Notre Offre | Cours offerts | Préparation avancée de données avec IBM SPSS Modeler
Préparation avancée de données avec IBM SPSS Modeler
Description générale
Ce cours d’une journée aborde des sujets avancés sur la préparation des données dans le but de bien réussir un projet d’exploration de données. Les participants apprendront comment utiliser différentes fonctions, gérer les valeurs manquantes, modifier des variables ou en créer de nouvelles, utiliser les données de séquence, appliquer des méthodes d’échantillonnage avancées et améliorer l’efficacité.
Note : Le matériel de cours est en anglais.
Prérequis
- Connaissances générales en informatique
- Expérience avec IBM SPSS Modeler
- Il est recommandé d’avoir complété le cours Introduction à IBM SPSS Modeler et à l’exploration de données.
Cours subséquents
- Les cours Classification des clients avec IBM SPSS Modeler, Modélisation de variables continues avec IBM SPSS Modeler et Modèles de segmentation et d’association avec IBM SPSS Modeler sont suggérés.
Plan de cours
Utilisation des fonctions
- Fonctions de date
- Fonctions de conversion
- Fonction de chaînes
- Fonctions statistiques
- Fonctions adaptées pour les données manquantes
Transformations des données
- Utiliser le nœud Remplacer pour remplacer des valeurs
- Utiliser le nœud Discrétiser pour recoder une variable continue
- Utiliser le nœud Transformation pour changer la distribution d’une variable
Données de séquence
- Utiliser les fonctions de données croisées
- Utiliser le mode Comptage dans le nœud Calculer
- Utiliser le nœud Restructurer afin d’obtenir plusieurs variables continues à partir d’une variable continue.
- Utiliser le nœud Boîtes-espace-temps pour travailler avec des données géospatiales et temporelles
Échantillonnage
- Utiliser le nœud Échantillonner pour effectuer un échantillonnage simple ou complexe
- Partitionner les données dans un ensemble d’apprentissage et un ensemble de test
- Réduire ou augmenter le nombre de données
Amélioration de l’efficacité
- Utiliser l’évolutivité de la base de données à l’aide de répercussions SQL
- Utiliser le nœud Audit des données pour traiter les valeurs aberrantes et les valeurs manquantes
- Utiliser le nœud Valeurs globales
- Utiliser les paramètres
- Utiliser des boucles et l’exécution conditionnelle