Notre Offre  |  Cours offerts  |  Introduction à IBM SPSS Modeler et à l’exploration de données

Introduction à IBM SPSS Modeler et à l’exploration de données

Description générale

Ce cours de deux jours présente un aperçu de l’exploration de données et des principes fondamentaux de IBM SPSS Modeler. Les principes et les pratiques en lien avec l’exploration de données sont illustrés à l’aide de la méthodologie CRISP-DM. La structure du cours suit les étapes habituelles d’un projet d’exploration de données, soit l’importation, l‘exploration et la transformation des données, la modélisation et l’interprétation des résultats. Le cours fournit les bases pour lire, explorer et préparer des données avec IBM SPSS Modeler, puis introduit l’étudiant à la modélisation.

Note : Le matériel de cours est en anglais.

automatisationavecmodeler2_frautomatisationavecmodeler_fr

Prérequis

Connaissances générales en informatique

Cours subséquents

Plan de cours

Introduction à l’exploration de données

  • Présenter des exemples d’exploration de données
  • Expliquer les étapes de la méthodologie CRISP-DM
  • Décrire des projets d’exploration de données réussis et les raisons pour lesquelles des projets échouent
  • Décrire les compétences nécessaires pour l’exploration de données

Travailler avec l’interface de Modeler

  • Décrire l’interface utilisateur de Modeler
  • Travailler avec les nœuds
  • Exécuter un flux ou une partie d’un flux
  • Ouvrir et enregistrer un flux
  • Utiliser l’aide en ligne dans Modeler

Présentation de l’exploration de données

  • Expliquer le cadre de base d’un projet d’exploration de données
  • Construire un modèle
  • Déployer un modèle

La collecte de données

  • Expliquer les concepts de « structure de données », « unité d’analyse », « champ de stockage » et « niveau de mesure »
  • Importer des fichiers Microsoft Excel
  • Importer des fichiers IBM SPSS Statistics
  • Importer des fichiers texte
  • Importer des bases de données
  • Exporter les données vers différents formats

Compréhension des données

  • Vérifier la qualité des données
  • Vérifier s’il y a des valeurs invalides
  • Gérer les valeurs invalides
  • Expliquer comment définir les « blancs »

Régler l’unité d’analyse

  • Régler l’unité d’analyse en supprimant les cas dupliqués
  • Régler l’unité d’analyse par agrégation
  • Régler l’unité d’analyse en transformant une variable catégorielle en plusieurs variables dichotomiques

Intégrer des données

  • Rassembler les données de plusieurs fichiers de données
  • Joindre les variables de plusieurs fichiers de données
  • Échantillonner les données

Calculer et reclasser des variables

  • Utilisation du « Control Language for Expression Manipulation » (CLEM)
  • Calculer de nouvelles variables
  • Reclasser les valeurs des variables

Étudier les relations entre variables

  • Étudier la relation entre deux variables catégorielles
  • Étudier la relation entre une variable catégorielle et une variable continue
  • Étudier la relation entre deux variables continues

Introduction à la modélisation

  • Présenter les objectifs de la modélisation
  • Utiliser un modèle de classification
  • Utiliser un modèle de segmentation

Inscription: Formule en classe | Formule en entreprise