Python pour la Data Science
Demandez le programme !
Vous souhaitez mettre en place cette e-formation pour vos apprenants ? Nos équipes sont là pour vous aider.
Objectifs de la formation
Cette formation s’adresse aux étudiants, professionnels en reconversion ou analystes de données débutants disposant de connaissances basiques en Python, qui veulent acquérir des compétences en data science, depuis les bases de la manipulation et de la visualisation de données jusqu’à l’analyse statistique et la mise en œuvre complète de projets. Elle vise à fournir à la fois une compréhension pratique des outils incontournables (NumPy, Pandas, Matplotlib, Scikit-Learn…) et une méthodologie pour explorer, analyser et valoriser les données.
Pré-requis
Prérequis :
Disposer de connaissances basiques en Python
Contenu de la formation
Vidéo
Ce module vous propose la consultation d’une vidéo d’une durée de 2h35.
Python pour la Data Science
- Python et la Data Science
- Choisir Python pour la Data Science
- La bibliothèque NumPy
- Le type et la taille des vecteurs NumPy
- Initialisation et tableau NumPy
- Accéder aux données d’un tableau NumPy à une dimension
- Accéder aux données d’un tableau NumPy à deux dimensions
- Algèbre linéaire avec NumPy
- Tableau NumPy versus liste Python
- Statistique descriptive avec NumPy
- Visualisation de données
- Installer Anaconda et Jupyter
- Travailler avec Jupyter
- La bibliothèque Pandas
- Accéder aux données d’un Data Frame
- Filtrer les données d’un Data Frame
- Trier les données d’un Data Frame
- Les statistiques de base avec un Data Frame
- Lecture des fichiers de grandes tailles avec Pandas
- Les statistiques inférentielles avec Python
- Utilisation des méthodes melt et apply
- Extraire des informations à partir des données existantes
- Créer de nouvelles variables à partir des données existantes
- Visualiser les données avec Matplotlib
- La loi Normale
- Introduction aux tests d’hypothèses
- Test statistique de comparaison de deux moyennes
- Modélisation multivariée avec Python
- Introduction à la régression linéaire
- Exemple de modélisation avec la régression linéaire
- Introduction à l’algorithme Support Vector Machine
- Exemple de modélisation avec un Support Vector Machine
- Introduction à l’algorithme de K-Means
- Exemple de l’algorithme K-Means
- Conclusion
Vidéo
Ce module vous propose la consultation d’une vidéo d’une durée de 2h16.
Visualisation de données avec Matplotlib – Créez des graphiques professionnels et intuitifs
- Introduction à la visualisation de données
- La visualisation de données
- Pourquoi utiliser Matplotlib ?
- Installation et prise en main de Matplotlib
- Les différentes typologies de graphiques
- Premiers pas avec Matplotlib
- Structure de base
- Tracer un premier graphique
- Sauvegarder et afficher les graphiques
- Afficher plusieurs courbes
- Tracer ses premiers graphiques
- Les diagrammes en barres
- Les histogrammes
- Les courbes
- Les diagrammes en secteurs
- Les graphiques de dispersion
- Les graphiques en aires
- Les graphiques en 3D et leurs animations
- Les graphiques avec axes multiples
- Les boxplots
- Personnaliser ses graphiques
- Changer la couleur, le style et les marqueurs
- Ajouter des labels et des titres
- Ajouter une légende
- Gestion des axes
- Gestion des sous-graphiques
- Ajout d’annotations et de texte
- Personnalisation avancée
Vidéo
Ce module vous propose la consultation d’une vidéo d’une durée de 1h45.
Statistiques descriptives avec Python
- Introduction aux statistiques
- Prérequis
- Introduction aux statistiques
- Pourquoi les statistiques avec Python ?
- Installer son environnement de travail
- Les statistiques descriptives
- Statistiques descriptives
- Importer un échantillon avec Pandas
- Structure des données
- Manipulation des données avec Pandas
- Utiliser les fonctions avancées de Pandas
- Utiliser la fonction apply
- Etudier une variable quantitative
- Etudier une variable qualitative
- Le pouvoir de la visualisation de données
- Introduction à Matplotlib
- Ajouter des couleurs dans vos graphiques
- Utiliser les histogrammes
- Utiliser les boîtes à moustache
- Etudier les relations entre deux variables
- Tests paramétrique et non paramétrique
- La loi normale centrée réduite
- Estimer une moyenne
- Test d’hypothèse
- Calcul de la p-value
- La modélisation statistique
- Statistiques vs Machine Learning
- Conclusion
Livre en complément
Ce module vous propose la consultation d’un support de cours numérique.
Maîtrisez la Data Science avec Python
- Introduction
- Bases de Python et environnements
- Préparer les données avec Pandas et Numpy
- DataViz avec Matplotlib, Seaborn, Plotly
- Analyse des données
- Le Machine Learning avec Scikit-Learn
- L’apprentissage supervisé
- L’apprentissage non supervisé
- Modéliser le texte et l’image
- Mener un projet de data science avec Python
- Conclusion