Python pour la Data Science

Python pour la Data Science

6h36

Quiz

FR

ET_DAT_PYTDAT

Demandez le programme !

    Prénom *
    Nom *
    E-mail *
    Les champs précédés d'un astérisque (*) sont obligatoires.
    Votre adresse de messagerie est utilisée uniquement pour vous délivrer votre accès gratuit et vous tenir informé·e de l'évolution sur nos produits et services ainsi que vous inviter à nos prochains événements. Si vous ne souhaitez pas recevoir nos prochaines communications, merci de cocher la case suivante :
    Pour plus d'informations sur notre politique de protection des données, cliquez ici.

    Vous souhaitez mettre en place cette e-formation pour vos apprenants ? Nos équipes sont là pour vous aider.

    Objectifs de la formation

    Cette formation s’adresse aux étudiants, professionnels en reconversion ou analystes de données débutants disposant de connaissances basiques en Python, qui veulent acquérir des compétences en data science, depuis les bases de la manipulation et de la visualisation de données jusqu’à l’analyse statistique et la mise en œuvre complète de projets. Elle vise à fournir à la fois une compréhension pratique des outils incontournables (NumPy, Pandas, Matplotlib, Scikit-Learn…) et une méthodologie pour explorer, analyser et valoriser les données.

    Pré-requis

    Prérequis :
    Disposer de connaissances basiques en Python

    Contenu de la formation

    Vidéo
    Ce module vous propose la consultation d’une vidéo d’une durée de 2h35.
    Python pour la Data Science

    • Python et la Data Science
      • Choisir Python pour la Data Science
      • La bibliothèque NumPy
      • Le type et la taille des vecteurs NumPy
      • Initialisation et tableau NumPy
      • Accéder aux données d’un tableau NumPy à une dimension
      • Accéder aux données d’un tableau NumPy à deux dimensions
      • Algèbre linéaire avec NumPy
      • Tableau NumPy versus liste Python
      • Statistique descriptive avec NumPy
    • Visualisation de données
      • Installer Anaconda et Jupyter
      • Travailler avec Jupyter
      • La bibliothèque Pandas
      • Accéder aux données d’un Data Frame
      • Filtrer les données d’un Data Frame
      • Trier les données d’un Data Frame
      • Les statistiques de base avec un Data Frame
      • Lecture des fichiers de grandes tailles avec Pandas
    • Les statistiques inférentielles avec Python
      • Utilisation des méthodes melt et apply
      • Extraire des informations à partir des données existantes
      • Créer de nouvelles variables à partir des données existantes
      • Visualiser les données avec Matplotlib
      • La loi Normale
      • Introduction aux tests d’hypothèses
      • Test statistique de comparaison de deux moyennes
    • Modélisation multivariée avec Python
      • Introduction à la régression linéaire
      • Exemple de modélisation avec la régression linéaire
      • Introduction à l’algorithme Support Vector Machine
      • Exemple de modélisation avec un Support Vector Machine
      • Introduction à l’algorithme de K-Means
      • Exemple de l’algorithme K-Means
      • Conclusion

    Vidéo
    Ce module vous propose la consultation d’une vidéo d’une durée de 2h16.
    Visualisation de données avec Matplotlib – Créez des graphiques professionnels et intuitifs

    • Introduction à la visualisation de données
      • La visualisation de données
      • Pourquoi utiliser Matplotlib ?
      • Installation et prise en main de Matplotlib
      • Les différentes typologies de graphiques
      • Premiers pas avec Matplotlib
      • Structure de base
      • Tracer un premier graphique
      • Sauvegarder et afficher les graphiques
      • Afficher plusieurs courbes
    • Tracer ses premiers graphiques
      • Les diagrammes en barres
      • Les histogrammes
      • Les courbes
      • Les diagrammes en secteurs
      • Les graphiques de dispersion
      • Les graphiques en aires
      • Les graphiques en 3D et leurs animations
      • Les graphiques avec axes multiples
      • Les boxplots
    • Personnaliser ses graphiques
      • Changer la couleur, le style et les marqueurs
      • Ajouter des labels et des titres
      • Ajouter une légende
      • Gestion des axes
      • Gestion des sous-graphiques
      • Ajout d’annotations et de texte
      • Personnalisation avancée

    Vidéo
    Ce module vous propose la consultation d’une vidéo d’une durée de 1h45.
    Statistiques descriptives avec Python

    • Introduction aux statistiques
      • Prérequis
      • Introduction aux statistiques
      • Pourquoi les statistiques avec Python ?
      • Installer son environnement de travail
      • Les statistiques descriptives
    • Statistiques descriptives
      • Importer un échantillon avec Pandas
      • Structure des données
      • Manipulation des données avec Pandas
      • Utiliser les fonctions avancées de Pandas
      • Utiliser la fonction apply
      • Etudier une variable quantitative
      • Etudier une variable qualitative
    • Le pouvoir de la visualisation de données
      • Introduction à Matplotlib
      • Ajouter des couleurs dans vos graphiques
      • Utiliser les histogrammes
      • Utiliser les boîtes à moustache
      • Etudier les relations entre deux variables
    • Tests paramétrique et non paramétrique
      • La loi normale centrée réduite
      • Estimer une moyenne
      • Test d’hypothèse
      • Calcul de la p-value
      • La modélisation statistique
      • Statistiques vs Machine Learning
      • Conclusion

    Livre en complément
    Ce module vous propose la consultation d’un support de cours numérique.
    Maîtrisez la Data Science avec Python

    • Introduction
    • Bases de Python et environnements
    • Préparer les données avec Pandas et Numpy
    • DataViz avec Matplotlib, Seaborn, Plotly
    • Analyse des données
    • Le Machine Learning avec Scikit-Learn
    • L’apprentissage supervisé
    • L’apprentissage non supervisé
    • Modéliser le texte et l’image
    • Mener un projet de data science avec Python
    • Conclusion