Manipulation de données avec le langage Python
Le langage informatique Python s’est imposé très largement ces dernières années dans le monde comme le langage de référence pour la data science, comme l’indiquent les différents classements. Il permet en particulier facilement des manipulations de données avancées, sur des formats variés (Excel, csv, SQL,…), dépassant par beaucoup d’aspects certaines limites d’Excel notamment en termes de volumes ou sur des manipulations complexes.
Ses avantages sont nombreux :
- Gratuit, installable sur n’importe quelle plateforme
- Un des langages de programmation les plus faciles d’accès, idéal pour des débutants
- Traçabilité des actions effectuées sur les données (« piste d’audit ») bien meilleure que sur des logiciels type Excel, et ré-utilisation facilitée pour les analyses et travaux
Cette formation donne les bases du langage informatique Python et apprend à l’utiliser pour les manipulations de données les plus utiles. Elle est accessible à tout le monde, sans pré-requis, et pensée pour embarquer tant les débutants (y compris ceux convaincus que « l’informatique et le code ce n’est pas pour eux ») que les personnes ayant déjà eu l’occasion de coder. Elle vise un public ayant l’occasion de manipuler régulièrement des données (par exemple avec Excel) et qui souhaiterait « passer à la vitesse supérieure » sur les manipulations.
A titre d’illustration, vous apprendrez à dézipper, lire puis concaténer une centaine de fichiers Excel zippés et déposés dans un dossier, tout cela automatiquement sans les ouvrir (ni entrer leur nom) à la main ; puis effectuer plusieurs analyses avancées sur le fichier obtenu (filtrer, enrichir, synthétiser,…), et enfin visualiser les résultats.
Public visé
Public ayant l’occasion de manipuler régulièrement des données (par exemple avec Excel) et souhaitant « passer à la vitesse supérieure » sur les manipulations.
Objectifs et compétences visées
- Démystifier la programmation et le code, donner la confiance et l’envie nécessaires pour s’y lancer !
- Mettre en évidence les utilisations possibles de Python pour la manipulation de données et les avantages associés
- Permettre de réaliser en autonomie des manipulations variées de données couvrant les usages les plus utiles et courants
Pré-requis
Public familier d'Excel ou similaire
Programme
Le langage Python
- Qu’est-ce qu’un langage de programmation ?
- Que permet de faire le langage Python ?
- Quels sont les atouts du langage Python pour vous (dès aujourd’hui et pour la suite de votre carrière) ?
- Jupyter, un outil pour faciliter l’utilisation de Python
Premières manipulations de données avec le package « pandas »
- Lecture d’un fichier type Excel
- Accéder aux données d’un tableau
- Premières manipulations, création de nouvelles colonnes
- Sortir facilement les statistiques importantes d’un jeu de données
- Repérer, filtrer, et extraire les informations pertinentes
- Sauvegarder le résultat dans un fichier type Excel ou sous d’autres formats
Les notions clés de programmation
- La variable, pour stocker toute information
- Ré-utiliser facilement des parties de code grâce aux fonctions
- Répéter automatiquement une série d’instructions grâce aux boucles
- Ajouter des conditions grâce aux tests
Visualiser vos données et les résultats de vos analyses
- Présentation du package de graphiques « matplotlib »
- Un graphique en une seule ligne de code
- Réaliser les graphiques les plus courants
Manipulations de données avancées
- Fusionner plusieurs fichiers pour enrichir l’analyse grâce aux jointures
- Aller plus loin que le TCD d’Excel, grâce à la fonctionnalité de « group by »
Progresser dans votre utilisation de Python
- Conseils et bonnes pratiques
- Quelques erreurs classiques
- Pour aller plus loin
Méthode pédagogique
- Formation magistrale
- Exercices pratiques où l’on code
- Quizz
Intervenants
Raphaël Deswarte
Prochaines sessions
- Dates à venir
jamais oser le faire... écrivez-nous !
(On est très sympa)
Si vous souhaitez nous appeler : 07.67.12.42.94