FORMATION

Programmer avec Python : Outils pour la Data Science
— La Data Science est une discipline issue de la convergence des mathématiques, des statistiques et de l’informatique, qui permet d’exploiter au mieux l’information contenue dans les données. Le langage Python met à disposition du Data Scientist tous les outils nécessaires pour faire de la programmation scientifique. La formation met un accent particulier sur la qualité du code.

Objectifs de la formation

• Comprendre les problématiques de la programmation scientifique.
• Enrichir sa boîte à outils pour la Data Science.
• Manipuler les librairies Python permettant de faire de l’exploration de données et du calcul scientifique.
• Produire du code Python robuste et de qualité.

Pour qui ?

• Analystes, statisticiens
• Développeurs
• Data Scientists

Par qui ?

Ingénieurs et Data Scientists d’Artelys travaillant régulièrement sur des projets informatiques internes et clients.

Programme

Programmation efficace avec Python
• Présentation du langage, premier script en Python.
• Présentation des environnements de développement (Anaconda).
• Jupyter notebook : un environnement efficace pour la présentation et la reproductibilité de résultats scientifiques.

Les bases de la programmation avec Python
• Les structures de données de Python (listes, tuples, dictionnaires).
• Parcours et génération de listes (itertools, itérateurs, générateurs et les comprehension lists).
• Les bonnes pratiques (utilisation des exceptions, vérification du typage, etc.).

Organisation et amélioration du code
• Commentaires et propreté (docstring, linters, pep8…).
• Modularité et réutilisabilité du code (import de fichiers, POO et polymorphisme).
• Algorithmes et complexité.

Distribution, isolation et gestion de paquets

Introduction à la programmation scientifique
• Vocabulaire de la programmation scientifique et analyse statistique.
• Principaux algorithmes de machine learning (analyse supervisée, analyse non supervisée, classification et régression).
• La stack scientifique : Numpy, Scipy, Scikit-learn, pandas, Sympy, matplotlib.

Statistiques descriptives et structures de données
• Gestion de données avec pandas : import, dataframes, slicing, mapping (lecture, formats, gestion de dates).
• Visualisation avec matplotlib.

Modélisation statistique avec Scikit-learn
• Présentation, modélisation linéaire et prévision, classification avec Scikit-learn.

Calcul scientifique avec Numpy
• Présentation, structure de données, indexing, slicing, iterating.

Calcul scientifique avec Scipy
• Présentation, algèbre linéaire, application.

 

Informations pratiques

Le coût de la formation est de 1 950 € HT.
Il comprend les supports, les repas, les cafés et la documentation. Des ordinateurs sont mis à disposition.

Artelys est un organisme de formation enregistré sous le n°11754066975.

Artelys FRANCE 
81 rue Saint Lazare – 75009 Paris – France
+33 (0)1 44 77 89 00

 

Cette formation vous intéresse ? Inscrivez-vous dès maintenant !

 

 

© ARTELYS • Tous droits réservés • Mentions légales

Pin It on Pinterest

Share This