FORMATION
Programmer avec Python : Outils pour la Data Science
— La Data Science est une discipline issue de la convergence des mathématiques, des statistiques et de l’informatique, qui permet d’exploiter au mieux l’information contenue dans les données. Le langage Python met à disposition du Data Scientist tous les outils nécessaires pour faire de la programmation scientifique. La formation met un accent particulier sur la qualité du code.
Objectifs de la formation
• Comprendre les problématiques de la programmation scientifique.
• Enrichir sa boîte à outils pour la Data Science.
• Manipuler les librairies Python permettant de faire de l’exploration de données et du calcul scientifique.
• Produire du code Python robuste et de qualité.
Pour qui ?
• Analystes, statisticiens
• Développeurs
• Data Scientists
Par qui ?
Ingénieurs et Data Scientists d’Artelys travaillant régulièrement sur des projets informatiques internes et clients.
Programme
Programmation efficace avec Python
• Présentation du langage, premier script en Python.
• Présentation des environnements de développement (Anaconda).
• Jupyter notebook : un environnement efficace pour la présentation et la reproductibilité de résultats scientifiques.

Les bases de la programmation avec Python
• Les structures de données de Python (listes, tuples, dictionnaires).
• Parcours et génération de listes (itertools, itérateurs, générateurs et les comprehension lists).
• Les bonnes pratiques (utilisation des exceptions, vérification du typage, etc.).

Organisation et amélioration du code
• Commentaires et propreté (docstring, linters, pep8…).
• Modularité et réutilisabilité du code (import de fichiers, POO et polymorphisme).
• Algorithmes et complexité.

Distribution, isolation et gestion de paquets

Introduction à la programmation scientifique
• Vocabulaire de la programmation scientifique et analyse statistique.
• Principaux algorithmes de machine learning (analyse supervisée, analyse non supervisée, classification et régression).
• La stack scientifique : Numpy, Scipy, Scikit-learn, pandas, Sympy, matplotlib.

Statistiques descriptives et structures de données
• Gestion de données avec pandas : import, dataframes, slicing, mapping (lecture, formats, gestion de dates).
• Visualisation avec matplotlib.

Modélisation statistique avec Scikit-learn
• Présentation, modélisation linéaire et prévision, classification avec Scikit-learn.

Calcul scientifique avec Numpy
• Présentation, structure de données, indexing, slicing, iterating.

Calcul scientifique avec Scipy
• Présentation, algèbre linéaire, application.

 

Informations pratiques

Prochaine session
05/06/2024 – 06/06/2024 – 07/06/2024

Session spéciale possible
(4 inscrits minimum, en présentiel ou en distanciel)
Durée de la formation
3 jours
Coût de la formation:
Inter-entreprise : 2 600 € H.T. par personne
Intra-entreprise : 13 000 € H.T. par session
Il comprend les supports, les repas, les cafés et la documentation. Des ordinateurs sont mis à disposition.
Catalogue complet
Disponible sur ce lien
Artelys est un organisme de formation enregistré sous le n°11754066975.

 

Intéressé par cette formation ? Inscrivez-vous !

 

 

© ARTELYS • Tous droits réservés • Mentions légales

Pin It on Pinterest

Share This