Options d’inscription

Ce cours démarre par un cours de Python pour la production permet d'enseigner la mise en place d'un environnement de développement optimal en couvrant le choix et la configuration d'un IDE, la sélection de la version de Python, la création d'environnements virtuels et le recours aux bibliothèques Python pertinentes. Les participants apprendront également à utiliser efficacement le debugger de leur IDE, à intégrer l'IA générative comme un assistant, à structurer leurs projets Python conformément aux bonnes pratiques, et à maîtriser l'utilisation de Git en ligne de commande ainsi que les fonctionnalités de GitHub/GitLab. Le cours met l'accent sur la qualité du code en suivant les directives PEP8, en mettant en place un système de journalisation, en documentant soigneusement le code et le projet, et en enseignant les principes fondamentaux du test et de l'optimisation du code. Enfin, les participants seront initiés à l'Intégration Continue (CI), au Développement Continu (CD) et aux pratiques du MLOps pour assurer un déploiement efficace et durable de leurs projets.
Dans un deuxième temps, cette UE propose un tour d'horizon des méthodes pour l'analyse exploratoire des données massives. On y présente la préparation des données tabulaires (nettoyage, détection d’outlier, pré-traitement des variables), l’imputation de données manquantes et les methodes classiques de visualisation. On y présente également l’analyse de données textuelles et de séries temporelles.
Une partie du cours est dédiée à la mise en pratique des méthodes vues en cours avec des TPs et surtout un projet impliquant d'exploiter des données ouvertes à l'aide de bibliothèques et d’articuler l’ensemble des concepts vus.

Les visiteurs anonymes ne peuvent pas accéder à ce cours. Veuillez vous connecter.