Outils informatiques pour la science des données : Python

Par Ivan Keller, AXA

Afin de pouvoir tirer le meilleur parti du cours Outils informatiques pour la science des données : Python, il vous est recommandé de connaître les bases du langage Python même si celle-ci seront rappelées rapidement en première partie du cours.

Il est vivement recommandé d’assister au cours muni d’un ordinateur portable sur lequel Python (version 3) est installé.

Au besoin, vous pouvez suivre les instructions ici : https://github.com/ivankeller/ema dans la partie Installation de Python.

Toutefois, si vous rencontrez des difficultés nous tenterons de vous aider en début de cours afin que vous puissiez participer pleinement aux sessions pratiques.

Si vous n’avez pas d’expérience nous vous demandons de vous former par vous-mêmes. Pour ce faire nous vous recommandons les références suivantes :

Vous trouverez de nombreuses autres références en français ici : https://wiki.python.org/moin/FrenchLanguag et en anglais ici : https://wiki.python.org/moin/BeginnersGuide/Programmers

Ce cours, basé sur des exposés associés à des démonstrations et travaux pratiques, permettra aux étudiants d’apprendre à utiliser les outils Open Source de la science des données, et notamment l’éco-système autour du langage Python.

  • Rappels sur les bases de Python
  • Numpy et SciPy
  • Utilisation des notebooks Jupyter
  • Visualisations avec Matplotlib
  • Apprentissage et Machine Learning avec scikit-learn (http://scikit-learn.org )

Ivan Keller a un master de Probabilités et Statistiques de l’Université Pierre et Marie Curie et un master d’Intelligence Artificielle de l’Université Catholique de Louvain (KU Leuven. Il a travaillé sur l’analyse des réseaux sociaux ainsi que sur les systèmes de recommandation dans le cadre de collaborations avec le L2TI de l’Université Paris Nord. Depuis deux ans, il est data-scientist chez Axa Belgium où il contribue à développer les techniques d’apprentissage statistique dans l’assurance : modèles de risque, optimisation pour l’aide à la décision, classification automatique des courriels. Dans le cadre de ses recherches et du développement de projets de l’entreprise il utilise et maîtrise les outils état de l’art et open source du domaine.