Descriptions des cours

Optimisation pour l’apprentissage

Par Stéphane Canu, INSA de Rouen

Exemples d’optimisation en apprentissage statistique
Cadre général de l’optimisation
Optimisation différenciable, convexe et sans contraintes
Optimisation sans contraintes non différenciable
Optimisation avec contraintes non différenciable

Fondateur du département « informatique » de l’INSA de Rouen Normandie, Stéphane Canu est Professeur des universités et membre du Laboratoire de recherche LITIS dont il a été directeur de 2005 à 2012. Il fait de la recherche depuis 35 ans dans le domaine de l’intelligence artificielle et de la science des données. Il coordonne le programme Deep in France financé par l’ANR sur la question cruciale de la sobriété énergétique de l’apprentissage profond.

Réseaux de neurones et apprentissage profond

Par Emmanuel Viennet, Université Paris 13

Des connaissances élémentaires d’algèbre linéaire et d’analyse (fonctions multivariées, dérivées partielles) sont suffisantes pour suivre ce cours.

Tutoriels et outils utiles pour suivre ce cours:

Quelques références pour aller plus loin après le cours:

  • T. Hastie, R. Tibshirani, J. Friedman (2009) The Elements of Statistical Learning
  • I. Goodfellow, Y. Bengio et Aaron Courville (2016), Deep Learning
  • François Chollet (2018), Deep Learning with Python
  • Grus (2015), Data Science from Scratch
  • S. Kevin Zhou et al. (2017), Deep Learning for Medical Image Analysis
  • A. Géron (2017), Hands-On Machine Learning with Scikit-Learn & TensorFlow

Les réseaux de neurones artificiels, étudiés depuis les années 50, connaissent un succès remarquable ces dernières années car ils permettent d’aborder des problèmes de reconnaissance des formes très complexes sur des données de grande taille. Ces modèles sont couramment utilisés pour la reconnaissance vocale, la détection et l’identification d’objets dans des images, mais aussi la traduction de textes ou la synthèse d’images. Le cours abordera les principaux concepts et modèles :

  • Historique du domaine
  • Réseaux à convolutions
  • Apprentissage supervisé
  • Auto-encodeurs
  • Traitement du texte et des images

Emmanuel Viennet est Professeur à l’Université Paris 13 et mène des recherches depuis trente ans sur la reconnaissance des formes par réseaux de neurones, le traitement de données massives et d’images. Il est responsable de l’axe « Apprentissage et Fouille de Données » du laboratoire L2TI. Il a publié plus de cent articles dans des journaux et conférences internationales.

Sélection de variables et Feature engineering

Par Blaise Ngonmang, AXA/Anorak

Les variables sont les ingrédients de base des modèles de Machine Learning. Leur choix est souvent crucial au bon fonctionnement des algorithmes. Les deux situations Suivantes sont généralement rencontrées en pratique : on a de nombreux attributs et on doit en choisir uniquement les plus significatifs (sélection de variables) ou bien, on a des données qui ne sont pas directement utilisables par les modèles (par exemple, des textes, des images ou des sons) et on doit donc construire des variables à partir de ses données sources (Feature Engineering).

Nous présenterons les méthodes de sélection de variables classiques, les techniques régularisation. Nous aborderons ensuite les méthodes dédiées à la sélection de variables. Les méthodes manuelles de Feature Engineering et leur limites seront ensuite étudiées, puis les méthodes modernes d’apprentissage de features basées sur les approches de l’apprentissage profond (Deep Learning).

Les travaux pratiques de cette partie se ferons grâce à Tensorflow (https://www.tensorflow.org), un système Open Source très utilisé dans l’industrie et les laboratoires de recherche.

Blaise NGONMANG est Docteur en Informatique des universités de Paris 13 et de Yaoundé I. Sa thèse a porté sur l’analyse de communautés dans les grands réseaux en utilisant des approches de Machine Learning. Après plusieurs années comme Data Scientist Senior au sein du Groupe AXA, Il occupe aujourd’hui il occupe aujourd’hui le poste de Chief Data Officer au sein d’Anorak Technologies, crée par Kamet, la Startup Studio du Groupe AXA.