Apprentissage statistique

Responsables : Gérard Biau et Maxime Sangnier

Objectif : Ce cours présente les grands principes de l’apprentissage statistique et les problématiques liées. Il introduit aussi les principales méthodes de prédiction (classification et régression), de partitionnement et de réduction de dimension. Il présente l’apprentissage statistique d’un point de vue algorithmique et sera illustré par des travaux pratiques (en Python) ainsi que par un challenge en science des données.

Prérequis : Notions fondamentales de probabilités et statistique, analyse convexe, algèbre linéaire et calcul scientifique en Python

Thèmes abordés :

  • Introduction au problème de la classification supervisée
  • Analyse discriminante, régression logistique, machines à vecteurs supports
  • Principe de minimisation du risque empirique, théorie de Vapnik-Chervonenkis
  • Bornes de performance, pertes convexes, sélection de modèle
  • Classification non paramétrique, théorème de Stone, plus proches voisins, arbres, méthodes ensemblistes
  • Classification par réseaux neuronaux
  • Quantification et clustering
  • Modèle de mélange et algorithme EM, k-moyennes, partitionnement spectral et hiérarchique
  • Analyse en composantes principales, projections aléatoires et positionnement multidimensionnel

Ressources : Moodle