Gestion des données

Responsable : Olivier Schwander

Objectif : Apprendre à charger et manipuler des données réelles, déployer une chaîne de traitement telle qu’utilisée en entreprise, comprendre les problèmes posés par la manipulation de données dans une application réelle. Ces points sont des préliminaires essentiels à l’intégration de méthodes statistiques avancées dans des applications réelles.

Prérequis : Connaissances basiques d’un langage de programmation

Thèmes abordés :

  • Systèmes de gestion des bases de données (SQL et noSQL)
  • Business Intelligence (ETL, Data Warehouse, OLAP)
  • Extraction de données sur le web (services web, scraping)
  • Paradigme MapReduce pour le Big Data (Spark, SPARKQL)

Ressources : Moodle