Retour accueil UPMCPhoto1 UPMCPhoto2 UPMC
UE: Statistique et informatique
Site permanent

L'unité d'enseignement « Statistique et informatique » est une UE de niveau (300) spécialisation relevant de la licence d'informatique. Elle possède un volume de 6 ECTS et s'étend sur 12 semaines. Elle est placée sous la responsabilité de D'ALCHE-BUC, florence.

Description

Les progrès des sciences s'appuient sur un traitement pertinent et efficace des données. Mesures, séries temporelles, images ou signaux doivent être correctement analysés pour apporter de l'information utile. La statistique comme l'informatique placent au coeur de leur problématique le traitement de l'information. Alors que la statistique s'intéresse à décrire et à extraire les propriétés communes d'une population, l'informatique étudie le problème de la représentation et du calcul avec un souci d'efficacité algorithmique et d'économie de ressources.

Dans ce module, les outils statistiques et les problèmes de leur mise en oeuvre algorithmique et logicielle sont présentés. Il s'agit d'acquérir les fondements pratiques des statistiques et de l'analyse des données tout en s'intéressant à la conception de programmes de complexités en temps et en espace restreintes. L'analyse de données et les composants fondamentaux de la statistique fournissent un ensemble de concepts et de méthodes pour résoudre ce type de problèmes, l'informatique permet leur codage et leur mise en oeuvre efficace. Cet enseignement introduit les notions de base en analyse des données et en statistique tout en sensibilisant l'étudiant aux problématiques soulevées par ce type de calcul comme celle de complexité algorithmique des traitements effectués.

Dans ce module, chaque concept mathématique est d'abord motivé par la résolution d'un problème réel (analyse de données épidémiologiques, classification de données d'expression de gènes, régression d'indicateurs économiques, estimation d'une région dans une image ...). L'introduction du problème est donc suivie d'une présentation formelle des concepts et des notions de statistique qui sont utiles à sa résolution. Pendant les travaux dirigés intégrés avec les travaux sur machine encadrés, on s'intéresse aux propriétés des notions introduites puis on étudie la mise en oeuvre informatique des algorithmes correspondants à l'aide des langages Matlab et R, respectivement dédiés au calcul matriciel et aux calculs statistiques.

Préalables et buts pédagogiques

Bibliographie

  • Probabilités, analyse de données et statistiques. Gilbert Saporta, Editions Technip, 1990.

  • Netlab: algorithms for pattern recognition. Ian Nabney, Springer, 2001.

Contenu indicatif par semaine

  1. Introduction à l'analyse de données / aux statistiques. Introduction aux outils informatiques Scilab (ou R)

  2. Comment visualiser des données multidimensionnelles dans le plan ? (1) Analyse en composantes principales

  3. Comment visualiser des données multidimensionnelles dans le plan ? (2) Analyse en composantes principales

  4. (3) Autres Analyses factorielles

  5. Comment classifier des données en groupes homogènes ? (1) Les méthodes hiérarchiques

  6. Comment classifier des données en groupes homogènes ? (2) Les méthodes hiérarchiques

  7. Statistique. Eléments de probabilités (rappels)

  8. Eléments de probabilités (rappels). Echantillonnage - Théorème central-limite

  9. Eléments de statistique descriptive

  10. Estimation et estimateurs, propriétés. Estimation ponctuelle/par intervalle

  11. Régression

  12. Tests d'hypothèse