Introduction to the course

Analyse Statistique des données Génomiques (ASG)

Jacques van Helden

2018-04-12

Prérequis

En M1, nous avons revu les notions de base suivantes:

Objectifs du cours

Aperçu des matières couvertes

Analyse multidimensionnelle

En bioinformatique on est souvent confrontés à des données présentées sous la forme de tables où chaque ligne représente un objet (par exemple un patient) et chaque colonne une caractéristique (feature) de cet objet (par exemple niveau d’expression d’un gène).

Note: selon les cas on pourra utiliser les lignes pour les variables et les colonnes pour les objets.

Analyse multidimensionnelle

Nous aborderons l’analyse multidimensionnelle sur base de données de biopuces transcriptomiques, qui se prêtent bien à ce type d’analyses. Nous étendrons ensuite l’analyse au traitement de données de RNA-seq.

RNA-seq: détection de gènes différentiellement exprimés

La détection de gènes différentiellement exprimés à partir de données RNA-seq requiert des modèles statistiques particuliers du fait de la nature des données:

Les tests paramétriques ne s’appliquent absolument pas à ce type de données.

Analyse d’enrichissement fonctionnel

But: interprétattion de groupes de gènes fonctionnellement associés, par exemple des groupes de gènes différentiellement exprimés entre deux conditions, ou des clusters de gènes co-exprimés dans une série de conditions.

Autres applications à traiter (en fonction du temps)