Via GoogleTM
 

Dernière mise à jour : « Lundi 16 Août 2010 »

Programme détaillé de l'UE

 

Gilles Pitiot • Marc Le Bret • Christian Auclair

Bioinformatique

UEOP2

Mention : Cancérologie
Type d'UE : CM
Année : M2
Semestre : S2

 

Objectifs :

Le cours a pour finalité de donner au biologiste sans connaissance préalable spécifique du domaine, les bases de la logique des logiciels de traitements de séquences et de modélisation moléculaire, ainsi qu’une initiation pratique aux logiciels communs disponibles via internet. La démarche du cours est donc progressive, et à pour but que le biologiste utilise un logiciel dont il aura compris la logique du traitement des données.

Pour cela, une description de la progression historique des algorithmes développés en bioinformatique pour répondre aux questions moléculaires des biologistes sera présentée en cours. Parallèlement, un petit projet d’application sur un exemple de séquence sera réalisé, par binôme, au fur et à mesure des séances sur des PC utilisant Windows.

Plan des enseignements :

Nombre d'heures de cours : 20 heures 

  • COMPARAISONS AUX BANQUES DE DONNEES (4H)
    • Présentation de l'analyse de séquences en biologie
    • banques de données
    • formats de fichiers
    • Alignement de deux séquences
    • Présentation des matrices de scores
    • Algorithmes optimisés
    • Algorithme d'alignement global de Needleman et Wunsch
    • Algorithme d'alignement local de Smith et Waterman
    • Utilisation d'heuristiques pour la comparaison aux banques
    • FASTA
    • BLAST
    • Comparaisons d'ADN ou de protéines par rapport à de l'ADN ou des protéines

  • RECHERCHE DE MOTIFS PROTEIQUES (2H)
    • Construction d'alignements multiples de séquences
    • Alignement multiple par Clustal ou Dialign
    • Notion de consensus de séquences et conséquences
    • Présentation des motifs, profiles, fingerprints, domaines.
    • Banques Prosite, Blocks, PRINTS, ProDom
    • Stratégies itératives de recherche de profiles dans les banques: PsiBlast et Impala
    • Les chaînes de Markov et leurs applications au traitement des séquences
    • Principe des HMM
    • Construction de HMM et comparaison aux banques avec HMMER
    • Les banques Pfam

  • PHYLOGENESE (2H)
    • Construction d'un arbre de distances
    • Méthode UPGMA
    • Méthode Neighbor-Joining
    • Principe de la parcimonie
    • Construction d'un arbre par la méthode de maximum de vraisemblance

  • MODELISATION MOLECULAIRE (5H)
    • Visualisation de données de cristallographie
    • Banque PDB
    • Rasmol
    • Modélisation des effets d'une mutation
    • Principe du logiciel AMBER
    • Minimisation d'énergie potentielle (mécanique moléculaire)
    • Calculs de dynamique moléculaire (Brownienne, Newtonienne)
    • Modélisation par homologie
    • Application à la fixation d'un ligand (docking de composés pharmaceutiques)
    • Modélisation d'une structure non connue
    • Modélisation de structures 2D
    • Optimisation énergétique des structures 3D
       
  • GESTION DE SEQUENCES A GRANDE ECHELLE (PROJETS GENOMES) (3H)
    • Introduction aux projets génomiques: projets académiques versus société Celera
    • Présentation des projets STS, EST, HTG-NT, SNP
    • Séquençage de contigs ordonnés versus "shotgun sequencing" de tout un génome
    • Présentation des logiciels de traitement automatisé de séquences
    • Phred, Phrap, Consed, Arachne
    • Familles de séquences répétées dans les génomes: origine et variations
    • RepeatMasker
    • Définition du nombre de gènes d'un génome et classement par groupes des EST
    • Logiciel Cap3, et les banques Unigène
    • Les polymorphismes de l'ADN et les banques de SNP

  • PREDICTION DE GENES (2H)
    • Evolution des méthodes de prédiction de gènes
    • Application aux différents génomes
    • Genscan - Genoscan pour les génomes humain et de plantes
    • Genmark - Genmark.hmm pour le génome de drosophile
    • Glimmer pour le génome de bactéries
    • Prédiction d'un gène d'après un HMM protéique (Wise2)

  • ANALYSES POST-GENOMIQUES (2H)
    • Présentation des systèmes d'analyse de microchips et de définition de groupes

Enseignants (fonction et grade) :

Gilles Pitiot (PRAG), Marc Le Bret (DR2 CNRS), Christian Auclair (PR ENS), un moniteur ENS Cachan, Vladimir Lazar (Responsable génomique IGR), Nicolas Stransky (Chercheur UMR 144)

Prérequis : Filières médicales, biologistes, filières MP, ingénieurs, informaticiens

Contrôle des connaissances : Examen écrit à la fin du module + exercice personnel donnant lieu à un compte-rendu 

Nb d'heures : 20

ECTS : 3

Master Biologie Santé spécialité Cancérologie 2010
ContactPlan du site