Bioinformatique : séquence d'ADN et de protéines

4.00 crédits

30.0 h + 15.0 h

Enseignants

Ghislain Michel;

Langue
d'enseignement

Français

Préalables

Notions de base en biochimie et en biologie moléculaire.

Thèmes abordés

La bio-informatique désigne l'ensemble des concepts et des techniques nécessaires au traitement de l'information biologique et à son interprétation. Ce cours introductif décrit :
- les bases de données où sont conservées les séquences nucléotidiques et polypeptidiques
- les concepts et les outils informatiques qui sont nécessaires à l'analyse des séquences de l'ADN ou des protéines encodées (identification des régions codantes, recherche de ressemblances ou de motifs conservés, relations évolutives)
- les concepts et les outils informatiques utilisés pour la prédiction de structures secondaires de l'ARN et la détection des traverses membranaires des protéines
- certains outils statistiques développés pour l'interprétation des résultats

Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :
1	a. Contribution de l'activité au référentiel AA (AA du programme) Cohérence des AA cours en regard de ceux du programme 1.1, 1.2, 1.3 3.1, 3.2, 3.4, 3.5, 3.6 b. Formulation spécifique pour cette activité des AA du programme A la fin de cette activité, l'étudiant est capable d'identifier les outils informatiques (logiciels, base de données) les plus appropriés pour résoudre un problème scientifique, lié à l'analyse des séquences d'ADN ou de protéine, c'est-à-dire : - Expliquer les concepts théoriques sous-jacents aux outils bio-informatiques -Consulter les bases de données, expliquer comment l'information y est organisée, et identifier leurs avantages et inconvénients respectifs - Confirmer ou réfuter les résultats d'analyse et les prédictions disponibles ; le cas échéant, proposer des analyses informatiques plus performantes ou rigoureuses -Élaborer une méthodologie d'analyse complète à partir d'une séquence inconnue

Contenu

1.     Introduction et contenu du cours
2.     Les bases de données ciblées sur les séquences nucléiques et polypeptidiques, les motifs conservés et les familles de protéines, les organismes
3.     Comparaison, alignement global et local de séquences par la technique de programmation dynamique, matrices de score
4.     Recherche de séquences similaires dans les bases de données par la technique de la table de hachage
5. Alignement multiple global et local (matrices de score à position spécifique, modèle caché de Markov)
6. Construction d'arbres phylogénétiques (distance et approche cladistique)
7. Analyse transcriptomique à haut débit: données RNA seq

Méthodes d'enseignement

Les compétences visées par le cours seront développées à l'aide d'exposés magistraux, incluant des exemples concrets d'analyse de séquence, et à l'aide d'exercices encadrés à réaliser individuellement ou en groupe, en salle informatique.

Modes d'évaluation
des acquis des étudiants

Un examen écrit à livre ouvert sur 12 points permet d'évaluer les compétences théoriques développées au cours, c-à-d :
-la compréhension des concepts visés par le cours
- l'identification et la justification des outils informatiques (logiciels, bases de données) les plus appropriés
- l'interprétation statistique des résultats ou des prédictions obtenus
Les compétences pratiques sont évaluées sur 8 points au cours du quadrimestre , à travers des exercices à résoudre sur PC , individuellement ou en groupe de 2-3 étudiant.e.s.
La note finale sur 20 points est la somme arithmétique des notes de l'examen écrit (sur 12) et des exercices pratiques (sur 8)

Autres infos

Ce cours peut être donné en anglais.

Ressources
en ligne

Moodle

Bibliographie

Des copies papier des diaporamas et le manuel pour les exercices sont disponibles sur Moodle.
Le cours ne fait appel à aucun support particulier qui serait payant et jugé obligatoire. Les ouvrages Bioinformatics de Mount (CSHL press) et Bioinformatics and functional genomics de Pevsner sont conseillés pour un apprentissage plus approfondi

Support de cours

Bioinformatics sequence and genome analysis D. Mount
Bioinformatics and functional genomics by Pevsner

Faculté ou entité
en charge

AGRO

Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme

Sigle

Crédits

Prérequis

Acquis
d'apprentissage

Master [120] en statistique, orientation biostatistiques

BSTA2M

Master [120] : bioingénieur en chimie et bioindustries

BIRC2M

Master [120] en biochimie et biologie moléculaire et cellulaire

BBMC2M

Master [60] en sciences biologiques

BIOL2M1