Bioinformatics

lgbio2010  2024-2025  Louvain-la-Neuve

Bioinformatics
5.00 crédits
30.0 h + 30.0 h
Q1
Enseignants
Branders Vincent (supplée Dupont Pierre); Dupont Pierre;
Préalables
Les étudiants doivent maîtriser les compétences suivantes :
  • implémenter et tester une solution sous la forme d'un prototype logiciel et/ou d'un modèle numérique,
  • démontrer une bonne compréhension des concepts et de la méthodologie de la programmation,
  • faire un choix justifié entre plusieurs représentations des informations et plusieurs algorithmes pour les traiter,
  • analyser un problème, proposer une solution informatique pour le résoudre et la mettre en oeuvre dans un langage de haut niveau,
  • comprendre et savoir appliquer dans des situations variées les concepts de base de probabiités et de l'inférence statistique,
  • tirer des conclusions fiables à partir de données d'échantillons statistiques,
telles que couvertes dans les cours LEPL1401 , LEPL1402 et LEPL1109.
Les compétences suivantes sont également utiles.  Elles sont brièvement revues en début du cours LGBIO2010 :
  • comprendre le fonctionnement des organismes vivants à l'échelle de la cellule,
  • décrire les concepts de la base de la génétique moléculaire
  • définir les différentes classes de biomolécules ainsi que les processus et structures cellulaires où elles interviennent,
telles que couvertes dans les cours LGBIO1111 et LBIR1250A
Thèmes abordés
  • Introduction à la biologie moléculaire
  • Recherche dans des bases de données biologiques
  • Comparaison et alignements de séquences
  • Recherche de motifs
  • Modèles de Markov cachés
  • Technologies et méthodes d'analyse du transcriptome
  • Méthodes d'inférence de réseaux d'interaction
  • Algorithmes de construction d'arbres phylogénétiques
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 Eu égard au référentiel AA du programme « Master ingénieur civil en génie biomédical », ce cours contribue au développement, à l'acquisition et à l'évaluation des acquis d'apprentissage suivants :
  • AA1.1, AA1.2, AA1.3
  • AA2.2, AA2.4
  • AA4.3
  • AA5.3
Plus précisément, au terme du cours, l'étudiant sera capable de :
- maîtriser des concepts de base en biologique moléculaire pour une utilisation pertinente d'outils bio-informatiques,
- concevoir, développer et utiliser des outils et méthodes informatiques spécifiques à la gestion, l'exploitation et la recherche d'informations dans des collections de données biologiques,
- faire un choix argumenté entre différentes techniques informatiques pour résoudre des problèmes biologiques.
Acquis d'apprentissage transversaux :
- Mener à bien un projet en équipe, éventuellement entre étudiants avec des compétences initiales complémentaires en informatique ou en biologie, et fournir en commun une solution argumentée à un problème bioinformatique donné
- S'appuyer à bonne escient sur des informations disponibles dans des bases de données externes (telles que GenBank ou UniProt) régulièrement mise à jour
- Maîtriser un environnement logiciel tel que R (Bioconductor).
 
Contenu
  • Introduction à la biologie moléculaire
  • Recherche dans des bases de données biologiques
  • Alignement de reads et assemblage de génomes
  • Comparaison et alignements, simple et multiple, de séquences
  • Modèles de Markov cachés
  • Algorithmes de construction d'arbres phylogénétiques
  • Méthodes d'analyse de l'expression génique (transcriptome)
  • Sélection de biomarqueurs
  • Modèles prédictifs
Méthodes d'enseignement
Cours magistraux et projets.
  • Des projets sont réalisés par groupes de (max) 2 étudiants pour mettre en oeuvre, et adapter au besoin, des algorithmes vus au cours.
  • Le langage R est utilisé pour réaliser ces projets. Un tutoriel sur R est présenté aux étudiants au début du premier projet.
Les projets se font en ligne sur la plateforme Inginious.
Modes d'évaluation
des acquis des étudiants

Calcul de la note globale pour le cours

La note du cours se répartit comme suit :
  • 25% pour les projets effectués en groupes de (max.) 2 étudiants pendant le quadrimestre,
  • 75% pour l'examen final
La note des projets est définitive à l'issue du quadrimestre : il n'y a pas de possibilité de refaire ces exercices en seconde session.
L'examen final est, par défaut, un écrit (sur papier ou, le cas échéant, sur ordinateur).

Règles concernant les collaborations entre étudiants et l'usage de ressources externes

Une collaboration active entre les étudiant.e.s est encouragée lors des séances de suivi de projets
et via un forum d'échanges sur Moodle.
Chaque groupe de (max.) 2 étudiant.e(s) doit soumettre sa propre solution pour chaque projet. Le recours à des ressources publiques (p.ex. stackoverflow.com), ce inclus des IA génératives (p.ex. chatGPT) est autorisé pour autant que chaque (fragment de) code soumis par chaque groupe mentionne toutes les ressources utilisées.
La diffusion ou l'échange entre groupes d'étudiants de (fragments de) code ne sont pas autorisés par quelque moyen que ce soit (GitHub, Facebook, Discord, ...) et ce même après la date limite de remise des projets.
Le non-respect de ces règles pour n'importe quel projet entraînera une note globale de 0 pour l'ensemble des projets.
Ces règles sont exposées et détaillées lors du premier cours (voir site Moodle du cours).
 
Bibliographie
Recommended textbooks - Ouvrages complémentaires conseillés :
- Biological Sequence Analysis : Probabilistic Models of Proteins and Nucleic Acids, R. Durbin et al., Cambridge University Press, 1998.
- Inferring Phylogenies, J. Felsenstein, Sinauer Associates; 2nd ed., 2003.
- Bioinformatics, Sequence and Genome Analysis, D. Mount, Cold Spring Harbord Laboratory Press, 2nd ed., 2004.
- Introduction to Computational Genomics : a case-study approach, N. Cristianini M. Hand, Cambridge University Press, 2007.
Support de cours
  • Required teaching material include all documents (lecture slides, project assignments, complements, ...) available from the Moodle website for this course.
  • Les supports obligatoires sont constitués de l'ensemble des documents (transparents des cours magistraux, énoncés des travaux pratiques, compléments, ...) disponibles depuis le site Moodle du cours.
Faculté ou entité
en charge


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] : ingénieur civil biomédical

Master [120] en statistique, orientation biostatistiques

Master [120] : ingénieur civil en informatique

Master [120] en sciences informatiques

Master [120] : ingénieur civil en mathématiques appliquées

Master [120] : ingénieur civil en science des données

Master [120] en science des données, orientation technologies de l'information