Qu’est‑ce qu’un gène orthologue ?
Deux gènes de taxons différents provenant d’un même gène de l’ancêtre commun. → Sert à établir les relations de parenté.
Quels sont les deux grands types de mutations dans les séquences ?
Comment distinguer insertion et délétion ?
On ne peut pas toujours savoir : cela dépend si l’on connaît l’état ancestral.
Qu’est‑ce qu’un alignement de séquences ?
Mise en correspondance des bases/acides aminés pour repérer identités, substitutions et indels.
Alignement global vs local ?
Principe du DotPlot ?
Placer une séquence en ligne, l’autre en colonne, et tracer un point aux positions identiques
Que représente une diagonale continue pour le dotplot ?
Pourquoi les DotPlots protéiques sont plus lisibles que ceux ADN ?
Comment évaluer un alignement ?
On calcule un score basé sur :
* identités (positif)
* substitutions (négatif)
* insertions/délétions (plus négatif)
Pourquoi utiliser des scores différents selon la mutation ?
Car certaines substitutions sont plus probables que d’autres.
Objectif de l’algorithme NW ?
Trouver le meilleur alignement global entre deux séquences via une matrice de scores.
Trois types de déplacements dans la matrice NW ?
Que représente la case tout en bas à droite dans nw ?
Le score global maximal = meilleure similarité.
Comment reconstituer l’alignement ?
On remonte les flèches depuis la dernière case jusqu’à la première.
Pourquoi travailler sur les protéines pour des alignement ?
Qu’est‑ce qu’un codon synonyme ou silencieuse  ?
Mutation qui ne change pas l’acide aminé → « silencieuse ».
Matrices PAM : principe ?
Basées sur substitutions acceptées entre protéines proches ; adaptées aux séquences évolutivement proches (PAM1), ou éloignées (PAM250).
Matrices BLOSUM : principe ?
Construites à partir de régions conservées (« blocks »). BLOSUM62 = standard (séquences à 62% d’identité).
PAM vs BLOSUM ?
Objectif de BLAST ?
Trouver des alignements locaux significatifs entre une séquence et une base de données.
Qu’est‑ce qu’un motif protéique ?
Une séquence d’acides aminés définissant un domaine fonctionnel.
Méthodes d’alignement selon nombre de séquences ?