Alignements De Séquences Flashcards

(22 cards)

1
Q

Qu’est‑ce qu’un gène orthologue ?

A

Deux gènes de taxons différents provenant d’un même gène de l’ancêtre commun. → Sert à établir les relations de parenté.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quels sont les deux grands types de mutations dans les séquences ?

A
  • Mutations ponctuelles (substitution d’une base).

  • Indels : insertions ou délétions (cause un « gap »).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment distinguer insertion et délétion ?

A

On ne peut pas toujours savoir : cela dépend si l’on connaît l’état ancestral.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est‑ce qu’un alignement de séquences ?

A

Mise en correspondance des bases/acides aminés pour repérer identités, substitutions et indels.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Alignement global vs local ?

A
  • Global : aligne toute la longueur des séquences.

  • Local : aligne seulement les régions conservées.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Principe du DotPlot ?

A

Placer une séquence en ligne, l’autre en colonne, et tracer un point aux positions identiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que représente une diagonale continue pour le dotplot ?

A
  • Diagonale ↘ = alignement global parfait.

  • Segment diagonal = alignement local.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Pourquoi les DotPlots protéiques sont plus lisibles que ceux ADN ?

A
  • Moins de chances de matches aléatoires (20 aa vs 4 bases).

  • Pas de mutations silencieuses dans la protéine.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment évaluer un alignement ?

A

On calcule un score basé sur :
* identités (positif)

* substitutions (négatif)

* insertions/délétions (plus négatif)


How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pourquoi utiliser des scores différents selon la mutation ?

A

Car certaines substitutions sont plus probables que d’autres.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Objectif de l’algorithme NW ?

A

Trouver le meilleur alignement global entre deux séquences via une matrice de scores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Trois types de déplacements dans la matrice NW ?

A
  • Diagonale → identité ou substitution

  • Droite → délétion

  • Bas → insertion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que représente la case tout en bas à droite dans nw ?

A

Le score global maximal = meilleure similarité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment reconstituer l’alignement ?

A

On remonte les flèches depuis la dernière case jusqu’à la première.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pourquoi travailler sur les protéines pour des alignement ?

A
  • Moins d’ambiguïtés (pas de mutations silencieuses).

  • Plus grande diversité (20 aa).

  • Meilleure conservation fonctionnelle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est‑ce qu’un codon synonyme ou silencieuse  ?

A

Mutation qui ne change pas l’acide aminé → « silencieuse ».

17
Q

Matrices PAM : principe ?

A

Basées sur substitutions acceptées entre protéines proches ; adaptées aux séquences évolutivement proches (PAM1), ou éloignées (PAM250).

18
Q

Matrices BLOSUM : principe ?

A

Construites à partir de régions conservées (« blocks »). 
BLOSUM62 = standard (séquences à 62% d’identité).

19
Q

PAM vs BLOSUM ?

A
  • PAM : bon pour séquences proches ; pondère trop les identités.

  • BLOSUM : basé sur plus de données, bon pour alignements locaux.

20
Q

Objectif de BLAST ?

A

Trouver des alignements locaux significatifs entre une séquence et une base de données.

21
Q

Qu’est‑ce qu’un motif protéique ?

A

Une séquence d’acides aminés définissant un domaine fonctionnel.

22
Q

Méthodes d’alignement selon nombre de séquences ?

A
  • 2 séquences : DotPlot, programmation dynamique (NW)

  • < 500 séquences : ClustalW

  • Très grand nombre : BLAST