4-AlignementMultiple Flashcards

(37 cards)

1
Q

Quel est le problème principal lié à l’étiquetage des nœuds internes d’un arbre phylogénétique T?

A

Minimiser le score de T (somme des poids des arêtes)

Un étiquetage optimal est appelé alignement phylogénétique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’un alignement phylogénétique?

A

Un arbre T avec étiquetage de ses nœuds internes

Il induit un alignement de S consistant avec T.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Le problème de l’étiquetage est classé comme NP-complet. Vrai ou faux?

A

VRAI

Cela signifie qu’il n’existe pas de solution efficace connue pour ce problème.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’un alignement consistant avec un arbre T?

A

Alignement multiple de S tel que pour tout couple de séquences S_i, S_j reliées par une arête, S_i et S_j sont alignées de façon optimale

Cela garantit que l’alignement respecte la structure de l’arbre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelle est la complexité d’alignement pour k séquences de taille n?

A

O(kn²)

Cela reflète le coût computationnel de l’alignement multiple.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’un arbre étoile?

A

Un arbre connectant toutes les séquences de S, avec une racine S_c

S_c est la séquence centrale qui minimise la somme des distances à toutes les autres séquences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment est calculée la complexité pour trouver la séquence centrale S_c?

A

O(k²n²)

Cela implique de calculer les distances entre toutes les paires de séquences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qu’une heuristique bornée?

A

Algorithme qui n’est pas garanti d’obtenir la solution optimale, mais dont on sait dans quel intervalle se situe la solution

Utilisée pour des problèmes difficiles comme ceux de type NP-complet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel est le score d’un alignement multiple A par rapport à un alignement optimal A*?

A

Au plus deux fois plus élevé que le score d’un alignement optimal

Cela garantit une approximation raisonnable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel est le rôle de l’algorithme de Carillo & Lipman en 1988?

A

Calculer les alignements optimaux pour chaque paire de séquences

Il a été implémenté dans MSA pour améliorer l’efficacité des alignements.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que la méthode d’alignement par points d’ancrage?

A

Basée sur la recherche de motifs communs à une majorité de séquences

Exemple: MACAW, qui divise le problème en parties gauche et droite par rapport au motif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est la complexité de l’alignement optimal d’un sous-arbre de racine v?

A

O(k²n²)

Cela inclut le calcul des distances entre les séquences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que le score SP d’un alignement multiple A?

A

Score d’un alignement optimal de S_i et S_j

Il est utilisé pour évaluer la qualité de l’alignement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quel est le but de l’algorithme de Barton-Stenberg (MultAlign)?

A

Choisir l’alignement de score max et construire une matrice consensus

Il itère jusqu’à épuisement des séquences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

La complexité de l’algorithme pour calculer tous les D(Si,Sj) est de _______.

A

O(k²n²)

Cela se produit lors d’un prétraitement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Pour chaque nœud v, le calcul de d(v,S) a une complexité de _______.

A

O(k)

La complexité totale devient O(k²n² + k³).

17
Q

L’alignement phylogénétique optimal est noté T* et on veut construire un alignement soulevé TS à partir de _______.

A

T*

Dans TS, v est étiqueté par la séquence de S la plus proche de Sv*.

18
Q

Le score de TS est inférieur ou égal à _______ fois le score de T*.

A

2

Cela indique une relation entre les scores d’alignement.

19
Q

Nommez quelques outils d’alignement multiple utilisés dans l’alignement phylogénétique.

A
  • MultAlign
  • ClustalW
  • Pileup
  • T-Coffee
  • DIALIGN

Ces outils diffèrent principalement par la méthode de construction de l’arbre guide.

20
Q

L’algorithme ClustalW utilise la méthode de _______ pour construire un arbre guide.

A

Neighbour-Joining

Cet algorithme est le plus utilisé pour le calcul des scores d’alignement.

21
Q

L’alignement d’une séquence avec une matrice consensus utilise une méthode _______.

A

itérative

Cela implique d’améliorer un alignement de basse qualité par des itérations.

22
Q

La complexité de l’alignement optimal entre S[1..i] et C[1..j] est de _______.

A

O(|S| mn)

Ici, n est le nombre de colonnes de C et m est la taille de S.

23
Q

Le score d’un alignement optimal D(i,j) est calculé comme suit : D(i,j) = max [D(i-1,j-1) + p(Si,Cj), D(i-1,j) + p(Si,-), D(i,j-1) + p(-,Cj)]. Vrai ou faux?

A

VRAI

Cela décrit la formule de calcul du score d’alignement optimal.

24
Q

Le score d’appariement entre S[i] et T[j] est noté _______.

A

c(i,j)

Cela fait partie du calcul du score d’alignement.

25
Les méthodes itératives sont souvent utilisées pour résoudre le problème des alignements intermédiaires **figés**. Vrai ou faux?
VRAI ## Footnote Ces méthodes permettent d'améliorer les alignements en évitant la rigidité.
26
Le score d'un alignement optimal D(i,j,k) est calculé en examinant _______ cases voisines.
7 ## Footnote Cela inclut des calculs basés sur les distances d'édition avec pondération.
27
What is the **purpose** of **multiple alignment**?
* Trouver des contraintes de structures pour les ARN * Trouver des caractéristiques communes à une famille de protéines * Caractériser les régions conservées et les régions variables * Relier la séquence à la structure et à la fonction * Reconstituer des phylogénies * Sélectionner des séquences homologues * Trouver un alignement multiple * L’utiliser pour construire l’arbre phylogénétique * Inférer des scénarios d’évolution ## Footnote L’alignement multiple joue un rôle central pour comprendre les relations entre fonction, évolution, séquence et structure d’une famille de gènes ou de protéines.
28
True or false: The **score SP** is the most commonly used score for alignment.
TRUE ## Footnote Le score SP a de bonnes propriétés théoriques et pratiques.
29
What does the **score SP** of an alignment represent?
La somme des scores des alignements induits pour chaque paire de séquences dans A ## Footnote C'est une généralisation du score utilisé pour l’alignement de deux séquences.
30
Fill in the blank: Un bon alignement reflète le **modèle d’évolution** qui a donné lieu aux séquences, en supposant que les séquences à aligner descendent d’un _______.
ancêtre commun ## Footnote Les séquences ont évolué par mutations ponctuelles.
31
What are the **usual heuristics** for multiple alignment?
* Méthodes progressives * Méthodes itératives * Méthodes par point d’ancrage ## Footnote Ces méthodes sont utilisées pour résoudre le problème d’alignement multiple.
32
What is the **complexity** of the exact solution for multiple alignment?
O(n^m) ## Footnote Très inefficace dès que m > 5 et n ~ 100.
33
What is the **alignment matrix** A in multiple alignment?
A = (a_ij), 1 ≤ i ≤ k; 1 ≤ j ≤ l ## Footnote a_ij symboles de l’alphabet ou ‘-’, où la concaténation des caractères à la ligne i produit S_i.
34
What is the **goal** of multiple alignment?
* Trouver des contraintes de structures pour les ARN * Caractériser les régions conservées et les régions variables * Relier la séquence à la structure et à la fonction * Reconstituer des phylogénies ## Footnote L’alignement multiple aide à comprendre les relations entre fonction, évolution, séquence et structure.
35
What is the **NP-complete** problem in multiple alignment?
Trouver un alignement multiple ayant un score SP minimum ## Footnote Ce problème a été identifié par Wang et Jiang en 1994.
36
What is the **importance** of weighting in multiple alignment?
Garder l’alignement qui produit l’arbre de poids minimal ## Footnote La pondération d’un alignement multiple est essentielle pour la construction d’arbres phylogénétiques.
37
What does the **function G** represent in multiple alignment?
Une fonction de pondération des indels ## Footnote La pondération affine est souvent utilisée, avec un coût supérieur pour l’ouverture d’un « gap » que pour son élongation.