Quel est le problème principal lié à l’étiquetage des nœuds internes d’un arbre phylogénétique T?
Minimiser le score de T (somme des poids des arêtes)
Un étiquetage optimal est appelé alignement phylogénétique.
Qu’est-ce qu’un alignement phylogénétique?
Un arbre T avec étiquetage de ses nœuds internes
Il induit un alignement de S consistant avec T.
Le problème de l’étiquetage est classé comme NP-complet. Vrai ou faux?
VRAI
Cela signifie qu’il n’existe pas de solution efficace connue pour ce problème.
Qu’est-ce qu’un alignement consistant avec un arbre T?
Alignement multiple de S tel que pour tout couple de séquences S_i, S_j reliées par une arête, S_i et S_j sont alignées de façon optimale
Cela garantit que l’alignement respecte la structure de l’arbre.
Quelle est la complexité d’alignement pour k séquences de taille n?
O(kn²)
Cela reflète le coût computationnel de l’alignement multiple.
Qu’est-ce qu’un arbre étoile?
Un arbre connectant toutes les séquences de S, avec une racine S_c
S_c est la séquence centrale qui minimise la somme des distances à toutes les autres séquences.
Comment est calculée la complexité pour trouver la séquence centrale S_c?
O(k²n²)
Cela implique de calculer les distances entre toutes les paires de séquences.
Qu’est-ce qu’une heuristique bornée?
Algorithme qui n’est pas garanti d’obtenir la solution optimale, mais dont on sait dans quel intervalle se situe la solution
Utilisée pour des problèmes difficiles comme ceux de type NP-complet.
Quel est le score d’un alignement multiple A par rapport à un alignement optimal A*?
Au plus deux fois plus élevé que le score d’un alignement optimal
Cela garantit une approximation raisonnable.
Quel est le rôle de l’algorithme de Carillo & Lipman en 1988?
Calculer les alignements optimaux pour chaque paire de séquences
Il a été implémenté dans MSA pour améliorer l’efficacité des alignements.
Qu’est-ce que la méthode d’alignement par points d’ancrage?
Basée sur la recherche de motifs communs à une majorité de séquences
Exemple: MACAW, qui divise le problème en parties gauche et droite par rapport au motif.
Quelle est la complexité de l’alignement optimal d’un sous-arbre de racine v?
O(k²n²)
Cela inclut le calcul des distances entre les séquences.
Qu’est-ce que le score SP d’un alignement multiple A?
Score d’un alignement optimal de S_i et S_j
Il est utilisé pour évaluer la qualité de l’alignement.
Quel est le but de l’algorithme de Barton-Stenberg (MultAlign)?
Choisir l’alignement de score max et construire une matrice consensus
Il itère jusqu’à épuisement des séquences.
La complexité de l’algorithme pour calculer tous les D(Si,Sj) est de _______.
O(k²n²)
Cela se produit lors d’un prétraitement.
Pour chaque nœud v, le calcul de d(v,S) a une complexité de _______.
O(k)
La complexité totale devient O(k²n² + k³).
L’alignement phylogénétique optimal est noté T* et on veut construire un alignement soulevé TS à partir de _______.
T*
Dans TS, v est étiqueté par la séquence de S la plus proche de Sv*.
Le score de TS est inférieur ou égal à _______ fois le score de T*.
2
Cela indique une relation entre les scores d’alignement.
Nommez quelques outils d’alignement multiple utilisés dans l’alignement phylogénétique.
Ces outils diffèrent principalement par la méthode de construction de l’arbre guide.
L’algorithme ClustalW utilise la méthode de _______ pour construire un arbre guide.
Neighbour-Joining
Cet algorithme est le plus utilisé pour le calcul des scores d’alignement.
L’alignement d’une séquence avec une matrice consensus utilise une méthode _______.
itérative
Cela implique d’améliorer un alignement de basse qualité par des itérations.
La complexité de l’alignement optimal entre S[1..i] et C[1..j] est de _______.
O(|S| mn)
Ici, n est le nombre de colonnes de C et m est la taille de S.
Le score d’un alignement optimal D(i,j) est calculé comme suit : D(i,j) = max [D(i-1,j-1) + p(Si,Cj), D(i-1,j) + p(Si,-), D(i,j-1) + p(-,Cj)]. Vrai ou faux?
VRAI
Cela décrit la formule de calcul du score d’alignement optimal.
Le score d’appariement entre S[i] et T[j] est noté _______.
c(i,j)
Cela fait partie du calcul du score d’alignement.