Quel est le but quand on fait un comparison d’une séquence avec des séquences déjà connue et répertorié dans les bases de donnée ?
Obtenir des infos sur la séquence inconnue garce aux infos déjà dispos dans les banques de données.
Quel est le problème quand on veut faire aligner une séquence avec celles de la BDD ?
Quelle est la solution ?
-calculer dans un temps raisonnable : développement de programme de recherche de similarité dans les banques de données
: BLAST et FASTA
BLAST et FASTA
Qu’est-ce qu’un programme heuristique ?
Approximation ou simplification d’algorithmes plus ou moins justifié permet de réduire de manière astucieuse le temps de calcul ou la complexité de l’algorithme
—> on peut sacrifier un peu de sensibilité à la menthode
Principe de FASTA
🔹 index tous les mot de longueur on er leurs position dans la séquence. Identité entre les Ktuble
🔹diagonale
🔹alignement Smith-Waterman
Principe de BLAST
Blast ou FASTA pour les proteine ?
Et pour le nucleotides ?
Quelle stratégie adopter ?
On fait un blast car plus sensible pour les proteine
Et un FASTA pour les nucleotides, mais aussi plus lent.
Faire un blastN Et faire ensuite un FASTA
Que fait le blast 2 ?
Alignement local avec gap : sélectionne les meilleures HSP
E value
Le nombre attendu d’alignement qui par chance aurait un score >ou égal à 5 lors de la comparaison de séquences aléatoires
Plus elle est petites plus elle est significative
Blast 10
BLASTn
Séquence requête : nucleotides
Types de BDD : nucleotides
Trouver les exons introns d’un gène
BLASTp
Séquence requête : protéique
Type de BDD : protéique
Recherche des protéines homologues
BLASTx
Séquence requête : nucléique (traduire dans les 6 cadre)
Type de BDD : protéique
Identification des régions codantes des sequence nucléiques
TBLASTn
Séquence requête : protéique
Type de BDD: nucléiques ( traduite dans les 6 cadres )
Trouver les régions génomiques correspondant à la protéine (pseudogene
, gène non annoté etc )
Tblastx
Type de la séquence requête : nucléiques ( traduite dans les 6 cadres )
Types de BDD : nucléiques ( traduite dans les 6 cadres)
Revient à effecteur 36 blast p coûteux en énergie