Module 6 - Protéomique Flashcards

(25 cards)

1
Q

Décrivez en détail les grandes étapes du pipeline protéomique basé sur la spectrométrie de masse.

A

Le pipeline protéomique par spectrométrie de masse vise à identifier et quantifier les protéines présentes dans un échantillon biologique complexe. Il débute par la préparation des échantillons, incluant la lyse cellulaire, l’extraction des protéines, leur purification partielle et leur digestion enzymatique (souvent par la trypsine) afin de générer des peptides analysables.
Les peptides sont ensuite séparés par chromatographie liquide (LC), ce qui réduit la complexité de l’échantillon et améliore la résolution analytique.
La spectrométrie de masse en tandem (LC-MS/MS) permet alors de mesurer les rapports masse/charge (m/z) des peptides intacts (MS1) et de leurs fragments (MS2).
Les spectres expérimentaux sont comparés à des spectres théoriques générés à partir de bases de données protéiques, permettant l’identification des peptides.
Un contrôle statistique du taux de fausses découvertes (FDR) est appliqué pour garantir la fiabilité des identifications.
Enfin, les peptides identifiés sont utilisés pour inférer les protéines, estimer leurs abondances relatives et produire une interprétation biologique (voies, réseaux, fonctions cellulaires)
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Expliquez pourquoi la préparation des échantillons est une étape déterminante en protéomique.

A

La préparation des échantillons est critique car elle influence directement la qualité, la reproductibilité et l’interprétabilité des données de spectrométrie de masse. Cette étape comprend la lyse des cellules ou tissus, permettant de libérer les protéines, suivie de l’élimination de contaminants (lipides, glucides, métabolites) susceptibles d’interférer avec l’ionisation.
Les protéines sont ensuite dénaturées, réduites (rupture des ponts disulfure) et alkylées afin d’éviter leur reformation. Cette dénaturation garantit un clivage enzymatique homogène.
La digestion enzymatique transforme les protéines en peptides de taille compatible avec la MS. Une préparation inadéquate peut entraîner une perte sélective de protéines, une digestion incomplète ou une suppression ionique, conduisant à des biais quantitatifs et des erreurs d’identification
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pourquoi la trypsine est-elle privilégiée pour la digestion des protéines en protéomique ?

A

La trypsine est l’enzyme de choix en protéomique car elle clive spécifiquement les liaisons peptidiques en C-terminal des résidus lysine (K) et arginine (R), sauf en présence de proline. Cette spécificité génère des peptides de longueur optimale pour la spectrométrie de masse.
De plus, ces peptides possèdent généralement une charge positive en C-terminal, ce qui améliore leur ionisation en mode électrospray. La fragmentation CID produit alors des séries d’ions b et y prévisibles, facilitant l’identification par recherche en base de données. Enfin, la trypsine est robuste, reproductible et bien caractérisée, ce qui standardise les analyses protéomiques
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Expliquez le fonctionnement et l’intérêt de la LC-MS/MS en protéomique.

A

La LC-MS/MS combine deux techniques complémentaires. La chromatographie liquide sépare les peptides selon leur hydrophobicité, réduisant la complexité instantanée introduite dans le spectromètre.
La spectrométrie de masse mesure ensuite les ions peptidiques. En MS1, le spectromètre détecte l’ensemble des peptides présents à un temps donné. Un ion précurseur est sélectionné, isolé puis fragmenté par collision (CID ou HCD). Les fragments générés sont analysés en MS2, produisant un spectre spécifique à la séquence du peptide.
Cette approche permet l’identification simultanée de milliers de peptides dans un seul échantillon complexe
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comparez les informations fournies par les spectres MS1 et MS2.

A

Le spectre MS1 fournit des informations globales sur les peptides présents : masse, charge, abondance relative et distribution isotopique. Il est utilisé pour la quantification et la sélection des ions à fragmenter.
Le spectre MS2, issu de la fragmentation d’un ion précurseur spécifique, contient des ions fragments dont les différences de masse correspondent aux acides aminés successifs de la séquence. Ces informations sont essentielles pour identifier précisément le peptide et distinguer des peptides de masse similaire
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Décrivez le mécanisme de la fragmentation par Collision-Induced Dissociation (CID).

A

La CID repose sur l’accélération d’ions peptidiques dans un champ électrique puis leur collision avec un gaz inerte (souvent N₂). Cette collision transfère de l’énergie cinétique aux ions, provoquant la rupture préférentielle des liaisons peptidiques, principalement entre le carbone carbonyle et l’azote amide.
La fragmentation génère des ions b (fragment N-terminal) et y (fragment C-terminal). L’ensemble de ces ions constitue une empreinte spécifique permettant la reconstruction de la séquence du peptide
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment prédit-on théoriquement les masses des peptides observés en MS1 ?

A

À partir de la séquence protéique codée par le génome, une digestion enzymatique in silico est effectuée. Pour chaque peptide théorique, la masse exacte est calculée en tenant compte de la composition atomique, des charges possibles et des isotopes naturels (C¹³, N¹⁵).
Le pic monoisotopique correspond à la combinaison isotopique la plus légère et est généralement le plus intense. Cette prédiction est essentielle pour associer les pics MS1 aux peptides candidats
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Expliquez comment les peptides sont identifiés par recherche en base de données.

A

Les spectres MS/MS expérimentaux sont comparés à des spectres théoriques générés à partir de bases de données protéiques (Uniprot, RefSeq). Chaque peptide théorique est fragmenté virtuellement, et un score mesure la similarité entre les pics observés et prédits.
Le peptide associé au meilleur score est assigné au spectre, formant une correspondance peptide-spectre (PSM). Cette étape est centrale pour l’identification à grande échelle des protéines
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Décrivez en détail le fonctionnement de l’algorithme SEQUEST.

A

SEQUEST génère des spectres MS/MS théoriques à partir de peptides prédits, puis les compare aux spectres expérimentaux. L’algorithme effectue une corrélation croisée entre les intensités des pics, en décalant les spectres pour maximiser le score.
Le score final reflète la qualité de l’alignement et permet de sélectionner le peptide candidat le plus probable parmi plusieurs hypothèses
Module 6 - Protéomique
.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pourquoi les analyses protéomiques génèrent-elles des faux positifs et quels en sont les principaux mécanismes ?

A

Les faux positifs en protéomique correspondent à des peptides ou protéines identifiés alors qu’ils ne sont pas réellement présents dans l’échantillon. Ils sont inévitables dans les analyses à haut débit en raison de plusieurs facteurs expérimentaux et computationnels.
Premièrement, la complexité extrême des mélanges peptidiques fait que de nombreux peptides possèdent des masses similaires, voire identiques, ce qui augmente le risque d’attribution incorrecte.
Deuxièmement, les spectres MS/MS sont souvent incomplets ou bruités, notamment à cause d’une fragmentation partielle, de la co-fragmentation de plusieurs peptides simultanément ou d’une faible intensité du signal.
Troisièmement, les algorithmes de recherche en base de données comparent chaque spectre expérimental à un très grand nombre de peptides théoriques. Par pur hasard statistique, certains peptides incorrects peuvent obtenir un score élevé.
Enfin, les erreurs peuvent être amplifiées lors de l’inférence protéique, où des peptides partagés sont attribués à des protéines incorrectes. C’est pour ces raisons qu’un contrôle statistique rigoureux, comme le FDR, est indispensable pour interpréter correctement les résultats
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Définissez le False Discovery Rate (FDR) et expliquez pourquoi il est indispensable en protéomique.

A

Le False Discovery Rate (FDR) est une mesure statistique qui représente la proportion attendue de fausses identifications parmi l’ensemble des identifications acceptées. Contrairement à une simple probabilité d’erreur individuelle, le FDR contrôle la qualité globale d’un jeu de données.
En protéomique, des milliers, voire des millions de correspondances peptide-spectre (PSMs) sont générées. Même avec des algorithmes performants, un certain nombre d’identifications erronées est inévitable. Le FDR permet donc de trouver un compromis entre sensibilité (identifier le plus de peptides possible) et spécificité (limiter les faux positifs).
Sans FDR, les résultats seraient dominés par des identifications incorrectes, rendant toute interprétation biologique non fiable. Le FDR est ainsi un pilier fondamental de l’analyse protéomique moderne à grande échelle
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Expliquez en détail comment le FDR est calculé et ce que signifie un FDR de 5 %.

A

Le FDR est généralement estimé par la stratégie target–decoy. Deux bases de données sont utilisées :
1. une base target, contenant les vraies séquences protéiques,
2. une base decoy, contenant des séquences artificielles (souvent inversées ou aléatoirement permutées) ayant la même composition en acides aminés.
Les spectres expérimentaux sont recherchés simultanément contre les deux bases. Les identifications obtenues sur la base decoy sont, par définition, des faux positifs.
Le FDR est calculé comme le ratio entre le nombre de correspondances decoy et le nombre total de correspondances au-dessus d’un seuil de score donné.
Un FDR de 5 % signifie que, statistiquement, 5 % des peptides acceptés sont des identifications incorrectes, ce qui est généralement considéré comme un seuil acceptable pour les analyses globales en protéomique
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Pourquoi l’inférence des protéines à partir des peptides est-elle un problème complexe et non trivial ?

A

L’inférence protéique consiste à déterminer quelles protéines sont réellement présentes à partir des peptides identifiés. Ce problème est complexe car un même peptide peut appartenir à plusieurs protéines, notamment dans le cas d’isoformes, de familles protéiques homologues ou de protéines partageant des domaines conservés.
Ainsi, l’identification d’un peptide ne garantit pas l’identification unique d’une protéine. Les algorithmes d’inférence cherchent généralement à identifier l’ensemble minimal de protéines expliquant l’ensemble des peptides observés (principe de parcimonie).
Cette approche peut conduire à des groupes de protéines indistinguables expérimentalement. Par conséquent, la protéomique fournit souvent des groupes protéiques plutôt que des protéines uniques, ce qui doit être pris en compte lors de l’interprétation biologique
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Expliquez pourquoi la quantification en protéomique est le plus souvent relative et non absolue.

A

La spectrométrie de masse mesure des intensités ioniques, qui ne sont pas directement proportionnelles aux concentrations absolues des protéines. Ces intensités dépendent de nombreux facteurs : efficacité d’ionisation, suppression ionique, pertes lors de la préparation des échantillons et variabilité instrumentale.
Sans standards internes isotopiquement marqués pour chaque protéine, il est impossible de convertir ces intensités en concentrations absolues fiables.
Ainsi, la protéomique compare généralement les rapports d’abondance entre conditions expérimentales, ce qui permet d’identifier des changements biologiquement pertinents même en l’absence de quantification absolue
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Décrivez la quantification label-free et discutez ses avantages et limites.

A

La quantification label-free repose sur la comparaison des intensités de peptides entre plusieurs échantillons analysés séparément. Elle peut utiliser soit l’intensité des pics MS1, soit le nombre de spectres MS/MS associés à un peptide.
Son principal avantage est sa simplicité, puisqu’elle ne nécessite aucun marquage isotopique et peut être appliquée à un grand nombre d’échantillons.
Cependant, elle est très sensible aux variations expérimentales (préparation, chromatographie, instrument), ce qui impose des méthodes de normalisation rigoureuses et limite parfois la précision quantitative
Module 6 - Protéomique
.
________________________________________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Expliquez en détail le principe du SILAC et ses avantages majeurs.

A

Le SILAC (Stable Isotope Labeling by Amino acids in Cell culture) repose sur l’incorporation métabolique d’acides aminés lourds (ex. lysine ou arginine marquées en C¹³/N¹⁵) dans les protéines cellulaires.
Deux populations cellulaires sont cultivées séparément (conditions contrôle et traitement), puis mélangées avant la préparation et l’analyse MS. Les peptides lourds et légers sont chimiquement identiques mais séparables par leur masse.
Cette approche élimine la majorité des biais techniques, car les échantillons sont analysés ensemble. Le SILAC offre ainsi une quantification relative très précise et reproductible, particulièrement adaptée aux études de dynamique protéique et de signalisation
Module 6 - Protéomique
.
________________________________________

17
Q

Décrivez le principe de l’étiquetage isobarique et son intérêt expérimental.

A

L’étiquetage isobarique (TMT, iTRAQ) utilise des réactifs chimiques qui marquent les peptides avec des masses totales identiques. Les échantillons marqués sont mélangés et analysés ensemble.
Lors de la fragmentation MS2 ou MS3, les tags libèrent des ions rapporteurs de masses distinctes, permettant la quantification relative des peptides entre plusieurs conditions.
Cette approche permet l’analyse simultanée de nombreux échantillons dans une seule expérience, mais peut être affectée par la compression de ratios due à la co-fragmentation
Module 6 - Protéomique
.
________________________________________

18
Q

Comment la protéomique permet-elle l’étude des réseaux d’interactions protéine-protéine ?

A

La protéomique étudie les interactions protéine-protéine principalement par purification d’affinité couplée à la spectrométrie de masse (AP-MS). Une protéine d’intérêt est utilisée comme appât, purifiée avec ses partenaires, puis analysée par MS.
Cette approche permet d’identifier les complexes protéiques, de distinguer les interactions fortes et faibles, et d’explorer l’organisation globale de l’interactome cellulaire
Module 6 - Protéomique
.
________________________________________

19
Q

Expliquez le lien entre stœchiométrie des interactions protéiques et thermodynamique.

A

La stœchiométrie décrit le rapport d’abondance entre une protéine appât et ses partenaires dans un complexe. Ce rapport est directement lié à l’énergie libre de liaison (ΔG) : des interactions fortes présentent des stœchiométries élevées et stables.
Ainsi, la protéomique permet non seulement d’identifier les interactions, mais aussi d’inférer leur force et leur stabilité thermodynamique à l’échelle du protéome
Module 6 - Protéomique
.
________________________________________

20
Q

Expliquez les notions de connecteurs et de modules dans les réseaux protéiques.

A

Les modules correspondent à des complexes protéiques stables, fortement connectés, associés à des fonctions bien définies.
Les connecteurs établissent des interactions faibles et transitoires entre modules. Ils assurent la communication entre processus cellulaires distincts, mais rendent le réseau plus fragile.
Cette organisation hiérarchique reflète la plasticité fonctionnelle du protéome
Module 6 - Protéomique
.

21
Q

Décrivez en détail comment la phosphoprotéomique est réalisée et expliquez pourquoi cette approche est essentielle pour l’étude de la signalisation cellulaire.

A

La phosphoprotéomique est une branche de la protéomique dédiée à l’étude des phosphorylations des protéines, une modification post-traductionnelle centrale dans la régulation de la signalisation cellulaire.
Après la préparation classique des échantillons (lyse, digestion enzymatique), les peptides phosphorylés sont spécifiquement enrichis, car ils sont généralement peu abondants et masqués par les peptides non phosphorylés. L’enrichissement repose souvent sur des matrices ayant une forte affinité pour les groupements phosphate, telles que le dioxyde de titane (TiO₂) ou l’IMAC (Immobilized Metal Affinity Chromatography).
Les peptides enrichis sont ensuite analysés par LC-MS/MS, permettant d’identifier les sites de phosphorylation et de mesurer leurs variations d’abondance entre conditions.
Cette approche est essentielle car la phosphorylation est dynamique, réversible et rapide, et qu’elle contrôle des processus clés comme la transduction de signaux, le cycle cellulaire, l’endocytose et la réponse au stress. La phosphoprotéomique permet ainsi de capturer une image fonctionnelle et temporelle de l’état de signalisation d’une cellule
Module 6 - Protéomique
.
________________________________________

22
Q

Expliquez comment la protéomique et la phosphoprotéomique ont permis de caractériser en profondeur la réponse HOG au stress osmotique.

A

La réponse HOG (High Osmolarity Glycerol) est un modèle de signalisation cellulaire étudié grâce à des approches protéomiques quantitatives, notamment le SILAC couplé à la phosphoprotéomique temporelle.
Dans ce type d’expérience, des cellules sont exposées à un choc osmotique, puis rapidement figées dans le temps (par congélation rapide) afin de préserver l’état exact des phosphorylations. Les protéines sont ensuite extraites, digérées et les peptides phosphorylés enrichis avant analyse MS.
Les résultats ont montré que la réponse HOG n’est pas une simple cascade linéaire de phosphorylations, mais une réorganisation massive et coordonnée impliquant des centaines d’événements de phosphorylation et de déphosphorylation en quelques secondes.
De plus, la phosphoprotéomique a révélé que la déphosphorylation joue un rôle aussi important que la phosphorylation, soulignant la complexité et la précision du contrôle de la signalisation. Cette approche a permis d’identifier des processus complémentaires, tels que l’arrêt de l’endocytose et du cycle cellulaire, nécessaires à l’adaptation au stress osmotique
Module 6 - Protéomique
.
________________________________________

23
Q

Décrivez en détail le principe de la protéomique par protéolyse limitée (LiP-MS) et ce qu’elle permet de révéler sur les protéines.

A

La LiP-MS (Limited Proteolysis Mass Spectrometry) est une approche protéomique conçue pour détecter les changements conformationnels des protéines à l’échelle du protéome, indépendamment de leur abondance.
Dans cette méthode, les protéines sont initialement maintenues dans leur état replié natif. Une protéase non spécifique est brièvement appliquée, clivant uniquement les régions accessibles à la surface des protéines. Les protéines sont ensuite totalement dénaturées et digérées par la trypsine.
Les peptides résultants sont analysés par LC-MS/MS. Les différences d’abondance de certains fragments reflètent des changements d’accessibilité structurale, révélateurs de modifications de conformation, d’assemblage en complexes, d’agrégation ou d’effets allostériques.
La LiP-MS a montré que, lors de perturbations cellulaires (ex. stress osmotique), beaucoup plus de protéines changent de conformation que d’abondance, démontrant que la régulation fonctionnelle passe souvent par des réarrangements structuraux plutôt que par des variations d’expression
Module 6 - Protéomique
.
________________________________________

24
Q

Expliquez le principe du marquage de proximité et discutez ses avantages par rapport aux approches classiques d’interactions protéiques.

A

Le marquage de proximité est une stratégie protéomique permettant d’identifier les protéines spatialement proches d’une protéine d’intérêt dans un contexte cellulaire vivant.
Une enzyme modifiée (ex. APEX2) est fusionnée à la protéine cible. Lors de l’activation, cette enzyme catalyse la formation de radicaux réactifs qui biotinylent de façon covalente les protéines situées dans un rayon de quelques nanomètres.
Les protéines biotinylées sont ensuite purifiées par affinité (streptavidine) et identifiées par spectrométrie de masse.
Contrairement à l’AP-MS classique, le marquage de proximité permet de capturer des interactions transitoires, faibles ou dépendantes du contexte spatial, souvent perdues lors des étapes de purification. Cette approche est particulièrement puissante pour cartographier la composition des organelles et l’organisation subcellulaire des protéines
Module 6 - Protéomique
.
________________________________________

25
Décrivez en profondeur le principe des Protein-fragment Complementation Assays (PCA) et leurs principales applications en biologie cellulaire.
Les Protein-fragment Complementation Assays (PCA) sont des méthodes permettant de détecter directement et spécifiquement les interactions protéine-protéine in vivo. Une protéine rapporteur est divisée en deux fragments inactifs, chacun fusionné à une protéine d’intérêt. Lorsque les deux protéines d’intérêt interagissent, les fragments du rapporteur se rapprochent et se reconstituent en une protéine fonctionnelle, générant un signal mesurable (croissance cellulaire, fluorescence ou activité enzymatique). Les PCA offrent une sensibilité extrêmement élevée, capable de détecter moins de 100 complexes par cellule, et une plage dynamique très large. Elles permettent également d’étudier la dynamique spatio-temporelle des interactions, leur dépendance aux modifications post-traductionnelles et leurs variations en fonction des conditions cellulaires. Enfin, combinées au séquençage à haut débit, les PCA permettent de relier interactions, stabilité protéique, énergie libre de liaison et fitness cellulaire, ouvrant la voie à une analyse quantitative et thermodynamique des réseaux protéiques à grande échelle Module 6 - Protéomique .