Module 4 Flashcards

(244 cards)

1
Q

Quel est le rôle principal du plan d’analyse statistique (PAS) ?

A

Définir les principales analyses statistiques et prévenir le tripotage des données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pourquoi le PAS est-il obligatoire dans une demande de subvention et dans le protocole de l’étude ?

A

Parce qu’il assure une certaine objectivité dans l’analyse et prévient la subjectivité dans le choix des analyses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quand le PAS est-il généralement écrit et défini ?

A

Avant l’exécution de l’étude et avant d’avoir vu les résultats

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Pourquoi existe-t-il un risque sans PAS ?

A

Il y a de nombreuses façons d’analyser les données pouvant aboutir à des résultats différents

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que le tripotage des données ?

A

Le fait de modifier les analyses après avoir pris connaissance des résultats afin d’obtenir une conclusion différente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Comment appelle-t-on le tripotage des données en anglais ?

A

Harking

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Pourquoi le tripotage des données est-il problématique ?

A

Il est excessivement hasardeux, très fréquent en pratique et peut mener à des conclusions erronées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dans l’exemple du CRP dichotomique, quelle conclusion est tirée ?

A

Il ne semble pas y avoir d’évidence que l’intervention expérimentale soit supérieure à l’intervention placebo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pourquoi la reformulation du CRP en 4 catégories est problématique ?

A

Parce qu’elle est faite après avoir pris connaissance des résultats

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

À quoi le tripotage des données est-il comparé dans le texte ?

A

À un chercheur qui présente seulement les billets gagnants de la loterie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la question pertinente face à des résultats positifs ?

A

Savoir si seulement les résultats positifs sont présentés à la suite d’un exercice de tripotage de données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment appelle-t-on en statistique le fait de tester plusieurs catégorisations ?

A

Un problème de multiplicité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que doit-on faire si la multiplicité est présente ?

A

En tenir compte et la déclarer avant tout dans le PAS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que demandent les revues à fort facteur d’impact lors de la soumission d’un article ?

A

Une copie du PAS et la date où il a été scellé/finalisé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que demandent les organismes réglementaires comme Santé Canada ?

A

Les PAS et des preuves qu’ils ont été scellés/finalisés avant le début de l’étude.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Sur quoi se concentrent les PAS inclus dans les articles scientifiques ?

A

Principalement sur l’analyse se rapportant au CRP (analyse principale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelle est la longueur typique d’un PAS complet ?

A

Entre 50 et 300 pages

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les 6 sections recommandées d’un PAS ?

A

Section 1 : Détails administratifs (promoteur, chercheur principal, auteur du PAS, etc.)
Section 2 : Résumé de l’étude et de la question de recherche
Section 3 : Design et méthodes de l’étude (randomisation, insu, etc.)
Section 4 : Principes statistiques utilisés
Section 5 : Population de l’étude
Section 6 : Description des analyses statistiques prévues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Le PAS contient-il des résultats ?

A

Non, il décrit uniquement les méthodes analytiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

À quoi est comparé le PAS dans le texte ?

A

À un plan d’architecte pour les analyses statistiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce que la multiplicité en statistique ?

A

La multiplicité correspond au fait de réaliser un grand nombre de tests statistiques dans une même étude, ce qui augmente la probabilité de trouver des associations statistiquement significatives par hasard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quelle est l’analogie utilisée pour expliquer la multiplicité ?

A

Plus on achète de billets de loterie, plus on augmente nos chances de gagner.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Que signifie “gagner” dans une étude statistique selon le texte ?

A

Trouver des associations statistiquement significatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Pourquoi peut-on trouver des associations significatives même si un traitement est inefficace ?

A

Parce que tester de nombreux sous-groupes implique plusieurs milliers ou millions de tests statistiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Comment peut-on artificiellement trouver des sous-groupes où le traitement est efficace ?
En lançant un programme sur un logiciel où tous les sous-groupes possibles sont testés.
26
Qu’est-ce que l’hypothèse nulle (H0) ?
L’hypothèse selon laquelle il n’y a pas d’association entre l’exposition et l’issue étudiée.
27
Existe-t-il un risque de rejeter H0 même s’il n’y a pas d’association ?
Oui, pour chaque test statistique, il existe une probabilité de rejeter H0 même si elle est vraie.
28
Pourquoi faire des milliers de tests mène presque assurément à des résultats significatifs ?
Parce que chaque test comporte un risque d’erreur, et ces erreurs s’accumulent avec le nombre de tests
29
Quel exemple réel est utilisé pour démontrer le problème de multiplicité ?
L’association entre le signe du zodiaque sagittaire et un risque accru de fracture de l’humérus.
30
Pourquoi cette association avec les signes du zodiaque est-elle problématique ?
Parce qu’elle est statistiquement significative mais biologiquement non plausible
31
Comment appelle-t-on ce type d’association en jargon anglophone ?
Une association “spurious” (deux choses ont l'air liées, mais en vrai, elles ne le sont pas du tout)
32
Qu’est-ce qu’une association spurious ?
Une association statistiquement significative qui est due au hasard ou à la multiplicité des tests et qui ne reflète pas une relation réelle
33
Que se passe-t-il lorsqu’on contrôle pour la multiplicité des tests ?
Les associations significatives disparaissent
34
Comment contrôle-t-on formellement la multiplicité dans les ECR ?
Grâce au plan d’analyse statistique (PAS).
35
Pourquoi y a-t-il encore beaucoup de problèmes de multiplicité dans les études observationnelles ?
Parce que la multiplicité est souvent mal contrôlée ou ignorée
36
Quel est le rôle fondamental du PAS face à la multiplicité ?
Prévenir le tripotage des données et limiter les faux résultats statistiquement significatifs
37
Qu’est-ce qu’une variable dans un ECR ?
Une variable est une caractéristique socio-démographique ou clinique mesurée sur chaque participant/patient de l’étude
38
Pourquoi parle-t-on de “variable” ?
Parce que la caractéristique varie entre les patients et/ou varie durant le suivi
39
Combien de variables sont mesurées dans un essai clinique typique ?
Plusieurs centaines, voire des milliers de variables par patient.
40
Qu’est-ce que le CRP ?
Le CRP est la variable principale d’un essai clinique randomisé.
41
Comment le CRP peut-il être mesuré ?
Une seule fois s’il est constant (ex : homme/femme) ou à plusieurs reprises durant le suivi (ex : taux de cholestérol)
42
Combien de CRP une étude peut-elle avoir ?
Une étude peut avoir plusieurs CRP, mais typiquement ≤ 3
43
Qu’est-ce que le baseline ?
L’évaluation réalisée au recrutement avant la randomisation et le début des interventions
44
Au recrutement avant la randomisation et le début des interventions, les variables mesurées lors des essais cliniques (BASELINE) sont:
1. Variables socio-démographiques Ex : identifiant unique, genre, âge, éducation, ethnicité, région, site, etc. 2. Variables d'expositions Ex : intervention, usage tabac, caféine, etc. 3. Variables cliniques Ex : tension artérielle, IMC, grade du cancer, médicamentation concomitante, etc 4. Autres variables potentiellement associées au CRP Ex : biomarqueurs 5. Facteurs de confusion connus (variables généralement associées au CRP)
45
Quelles variables sont mesurées durant le suivi ?
- CRP - variable d’exposition (intervention ou traitement reçu) - critères secondaires - variables d’innocuité - variables de mécanisme - variables d’adhérence
46
Que sont les critères secondaires ?
Ce sont des variables sur lesquelles l'intervention pourrait avoir un impact
47
Variables d'innocuité
Ex : effets néfastes et indésirables des interventions.
48
Variables de mécanisme
Des variables qui permettent de comprendre comment l’intervention agit (ex : taille de la tumeur, pharmaco-dynamique, pharmaco-cinétique)
49
Qu’est-ce que l’adhérence dans un ECR ?
L’adhérence est la mesure de l’utilisation du traitement selon l’intention du protocole. *Mesure si le patient a utilisé le traitement selon l'intention du protocole - un traitement efficace ne fonctionne pas si le patient ne le prend pas*
50
Pourquoi l’adhérence est-elle importante ?
Parce qu’un patient ne peut bénéficier d’un traitement efficace que s’il l’utilise selon le protocole.
51
Comment peut-on mesurer l’adhérence ?
Par auto-rapport des patients, comptage de pilules ou autres méthodes.
52
À quoi sert une matrice variables × visites ?
À résumer les variables mesurées et la cédule des évaluations durant le suiv
53
Que représente la colonne de gauche dans la matrice ?
Les différentes évaluations.
54
Que montre l’exemple du glucose dans la matrice ?
ue certaines variables sont mesurées au recrutement, à 3 mois et à 12 mois
55
Qu’est-ce que le diagramme CONSORT ?
Une figure qui résume le suivi des participants dans un essai clinique randomisé.
56
Quand produit-on le diagramme CONSORT ?
C’est le premier diagramme présenté lors de la présentation des résultats d’un ECR.
57
Que signifie l’acronyme CONSORT ?
CONsolidated Standards Of Reporting Trials.
58
Quel est le rôle du CONSORT ?
Promouvoir la transparence dans la publication des résultats des études cliniques
59
Qui entérine les recommandations du CONSORT ?
Des organismes réglementaires (ex : Santé Canada, FDA) et de nombreuses revues médicales.
60
Quelles informations le diagramme CONSORT permet-il d’identifier rapidement ?
Le nombre de participants approchés, recrutés, perdus au suivi et inclus dans l’analyse principale du CRP.
61
Qu’appelle-t-on les pertes au suivi ?
Les participants qui quittent l’étude ou ne complètent pas le suivi
62
Pourquoi les pertes au suivi sont-elles importantes ?
Parce qu’elles sont un indicateur de la qualité d’une étude.
63
64
Quel est le lien entre pertes au suivi et validité interne ?
Plus il y a de pertes au suivi, plus la validité interne de l’étude est affaiblie.
65
Que montre le diagramme CONSORT de l’ECR VOICE ?
Que la majorité des femmes randomisées ont été incluses dans l’analyse principale avec moins de 10 % de pertes au suivi
66
Pourquoi l’ECR VOICE est-il considéré comme une étude de qualité ?
Parce que le nombre de pertes au suivi est relativement faible
67
Quel est le principal problème observé dans le diagramme CONSORT de l’ECR EPOC ?
Près de 25 % des participants sont perdus au suivi et exclus de l’analyse principale.
68
Quel est le risque associé à une perte au suivi de 25 % ?
Un potentiel de biais très grand
69
: Quelles analyses principales sont présentes dans l’ECR EPOC ?
: ITT (intention-to-treat) et PPA (per protocol analysis).
70
Pourquoi l’analyse PPA pose problème dans l’ECR EPOC ?
Parce que plus de 36 % des participants sont exclus, ce qui affaiblit la validité de l’étude
71
Quel est le rôle global du diagramme CONSORT ?
Évaluer rapidement la transparence, la qualité et le risque de biais d’un essai clinique
72
Quels sont les deux principes d’analyse des résultats d’un ECR ?
L’analyse sous l’intention de traiter (ITT) et l’analyse sous l’intention du protocole (ITP).
73
Pourquoi l’analyse ITT a-t-elle été exigée par les organismes réglementaires ?
Pour prévenir les abus liés à l’exclusion sélective de patients et protéger l’intégrité des résultats.
74
Qu’est-ce que l’analyse sous l’intention de traiter (ITT) ?
Une analyse qui inclut tous les patients recrutés et randomisés, sans aucune exclusion.
75
Quelle est la règle fondamentale de l’ITT ?
Un patient recruté et randomisé est de facto inclus dans l’analyse principale
76
Selon quel principe le CRP est-il analysé en ITT ?
: Selon la randomisation prévue à l’origine.
77
Quel est l’avantage majeur de l’ITT ?
Elle préserve l’intégrité de la randomisation et protège contre les biais de confusion
78
Pourquoi l’ITT n’accepte-t-elle pas de valeurs manquantes sur le CRP ?
Parce que le CRP doit être mesuré chez tous les patients randomisés
79
Pourquoi dit-on que l’ITT dilue l’amplitude de la réponse ?
Parce que les patients non adhérents sont inclus, ce qui sous-estime le bénéfice et surestime l’innocuité
80
Qu’est-ce qu’une analyse mITT ?
Une analyse modified ITT permettant quelques exclusions très spécifiques
81
Qu’est-ce que l’analyse sous l’intention du protocole (ITP) ?
Une analyse qui inclut seulement les patients ayant respecté le protocole tel que prescrit.
82
Quand les exclusions en ITP doivent-elles être définies ?
A priori dans le PAS, avant le début de l’étude.
83
Quel est l’objectif de l’analyse ITP ?
Inclure le patient « parfait », le plus susceptible de répondre au traitement.
84
Pourquoi les résultats sont-ils souvent plus favorables en ITP qu’en ITT ?
Parce que seuls les patients adhérents et conformes au protocole sont analysés.
85
Quel est le principal risque de l’ITP ?
L’exposition au biais de confusion.
86
Pourquoi l’ITP affaiblit-elle la comparabilité des groupes ?
Parce que les exclusions éloignent l’analyse de la randomisation initiale.
87
Quels sont les résultats de l’analyse ITT dans l’ECR SPORT ?
Des différences de moyennes proches de zéro pour les trois CRPs, sans bénéfice apparent.
88
Rappel: ITT
L’analyse sous l’intention de traiter inclut tous les patients recrutés et randomisés, sans aucune exclusion, afin de préserver l’intégrité de la randomisation et de protéger contre les biais de confusion. *tout le monde, vraie vie, peu de biais*
89
Rappel: ITP
L’analyse sous l’intention du protocole inclut seulement les patients ayant respecté le protocole tel que prescrit, ce qui expose l’étude à des biais de confusion en raison de la perte de la randomisation *patients parfaits, effet plus fort, biais possible*
90
Pourquoi dit-on que l’analyse selon l’ITT est difficile à réaliser en pratique ?
Parce qu’elle ne permet aucune exclusion de patients randomisés, y compris en présence de valeurs manquantes
91
L’analyse ITT permet-elle l’exclusion de patients randomisés ?
Non, aucune exclusion n’est permise pour aucune raison
92
Les valeurs manquantes sont-elles permises en ITT ?
Non, une analyse ITT ne permet pas de valeurs manquantes sur le CRP
93
94
Donne un exemple de situation créant une valeur manquante du CRP
Un patient randomisé qui est absent lors de la visite clinique pour mesurer son CRP
95
Pourquoi une analyse avec seulement les données disponibles n’est-elle pas une ITT ?
Parce qu’elle exclut les patients randomisés ayant des valeurs manquantes
96
Dans un ECR avec 100 participants randomisés et 10 CRP manquants, combien de participants doit inclure une analyse ITT ?
100 participants.
97
Quel est le dilemme central de l’ITT en présence de données manquantes ?
Inclure tous les participants randomisés même lorsque le CRP n’est pas mesuré chez certains.
98
Existe-t-il des méthodes pour gérer les données manquantes en ITT ?
Oui, il existe certaines méthodes statistiques, mais aucune n’est entièrement satisfaisante.
99
Quelle est la meilleure stratégie face aux données manquantes ?
Mettre tous les efforts à minimiser les données manquantes, surtout celles concernant le CRP.
100
Pourquoi l’ITT est-elle préférée à l’ITP malgré sa difficulté ?
Parce qu’elle est beaucoup moins susceptible aux biais.
101
Comment se compare la validité interne de l’ITT à celle de l’ITP ?
La validité interne de l’ITT est supérieure à celle de l’ITP.
102
En pratique, laquelle est la plus simple à exécuter : ITT ou ITP ?
L’analyse selon l’ITP est généralement plus simple à exécuter
103
À quoi sert l’analyse descriptive dans un ECR ?
À donner un premier coup d’œil sur les résultats et à décrire la population recrutée.
104
Quels outils sont utilisés dans l’analyse descriptive ?
Des tableaux, des diagrammes et des figures.
105
: Que permet de détecter l’analyse descriptive dans les données ?
Des données manquantes, des données aberrantes et des problèmes de comparabilité entre les groupes.
106
L’analyse descriptive teste-t-elle des hypothèses ?
Non, elle fournit seulement un résumé des données.
107
Pourquoi présente-t-on les groupes côte à côte ?
Pour faciliter la comparaison entre les groupes.
108
Qu’est-ce que la Table 1 dans un article scientifique ?
La première table qui présente les statistiques descriptives des variables mesurées à la visite de recrutement.
109
Quelles variables sont typiquement incluses dans la Table 1 ?
Quelques variables socio-démographiques, des variables cliniques et des variables associées au CRP.
110
Pourquoi inclut-on des variables associées au CRP dans la Table 1 ?
Pour évaluer le risque de biais de confusion
111
Pourquoi n’inclut-on pas toutes les variables dans la Table 1 ?
Parce qu’il y a trop de variables et que l’espace est limité dans les articles
112
Que fait-on des variables non incluses dans la Table 1 ?
lles sont analysées descriptivement mais exclues de la Table 1.
113
Pourquoi les pratiques sexuelles et autres infections sont-elles incluses dans la Table 1 de VOICE ?
Parce qu’elles sont associées au risque d’infection au VIH selon la littérature
114
Que sont les données brutes dans un ECR ?
Les données vérifiées et validées à la fin de l’étude, provenant directement des mesures.
115
Qu’est-ce qu’une variable dérivée ?
Une variable calculée à partir des données brutes.
116
Donne un exemple de variable dérivée.
L’indice de masse corporelle (IMC) = poids (kg) ÷ taille² (m²).
117
Pourquoi les analyses statistiques utilisent-elles surtout des variables dérivées ?
Parce qu’elles résument et standardisent l’information issue des données brutes
118
À quoi servent les analyses descriptives ?
À résumer l’information pour faciliter l’interprétation et faire émerger des tendances ou associations
119
Quel est le désavantage principal d’un résumé des données ?
Une perte d’information.
120
Quelles sont les deux grandes façons de résumer une variable ?
- Mesures de tendance centrale (ex : moyenne) et de dispersion (ex : étendue, écart-type, etc) Typiquement, ces mesures sont tabulées dans des tables similaires à la Table 1 de l'ECR VOICE - Distribution présentée à l'aide d'une figure (ex : histogramme).
121
Qu’est-ce qu’un histogramme ?
Une figure qui montre la distribution des valeurs d’une variable.
122
Qu’est-ce qu’un diagramme en boîte ?
Une figure montrant la médiane, les quartiles, l’étendue et les valeurs aberrantes
123
Pourquoi les figures sont-elles complémentaires aux tables ?
Parce qu’elles montrent visuellement la distribution avec moins de perte d’information
124
Pourquoi les distributions sont-elles rarement incluses dans les articles ?
À cause de l’espace restreint
125
Qu’est-ce qu’une dimension dans une table ou une figure ?
Une variable
126
Pourquoi ajouter des dimensions à une table ou une figure ?
Pour déterminer des différences, tendances ou associations.
127
Quel est l’objectif principal d’une table ou d’une figure dans un article ?
Donner une information qui saute aux yeux pour appuyer le texte et une affirmation.
128
Autre nom pour diagramme en boîte
Diagramme de quartiles (L'IQR et l'écart-type sont des mesures de dispersion)
129
Dans un ECR, pourquoi est il nécessaire d'inclure au moins une autre dimension
l’objectif est de comparer des groupes d’intervention, et cette dimension (expérimental vs placebo) est indispensable pour évaluer la comparabilité des groupes et l’effet du traitement.
130
Pourquoi dit-on que la distribution et les statistiques descriptives sont complémentaires ?
Parce que l’histogramme est plus qualitatif et informatif sur la distribution, tandis que les statistiques descriptives sont quantitatives mais peuvent masquer des informations importantes.
131
Quel est l’avantage principal d’un histogramme par rapport aux statistiques descriptives ?
L’histogramme permet de visualiser la distribution complète des données et de détecter des formes, asymétries ou sous-groupes invisibles dans les statistiques descriptives
132
Quelle est la limite des statistiques descriptives seules pour décrire un biomarqueur ?
Elles résument les données par des nombres, mais peuvent masquer des informations importantes sur la distribution réelle des valeurs.
133
Pourquoi est-il fondamental de visualiser les données dans un ECR ?
Parce que les statistiques descriptives seules peuvent masquer des informations importantes sur la distribution des données.
134
Quelle est la principale erreur commise par de nombreux chercheurs ?
Se limiter aux statistiques descriptives et à l’inférence statistique sans visualiser les données
135
Pourquoi les articles scientifiques ne présentent-ils pas toujours les distributions ?
À cause du manque d’espace dans les articles scientifiques
136
Quelles analyses descriptives faut-il regarder ensemble pour une variable continue ?
L’histogramme, le diagramme en boîtes, les statistiques descriptives et le nombre de valeurs manquantes
137
Pourquoi est-il important d’adapter la visualisation à la nature de la variable ?
Parce que certaines variables, comme le temps d’incidence, nécessitent des outils spécifiques comme les courbes de Kaplan–Meier
138
Qu’est-ce qu’une valeur manquante ?
Une information inconnue pour un participant parce que la valeur n’a pas été mesurée ou que le participant était absent
139
Pourquoi les valeurs manquantes sont-elles particulièrement problématiques pour le CRP et l’exposition ?
Parce qu’elles augmentent le risque d’introduire des biais dans l’étude.
140
Que représente le nombre de valeurs manquantes dans un ECR ?
Un indicateur important de la qualité de l’exécution de l’étude
141
Pourquoi faut-il indiquer le nombre de valeurs manquantes dans la Table 1 ?
Parce que le nombre de valeurs manquantes est une information importante sur la qualité des données et le risque de biais, et doit être communiqué via les statistiques descriptives
142
Comment doit-on présenter les valeurs manquantes dans la Table 1 ?
En ajoutant une ligne indiquant le nombre de participants avec valeurs manquantes (ex : N manquant = 10), tout en précisant dans l’entête le nombre total de participants (N = 100).
143
statistiques descriptives
outils qui résument et décrivent les données (par des nombres et des figures) afin de comprendre les caractéristiques d’une population ou d’un échantillon, sans tester d’hypothèses
144
Qu'est-ce qui détermine les statistiques descriptibes qui pourront être utilisées
La nature de la variable
145
Quand n’utilise-t-on pas les proportions pour une variable ordinale ?
Lorsqu’elle possède beaucoup de valeurs possibles.
146
Quand n’utilise-t-on pas les centiles, la médiane et l’histogramme ?
Lorsque la variable ordinale a peu de valeurs possibles.
147
Quelles sont les mesures de tendance centrale ?
La moyenne et la médiane.
148
149
: Quelles sont les mesures de dispersion ?
L’écart-type et l’IQR.
150
Que représentent les centiles ?
Des valeurs qui divisent les observations en 100 parts égales
151
À quoi correspond le 92e centile ?
À une valeur supérieure ou égale à celle de 92 % des observations
152
À quels centiles correspondent Q1, Q2 et Q3 ?
Q1 = 25e, Q2 (médiane) = 50e, Q3 = 75e centile
153
Qu’est-ce que l’IQR ?
L’intervalle entre Q1 et Q3 (IQR = Q3 − Q1), contenant 50 % des observations
154
Pourquoi la médiane est-elle plus robuste que la moyenne ?
Parce qu’elle est moins sensible aux valeurs extrêmes et aux distributions asymétriques
155
Comment visualise-t-on la distribution observée d’une variable ?
À l’aide d’un histogramme
156
Une distribution observée est-elle souvent symétrique ?
Non, elle est rarement purement symétrique
157
Qu’est-ce que le mode ?
La valeur la plus fréquente dans une distribution
158
Qu’est-ce qu’une distribution multimodale ?
Une distribution qui possède plusieurs modes (plusieurs bosses)
159
À quoi sert principalement le mode en pratique ?
À décrire qualitativement la forme d’une distribution observée
160
Moyenne arithmétique
- la somme de toutes les valeurs non manquantes - divisée par le nombre de participants avec des valeurs non manquantes *les valeurs manquantes ne comptent pas et la moyenne est sensible aux valeurs extrêmes*
161
Médiane
- valeur du milieu - sépare les données en deux parts égales
162
Comment calculer la médiane avec un nombre impaire
Valeurs : 110, 125, 135, 140, 165 👉 Médiane = 135
163
Comment calculer la médiane avec un chiffre pair
Valeurs : 110, 125, 131, 135, 140, 165 👉 Pas de valeur centrale 👉 Médiane = moyenne des deux valeurs centrales 👉 (131 + 135) / 2 = 133 📌 Les centiles suivent la même logique, mais en 100 parts égales.
164
Moyenne géométrique
👉 Lorsque la distribution est très asymétrique : - la moyenne arithmétique est peu représentative - on peut utiliser la moyenne géométrique 📌 (mentionnée, mais non couverte dans le cours)
165
Comment savoir si une proportion est une moyenne
👉 Une proportion est une moyenne si : la variable est dichotomique, codée : 0 = échec 1 = succès 📌 Exemple : 20 % d’échec = proportion = moyenne des 0 et 1
166
Que mesure l'écart-type
- la dispersion - la concentration des valeurs autour de la moyenne ➡️ Plus l’écart-type est grand : plus les valeurs sont dispersées
167
Formule de l’écart-type
👉 On calcule : - l’écart de chaque valeur à la moyenne - on élève au carré (pour éviter que la somme = 0) - on fait la moyenne de ces écarts - on prend la racine carrée 📌 Le carré de l’écart-type = la variance, même unité que la variable
168
À quoi sert l'écart-type (ou la variance) d'un CRP
Il est central pour déterminer l'erreur aléatoire et la précision de la réponse à la question de recherche clinique.
169
Pourquoi diviser par N−1 et non N ?
- Diviser par N : sous-estime l’écart-type réel de la population - Diviser par N−1 : corrige cette sous-estimation surtout important quand N est petit - Quand N est grand : la différence entre N et N−1 est minime
170
Écart-type
- dispersion des valeurs individuelles - décrit la population observée
171
Erreur-type (erreur standard)
- dispersion d’une statistique (ex : la moyenne) - décrit la précision de l’estimation - ≠ écart-type
172
Écart-type pour variables dichotomiques
Si la variable est dichotomique : - l’écart-type dépend de la proportion p - Formule : sqrt(𝑝(1−𝑝)) ​
173
Exemple de calcul pour l'écart-type pour variables dichotomiques
- Exemple : p = 0.2 (20 % d’échec) √(0.2 × 0.8) = √0.16 = 0.40 - Propriétés : écart-type maximal quand p = 0.5 écart-type = 0 quand p = 0 ou p = 1 aucune variation entre participants
174
variable avec un temps d’incidence
le temps qu’on attend avant que quelque chose arrive (le temps jusqu’à la survenue d’un événement ex. tomber malade)
175
Particularités des variables de temps d'incidence
- Difficiles à décrire à cause de la censure (administrative) - autant pour les mesures de tendance centrale que pour les mesures de dispersion (y compris les diagrammes en boîte et les histogrammes)
176
Qu'utilise-t-on pour décrire ce type de variable
- Centiles (Q1, médiane) et courbes de Kaplan-Meier - Plutôt que moyenne, écart-type, histogrammes
177
But du tableau de contingence
- Sert à décrire et comparer des variables dichotomiques, catégoriques, ordinales avec peu de valeurs - Permet de voir comment une variable (ex. CRP) se répartit selon les groupes (ex. traitement vs placebo)
178
Quelles proportions sont pertinentes dans un tableau de contingence ?
Les proportions selon la colonne (et non la rangée).
179
Les proportions selon la colonne (et non la rangée).
La marginale donne la distribution du CRP indépendante des groupes et la distribution des groupes indépendante du CRP.
180
Quelle est la proportion marginale associée à la catégorie 1 ?
55 % (110/200).
181
Que se passe-t-il si les deux traitements sont équivalents ?
La proportion observée dans une cellule sera identique aux produits des marginales.
182
Quelle est la relation utilisée pour l’indépendance ?
P(A et B) = P(A)P(B) si A et B sont deux événements indépendants.
183
Quelle est la proportion de patients du groupe expérimental dans la catégorie 1
70/200 = 35 %.
184
Quelle proportion attend-on sous l’hypothèse d’indépendance ?
55 % × 50 % = 27.5 %.
185
Que montre la différence entre 35 % et 27.5 % ?
On observe que le CRP ne semble pas être indépendant des groupes.
186
Pourquoi faut-il être prudent dans l’interprétation ?
La différence pourrait être causée par l’erreur aléatoire et/ou la présence de biais.
187
Quand y a-t-il indépendance entre le CRP et les groupes ?
S’il n’y a pas de différences entre les traitements.
188
Quelle mesure d’association est parfois utilisée par certains chercheurs ?
Le rapport de cote (RC).
189
Comment calcule-t-on le rapport de cote ?
Par le produit croisé des effectifs des quatre cellules : (70 × 60) / (30 × 40) = 3.5
190
Comment est définie la cote ?
La cote est définie p / (1 − p).
191
Comment interprète-t-on RC = 3.5 ?
La cote d’un patient du groupe expérimental d’être dans la catégorie 1 est 3.5 fois plus élevée que celle d’un patient du groupe placebo.
192
Que vaut le RC lorsque la différence de proportion est nulle ?
RC = 1.
193
Pourquoi le RC est-il moins informatif dans un ECR ?
Dans un contexte de tableau de contingence et d’ECR, les RCs sont moins informatifs que la différence de proportions
194
Pourquoi une proportion est-elle une mesure de tendance centrale ?
Parce que la moyenne de valeurs binaires 0 et 1 donne une proportion
195
Comment code-t-on une variable dichotomique pour obtenir une proportion ?
Succès = 1 et échec = 0 (ou l’inverse selon la proportion d’intérêt)
196
Comment obtient-on la proportion complémentaire ?
Proportion d’échec = 1 − proportion de succès.
197
Qu’est-ce qu’une probabilité conditionnelle ?
Qu’est-ce qu’une probabilité conditionnelle ?
198
Que représentent les événements A et B dans cet exemple ?
A : succès au traitement ; B : patient dans le groupe avec le traitement expérimental.
199
Que représente P(A et B) ?
La proportion de patients ayant eu un succès ET étant dans le groupe traitement expérimental
200
Que sont P(A) et P(B) ?
Des probabilités marginales représentant respectivement la probabilité de succès et la probabilité d’être dans le groupe traitement, indépendamment l’une de l’autre.
201
quand dit-on que deux événements sont indépendants ?
Lorsque P(A et B) = P(A) × P(B).
202
Quand y a-t-il une association entre deux événements ?
Lorsque P(A et B) est différent de P(A) × P(B)
203
Que vaut P(A|B) s’il y a indépendance entre A et B ?
P(A|B) = P(A).
204
Que signifie P(A|B) ≠ P(A) ?
Le traitement a un impact sur la probabilité de succès.
205
Pourquoi les notions d’indépendance, d’association et de différence sont-elles équivalentes ?
Parce qu’une différence entre les groupes implique une association et une dépendance, et l’absence de différence implique l’indépendance.
206
Qu’est-ce qu’un temps d’incidence ?
Le temps écoulé entre le début du suivi et la survenue d’un événement.
207
Pourquoi parle-t-on d’analyse de survie ?
Parce que ces méthodes ont été développées pour étudier la mortalité, mais elles s’appliquent aujourd’hui à tout type d’événement
208
La survie concerne-t-elle uniquement la mort ?
Non, elle concerne tout temps avant un événement (infection, rechute, rémission, etc.).
209
Non, elle concerne tout temps avant un événement (infection, rechute, rémission, etc.).
Parce qu’elles sont partiellement observées à cause de la censure
210
Qu’est-ce que la censure ?
Le fait de ne pas connaître le temps exact de l’événement pour certains participants.
211
À quoi sert une courbe de Kaplan-Meier ?
À décrire la proportion de participants n’ayant pas encore eu l’événement au fil du temps
212
Que montre une chute dans une courbe de Kaplan-Meier ?
La survenue d’un événement chez un ou plusieurs participants.
213
C’est quoi le taux d’incidence (vraie définition)
nombre de nouveaux événements divisé par le temps total à risque (personne-temps)
214
Les indidences cumulées ont elle des unité
Non, car ce sont des proportions et elles sont aussi bcp moins informatives *plus on allonge le suivi des patients plus les incidences cumulées tendent vers 100% dans les 2 groupes*
215
Quelle est la différence entre un taux d’incidence et une incidence cumulée ?
L’incidence cumulée est une proportion qui mesure la fraction de participants ayant eu l’événement, sans tenir compte du temps, tandis que le taux d’incidence mesure la vitesse d’apparition des événements en tenant compte du temps de suivi.
216
Quelles sont les unités d’un taux d’incidence et pourquoi est-ce important ?
Les unités d’un taux d’incidence sont des cas incidents par unité de personne-temps (ex. cas par personne-semaine), ce qui indique que ce n’est pas une proportion mais une mesure de vitesse.
217
Pourquoi est-il incorrect de dire que 2.51 cas par 100 personnes-semaines correspond à 2.51 % ?
Parce qu’un taux d’incidence n’est pas une proportion, même s’il est parfois exprimé avec le symbole %, et qu’il représente un nombre de cas par unité de temps et non une fraction de participants
218
À quoi doit-on porter une attention particulière dans l’analyse des courbes de survie ?
À quoi doit-on porter une attention particulière dans l’analyse des courbes de survie ?
219
Que peut indiquer le croisement des courbes concernant un traitement ?
Que peut indiquer le croisement des courbes concernant un traitement ?
220
Pourquoi un traitement chirurgical peut-il entraîner un croisement des courbes ?
Un ECR sur la chirurgie comme traitement peut démontrer un grand nombre de décès au début du traitement mais une longue survie par la suite
221
Que décrit la situation A ?
Cette situation décrit un traitement qui, à court terme, est inférieur à l’autre traitement, mais dont la survie à long terme est supérieure, avec des temps médians de survie similaires
222
Que décrit la situation B ?
: Cette situation décrit un traitement qui, à court terme, est nettement inférieur à l’autre traitement, mais dont la survie à long terme est très supérieure, avec un temps médian de survie supérieur.
223
Que décrit la situation C ?
Cette situation décrit un traitement qui, à court terme, est nettement inférieur à l’autre traitement, mais dont la survie à long terme est similaire, avec un temps médian de survie du traitement bleu supérieur.
224
Pourquoi le croisement des courbes est-il important en analyse statistique ?
Le croisement des courbes a de l’importance car certaines analyses ne sont pas appropriées lorsque les courbes se croisent.
225
Qu’est-ce qu’un critère de résultat dans un essai clinique ?
Qu’est-ce qu’un critère de résultat dans un essai clinique ?
226
Donne des exemples de critères de résultat.
Taux de cholestérol, tension artérielle, statut VIH (positif/négatif), indice de masse corporelle.
227
Qu’est-ce que le critère de résultat principal (CRP) ?
Le CRP est le critère de résultat utilisé dans la construction de l’analyse de la réponse à la question de recherche clinique.
228
Quels sont les autres noms du CRP ?
Critère de jugement principal ou critère d’évaluation principal.
229
À quel élément de la méthode PICO correspond le CRP ?
Le CRP correspond au « O » (Outcome) de la méthode PICO.
230
Le CRP est-il la réponse à la question de recherche ?
: Non, le CRP n’est pas une réponse mais une mesure effectuée sur un participant/patient.
231
À quoi sert le choix du CRP ?
Le choix du CRP, s’il est approprié, permet de répondre à la question de recherche de l’essai clinique
232
Comment l’IMC peut-il être utilisé comme CRP ?
Il peut être mesuré une fois après le traitement, ou plusieurs fois durant le suivi (recrutement, 1, 2 et 3 mois).
233
Il peut être mesuré une fois après le traitement, ou plusieurs fois durant le suivi (recrutement, 1, 2 et 3 mois).
Parce que la fréquence de mesure du CRP a un impact sur le type d’analyse statistique à privilégier.
234
De quoi dépend le type de CRP ?
Le type de CRP dépend de la nature de la variable clinique mesurée.
235
Qu’est-ce qu’un CRP dichotomique ?
Un CRP dichotomique prend deux valeurs possibles, par exemple succès ou échec au traitement.
236
Qu’est-ce qu’un CRP continu ?
Un CRP continu est une variable numérique pouvant prendre une infinité de valeurs, comme la tension artérielle
237
Qu’est-ce qu’un CRP d’incidence ?
Un CRP d’incidence mesure à la fois la survenue d’un événement et le moment de sa survenue.
238
Pourquoi inclure le temps dans un CRP d’incidence ?
Parce que le bénéfice d’une intervention peut être de retarder l’événement d’intérêt.
239
Qu’est-ce qu’une censure administrative ?
L’arrêt du suivi des participants à la fin de l’étude, alors que l’événement n’est pas survenu.
240
Qu’est-ce qu’une variable ordinale ?
Une variable qualitative où l’ordre ou le rang confère une information importante.
241
Pourquoi une variable de dénombrement n’est-elle pas une variable ordinale ?
Parce qu’elle représente un compte numérique et ne possède pas d’ordre ou de classement inhérent
242
Qu’est-ce qu’une variable catégorielle ?
Une variable qualitative dont l’ordre et la valeur ne confèrent aucune information
243
Pourquoi le type de CRP influence-t-il l’analyse statistique ?
Parce que les mesures résumées et les analyses varient selon la nature du CRP
244
Quelle est la terminologie anglaise pour CRP ?
Outcome ou endpoint (pour critère de résultat), et primary outcome ou primary endpoint pour le CRP (critère de résultat principal)