14.08.2013 Views

Place des Statistiques dans la Recherche Médicale

Place des Statistiques dans la Recherche Médicale

Place des Statistiques dans la Recherche Médicale

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong><br />

<strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> <strong>Médicale</strong><br />

Master <strong>Recherche</strong> Biologie et Santé<br />

P. Devos – DRCI CHRU de Lille – EA2694<br />

patrick.devos@univ-lille2.fr<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Définition <strong>des</strong> statistiques<br />

Notion d’Échantillonnage<br />

Mise en p<strong>la</strong>ce d’une étude<br />

Présentation <strong>des</strong> résultats<br />

PLAN<br />

Analyse <strong>des</strong> bases de données<br />

Métho<strong>des</strong> multivariées<br />

Exemples<br />

Petits échantillons<br />

Grands échantillons<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


INTRODUCTION<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


La Statistique et les Biostatistiques<br />

La STATISTIQUE : discipline traitant du recueil (p<strong>la</strong>ns d’expérience,<br />

sondages, …), du traitement et de l’interprétation de données<br />

caractérisées par une grande variabilité.<br />

Partie <strong>des</strong> mathématiques appliquées, utilisant <strong>la</strong> théorie <strong>des</strong> probabilités.<br />

Beaucoup de domaines d’applications<br />

• Sondages : enquêtes d’opinion<br />

• Industrie : contrôle de qualité<br />

• Marketing : scoring, profil de consommateurs<br />

• Médecine : épidémiologie, recherche clinique<br />

• ……..<br />

<strong>Statistiques</strong> appliquées à <strong>la</strong> Médecine = BIOSTATISTIQUES<br />

• Données spécifiques : variabilité inter et intra, données interprétées, …<br />

• Métho<strong>des</strong> spécifiques : survie, courbes ROC, p<strong>la</strong>ns d’expérience…<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Révolution<br />

Informatique<br />

Nouveaux<br />

enjeux<br />

Problématique actuelle<br />

Multiplication <strong>des</strong> sources de données ( SIH, Internet, ….)<br />

Accès bibliographiques : Pubmed, Sciencedirect, …<br />

Explosion <strong>des</strong> moyens de calculs (PC 4GHz)<br />

De plus en plus de logiciels de plus en plus évolués (SPSS,<br />

STATVIEW, S+, STATISTICA, R ….)<br />

Nécessité de publier<br />

Exigence de Rigueur de plus en plus élevée<br />

Besoin de métho<strong>des</strong> exploratoires efficaces (gran<strong>des</strong> bases de<br />

données)<br />

Nécessité d’une méthodologie rigoureuse<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Méthodologie statistique<br />

Employer bien sûr <strong>la</strong> "bonne" procédure statistique pendant l’analyse !!!<br />

MAIS ce<strong>la</strong> ne suffit pas …<br />

Choisir le bon type d’étude<br />

Choisir le bon p<strong>la</strong>n d’expérience<br />

Choisir les bons critères de jugement<br />

Qualité <strong>des</strong> données recueillies<br />

Analyse statistique rigoureuse (tests, modèles, …)<br />

Bonne interprétation <strong>des</strong> résultats<br />

Avant l ’étude !!!<br />

Fin d’étude<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Projet :<br />

Objectifs,<br />

Bibliographie<br />

P<strong>la</strong>n d’analyse<br />

…<br />

Schéma général d’une étude<br />

Échantillon<br />

Recueil <strong>des</strong><br />

données<br />

Interprétation<br />

Rapport<br />

Article<br />

Analyse<br />

Descriptive<br />

Analyse<br />

Inférentielle<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


L’Échantillonnage<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


On désire étudier une popu<strong>la</strong>tion P<br />

Principe :<br />

L’inférence statistique<br />

• On tire un échantillon E de taille n issu de P<br />

• On analyse les caractéristiques de E<br />

• On généralise à P<br />

Attention !!<br />

• E doit être un échantillon représentatif de P<br />

• E doit être de taille suffisamment élevée pour pouvoir extrapoler les résultats<br />

Définir très précisément <strong>la</strong> popu<strong>la</strong>tion que l’on désire étudier !!<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Les fluctuations d’échantillonnage<br />

Quand on tire aléatoirement un échantillon, on a <strong>des</strong> fluctuations.<br />

Exemple : on s’intéresse aux 10 premiers étudiants entrant <strong>dans</strong> l’amphi. On<br />

comptabilise 7 femmes et 3 hommes. Peut-on en déduire que 70% <strong>des</strong> étudiants<br />

qui assisteront au cours sont <strong>des</strong> femmes ? NON !!!<br />

On considère que <strong>dans</strong> <strong>la</strong> popu<strong>la</strong>tion<br />

totale, les proportions d’hommes et de<br />

femmes sont les mêmes P(H)=P(F)=1/2<br />

Soit X le nombre de femmes parmi les<br />

10 étudiants. On peut montrer que X<br />

suit une loi binomiale de taille 10 et de<br />

paramètre 0.5 et calculer <strong>la</strong> probabilité<br />

d’observer 0,1,2,…,10 femmes.<br />

0.3<br />

0.25<br />

0.2<br />

0.15<br />

0.1<br />

0.05<br />

0<br />

P(X=k)<br />

0 1 2 3 4 5 6 7 8 9 10<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Les prendre en compte<br />

Comment prendre en compte les fluctuations d’échantillonnage ?<br />

1) En vérifiant que l’échantillon est représentatif (tests d’adéquation par exemple)<br />

2) En donnant <strong>la</strong> marge d’erreur que l’on commet en raisonnant sur un échantillon<br />

(Intervalles de confiance)<br />

3) En maîtrisant les risques d’erreurs (puissance <strong>dans</strong> le cas de comparaisons)<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Mise en <strong>P<strong>la</strong>ce</strong> d’une Étude<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


+<br />

-<br />

+<br />

-<br />

Les différents types d’étu<strong>des</strong><br />

Étude rétrospective : Étude <strong>la</strong> plus fréquente<br />

• Pas d’inclusion de patients<br />

• Collecte de données à partir <strong>des</strong> dossiers<br />

• Rapide et simple à mettre en œuvre<br />

• Comparabilité <strong>des</strong> groupes<br />

• Qualité <strong>des</strong> données recueillies<br />

Étude prospective pilote<br />

• En général, peu de patients<br />

• Qualité <strong>des</strong> données<br />

• Sert à déterminer <strong>des</strong> caractéristiques pour une étude comparative contrôlée.<br />

• Pas de comparaisons<br />

• Résultats limités<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


+<br />

-<br />

+<br />

-<br />

Les différents types d’étu<strong>des</strong><br />

Étude prospective contrôlée (essai contrôlé) : Cas le plus complexe<br />

• Résultats fiables (Puissance calculée au début de l’étude)<br />

• Critères d’inclusion + Randomisation / Comparabilité <strong>des</strong> groupes<br />

• Critères de jugement définis au début<br />

• Étude longue ( en général, 3 ans minimum).<br />

• Peut être coûteuse<br />

Étude épidémiologique, Cohorte, …<br />

• Résultats fiables (Puissance statistique)<br />

• Grand nombre de sujets<br />

• Suivi au cours du temps (10,15 ans !!)<br />

• Multicentrique<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Mise en <strong>P<strong>la</strong>ce</strong> d’une Étude<br />

Dans tous les cas,<br />

rédaction d’un protocole !!<br />

Protocole<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Conseils pour <strong>la</strong> Rédaction du Protocole<br />

L'introduction : ce paragraphe a pour objectifs :<br />

• de décrire l'état actuel <strong>des</strong> connaissances sur le sujet<br />

• d'expliquer le problème scientifique<br />

Les objectifs de l'étude : il s'agit de décrire en quelques phrases l'objectif principal<br />

de l'étude et les objectifs secondaires. Ces objectifs doivent être précis et déduits du<br />

paragraphe précédent.<br />

La sélection <strong>des</strong> patients : ce paragraphe a pour objectifs :<br />

• de décrire <strong>la</strong> méthode de recrutement,<br />

• de définir <strong>des</strong> groupes éventuels,<br />

• de préciser les critères d'inclusion et de non-inclusion.<br />

Les critères de jugement : définir précisément le critère de jugement principal et<br />

éventuellement les critères secondaires : pourcentage de guérison, mesure d'un<br />

paramètre biologique, score, durée de vie,… Ce critère conditionne le type d'analyse<br />

statistique.<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Conseils pour <strong>la</strong> Rédaction du Protocole<br />

P<strong>la</strong>n d'expérience :<br />

• expliciter le p<strong>la</strong>n d'expérience : groupes parallèles, p<strong>la</strong>n 2x2, cross-over, …<br />

• nombre de sujets recrutés : s'il est basé sur un calcul de nombre de sujets<br />

nécessaires, indiquer les éléments du calcul, sinon justifier le nombre choisi<br />

(données bibliographiques, étude exploratoire...).<br />

• durée prévue de l'étude.<br />

Information recueillie : <strong>des</strong>cription <strong>des</strong> paramètres enregistrés, mode de recueil.<br />

Analyses statistiques : décrire brièvement le type d'analyses statistiques<br />

envisagées.<br />

Documents annexes : lettre d'information, consentement éc<strong>la</strong>iré, références<br />

bibliographiques, cahier d'observation, CV <strong>des</strong> investigateurs.<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Quelques aspects statistiques<br />

Détermination du p<strong>la</strong>n d’expérience<br />

• groupes parallèles, p<strong>la</strong>ns factoriels<br />

• appariement, stratification<br />

• cross-over, carré <strong>la</strong>tin<br />

• P<strong>la</strong>ns séquentiels<br />

Discussion sur les variables analysées :<br />

• critères de jugement (principal et secondaires), <strong>dans</strong> le cas d’un essai clinique<br />

• Attention, <strong>la</strong> multiplication <strong>des</strong> hypothèses et <strong>des</strong> tests rend <strong>la</strong> conclusion de l’étude<br />

très difficile : l’étude doit être bâti autour de quelques questions précises<br />

Type d’analyses statistiques prévues<br />

Détermination de <strong>la</strong> taille <strong>des</strong> échantillons<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Efficacité ou Équivalence ?<br />

Que veut-on montrer ??<br />

• Les essais d’efficacité : on suppose l’égalité <strong>des</strong> traitements et on cherche à<br />

rejeter l ’hypothèse.<br />

• Les essais d’équivalence : on considère que deux traitements sont équivalents<br />

si <strong>la</strong> différence entre-eux ne dépasse pas Δ.<br />

Comparaison de moyennes, de fréquences, de courbes ?<br />

Test Uni<strong>la</strong>téral ou Bi<strong>la</strong>téral ?<br />

P<strong>la</strong>n d’Expérience ?<br />

• Nombre de groupes ?<br />

• Indépendant / Apparié ?<br />

• Stratification, facteur de confusion, … ?<br />

Δ.<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Les p<strong>la</strong>ns d’expérience<br />

De nombreux types de p<strong>la</strong>n d'expérience.<br />

• Groupes parallèles +++<br />

• comparaisons intra-individuelles<br />

• Mesures répétées<br />

• ….<br />

Le choix entre plusieurs p<strong>la</strong>ns doit être fait en tenant compte de leurs<br />

avantages et de leurs inconvénients.<br />

Le choix du p<strong>la</strong>n détermine :<br />

• <strong>la</strong> méthodologie statistique à employer pour l'analyse<br />

• le nombre de patients à inclure <strong>dans</strong> l'étude<br />

Un p<strong>la</strong>n d'expérience est choisi de manière à optimiser <strong>la</strong> puissance <strong>des</strong> tests<br />

statistiques tout en minimisant le nombre de patients à inclure <strong>dans</strong> l'étude.<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


+<br />

-<br />

Les Groupes Parallèles<br />

Certainement le p<strong>la</strong>n le plus simple et le plus utilisé.<br />

• L'ensemble <strong>des</strong> patients est divisé en plusieurs groupes homogènes, de<br />

même taille en général, de manière à avoir une comparaison statistique <strong>la</strong><br />

plus "efficace" possible.<br />

Chaque patient reçoit un traitement et un seul.<br />

Méthodologie statistique d'analyse simple.(ANOVA 1Facteur / Khi²)<br />

Attention à <strong>la</strong> comparabilité <strong>des</strong> groupes de traitements.<br />

La variabilité entre les sujets peut être importante.<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


+<br />

-<br />

Les comparaisons intra-individuelles<br />

Dans ce type d'essai, le sujet est son propre témoin et reçoit donc successivement deux ou<br />

plusieurs traitements, <strong>dans</strong> un ordre aléatoire.<br />

Tailles d'échantillon plus faibles, chaque patient étant "utilisé" plusieurs fois<br />

Permet de minimiser <strong>la</strong> variance inter-sujet <strong>dans</strong> les différents sta<strong>des</strong> de l'expérimentation<br />

(efficace si Variance Intra < Variance Inter).<br />

Suppose que le sujet soit <strong>dans</strong> les mêmes conditions <strong>dans</strong> les différentes phases<br />

d'expérimentation<br />

Aucun <strong>des</strong> traitements administrés au cours d'une phase ne doit influencer les résultats de <strong>la</strong><br />

phase suivante WASH-OUT (période de "sevrage" )<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


P<strong>la</strong>ns Intra-Individuels : 2 Traitements<br />

L'essai croisé (cross-over): on compare deux traitements A et B<br />

G1 :<br />

G2 :<br />

• Chaque patient reçoit soit A puis B, soit B puis A.<br />

• Indispensable d'étudier simultanément l'effet <strong>des</strong> traitements mais également l'ordre<br />

d'administration.<br />

• Si plus de deux traitements, cross-over trop compliqué et l'on utilise alors le carré <strong>la</strong>tin.<br />

T0<br />

X0<br />

Baseline<br />

T1 T2 T3<br />

A B<br />

WASH-OUT<br />

X1 X2<br />

Contrôle<br />

X3<br />

B A<br />

WASH-OUT<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


55<br />

50<br />

45<br />

40<br />

35<br />

30<br />

2 Groupes : A et B<br />

Mesures Répétées<br />

1 variable numérique X mesurée k fois (T1, T2, …, Tk)<br />

25<br />

1 3 5<br />

Très utilisé !!!!<br />

A<br />

B<br />

55<br />

50<br />

45<br />

40<br />

35<br />

30<br />

25<br />

1 3 5<br />

Méthodologie statistique spécifique (modèle mixte)<br />

A<br />

B<br />

25<br />

1 3 5<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011<br />

55<br />

50<br />

45<br />

40<br />

35<br />

30<br />

A<br />

B


Le Critère de Jugement Principal<br />

1 question = 1 étude = 1 critère principal<br />

Le critère de jugement principal doit être :<br />

• Validé par <strong>la</strong> communauté scientifique<br />

• Cliniquement pertinent par rapport à ce que l’on veut démontrer<br />

• Reproductible<br />

• Simple à analyser et interpréter<br />

IMPORTANT : Détermine :<br />

• le nombre de sujets nécessaire<br />

• l’analyse statistique<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Nombre de cas à inclure <strong>dans</strong> l’étude ?<br />

On a déterminé le problème clinique<br />

On a déterminé le(s) critère(s) de jugement<br />

On a défini le p<strong>la</strong>n d’expérience adapté<br />

Pb : combien, doit-on inclure de patients pour répondre<br />

correctement à l’hypothèse posée ?<br />

On utilise un test statistique Notion de puissance<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Notion de Puissance d’un test<br />

Décision<br />

Vérité<br />

H0 H1<br />

Compatible H0 β<br />

Rejet de H0 =<br />

on décide H1<br />

α 1-β<br />

α = Proba (décider H1 / H0 est vraie) = risque de première espèce<br />

β = Proba ( décider « compatible avec H0 » / H1 est vraie) = risque de deuxième espèce<br />

Puissance = 1-β = Proba ( décider H1 / H1 est vraie)<br />

α = Risque d'affirmer qu'il y a une différence significative alors qu'elle n'existe pas réellement.<br />

β = Risque d'affirmer qu'il n'y a pas de différence significative alors qu'elle existe réellement.<br />

Puissance = Probabilité de détecter une différence réelle si elle existe réellement<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Notion de puissance d’un test<br />

Puissance dépend de <strong>la</strong> différence<br />

mais aussi de <strong>la</strong> variabilité<br />

Δ<br />

Puissance dépend du risque de<br />

première espèce α , mais inutile en<br />

pratique car α fixé à 5%<br />

Puissance = F(Δ,N,DS)<br />

En pratique, on estime Δ et DS<br />

et on déduit N<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Les deux risques sont antagonistes<br />

α = 0 → β=1 et β = 0 → α = 1<br />

En pratique :<br />

• on fixe α=5%<br />

Notion de puissance d’un test<br />

• on se donne ΔΔΔΔ sur critères cliniques<br />

• on estime DS (étude pilote / littérature)<br />

• on a donc « <strong>la</strong> main » que sur N :<br />

• on calcule N pour assurer β = 10% ou 20% (puissance ≥ 80%)<br />

Formules, tables, logiciels<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


En pratique…<br />

Dépend du p<strong>la</strong>n d’expérience :<br />

• Nombre de groupes<br />

• Indépendant / Apparié (patient propre témoin)<br />

Dépend du critère de jugement principal<br />

• Numérique<br />

• Binaire<br />

• Survie<br />

• …<br />

Des 2 risques :<br />

• α : risque de première espèce : généralement 5%<br />

• β : risque de seconde espèce : inférieur à 20%<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Taille <strong>des</strong> échantillons : En pratique<br />

Comparaison de 2 moyennes (groupes indépendants)<br />

Test bi<strong>la</strong>téral Test uni<strong>la</strong>téral<br />

Alpha Beta Zalpha Zbéta K<br />

0.05 0.05 1.96 1.64 25.99<br />

0.05 0.1 1.96 1.28 21.01<br />

0.05 0.2 1.96 0.84 15.70<br />

σ ² σ ²<br />

Δ² Δ²<br />

2<br />

n = 2( + ) = K<br />

1−α 1−β<br />

z z<br />

(Formules approchées)<br />

Alpha Beta Zalpha Zbéta K<br />

0.05 0.05 1.64 1.64 21.64<br />

0.05 0.1 1.64 1.28 17.13<br />

0.05 0.2 1.64 0.84 12.37<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Exemple<br />

Différence attendue (Δ) : 5mm de mercure<br />

Ecart-type (DS): 10 mm<br />

Risque de première espèce (α ): 5%<br />

Puissance (1-β ): 90%<br />

Puissance<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 50 100 150 200<br />

Nombre de Patients par Groupe<br />

⎛10 ⎞<br />

N = 21.01* ⎜ ⎟ = 84<br />

⎝ 5 ⎠<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011<br />

2<br />

( par groupe )


Taille <strong>des</strong> échantillons : En pratique<br />

Comparaison de 2 fréquences (groupes indépendants)<br />

P (1 − P ) + P (1 − P ) P (1 − P ) + P (1 − P )<br />

n = ( + ) = K<br />

A A B B<br />

z z<br />

2 A A B B<br />

1−α 1−β<br />

( PA − PB )² ( PA − PB<br />

)²<br />

Test bi<strong>la</strong>téral Test uni<strong>la</strong>téral<br />

Alpha Beta Z1 Z2 K<br />

0.05 0.05 1.96 1.64 12.99<br />

0.05 0.1 1.96 1.28 10.51<br />

0.05 0.2 1.96 0.84 7.85<br />

(Formules approchées)<br />

Alpha Beta Z1 Z2 K<br />

0.05 0.05 1.64 1.64 10.82<br />

0.05 0.1 1.64 1.28 8.56<br />

0.05 0.2 1.64 0.84 6.18<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


P A = 0.1, P B = 0.2<br />

Exemple<br />

Risque de première espèce (α ): 5%<br />

Puissance (1-β ): 90%<br />

Puissance<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

0 50 100 150 200 250 300 350 400 450 500<br />

Effectif par Groupe<br />

N = 10.51*25 = 263<br />

( par groupe )<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Puissance d’un test et Taille d’échantillon<br />

Comparaison de deux antihypertenseurs avec :<br />

• ΔΔΔΔ : 5mm de mercure<br />

• Ecart-type (DS): 10 mm<br />

• Risque de première espèce (α ): 5%<br />

1- β = 0.9 N1=N2=86<br />

L’étude a été réalisée sans calcul de puissance préa<strong>la</strong>ble sur 2 groupes de 30<br />

sujets.<br />

Ne pas confondre :<br />

Puissance = 1-β = 0.48 !!!<br />

Conditions d’application du test et Puissance du test<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Un petit exemple ??<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


EXEMPLE<br />

On s’intéresse à <strong>la</strong> popu<strong>la</strong>tion <strong>des</strong> patients dépressifs. On dispose d’un<br />

traitement de référence R.<br />

On veut tester l’hypothèse que l’association d’une nouvelle molécule M<br />

permet une guérison plus rapide.<br />

Pour mesurer <strong>la</strong> dépression, on utilise l’échelle de Hamilton. On considère<br />

qu’un patient est dépressif si son score est supérieur ou égal à 10. On<br />

mesure ce score à l ’inclusion (J0), puis à J5, J10, J14, J21, J28 et J60.<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


EXEMPLE<br />

P<strong>la</strong>n d ’expérience : simple . On va constituer 2 groupes :<br />

• Groupe 1 : R + M<br />

• Groupe 2 : R + <strong>P<strong>la</strong>ce</strong>bo<br />

Critère de jugement : Au moins 4 critères possibles !!<br />

• Échelle de Hamilton à J14<br />

• Évolution du Hamilton au cours du temps<br />

• Taux de guérison (Hamilton < 10) à un instant T (J14, ou J21)<br />

• Temps avant guérison (Hamilton


Option 1<br />

Critère principal : Échelle de Hamilton à J14<br />

Calcul du nombre de sujets : nécessite de connaître les<br />

moyennes et l’écart-type. Exemple :<br />

x A = 10 , xB = 13 , σ =5 , α =0.05 , β =0.10<br />

→<br />

n = 60 par groupe<br />

Analyse statistique : comparaison de 2 moyennes : test T<br />

! Ne pas se tromper de temps !!!<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Option 2<br />

Critère principal : Évolution du Hamilton entre J0 et J21<br />

Calcul du nombre de sujets : nécessite de connaître :<br />

• les moyennes pour chaque groupe et chaque temps<br />

• l’écart-type global.<br />

• les corré<strong>la</strong>tions entre les mesures<br />

Analyse statistique : ANOVA en mesures répétées<br />

Intérêt : On ne choisit pas le temps a priori !!!<br />

Irréaliste en pratique !!<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Option 3<br />

Critère principal : Taux de guérison (Hamilton


Option 4<br />

Critère principal : Temps avant guérison (Hamilton


Traitement statistique<br />

<strong>des</strong> données<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Le recueil <strong>des</strong> données (Data Management)<br />

Les résultats statistiques sont fonction <strong>des</strong> données - Problème de <strong>la</strong> qualité <strong>des</strong><br />

données.<br />

Problème <strong>des</strong> données manquantes (analyses multivariées) !!<br />

Pour certains essais, nécessité de suivre <strong>des</strong> guidelines (FDA, AMM)<br />

2 approches :<br />

• Maximaliste : Guidelines ( double saisie, confrontation et gel de <strong>la</strong> base)<br />

• Minimaliste : logiciel permettant le contrôle à <strong>la</strong> saisie (bornes, valeurs autorisées …)<br />

Approche 1 : Complexe, longue et coûteuse - A éviter si possible<br />

Approche 2 : Approche minimale, quelque soit l’étude.<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Métho<strong>des</strong> <strong>Statistiques</strong> : définitions générales<br />

INDIVIDU : « Objet » sur lequel un ou plusieurs caractères peuvent être observés.<br />

POPULATION : Ensemble <strong>des</strong> individus pris en considération.<br />

VARIABLE : Propriété servant à distinguer les individus d'une popu<strong>la</strong>tion. Une<br />

variable peut être qualitative (attribut) ou quantitative (numérique).<br />

VARIABLES<br />

QUANTITATIVES<br />

QUALITATIVES<br />

DISCRETES (Nombre limité de valeurs)<br />

CONTINUES (prend ses valeurs <strong>dans</strong> un intervalle<br />

BINAIRES ( Présent / Absent )<br />

NOMINALES (SEXE, Couleur <strong>des</strong> Yeux, CSP, …)<br />

ORDINALES = SCORE (Notion d’ordre)<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


La statistique<br />

Les métho<strong>des</strong> statistiques<br />

Descriptive<br />

Inférentielle<br />

Univariée (moyenne, DS, …)<br />

Multivariée (ACP, …)<br />

Univariée (tests, …)<br />

Multivariée (modèles, …)<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


La Statistique Descriptive<br />

BUTS :<br />

• Contrôle de qualité <strong>des</strong> données, <strong>des</strong>criptifs simples (moyennes, …).<br />

• Synthétiser, résumer, structurer l'information contenue <strong>dans</strong> les données.<br />

• Mettre en évidence <strong>des</strong> propriétés de l'échantillon.<br />

• Suggérer <strong>des</strong> hypothèses.<br />

Analyses univariées : moyennes, histogramme, box-plot, fréquences, …<br />

Analyses multivariées =Analyse <strong>des</strong> Données. Permet de traiter <strong>des</strong><br />

données multidimensionnelles.<br />

Principales métho<strong>des</strong> multivariées:<br />

• Métho<strong>des</strong> de c<strong>la</strong>ssification : déterminer <strong>des</strong> sous-groupes homogènes<br />

• Métho<strong>des</strong> factorielles : réduire le nombre de variables par construction d'axes<br />

synthétiques (ACP, AFC, ACM, ...), mais aussi sous-groupes d’individus<br />

• 2 c<strong>la</strong>sses de métho<strong>des</strong> souvent complémentaires Cours N° 2<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


La Statistique Inférentielle Univariée<br />

BUT : Valider ou infirmer <strong>des</strong> hypothèses a priori ou formulées après<br />

une phase exploratoire.<br />

Utilisation de tests statistiques se référant à <strong>des</strong> modèles probabilistes.<br />

EXEMPLES :<br />

• Comparaison de moyennes (test T, Wilcoxon, …)<br />

• ANOVA (+ + + !!!) / Modèle mixte<br />

• Comparaison de fréquences (Khi², Fisher exact)<br />

• Tests de lois (Shapiro-wilk, Kolmogorov-Smirnov)<br />

• ...<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


STATISTIQUE DESCRIPTIVE<br />

UNIVARIEE<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Analyse <strong>des</strong>criptive univariée<br />

Contrôle <strong>des</strong> données : Fréquences et Box-plots<br />

Calcul <strong>des</strong> statistiques <strong>des</strong>criptives : moyenne, ….<br />

Présentation <strong>des</strong> résultats :<br />

3 Objectifs :<br />

• Moyenne ± Déviation standard ou Médiane et Quartiles<br />

• Fréquence avec Intervalle de confiance<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Moyenne :<br />

Variance estimée:<br />

Paramètres statistiques de base<br />

x<br />

=<br />

1<br />

n<br />

∑<br />

i=<br />

1<br />

Déviation standard : racine carrée de <strong>la</strong> variance<br />

Min, Max, Médiane, Quartiles, Centiles<br />

n<br />

x<br />

i<br />

n 1<br />

= −<br />

n −1∑ s² x x<br />

i=<br />

1<br />

( ) 2<br />

i<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


X max<br />

X min<br />

Q3<br />

Médiane<br />

Q1<br />

Le Box-Plot ( Boîte à Moustaches )<br />

0<br />

+<br />

1,5 (Q3-Q1)<br />

1,5 (Q3-Q1)<br />

II=Q3-Q1<br />

0 : valeur comprise entre<br />

1.5 et 3 interquartiles<br />

* : valeur supérieure à 3 interquartiles<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Femme<br />

45%<br />

VARIABLES DISCRETES<br />

Représentations graphiques<br />

Homme<br />

55%<br />

Homme<br />

Femme<br />

VARIABLES QUALITATIVES<br />

VARIABLES CONTINUES<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Distribution d’un paramètre (loi)<br />

Différentes formes observables<br />

Modélisation de <strong>la</strong> distribution : Hypothèse de loi<br />

D<br />

e<br />

n<br />

s<br />

i<br />

t<br />

y<br />

0. 04<br />

0. 02<br />

0<br />

-2 2 6 10 14 18 22 26 30 34 38<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011<br />

X


-4 -3 -2 -1 0 1 2 3 4<br />

Tests de Normalité<br />

SHAPIRO-WILK ( N< 50 ) ou KOLMOGOROV-SMIRNOV ( N> 50 )<br />

TEST D'ADEQUATION DU χ²<br />

Hypothèses de normalité requise pour<br />

• test T, ANOVA<br />

• régression,<br />

• Intervalles de confiance (valeurs normales)<br />

• …<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Présentation <strong>des</strong> résultats<br />

Toujours rappeler <strong>la</strong> popu<strong>la</strong>tion étudiée, les patients inclus ou exclus, …<br />

Préciser les métho<strong>des</strong> statistiques utilisées<br />

Faire <strong>des</strong> tableaux de synthèse<br />

Utiliser <strong>des</strong> graphiques<br />

Existence de recommandations ( http://www.consort-statement.org/ )<br />

Suivre scrupuleusement les guidelines si article scientifique !!!<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Utilisation de <strong>la</strong> moyenne si distribution symétrique, de <strong>la</strong> médiane si distribution<br />

asymétrique<br />

Pas de moyenne sans déviation standard<br />

Pas de médiane sans quartiles<br />

Présentation <strong>des</strong> résultats<br />

-4 -3 -2 -1 0 1 2 3 4<br />

Pas de fréquence sans Intervalle de confiance<br />

0.5<br />

0.45<br />

0.4<br />

0.35<br />

0.3<br />

0.25<br />

0.2<br />

0.15<br />

0.1<br />

0.05<br />

médiane<br />

moyenne<br />

0<br />

0 2 4 6 8 10 12<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Intervalles de confiance à 95%<br />

d’un paramètre numérique :<br />

si X suit une loi normale<br />

d’une moyenne :<br />

quelque soit <strong>la</strong> loi de X, si n > 30<br />

d’une fréquence<br />

si np , nq > 10<br />

x<br />

x<br />

p ±<br />

±<br />

±<br />

1 . 96<br />

1 . 96<br />

1.96<br />

DS<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011<br />

n<br />

DS<br />

p(1 -<br />

n<br />

p)


Comparaisons de groupes,<br />

quels tests utiliser ?<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Comparaison de Groupes<br />

Choix du test statistique – Dépend de :<br />

• La nature de <strong>la</strong> variable<br />

• Du nombre de groupes<br />

• De <strong>la</strong> taille <strong>des</strong> groupes<br />

Cas <strong>des</strong> variables binaires ou qualitatives : Test du χ² ou Fisher exact<br />

Variables numériques : plusieurs cas :<br />

• 5 valeurs différentes : on considère que <strong>la</strong> variable est continue. Choix du test fait<br />

en fonction de plusieurs critères (algorithme suivant)<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


n 1 et n 2 > 30<br />

Ecart-réduit<br />

homogénéité<br />

Student<br />

Comparaison de groupes : variable numérique<br />

2 groupes<br />

Tester variances<br />

n 1 ou n 2 < 30<br />

X ~ N(m,σ) (biblio)<br />

OUI NON<br />

Non<br />

homogénéité<br />

Wilcoxon<br />

Variable continue<br />

ANOVA<br />

n i > 30<br />

>2 groupes<br />

∃ n i < 30<br />

2 parmi les 3 :<br />

- 1) groupes équilibrés<br />

- 2) variances égales<br />

- 3) distributions simi<strong>la</strong>ires<br />

OUI NON<br />

Kruskal-Wallis<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011


Des questions ???<br />

A<strong>la</strong>in Duhamel – Pôle de Santé Publique - aduhamel@univ-lille2.fr<br />

Patrick Devos – Délégation à <strong>la</strong> <strong>Recherche</strong> - pdevos@univ-lille2.fr<br />

Julia Salleron – Pôle de Santé Publique – julia.salleron@univ-lille2.fr<br />

Possibilité de RDV le Mardi AM ou Jeudi AM (ou autre si nécessaire)<br />

Contact :<br />

Mme Brigitte Bonneau<br />

Pôle de Santé Publique<br />

03-20-44-55-18<br />

<strong>P<strong>la</strong>ce</strong> <strong>des</strong> <strong>Statistiques</strong> <strong>dans</strong> <strong>la</strong> <strong>Recherche</strong> Biomédicale 22/09/2011

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!