08.08.2013 Views

Tests de comparaison des fonctions d'incidence cumulée pour des ...

Tests de comparaison des fonctions d'incidence cumulée pour des ...

Tests de comparaison des fonctions d'incidence cumulée pour des ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Tests</strong> <strong>de</strong> <strong>comparaison</strong> <strong>de</strong>s <strong>fonctions</strong> d’inci<strong>de</strong>nce<br />

<strong>cumulée</strong> <strong>pour</strong> <strong>de</strong>s risques concurrents sous biais<br />

<strong>de</strong> longueur<br />

Jean-Yves Dauxois 1 & Agathe Guilloux 2<br />

1 CREST-ENSAI, Campus <strong>de</strong> Ker-Lann,<br />

BP 37203, 35 172 Bruz.<br />

2 Laboratoire <strong>de</strong> mathématiques, CNRS UMR 8628,<br />

Université Paris-Sud - Bât 425, 91405 Orsay Ce<strong>de</strong>x,<br />

Résumé<br />

L’objet <strong>de</strong> ce travail est <strong>de</strong> construire <strong>de</strong>s tests <strong>de</strong> <strong>comparaison</strong> entre les différentes <strong>fonctions</strong><br />

d’inci<strong>de</strong>nce <strong>cumulée</strong> <strong>pour</strong> un échantillon <strong>de</strong> durées <strong>de</strong> vie à risques concurrents et<br />

sous biais <strong>de</strong> longueur. Nous proposons <strong>de</strong>s statistiques <strong>de</strong> test et nous donnons leur<br />

comportement asymptotique. Nous appliquons nos tests à un jeu <strong>de</strong> données réelles et<br />

effectuons <strong>de</strong>s simulations <strong>pour</strong> évaluer empiriquement la puissance <strong>de</strong> nos tests.<br />

Mots-clés : biais <strong>de</strong> longueur, risques compétitifs, <strong>fonctions</strong> d’inci<strong>de</strong>nce <strong>cumulée</strong>.<br />

Abstract<br />

The aim of this work is to <strong>de</strong>rive a family of tests for comparing the cumulative inci<strong>de</strong>nce<br />

functions in a competing risks setup un<strong>de</strong>r length bias. Asymptotic results are proved<br />

for our test statistics. These tests are applied to a well-known dataset in this area and a<br />

simulation study is done.<br />

Keywords : Length biased, Competing risks, Cumulative Inci<strong>de</strong>nce Function.<br />

1 Risques concurrents et biais <strong>de</strong> longueur<br />

Supposons qu’un individu (ou une machine) soit soumis(e) à K ≥ 2 causes <strong>de</strong> mort (<strong>de</strong><br />

panne) notées D1, . . . , DK. On suppose que le décès (ou la panne) n’est dû, à chaque fois,<br />

qu’à une seule <strong>de</strong> ces causes (on parle <strong>de</strong> risques concurrents) mais que ces <strong>de</strong>rnières<br />

ne sont pas nécessairement indépendantes. Une dépendance entre les causes apparaît par<br />

exemple dans le cas du diabète. Si le principal intérêt est la modélisation du décès dû<br />

au diabète, cette cause <strong>de</strong> mort est en concurrence avec la mort <strong>de</strong>s suites d’une maladie<br />

cardiovasculaire dont le risque est nettement augmenté <strong>pour</strong> les sujets atteints du diabète<br />

en raison d’effets indésirables associés au traitement contre le diabète...<br />

Notons donc XIn k , <strong>pour</strong> k = 1, . . . , K, les variables aléatoires réelles (v.a.r.), non<br />

indépendantes, modélisant l’âge du décès d’un patient dans la situation hypothétique où<br />

la seule cause <strong>de</strong> mort Dk serait présente. La durée <strong>de</strong> vie du patient est alors notée T In<br />

1


Age<br />

t 0<br />

Temps<br />

Figure 1: Diagramme <strong>de</strong> Lexis <strong>pour</strong> les observations <strong>de</strong>s durées <strong>de</strong> vie sous biais <strong>de</strong><br />

longueur<br />

et est égale à T In = ∧kX In<br />

k . On note <strong>de</strong> plus δIn la v.a.r. qui vaut k si la mort est due à<br />

la cause Dk, <strong>pour</strong> k = 1, . . . , K. Notons<br />

¯G(t) = P (T In > t).<br />

la fonction <strong>de</strong> survie <strong>de</strong> la v.a.r. T In .<br />

Sans hypothèse d’indépendance, il est bien connu que les <strong>fonctions</strong> <strong>de</strong> répartitions<br />

(f.d.r.) <strong>de</strong>s v.a.r. XIn 1 , . . . , XIn K ne sont pas estimables (Cf. par exemple Benichou et Gail<br />

1990). On peut seulement estimer les <strong>fonctions</strong> d’inci<strong>de</strong>nce <strong>cumulée</strong> (f.i.c.) définies<br />

<strong>pour</strong> tout k = 1, . . . , K, par :<br />

Gk(t) = P (T In ≤ t, δ In = k).<br />

Dans la pratique, il n’est pas rare que l’observation que l’on fasse <strong>de</strong>s durées <strong>de</strong> vie<br />

soit soumise à biais <strong>de</strong> longueur. C’est à dire que l’on constitue l’échantillon <strong>de</strong>s durées<br />

<strong>de</strong> vies observées en ne suivant que les individus en vie à une date t0 donnée, comme le<br />

montre le diagramme <strong>de</strong> Lexis <strong>de</strong> la figure 1. On note T la v.a.r. modélisant la durée <strong>de</strong><br />

vie d’un individu suivi et δ sa cause <strong>de</strong> mort. Il est alors facile <strong>de</strong> voir que la loi <strong>de</strong> T<br />

n’est pas la même que celle <strong>de</strong> T In . On parle alors <strong>de</strong> biais <strong>de</strong> longueur car plus sa durée<br />

<strong>de</strong> vie est “longue” plus la probabilité <strong>pour</strong> l’individu d’être dans l’échantillon est gran<strong>de</strong>.<br />

Les <strong>fonctions</strong> d’inci<strong>de</strong>nce <strong>cumulée</strong> <strong>de</strong>s durées <strong>de</strong> vie observées (donc sous biais <strong>de</strong><br />

longueur) sont alors notées<br />

Fk(t) = P (T ≤ t, δ = k).<br />

Les <strong>fonctions</strong> taux <strong>de</strong> hasard spécifique sont définies en tout t > 0 par<br />

P(t ≤ T < t + h, δ = k|T ≥ t)<br />

λk(t) = lim<br />

h→0<br />

h<br />

2


et les <strong>fonctions</strong> taux <strong>de</strong> hasard spécifique cumulé par :<br />

<strong>pour</strong> k = 1, . . . , K.<br />

Λk(t) =<br />

t<br />

0<br />

λk(u)du,<br />

On suppose enfin, que la v.a. T <strong>de</strong> la durée <strong>de</strong> vie échantillonnée est soumise à une<br />

censure aléatoire à droite du type par exemple “perte <strong>de</strong> suivi”. On note C la v.a.r.<br />

modélisant cette censure, supposée indépendante <strong>de</strong> T .<br />

En résumé, nous supposons que l’on observe n durées <strong>de</strong> vie sous K risques concurrents<br />

et sous biais <strong>de</strong> longueur, que l’on note<br />

T ∗<br />

i = Ti ∧ Ci<br />

δ ∗ i = δiI({Ti ≤ Ci}) ,<br />

<strong>pour</strong> i = 1, . . . , n.<br />

2 <strong>Tests</strong> <strong>de</strong> <strong>comparaison</strong> <strong>de</strong>s f.i.c.<br />

L’objet <strong>de</strong> ce travail est <strong>de</strong> proposer un test <strong>de</strong> <strong>comparaison</strong> entre les <strong>fonctions</strong> d’inci<strong>de</strong>nce<br />

<strong>cumulée</strong> <strong>pour</strong> <strong>de</strong>s risques concurrents et sous biais <strong>de</strong> longueur. Plus particulièrement, on<br />

s’intéresse au test <strong>de</strong> l’hypothèse nulle<br />

H0 : G1(t) = G2(t),<br />

<strong>pour</strong> tout t > 0, contre l’hypothèse alternative<br />

H1 : G1(t) ≥ G2(t),<br />

<strong>pour</strong> tout t > 0, ce qui revient à dire que le risque 1 est plus sérieux que le risque 2. On<br />

peut aussi considérer l’hypothèse alternative<br />

H2 : ∃t > 0 tel que G1(t) = G2(t).<br />

En nous inspirant du travail effectué par Aly, Kochar & McKeague (1994) mais sans<br />

biais <strong>de</strong> longueur, nous montrons qu’en notant π une fonction <strong>de</strong> poids estimable, et Φ la<br />

fonction définie en tout t > 0 par :<br />

Φ(t) =<br />

t<br />

0<br />

π(u)d[Λ1 − Λ2](u),<br />

3


une mesure <strong>de</strong> l’écart à l’hypothèse nulle, en ayant en vue l’hypothèse alternative H1,<br />

peut être<br />

sup Φ(t).<br />

t∈[0,∞]<br />

Si l’hypothèse alternative considérée est H2, il est alors naturel <strong>de</strong> plutôt considérer comme<br />

mesure<br />

sup |Φ(t)|.<br />

t∈[0,∞]<br />

On obtient aisément une famille <strong>de</strong> statistiques <strong>de</strong> test (grâce au choix <strong>de</strong>s <strong>fonctions</strong> π)<br />

en estimant les mesures définies ci-<strong>de</strong>ssus. Ainsi, en notant ˆπ l’estimation <strong>de</strong> la fonction<br />

<strong>de</strong> poids,<br />

Nk(t) =<br />

Y (t) =<br />

n<br />

i=1<br />

n<br />

i=1<br />

I({T ∗<br />

i ≤ t, δ ∗ i = k}), k = 1, 2<br />

I({T ∗<br />

i ≥ t}) et<br />

J(t) = I({Y (t) > 0})<br />

une estimation <strong>de</strong> la fonction Φ est donnée, <strong>pour</strong> tout t > 0, par :<br />

ˆΦ(t) =<br />

=<br />

t<br />

0<br />

t<br />

0<br />

ˆπ(u)d[ ˆ Λ1 − ˆ Λ2](u)<br />

ˆπ(u)J(u)<br />

Y (u) d[N1 − N2](u).<br />

Nous montrons, sous H0, la convergence faible du processus √ n ˆ Φ vers un processus<br />

gaussien centré dont nous déterminons la fonction <strong>de</strong> covariance. Un choix judicieux <strong>de</strong> la<br />

fonction <strong>de</strong> poids π permet en particulier d’obtenir un test asymptotiquement libre. Dans<br />

un tel cas, nous obtenons, en effet, les convergences faibles suivantes, quand n → +∞ :<br />

et<br />

T1 = √ n sup ˆΦ(t)<br />

t∈[0,∞]<br />

D → sup W (t)<br />

t∈[0,1]<br />

T2 = √ n sup |<br />

t∈[0,∞]<br />

ˆ Φ(t)| D → sup |W (t)|<br />

t∈[0,1]<br />

où W est le mouvement brownien standard.<br />

Nous appliquons ensuite nos tests à un jeu <strong>de</strong> données, classique en risques concurrents,<br />

fourni par Bienen et van <strong>de</strong> Walle (1991). Nous présentons enfin <strong>de</strong>s simulations<br />

permettant d’évaluer empiriquement la puissance <strong>de</strong> nos tests.<br />

4


Bibliographie<br />

[1] Aly, E.A.A., Kochar, S.C. & McKeague, I.W. (1994), Some <strong>Tests</strong> for Comparing Cumulative<br />

Inci<strong>de</strong>nce Functions and Cause-Specific Hazard Rates, J. Amer. Statist. Assoc.,<br />

89, 994-999.<br />

[2] An<strong>de</strong>rsen, P.K., Borgan, O., Gill, R.D. and Keiding, N. (1993), Statistical mo<strong>de</strong>ls based<br />

on counting processes. Springer-Verlag.<br />

[3] Asgharian M., M’Lan, C.E. & Wolfson, D.B. (2002), Length-biased sampling with<br />

right censoring : an unconditional approach, J. Amer. Statist. Assoc. 97, 201-209.<br />

[4] Bienen, H.S. & van <strong>de</strong> Walle, N. (1991), Time of power. Stanford University Press.<br />

[5] Benichou, J. & Gail, M.H. (1990). Estimates of absolute cause-specific risk in cohort<br />

studies, Biometrics 46, 813-826.<br />

[6] Gray, R.J. (1988) A class of k-sample tests for Comparative the Cumulative Inci<strong>de</strong>nce<br />

of a Competing Risk, The Annals of Statistics 16, 1141-1154.<br />

[7] Huang, Y. and Wang, M-C (1995). Estimating the occurence rate for prevalent survival<br />

data in competing risks mo<strong>de</strong>ls J. Amer. Statist. Assoc. 90, 1406-1415.<br />

5

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!