23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 3. Mélange <strong>de</strong> régressions logistiques<br />

le lecteur intéressé pourra alors consulter les travaux <strong>de</strong> Bohning and Sei<strong>de</strong>l (2003) <strong>et</strong> Garel<br />

(2007), dans lesquels <strong>de</strong>s références <strong>et</strong> <strong>de</strong>s étu<strong>de</strong>s théoriques (avec <strong>application</strong>) sont proposées.<br />

3.1.5 Focus sur les mélanges <strong>de</strong> Logit dans le contexte <strong>de</strong>s rachats<br />

Les mélanges <strong>de</strong> régressions logistiques font partie intégrante <strong>de</strong>s modèles mélanges semiparamétriques.<br />

Un résumé <strong>et</strong> une revue bibliographique <strong>de</strong> ce type <strong>de</strong> modèles est disponible<br />

dans le papier <strong>de</strong> Lindsay and Lesperance (1995), <strong>et</strong> <strong>de</strong>s <strong>application</strong>s dans le domaine <strong>de</strong> la<br />

biologie sont fournies dans Follmann and Lambert (1989) <strong>et</strong> Wang (1994). Nous avons vu au<br />

chapitre 1 que la régression logistique était adaptée aux données binomialement distribuées.<br />

Ainsi en notant p i (X j ) la probabilité <strong>de</strong> rachat <strong>de</strong> N j individus homogènes (ayant les mêmes<br />

caractéristiques X j ) appartenant à la composante i du mélange, <strong>et</strong> en reprenant les notations<br />

ci-<strong>de</strong>ssus avec Y j ∼ Bin(N j , p i (X j )) :<br />

f i (y j ) = f(y j ; p i (X j )) = P (Y j = y j ) = C y j<br />

N j<br />

p i (X j ) y j<br />

(1 − p i (X j )) N j−y j<br />

, (3.6)<br />

où y j est le <strong>nombre</strong> <strong>de</strong> rachats observés dans le groupe homogène j, <strong>et</strong> p i (X j ) résulte du lien<br />

logistique<br />

p i (X j ) = exp(βT i X j)<br />

1 + exp(β T i X j) ,<br />

avec X j = (X j1 , ..., X jp ) T le vecteur <strong>de</strong>s p covariables <strong>de</strong> l’individu j, β i = (β i1 , ..., β ip ) T le<br />

vecteur <strong>de</strong>s p coefficients <strong>de</strong> régression <strong>de</strong> la composante i.<br />

Considérons la moyenne <strong>et</strong> la variance du modèle mélange <strong>de</strong> régressions logistiques tel que<br />

f(y j ; ψ) =<br />

G∑<br />

π i (X j)f(y ′ j ; p i (X j )).<br />

i=1<br />

L’interprétation <strong>de</strong> ce modèle est la suivante : il existe plusieurs groupes qui suivent <strong>de</strong>s distributions<br />

logistiques différentes, avec chacun une proportion π i (X ′ j ). C<strong>et</strong>te proportion peut donc<br />

dépendre <strong>de</strong> certaines variables explicatives, à condition que l’i<strong>de</strong>ntifiabilité soit préservée (cf<br />

ci-<strong>de</strong>ssous). La moyenne <strong>et</strong> la variance sont facilement calculables par les formules suivantes :<br />

E[Y j ] = E Z [E[Y j | Z j ]] =<br />

G∑<br />

P (Z ij = 1)E[Y j | Z j ] =<br />

i=1<br />

Var[Y j ] = E [Var[Y j |Z j ]] + Var [E[Y j |Z j ]]<br />

[ G<br />

] ]<br />

∑<br />

G∑<br />

= N j π ij p ij<br />

[1 − π ij p ij<br />

i=1<br />

i=1<br />

G∑<br />

π ij p ij ,<br />

i=1<br />

+ (N j − 1)<br />

N j<br />

Var [E[Y j |Z j ]] ,<br />

avec Var [E[Y j |Z j ]] = N 2 j<br />

[ ∑G<br />

i=1 π ijp 2 ij − (∑ G<br />

i=1 π ijp ij ) 2 ].<br />

Dans le cas général, nous considérons également <strong>de</strong>s poids π i (X ′ j ) qui dépen<strong>de</strong>nt <strong>de</strong> certains<br />

facteurs endogènes ou exogènes, ce qui nous amène à les définir aussi comme <strong>de</strong>s régressions<br />

logistiques multinomiales (rappelons que Z j est multinomiale), soit :<br />

76<br />

π i (X ′ j) =<br />

exp(γi T X ′ j<br />

∑ )<br />

G<br />

h=1 exp(γT h X (3.7)<br />

′<br />

j<br />

),

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!