Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Chapitre 3. Mélange <strong>de</strong> régressions logistiques<br />
le lecteur intéressé pourra alors consulter les travaux <strong>de</strong> Bohning and Sei<strong>de</strong>l (2003) <strong>et</strong> Garel<br />
(2007), dans lesquels <strong>de</strong>s références <strong>et</strong> <strong>de</strong>s étu<strong>de</strong>s théoriques (avec <strong>application</strong>) sont proposées.<br />
3.1.5 Focus sur les mélanges <strong>de</strong> Logit dans le contexte <strong>de</strong>s rachats<br />
Les mélanges <strong>de</strong> régressions logistiques font partie intégrante <strong>de</strong>s modèles mélanges semiparamétriques.<br />
Un résumé <strong>et</strong> une revue bibliographique <strong>de</strong> ce type <strong>de</strong> modèles est disponible<br />
dans le papier <strong>de</strong> Lindsay and Lesperance (1995), <strong>et</strong> <strong>de</strong>s <strong>application</strong>s dans le domaine <strong>de</strong> la<br />
biologie sont fournies dans Follmann and Lambert (1989) <strong>et</strong> Wang (1994). Nous avons vu au<br />
chapitre 1 que la régression logistique était adaptée aux données binomialement distribuées.<br />
Ainsi en notant p i (X j ) la probabilité <strong>de</strong> rachat <strong>de</strong> N j individus homogènes (ayant les mêmes<br />
caractéristiques X j ) appartenant à la composante i du mélange, <strong>et</strong> en reprenant les notations<br />
ci-<strong>de</strong>ssus avec Y j ∼ Bin(N j , p i (X j )) :<br />
f i (y j ) = f(y j ; p i (X j )) = P (Y j = y j ) = C y j<br />
N j<br />
p i (X j ) y j<br />
(1 − p i (X j )) N j−y j<br />
, (3.6)<br />
où y j est le <strong>nombre</strong> <strong>de</strong> rachats observés dans le groupe homogène j, <strong>et</strong> p i (X j ) résulte du lien<br />
logistique<br />
p i (X j ) = exp(βT i X j)<br />
1 + exp(β T i X j) ,<br />
avec X j = (X j1 , ..., X jp ) T le vecteur <strong>de</strong>s p covariables <strong>de</strong> l’individu j, β i = (β i1 , ..., β ip ) T le<br />
vecteur <strong>de</strong>s p coefficients <strong>de</strong> régression <strong>de</strong> la composante i.<br />
Considérons la moyenne <strong>et</strong> la variance du modèle mélange <strong>de</strong> régressions logistiques tel que<br />
f(y j ; ψ) =<br />
G∑<br />
π i (X j)f(y ′ j ; p i (X j )).<br />
i=1<br />
L’interprétation <strong>de</strong> ce modèle est la suivante : il existe plusieurs groupes qui suivent <strong>de</strong>s distributions<br />
logistiques différentes, avec chacun une proportion π i (X ′ j ). C<strong>et</strong>te proportion peut donc<br />
dépendre <strong>de</strong> certaines variables explicatives, à condition que l’i<strong>de</strong>ntifiabilité soit préservée (cf<br />
ci-<strong>de</strong>ssous). La moyenne <strong>et</strong> la variance sont facilement calculables par les formules suivantes :<br />
E[Y j ] = E Z [E[Y j | Z j ]] =<br />
G∑<br />
P (Z ij = 1)E[Y j | Z j ] =<br />
i=1<br />
Var[Y j ] = E [Var[Y j |Z j ]] + Var [E[Y j |Z j ]]<br />
[ G<br />
] ]<br />
∑<br />
G∑<br />
= N j π ij p ij<br />
[1 − π ij p ij<br />
i=1<br />
i=1<br />
G∑<br />
π ij p ij ,<br />
i=1<br />
+ (N j − 1)<br />
N j<br />
Var [E[Y j |Z j ]] ,<br />
avec Var [E[Y j |Z j ]] = N 2 j<br />
[ ∑G<br />
i=1 π ijp 2 ij − (∑ G<br />
i=1 π ijp ij ) 2 ].<br />
Dans le cas général, nous considérons également <strong>de</strong>s poids π i (X ′ j ) qui dépen<strong>de</strong>nt <strong>de</strong> certains<br />
facteurs endogènes ou exogènes, ce qui nous amène à les définir aussi comme <strong>de</strong>s régressions<br />
logistiques multinomiales (rappelons que Z j est multinomiale), soit :<br />
76<br />
π i (X ′ j) =<br />
exp(γi T X ′ j<br />
∑ )<br />
G<br />
h=1 exp(γT h X (3.7)<br />
′<br />
j<br />
),