Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Chapitre 3. Mélange <strong>de</strong> régressions logistiques<br />
Grâce à la formule <strong>de</strong> Bayes, nous pouvons calculer la probabilité a posteriori d’appartenir<br />
à telle ou telle composante du mélange :<br />
τ i (y j ) = π i<br />
f i (y j )<br />
f(y j ) ,<br />
pour i = 1, .., G <strong>et</strong> j = 1, ..., n.<br />
En pratique nous estimons les π i par leur moyenne empirique (sauf au départ <strong>de</strong> l’algorithme<br />
où ils sont fixés arbitrairement, cf section 3.1.3), i.e. ˆπ i = ∑ n<br />
j=1 z ij/n où les z ij sont déterminés<br />
par la règle du maximum a posteriori ; <strong>et</strong> les paramètres <strong>de</strong>s <strong>composantes</strong> du mélange grâce<br />
aux données qui y appartiennent.<br />
Une formulation paramétrique d’un modèle mélange peut s’écrire <strong>de</strong> la manière suivante<br />
f(y j ) = f(y j ; ψ) =<br />
G∑<br />
π i f i (y j ; θ i ), (3.2)<br />
i=1<br />
avec ψ = (π 1 , ..., π G−1 , ξ T ) T <strong>et</strong> ξ T = (θ1 T , ..., θT G<br />
). Nous noterons Ψ l’espace <strong>de</strong>s paramètres<br />
<strong>de</strong> ψ. Faisons l’hypothèse que les <strong>composantes</strong> appartiennent à la même famille paramétrique<br />
(mais ce n’est pas une généralité), <strong>et</strong> considérons une distribution mélangeante discrète H(θ)<br />
définie par H(θ) = P (θ = θ i ) = π i pour i=1,...,G. Alors le modèle mélange se reécrit comme<br />
∫<br />
f(y j ; H) = f(y j ; θ)dH(θ).<br />
C<strong>et</strong>te généralisation <strong>de</strong> l’écriture du mélange perm<strong>et</strong> d’appréhen<strong>de</strong>r son expression avec une<br />
mesure <strong>de</strong> probabilité plus générale pour H, qui peut être une loi continue (souvent une loi<br />
Gamma (modèle Poisson-Gamma) ou une loi B<strong>et</strong>a (modèle B<strong>et</strong>a-Binomial)).<br />
Il existe dans la littérature plusieurs techniques d’estimation <strong>de</strong> la distribution mélange : la<br />
métho<strong>de</strong> graphique, la métho<strong>de</strong> <strong>de</strong>s moments, la métho<strong>de</strong> <strong>de</strong>s distances minimum, l’approche<br />
bayésienne <strong>et</strong> le maximum <strong>de</strong> vraisemblance. C<strong>et</strong>te gran<strong>de</strong> variété est due au fait que nous<br />
n’avons pas <strong>de</strong> formules explicites pour les estimateurs, qui sont calculés itérativement par<br />
divers algorithmes. D’autre part, la taille n <strong>de</strong> l’échantillon doit être relativement gran<strong>de</strong> pour<br />
garantir les propriétés asymptotiques <strong>de</strong>s mélanges.<br />
3.1.2 I<strong>de</strong>ntifiabilité<br />
L’estimation <strong>de</strong> ψ sur la base <strong>de</strong>s observations y j n’a <strong>de</strong> sens que si ψ est i<strong>de</strong>ntifiable.<br />
La définition <strong>de</strong> l’i<strong>de</strong>ntifiabilité dans le cadre <strong>de</strong>s mélanges diffère un peu du cas classique<br />
dans la mesure où il y a la notion supplémentaire <strong>de</strong> <strong>composantes</strong>. Intuitivement, un modèle<br />
est i<strong>de</strong>ntifiable si <strong>de</strong>s valeurs distinctes <strong>de</strong> ψ déterminent <strong>de</strong>s membres distincts <strong>de</strong> la famille<br />
paramétrique associée à ψ (il ne peut pas y avoir <strong>de</strong>ux paramètres différents qui donnent<br />
le même modèle à l’arrivée). Formellement, f(y j ; ψ) est une famille paramétrique <strong>de</strong> <strong>de</strong>nsité<br />
i<strong>de</strong>ntifiable dans le cadre classique si<br />
f(y j ; ψ) = f(y j ; ψ ′ ) ⇔ ψ = ψ ′<br />
Pour les mélanges, c<strong>et</strong>te seule définition ne suffit pas car on peut avoir une classe <strong>de</strong> mélange<br />
i<strong>de</strong>ntifiable sans pour autant avoir i<strong>de</strong>ntifiabilité sur ψ. Il suffit pour comprendre cela <strong>de</strong><br />
permuter les <strong>composantes</strong> d’appartenance (les “labels”), ce qui ne change pas la <strong>de</strong>nsité globale<br />
72