23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 3. Mélange <strong>de</strong> régressions logistiques<br />

Grâce à la formule <strong>de</strong> Bayes, nous pouvons calculer la probabilité a posteriori d’appartenir<br />

à telle ou telle composante du mélange :<br />

τ i (y j ) = π i<br />

f i (y j )<br />

f(y j ) ,<br />

pour i = 1, .., G <strong>et</strong> j = 1, ..., n.<br />

En pratique nous estimons les π i par leur moyenne empirique (sauf au départ <strong>de</strong> l’algorithme<br />

où ils sont fixés arbitrairement, cf section 3.1.3), i.e. ˆπ i = ∑ n<br />

j=1 z ij/n où les z ij sont déterminés<br />

par la règle du maximum a posteriori ; <strong>et</strong> les paramètres <strong>de</strong>s <strong>composantes</strong> du mélange grâce<br />

aux données qui y appartiennent.<br />

Une formulation paramétrique d’un modèle mélange peut s’écrire <strong>de</strong> la manière suivante<br />

f(y j ) = f(y j ; ψ) =<br />

G∑<br />

π i f i (y j ; θ i ), (3.2)<br />

i=1<br />

avec ψ = (π 1 , ..., π G−1 , ξ T ) T <strong>et</strong> ξ T = (θ1 T , ..., θT G<br />

). Nous noterons Ψ l’espace <strong>de</strong>s paramètres<br />

<strong>de</strong> ψ. Faisons l’hypothèse que les <strong>composantes</strong> appartiennent à la même famille paramétrique<br />

(mais ce n’est pas une généralité), <strong>et</strong> considérons une distribution mélangeante discrète H(θ)<br />

définie par H(θ) = P (θ = θ i ) = π i pour i=1,...,G. Alors le modèle mélange se reécrit comme<br />

∫<br />

f(y j ; H) = f(y j ; θ)dH(θ).<br />

C<strong>et</strong>te généralisation <strong>de</strong> l’écriture du mélange perm<strong>et</strong> d’appréhen<strong>de</strong>r son expression avec une<br />

mesure <strong>de</strong> probabilité plus générale pour H, qui peut être une loi continue (souvent une loi<br />

Gamma (modèle Poisson-Gamma) ou une loi B<strong>et</strong>a (modèle B<strong>et</strong>a-Binomial)).<br />

Il existe dans la littérature plusieurs techniques d’estimation <strong>de</strong> la distribution mélange : la<br />

métho<strong>de</strong> graphique, la métho<strong>de</strong> <strong>de</strong>s moments, la métho<strong>de</strong> <strong>de</strong>s distances minimum, l’approche<br />

bayésienne <strong>et</strong> le maximum <strong>de</strong> vraisemblance. C<strong>et</strong>te gran<strong>de</strong> variété est due au fait que nous<br />

n’avons pas <strong>de</strong> formules explicites pour les estimateurs, qui sont calculés itérativement par<br />

divers algorithmes. D’autre part, la taille n <strong>de</strong> l’échantillon doit être relativement gran<strong>de</strong> pour<br />

garantir les propriétés asymptotiques <strong>de</strong>s mélanges.<br />

3.1.2 I<strong>de</strong>ntifiabilité<br />

L’estimation <strong>de</strong> ψ sur la base <strong>de</strong>s observations y j n’a <strong>de</strong> sens que si ψ est i<strong>de</strong>ntifiable.<br />

La définition <strong>de</strong> l’i<strong>de</strong>ntifiabilité dans le cadre <strong>de</strong>s mélanges diffère un peu du cas classique<br />

dans la mesure où il y a la notion supplémentaire <strong>de</strong> <strong>composantes</strong>. Intuitivement, un modèle<br />

est i<strong>de</strong>ntifiable si <strong>de</strong>s valeurs distinctes <strong>de</strong> ψ déterminent <strong>de</strong>s membres distincts <strong>de</strong> la famille<br />

paramétrique associée à ψ (il ne peut pas y avoir <strong>de</strong>ux paramètres différents qui donnent<br />

le même modèle à l’arrivée). Formellement, f(y j ; ψ) est une famille paramétrique <strong>de</strong> <strong>de</strong>nsité<br />

i<strong>de</strong>ntifiable dans le cadre classique si<br />

f(y j ; ψ) = f(y j ; ψ ′ ) ⇔ ψ = ψ ′<br />

Pour les mélanges, c<strong>et</strong>te seule définition ne suffit pas car on peut avoir une classe <strong>de</strong> mélange<br />

i<strong>de</strong>ntifiable sans pour autant avoir i<strong>de</strong>ntifiabilité sur ψ. Il suffit pour comprendre cela <strong>de</strong><br />

permuter les <strong>composantes</strong> d’appartenance (les “labels”), ce qui ne change pas la <strong>de</strong>nsité globale<br />

72

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!