23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Chapitre 4. Sélection <strong>de</strong> mélange <strong>de</strong> <strong>GLMs</strong><br />

assure la convergence presque sûre <strong>de</strong> la moyenne empirique <strong>de</strong> la log-vraisemblance L cc en<br />

le M-estimateur vers son espérance en le meilleur paramètre. Nous allons voir que (H2-C)<br />

résulte <strong>de</strong> l’association du théorème 6 <strong>et</strong> du lemme 5. En ce qui concerne l’hypothèse (H4-C),<br />

elle n’est pas intuitive <strong>et</strong> nécessite <strong>de</strong> présenter d’autres résultats afin <strong>de</strong> l’expliciter. Nous<br />

présentons ci-après la preuve <strong>de</strong> ce théorème.<br />

[<br />

Démonstration. Posons l’ensemble E = arg max E f 0 ln Lcc (Ψ b g) ] . D’après (H1-C),<br />

1≤g≤m<br />

Ψ b g = arg max<br />

ψ g∈Ψ g<br />

E f 0 [ln L cc (ψ g )] <strong>et</strong> g b = min<br />

(<br />

arg max E f 0[<br />

ln Lcc (Ψ b g) ]) .<br />

1≤g≤m<br />

• Soit g /∈ E : définissons<br />

ɛ = 1 2<br />

( [ ] [ ])<br />

E f 0 ln L cc (Ψ b g<br />

) − E b f 0 ln L cc (Ψ b g) > 0. (4.11)<br />

D’après (H2-C) <strong>et</strong> (H3-C), lorsque n grandit nous avons avec gran<strong>de</strong> probabilité<br />

[ ]<br />

| E f 0 ln L cc (ψg)<br />

b − L n ( ˆψ g ) | ≤ ɛ [ ]<br />

3 ⇒ E f 0 ln L cc (Ψ b g) − L n ( ˆψ g ) ≥ − ɛ<br />

[ ]<br />

3<br />

| E f 0 ln L cc (ψ b g<br />

) − L b n ( ˆψ g b) | ≤ ɛ [ ]<br />

3 ⇒ E f 0 ln L cc (Ψ b g<br />

) − L b n ( ˆψ g b) ≤ ɛ 3<br />

(4.12)<br />

(4.13)<br />

pen(K g b) ≤ ɛ 3 . (4.14)<br />

Alors<br />

IC(K g)<br />

{ }} {<br />

−L n ( ˆψ g ) + pen(K g )<br />

(4.12) [ ]<br />

≥ −E f 0 ln L cc (ψg)<br />

b − ɛ (car pen(K g ) > 0)<br />

3<br />

(4.11) [ ]<br />

≥ −E f 0 ln L cc (ψ b g<br />

) + 5ɛ<br />

b 3<br />

(4.13)<br />

≥ −L n ( ˆψ g b) + 4ɛ<br />

3<br />

≤0<br />

(4.14)<br />

≥ −L n ( ˆψ g b) + 4ɛ { }} {<br />

3 + pen(K g b) − ɛ 3<br />

≥ −L n ( ˆψ g b) + pen(K g b) + ɛ.<br />

} {{ }<br />

IC(K g b)<br />

Or nous voulons minimiser le critère d’information IC, donc le modèle sélectionné (ĝ <strong>composantes</strong>)<br />

ne sera pas celui qui a g <strong>composantes</strong> : ĝ ≠ g.<br />

• Soit g ∈ E <strong>et</strong> g ≠ g b : par définition <strong>de</strong> g b , on a forcément g > g b . L’hypothèse (H4-C)<br />

implique qu’il existe v > 0 tel que pour n grand, nous avons avec gran<strong>de</strong> probabilité<br />

136<br />

(<br />

n L n ( ˆψ g ) − L n ( ˆψ<br />

)<br />

g b) ≤ v.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!