Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Chapitre 4. Sélection <strong>de</strong> mélange <strong>de</strong> <strong>GLMs</strong><br />
est qu’il n’existe pour le moment pas <strong>de</strong> meilleure métho<strong>de</strong> <strong>de</strong> sélection <strong>de</strong> mélange quelle que<br />
soit la nature <strong>de</strong> celui-ci. Leur étu<strong>de</strong> sur la détermination du <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> dans le<br />
cas <strong>de</strong> mélange <strong>de</strong> régressions (Oliviera-Brochado and Vitorino Martins (2008)) par diverses<br />
techniques illustre très bien ce propos, <strong>de</strong> même que le papier <strong>de</strong> Sarstedt <strong>et</strong> al. (2011).<br />
Dans le cadre <strong>de</strong> modèles mélanges où l’on souhaite explicitement décrire la structure <strong>de</strong> la<br />
population <strong>et</strong> où l’objectif est <strong>de</strong> trouver le <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong>, la plupart <strong>de</strong>s auteurs<br />
(McLachlan and Peel (2000), Fraley and Raftery (1998)) s’accor<strong>de</strong>nt à dire que le critère BIC<br />
donne <strong>de</strong> meilleurs résultats que le critère AIC puisqu’il recherche le quasi-vrai modèle. La<br />
convergence du BIC pour estimer l’ordre d’un mélange gaussien a notamment été démontrée<br />
dans Keribin (1999). Néanmoins Celeux and Soromenho (1996) précisent qu’il existe <strong>de</strong><br />
meilleurs critères <strong>de</strong> sélection que les critères classiques majoritairement utilisés dans la littérature<br />
pour réaliser une classification. Le critère ICL, que nous avons choisi d’étudier dans<br />
la suite <strong>de</strong> c<strong>et</strong>te thèse, en est un. La très gran<strong>de</strong> majorité <strong>de</strong>s travaux se sont concentrés sur<br />
les propriétés <strong>de</strong> ce critère dans le cadre gaussien (Baudry (2009)), mais n’ont pas abordé<br />
le contexte <strong>de</strong>s mélanges <strong>de</strong> <strong>GLMs</strong>. Une panoplie d’étu<strong>de</strong>s sur simulation <strong>et</strong> données réelles<br />
dans Baudry (2009) suggèrent un meilleur comportement d’ICL par rapport au BIC dans une<br />
optique <strong>de</strong> clustering. Nous présentons dans la section suivante quelques notions phares grâce<br />
à l’usage <strong>de</strong>s mélanges <strong>de</strong> lois normales. La question <strong>de</strong> la convergence du critère <strong>de</strong> sélection<br />
ICL pour <strong>de</strong>s mélanges gaussiens sera également abordée.<br />
4.2.1 Introduction avec les mélanges gaussiens<br />
Avant <strong>de</strong> présenter l’étu<strong>de</strong> sur les mélanges <strong>de</strong> <strong>GLMs</strong>, nous proposons d’introduire la<br />
problématique avec <strong>de</strong>s mélanges gaussiens. Ce choix nous parait pertinent dans la mesure où<br />
il est plus facile <strong>de</strong> comprendre les nouveaux concepts sur <strong>de</strong>s obj<strong>et</strong>s que nous avons l’habitu<strong>de</strong><br />
<strong>de</strong> manipuler, les mélanges gaussiens étant somme toute <strong>de</strong>s mélanges relativement classiques.<br />
La <strong>de</strong>nsité d’une loi normale multivariée N (µ, Σ) par rapport à la mesure <strong>de</strong> Lebesgue λ sur<br />
R d est donnée par<br />
∀y ∈ R d , ∀µ ∈ R d , ∀Σ ∈ S d +, f N (y; µ, Σ) =<br />
1<br />
√ e − 1<br />
(2π) d 2 (y−µ)T Σ −1 (y−µ) ,<br />
2 <strong>de</strong>t Σ<br />
où S d + est l’ensemble <strong>de</strong>s matrices symétriques définies positives sur R d . On note θ le vecteur<br />
<strong>de</strong> paramètres θ = (µ, Σ). Comme nous l’avons vu au chapitre 3, nous pouvons exprimer<br />
la <strong>de</strong>nsité d’un mélange gaussien dans le cas général (distribution mélangeante discrète ou<br />
continue) par rapport à la mesure <strong>de</strong> Lebesgue comme<br />
∫<br />
f(y) =<br />
f N (y; θ)dν(θ)<br />
dλ-p.s.,<br />
où ν est la distribution <strong>de</strong> probabilité sur l’espace <strong>de</strong>s paramètres.<br />
Nous nous restreignons à l’étu<strong>de</strong> <strong>de</strong>s mélanges finis, donc avec support fini. Autrement dit<br />
nous avons ν = ∑ G<br />
i=1 π iδ θi ; avec δ θi la mesure <strong>de</strong> Dirac en θ, {θ 1 , ..., θ G } le support <strong>de</strong> ν, <strong>et</strong><br />
les π i ∈ [0, 1] telles que ∑ G<br />
i=1 π i = 1. L’ensemble <strong>de</strong>s G-upl<strong>et</strong>s (π 1 , ..., π G ) qui satisfont c<strong>et</strong>te<br />
condition est noté par la suite Π G .<br />
Les <strong>composantes</strong> du mélange sont les f N (.; θ i ), <strong>et</strong> les poids sont les π i . Comme dans le chapitre<br />
3, l’ensemble <strong>de</strong>s paramètres est représenté par le vecteur ψ = (π 1 , ..., π G , ξ T ) ∈ Ψ avec<br />
116