23.12.2013 Views

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

Mélanges de GLMs et nombre de composantes : application ... - Scor

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Chapitre 4. Sélection <strong>de</strong> mélange <strong>de</strong> <strong>GLMs</strong><br />

est qu’il n’existe pour le moment pas <strong>de</strong> meilleure métho<strong>de</strong> <strong>de</strong> sélection <strong>de</strong> mélange quelle que<br />

soit la nature <strong>de</strong> celui-ci. Leur étu<strong>de</strong> sur la détermination du <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong> dans le<br />

cas <strong>de</strong> mélange <strong>de</strong> régressions (Oliviera-Brochado and Vitorino Martins (2008)) par diverses<br />

techniques illustre très bien ce propos, <strong>de</strong> même que le papier <strong>de</strong> Sarstedt <strong>et</strong> al. (2011).<br />

Dans le cadre <strong>de</strong> modèles mélanges où l’on souhaite explicitement décrire la structure <strong>de</strong> la<br />

population <strong>et</strong> où l’objectif est <strong>de</strong> trouver le <strong>nombre</strong> <strong>de</strong> <strong>composantes</strong>, la plupart <strong>de</strong>s auteurs<br />

(McLachlan and Peel (2000), Fraley and Raftery (1998)) s’accor<strong>de</strong>nt à dire que le critère BIC<br />

donne <strong>de</strong> meilleurs résultats que le critère AIC puisqu’il recherche le quasi-vrai modèle. La<br />

convergence du BIC pour estimer l’ordre d’un mélange gaussien a notamment été démontrée<br />

dans Keribin (1999). Néanmoins Celeux and Soromenho (1996) précisent qu’il existe <strong>de</strong><br />

meilleurs critères <strong>de</strong> sélection que les critères classiques majoritairement utilisés dans la littérature<br />

pour réaliser une classification. Le critère ICL, que nous avons choisi d’étudier dans<br />

la suite <strong>de</strong> c<strong>et</strong>te thèse, en est un. La très gran<strong>de</strong> majorité <strong>de</strong>s travaux se sont concentrés sur<br />

les propriétés <strong>de</strong> ce critère dans le cadre gaussien (Baudry (2009)), mais n’ont pas abordé<br />

le contexte <strong>de</strong>s mélanges <strong>de</strong> <strong>GLMs</strong>. Une panoplie d’étu<strong>de</strong>s sur simulation <strong>et</strong> données réelles<br />

dans Baudry (2009) suggèrent un meilleur comportement d’ICL par rapport au BIC dans une<br />

optique <strong>de</strong> clustering. Nous présentons dans la section suivante quelques notions phares grâce<br />

à l’usage <strong>de</strong>s mélanges <strong>de</strong> lois normales. La question <strong>de</strong> la convergence du critère <strong>de</strong> sélection<br />

ICL pour <strong>de</strong>s mélanges gaussiens sera également abordée.<br />

4.2.1 Introduction avec les mélanges gaussiens<br />

Avant <strong>de</strong> présenter l’étu<strong>de</strong> sur les mélanges <strong>de</strong> <strong>GLMs</strong>, nous proposons d’introduire la<br />

problématique avec <strong>de</strong>s mélanges gaussiens. Ce choix nous parait pertinent dans la mesure où<br />

il est plus facile <strong>de</strong> comprendre les nouveaux concepts sur <strong>de</strong>s obj<strong>et</strong>s que nous avons l’habitu<strong>de</strong><br />

<strong>de</strong> manipuler, les mélanges gaussiens étant somme toute <strong>de</strong>s mélanges relativement classiques.<br />

La <strong>de</strong>nsité d’une loi normale multivariée N (µ, Σ) par rapport à la mesure <strong>de</strong> Lebesgue λ sur<br />

R d est donnée par<br />

∀y ∈ R d , ∀µ ∈ R d , ∀Σ ∈ S d +, f N (y; µ, Σ) =<br />

1<br />

√ e − 1<br />

(2π) d 2 (y−µ)T Σ −1 (y−µ) ,<br />

2 <strong>de</strong>t Σ<br />

où S d + est l’ensemble <strong>de</strong>s matrices symétriques définies positives sur R d . On note θ le vecteur<br />

<strong>de</strong> paramètres θ = (µ, Σ). Comme nous l’avons vu au chapitre 3, nous pouvons exprimer<br />

la <strong>de</strong>nsité d’un mélange gaussien dans le cas général (distribution mélangeante discrète ou<br />

continue) par rapport à la mesure <strong>de</strong> Lebesgue comme<br />

∫<br />

f(y) =<br />

f N (y; θ)dν(θ)<br />

dλ-p.s.,<br />

où ν est la distribution <strong>de</strong> probabilité sur l’espace <strong>de</strong>s paramètres.<br />

Nous nous restreignons à l’étu<strong>de</strong> <strong>de</strong>s mélanges finis, donc avec support fini. Autrement dit<br />

nous avons ν = ∑ G<br />

i=1 π iδ θi ; avec δ θi la mesure <strong>de</strong> Dirac en θ, {θ 1 , ..., θ G } le support <strong>de</strong> ν, <strong>et</strong><br />

les π i ∈ [0, 1] telles que ∑ G<br />

i=1 π i = 1. L’ensemble <strong>de</strong>s G-upl<strong>et</strong>s (π 1 , ..., π G ) qui satisfont c<strong>et</strong>te<br />

condition est noté par la suite Π G .<br />

Les <strong>composantes</strong> du mélange sont les f N (.; θ i ), <strong>et</strong> les poids sont les π i . Comme dans le chapitre<br />

3, l’ensemble <strong>de</strong>s paramètres est représenté par le vecteur ψ = (π 1 , ..., π G , ξ T ) ∈ Ψ avec<br />

116

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!