Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
4.1. Théorie <strong>de</strong> l’information <strong>et</strong> sélection <strong>de</strong> modèle<br />
est “emboîtée” dans une régression à q covariables si p < q, ...). Il n’est donc pas optimal <strong>de</strong><br />
choisir son modèle sur la seule valeur <strong>de</strong> la vraisemblance puisque le modèle sélectionné sera<br />
systématiquement le plus complexe. Par conséquent, un critère <strong>de</strong> vraisemblance pénalisée<br />
classique est toujours <strong>de</strong> la forme<br />
MLE<br />
IC(K g ) = − ln L( ˆψ g ) + pen(K g ),<br />
où K g est la dimension du modèle (sa complexité), ˆψMLE g est l’estimateur du maximum <strong>de</strong><br />
vraisemblance, <strong>et</strong> pen(K g ) la pénalité. Dans ce contexte, nous cherchons le modèle donné par<br />
ˆK =<br />
Conditions suffisantes <strong>de</strong> convergence<br />
arg min IC(K g ).<br />
K g∈{K 1 ,...,K m}<br />
Nishii (1988), toujours dans le même article, déroule <strong>de</strong>s propriétés <strong>de</strong> convergence du<br />
modèle ˆM sélectionné (par ce type <strong>de</strong> critère d’information pénalisé) vers le modèle théorique<br />
M 0 <strong>de</strong> Y. Pour cela, il suffit que la pénalité du critère satisfasse les <strong>de</strong>ux conditions énoncées<br />
dans le théorème qui suit.<br />
Théorème 3. (Nishii). Soit ˆM un modèle sélectionné via un critère d’information <strong>de</strong> type<br />
IC(K g ) = −2 ln L( ˆψ g ) + c n K g , où ˆψ g , L( ˆψ g ) <strong>et</strong> K g sont respectivement l’estimateur du quasimaximum<br />
<strong>de</strong> vraisemblance, la quasi-vraisemblance <strong>et</strong> la dimension du modèle M g . Ainsi ˆM<br />
minimise<br />
IC(K g ) = − ln L( ˆψ g ) + c n K g ,<br />
pour n observations <strong>et</strong> <strong>de</strong>s modèles emboîtés M g = {M 1 , ..., M m } <strong>de</strong> dimension K g = {K 1 , ..., K m }<br />
(par définition, un modèle est dit emboîté dans un autre s’il est un cas particulier <strong>de</strong> c<strong>et</strong> autre<br />
modèle plus général). Si c n satisfait les <strong>de</strong>ux conditions<br />
1<br />
lim<br />
n→∞ n c c n<br />
n = 0 <strong>et</strong> lim<br />
n→∞ ln ln n = +∞,<br />
Alors ˆM converge fortement vers le quasi-vrai modèle M 0 , donc lim<br />
n→∞<br />
ˆM = M 0 p.s.<br />
La première condition garantit que le modèle sélectionné ne sous-estime pas le <strong>nombre</strong><br />
théorique <strong>de</strong> <strong>composantes</strong>, tandis que la <strong>de</strong>uxième sert à limiter la surestimation <strong>de</strong> ce même<br />
<strong>nombre</strong> <strong>de</strong> <strong>composantes</strong>. En eff<strong>et</strong> “c n négligeable <strong>de</strong>vant n” perm<strong>et</strong> <strong>de</strong> ne pas trop pénaliser<br />
la vraisemblance quand n grandit, alors que “ln ln n négligeable <strong>de</strong>vant c n ” provoque l’eff<strong>et</strong><br />
inverse : il faut donc trouver un juste milieu dans le poids <strong>de</strong> la pénalité. Nishii montre<br />
également <strong>de</strong>s résultats <strong>de</strong> convergence faible en relaxant la <strong>de</strong>uxième hypothèse sur c n .<br />
Nishii déduit <strong>de</strong> son étu<strong>de</strong> que le critère AIC n’est pas consistant, alors que le critère BIC l’est<br />
fortement. Nous présentons ci-<strong>de</strong>ssous la construction <strong>de</strong> ces <strong>de</strong>ux critères <strong>de</strong> vraisemblance<br />
pénalisée afin <strong>de</strong> visualiser concrètement les raisons <strong>de</strong> leur convergence (ou non), ainsi que<br />
leurs spécificités.<br />
Le critère AIC<br />
Nous nous appuyons dans ce paragraphe sur l’article d’origine, Akaike (1973), tout en reprenant<br />
les notations introduites <strong>de</strong>puis le début du chapitre. Dans son papier Akaike relève<br />
107