Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
Mélanges de GLMs et nombre de composantes : application ... - Scor
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Chapitre 4. Sélection <strong>de</strong> mélange <strong>de</strong> <strong>GLMs</strong><br />
Table 4.1 – <strong>GLMs</strong> <strong>et</strong> différentes lois <strong>de</strong> la famille exponentielle associées.<br />
Loi Notation Lien Moyenne Utilisation<br />
Normale N (µ, σ 2 ) Id : η = µ µ = Xβ Régression linéaire<br />
Bernoulli B(µ) logit : η = ln( µ<br />
1−µ ) µ = exp(Xβ)<br />
1+exp(Xβ)<br />
Taux<br />
Poisson P(µ) log : η = ln(µ) µ = exp(Xβ) Fréquence<br />
Gamma G(µ, ν) inverse : η = 1 µ<br />
µ = (Xβ) −1 Sévérité<br />
Inverse Gaussienne IN (µ, λ) inverse 2 : η = − 1 µ 2 µ = (Xβ) −2 Sévérité<br />
– paramètre <strong>de</strong> tendance : le paramètre θ j ;<br />
– paramètre <strong>de</strong> dispersion : le paramètre φ j .<br />
Nous pouvons expliciter ces paramètres <strong>et</strong> fonctions dans chacune <strong>de</strong>s classes <strong>de</strong> la famille<br />
GLM, en fonction <strong>de</strong>s paramètres initiaux <strong>de</strong>s distributions. Un autre atout <strong>de</strong> c<strong>et</strong>te représentation<br />
rési<strong>de</strong> dans la facilité avec laquelle <strong>de</strong> <strong>nombre</strong>ux résultats peuvent être dérivés. A<br />
partir <strong>de</strong> l’équation (4.23), nous obtenons par exemple directement la log-vraisemblance pour<br />
une observation y j :<br />
ln L(θ, φ; y j ) = ln f Y (y j ; θ, φ) = y jθ − b(θ)<br />
a(φ)<br />
+ c(y j , φ).<br />
Il est aisé <strong>de</strong> remonter au calcul <strong>de</strong> l’espérance <strong>et</strong> <strong>de</strong> la variance <strong>de</strong> la loi <strong>de</strong>s Y : pour cela,<br />
les formules (4.24) <strong>et</strong> (4.25) peuvent être utilisées (McCullagh and Nel<strong>de</strong>r (1989), p.29). De<br />
même, c<strong>et</strong> ouvrage détaille les métho<strong>de</strong>s numériques <strong>de</strong> calibration <strong>de</strong>s modèles, ainsi que<br />
les tests concernant la bonne adéquation du modèle aux données observées (voir p. 33, 37 <strong>et</strong><br />
42). Afin <strong>de</strong> définir les ensembles <strong>de</strong> définition <strong>de</strong>s différents paramètres en adoptant la forme<br />
d’écriture générale <strong>de</strong> la <strong>de</strong>nsité <strong>de</strong> la famille exponentielle, nous utiliserons essentiellement<br />
les propriétés suivantes :<br />
E[Y ] = b ′ (θ), (4.24)<br />
Var[Y ] = b ′′ (θ)a(φ), (4.25)<br />
où b ′ (θ) <strong>et</strong> b ′′ (θ) désignent les dérivées première <strong>et</strong> secon<strong>de</strong> <strong>de</strong> b(.) par rapport à θ.<br />
4.3.2 Caractéristiques <strong>de</strong>s mélanges <strong>de</strong> <strong>GLMs</strong><br />
Définissons tout d’abord les mélanges <strong>de</strong> <strong>GLMs</strong> auxquels nous nous intéressons. Il s’agit <strong>de</strong><br />
mélanges discr<strong>et</strong>s (à support discr<strong>et</strong>) dont les <strong>composantes</strong> appartiennent toutes à la même<br />
famille <strong>de</strong> GLM, ce qui est concrètement le type <strong>de</strong> modèles utilisé dans la pratique. Ainsi,<br />
l’ensemble <strong>de</strong> ces modèles est défini par<br />
M G =<br />
{<br />
f(.; ψ G ) =<br />
}<br />
G∑<br />
π i f glm (.; θ i , φ i ) | ψ G = (π 1 , ..., π G , θ 1 , ..., θ G , φ 1 , ..., φ G ) ∈ Ψ G ,<br />
i=1<br />
{ }<br />
avec Ψ G ⊂ Π G × (R d ) 2G yθi − b(θ i )<br />
, <strong>et</strong> f glm (y; θ i , φ i ) = exp<br />
+ c(y; φ i ) .<br />
a(φ i )<br />
150