Mélanges de GLMs et nombre de composantes : application ... - Scor

More documents

Recommendations

Info

Chapitre 4. Sélection de mélange de GLMs déjà dans ce mémoire, et vaut : ∀ψ G ∈ Ψ G , f(y j ; ψ G ) = L(ψ G ; y j ) = = = G∑ π i f B (y j ; p i ) i=1 G∑ π i p i i=1 G∑ i=1 π i exp(X j β i ) 1 + exp(X j β i ) , où β i = (β i0 , β i1 , ..., β ip ) T et X j = (1, X j1 , X j2 , ..., X jp ). Nous en déduisons la log-vraisemblance classifiante conditionnelle d’une observation y j pour les mélanges de régressions logistiques : ( ) G∑ π i f B (y j ; p i ) ln L cc (ψ G ; y j ) = ln L(ψ G ; y j ) + ∑ G i=1 k=1 π k f B (y j ; p k ) ln π i f B (y j ; p i ) ∑ G k=1 π k f B (y j ; p k ) ( G ) ( ) ∑ G∑ π i f B (y j ; p i ) = ln π i f B (y j ; p i ) + ∑ G k=1 π k f B (y j ; p k ) ln π i f B (y j ; p i ) ∑ G k=1 π . k f B (y j ; p k ) D’où en développant, ln L cc (ψ G ; y j ) = ln ( G ∑ i=1 ) e X jβ i π i 1 + e X jβ i i=1 + i=1 i=1 e G∑ X jβ i ⎛ e X jβ i ⎞ π i 1 + e X jβ i π i ∑ G k=1 π e X ln ⎜ 1 + e X jβ i ⎟ jβ k ⎝∑ G k 1 + e X jβ k k=1 π e X jβ k ⎠ . k 1 + e X jβ k Toujours par l’étude des limites de cette vraisemblance aux frontières de l’espace des paramètres, les contraintes à imposer deviennent flagrantes (annexe D.3.2). En fait, l’unique cas critique pour la bornitude de la log-vraisemblance classifiante conditionnelle correspond à β i → −∞. De par la relation bijective qu’il existe entre les paramètres θ i et φ i et les paramètres originels de cette distribution, nous étendons ces contraintes aux contraintes à imposer sur l’espace des paramètres de la famille exponentielle. Ainsi, il suffit d’imposer que θ i reste borné. Mélange de régressions Gamma Parfois, l’erreur peut être de loi Gamma lorsque nous désirons modéliser la charge des sinistres. Cette loi continue est à valeur dans l’ensemble des réels positifs, et ses paramètres µ et ν appartiennent tous deux à l’ensemble des réels strictement positifs. Pour Y une variable aléatoire de loi Gamma Γ(µ, ν), la densité est donnée par 154 f(y; µ, ν) = 1 Γ(ν) ( ν µ ) ν y ν−1 exp (− ν µ y ) . Après quelques calculs, la densité d’un mélange de régressions Gamma pour une observa-
4.3. Extension aux mélanges de GLMs tion y j s’exprime comme suit : ∀ψ G ∈ Ψ G , f(y j ; ψ G ) = L(ψ G ; y j ) = = = G∑ π i f Γ (y j ; µ i , ν i ) i=1 G∑ i=1 G∑ i=1 π i 1 Γ(ν i ) ( ) νi ( νi y ν i−1 j exp − ν ) i y j µ i µ i π i 1 Γ(ν i ) (ν iX j β i ) ν i y ν i−1 j exp (−ν i X j β i y j ) , où β i = (β i0 , β i1 , ..., β ip ) T et X j = (1, X j1 , X j2 , ..., X jp ). Cette densité de mélange nous permet d’exprimer la vraisemblance classifiante conditionnelle qui en découle (toujours pour une observation y j ) : ( ) G∑ π i f Γ (y j ; µ i ) ln L cc (ψ G ; y j ) = ln L(ψ G ; y j ) + ∑ G i=1 k=1 π k f Γ (y j ; µ k ) ln π i f Γ (y j ; µ i ) ∑ G k=1 π k f Γ (y j ; µ k ) ( G ) ( ) ∑ G∑ π i f Γ (y j ; µ i ) = ln π i f Γ (y j ; µ i ) + ∑ G k=1 π k f Γ (y j ; µ k ) ln π i f Γ (y j ; µ i ) ∑ G k=1 π . k f Γ (y j ; µ k ) D’où en développant, ln L cc (ψ G ; y j ) = ln G∑ i=1 π i i=1 ( G ∑ i=1 Γ(ν i ) (ν iX j β i ) ν i G∑ π k Γ(ν k ) (ν kX j β k ) ν k k=1 π i Γ(ν i ) (ν iX j β i ) ν i y ν i−1 j e −ν iX j β i y j y ν k−1 j i=1 ln ⎜ e −ν ⎝ kX j β k y j y ν i−1 j e −ν iX j β i y j ) + ⎛ π i Γ(ν i ) (ν iX j β i ) ν i G∑ π k Γ(ν k ) (ν kX j β k ) ν k k=1 y ν i−1 j e −ν iX j β i y j y ν k−1 j ⎞ ⎟ e −ν ⎠ . kX j β k y j Nous devons imposer certaines contraintes pour conserver les propriétés de bornitude de la vraisemblance classifiante conditionnelle : notamment, il ne faut pas que (cf annexe D.4.2) – ν i → 0 ou ν i → +∞ ; – β i → −∞ ou β i → +∞. En effet, quand les paramètres β i et ν i vers les frontières de leur domaine de définition, l’étude des limites de la vraisemblance L cc montre que cette dernière explose. Traduisons maintenant les contraintes équivalentes sur l’espace des paramètres de la famille exponentielle (cf tableau 4.2) : il faut éviter que φ i → +∞ ou que φ i → 0, et s’assurer que θ i soit borné. Mélange d’Inverses Gaussiennes L’Inverse Gaussienne fait partie de la famille exponentielle, et constitue à ce titre un choix possible de modélisation de l’erreur dans un modèle linéaire généralisé. Elle est utilisée dans la modélisation de la sévérité des sinistres en Assurance, et a comme support l’ensemble des réels positifs. Ses deux paramètres µ et σ 2 appartiennent à l’ensemble des réels strictement positifs. Ainsi, une variable aléatoire Y de loi Inverse Gaussienne IN (µ, σ 2 ), dont la densité vaut f(y; µ, σ 2 ) = ( 1 √ 2πσ 2 y exp − 1 3 2 (y − µ) 2 ) µ 2 σ 2 , y 155
Page 1:
I.S.F.A. École Doctorale Sciences
Page 5:
If you want to be happy... ... for
Page 9 and 10:
Table des matières Remerciements R
Page 11 and 12:
Conclusion et annexes Conclusion et
Page 13:
Introduction générale 1
Page 16 and 17:
Présentation de la thèse personne
Page 18 and 19:
Présentation de la thèse Les assu
Page 20 and 21:
Présentation de la thèse maux, et
Page 22 and 23:
Présentation de la thèse Figure 1
Page 24 and 25:
Présentation de la thèse visible
Page 26 and 27:
Présentation de la thèse Proposit
Page 28 and 29:
Présentation de la thèse { } avec
Page 30 and 31:
Présentation de la thèse Bibliogr
Page 32 and 33:
Présentation de la thèse Torsten,
Page 35 and 36:
Chapitre 1 Segmentation du risque d
Page 37 and 38:
1.1. Modélisation CART Constructio
Page 39 and 40:
1.1. Modélisation CART nous entend
Page 41 and 42:
1.2. Segmentation par modèle logis
Page 43 and 44:
1.2. Segmentation par modèle logis
Page 45 and 46:
1.3. Illustration : application sur
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
1.4. Conclusion Enfin cette analyse
Page 55 and 56:
BIBLIOGRAPHIE Ruiz-Gazen, A. and Vi
Page 57 and 58:
Chapitre 2 Crises de corrélation d
Page 59 and 60:
2.1. Problème de la régression lo
Page 61 and 62:
2.2. Impact de crises de corrélati
Page 63 and 64:
Page 65 and 66:
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
2.3. Application sur un portefeuill
Page 73 and 74:
2.3. Application sur un portefeuill
Page 75 and 76:
2.4. Ecart entre hypothéses standa
Page 77 and 78:
2.5. Conclusion encore considérer
Page 79:
Deuxième partie Vers la création
Page 82 and 83:
Chapitre 3. Mélange de régression
Page 84 and 85:
Page 86 and 87:
Page 88 and 89:
Page 90 and 91:
Page 92 and 93:
Page 94 and 95:
Page 96 and 97:
Page 98 and 99:
Page 100 and 101:
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
Page 114 and 115:
Page 116 and 117: Chapitre 4. Sélection de mélange
Page 189 and 190: Conclusion et perspectives Cette é
Page 191 and 192: BIBLIOGRAPHIE Bibliographie Akaike,
Page 193 and 194: BIBLIOGRAPHIE Doob, J. (1934), ‘P
Page 195 and 196: BIBLIOGRAPHIE Loisel, S. (2008),
Page 197 and 198: BIBLIOGRAPHIE Schlattmann, P. (2003
Page 199 and 200: Annexe A Articles de presse Figure
Page 201 and 202: Annexe B Méthodes de segmentation
Page 203 and 204: B.1.3 Plus loin dans la théorie de
Page 205 and 206: B.1. Méthode CART Pénalisation de
Page 207 and 208: B.2. La régression logistique Algo
Page 209 and 210: B.2. La régression logistique et e
Page 211 and 212: Annexe C Résultats des mélanges d
Page 213 and 214: C.2. Famille de produits Ahorro Fig
Page 215 and 216: C.2. Famille de produits Ahorro C.2
Page 217 and 218:
C.3. Famille de produits Unit-Link
Page 219 and 220:
C.3. Famille de produits Unit-Link
Page 221 and 222:
C.4. Famille de produits Index-Link
Page 223 and 224:
C.4. Famille de produits Index-Link
Page 225 and 226:
C.5. Famille de produits Universal
Page 227 and 228:
C.5. Famille de produits Universal
Page 229 and 230:
C.6. Famille de produits Pure Savin
Page 231 and 232:
C.6. Famille de produits Pure Savin
Page 233 and 234:
C.7. Famille de produits “Structu
Page 235 and 236:
C.7. Famille de produits “Structu
Page 237 and 238:
Annexe D Espace des paramètres des
Page 239 and 240:
D.1. Mélange de régressions liné
Page 241 and 242:
D.3 Mélange de régressions logist
Page 243 and 244:
Calcul de la limite : lim log L cc(
Page 245 and 246:
D.5. Mélange d’Inverses Gaussien
Page 247 and 248:
Annexe E Outil informatique - RExce
Page 249 and 250:
Figure E.2 - Exemple d’interface
Page 251 and 252:
Figure E.4 - Génération des résu
Page 253 and 254:
Figure E.6 - Exposition des résult
show all

Mélanges de GLMs et nombre de composantes : application ... - Scor

Create successful ePaper yourself

Delete template?

Save as template?