10.07.2015 Views

Télécharger le texte intégral

Télécharger le texte intégral

Télécharger le texte intégral

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ζ ′= (η 1 , ..., η m ; β 1 , ..., β p ; θ) la matrice Ω est nul<strong>le</strong> pour <strong>le</strong>s indices correspondant auxparamètres (β 1 , ..., β p ; θ).3.3.1 Validation croiséeNous présentons ici brièvement la méthode par validation croisée qui permet d’estimerun paramètre de lissage sans faire intervenir des variab<strong>le</strong>s explicatives.La méthode par validation croisée est fréquemment mise en œuvre pour estimer unparamètre de lissage [85, 72]. Supposons que pour une va<strong>le</strong>ur donnée du paramètre delissage κ, il soit possib<strong>le</strong> d’obtenir un estimateur de la fonction inconnue ˆλ(κ). Le principede la validation croisée est de mesurer comment <strong>le</strong> modè<strong>le</strong> ajusté sur toutes <strong>le</strong>s observationsexceptée la j ième peut prédire l’observation j. Ainsi, une donnée est retirée de l’échantilloninitial, la fonction d’intérêt est alors estimée sur <strong>le</strong> reste de l’échantillon et la vraisemblancede cette observation est calculée à partir de la fonction estimée, et ceci pour chaqueobservation. Le paramètre de lissage est choisi en optimisant la prédiction des donnéespar cette méthode. Cela revient à maximiser la fonction de score suivante :CV (κ) = 1 n∑n ihj=1l j (ˆη −j (κ))où ˆη −j (κ) est l’estimateur du maximum de vraisemblance pénalisée de η pour l’échantillonprivé du j ième individu et l j (.) est la log-vraisemblance pour <strong>le</strong> sujet j.Le temps de calcul nécessaire est très important dans cette méthode puisqu’il faut estimerune fonction pour chaque observation retirée et pour chaque va<strong>le</strong>ur de κ. Nous utilisonsdonc une approximation de la fonction CV (κ). El<strong>le</strong> est basée sur un développementdu premier ordre de l j (ˆη −j (κ)) autour de l j (ˆη(κ)) puisque l j (ˆη −j (κ)) est proche de l j (ˆη(κ)).Ceci conduit à une expression de la forme :où I(η) = ECV (κ) = 1 n l j(ˆη(κ)) − 1 n trace ( [Î(ˆη) + 2κΩ] −1Î(ˆη))( )− ∂2 l(η)∂η 2(3.4)est la matrice d’information (Î(ˆη) = − ∂2 l(ˆη)), et H(η) = I(η)+2κΩ∂η 2est moins <strong>le</strong> hessien de la log-vraisemblance pénalisée (Ĥ(ˆη) = Î(ˆη) + 2κΩ).On peut remarquer(que cette approximation (3.4) est éga<strong>le</strong> à un critère d’Akaike [3]] )−1si on interprète trace[Î(ˆη) + 2κΩ Î(ˆη) comme <strong>le</strong> nombre de degrés de liberté du

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!