You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
ζ ′= (η 1 , ..., η m ; β 1 , ..., β p ; θ) la matrice Ω est nul<strong>le</strong> pour <strong>le</strong>s indices correspondant auxparamètres (β 1 , ..., β p ; θ).3.3.1 Validation croiséeNous présentons ici brièvement la méthode par validation croisée qui permet d’estimerun paramètre de lissage sans faire intervenir des variab<strong>le</strong>s explicatives.La méthode par validation croisée est fréquemment mise en œuvre pour estimer unparamètre de lissage [85, 72]. Supposons que pour une va<strong>le</strong>ur donnée du paramètre delissage κ, il soit possib<strong>le</strong> d’obtenir un estimateur de la fonction inconnue ˆλ(κ). Le principede la validation croisée est de mesurer comment <strong>le</strong> modè<strong>le</strong> ajusté sur toutes <strong>le</strong>s observationsexceptée la j ième peut prédire l’observation j. Ainsi, une donnée est retirée de l’échantilloninitial, la fonction d’intérêt est alors estimée sur <strong>le</strong> reste de l’échantillon et la vraisemblancede cette observation est calculée à partir de la fonction estimée, et ceci pour chaqueobservation. Le paramètre de lissage est choisi en optimisant la prédiction des donnéespar cette méthode. Cela revient à maximiser la fonction de score suivante :CV (κ) = 1 n∑n ihj=1l j (ˆη −j (κ))où ˆη −j (κ) est l’estimateur du maximum de vraisemblance pénalisée de η pour l’échantillonprivé du j ième individu et l j (.) est la log-vraisemblance pour <strong>le</strong> sujet j.Le temps de calcul nécessaire est très important dans cette méthode puisqu’il faut estimerune fonction pour chaque observation retirée et pour chaque va<strong>le</strong>ur de κ. Nous utilisonsdonc une approximation de la fonction CV (κ). El<strong>le</strong> est basée sur un développementdu premier ordre de l j (ˆη −j (κ)) autour de l j (ˆη(κ)) puisque l j (ˆη −j (κ)) est proche de l j (ˆη(κ)).Ceci conduit à une expression de la forme :où I(η) = ECV (κ) = 1 n l j(ˆη(κ)) − 1 n trace ( [Î(ˆη) + 2κΩ] −1Î(ˆη))( )− ∂2 l(η)∂η 2(3.4)est la matrice d’information (Î(ˆη) = − ∂2 l(ˆη)), et H(η) = I(η)+2κΩ∂η 2est moins <strong>le</strong> hessien de la log-vraisemblance pénalisée (Ĥ(ˆη) = Î(ˆη) + 2κΩ).On peut remarquer(que cette approximation (3.4) est éga<strong>le</strong> à un critère d’Akaike [3]] )−1si on interprète trace[Î(ˆη) + 2κΩ Î(ˆη) comme <strong>le</strong> nombre de degrés de liberté du