08.08.2013 Views

Un test simple pour le parametre de forme d'une Pareto generalisee ...

Un test simple pour le parametre de forme d'une Pareto generalisee ...

Un test simple pour le parametre de forme d'une Pareto generalisee ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Un</strong> <strong>test</strong> <strong>simp<strong>le</strong></strong> <strong>pour</strong> <strong>le</strong> paramètre <strong>de</strong> <strong>forme</strong> d’une<br />

loi <strong>de</strong> <strong>Pareto</strong> généralisée<br />

Ali Chaouche & Jean-Noël Bacro<br />

ENGREF/GRESE 19, Avenue du Maine 75732 Paris ce<strong>de</strong>x 15<br />

&<br />

<strong>Un</strong>iversité Montpellier II , I3M, UMR CNRS 5149, CC51, Place Eugène Bataillon<br />

34095 Montpellier ce<strong>de</strong>x 5<br />

Résumé<br />

L’estimation par maximum <strong>de</strong> vraisemblance <strong>de</strong>s paramètres <strong>de</strong> <strong>forme</strong> et d’échel<strong>le</strong>, respectivement<br />

ξ et β, d’une distribution <strong>de</strong> <strong>Pareto</strong> généralisée conduit à un système d’équations<br />

n’admettant pas <strong>de</strong> solutions explicites. Ce système peut être résumé sous la <strong>forme</strong> d’une<br />

<strong>simp<strong>le</strong></strong> équation hx(ρ) = 0 où x désigne un n-échantillon <strong>de</strong> réalisations et ρ = ξ<br />

. L’étu<strong>de</strong><br />

β<br />

<strong>de</strong> la fonction hx(ρ) au voisinage <strong>de</strong> 0 permet <strong>de</strong> mettre en évi<strong>de</strong>nce une statistique S(x)<br />

indépendante <strong>de</strong> β. Cette statistique, fondée sur <strong>le</strong>s <strong>de</strong>ux premiers moments empiriques,<br />

peut alors être utilisée <strong>pour</strong> construire un <strong>test</strong> statistique <strong>simp<strong>le</strong></strong> <strong>pour</strong> ξ. La loi asymptotique<br />

<strong>de</strong> S(x) est caractérisée. Le <strong>test</strong> obtenu est <strong>de</strong> même puissance que <strong>le</strong>s approches<br />

concurrentes <strong>de</strong> la littérature, <strong>le</strong>squel<strong>le</strong>s sont plus diffici<strong>le</strong>s à mettre en oeuvre en pratique.<br />

Abstract<br />

The maximum likelihood system of equations for the shape and sca<strong>le</strong> parameters ξ and<br />

β of a generalized <strong>Pareto</strong> distribution is summarized through a sing<strong>le</strong> equation hx(ρ) = 0<br />

where x <strong>de</strong>signates the n-samp<strong>le</strong> of realizations and ρ = ξ<br />

. The study of the function<br />

β<br />

hx(ρ) in the neighborhood of 0 puts forward a <strong>simp<strong>le</strong></strong> statistic S(x) only based on the<br />

first two empirical moments which is in<strong>de</strong>pen<strong>de</strong>nt from β. This statistic allows to build<br />

an immediate and easy to use statistical <strong>test</strong> for ξ. The power of this <strong>test</strong> appears as<br />

quite similar to the one of already known <strong>test</strong> procedures which are much more difficult<br />

to use in practice.<br />

Mots clés : Distribution <strong>de</strong> <strong>Pareto</strong> généralisée ; maximum <strong>de</strong> vraisemblance ; <strong>test</strong> <strong>pour</strong> <strong>le</strong><br />

domaine d’attraction du maximum.<br />

1 Introduction<br />

La distribution <strong>de</strong> <strong>Pareto</strong> généralisée (DPG) a été introduite par Pickands (1975) et<br />

Balkema et <strong>de</strong> Haan (1974) comme distribution limite <strong>de</strong>s dépassements normalisés d’un<br />

1


seuil é<strong>le</strong>vé et est <strong>de</strong>venue une notion centra<strong>le</strong> en va<strong>le</strong>urs extrêmes (Davidson et Smith<br />

(1990)). La fonction <strong>de</strong> répartition d’une DPG, Gξ,β, est donnée par :<br />

⎧<br />

⎪⎨ 1 − (1 +<br />

Gξ,β(x) =<br />

⎪⎩<br />

ξ<br />

β x)−1/ξ ξ = 0,<br />

1 − exp(− x<br />

(1)<br />

) ξ = 0,<br />

β<br />

où β > 0 et x tel que 0 < x < ∞ si ξ ≥ 0, 0 < x < −β /ξ si ξ < 0. Le cas ξ = 0<br />

correspond au cas limite ξ −→ 0. Les paramètres ξ et β représentent respectivement <strong>le</strong>s<br />

paramètres <strong>de</strong> <strong>forme</strong> et d’échel<strong>le</strong> <strong>de</strong> la DPG.<br />

En pratique, <strong>le</strong>s paramètres ξ et β doivent être estimés sur la base d’un échantillon<br />

d’observations. Les approches <strong>le</strong>s plus utilisées sont <strong>le</strong> maximum <strong>de</strong> vraisemblance, la<br />

métho<strong>de</strong> <strong>de</strong>s moments ou encore la métho<strong>de</strong> <strong>de</strong>s moments pondérés. L’approche par<br />

maximun <strong>de</strong> vraisemblance apparaît comme la plus performante uniquement <strong>pour</strong> <strong>de</strong><br />

grands échantillons (Hosking et Wallis (1986)). Les équations du maximum <strong>de</strong> vraisemblance<br />

n’admettent pas <strong>de</strong> solutions explicites et <strong>le</strong>urs résolutions nécessitent l’utilisation<br />

d’algorithmes d’optimisation. En pratique, une utilisation en aveug<strong>le</strong> <strong>de</strong> ces algorithmes<br />

peut être dangeureuse : la vraisemblance <strong>de</strong> la DPG peut en effet présenter plusieurs<br />

maxima ou <strong>de</strong>s singularités sources <strong>de</strong> sérieux problèmes <strong>pour</strong> <strong>le</strong>s approches numériques<br />

automatiques.<br />

Dans la section 2, nous mettons en évi<strong>de</strong>nce une fonction particulière <strong>de</strong> ξ<br />

β<br />

dont <strong>le</strong>s racines<br />

permettent d’atteindre <strong>le</strong>s solutions du système d’équations du maximum <strong>de</strong> vraisemblance.<br />

L’étu<strong>de</strong> <strong>de</strong> cette fonction permet alors, entre autres, <strong>de</strong> construire un <strong>test</strong> sur ξ.<br />

Le <strong>test</strong> est présenté en section 3.<br />

Dans la suite, on note x = (x1, ..., xn) un n-échantillon <strong>de</strong> réalisations d’une v.a. X <strong>de</strong> loi<br />

Gξ,β, µk = +∞<br />

0<br />

XkdGξ,β(X), k entier > 0, <strong>le</strong> moment d’ordre k <strong>de</strong> X et mk(x) = 1<br />

k entier > 0, son moment emprique d’ordre k.<br />

2 La fonction hx(·)<br />

Soit gξ,β(·) la fonction <strong>de</strong> <strong>de</strong>nsité associée à la DPG. La log-vraisemblance fonction sachant<br />

x, L(ξ, β ; x) ≡ L, est alors donnée par :<br />

<br />

n <br />

<br />

L = −n ln β + ln<br />

<br />

. (2)<br />

i=1<br />

2<br />

(1 + ξ xi 1<br />

)− ξ<br />

β −1<br />

n<br />

n<br />

i=1<br />

x k i ,


Le système <strong>de</strong>s équations du maximum <strong>de</strong> vraisemblance sécrit :<br />

⎧<br />

⎪⎨<br />

n<br />

<br />

1<br />

ln 1 + ξ<br />

n<br />

i=1<br />

⎪⎩<br />

xi<br />

<br />

β<br />

= ξ<br />

n 1 1<br />

n<br />

i=1 1 + ξ xi<br />

β<br />

=<br />

1<br />

1 + ξ<br />

ou, <strong>de</strong> façon équiva<strong>le</strong>nte,<br />

⎧ <br />

⎪⎨ ξ = ln<br />

<br />

⎪⎩ 1 + ln<br />

où mG (x) =<br />

harmonique.<br />

n<br />

i=1<br />

xi<br />

1<br />

n<br />

mG<br />

mG<br />

<br />

1 + ξ<br />

β x<br />

<br />

<br />

1 + ξ<br />

β x<br />

<br />

− mH<br />

<br />

1 + ξ<br />

β x<br />

<br />

= 0<br />

désigne la moyenne géométrique et mH (x) = n<br />

n<br />

Soit ρ = ξ<br />

β ; on considère la fonction hx(ρ) définie par :<br />

1<br />

xi<br />

i=1<br />

(3)<br />

(4)<br />

la moyenne<br />

hx(ρ) = 1 + ln (mG (1 + ρx)) − mH (1 + ρx) (5)<br />

Les estimations <strong>de</strong> ξ et β peuvent être déduites <strong>de</strong>s racines <strong>de</strong> hx(ρ). La va<strong>le</strong>ur 0 est<br />

racine évi<strong>de</strong>nte. L’approche classique <strong>pour</strong> déterminer d’éventuel<strong>le</strong>s autres racines est <strong>de</strong><br />

1<br />

caractériser <strong>le</strong>s variations <strong>de</strong> hx(ρ). Si l’on pose yi = , y = (y1, · · · , yn), var (y) =<br />

1 + ρxi<br />

m2 (y) − (m1 (y)) 2 , on obtient<br />

d<br />

dρ hx(ρ) =<br />

1<br />

ρm1 (y) 2<br />

var (y) − m1 (y) (1 − m1 (y)) 2<br />

mais la résolution <strong>de</strong> l’équation var (y)−m1 (y) (1 − m1 (y)) 2 = 0 est très diffici<strong>le</strong> et nous<br />

oblige à une approche alternative : <strong>le</strong> comportement <strong>de</strong> hx(ρ) est caractérisé au travers<br />

d’une étu<strong>de</strong> combinant résultats analytiques et <strong>de</strong> simulations. Cette approche permet,<br />

au final, <strong>de</strong> proposer une procédure fiab<strong>le</strong> <strong>de</strong> recherche <strong>de</strong>s solutions du maximum <strong>de</strong><br />

vraisemblance. Parmi <strong>le</strong>s retombées <strong>de</strong> cette étu<strong>de</strong>, un <strong>test</strong> <strong>simp<strong>le</strong></strong> <strong>pour</strong> ξ peut être mis<br />

en évi<strong>de</strong>nce, <strong>le</strong>quel est détaillé dans la section suivante.<br />

3<br />

(6)


3 Test <strong>pour</strong> ξ<br />

Au voisinage <strong>de</strong> 0 la fonction hx(ρ) peut s’écrire :<br />

<br />

m2 (x)<br />

hx (ρ) =<br />

2 − m2 <br />

1 (x) ρ 2 <br />

+ 2<br />

m1 (x) m2 (x) − m3 (x)<br />

3<br />

<br />

ρ 3 + o(ρ 3 )<br />

Le coefficient m2 (x)<br />

2 − m2 <br />

µ2<br />

1 (x) est un estimateur <strong>de</strong><br />

2 − µ2 <br />

1 , paramètre nul dans <strong>le</strong> cas<br />

d’une loi exponentiel<strong>le</strong> (ξ = 0). Afin <strong>de</strong> travail<strong>le</strong>r avec une statistique indépendante <strong>de</strong><br />

β, on considère S(x) = m2 (x)<br />

2m2 µ2<br />

− 1, estimateur <strong>de</strong><br />

1 (x) 2µ 2 − 1 ≡<br />

1<br />

ξ<br />

1 <strong>pour</strong> ξ < . La loi<br />

2 1 − 2ξ<br />

asymptotique <strong>de</strong> S est donnée par <strong>le</strong> théorème suivant :<br />

Théorème<br />

Pour tout ξ < 1<br />

2<br />

<br />

√<br />

n S(x) −<br />

, on a :<br />

<br />

1 − ξ D<br />

−→ N 0,<br />

1 − 2ξ<br />

(1 − ξ) 2 (1 − ξ + 6ξ2 )<br />

(1 − 2ξ) 3 <br />

(1 − 3ξ)(1 − 4ξ)<br />

où N (0, σ 2 ) désigne la loi norma<strong>le</strong> centrée <strong>de</strong> variance σ 2 .<br />

quand n → ∞,<br />

<strong>Un</strong> <strong>test</strong> statistique <strong>pour</strong> ξ peut donc être construit à partir <strong>de</strong> la statistique S. L’hypothèse<br />

nul<strong>le</strong> peut concerner n’importe quel<strong>le</strong> va<strong>le</strong>ur <strong>de</strong> ξ, mais <strong>le</strong> <strong>test</strong> <strong>de</strong> ξ = 0 contre ξ = 0<br />

est <strong>le</strong> plus utilisé en pratique. La figure 1 présente la courbe <strong>de</strong> puissance empirique<br />

d’un tel <strong>test</strong>. Les courbes obtenues sont similaires à cel<strong>le</strong>s obtenues avec <strong>de</strong>s approches<br />

concurrentes (Chaouche et Bacro (2004)) mais <strong>le</strong> <strong>test</strong> fondé sur S à l’avantage d’être bien<br />

plus <strong>simp<strong>le</strong></strong> à mettre en oeuvre en pratique.<br />

Bibliographie<br />

Balkema, A.A. et <strong>de</strong> Haan, L. (1974). Residual lifetime at great age. Ann. Probab., 2,<br />

792-804.<br />

Chaouche, A. et Bacro, J.N. (2004). A statistical <strong>test</strong> procedure for the shape parameter<br />

of a generalized <strong>Pareto</strong> distribution. Comp. Stat. and Data Anal., 45, 787-803.<br />

Davison, A.C. et Smith, R.L. (1990). Mo<strong>de</strong>ls for exceedances over high thresholds. J.R.<br />

Statist. Soc. B, 52-3, 393-442.<br />

Hosking, J.R.M. et Wallis, J.R. (1987). Parameter and quanti<strong>le</strong> estimation for the generalized<br />

<strong>Pareto</strong> distribution. Technometrics, 29, 339-349.<br />

Pickands, J. (1975). Statistical inference using extreme or<strong>de</strong>r statistics, Ann. Stat., 3,<br />

119-131.<br />

4

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!