01.07.2013 Views

Filtres particulaires en grande dimension : introduction - Lamfa

Filtres particulaires en grande dimension : introduction - Lamfa

Filtres particulaires en grande dimension : introduction - Lamfa

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Filtres</strong> <strong>particulaires</strong> <strong>en</strong> <strong>grande</strong> dim<strong>en</strong>sion : <strong>introduction</strong><br />

Marc Bocquet<br />

(bocquet@cerea.<strong>en</strong>pc.fr)<br />

CEREA, École des Ponts ParisTech / EDF R&D<br />

Université Paris-Est et INRIA<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 1 / 19


Filtre <strong>particulaires</strong> : le principe<br />

Filtre particulaire :une approche naturelle<br />

On cherche à réaliser le programme ultime de l’assimilation de données :<br />

représ<strong>en</strong>tation de l’état du système par sa pdf complète p(x) et<br />

assimiler les données par application de la règle de Bayes<br />

p(x|y) = p(y|x)p(x)<br />

. (1)<br />

p(y)<br />

Étant donné la taille des systèmes <strong>en</strong> jeu, la discrétisation de la pdf est<br />

impossible.<br />

−→ <strong>en</strong> théorie l’approche Monte Carlo, avec M particules, est la seule possible.<br />

On veut, à la limite asymptotique M → ∞, retrouver l’infér<strong>en</strong>ce bayési<strong>en</strong>ne<br />

exacte.<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 2 / 19


Le filtre bootstrap<br />

Filtre <strong>particulaires</strong> : le principe<br />

C’est simple !<br />

Ensemble de particules : x1 k ,x2 k ,...,xM <br />

k au temps tk·<br />

Échantillonnage de la pdf du système :<br />

Analyse par application directe de Eq.(1) :<br />

Propagation :<br />

C’est beau !<br />

M<br />

pk(xk) ≃ ∑ ω<br />

i=1<br />

i k−1δ(xk −x i k ). (2)<br />

ω i k ∝ ωi k−1 p(yk|x i k ). (3)<br />

x i k+1 = Mk+1(x i k )+w k+1 (ou +w i k+1 ). (4)<br />

Aucune inversion de matrice n’est nécessaire (= EnKF),<br />

Trivialem<strong>en</strong>t parallélisable (≃ EnKF),<br />

Les particules sont des solutions pures du modèle (= EnKF).<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 3 / 19


Le filtre bootstrap<br />

Filtre <strong>particulaires</strong> : le principe<br />

Assez rapidem<strong>en</strong>t, l’échantillon s’appauvrit. Il est nécessaire de ré-échantillonner<br />

l’<strong>en</strong>semble à partir des poids de chacun des membres.<br />

Ré-échantillonnage probabiliste [Metropolis et Ulam, 1944; Gordon, 1993]<br />

On utilise directem<strong>en</strong>t les poids ωi k , i = 1,...,M, comme probabilités<br />

d’occurr<strong>en</strong>ce des particules.<br />

−→ échantillonnage classique.<br />

−→ introduit un bruit statistique d’échantillonnage.<br />

Ré-échantillonnage résiduel [Lui et Ch<strong>en</strong>, 1998]<br />

Si la taille de l’<strong>en</strong>semble est M, on réalise E[M ωi k ] copies de la particule i.<br />

Il reste un résidu de M ωi k − E[M ωi k ] pour chacune des particules.<br />

On tire le reste des particules à concurr<strong>en</strong>ce de M particules selon cette<br />

distribution résiduelle.<br />

−→ Amélioration significative de la performance du filtre bootstrap, mais pas<br />

fondam<strong>en</strong>tale.<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 4 / 19


Le filtre bootstrap<br />

Filtre <strong>particulaires</strong> : le principe<br />

+<br />

re−échantillonnage<br />

observation<br />

+<br />

k<br />

p −<br />

k+1<br />

p +<br />

k+1<br />

−<br />

k+2<br />

p p<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 5 / 19


Exemples de filtrage particulaire<br />

Des exemples <strong>en</strong> géophysique<br />

Auteurs modèle nbre de var. taille de l’<strong>en</strong>s.<br />

Zhou et al., 2006 surface contin<strong>en</strong>tale 684 800<br />

Kivman, 2003 Lor<strong>en</strong>z 63 3 250 −1000<br />

Losa et al., 2003 écosystème 24 1000<br />

van Leeuw<strong>en</strong>, 2003 KdV 100 250<br />

van Leeuw<strong>en</strong>, 2003 QG d’océan 2 ×10 5 512<br />

Nakano et al., 2007 Lor<strong>en</strong>z 95 40 ≥ 10 6<br />

Bocquet, 2008 Lor<strong>en</strong>z 95 10 10 4<br />

Si ! ça marche, parfois...<br />

−→ Les performances dép<strong>en</strong>d<strong>en</strong>t beaucoup du modèle (de la dynamique).<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 6 / 19


Exemples de filtrage particulaire<br />

Exemple sur un modèle jouet chaotique<br />

Modèle de Lor<strong>en</strong>z 95<br />

dxn<br />

dt = −xn−2xn−1 +xn−1xn+1 −xn +F (5)<br />

Paramètres originaux : n = 1,...,40, F = 8 [Lor<strong>en</strong>z et Emmanuel, 1998].<br />

Dynamique très chaotique représ<strong>en</strong>tatif d’une bande zonale d’atmosphère.<br />

Système conservatif sauf forçage F et dissipation −xn.<br />

Choix pour les exemples<br />

∆ = 0.05 (6 heures temps réel).<br />

Écart-type des obs. σ = 1.5.<br />

1 site observé sur 2.<br />

EnKF : matrice de covariance des erreurs d’obs. diagonale d’écart-type χ = 1.5.<br />

EnKF : localisation (longueur de corrélation c = 10).<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 7 / 19


Exemples de filtrage particulaire<br />

Exemple Lor<strong>en</strong>z 95, 10 variables<br />

Analysis rms error<br />

3.2<br />

1.6<br />

0.8<br />

0.4<br />

Bootstrap particle filter<br />

Ensemble Kalman filter<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

Bootstrap PF noise<br />

EnKF noise<br />

10 100 1000 10000 1e+05<br />

10 100 1000 10000 1e+05<br />

Number of particles<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 8 / 19


Dégénéresc<strong>en</strong>ce du filtre particulaire<br />

Dégénéresc<strong>en</strong>ce du filtre particulaire<br />

Très rapidem<strong>en</strong>t, et <strong>en</strong> moy<strong>en</strong>ne, les poids du filtre t<strong>en</strong>d<strong>en</strong>t vers 0 à l’exception<br />

d’une particule ou de quelques particules de poids significatifs.<br />

Frequ<strong>en</strong>cy<br />

0.15<br />

0.1<br />

0.05<br />

N = 10<br />

N = 20<br />

N = 40<br />

N = 80<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

Maximum of weights<br />

Poids maximum d’un filtre bootstrap appliqué à Lor<strong>en</strong>z 95 (très chaotique) pour<br />

quatre tailles de système : N = 10, 20, 40, et 80.<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 9 / 19


Dégénéresc<strong>en</strong>ce du filtre particulaire<br />

Dégénéresc<strong>en</strong>ce du filtre particulaire<br />

Diverg<strong>en</strong>ce du nombre de particules nécessaires<br />

[Snyder et al., 2008] ont étudié les statistiques du plus grand poids. Il ont démontré sur<br />

un modèle jouet que la taille requise de l’<strong>en</strong>semble se comporte comme<br />

M ∼ exp(τ 2 /2), (6)<br />

où τ est la variance de la log-vraisemblance des observations.<br />

−→ se comporte de façon expon<strong>en</strong>tielle avec les dim<strong>en</strong>sions de l’espace des états et de<br />

l’espace des observations.<br />

Malédiction !<br />

Ce comportem<strong>en</strong>t est lié au curse of dim<strong>en</strong>sionality [Bellman, 1961].<br />

Un symptôme typique est l’écrasem<strong>en</strong>t de l’hypersphère de rayon 1 dans l’hypercube<br />

[−1,1] N . En effet le volume se comporte comme<br />

πN/2 −→ 0. (7)<br />

N2 Γ +1<br />

−→ Dans une analyse <strong>en</strong> <strong>grande</strong> dim<strong>en</strong>sion, les a priori sur l’ébauche et sur les<br />

observations se chevauch<strong>en</strong>t de moins <strong>en</strong> moins !<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 10 / 19


Dégénéresc<strong>en</strong>ce du filtre particulaire<br />

Des filtres à particules sans la limite asymptotique<br />

Filtre avec ré-échantillonnage gaussi<strong>en</strong><br />

Ré-échantillonnage gaussi<strong>en</strong> complet (id<strong>en</strong>tification des premiers et seconds<br />

mom<strong>en</strong>ts) après chaque analyse [Xiong et al., 2006]<br />

Merging particle filter<br />

Ré-échantillonnage gaussi<strong>en</strong> (id<strong>en</strong>tification des premiers et seconds mom<strong>en</strong>ts)<br />

après chaque analyse à partir de quelques copies d’une même particule [Nakano<br />

et al., 2007].<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 11 / 19


Localisation<br />

Des pistes d’amélioration<br />

Localisation du Filtre de Kalman d’<strong>en</strong>semble<br />

Lissage des matrices de covariance par application d’un produit de Schur<br />

avec une fonction à courte portée [Houtekamer et Mitchell, 1998].<br />

Assimilation des observations locales [Ott et al., 2004].<br />

−→ dép<strong>en</strong>d du type de filtre de Kalman d’<strong>en</strong>semble (déterministe ou pas, etc.)<br />

−→ Les analyses locales se recoll<strong>en</strong>t naturellem<strong>en</strong>t.<br />

Localisation d’un filtre particulaire<br />

On peut facilem<strong>en</strong>t réaliser une analyse locale −→ poids locaux.<br />

−→ Mais comm<strong>en</strong>t recoller les morceaux ?<br />

−→ Quelques t<strong>en</strong>tatives [van Leeuw<strong>en</strong>, 2006].<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 12 / 19


Des pistes d’amélioration<br />

Sélection des particules par Metropolis-Hastings<br />

En général les particules échantillonn<strong>en</strong>t mal la pdf conditionnelle. On souhaite<br />

alors améliorer la distribution <strong>en</strong> appliquant une (ou des) itérations MCMC.<br />

−→ ajoute dans le filtre une étape MCMC.<br />

Exemple le plus simple qui utilise une sélection de type Metropolis-Hastings<br />

[Gilks et Berzuini, 1998] : pour i = 1,...,M :<br />

Tirage de ν dans [0,1]<br />

Échantillonnage de x⋆i k ∼ p(xk|xi k−1 ) (re-propagation de la particule)<br />

Si<br />

<br />

ν ≤ min 1, p(yk|x⋆i k )<br />

p(yk|ˆx i <br />

, (8)<br />

k)<br />

on accepte la nouvelle particule x ⋆i<br />

k , sinon on garde l’anci<strong>en</strong>ne ˆxi k.<br />

−→ n’est pas s<strong>en</strong>sible au fléau de la dim<strong>en</strong>sion !<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 13 / 19


Loi instrum<strong>en</strong>tale<br />

Loi d’importance (lissage)<br />

Des pistes d’amélioration<br />

On considère la trajectoire Xk = {x0,x1,x2,...,xk} conditionnelle à la collection<br />

d’observations Yk = {y 1,y 2,...,y k} jusqu’au temps tk. Alors<br />

pk(Xk|Yk) ≃<br />

M<br />

∑<br />

i=1<br />

ω i kδ(Xk −X i k) avec<br />

M<br />

∑<br />

i=1<br />

ω i k = 1. (9)<br />

On a la liberté de tirer les trajectoires d’une distribution connue qk (quelconque<br />

pourvu que son support conti<strong>en</strong>ne celle de pk). Mais les poids doiv<strong>en</strong>t être<br />

corrigés pour que la pdf soit toujours représ<strong>en</strong>tative de la pdf complète du<br />

système :<br />

ω i k ∝ pk(X i k|Yk)<br />

qk(X i . (10)<br />

k|Yk)<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 14 / 19


Loi instrum<strong>en</strong>tale<br />

Loi d’importance (filtrage)<br />

Des pistes d’amélioration<br />

Avec une dynamique markovi<strong>en</strong>ne, et dép<strong>en</strong>dance conditionnelle des observations sur<br />

l’état actuel du système seulem<strong>en</strong>t, on factorise p k(X k|Y k) selon<br />

p k(X k|Y k) ∝ p k(y k|x k)p k(x k|x k−1)p k−1(X k−1|Y k−1). (11)<br />

Si on suppose de plus que la loi instrum<strong>en</strong>tale est une loi de filtrage :<br />

Loi de mise à jour des poids :<br />

q k(X k|Y k) = q k(x k|X k−1,Y k)q k−1(X k−1|Y k−1). (12)<br />

ω i k ∝ ωi pk(yk|x k−1<br />

i k )pk(xi k |xi k−1 )<br />

qk(xi k |Xik−1 ,Yk) et<br />

M<br />

∑<br />

i=1<br />

ω i k = 1, (13)<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 15 / 19


Loi instrum<strong>en</strong>tale<br />

Application au filtre bootstrap<br />

Des pistes d’amélioration<br />

La loi candidate est dans ce cas l’opérateur de transition du modèle.<br />

Si<br />

qk(xk|Xk−1,Yk) ≡ pk(xk|xk−1), (14)<br />

alors on retrouve le filtre bootstrap [Gordon et al., 1993], puisque<br />

ω i k ∝ ω i k−1pk(y k|x i k). (15)<br />

−→ Malheureusem<strong>en</strong>t, les lois instrum<strong>en</strong>tales, n’écarte pas le le fléau de la<br />

dim<strong>en</strong>sion.<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 16 / 19


Des pistes d’amélioration<br />

Particules guidées par des filtres gaussi<strong>en</strong>s<br />

[van Merwe et al, 2000] ont construit un filtre particulaire avec une fonction<br />

d’importance constituées de plusieurs filtres de Kalman.<br />

−→ Contrairem<strong>en</strong>t au filtre bootstrap, seules les particules avec une<br />

vraisemblance significative seront échantillonnées.<br />

Si xk et Pk représ<strong>en</strong>t<strong>en</strong>t l’analyse d’un filtre gaussi<strong>en</strong> (EKF, UKF, EnKF, ETKF,<br />

etc.), alors<br />

qk(xk|Yk) ≡ n(xk −xk,Pk), (16)<br />

avec n(xk −xk,Pk) ∝ exp − 1<br />

2 (xk −xk) T (Pk) −1 (xk −xk) la pdf de N (xk,Pk),<br />

le filtre gaussi<strong>en</strong> de moy<strong>en</strong>ne xk et de matrice de covariance Pk.<br />

−→ L’idée est d’attacher un filtre gaussi<strong>en</strong> à chaque particule.<br />

−→ Malheureusemet pas adapté aux systèmes de <strong>grande</strong> dim<strong>en</strong>sion.<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 17 / 19


Des pistes d’amélioration<br />

Filtre particulaire guidé par le filtre EnKF (ou autres)<br />

Loi d’importance :<br />

avec<br />

qk(xk|xk−1,y k) ∼ N (Mk(xk−1)+Kk (y k −HkMk(xk−1)),Σk) , (17)<br />

Kk = P f kH T k HkP f kH T −1 k +Rk<br />

(18)<br />

Σk = KkRkK T k +(I −KkHk)Qk(I −KkHk) T . (19)<br />

Approximation implicite dans l’utilisation de P f k dans Kk, car le gain utilise<br />

toutes les particules.<br />

[Papadakis, 2007] propose d’utiliser un EnKF pour guider le filtre. Après<br />

l’analyse, les poids sont mis à jour <strong>en</strong> utilisant Eq.(17). Mise à jour des poids<br />

après la propagation (∑ M i=1 ωi k = 1) :<br />

M<br />

xk+1 = ∑ ω<br />

i=1<br />

i kxik+1 et P f k+1 =<br />

1<br />

1 − ∑ M i=1 (ωi k )2<br />

M<br />

∑ ω<br />

i=1<br />

i k<br />

<br />

x i k+1 −x <br />

k+1 x i k+1 −x T k+1 .<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 18 / 19<br />

(20)


Conclusions<br />

Conclusions<br />

Le filtre particulaire fonctionne sur des cas particuliers géophysiques de<br />

dim<strong>en</strong>sion modérée.<br />

Ri<strong>en</strong> ne s’oppose à ce qu’il serve de filtre d’appoint pour un sous-système<br />

(ou sous-domaine) [Spiller et al., 2008].<br />

Fonctionne mal sur des systèmes très chaotiques.<br />

Solutions de long terme (?) :<br />

lois candidates de filtrage gaussi<strong>en</strong>,<br />

localisation,<br />

MCMC −→ prés<strong>en</strong>tation de Christophe Baehr.<br />

M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 19 / 19

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!