Filtres particulaires en grande dimension : introduction - Lamfa
Filtres particulaires en grande dimension : introduction - Lamfa
Filtres particulaires en grande dimension : introduction - Lamfa
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Filtres</strong> <strong>particulaires</strong> <strong>en</strong> <strong>grande</strong> dim<strong>en</strong>sion : <strong>introduction</strong><br />
Marc Bocquet<br />
(bocquet@cerea.<strong>en</strong>pc.fr)<br />
CEREA, École des Ponts ParisTech / EDF R&D<br />
Université Paris-Est et INRIA<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 1 / 19
Filtre <strong>particulaires</strong> : le principe<br />
Filtre particulaire :une approche naturelle<br />
On cherche à réaliser le programme ultime de l’assimilation de données :<br />
représ<strong>en</strong>tation de l’état du système par sa pdf complète p(x) et<br />
assimiler les données par application de la règle de Bayes<br />
p(x|y) = p(y|x)p(x)<br />
. (1)<br />
p(y)<br />
Étant donné la taille des systèmes <strong>en</strong> jeu, la discrétisation de la pdf est<br />
impossible.<br />
−→ <strong>en</strong> théorie l’approche Monte Carlo, avec M particules, est la seule possible.<br />
On veut, à la limite asymptotique M → ∞, retrouver l’infér<strong>en</strong>ce bayési<strong>en</strong>ne<br />
exacte.<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 2 / 19
Le filtre bootstrap<br />
Filtre <strong>particulaires</strong> : le principe<br />
C’est simple !<br />
Ensemble de particules : x1 k ,x2 k ,...,xM <br />
k au temps tk·<br />
Échantillonnage de la pdf du système :<br />
Analyse par application directe de Eq.(1) :<br />
Propagation :<br />
C’est beau !<br />
M<br />
pk(xk) ≃ ∑ ω<br />
i=1<br />
i k−1δ(xk −x i k ). (2)<br />
ω i k ∝ ωi k−1 p(yk|x i k ). (3)<br />
x i k+1 = Mk+1(x i k )+w k+1 (ou +w i k+1 ). (4)<br />
Aucune inversion de matrice n’est nécessaire (= EnKF),<br />
Trivialem<strong>en</strong>t parallélisable (≃ EnKF),<br />
Les particules sont des solutions pures du modèle (= EnKF).<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 3 / 19
Le filtre bootstrap<br />
Filtre <strong>particulaires</strong> : le principe<br />
Assez rapidem<strong>en</strong>t, l’échantillon s’appauvrit. Il est nécessaire de ré-échantillonner<br />
l’<strong>en</strong>semble à partir des poids de chacun des membres.<br />
Ré-échantillonnage probabiliste [Metropolis et Ulam, 1944; Gordon, 1993]<br />
On utilise directem<strong>en</strong>t les poids ωi k , i = 1,...,M, comme probabilités<br />
d’occurr<strong>en</strong>ce des particules.<br />
−→ échantillonnage classique.<br />
−→ introduit un bruit statistique d’échantillonnage.<br />
Ré-échantillonnage résiduel [Lui et Ch<strong>en</strong>, 1998]<br />
Si la taille de l’<strong>en</strong>semble est M, on réalise E[M ωi k ] copies de la particule i.<br />
Il reste un résidu de M ωi k − E[M ωi k ] pour chacune des particules.<br />
On tire le reste des particules à concurr<strong>en</strong>ce de M particules selon cette<br />
distribution résiduelle.<br />
−→ Amélioration significative de la performance du filtre bootstrap, mais pas<br />
fondam<strong>en</strong>tale.<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 4 / 19
Le filtre bootstrap<br />
Filtre <strong>particulaires</strong> : le principe<br />
+<br />
re−échantillonnage<br />
observation<br />
+<br />
k<br />
p −<br />
k+1<br />
p +<br />
k+1<br />
−<br />
k+2<br />
p p<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 5 / 19
Exemples de filtrage particulaire<br />
Des exemples <strong>en</strong> géophysique<br />
Auteurs modèle nbre de var. taille de l’<strong>en</strong>s.<br />
Zhou et al., 2006 surface contin<strong>en</strong>tale 684 800<br />
Kivman, 2003 Lor<strong>en</strong>z 63 3 250 −1000<br />
Losa et al., 2003 écosystème 24 1000<br />
van Leeuw<strong>en</strong>, 2003 KdV 100 250<br />
van Leeuw<strong>en</strong>, 2003 QG d’océan 2 ×10 5 512<br />
Nakano et al., 2007 Lor<strong>en</strong>z 95 40 ≥ 10 6<br />
Bocquet, 2008 Lor<strong>en</strong>z 95 10 10 4<br />
Si ! ça marche, parfois...<br />
−→ Les performances dép<strong>en</strong>d<strong>en</strong>t beaucoup du modèle (de la dynamique).<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 6 / 19
Exemples de filtrage particulaire<br />
Exemple sur un modèle jouet chaotique<br />
Modèle de Lor<strong>en</strong>z 95<br />
dxn<br />
dt = −xn−2xn−1 +xn−1xn+1 −xn +F (5)<br />
Paramètres originaux : n = 1,...,40, F = 8 [Lor<strong>en</strong>z et Emmanuel, 1998].<br />
Dynamique très chaotique représ<strong>en</strong>tatif d’une bande zonale d’atmosphère.<br />
Système conservatif sauf forçage F et dissipation −xn.<br />
Choix pour les exemples<br />
∆ = 0.05 (6 heures temps réel).<br />
Écart-type des obs. σ = 1.5.<br />
1 site observé sur 2.<br />
EnKF : matrice de covariance des erreurs d’obs. diagonale d’écart-type χ = 1.5.<br />
EnKF : localisation (longueur de corrélation c = 10).<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 7 / 19
Exemples de filtrage particulaire<br />
Exemple Lor<strong>en</strong>z 95, 10 variables<br />
Analysis rms error<br />
3.2<br />
1.6<br />
0.8<br />
0.4<br />
Bootstrap particle filter<br />
Ensemble Kalman filter<br />
0.8<br />
0.7<br />
0.6<br />
0.5<br />
0.4<br />
0.3<br />
0.2<br />
0.1<br />
0<br />
Bootstrap PF noise<br />
EnKF noise<br />
10 100 1000 10000 1e+05<br />
10 100 1000 10000 1e+05<br />
Number of particles<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 8 / 19
Dégénéresc<strong>en</strong>ce du filtre particulaire<br />
Dégénéresc<strong>en</strong>ce du filtre particulaire<br />
Très rapidem<strong>en</strong>t, et <strong>en</strong> moy<strong>en</strong>ne, les poids du filtre t<strong>en</strong>d<strong>en</strong>t vers 0 à l’exception<br />
d’une particule ou de quelques particules de poids significatifs.<br />
Frequ<strong>en</strong>cy<br />
0.15<br />
0.1<br />
0.05<br />
N = 10<br />
N = 20<br />
N = 40<br />
N = 80<br />
0<br />
0 0.2 0.4 0.6 0.8 1<br />
Maximum of weights<br />
Poids maximum d’un filtre bootstrap appliqué à Lor<strong>en</strong>z 95 (très chaotique) pour<br />
quatre tailles de système : N = 10, 20, 40, et 80.<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 9 / 19
Dégénéresc<strong>en</strong>ce du filtre particulaire<br />
Dégénéresc<strong>en</strong>ce du filtre particulaire<br />
Diverg<strong>en</strong>ce du nombre de particules nécessaires<br />
[Snyder et al., 2008] ont étudié les statistiques du plus grand poids. Il ont démontré sur<br />
un modèle jouet que la taille requise de l’<strong>en</strong>semble se comporte comme<br />
M ∼ exp(τ 2 /2), (6)<br />
où τ est la variance de la log-vraisemblance des observations.<br />
−→ se comporte de façon expon<strong>en</strong>tielle avec les dim<strong>en</strong>sions de l’espace des états et de<br />
l’espace des observations.<br />
Malédiction !<br />
Ce comportem<strong>en</strong>t est lié au curse of dim<strong>en</strong>sionality [Bellman, 1961].<br />
Un symptôme typique est l’écrasem<strong>en</strong>t de l’hypersphère de rayon 1 dans l’hypercube<br />
[−1,1] N . En effet le volume se comporte comme<br />
πN/2 −→ 0. (7)<br />
N2 Γ +1<br />
−→ Dans une analyse <strong>en</strong> <strong>grande</strong> dim<strong>en</strong>sion, les a priori sur l’ébauche et sur les<br />
observations se chevauch<strong>en</strong>t de moins <strong>en</strong> moins !<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 10 / 19
Dégénéresc<strong>en</strong>ce du filtre particulaire<br />
Des filtres à particules sans la limite asymptotique<br />
Filtre avec ré-échantillonnage gaussi<strong>en</strong><br />
Ré-échantillonnage gaussi<strong>en</strong> complet (id<strong>en</strong>tification des premiers et seconds<br />
mom<strong>en</strong>ts) après chaque analyse [Xiong et al., 2006]<br />
Merging particle filter<br />
Ré-échantillonnage gaussi<strong>en</strong> (id<strong>en</strong>tification des premiers et seconds mom<strong>en</strong>ts)<br />
après chaque analyse à partir de quelques copies d’une même particule [Nakano<br />
et al., 2007].<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 11 / 19
Localisation<br />
Des pistes d’amélioration<br />
Localisation du Filtre de Kalman d’<strong>en</strong>semble<br />
Lissage des matrices de covariance par application d’un produit de Schur<br />
avec une fonction à courte portée [Houtekamer et Mitchell, 1998].<br />
Assimilation des observations locales [Ott et al., 2004].<br />
−→ dép<strong>en</strong>d du type de filtre de Kalman d’<strong>en</strong>semble (déterministe ou pas, etc.)<br />
−→ Les analyses locales se recoll<strong>en</strong>t naturellem<strong>en</strong>t.<br />
Localisation d’un filtre particulaire<br />
On peut facilem<strong>en</strong>t réaliser une analyse locale −→ poids locaux.<br />
−→ Mais comm<strong>en</strong>t recoller les morceaux ?<br />
−→ Quelques t<strong>en</strong>tatives [van Leeuw<strong>en</strong>, 2006].<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 12 / 19
Des pistes d’amélioration<br />
Sélection des particules par Metropolis-Hastings<br />
En général les particules échantillonn<strong>en</strong>t mal la pdf conditionnelle. On souhaite<br />
alors améliorer la distribution <strong>en</strong> appliquant une (ou des) itérations MCMC.<br />
−→ ajoute dans le filtre une étape MCMC.<br />
Exemple le plus simple qui utilise une sélection de type Metropolis-Hastings<br />
[Gilks et Berzuini, 1998] : pour i = 1,...,M :<br />
Tirage de ν dans [0,1]<br />
Échantillonnage de x⋆i k ∼ p(xk|xi k−1 ) (re-propagation de la particule)<br />
Si<br />
<br />
ν ≤ min 1, p(yk|x⋆i k )<br />
p(yk|ˆx i <br />
, (8)<br />
k)<br />
on accepte la nouvelle particule x ⋆i<br />
k , sinon on garde l’anci<strong>en</strong>ne ˆxi k.<br />
−→ n’est pas s<strong>en</strong>sible au fléau de la dim<strong>en</strong>sion !<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 13 / 19
Loi instrum<strong>en</strong>tale<br />
Loi d’importance (lissage)<br />
Des pistes d’amélioration<br />
On considère la trajectoire Xk = {x0,x1,x2,...,xk} conditionnelle à la collection<br />
d’observations Yk = {y 1,y 2,...,y k} jusqu’au temps tk. Alors<br />
pk(Xk|Yk) ≃<br />
M<br />
∑<br />
i=1<br />
ω i kδ(Xk −X i k) avec<br />
M<br />
∑<br />
i=1<br />
ω i k = 1. (9)<br />
On a la liberté de tirer les trajectoires d’une distribution connue qk (quelconque<br />
pourvu que son support conti<strong>en</strong>ne celle de pk). Mais les poids doiv<strong>en</strong>t être<br />
corrigés pour que la pdf soit toujours représ<strong>en</strong>tative de la pdf complète du<br />
système :<br />
ω i k ∝ pk(X i k|Yk)<br />
qk(X i . (10)<br />
k|Yk)<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 14 / 19
Loi instrum<strong>en</strong>tale<br />
Loi d’importance (filtrage)<br />
Des pistes d’amélioration<br />
Avec une dynamique markovi<strong>en</strong>ne, et dép<strong>en</strong>dance conditionnelle des observations sur<br />
l’état actuel du système seulem<strong>en</strong>t, on factorise p k(X k|Y k) selon<br />
p k(X k|Y k) ∝ p k(y k|x k)p k(x k|x k−1)p k−1(X k−1|Y k−1). (11)<br />
Si on suppose de plus que la loi instrum<strong>en</strong>tale est une loi de filtrage :<br />
Loi de mise à jour des poids :<br />
q k(X k|Y k) = q k(x k|X k−1,Y k)q k−1(X k−1|Y k−1). (12)<br />
ω i k ∝ ωi pk(yk|x k−1<br />
i k )pk(xi k |xi k−1 )<br />
qk(xi k |Xik−1 ,Yk) et<br />
M<br />
∑<br />
i=1<br />
ω i k = 1, (13)<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 15 / 19
Loi instrum<strong>en</strong>tale<br />
Application au filtre bootstrap<br />
Des pistes d’amélioration<br />
La loi candidate est dans ce cas l’opérateur de transition du modèle.<br />
Si<br />
qk(xk|Xk−1,Yk) ≡ pk(xk|xk−1), (14)<br />
alors on retrouve le filtre bootstrap [Gordon et al., 1993], puisque<br />
ω i k ∝ ω i k−1pk(y k|x i k). (15)<br />
−→ Malheureusem<strong>en</strong>t, les lois instrum<strong>en</strong>tales, n’écarte pas le le fléau de la<br />
dim<strong>en</strong>sion.<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 16 / 19
Des pistes d’amélioration<br />
Particules guidées par des filtres gaussi<strong>en</strong>s<br />
[van Merwe et al, 2000] ont construit un filtre particulaire avec une fonction<br />
d’importance constituées de plusieurs filtres de Kalman.<br />
−→ Contrairem<strong>en</strong>t au filtre bootstrap, seules les particules avec une<br />
vraisemblance significative seront échantillonnées.<br />
Si xk et Pk représ<strong>en</strong>t<strong>en</strong>t l’analyse d’un filtre gaussi<strong>en</strong> (EKF, UKF, EnKF, ETKF,<br />
etc.), alors<br />
qk(xk|Yk) ≡ n(xk −xk,Pk), (16)<br />
avec n(xk −xk,Pk) ∝ exp − 1<br />
2 (xk −xk) T (Pk) −1 (xk −xk) la pdf de N (xk,Pk),<br />
le filtre gaussi<strong>en</strong> de moy<strong>en</strong>ne xk et de matrice de covariance Pk.<br />
−→ L’idée est d’attacher un filtre gaussi<strong>en</strong> à chaque particule.<br />
−→ Malheureusemet pas adapté aux systèmes de <strong>grande</strong> dim<strong>en</strong>sion.<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 17 / 19
Des pistes d’amélioration<br />
Filtre particulaire guidé par le filtre EnKF (ou autres)<br />
Loi d’importance :<br />
avec<br />
qk(xk|xk−1,y k) ∼ N (Mk(xk−1)+Kk (y k −HkMk(xk−1)),Σk) , (17)<br />
Kk = P f kH T k HkP f kH T −1 k +Rk<br />
(18)<br />
Σk = KkRkK T k +(I −KkHk)Qk(I −KkHk) T . (19)<br />
Approximation implicite dans l’utilisation de P f k dans Kk, car le gain utilise<br />
toutes les particules.<br />
[Papadakis, 2007] propose d’utiliser un EnKF pour guider le filtre. Après<br />
l’analyse, les poids sont mis à jour <strong>en</strong> utilisant Eq.(17). Mise à jour des poids<br />
après la propagation (∑ M i=1 ωi k = 1) :<br />
M<br />
xk+1 = ∑ ω<br />
i=1<br />
i kxik+1 et P f k+1 =<br />
1<br />
1 − ∑ M i=1 (ωi k )2<br />
M<br />
∑ ω<br />
i=1<br />
i k<br />
<br />
x i k+1 −x <br />
k+1 x i k+1 −x T k+1 .<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 18 / 19<br />
(20)
Conclusions<br />
Conclusions<br />
Le filtre particulaire fonctionne sur des cas particuliers géophysiques de<br />
dim<strong>en</strong>sion modérée.<br />
Ri<strong>en</strong> ne s’oppose à ce qu’il serve de filtre d’appoint pour un sous-système<br />
(ou sous-domaine) [Spiller et al., 2008].<br />
Fonctionne mal sur des systèmes très chaotiques.<br />
Solutions de long terme (?) :<br />
lois candidates de filtrage gaussi<strong>en</strong>,<br />
localisation,<br />
MCMC −→ prés<strong>en</strong>tation de Christophe Baehr.<br />
M. Bocquet Journée LEFE-ASSIM, Paris, 4 décembre 2009 19 / 19