28.08.2014 Views

université de montréal développement de la méthode des ...

université de montréal développement de la méthode des ...

université de montréal développement de la méthode des ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

83<br />

4.7 Extension à un environnement parallèle à mémoire partagée<br />

Bien que l’aspect <strong>de</strong> parallélisation <strong>de</strong>s algorithmes n’ait pas été abordé en pratique<br />

dans ce travail <strong>de</strong> doctorat, on présente ici sous forme d’une extension possible<br />

du présent travail, <strong>la</strong> métho<strong>de</strong> ACA dans un environnement parallèle à mémoire<br />

distribuée.<br />

On considère ici une imp<strong>la</strong>ntation parallèle <strong>de</strong> <strong>la</strong> métho<strong>de</strong> <strong>de</strong>s caractéristiques telle<br />

que proposée dans [Dahmani & Roy, 2005]. Dans ce contexte, le tracking Υ + fait<br />

N<br />

⋃ p<br />

l’objet d’une partition Υ + = Υ + t et ∀t ∈ [1, N p ], ∀t ′ ∈ [1, N p ], Υ + ⋂<br />

t Υ<br />

+<br />

t<br />

= ∅<br />

′<br />

t=1<br />

si t ≠ t ′ où N p est le nombre <strong>de</strong> processus. Cette partition peut être, soit créée<br />

directement, soit résultée d’un partage entre les processus d’un fichier <strong>de</strong> tracking<br />

généré par le processus principal.<br />

Pour <strong>la</strong> simplicité <strong>de</strong> <strong>la</strong> présentation, on considèrera <strong>la</strong> diffusion isotrope dans cette<br />

partie <strong>de</strong> l’exposé sans perte <strong>de</strong> généralité. Dans ce cadre, le processus t à l’issue<br />

(<br />

<strong>de</strong> l’itération libre n aura calculé <strong>de</strong>s quantités <strong>de</strong> <strong>la</strong> forme Φ t i = S Υ+ t ⃗φ (n+ 1 2<br />

i<br />

) ( T))<br />

⃗ .<br />

Une communication collective bloquante <strong>de</strong> réduction (<strong>la</strong> somme) avec diffusion du<br />

résultat i.e. <strong>de</strong> type ≪All Reduce≫ permet alors d’obtenir le flux sca<strong>la</strong>ire sous <strong>la</strong><br />

N p<br />

N<br />

forme Φ ⃗ ∑<br />

(n+1 2 ) = ⃗Φ (n+1 2 )<br />

t ( T) ⃗ ∑ p<br />

en utilisant le fait que Si Υ = S Υ+ t<br />

i .<br />

t=1<br />

Étant donnée <strong>la</strong> formu<strong>la</strong>tion <strong>de</strong> l’hypothèse ACA, on voit que ce type <strong>de</strong> parallélisme<br />

est intéressant pour le préconditionnement ACA même si il oblige à revoir<br />

l’algorithme <strong>de</strong> résolution. En effet, on peut envisager que chaque processus t a<br />

préa<strong>la</strong>blement construit localement D t et E t par sommation sur Υ + t .<br />

t=1<br />

À l’issue <strong>de</strong><br />

cette communication (<br />

≪All Reduce≫, ) un processus t peut alors à résoudre le système<br />

∑<br />

D tΨt ⃗ = E t I proj<br />

∑s<br />

⃗R + I int<br />

⃗Ψ t ′ . On voit bien que <strong>la</strong> résolution <strong>de</strong> ces N p<br />

t ′ ≠t<br />

systèmes distribués va nécessiter <strong>de</strong>s communications collectives. Par exemple, une

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!