Solveurs de Krylov - MÃ©canique MatÃ©riaux Structure

26 –30 novembre 2007 - ENSMPMéthodes des Éléments FinisRésolution des systèmes linéairesVincent Chiaruttini–DMSE / LCMEvincent.chiaruttini@onera.fr

Simulation d'un problème de mécanique• Démarche de résolution d'un problème d'évolutionobjet dans son environnementmodélisationmathématique MMC½ div ¾ = 0¾ = K "équations localesformulation faiblediscrétisations temporelleet spatialeProblème linéaire ?ouimodèlediscrétisénonméthode de Newton-Raphsonà résoudre : [A] [x] = [b]Comment résoudre efficacement un système linéaire degrande dimension (10 4 à 10 7 ) dans un contexte EF ?

Méthodes pour la résolution des systèmes linéaires•Méthodes de résolution directes• Gauss-Jordan• Décomposition LU• Cholesky•Méthodes itératives• Point fixe : Gauss-Seidel, Relaxation, Jacobi• Solveurs de Krylov : Gradient-conjugué et GMRes•Spécificités des problèmes éléments finis• Matrices creuses• Largeur de bande et renumérotation• Solveurs frontaux•Parallélisme–• Méthode primale et dual• Préconditionneursdécomposition de domaine

• Méthodes directes• Gauss-Jordan• Décomposition LU• CholeskyMéthodes de résolutiondirectes• Méthodes itératives• Point fixe• Solveurs de Krylov• Problèmes éléments finis• Matrices creuses• Largeur de bande• Solveurs frontaux• Décomposition de domaine• Méthode primale et dual• Préconditionneurs

Méthodes de résolution directes•Objectif• Trouver la solution de A x = b•A matrice n x n inversible•x vecteur inconnu de dimension n•b "second membre" de dimension nCoût des méthodes directes : nombre d'opérationsStabilité : sensibilité à la propagation des erreurs d'arrondi

Méthode de Gauss-Jordan•Principe : opérations sur une matrice augmentée pour transformer lebloc de gauche en l'identitéSystème AugmentationTransformation[A] [x] = [b] [Ajb] [I n jx][A] [x i ] = [b i ]inversion[Ajb i ] [I n jx i ]£[AjI n ] In jA ¡1¤

Méthodes de résolution directes•Objectif• Trouver la solution de A x = b•A matrice n x n inversible•x vecteur inconnu de dimension n•b "second membre" de dimension n• Se ramener à la résolution de systèmes triangulaires[0] [] = []ou[ ] [] = []0Coût des méthodes directes : nombre d'opérationsStabilité : sensibilité à la propagation des erreurs d'arrondi

Résolution d'un système triangulaire•Écriture du système•Résolutiona 11 x 1 = b 1a 21 x 1 + a 22 x 2 = b 2...a n1 x 1 + a n2 x 2 + ¢ ¢ ¢ + a nn x n = b nb 1a 11x 1 =1x 2 =a 22(b 2 ¡ a 21 x 1 )...1x n =a nn(b n ¡ P nk=1 a nkx k )[0] [] = []descente du système•De même pour un système supérieurremontée du système[ ] [] = []0•Coût : n² opérations

Décomposition LU•Principe• Décomposition en produit d'une matrice triangulaire inférieure (Lower)et supérieure (Upper)A=LU (dans cadre général A=PLU où P matrice de permutation)•Démarche de résolution• FactorisationnXk=1L ik U kj = A ij½Lik = 0; 8i > kU kj = 0; 8j < kManque de relations : n² relations pour n²+n inconnues=> termes de la diagonale de L sont fixés à 1• Résolution après factorisation•1 montée + 1 descenteL U x = b ,½ y = U xL y = bL y = b descente pour trouver yU x = y remonte pour trouver x

Décomposition LU•On se place dans le cas où il n'y a pas besoin d'échanges ligne/colonne•Pour effectuer la factorisation, il suffit d'étudier le résultat de lamultiplication LUSoit à vérifier :nXk=1L ik U kj = A ijA ij = U ij +A ij = L ij U ij +Xi¡1k=1Xj¡1k=1L ik U kj ; i · jL ik U kj ; i > j

Algorithme de Crout pour la décomposition LUBoucle sur j de 1 à nBoucle sur i de 1 à jU ij Ã A ij ¡Boucle sur i de j+1 à nXi¡1k=1L ij Ã 1U ijÃA ij ¡L ik U kjXj¡1k=1L ik U kj!Coût de la décomposition en n 3

Méthode de Choleski•Hypothèses : A matrice carrée symétrique définie positive• Symétrique• Positive• DéfinieA T = A8x 2 R n ; x T Ax ¸ 0x T Ax = 0 ) x = 0•Théorème• A est carrée symétrique définie positive ssi il existe une matrice L triangulaire inférieureinversible telle que A=LL TSi on ajoute la condition L ii>0 alors la matrice L est unique.•AlgorithmeBoucle surqi de 1 à nL ii ÃBoucle sur j de i à nA ii ¡ P i¡1k=1 L2 ikL ji Ã 1L ii³A iJ ¡ P i¡1k=1 L ikL jk´

Méthode de Choleski•Hypothèses : A matrice carrée symétrique définie positive• Symétrique• Positive• DéfinieA T = A8x 2 R n ; x T Ax ¸ 0x T Ax = 0 ) x = 0•Théorème• A est carrée symétrique définie positive ssi il existe une matrice L triangulaire inférieureinversible telle que A=LL TSi on ajoute la condition L ii>0 alors la matrice L est unique.•AlgorithmeBoucle surqi de 1 à nL ii ÃBoucle sur j de i à nA ii ¡ P i¡1k=1 L2 ikL ji Ã 1L ii³A iJ ¡ P i¡1k=1 L ikL jk´Coût de la décomposition1/3 n 3 +1/2 n²+1/6 n

• Méthodes directes• Gauss-Jordan• Décomposition LU• CholeskyMéthodes de résolutionitératives• Méthodes itératives• Point fixe• Solveurs de Krylov• Problèmes éléments finis• Matrices creuses• Largeur de bande• Solveurs frontaux• Décomposition de domaine• Méthode primale et dual• Préconditionneurs

Méthodes de résolution itératives•Principe• Construction d'une suite de vecteurs tels que :• En pratique on se donne une initialisation x 0•Définitionslimn!1 xn = A ¡1 b• Convergence : une méthode itérative est convergente ssi la suite x n converge vers A -1 bquel que soit le choix de x 0• Rayon spectral :½(A) = sup vap(A) j¸j• Norme matricielle vérifie : kABk < kAkkBk ex :kAk = sup kxk=1 kAxk•Théorème - A carré de dim n, équivalence entre :• La série converge• La suite converge vers 0• ½(A) < 1•RemarqueP 1k=0 AkA ksi kAk < 1 alors ½(A) < 1 et (I ¡ A) ¡1 = P 1k=0 Ak

Méthodes de point fixe•PrincipeA = M ¡ N• Décomposition de A : avec M facilement inversible• Construction de la suite :Mx n+1 = Nx n + bavec x 0 donné• Convergence (avec A inversible) si½(M ¡1 N) < 1• Cas particulier : si A et M T +N sym. def. positives alors convergence•Propriété• si B= M -1 Nkx ¡ x n k · kB n kkx ¡ x 0 k

Méthodes de point fixe• A s'écrit sous la forme-L-UDMéthode Décomposition ConvergenceGauss-Seidel M = D - L ; N = U si A sym. def. pos.si A à diagonale strict. dominanteRelaxation M = 1/ω D - L Condition nécessaire : 0 < ω < 2successive N = (1-ω)/ω D - U si A sym. def. pos. et 0 < ω < 2Jacobi M = D ; N = L+U si A à diagonale strict. dominante• Critère d'arrêtkb ¡ Ax n+1 kkbk· ´• Fiable : courant :kx n+1 ¡ x n kkx n+1 k· ´Méthodes applicables en utilisant des décompositions par blocsJacobi est directement parallélisable

Solveurs de Krylov• Résidu si x i approximation de Ax=b après i itérations, r i=b-Ax i• Espace de KrylovK m (A; r 0 ) = Vect ¡ r 0 ; Ar 0 ; : : : ; A m¡1 r 0¢• Principe du solveur recherche de x msous contraintes½xm 2 x 0 + K m (A; r 0 )r m ? ? K m (A; r 0 )• La relation d'orthogonalité permet de définir plusieurs approches• GMRes• Gradient conjugué pour les matrices SDP

GMRes–General Minimun Residual•Pour une matrice quelconque, principe de recherche :½xm 2 x 0 + K m (A; r 0 )r m ? AK m (A; r 0 )•Soit trouver•Algorithmex m 2 x 0 + K m (A; r 0 ) minimisant kr m k 2r 0 Ã b ¡ Ax 0 v 0 Ã r 0 =kr 0 k 2pour j de 0 à m-1 fairew j Ã Av jpour i de 0 à j faireh ij Ã (v i ; w j )w j Ã w j ¡ h ij v ih (j+1)j Ã kw j k 2si kr j k 2 · ´ alors stopsinon v j+1 Ã w j =h (j+1)jy m Ã argmin y kkr 0 k 2 e 1 ¡ h ykx m Ã x 0 + v y mfinsisi m=n la méthode convergeen au plus n itérationsla méthode ne calcule pasl'approximation de la solutionà chaque itération

Méthode du gradient conjugué•Pour une matrice SDP, principe de recherche :½xm 2 x 0 + K m (A; r 0 )r m ? K m (A; r 0 )•Soit trouver :x m 2 x 0 + K m (A; r 0 )minimisantkx m ¡ xk A•Algorithmer 0 Ã b ¡ Ax 0 w 0 Ã r 0si m=n la méthode converge en• pour j de 0 à m faireau plus n itérations® j Ã (r j ; w j )=(w j ; Aw j )base des résidus orthogonalex j+1 Ã x j + ® j w jbase des directions de descente est A-orthogonaler j+1 Ã r j ¡ ® j Aw j en pratique réothogonalisation complètesi kr j k 2 · ´ alors stop¯j Ã ¡(r j+1 ; Aw j )=(w j ; Aw j )w j+1 Ã r j+1 + ¯jw j

Convergence du gradient conjugué•Résultat de convergence du GCkx ¡ x m k A · 2Ãpk ¡ 1pk + 1! mkx ¡ x 0 k A•k : conditionnement de la matrice A :k = j¸maxjj¸min j: rapport entre les |valeurs propres| min et max de AConditionnement 100 1 000 10 000Nombre d'itérations 70 218 690

Préconditionnement• Mauvais conditionnement• Effets de structures élancées• Discrétisations éléments finis défaillantes• Propriétés physiques trop différentes• non-linéarités• ...• Préconditionnement• remplacer le système de sorte que le conditionnement de P -1 A soit meilleur que celui de A(idéalement P -1 proche de A -1 )P ¡1 Ax = P ¡1 b• Exemple préconditionneur diagonalP ii = K ii ; P ij = 0

• Méthodes directes• Gauss-Jordan• Décomposition LU• CholeskySpécificités des problèmeséléments finis• Méthodes itératives• Point fixe• Solveurs de Krylov• Problèmes éléments finis• Matrices creuses• Largeur de bande• Solveurs frontaux• Décomposition de domaine• Méthode primale et dual• Préconditionneurs

Spécificités des problèmes éléments finis•Fonctions de forme à support compact• équations usuelles relient les degrés de liberté qui appartiennent à un même élément• les systèmes sont de type « bande »•Largeur de bandemaxe2EF•Applicationmax (indice(ddl i ) ¡ indice(ddl j ))(ddl i ;ddl j )2DDL e• ex: pour les solveurs directscomplexité en : n BW²Comment réduire la largeur de bande ?264o o oo o ovaleurs nulleso o o oo o oBW=5o o oo o oo o oo oo oo375

Largeur de bande sur un problème EF2223242526272815816917101811191220132114Mauvais !1234567

Renumérotation15913172125236710111415181922232627Optimale481216202428

Solveurs creux• Objectif - ne prendre en compte que les valeurs non nulles• Gain de mémoire et de temps calcul• Mise en oeuvre• Renumérotation pour minimiser le remplissage• Calcul du remplissage induit par la factorisation• Factorisation des seuls termes non nuls

Solveur frontal•Objectif : assembler et factoriser en même temps1215649101314171821222526327511151923274381216202428ÉlémentMatrice frontale DDL éliminés• IntérêtsLien avec le code EF121 2 5 62 5 6 3 712Optimisation du cache3 5 6 3 7 4 8 3 44 5 6 7 8 9 10 55 6 7 8 9 10 11 6• Solveurs multifrontaux...Dissection emboîtéeProgression de plusieurs fronts simultanément

• Méthodes directes• Gauss-Jordan• Décomposition LU• CholeskyParallélismedécomposition de domaine• Méthodes itératives• Point fixe• Solveurs de Krylov• Problèmes éléments finis• Matrices creuses• Largeur de bande• Solveurs frontaux• Décomposition de domaine• Méthode primale et dual• Préconditionneurs

Calculateurs à architecture parallèleArchitectures• Cluster• SMP• Cluster de SMP" Exemple - Onera DMSE « petit » cluster" 182 processeurs (Opteron, Xeon)" 460 Go RAM" environ 15 To DD•" performance crête environ 800 GflopsRed Storm–Sandia National Labs

Supercalculateurs parallèles212 992 processeurs !596 378 milliards d'opérations par seconde !

Décomposition de domaine sans recouvrement8

Construction d'un problème condenséaux interfaces•Choix du type d'inconnue et de CL d'interface• Variable d'interfaceMéthode primale (BDD)Méthode duale (FETI)u 12 = u 1j¡3 = u 21 = u 2j¡3¸12 = ¾ 1j¡3n 1 = ¡¸21 = ¡¾ 2j¡3n 2• Nature du problème localConditions de type DirichletConditions de type Neumann•Choix associé du type de condition de raccord• Problème condensé sur l'interface¾ 1j¡3n 1 + ¾ 2j¡3n 2 = 0 u 1j¡3 = u 2j¡3EFUtilisation des compléments de Schurprimaux pour éliminer les DDL internesUtilisation des compléments de Schurduaux pour éliminer les DDL internes

Préconditionneurs classiques•Mise en oeuvre de solveurs itératifs de type Krylov• Problèmes de petites dimensions• Opérateurs de Schur généralement mieux conditionnés par rapport aux tailles de mailles•Préconditionneurs efficaces• Idée : remplacer l'inverse de la somme des contributions locales par la somme desinverses des contributions localesex : approche primalecomplément de Schur primal du domaine sP ¡1 S p u b = P ¡1 b pon propose :P ¡1 = X sS (s)davecS p = X sS (s)pcomplément de Schur dual du domaine s

Performances des méthodesde décomposition de domaine• Solveur mixte direct/itératif• Direct en local (réponse des sous-domaines)• Itératif sur le problème condensé• Parallélisme à « gros grains »• Calculs locaux importants (par domaine)• Peu de communications• Gradient conjugué efficace• Peu d'inconnues (vs nombre de total de DDL)• Préconditionneurs performants•(indépendants du nombre de sous-domaines)• Accélérations de convergence pour les problèmes non-linéaires• Réutilisation des espaces de Krylov précédemment générés par les itérationsNewton-Raphson

ExempleDemi roue115 239 degrés de libertésSolveurT (s)Mém. (Mio)# itér.Direct 93 725 0Itératif GC 244 81 504DD 4 SD 130 159 82DD 8 SD 58 82 117DD 12 SD 40 50 133

Fin

Solveurs de Krylov - MÃ©canique MatÃ©riaux Structure

Create successful ePaper yourself

Delete template?

Save as template?