Algorithmes de la morphologie mathématique pour - Pastel - HAL

More documents

Recommendations

Info

Algorithmes de la morphologie mathématique pour les architectures orientées fluxJaromír BRAMBORCe skeleton algorithmique est important car il nous permet, par la suite, de définir facilement l’algorithmecomplet pour les quatre opérations en les distinguant par un seul paramètre.6.3.4 Algorithme complet pour les transpositions et les rotations par SIMDUne fois expliqué ce qui se passe à l’intérieur d’un macro bloc, nous allons détailler le processus pourles transpositions et les rotations des arrays. Pour cela, nous allons revenir à l’algorithme 6.2, présentéprécédemment sur la page 132, qui décrivait le skeleton algorithmique pour les transpositions/rotationspar macro blocs en travaillant élément par élément. Il va nous servir comme modèle pour la constructiond’un nouvel algorithme.Ce nouvel algorithme, que nous présentons ici comme l’algorithme 6.6, va utiliser pour son travaill’approche SIMD. Ainsi, l’accès aux données sera effectué en utilisant les types des vecteurs paquetés.Ce qui signifie que cet algorithme va percevoir l’array d’entrée comme un array dont les éléments sontdu type des vecteurs paquetés PVec. Par la suite, il découpera cet array en macro blocs et il effectueral’opération choisie localement à l’intérieur de chacun des macro blocs en utilisant, bien sûr, les algorithmesSIMD décrits précédemment. Puis il effectuera la même opération globalement avec les macroblocs en utilisant l’algorithme de base issue de la définition de cette opération.Algorithme 6.6 : trRot2DMBSIMD, algorithme complet de la transposition et rotation d’un array2D utilisant l’approche macro bloc et les fonctionnalités SIMD1 trRot2DMBSIMD :: [Char] → [Char] → I → Ar ( I , I ) α → Ar ( I , I ) α2 trRot2DMBSIMD how axe mbsize ar =3 (mkAr2DFromAr2DPVec axe)4 ◦ arrayFromMxNBlocs5 ◦ fg6 ◦ ( listArray ( (1,1) , (m,n)) )7 ◦ (map ( listArray ( (1,1) , (1, mbsize ) ) ) )8 ◦ (map fl )9 ◦ (map elems)10 ◦ elems11 ◦ (arrayToMxNBlocs m n )12 ◦ (mkAr2DPVec axe mbsize )13 $ ar14 where15 (p,q) = dimsAr2D ar ; (m,n) = ( (div p mbsize ) , (div q mbsize ) )16 fg = trRot2D how17 fl = trRot2DNxPVecNbf howLes paramètres de cet algorithme sont les suivants : how désigne le type d’opération à effectuer etpeut avoir les valeurs ”T D” pour la transposition par diagonale, ”TA” pour la transposition par l’antidiagonale,”R + ” pour la rotation de + π 2 et ”R − ” pour la rotation de − π 2. Le paramètre axe désigne lesens de vectorisation et peut avoir les valeurs ”Fst” pour le premier axe et ”Snd” pour le deuxième. Leparamètre mbsize désigne la taille des macro blocs et ar désigne l’array d’entrée.Expliquons alors, pas à pas, la construction exacte de cet algorithme. La lecture commence sur laligne 13 et on va progresser vers les lignes précédentes. La première étape est constituée du passaged’un array ar (ligne 13) avec les éléments du type α à un array avec les éléments paquetés PVec I α.Pour effectuer cela, nous allons utiliser la fonction mkAr2DPVec (ligne 12) avec la bonne clé, soit ”Fst”,soit ”Snd”. Le choix du sens de la vectorisation est prédéfini par l’axe de stockage des données dans lamémoire. Ensuite, en utilisant la fonction elems, nous extrayons tous les éléments de cet array vectoriséet nous les plaçons dans un stream (ligne 10). Pour pouvoir appliquer les fonctions macro blocs SIMDcomme décrites précédemment, nous devons passer, pour chacun des macro blocs, à son expression en140
Jaromír BRAMBOR6.4. NOTES SUR L’IMPLÉMENTATION, RÉSULTATS EXPÉRIMENTAUXtant que stream. C’est effectué par le mapping (map elems) sur la ligne 9. Nous obtenons ainsi un streamdes streams, formellement décrit comme :[ [ PVec I α] ]Sur la ligne 8, nous appliquons la fonction locale par l’expression (map fl) à chacun des macro blocsexprimés en stream. Ensuite, sur la ligne 7, nous passons à l’expression des macro blocs en tant quearray 2D et nous reconstituons à nouveau un array dont les éléments sont les macro blocs sur la ligne 6.L’opération globale, fg, est appliquée sur cet array reconstitué (sur la ligne 5) achevant ainsi notre opération.Ce qui reste à faire c’est de passer à partir d’un array des macro blocs à un array dont les élémentssont les vecteurs paquetés (sur la ligne 4) pour, à la fin, appliquer une opération inverse à la vectorisationqui donne comme résultat un array du même type que celui d’entrée de la fonction, du type Ar (I, I) α.Ainsi, nous avons obtenu l’opération souhaitée en utilisant l’approche macro bloc et en employantles opérations SIMD sur les macro blocs.6.4 Notes sur l’implémentation, résultats expérimentauxIl y a, en effet, autant de façons d’implémenter les algorithmes décrits dans ce chapitre qu’il y ad’architectures, de programmeurs pour l’écriture et de compilateurs pour la compilation du code.Les implémentations sur les architectures parallèles peuvent être facilement déduites de nos descriptionsformelles des algorithmes présentés dans ce chapitre. Le parallélisme le plus simple, utilisabledans ces cas, est celui de la replication fonctionnelle représentée par le skeleton algorithmique farm,cf. 4.4.2.1, page 67. Pour l’employer, nous nous intéressons à toutes les parties de notre algorithme quiutilisent la fonction map de l’application d’une fonction sur tous les éléments d’un stream. Toutes cesparties peuvent être récrites en utilisant le skeleton algorithmique farm à la place de la fonction map.Ainsi, nous changeons complètement la manière de travailler d’une telle partie de notre algorithme etnous passons de l’exécution en séquence, exprimée par map, à l’exécution en parallèle, exprimée parfarm. Le choix exact dépend de nos exigences et de nos possibilités matérielles lors de l’implémentation.De plus, ces algorithmes entrent dans la logique du paradigme Divide and Conquer, présenté parle skeleton algorithmique dc, cf. 4.4.2.2, page 67. La division d’un problème global à des problèmesplus petits et locaux est propre aux algorithmes de ce chapitre travaillant sur les macro blocs. Il seraitégalement envisageable d’exprimer ces algorithmes en termes du Divide and conquer et en utilisant leskeleton algorithmique dc car la manière de travailler de ce skeleton est identique à ce que nous faisonspar le découpage d’un array sur les macro blocs, l’application de la fonction locale et son recollageeffectué à la fin.Concernant l’implémentation SIMD, la première chose que nous devrions souligner est la demanded’alignement des données de l’image dans la mémoire aux bornes qui sont les multiples de la taille Ndu registre multimédia. Si l’image a des dimensions qui sont des multiples de N et si, de plus, ellesest alignée aux blocs de mémoire par N, notre implémentation se révèle simple. Dans le cas contraire,nous devrions faire face aux effets particuliers du travail avec les données non-alignées. L’accès auxdonnées non-alignées est possible sur les architectures multimédia via les instructions spécialisées pourun accès non-aligné mais le coût d’un tel accès est, en général, supérieur à un accès alignée. C’est duau fait que pour la lecture d’une donnée non-alignée vers un registre, l’architecture utilise deux lecturesconsécutives des zones alignées couvrant les données voulues suivies par leur extraction vers le registre.Ces instructions peuvent avoir un coût relativement faible, mesuré dans les cycles d’horloge, commec’est le cas pour les instructions Intel SSE3. La figure 6.7 illustre un exemple de la transposition d’uneimage alignée mais dont les dimensions ne sont pas un multiple de la taille du registre multimédia.Nous présentons également deux exemples du code en langage C implémentant la transposition d’unmacro bloc par la diagonale.Le premier, présenté sur la fig. 6.6, est un code qui provient du MorphoMedia, un outil logiciel quenous avons développé dans le cadre de cette thèse. Il s’agit d’un code programmé comme les directivesdu préprocesseur (cf. #define) qui utilise les fonctions commençant par mrph_asm_ qui nous141
Page 2 and 3:
Marques commerciales déposées et/
Page 4 and 5:
Cette page est blanche par intentio
Page 7 and 8:
ALGORITHMES DE LA MORPHOLOGIE MATH
Page 9 and 10:
ALGORITHMS OF MATHEMATICAL MORPHOLO
Page 11:
Table des matièresGuide de thèse
Page 14 and 15:
Algorithmes de la morphologie math
Page 16 and 17:
Page 20 and 21:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Page 30 and 31:
Cette page est blanche par intentio
Page 32 and 33:
Page 34 and 35:
Page 36:
Page 39 and 40:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 41 and 42:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 43 and 44:
Jaromír BRAMBOR3.3. CONSOMMATION D
Page 45 and 46:
Jaromír BRAMBOR3.4. MODÈLE STREAM
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
CHAPITRE 4Formalisme fonctionnelado
Page 61 and 62:
Jaromír BRAMBOR4.2. HASKELL ET LES
Page 63 and 64:
Jaromír BRAMBOR4.3. PRIMITIVES DE
Page 65 and 66:
Page 67 and 68:
Jaromír BRAMBOR4.4. PRIMITIVES DU
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Jaromír BRAMBOR4.5. MODÈLE FORMEL
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90: Jaromír BRAMBOR4.6. PRIMITIVES DE
Page 97 and 98: Partie IIAlgorithmeset les skeleton
Page 99 and 100: CHAPITRE 5Algorithmes de voisinagen
Page 101 and 102: Jaromír BRAMBOR5.1. ALGORITHMES É
Page 115 and 116: Jaromír BRAMBOR5.3. ALGORITHMES G
Page 117 and 118: Jaromír BRAMBOR5.3. ALGORITHMES G
Page 119 and 120: Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 121 and 122: Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 123 and 124: Jaromír BRAMBOR5.5. RÉSULTATS EXP
Page 125 and 126: Jaromír BRAMBOR5.6. RÉCAPITULATIO
Page 127 and 128: CHAPITRE 6Permutation SIMD des arra
Page 129 and 130: Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 131 and 132: Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 133 and 134: Jaromír BRAMBOR6.3. ALGORITHMES RA
Page 139: Jaromír BRAMBOR6.3. ALGORITHMES RA
Page 143 and 144: Jaromír BRAMBOR6.4. NOTES SUR L’
Page 147 and 148: CHAPITRE 7Algorithmes de voisinaged
Page 149 and 150: Jaromír BRAMBOR7.1. PARTICULARITÉ
Page 151 and 152: Jaromír BRAMBOR7.3. SKELETON ALGOR
Page 165 and 166: CHAPITRE 8Algorithmes de la dilatat
Page 167 and 168: Jaromír BRAMBOR8.2. APPROCHE EMPLO
Page 177 and 178: CHAPITRE 9Algorithmes et complexit
Page 179 and 180: Jaromír BRAMBOR9.4. ESTIMATION DE
Page 181 and 182: Jaromír BRAMBOR9.5. EXEMPLE D’ES
Page 189 and 190: Conclusion et perspectives
Page 191 and 192:
Conclusion et perspectivesConclusio
Page 193 and 194:
Jaromír BRAMBORtations sur les GPU
Page 195 and 196:
Jaromír BRAMBORsemble inadapté, d
Page 197 and 198:
Annexe
Page 199 and 200:
Annexe AFonctions pour assurer l’
Page 201 and 202:
Annexe BDéfinitions des fonctions
Page 203 and 204:
Jaromír BRAMBORtestSIMD :: PVec I
Page 205 and 206:
Liste des termes et des abréviatio
Page 207 and 208:
Liste des figures1.1 Évolution du
Page 209 and 210:
Jaromír BRAMBORListe des figures7.
Page 211 and 212:
Liste des tableaux1.1 Évolution de
Page 213 and 214:
Bibliographie[AD03] Marco ALDINUCCI
Page 215 and 216:
Jaromír BRAMBORBibliographie[Cou02
Page 217 and 218:
Jaromír BRAMBORBibliographie[Gha99
Page 219 and 220:
Jaromír BRAMBORBibliographie[Lem96
Page 221 and 222:
Jaromír BRAMBORBibliographie[RS01]
Page 223 and 224:
Jaromír BRAMBORBibliographie[Wik06
Page 225 and 226:
IndexSymbols+, fonction . . . 62, 7
Page 227 and 228:
Jaromír BRAMBORINDEXICL . . . . .
Page 229:
Jaromír BRAMBORINDEXspecNgbSQR, fo
show all

Algorithmes de la morphologie mathématique pour - Pastel - HAL

Create successful ePaper yourself

Delete template?

Save as template?