Algorithmes de la morphologie mathématique pour - Pastel - HAL

More documents

Recommendations

Info

Algorithmes de la morphologie mathématique pour les architectures orientées fluxJaromír BRAMBORΘ. Pourtant, il nous semble utile de l’y mentionner car si ce terme α est bien décrit et reflète correctementla réalité, il peut nous démontrer plus en détail la structure de la fonction du coût d’un algorithme.Notons que la seule manière de vérifier que notre estimation, que nous appelons estimation pratiquede performance, est correcte et cohérente avec la réalité, c’est la mesure physique du temps du calculd’un algorithme sur une architecture donnée et pour les paramètres donnés (les dimensions d’image,d’élément structurant, etc.).9.4.2 Estimation pratique pour les GPPMMExpliquons sur un exemple trivial comment nous envisageons de procéder à cette estimation pratique.Nous prenons l’exemple de l’opération addition de deux images (arrays) de dimensions M × N et dontle résultat serait également une image. Nous voulons exécuter cette opération sur une architecture GPPavec un seul processeur. La complexité C 1 de l’algorithme trivial travaillant élément par élément expriméen O est O(MN) ce qui peut également être exprimé, en effet, comme :C 1 = O(N 2 ). (9.1)Si nous voulons décrire un modèle de performance précis, il faut d’abord distinguer les opérationsavec la mémoire des opérations arithmétiques qui peuvent participer au coût final par différentes proportions.Notons comme µ le coût de toute les opérations avec la mémoire (lecture et écriture) pour unélément d’image. Notons comme α le coût de toutes les opérations arithmétiques qui sont nécessairespour évaluer un élément. Ainsi, le coût de cet algorithme peut être estimé commeC 1 = Θ((α + µ)MN). (9.2)ce qui donne une idée plus précise de son fonctionnement.Regardons comment vont changer ces estimations si nous utilisons à la place d’une architecture GPPavec un seul processeur (un seul fil d’exécution physique) une architecture GPPMM à plusieurs processeurset/ou à plusieurs cœurs et/ou à plusieurs fils d’exécution indépendantes et/ou à parallélismesuperscalaire avec les capacités SWAR. Notons par P le nombre de processeurs qui peuvent assurerl’exécution concurrente et que S soit le nombre d’éléments qui peuvent être traités par les instructionsSIMD en même temps. Puisque les coûts d’accès à la mémoire et les coûts des opérations arithmétiquesne sont pas, dans le cas général, les mêmes que ceux présentés dans l’équation 9.2, nous allons dénoterpar β le coût de toutes les opérations arithmétiques nécessaires pour l’évaluation d’un élément multimédialarge et par ν le coût d’accès à la mémoire pour un tel élément. Pour cette configuration matérielle, ilest possible de concevoir un algorithme dont la complexité C 2 sera :C 2 = Θ((β + ν) MN ). (9.3)SPPour pouvoir obtenir des estimations très concrètes, il faut substituer aux termes α, µ, β et ν desvaleurs concrètes qui peuvent être exprimées comme multiples de cycles d’horloge de notre architecture.Pour faire cela, il faut très bien connaître l’architecture de notre matériel informatique et surtout lesphénomènes entrant en jeu. Il s’agit souvent des effet indésirables du préchargement de données dansla mémoire cache en temps d’exécution ce qui se manifeste, pour les grandes images n’entrant pas entièrementen mémoire cache, par un ralentissement assez important de l’exécution. Ce phénomène estaccentué dans le cas où la zone de la mémoire de sortie est distincte des deux zones de mémoires d’entréecar dans ce cas, nous travaillons effectivement avec 3 images et le volume des données traitées peut trèsrapidement dépasser la taille de la mémoire cache.Ce point est d’autant plus marquant sur les fonctions triviales telles que l’addition que nous abordonsici. Ce type d’opérations n’exécute pas assez d’instructions arithmétiques pour pouvoir cacher lapréparation des données dans l’exécution confluente des instructions en pipeline (cf. 3.2.3, page 38).180
Jaromír BRAMBOR9.5. EXEMPLE D’ESTIMATION PRATIQUE DE LA COMPLEXITÉ DES ALGORITHMES DE VOISINAGEPour illustrer cet exemple, nous présentons dans la table 9.1 les temps du calcul de l’opération additionavec saturation que nous avons obtenus comme des résultats expérimentaux.dimensions volume de données méthode temps tauxd’image manipulé d’implémentation en ms d’accélérationgénérique 0.175 0.26128 2 × 8bits 3*16 ko = 48 ko via pointer++ 0.045 1.0multimédia 64 bit 0.005 9générique 0.69 0.28256 2 × 8bits 3*64 ko = 192 ko via pointer++ 0.19 1.0multimédia 64 bit 0.03 6.3générique 3.00 0.2512 2 × 8bits 3*256 ko = 768 ko via pointer++ 0.60 1.0multimédia 64 bits 0.40 1.5Opération travaillant avec 3 images, chacune dans une zone de mémoire distincte. L’implémentation génériqueutilise les fonctions getPixel()/setPixel() ; l’implémentation via pointer++ travaille élément par élément en utilisantles pointeurs ; l’implémentation multimédia 64 bits utilise les instructions spéciales SIMD de 64 bits pourévaluation. Machine : Intel Pentium 4 @ 2.4 GHz, single thread, 8 ko L1, 512 ko L2 cahce, Linux Mandrake 9.2.Compilateur Intel ICC 8.1, optimisations manuelles dans le cas multimédia 64 bits.TAB. 9.1 : Temps du calcul de l’opération addition avec saturation sur les images dont les éléments sont dutype unsigned integer 8bitIl est évident que pour le volume de données traitées de 48 ko et 192 ko qui entrent dans la mémoirecache L2 de notre machine (512 ko), les taux d’accélération 9 et 6.3 sont cohérents avec la valeur attenduepour le travail SIMD de 64 bits qui devrait nous fournir, en théorie, le taux d’accélération égale à 8. Enrevanche, pour les images 512 2 dont la taille correspond aux volume manipulé de 768 ko, nous dépassonsles capacités de notre architecture ; cela se reflète sur le temps du calcul qui dépasse les temps que l’onpouvait espérer en faisant une simple extrapolation des résultats précédents. Le taux d’accélération tombedans ce cas à une valeur très décevante 1.5.Cet exemple très pratique nous démontre que notre estimation devrait inclure également dans le coûtpour les opérations avec la mémoire µ et ν un terme supplémentaire dont le comportement serait nonlinéaireet dépendant de la taille de l’image et de la taille de la mémoire cache. Nous pouvons l’exprimerpar la décomposition des coefficients du coût µ et ν comme :µ = µ 1 + µ 2 (MN)ν = ν 1 + ν 2 (MN)où les premiers termes µ 1 et ν 1 expriment les coûts que l’on paye pour un accès aux données présentesdans la mémoire cache ; et où les deuxièmes termes µ 2 et ν 2 , qui sont les fonctions de la taille de l’imageMN expriment les coûts relatifs au comportement particulier lors du chargement de données dans lamémoire cache en cas de leur absence.9.5 Exemple d’estimation pratique de la complexité des algorithmes de voisinageEn ce qui concerne la complexité de l’approche naïve, il ne suffit pas d’avoir que le skeleton algorithmiquengbAlgo pour son évaluation. Ce skeleton est très générique pour pouvoir effectuer l’étude dela complexité en ne se basant que sur lui. Il faut spécifier également les scénarios de son utilisation quisont en directe correspondance avec les algorithmes concrets dilSQR et dilHEXR que nous venons deprésenter.L’approche naïve telle qu’elle est définie est générique. Elle utilise la fonction d’extraction du voisinagequi teste pour chaque accès au voisin si celui est inclus dans le domaine de l’image. Étant donnéune image de M × N pixels, N, M ∈ N, un élément structurant composé de K vecteurs, K < MN.181
Page 2 and 3:
Marques commerciales déposées et/
Page 4 and 5:
Cette page est blanche par intentio
Page 7 and 8:
ALGORITHMES DE LA MORPHOLOGIE MATH
Page 9 and 10:
ALGORITHMS OF MATHEMATICAL MORPHOLO
Page 11:
Table des matièresGuide de thèse
Page 14 and 15:
Algorithmes de la morphologie math
Page 16 and 17:
Page 20 and 21:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Page 30 and 31:
Cette page est blanche par intentio
Page 32 and 33:
Page 34 and 35:
Page 36:
Page 39 and 40:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 41 and 42:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 43 and 44:
Jaromír BRAMBOR3.3. CONSOMMATION D
Page 45 and 46:
Jaromír BRAMBOR3.4. MODÈLE STREAM
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
CHAPITRE 4Formalisme fonctionnelado
Page 61 and 62:
Jaromír BRAMBOR4.2. HASKELL ET LES
Page 63 and 64:
Jaromír BRAMBOR4.3. PRIMITIVES DE
Page 65 and 66:
Page 67 and 68:
Jaromír BRAMBOR4.4. PRIMITIVES DU
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Jaromír BRAMBOR4.5. MODÈLE FORMEL
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Partie IIAlgorithmeset les skeleton
Page 99 and 100:
CHAPITRE 5Algorithmes de voisinagen
Page 101 and 102:
Jaromír BRAMBOR5.1. ALGORITHMES É
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110:
Page 111 and 112:
Page 113 and 114:
Page 115 and 116:
Jaromír BRAMBOR5.3. ALGORITHMES G
Page 117 and 118:
Jaromír BRAMBOR5.3. ALGORITHMES G
Page 119 and 120:
Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 121 and 122:
Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 123 and 124:
Jaromír BRAMBOR5.5. RÉSULTATS EXP
Page 125 and 126:
Jaromír BRAMBOR5.6. RÉCAPITULATIO
Page 127 and 128:
CHAPITRE 6Permutation SIMD des arra
Page 129 and 130: Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 131 and 132: Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 133 and 134: Jaromír BRAMBOR6.3. ALGORITHMES RA
Page 141 and 142: Jaromír BRAMBOR6.4. NOTES SUR L’
Page 145 and 146: Jaromír BRAMBOR6.5. RÉCAPITULATIO
Page 147 and 148: CHAPITRE 7Algorithmes de voisinaged
Page 149 and 150: Jaromír BRAMBOR7.1. PARTICULARITÉ
Page 151 and 152: Jaromír BRAMBOR7.3. SKELETON ALGOR
Page 165 and 166: CHAPITRE 8Algorithmes de la dilatat
Page 167 and 168: Jaromír BRAMBOR8.2. APPROCHE EMPLO
Page 173 and 174: Jaromír BRAMBOR8.3. RÉSULTATS EXP
Page 175 and 176: Jaromír BRAMBOR8.3. RÉSULTATS EXP
Page 177 and 178: CHAPITRE 9Algorithmes et complexit
Page 179: Jaromír BRAMBOR9.4. ESTIMATION DE
Page 183 and 184: Jaromír BRAMBOR9.6. ESTIMATION DE
Page 185 and 186: Jaromír BRAMBOR9.6. ESTIMATION DE
Page 189 and 190: Conclusion et perspectives
Page 191 and 192: Conclusion et perspectivesConclusio
Page 193 and 194: Jaromír BRAMBORtations sur les GPU
Page 195 and 196: Jaromír BRAMBORsemble inadapté, d
Page 197 and 198: Annexe
Page 199 and 200: Annexe AFonctions pour assurer l’
Page 201 and 202: Annexe BDéfinitions des fonctions
Page 203 and 204: Jaromír BRAMBORtestSIMD :: PVec I
Page 205 and 206: Liste des termes et des abréviatio
Page 207 and 208: Liste des figures1.1 Évolution du
Page 209 and 210: Jaromír BRAMBORListe des figures7.
Page 211 and 212: Liste des tableaux1.1 Évolution de
Page 213 and 214: Bibliographie[AD03] Marco ALDINUCCI
Page 215 and 216: Jaromír BRAMBORBibliographie[Cou02
Page 217 and 218: Jaromír BRAMBORBibliographie[Gha99
Page 219 and 220: Jaromír BRAMBORBibliographie[Lem96
Page 221 and 222: Jaromír BRAMBORBibliographie[RS01]
Page 223 and 224: Jaromír BRAMBORBibliographie[Wik06
Page 225 and 226: IndexSymbols+, fonction . . . 62, 7
Page 227 and 228: Jaromír BRAMBORINDEXICL . . . . .
Page 229: Jaromír BRAMBORINDEXspecNgbSQR, fo
show all

Algorithmes de la morphologie mathématique pour - Pastel - HAL

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?