Algorithmes de la morphologie mathématique pour - Pastel - HAL

More documents

Recommendations

Info

Algorithmes de la morphologie mathématique pour les architectures orientées fluxJaromír BRAMBORNous mentionnons également deux autres implémentations qui ont été écrites dans le langage C, sansavoir exploré les capacités SIMD. La première (mentionnée comme C non-SIMD* dans la tab. 8.1) a suividirectement la définition, utilisait abondamment les structures if-else dans les tests de dépassement desbords, et correspond à une implémentation intuitive qu’un programmeur effectue si la performance del’algorithme n’est pas sa priorité. Nous avons restructuré le code de cette implémentation dans une formeplus propre qui ne fait plus appel aux instructions spécifiques à l’architecture (mentionnée comme C non-SIMD**). Nous avons espéré que le compilateur pourrait, dans un tel code, procéder à la vectorisationde la même manière que nous l’avons exposée dans l’algorithme 8.3, mais malgré le gain que nousavons obtenus et qui est dû à la restructuration de cette implémentation, le temps d’exéctution est plutôtdécevant, surtout si on le compare avec les temps obtenu pour les implémentations C++ template SSE2qui intègrent le travail SIMD dans la structure de l’algorithme.Temps d’exécution en ms des algorithmes de la dilatation par segmentsalgorithme méthode typeTaille du segment symétrique (1 ∼ 3 pixels)1 3 5 15 30 60Itératif assembleur 32 bits HOR 1.486 3.893 5.791 13.00 21.96 36.85Itératif assembleur 32 bits VER 3.256 8.596 10.31 31.18 52.35 91.84HGW C non-SIMD* HOR — — 31 — — —HGW C non-SIMD** HOR — — 6.1 — — —HGW C++ template SSE2 HOR 0.626 0.625 0.622 0.602 0.602 0.592HGW C++ template SSE2 VER 0.334 0.331 0.313 0.276 0.261 0.260Légende : HOR = segment horizontal, VER = segment vertical ; L’implémentation assembleur 32 bits est programméeen assembleur et utilise directement les instructions 32 bits de l’architecture Intel IA-32 ; l’implémentation Cnon-SIMD* selon la définition mathématique, utilise abondamment les constructions if-else ; l’implémentation Cnon-SIMD** est la plus optimisée possible en C et à la main sans utiliser les types vectoriels. L’implémentationC++ template SSE2 utilise les classes fournies avec le compilateur Intel ICL pour le calcul vectoriel. L’imaged’entrée/sortie : 768 × 576 × 8 bits = 432 ko ; processeur Intel Pentium 4 à 2.4 GHz, mémoire cache L2 = 512ko ; système d’exploitation Microsoft Windows XP ; compilateur Intel ICL 7.1 pour Windows.TAB. 8.1 : Résultats expérimentaux de diverses implémentations de la dilatation par segmentsLe graphe présentant les temps d’exécution dépendant de la taille du segment pour l’implémentationitérative, cf. la fig. 8.7(a), a tout-à-fait la forme attendue sachant que la complexité de cet algorithme pourune image donnée est de O(K), où K est le nombre de voisins traités par pixel. Les temps d’exécutiongrandissent avec la taille de l’élément structurant linéairement.Nous présentons cette courbe comme contre-exemple pour démontrer qu’il est possible de calculerles dilatations / érosions beaucoup plus rapidement et surtout, avec un algorithme ayant la complexitéO(1), où le temps du calcul ne dépend pas du nombre des voisins traités par pixel, q.v. la fig. 8.7(b).Il s’agit de l’implémentation SIMD de l’algorithme de van Herk-Gil-Werman, cf. les définitions de lafonction algoHGWFstSIMD (l’algorithme 8.4) et de la fonction algoHGWSndSIMD (l’algorithme 8.4).L’écart entre les deux courbes dans la fig. 8.7(b) qui est d’une valeur constante n’est pas surprenantcar nous savons comment nous avons construit ces deux implémentations. Cet écart correspond, eneffet, à 2 exécutions de la transposition par diagonale de l’image entière. Un phénomène plus intéressantprésenté par les mêmes données est celui de la baisse du temps du calcul avec la taille du segmentgrandissant qui est, au premier regard, paradoxal.Au début, nous avons jugé que cette baisse était due aux optimisations que le compilateur peuteffectuer dans le code de boucles lors de l’exécution de la phase p 1 et p 2 à l’échelle des macro blocs. Maisl’explication est, en fait, plus simple. Il s’agirait d’un phénomène dû à la gestion des boucles car pourles tailles grandissantes des segments, nous obtenons moins de macro blocs et par conséquent, moins deboucles. Ce phénomène est présent également dans les implémentations non-SIMD de l’algorithme devan Herk et même dans d’autres, nous renvoyons le lecteur aux articles DB05 et aux publications DD06 quiprésentent les graphiques avec des tendances similaires.174
Jaromír BRAMBOR8.3. RÉSULTATS EXPÉRIMENTAUX10090itératif, asm32, horizontalitératif, asm32, vertical807060temps / ms504030201000 10 20 30 40 50 60taille de l’élémént structurant (1 = 3 pixels)(a) Algorithme itératif0.65VanHerk, SSE2, horizontalvanHerk, SSE2, vertical0.60.550.5temps / ms0.450.40.350.30.250 10 20 30 40 50 60taille de l’élémént structurant (1 = 3 pixels)(b) Algorithme SIMD de van Herk-Gil-Werman pour Intel SSE2FIG. 8.7 : Les temps du calcul des implémentations de la dilatation / érosion par un segment pour une image768 × 576 × 8 bits = 432 ko175
Page 2 and 3:
Marques commerciales déposées et/
Page 4 and 5:
Cette page est blanche par intentio
Page 7 and 8:
ALGORITHMES DE LA MORPHOLOGIE MATH
Page 9 and 10:
ALGORITHMS OF MATHEMATICAL MORPHOLO
Page 11:
Table des matièresGuide de thèse
Page 14 and 15:
Algorithmes de la morphologie math
Page 16 and 17:
Page 20 and 21:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Page 30 and 31:
Cette page est blanche par intentio
Page 32 and 33:
Page 34 and 35:
Page 36:
Page 39 and 40:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 41 and 42:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 43 and 44:
Jaromír BRAMBOR3.3. CONSOMMATION D
Page 45 and 46:
Jaromír BRAMBOR3.4. MODÈLE STREAM
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
CHAPITRE 4Formalisme fonctionnelado
Page 61 and 62:
Jaromír BRAMBOR4.2. HASKELL ET LES
Page 63 and 64:
Jaromír BRAMBOR4.3. PRIMITIVES DE
Page 65 and 66:
Page 67 and 68:
Jaromír BRAMBOR4.4. PRIMITIVES DU
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Jaromír BRAMBOR4.5. MODÈLE FORMEL
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Partie IIAlgorithmeset les skeleton
Page 99 and 100:
CHAPITRE 5Algorithmes de voisinagen
Page 101 and 102:
Jaromír BRAMBOR5.1. ALGORITHMES É
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110:
Page 111 and 112:
Page 113 and 114:
Page 115 and 116:
Jaromír BRAMBOR5.3. ALGORITHMES G
Page 117 and 118:
Jaromír BRAMBOR5.3. ALGORITHMES G
Page 119 and 120:
Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 121 and 122:
Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 123 and 124: Jaromír BRAMBOR5.5. RÉSULTATS EXP
Page 125 and 126: Jaromír BRAMBOR5.6. RÉCAPITULATIO
Page 127 and 128: CHAPITRE 6Permutation SIMD des arra
Page 129 and 130: Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 131 and 132: Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 133 and 134: Jaromír BRAMBOR6.3. ALGORITHMES RA
Page 141 and 142: Jaromír BRAMBOR6.4. NOTES SUR L’
Page 147 and 148: CHAPITRE 7Algorithmes de voisinaged
Page 149 and 150: Jaromír BRAMBOR7.1. PARTICULARITÉ
Page 151 and 152: Jaromír BRAMBOR7.3. SKELETON ALGOR
Page 165 and 166: CHAPITRE 8Algorithmes de la dilatat
Page 167 and 168: Jaromír BRAMBOR8.2. APPROCHE EMPLO
Page 173: Jaromír BRAMBOR8.3. RÉSULTATS EXP
Page 177 and 178: CHAPITRE 9Algorithmes et complexit
Page 179 and 180: Jaromír BRAMBOR9.4. ESTIMATION DE
Page 181 and 182: Jaromír BRAMBOR9.5. EXEMPLE D’ES
Page 189 and 190: Conclusion et perspectives
Page 191 and 192: Conclusion et perspectivesConclusio
Page 193 and 194: Jaromír BRAMBORtations sur les GPU
Page 195 and 196: Jaromír BRAMBORsemble inadapté, d
Page 197 and 198: Annexe
Page 199 and 200: Annexe AFonctions pour assurer l’
Page 201 and 202: Annexe BDéfinitions des fonctions
Page 203 and 204: Jaromír BRAMBORtestSIMD :: PVec I
Page 205 and 206: Liste des termes et des abréviatio
Page 207 and 208: Liste des figures1.1 Évolution du
Page 209 and 210: Jaromír BRAMBORListe des figures7.
Page 211 and 212: Liste des tableaux1.1 Évolution de
Page 213 and 214: Bibliographie[AD03] Marco ALDINUCCI
Page 215 and 216: Jaromír BRAMBORBibliographie[Cou02
Page 217 and 218: Jaromír BRAMBORBibliographie[Gha99
Page 219 and 220: Jaromír BRAMBORBibliographie[Lem96
Page 221 and 222: Jaromír BRAMBORBibliographie[RS01]
Page 223 and 224: Jaromír BRAMBORBibliographie[Wik06
Page 225 and 226:
IndexSymbols+, fonction . . . 62, 7
Page 227 and 228:
Jaromír BRAMBORINDEXICL . . . . .
Page 229:
Jaromír BRAMBORINDEXspecNgbSQR, fo
show all

Algorithmes de la morphologie mathématique pour - Pastel - HAL

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?