Algorithmes de la morphologie mathématique pour - Pastel - HAL

More documents

Recommendations

Info

Algorithmes de la morphologie mathématique pour les architectures orientées fluxJaromír BRAMBORsur une architecture donnée. C’est pourquoi nous avons pu les compiler facilement pour l’architectureIntel IA-32, qui fait le point de référence dans cette thèse, en nous appuyant sur la technologie IntelMMX (64 bits) et SSE2 (128 bits), le dernier implémentant les fonctions SIMD pour les maxima et lesminima utilisés dans la morphologie mathématique.Tout d’abord, nous présentons les résultats de l’implémentation de la fonction distance sur la grillecarrée et ayant 4-voisins par pixel, q.v. tab. 7.1. Il s’agit d’un algorithme de base qui est bien connu. Nousvoulions obtenir les temps d’exécution chiffrés pour cette fonction distance pour pouvoir les comparerpar la suite avec les temps obtenus pour les nivellements. En consultant la table 7.1 nous constatonsque pour une image de 99 ko, nous obtenons sur un processeur Intel Pentium 4 à 2.4 GHz un tempsd’exécution de 0.34 ms. Ce temps est le plus favorable possible car l’algorithme présenté travaille avecl’image de sortie ayant les éléments de 8 bits ; ce qui peut, pour certains types d’images, poser desproblèmes d’insuffisance du type de stockage, mais nous le présentons ici pour une autre raison – lesalgorithmes des nivellements présentés par la suite travaillent avec les images d’entrée et de sortie de8 bits et cette implémentation de la fonction distance peut nous servir en tant que référence pour lacomparaison.Fonction distance, grille carrée, 4-voisinsméthode temps tauxd’implémentation en ms d’accélérationgénérique 2.42 1.0par macro blocs utilisant la transposition par diagonale directe 0.34 7.1Image 352 × 288 × 8 bits = 99 ko, l’image d’entrée et l’image de sortie sont de 8 bits. L’algorithme génériqueutilise les fonctions getpixel()/setpixel() et la propagation en sens vidéo/anti-vidéo ; l’algorithme par macro blocsest optimisé pour les types multimédia de 64 bits et utilise la transposition directe à l’échelle des macro blocs.Exécuté 1000 fois en trois réalisations, le temps présenté est le moyen de la meilleure réalisation. Processor IntelPentium 4 à 2.4 GHz, mémoire cache L2 = 512 ko ; système d’exploitation Linux Mandrake 9.2 ; compilateur IntelICC 8.1 pour Linux.TAB. 7.1 : Résultats expérimentaux pour diverses implémentations de la fonction distance sur la grille carréeet 4-voisins par pixelLes résultats des diverses implémentations des nivellements plats et des lambda-nivellements avec lavaleur λ = 1 sont présentés dans la table 7.2. Les conditions des tests (dimensions d’image, processeuretc.) pour les nivellements sont identiques à celles pour la fonction distance. En consultant les temps del’implémentation la plus rapide par macro blocs pour 1 itération – 1.2 ms pour les nivellements platset 1.3 ms pour les lambda-nivellements – et en les comparant avec la valeur obtenue pour la fonctiondistance (0.34 ms), nous pouvons constater que l’exécution de l’algorithme des nivellements est à peuprès 3.5 à 4 fois plus longue que celle de la fonction distance correspondante.En ce qui concerne les différences entre les diverses implémentations des nivellements, nous avonschoisi comme référence l’implémentation pointeur++ (son taux d’accélération est égal à 1.0 est présentéen gras). Le masque, qui est une des images d’entrée de l’algorithme des nivellements, n’est pas modifiépar ce dernier. Ainsi, sa transposition peut être effectuée en avance et seulement une fois pour toutesles itérations. Les temps que nous présentons pour l’implémentation par macro blocs, reflètent ce fait etnous mentionnons entre parenthèses les temps incluant cette transposition préalable. La fig. 7.12(a) présenteune comparaison graphique des temps d’exécution pour différentes implémentations de la fonctiondistance et des nivellements plats.Sachant que le parallélisme SIMD que nous utilisons est de 8 éléments de 8 bits (implémentation utilisantles types multimédia de 64 bits) et en prenant en compte que nous effectuons deux transpositionspar diagonale dans notre implémentation par macro blocs qui ne sont pas présentes dans l’implémentationpointer++, le taux d’accélération des nivellements est de 4.8 pour 1 itération et il augmente avec160
Jaromír BRAMBOR7.5. NOTES SUR L’IMPLÉMENTATION, RÉSULTATS EXPÉRIMENTAUXSQR DISC2D_4SQR DISC2D_4nivellements plats,10 itérations87nivellements platslambda nivellementsnivellements plats, 5itérationsnivellements plats, 1itérationfonction distancepar macro blocs,transposition pardiagonale directepointer++génériquetaux d'accélération654320,1 1 10 100temps / ms10 1 2 3 4 5 6 7 8 9 10 11nombre d'itérations(a) Comparaison des temps d’exécutions de la fonctiondistance et des nivellements plats(b) Taux d’accélération pour les nivellementsFIG. 7.12 : Résultats expérimentaux des algorithmes dépendant du sens prédéfini du parcours de l’imageNivellements, grille carrée, 4-voisinstype1 itération 5 itérations 10 itérationsimplémentation temps taux temps taux temps tauxms d’accélération ms d’accélération ms d’accélérationgénérique 10.8 — 46.9 — 91.3 —plats pointeur++ 5.7 1.0 27.4 1.0 58.4 1.0(λ = 0) par MB 1.2 (1.8) 4.8 (3.2) 4.6 (5.2) 6.0 (5.3) 8.9 (9.5) 6.6 (6.1)générique 11.8 — 51.9 — 102.3 —lambda pointeur++ 6.3 1.0 29.3 1.0 55.2 1.0(λ = 1) par MB 1.3 (1.9) 4.8 (3.3) 4.8 (5.4) 6.1 (5.4) 9.2 (9.9) 6.0 (5.6)Légende : MB = macro blocs, TD = transposition par diagonale ; Image 352×288×8 bits = 99 ko, l’image d’entrée et l’image de sortie sont de8 bits. L’algorithme générique utilise les fonctions getpixel()/setpixel() et la propagation en sens vidéo/anti-vidéo ; l’algorithme pointeur++ estune analogie de l’algorithme générique mais il utilise explicitement les pointeurs ; l’algorithme par MB est optimisé pour les types multimédiade 64 bits et utilise la transposition directe à l’échelle des macro blocs ; entre parenthèses nous présentons les temps et les taux d’accélération quiincluent la transposition préalable de l’image du masque. Exécuté 1000 fois en trois réalisations, le temps présenté est le moyen de la meilleureréalisation. Processeur Intel Pentium 4 à 2.4 GHz, mémoire cache L2 = 512 ko ; système d’exploitation Linux Mandrake 9.2 ; compilateur IntelICC 8.1 pour Linux.TAB. 7.2 : Résultats expérimentaux pour diverses implémentations des nivellements sur la grille carrée et4-voisins par pixeld’avantage d’itérations – nous obtenons le taux d’accélération de 6.6 pour 10 itérations. La fig. 7.12(b)présente graphiquement les taux d’accélérations des nivellements plats et lambda pour l’implémentationpar macro blocs qui utilise la transposition directe ; l’algorithme pointeur++ fait la référence (tauxd’accélération égal à 1).Remarquons l’écart important entre l’implémentation générique (qui parcourt l’image en sens vidéoet anti-vidéo, utilise les fonctions d’accès aux pixels (setpixel(), getpixel()) et peut travailler avec n’importequelle grille) et l’implémentation pointeur++ (qui parcourt également l’image en sens vidéo etanti-vidéo mais qui est spécialisée pour la grille carrée de 4-voisins).Nous présentons une des applications possibles des nivellements pour le filtrage du flux vidéo lorsd’une vidéo conférence, q.v. la fig. 7.13(a) présentant l’original et la fig. 7.13(b) présentant les résultats.161
Page 2 and 3:
Marques commerciales déposées et/
Page 4 and 5:
Cette page est blanche par intentio
Page 7 and 8:
ALGORITHMES DE LA MORPHOLOGIE MATH
Page 9 and 10:
ALGORITHMS OF MATHEMATICAL MORPHOLO
Page 11:
Table des matièresGuide de thèse
Page 14 and 15:
Algorithmes de la morphologie math
Page 16 and 17:
Page 20 and 21:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Page 30 and 31:
Cette page est blanche par intentio
Page 32 and 33:
Page 34 and 35:
Page 36:
Page 39 and 40:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 41 and 42:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 43 and 44:
Jaromír BRAMBOR3.3. CONSOMMATION D
Page 45 and 46:
Jaromír BRAMBOR3.4. MODÈLE STREAM
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
CHAPITRE 4Formalisme fonctionnelado
Page 61 and 62:
Jaromír BRAMBOR4.2. HASKELL ET LES
Page 63 and 64:
Jaromír BRAMBOR4.3. PRIMITIVES DE
Page 65 and 66:
Page 67 and 68:
Jaromír BRAMBOR4.4. PRIMITIVES DU
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Jaromír BRAMBOR4.5. MODÈLE FORMEL
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Partie IIAlgorithmeset les skeleton
Page 99 and 100:
CHAPITRE 5Algorithmes de voisinagen
Page 101 and 102:
Jaromír BRAMBOR5.1. ALGORITHMES É
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110: Jaromír BRAMBOR5.1. ALGORITHMES É
Page 115 and 116: Jaromír BRAMBOR5.3. ALGORITHMES G
Page 117 and 118: Jaromír BRAMBOR5.3. ALGORITHMES G
Page 119 and 120: Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 121 and 122: Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 123 and 124: Jaromír BRAMBOR5.5. RÉSULTATS EXP
Page 125 and 126: Jaromír BRAMBOR5.6. RÉCAPITULATIO
Page 127 and 128: CHAPITRE 6Permutation SIMD des arra
Page 129 and 130: Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 131 and 132: Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 133 and 134: Jaromír BRAMBOR6.3. ALGORITHMES RA
Page 141 and 142: Jaromír BRAMBOR6.4. NOTES SUR L’
Page 143 and 144: Jaromír BRAMBOR6.4. NOTES SUR L’
Page 147 and 148: CHAPITRE 7Algorithmes de voisinaged
Page 149 and 150: Jaromír BRAMBOR7.1. PARTICULARITÉ
Page 151 and 152: Jaromír BRAMBOR7.3. SKELETON ALGOR
Page 159: Jaromír BRAMBOR7.5. NOTES SUR L’
Page 165 and 166: CHAPITRE 8Algorithmes de la dilatat
Page 167 and 168: Jaromír BRAMBOR8.2. APPROCHE EMPLO
Page 177 and 178: CHAPITRE 9Algorithmes et complexit
Page 179 and 180: Jaromír BRAMBOR9.4. ESTIMATION DE
Page 181 and 182: Jaromír BRAMBOR9.5. EXEMPLE D’ES
Page 189 and 190: Conclusion et perspectives
Page 191 and 192: Conclusion et perspectivesConclusio
Page 193 and 194: Jaromír BRAMBORtations sur les GPU
Page 195 and 196: Jaromír BRAMBORsemble inadapté, d
Page 197 and 198: Annexe
Page 199 and 200: Annexe AFonctions pour assurer l’
Page 201 and 202: Annexe BDéfinitions des fonctions
Page 203 and 204: Jaromír BRAMBORtestSIMD :: PVec I
Page 205 and 206: Liste des termes et des abréviatio
Page 207 and 208: Liste des figures1.1 Évolution du
Page 209 and 210: Jaromír BRAMBORListe des figures7.
Page 211 and 212:
Liste des tableaux1.1 Évolution de
Page 213 and 214:
Bibliographie[AD03] Marco ALDINUCCI
Page 215 and 216:
Jaromír BRAMBORBibliographie[Cou02
Page 217 and 218:
Jaromír BRAMBORBibliographie[Gha99
Page 219 and 220:
Jaromír BRAMBORBibliographie[Lem96
Page 221 and 222:
Jaromír BRAMBORBibliographie[RS01]
Page 223 and 224:
Jaromír BRAMBORBibliographie[Wik06
Page 225 and 226:
IndexSymbols+, fonction . . . 62, 7
Page 227 and 228:
Jaromír BRAMBORINDEXICL . . . . .
Page 229:
Jaromír BRAMBORINDEXspecNgbSQR, fo
show all

Algorithmes de la morphologie mathématique pour - Pastel - HAL

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?