Algorithmes de la morphologie mathématique pour - Pastel - HAL

More documents

Recommendations

Info

Algorithmes de la morphologie mathématique pour les architectures orientées fluxJaromír BRAMBORRemplissage volume Windows XP / fps Linux Mandrake / fpsde rectangle traité Fenêtre Plein écran Fenêtre Plein écrancouleur constante4 Mo 1670 2700 1422 33003 Mo — 3836 1850 3915couleur variante4 Mo — 1500 1031 16633 Mo — 2326 1338 21904 Mo= 1024 2 × 4 × 8 bits, 3 Mo= 1024 × 768 × 4 × 8 bits ; GPP = Intel Pentium 4 à 2.4 GHz singlethread ; GPU = NVidia GeForce 6800 LE sur AGP 4x. Résolution d’écran lors du travail avec fenêtre= 1280×1024TAB. 9.2 : Test comparatif de performances d’affichage d’un rectangle couvrant entièrement la scènerapide, son débit théorique est de 4 Go/s dans sa version "16x", couramment présente dans l’année 2006,est deux fois supérieur à celui de AGP 8x dans le sens GPP→GPU et 16 fois supérieur dans le sensGPU→GPP.Le bus PCI Express devait améliorer les temps du transfert, principalement dans le sens GPU→GPP.Même si une amélioration est perceptible, l’impact des transferts reste toujours important vis-à-vis de ladurée du traitement GPGPU que nous effectuons.De plus, on a beau avoir un débit théorique chiffré, les temps de transfert réels peuvent en différerfortement. Le temps de transfert varie, en effet, selon la configuration de notre architecture GPP-GPU.En se basant sur les données officielles de NVidia, nous avons modifié l’échelle de la courbe que l’onvient de présenter sur la fig. 9.1(b) pour pouvoir démontrer les temps estimés à partir de l’article NVi05qui sont les plus favorables à notre traitement (texture fixed point de 8 bit en format BGRA) pour deuxprocesseurs graphiques différents. Sur la fig. 9.2(a), nous présentons les temps estimés de transfertsGPP→GPU pour le processeur graphique NVidia GeForce 6800 Ultra connecté via PCI Express 16x etd’où nous pouvons déduire le taux effectif de "8x". Sur la fig. 9.2(b) nous présentons les temps estimésde transferts GPP→GPU pour le processeur graphique NVidia Quadro FX 4500 connecté également viaPCI Express 16x et d’où nous pouvons déduire le taux effectif de "13x".9.6.2 Influence du système d’exploitation et de l’APIL’influence non négligeable sur les performances finales est apportée également par le système d’exploitationà l’aide duquel nous exécutons nos programmes (dans notre cas Linux Mandrake 9.2 et MicrosoftWindows XP) et, bien sûr, du pilote qui exécute nos commandes OpenGL ou DirectX.En utilisant l’API Mesa sous Linux et l’API DirectX 9 sous Microsoft Windows XP, nous avonseffectué un test comparatif dont les résultats sont présentés dans la tab. 9.2. Nous avons implémentédeux algorithmes d’affichage d’un rectangle couvrant entièrement la scène.L’algorithme plus simple, dénoté couleur constante, n’utilise pas l’information de couleur incorporéedans les vertex, celle-ci est fournie par le programme traitant des fragments. Les résultats de cetalgorithme nous servent comme indicateur de performance maximale atteignable de notre architectureGPP-GPU. Dans ce cas précis, nous effectuons le moins de travail dans le pipeline graphique. La valeurque nous allons observer sera le nombre de trames que nous pouvons traiter par seconde (fps).Le deuxième algorithme, dénoté couleur variante, utilise l’information de couleur dans chacun desvertex du rectangle et cette information est pour chacun des vertex différente. Cette configuration occupeprincipalement le rastériseur et devrait nous démontrer le changement du nombre des trames traitablespar seconde lors d’interpolation de 4 valeurs de couleur.Puisque dans la plupart de cas, lors de notre travail avec les GPU, nous passons comme commandesgraphiques les structures ayant un nombre très petit de triangles, les mesures expérimentales devaientnous tester également la validité de l’hypothèse que nous nous avons construite pendant l’étude de labibliographie .Il s’agit de démontrer expérimentalement que l’API basé sur OpenGL gère plus efficacement l’en-186
Jaromír BRAMBOR9.7. RÉCAPITULATIONvoi de commandes qui comptent peu de triangles, cet fait étant mentionné dans la présentation deWloka Wlo03 . Le test que nous effectuons ici semble convenable pour cette démonstration. Nous y envoyons1 rectangle (qui est constitué de 2 triangles), il suffirait de comparer les fps obtenus pour les deuxsystèmes d’exploitation.Nous remarquons que ce type de travail n’est pas propre à l’utilisation habituelle des GPU car cesderniers ne sont pas conçus pour un travail à une fréquence élevée d’affichage dans le framebuffer maisils sont conçus pour les algorithmes qui se présentent par des taux des fps moindres à 100, le nombrepropre à la fréquence de rafraîchissement des trames pour la visualisation.Les résultats nous révèlent trois idées principales :• Il est à recommander de travailler avec une application qui fonctionne en régime plein écran (cf.les colonnes Plein écran dans la tab. 9.2). Dans le cas opposé où nous travaillerons dans unefenêtre de système d’exploitation (ou de système de fenêtres dans le cas de Linux), les taux de fpschuteraient d’une manière significative (cf. les colonnes Fenêtre dans la tab. 9.2).• On peut percevoir une certaine supériorité des résultats pour Linux et le pilote du processeur pourOpenGL en terme de fps qui sont plus grandes que celles pour Windows et DirectX. Mais noustrouvons également le cas contraire, notamment les valeurs de fps pour les images de 3 Mo lorsd’un remplissage par la couleur variante en plein écran. Il faut souligner que les résultats desdeux API ne sont pas excessivement différents et nous ne pouvons pas faire une recommandationd’utilisation d’un API plutôt que de l’autre. De plus, ces résultats étant fortement dépendants de laversion du pilote, ils peuvent varier fortement d’une version à l’autre.• Le fait d’avoir ajouté au traitement de base l’interpolation des couleurs se manifeste par une diminutiondes fps allant dans certains cas jusqu’à 2 fois (Linux, Plein écran, 4 Mo). Sachant que cetest devait démontrer les capacités d’interpolation des valeurs (nous visons prioritairement l’interpolationdes coordonnées des index de textures lors du travail avec 4 textures, sans avoir effectuél’échantillonnage), les résultats sont plutôt décevants car lors du travail avec les algorithmes detraitement d’images, nous allons encore ajouter aux temps qui correspondent à ces fps la durée desopérations de traitement des fragments (échantillonnage, opérations arithmétiques, etc.).9.7 RécapitulationCe petit chapitre devait nous servir à introduire des techniques pour la description de la complexitédes algorithmes. Nous y avons présenté, sur un exemple pratique pour les GPP/GPPMM les phénomènesque nous devons assumer si nous voulons passer de l’expression théorique de la complexité à l’aidede O() à une estimation pratique du coût d’un algorithme, qui est, dans notre cas, prioritairement lié àl’expression du temps du calcul.Cette estimation pratique n’est pas simple et est fortement liée à une architecture donnée mais également,comme nous l’avons présenté dans 9.4.2, page 180, à d’autres facteurs qui ne sont pas a priori aussiévident à assumer, comme les dimensions relatives d’une image et de la mémoire cache de l’architecture.L’estimation pratique des performances des algorithmes pour les GPU est encore plus délicate. Pourpouvoir obtenir des estimations fiables, on devrait prendre en compte beaucoup de paramètres. De cesderniers, nous avons présenté en particulier le temps de transfert de données et la possible influence dusystème d’exploitation et de l’interface de programmation (l’API) que nous utilisons pour exécuter noscommandes graphiques. Remarquons que pour un programme donné et pour un processeur graphiquedonné, les outils de développement de NVidia permettent de calculer avec précision le nombre de cyclesque les programmes pour les vertex et pour les fragments sont censés consommer. Mais il ne s’agit que dedeux des unités du pipeline graphique et il n’existe pas une méthode pour pré-évaluer les performancesdu pipeline graphique dans son entier.Même dans la littérature portant sur le GPGPU, nul ne présente les estimations de la performancepour les algorithmes pour les GPU. C’est dû au caractère des données, dépendantes de l’interaction avecl’utilisateur, qui sont traitées dans la synthèse d’images. Par conséquent, il n’est pas possible de prévoir187
Page 2 and 3:
Marques commerciales déposées et/
Page 4 and 5:
Cette page est blanche par intentio
Page 7 and 8:
ALGORITHMES DE LA MORPHOLOGIE MATH
Page 9 and 10:
ALGORITHMS OF MATHEMATICAL MORPHOLO
Page 11:
Table des matièresGuide de thèse
Page 14 and 15:
Algorithmes de la morphologie math
Page 16 and 17:
Page 20 and 21:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Page 30 and 31:
Cette page est blanche par intentio
Page 32 and 33:
Page 34 and 35:
Page 36:
Page 39 and 40:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 41 and 42:
Jaromír BRAMBOR3.2. FACTEURS INFLU
Page 43 and 44:
Jaromír BRAMBOR3.3. CONSOMMATION D
Page 45 and 46:
Jaromír BRAMBOR3.4. MODÈLE STREAM
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
CHAPITRE 4Formalisme fonctionnelado
Page 61 and 62:
Jaromír BRAMBOR4.2. HASKELL ET LES
Page 63 and 64:
Jaromír BRAMBOR4.3. PRIMITIVES DE
Page 65 and 66:
Page 67 and 68:
Jaromír BRAMBOR4.4. PRIMITIVES DU
Page 69 and 70:
Page 71 and 72:
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Jaromír BRAMBOR4.5. MODÈLE FORMEL
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Partie IIAlgorithmeset les skeleton
Page 99 and 100:
CHAPITRE 5Algorithmes de voisinagen
Page 101 and 102:
Jaromír BRAMBOR5.1. ALGORITHMES É
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110:
Page 111 and 112:
Page 113 and 114:
Page 115 and 116:
Jaromír BRAMBOR5.3. ALGORITHMES G
Page 117 and 118:
Jaromír BRAMBOR5.3. ALGORITHMES G
Page 119 and 120:
Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 121 and 122:
Jaromír BRAMBOR5.4. ALGORITHMES PO
Page 123 and 124:
Jaromír BRAMBOR5.5. RÉSULTATS EXP
Page 125 and 126:
Jaromír BRAMBOR5.6. RÉCAPITULATIO
Page 127 and 128:
CHAPITRE 6Permutation SIMD des arra
Page 129 and 130:
Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 131 and 132:
Jaromír BRAMBOR6.2. APPROCHE MACRO
Page 133 and 134:
Jaromír BRAMBOR6.3. ALGORITHMES RA
Page 135 and 136: Jaromír BRAMBOR6.3. ALGORITHMES RA
Page 141 and 142: Jaromír BRAMBOR6.4. NOTES SUR L’
Page 145 and 146: Jaromír BRAMBOR6.5. RÉCAPITULATIO
Page 147 and 148: CHAPITRE 7Algorithmes de voisinaged
Page 149 and 150: Jaromír BRAMBOR7.1. PARTICULARITÉ
Page 151 and 152: Jaromír BRAMBOR7.3. SKELETON ALGOR
Page 163 and 164: Jaromír BRAMBOR7.6. RÉCAPITULATIO
Page 165 and 166: CHAPITRE 8Algorithmes de la dilatat
Page 167 and 168: Jaromír BRAMBOR8.2. APPROCHE EMPLO
Page 173 and 174: Jaromír BRAMBOR8.3. RÉSULTATS EXP
Page 175 and 176: Jaromír BRAMBOR8.3. RÉSULTATS EXP
Page 177 and 178: CHAPITRE 9Algorithmes et complexit
Page 179 and 180: Jaromír BRAMBOR9.4. ESTIMATION DE
Page 181 and 182: Jaromír BRAMBOR9.5. EXEMPLE D’ES
Page 183 and 184: Jaromír BRAMBOR9.6. ESTIMATION DE
Page 185: Jaromír BRAMBOR9.6. ESTIMATION DE
Page 189 and 190: Conclusion et perspectives
Page 191 and 192: Conclusion et perspectivesConclusio
Page 193 and 194: Jaromír BRAMBORtations sur les GPU
Page 195 and 196: Jaromír BRAMBORsemble inadapté, d
Page 197 and 198: Annexe
Page 199 and 200: Annexe AFonctions pour assurer l’
Page 201 and 202: Annexe BDéfinitions des fonctions
Page 203 and 204: Jaromír BRAMBORtestSIMD :: PVec I
Page 205 and 206: Liste des termes et des abréviatio
Page 207 and 208: Liste des figures1.1 Évolution du
Page 209 and 210: Jaromír BRAMBORListe des figures7.
Page 211 and 212: Liste des tableaux1.1 Évolution de
Page 213 and 214: Bibliographie[AD03] Marco ALDINUCCI
Page 215 and 216: Jaromír BRAMBORBibliographie[Cou02
Page 217 and 218: Jaromír BRAMBORBibliographie[Gha99
Page 219 and 220: Jaromír BRAMBORBibliographie[Lem96
Page 221 and 222: Jaromír BRAMBORBibliographie[RS01]
Page 223 and 224: Jaromír BRAMBORBibliographie[Wik06
Page 225 and 226: IndexSymbols+, fonction . . . 62, 7
Page 227 and 228: Jaromír BRAMBORINDEXICL . . . . .
Page 229: Jaromír BRAMBORINDEXspecNgbSQR, fo
show all

Algorithmes de la morphologie mathématique pour - Pastel - HAL

Create successful ePaper yourself

Delete template?

Save as template?