12.07.2015 Views

Algorithmes de la morphologie mathématique pour - Pastel - HAL

Algorithmes de la morphologie mathématique pour - Pastel - HAL

Algorithmes de la morphologie mathématique pour - Pastel - HAL

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Algorithmes</strong> <strong>de</strong> <strong>la</strong> <strong>morphologie</strong> <strong>mathématique</strong> <strong>pour</strong> les architectures orientées fluxJaromír BRAMBORLa portabilité d’un programme qui utilise les instructions spécialisées à une autre architecture est unautre sujet à discuter. Le co<strong>de</strong> écrit <strong>pour</strong> une architecture particulière qui, <strong>de</strong> plus, s’en sert couramment,est difficile à porter à une autre architecture. Le grand avantage <strong>de</strong>s instructions multimédia <strong>de</strong>s architecturesGPPMM est que <strong>pour</strong> quasiment tous les représentants existants <strong>de</strong>s GPPMM nous trouvons, dansleurs jeux d’instructions, les instructions multimédia qui assurent <strong>de</strong>s fonctionnalités i<strong>de</strong>ntiques ou trèssimi<strong>la</strong>ires.De ce point <strong>de</strong> vue, <strong>la</strong> solution <strong>de</strong> portage peut être réalisée à l’ai<strong>de</strong> <strong>de</strong> <strong>la</strong> couche d’abstraction dumatériel, <strong>HAL</strong>, une couche intermédiaire au niveau du logiciel qui encapsule les différences <strong>de</strong>s co<strong>de</strong>sassembleurs <strong>de</strong> différentes architectures et n’exporte qu’un interface unifié et généralisé. Tel est le cas<strong>pour</strong> l’outil <strong>de</strong> recherche MorphoMedia Bra05 . Les GPU, eux aussi, sont dotés <strong>de</strong> <strong>la</strong> couche <strong>HAL</strong> présentéepar le pipeline graphique abstrait au niveau du logiciel.3.3 Consommation d’énergieUn paramètre important <strong>pour</strong> le choix d’une architecture et qui est étroitement lié à <strong>la</strong> performanceque l’on vient <strong>de</strong> discuter dans 3.2, est <strong>la</strong> consommation <strong>de</strong> l’énergie. Pour certaines applications, <strong>la</strong>consommation ne joue pas un rôle important et le seul facteur limitant <strong>pour</strong>rait être le coût <strong>de</strong> l’électricité.Pour d’autres, <strong>la</strong> consommation d’énergie est le facteur majeur du choix du matériel, surtout <strong>pour</strong>les applications portables et nomadiques où l’équipement matériel n’est pas toujours connecté à une alimentationfixe et où ont doit gérer <strong>la</strong> consommation, d’une façon ou l’autre. Ce<strong>la</strong> est assuré souvent parl’utilisation <strong>de</strong>s régimes économiques qui changent <strong>la</strong> fréquence du processeur selon les besoins actuels<strong>de</strong> performance ou qui arrêtent partiellement ou complètement le fonctionnement en cas d’inactivité.Dans ces cas précis, le taux consommation/performance est celui qui oriente le choix d’un processeurplutôt que d’un autre.La table 3.2 présente une liste non exhaustive <strong>de</strong>s processeurs issus <strong>de</strong>s architectures que nous ciblonsdans cette thèse. Le premier groupe présente <strong>la</strong> consommation <strong>de</strong> processeurs GPP/GPPMM. Le<strong>de</strong>uxième groupe, en contraste avec le premier, présente les GPP/GPPMM mobiles ou à basse consommation.Le troisième groupe présente <strong>la</strong> consommation <strong>de</strong>s GPU. Le tableau finit par présenter <strong>la</strong> consommation<strong>de</strong>s consoles <strong>de</strong> jeux, c’est-à-dire d’autres architectures spécialisées qui peuvent être visées parles algorithmes décrits dans cette thèse.Ce qui nous intéresse quant aux processeurs dans ce tableau, c’est <strong>la</strong> consommation d’énergie. Pourl’information, nous y présentons également les valeurs <strong>de</strong> MIPS et <strong>de</strong> FLOPS que nous avons pu collecter<strong>pour</strong> que le lecteur se fasse une idée <strong>de</strong>s performances liées à <strong>la</strong> consommation. Tout en sachant que ces<strong>de</strong>scripteurs ne sont pas les meilleurs que l’on puisse trouver <strong>pour</strong> évaluer <strong>la</strong> performance mais ils nouspermettent <strong>de</strong> comparer, au moins au niveau <strong>de</strong> l’ordre, les performances d’architectures aussi différentesque, par exemple, SH-5 et AMD Athlon64 FX-60 avec <strong>de</strong>ux cœurs.Le premier regard sur les données dans le tableau 3.2 nous révèle que <strong>la</strong> consommation <strong>de</strong>s GPPMM,<strong>de</strong>s GPU et <strong>de</strong>s consoles <strong>de</strong> jeux est <strong>de</strong> même ordre. Comme les vainqueurs sortent <strong>de</strong> cette comparaisonles consoles <strong>de</strong> jeux car si on vou<strong>la</strong>it obtenir l’équivalent d’une telle solution à partir <strong>de</strong>s GPP et GPU,nous <strong>de</strong>vrions additionner <strong>la</strong> consommation d’un GPP choisi avec <strong>la</strong> consommation d’un GPU choisi cequi donnerait à l’estime une somme <strong>de</strong>ux fois supérieure à celle <strong>de</strong>s consoles <strong>de</strong> jeux. Dans une tellelogique, le ratio performance-consommation est plus favorable aux consoles <strong>de</strong> jeux.Les solutions à consommation basse ou réduite se font remarquer par <strong>la</strong> consommation inférieure<strong>de</strong> quelques ordres par rapport aux solutions décrites précé<strong>de</strong>mment. Ce qui n’est pas surprenant car ils’agit <strong>de</strong> leur désignation. En même temps, ils n’offrent pas les mêmes performances. La différence estimportante mais le ratio MIPS par Watt est plus élevé <strong>pour</strong> les solutions à basse consommation.Parmi les architectures <strong>de</strong> ce type et tout-à-fait intéressantes qui combinent une haute performanceet une basse consommation d’énergie nous trouvons les architectures VLIW. Ces architectures sont représentéespar les processeurs tels que ST200 Bag02 basés sur <strong>la</strong> p<strong>la</strong>teforme nommée Lx FBF00 <strong>de</strong> STMicroelectronicset par les processeurs Transmeta Crusoe Tra05a et Efficeon Tra05b . Le <strong>de</strong>rnier, Transmeta42

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!