Fonctionnement d'un ordinateur depuis zéro

More documents

Recommendations

Info

$Rédigez des documents de qualité avec Latex Noël-Arnaud Maguis$

$Chapitre 1 : Qu'est-ce que Latex - Site du Zéro$

Partie 7 : Le parallélisme d'instruction et les processeurs modernes 330/343 cela, notre Reorder Buffer est une sorte de mémoire, triée l'ordre d'ajout : les instructions sont ainsi triées de celles ajoutées les lus récemment aux plus anciennes. Seule l'instruction la plus ancienne peut quitter le Reorder Buffer et enregistrer son résultat une fois que celui-ci aura été stocké dans le Reorder Buffer. Les autres, plus récentes, doivent attendre que cette instruction, la plus ancienne, aie enfin son résultat. Pour les programmeurs : oui, vous avez bien compris. Le Reorder Buffer est une file ! Cela a une conséquence immédiate : plus un Reorder Buffer peu contenir d'instruction, plus on pourra éxecuter d'instructions de façon anticipée. L’exécution Out-Of-Order sera ainsi plus facile et donnera de meilleurs résultats. Sur les processeurs utilisant un séquenceur micro-codé, certaines améliorations au niveau de l'unité de décodage d'instruction permettent de mieux utiliser ce Reorder Buffer en faisant un peu de place. Ces fameuses améliorations sont celles qui consistent à fusionner une ou plusieurs instructions machines en une seule micro-opération. Sur ces processeurs, notre Reorder Buffer va en effet stocker des micro-instruction, et non des instructions machines complètes. En fusionnant plusieurs instructions machines ou micro-opérations en une seule, on diminue le nombre d'instructions à stocker dans le Reorder Buffer, et on gagne un peu de place. L'effet de ce genre d'optimisations est loin d'être négligeable ! Branchements et exceptions Dans le chapitre parlant de la prédiction de branchement, j'avais dit qu'il y avait deux solutions pour remettre le pipeline à son état originel en cas de mauvaise prédiction de branchement : empêcher nos instructions fautives d'enregistrer leurs résultats dans les registres (sous entendu, les registres architecturaux), ou remettre les registres à leurs valeurs originelles à partir d'une sauvegarde de ceux-ci. Le Reorder Buffer permet d'implémenter facilement la première solution. C'est lui qui empêche les instructions exécutées de façon anticipées d'enregistrer leurs résultats dans les registres architecturaux. en cas de mauvaise prédiction de branchement. Si une interruption ou une mauvaise prédiction de branchement a lieu, le Reorder Buffer se débarrassera des résultats des instructions qui suivent l'instruction fautive (celle qui a déclenché l'interruption ou la mauvaise prédiction de branchement) : ces résultats ne seront pas enregistrés dans les registres architecturaux. Mais les résultats des instructions précédant l'instruction fautive seront tout de même sauvegardés et réutilisables au besoin, permettant à notre processeur de reprendre là où il en était. Register file unifié Dans la version vue plus haut, on utilise bien un jeu de registre architecturaux, et un autre jeu de registres stockant les registres logiques : le reorder buffer, avec ses reservations stations. Mais on peut améliorer la structure vue au-dessus en utilisant non pas plusieurs register files, mais un seul. On utilisera alors un grand register file, qu'on appellera le Physical Register File. Celui-ci stockera aussi bien les résultats en attente d'écriture (qui correspondent à des registres virtuels, c'est à dire le reorder buffer et les reservations stations) que les résultats définitifs (ceux qui correspondent à des registres architecturaux). Dans ce cas, les reservations stations et le reorder buffer ne stockent plus les opérandes de l'instruction, mais seulement le tag correspondant au registre qui contient la donnée dans ce grand register file unifié. Notre processeur a juste à se souvenir pour chaque registre architectural à quel registre du Physical Register File il correspond. Et pour cela, il utilise une Register Map Table, une mémoire qui stocke les correspondances entre un registre architectural et le registre logique associé. Les avantages à cette technique sont multiples : déjà, les données n'ont plus besoin d'être copiée du Reorder Buffer vers les registres architecturaux une fois le résultat de l'instruction valide. Au lieu de copier la donnée du Reorder Buffer vers les registres architecturaux, il suffit de mettre à jour la Register Map Table. Ainsi, Les Reservations Stations et le Reorder Buffer ne stockent plus directement les données de nos instructions ou leurs résultat. Ils vont simplement indiquer où ce résultats ou ces opérandes sont placées dans le Physical Register File. Ce tag est bien plus court que les opérandes à manipuler, ce qui économise pas mal de circuits. De plus, on supprime les copies entre Reorder Buffer et registres architecturaux. Les processeurs utilisant cette amélioration consomment donc beaucoup moins d'énergie et sont plus économes en électricité. C'est pour cela que cette amélioration est utilisé sur les derniers processeurs actuels. www.siteduzero.com
Partie 7 : Le parallélisme d'instruction et les processeurs modernes 331/343 Les optimisations des accès mémoire Dans tout ce qu'on a vu précédemment, on a surtout parlé des instructions arithmétiques et des branchements. Le chapitre sur l’exécution Out Of Order nous a montré que l'on pouvait modifier l'ordre des instructions pour gagner en efficacité. Et avec le chapitre sur le renommage de registre, on a vu comment supprimer certaines dépendances entre instructions lorsque ces instructions utilisant des registres. Ainsi, si deux instructions réutilisaient le même registre, mais à des instants différents, on pouvait supprimer les dépendances WAR et WAW qui en résultait. Le seul problème, c'est que tout cela n'est valable que pour les instructions travaillant sur des registres. Si nos instructions doivent aller lire ou écrire dans la mémoire, le renommage de registre ne servira à rien ! Dans ce cas précis, on ne peut donc supprimer les dépendances WAR et WAW avec ce genre de techniques, ce qui diminue les possibilités d’exécution Out Of Order. Pour améliorer la situation, il a fallu trouver un moyen de limiter les effets de ces dépendances de données entre instructions d'accès mémoires. Pour ce faire, les concepteurs de processeurs et les chercheurs en architecture des ordinateurs ont inventés diverses techniques plus ou moins efficaces permettant de gérer ces dépendances entre instructions mémoires. Ces techniques sont ce qu'on appelle des techniques de Memory Disambiguation. Dépendances, le retour ! Modifier l'ordre d’exécution des accès à la mémoire est une chose assez efficace en terme de performances. Par exemple, il vaut mieux effectuer les lectures le plus tôt possible. Il faut dire que ces lectures prennent un certain temps : accéder à une donnée ne se fait pas immédiatement. Cela peut prendre moins de 10 cycles d'horloge pour un accès au cache L1, mais peut facilement monter et atteindre des nombres à 2 chiffres pour les accès au L2, et trois chiffres pour les accès à la mémoire. Autant dire que ne rien faire durant cet accès au cache ou à la mémoire, et faire attendre les instructions suivant une instruction de lecture n'est pas une bonne chose. L'idéal serait d’exécuter des instructions indépendantes de l'accès en mémoire pendant qu'on attend que la donnée voulue soit lue. Pour ce faire, il suffit d’exécuter la lecture le plus précocement possible, et éxecuter des instructions indépendantes pendant ce temps. Seul problème : il faut que toutes les instructions ayant une dépendance avec cette lecture aient déjà finies de s’exécuter avant qu'on puisse lancer la lecture. Si on se trouve dans un tel cas, il se peut que l'on ne puisse démarrer notre lecture aussi tôt que prévu, parce qu'une instruction ayant une dépendance avec notre lecture n'est pas terminée : impossible de faire passer notre lecture avant celle-ci. Reste à savoir si ces dépendances sont monnaie courante. Utilité Dans le chapitre précédent, on a vu que ces dépendances naissaient lorsque l'on des instructions différentes veulent lire ou écrire dans des emplacements mémoire identiques. Dans les cas des registres, cela arrive très souvent : un processeur possède souvent une faible quantité de registres, qui doit donc être utilisée au mieux. Ainsi, nos compilateurs n’hésitent pas à réutiliser des registres dès que possible, et n'hésitent pas à écraser des données qui ne sont plus nécessaires pour stocker des résultats utiles. Réutiliser des registres le plus possible fait donc apparaitre de nombreuses dépendances WAR et WAW. Mais pour les accès mémoires, c'est autre chose. Accéder à la mémoire n'est pas rare, certes, mais réutiliser de la mémoire l'est. Il est en effet très rare qu'on doive lire ou écrire à des adresses identiques dans un cours laps de temps, et rares sont les dépendances WAR et WAW. Il faut dire que ces situations correspondent souvent à des données qui sont stockées temporairement sur la pile, à cause d'un manque de registres. On pourrait donc croire que chercher à supprimer les dépendances WAR et WAW pour les accès à la mémoire ne servirait que marginalement, et ne serait donc qu'un coup d'épée dans l'eau. Mais la situation est beaucoup plus compliquée que ce que cette présentation naïve vous l'a laissé entendre. De nouvelles dépendances Le seul truc, c'est que notre processeur ne peut pas toujours savoir si deux accès à la mémoire vont se faire au même endroit ou pas. Pour les instructions utilisant l'adressage absolu (l'adresse à laquelle lire ou écrire est stockée dans la suite de bits représentant notre instruction), il n'y a pas de problèmes. Mais le seul truc, c'est que ce n'est pas le cas pour d'autres modes d'adressages. Par exemple, il n'est pas rare que nos adresses soient stockées dans des registres. Il est en effet monnaie courante de ne pas connaitre à l'avance les adresses à laquelle lire ou écrire, et calculer des adresses est une chose commune de nos jours. Dans des cas pareils, il est impossible de savoir si deux accès à la mémoire se font à la même adresse ou pas. Bilan : deux accès à la mémoire peuvent être totalement indépendants, mais le processeur ne peut pas le savoir. Résultat : il est obligé de supposer par sécurité que ces deux accès sont dépendants, ce qui va limiter ses possibilités. Il ne pourra pas changer l'ordre de ses instructions pour gagner en efficacité. Et cela arrive très souvent : presque à chaque accès mémoire ! Il faut noter que ce genre de situations arrive aussi dans un domaine assez éloigné. Certains compilateurs doivent faire face à un problème similaire dans certaines situations : dans certaines conditions, ils ne savent pas si deux adresses mémoire utilisées dans un programme sont différentes ou pas. Et dans ces conditions, ils doivent éviter de modifier l'ordre des accès à ces adresses, ce qui limite grandement les possibilités d’optimisation. C'est ce qu'on appelle le phénomènes d'aliasing des pointeurs. www.siteduzero.com
Page 1 and 2:
Fonctionnement d'un ordinateur depu
Page 3 and 4:
Sommaire 3/343 Noms de registre ...
Page 5 and 6:
Sommaire 5/343 Ordre des requêtes
Page 7 and 8:
Lire aussi 7/343 Le Reorder Buffer
Page 9 and 10:
Fonctionnement d'un ordinateur depu
Page 11 and 12:
Partie 1 : Tout ça rien qu'avec de
Page 13 and 14:
Page 15 and 16:
Page 17 and 18:
Page 19 and 20:
Page 21 and 22:
Page 23 and 24:
Page 25 and 26:
Page 27 and 28:
Page 29 and 30:
Page 31 and 32:
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
Page 41 and 42:
Page 43 and 44:
Page 45 and 46:
Page 47 and 48:
Partie 2 : Architecture de base 47/
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
Page 61 and 62:
Page 63 and 64:
Page 65 and 66:
Page 67 and 68:
Page 69 and 70:
Page 71 and 72:
Partie 3 : Processeur et Assembleur
Page 73 and 74:
Page 75 and 76:
Page 77 and 78:
Page 79 and 80:
Page 81 and 82:
Page 83 and 84:
Page 85 and 86:
Page 87 and 88:
Page 89 and 90:
Page 91 and 92:
Page 93 and 94:
Page 95 and 96:
Page 97 and 98:
Page 99 and 100:
Page 101 and 102:
Page 103 and 104:
Page 105 and 106:
Page 107 and 108:
Page 109 and 110:
Page 111 and 112:
Page 113 and 114:
Page 115 and 116:
Page 117 and 118:
Page 119 and 120:
Page 121 and 122:
Page 123 and 124:
Page 125 and 126:
Page 127 and 128:
Page 129 and 130:
Page 131 and 132:
Page 133 and 134:
Page 135 and 136:
Page 137 and 138:
Page 139 and 140:
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Page 149 and 150:
Page 151 and 152:
Page 153 and 154:
Page 155 and 156:
Page 157 and 158:
Page 159 and 160:
Page 161 and 162:
Page 163 and 164:
Partie 4 : Mémoires 163/343 Oui, e
Page 165 and 166:
Partie 4 : Mémoires 165/343 Les m
Page 167 and 168:
Partie 4 : Mémoires 167/343 Bus d'
Page 169 and 170:
Partie 4 : Mémoires 169/343 Bus mu
Page 171 and 172:
Partie 4 : Mémoires 171/343 (SRAM,
Page 173 and 174:
Partie 4 : Mémoires 173/343 Quand
Page 175 and 176:
Partie 4 : Mémoires 175/343 Commen
Page 177 and 178:
Partie 4 : Mémoires 177/343 C'est
Page 179 and 180:
Partie 4 : Mémoires 179/343 Ce mon
Page 181 and 182:
Partie 4 : Mémoires 181/343 Logiqu
Page 183 and 184:
Partie 4 : Mémoires 183/343 Contr
Page 185 and 186:
Partie 4 : Mémoires 185/343 (souve
Page 187 and 188:
Partie 4 : Mémoires 187/343 Ainsi,
Page 189 and 190:
Partie 4 : Mémoires 189/343 mémoi
Page 191 and 192:
Partie 4 : Mémoires 191/343 Comme
Page 193 and 194:
Partie 4 : Mémoires 193/343 lire o
Page 195 and 196:
Partie 4 : Mémoires 195/343 En fai
Page 197 and 198:
Partie 4 : Mémoires 197/343 Mémoi
Page 199 and 200:
Partie 4 : Mémoires 199/343 adress
Page 201 and 202:
Partie 4 : Mémoires 201/343 Et min
Page 203 and 204:
Partie 4 : Mémoires 203/343 Si vou
Page 205 and 206:
Partie 4 : Mémoires 205/343 Qui pl
Page 207 and 208:
Partie 4 : Mémoires 207/343 Avec l
Page 209 and 210:
Page 211 and 212:
Partie 4 : Mémoires 211/343 Premie
Page 213 and 214:
Partie 4 : Mémoires 213/343 Petite
Page 215 and 216:
Partie 4 : Mémoires 215/343 Sur ce
Page 217 and 218:
Page 219 and 220:
Partie 4 : Mémoires 219/343 conten
Page 221 and 222:
Partie 5 : Périphériques, bus, et
Page 223 and 224:
Page 225 and 226:
Page 227 and 228:
Page 229 and 230:
Page 231 and 232:
Page 233 and 234:
Page 235 and 236:
Page 237 and 238:
Page 239 and 240:
Page 241 and 242:
Page 243 and 244:
Page 245 and 246:
Page 247 and 248:
Page 249 and 250:
Partie 6 : Hiérarchie mémoire 249
Page 251 and 252:
Page 253 and 254:
Page 255 and 256:
Page 257 and 258:
Page 259 and 260:
Page 261 and 262:
Page 263 and 264:
Page 265 and 266:
Page 267 and 268:
Page 269 and 270:
Page 271 and 272:
Page 273 and 274:
Page 275 and 276:
Page 277 and 278:
Page 279 and 280: Partie 6 : Hiérarchie mémoire 279
Page 287 and 288: Partie 7 : Le parallélisme d'instr
Page 329: Partie 7 : Le parallélisme d'instr
show all

Fonctionnement d'un ordinateur depuis zéro

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?