Laboration 2

More documents

Recommendations

Info

Laboration 2 Assemblering av program DLX-simulatorn läser program skrivna i DLX-assemblyspråk. Man editerar ett assemblyspråksprogram på vanligt sätt. Det enda man måste tänka på är att programmet inte får exekveras i oändlig slinga och att det måste avslutas med assemblyinstruktionen trap #0. Filnamnet måste ha filtypen “s”. Start av simulatorn I katalogen /home/obelix/staff/ide/nesse/cache/ finns några algoritmer kodade i DLX-assemblyspråk. Ställ dig i hemmakatalogen. Dess filer, och några andra som inte finns där, kopieras till en underkatalog med namnet cache_lab genom kommandot: /home/obelix/staff/ide/nesse/bin/init_cache Förflytta Dig därefter till denna katalog och starta därefter cachesimulatorn med kommandot cache example0 Efter att programmet lästs in och analyserats av simulatorn skapas ett fönster som lämpligtvis positioneras någonstans i mitten av skärmen. Simulatorns funktioner I Figur 2.1 visas en bild över simulatorn. Vi skall gå igenom de olika funktionerna nedan. Tre boxar symboliserar CPUn, cachen och huvudminnet. Mellan CPUn och cachen finns tre fält som vid exekvering visar adress, data och typ av operation för den minnesoperation som CPUn initierat. Adressen visas också indelad i tag, index och offset ovanför linjen mellan CPUn och cachen. Figur 2.1: Simulatorn med de tre boxarna: CPU, cache och minne. Minnesoperationerna som initieras av cachen visas på motsvarande sätt mellan cachen och minnet. I figuren visas ett läge då CPUn läser in en instruktion som är 32 bitar (Read L står för läsning av ett 32-bitars ord och I står för instruktionsuthämtning). Minnesoperationen ger upphov till en cachemiss (minnet är mörklagt) som leder till att blocket på samma adress hämtas. Allmänt gäller att den enhet som är aktiverad (cache eller minne) mörkläggs vid en minnesoperation. På så vis ser man lätt om en minnesoperation leder till träff (eng. hit) eller miss. Notera att alla minnesoperationer motsvarar 32 bitar. Exekvering av program Man kan välja mellan tre sätt att exekvera ett program. Dels kan man exekvera programmet i full fart med (till vänster i figuren) eller så kan man exekvera det till nästa minnesreferens med Step . Go 3 Laboration 2 Ett tredje sätt är att exekvera programmet ett antal minnesreferenser framåt genom att ange ett antal i fältet under No of steps. I detta fall kan man låta exekveringen ske i halvfart genom Visual . Härvid kommer cachen respektive minnet att blinka till när de aktiveras. Man kan också exekvera det i full fart med Go fältet under No of steps. Det finns också möjlighet att ställa in brytpunkter på en viss adress. Detta görs under CPU-menyn (se nedan). Ovanstående funktioner erhålls genom att motsvarande fält pekas ut samtidigt som vänster musknapp trycks ned. Då programmet är färdigexekverat, kommer adressfälten att blankställas. Ändring av parametrar för CPU, cache- och minnesorganisation Det finns tre popup-menyer för att ställa in olika parametrar. Dessa menyer är CPU-menyn, cache-menyn samt minnes-menyn. Menyerna erhålls genom att peka på motsvarande box (CPU-menyn fås då CPUn pekas ut) samtidigt som vänster musknapp trycks ned. I CPU-menyn kan följande göras: • Reset. Initiering av CPUn. Detta måste göras före exekvering av ett program. • Change. Ändra klockcykeltid för CPUn. • Break On Address. Inställning av brytpunkt för adress. • Quit. Lämna simulatorn. I cache-menyn kan följande göras: • Change. Ändring av cacheorganisation. • Contents. Inspektion av cacheinnehållet. Om Change väljs, erhålls ett fönster i vilket man kan ändra olika parametrar som styr organisationen. Fönstrets utseende visas i Figur 2.2. Figur 2.2: Fönstret i vilket man ändrar cacheorganisationen. 4
Laboration 2 Laboration 2 Som figuren visar kan man ändra cachestorlek, blockstorlek, antal mängder (eng. set) (adressavbildningsmetod), accesstid, uppdateringsstrategi (eng. write policy) samt utbytesalgoritm (eng. replacement policy). Cache och blockstorlek anges i antal 32-bitars ord, som vi hädanefter kommer att kalla för ord, kort och gott. De numeriska värdena ändras genom att man ökar eller minskar genom att trycka på “+” eller “-”. Övriga parametrar ändras genom att trycka på det högra fältet på motsvarande rad ett antal gånger tills önskat alternativ kommer upp. Om man exempelvis vill ändra till copy-back, pekar man ut fältet i vilket det står write-through och trycker därefter på vänster musknapp. Fönstret tas bort genom att aktivera rutan Close . Om Contents väljs skapas ett fönster i vilket man kan studera såväl innehållet i varje block i cachen som den information som krävs av adressavbildningsmetoden och utbytesalgoritmen. Nedan visas cacheinnehållet efter exekvering av ett program med en mängd-associativ, 8 ords cache med 1 ord / block och 2 block/mängd som använder utbytesalgoritmen LRU samt upp\-dateringsstrategin copy-back (förklaras senare i kommande avsnitt). V D R Tag Block - - - --- ----- 0 : 1 1 0 80b 0 0 0 8 1 0 1 805 0 a 24 d9 1 : 1 0 0 805 4 80 0 0 1 0 1 808 0 0 0 8 2 : 1 1 1 80a 0 0 0 6 1 0 0 805 0 1 66 f6 3 : 1 0 0 805 4e 72 27 0 1 1 1 80a 0 0 0 7 Varje rad motsvarar informationen i ett cacheblock med statusbitarna (V=Valid, D=Dirty samt R=Reference för LRU och FIFO) och taggen. Därefter följer blockinnehållet (1 ord = 4 bytes). Fönstret uppdateras efter varje minnesoperation. Det tas bort genom att aktivera Close . Ovanför linjen mellan CPUn och cachen finns tre fält som visar adressen som CPUn lägger ut uppdelad i tag, index och offset. Detta är tänkt att underlätta inspektionen av cacheinnehållet. I minnes-menyn kan följande göras: • Change. Ändring av minnesorganisation. • Contents. Inspektion av minnesinnehållet. Under change kan man ändra minnesbredden, dvs det antal (32-bitars) ord som kan överföras mellan cachen och huvudminnet i en minnesaccess. Man kan också ändra minnesaccesstiden. Minnesinnehållet kan studeras genom att välja Contents. Detta presenteras blockvis och uppdateras efter varje minnesoperation. Resultat av simuleringar Med en fjärde popup-meny, show-menyn, kan man få ut resultatet från en simulering. Denna popup-meny erhålls då mittersta musknappen trycks ned inom simulator-fönstret. I show-menyn kan följande göras: • Show Result. • Show Hitgraph, All • Show Hitgraph, Data • Show Hitgraph, Instr • Show Localitygraph, All • Show Localitygraph, Data • Show Localitygraph, Instr Show Result visar andel träffar, exekveringstid, antal minnesreferenser, andel skrivningar etc för senaste simuleringen. Show Hitgraph visar hur hit-ratio varierar med tiden (i antal minesreferenser) under exekveringen. Man kan välja att studera detta för alla minnesreferenser, endast data eller instruktioner. Show Localitygraph visar hur minnesreferenserna fördelar sig i adressrymden som funktion av tiden (i minnesreferenser). Även här kan man välja att studera alla, endast data eller instruktionsreferenser. Man kan få ut diagram och textutskrifter på skrivare genom att aktivera Hardcopy fältet i respektive fönster. För diagrammen måste man därefter aktivera Postscript och blankställa fältet med skrivarens namn. Allra sist aktiveras OK varvid diagrammet skrivs ut på laserskrivaren. Konstruktionsprinciper för cacheminne Lokalitetsprincipen En cacheminneshierarki består av ett litet snabbt minne (cacheminnet) och ett långsamt större minne (huvudminne). Genom att endast lagra de delar av huvudminnet som används ofta i cacheminnet, kommer de flesta minnesreferenser att kunna betjänas av cachen och vi får en skenbar accesstid som ligger mycket nära cacheminnets. Anledningen att denna enkla teknik fungerar bra beror på lokaliteten hos minnesreferenserna i adressrymden. Vi skall studera lokaliteten för två program. Det första programmet — example0 — finns längst bak i denna handledning. Programmet bestämmer en svit av Fibonaccital. Hemuppgift 2.1 Studera assemblykoden för programmet example0.s och besvara nedanstående fråga Hur många (32-bitars) ord upptar for-loopen Ledning: Du finner adresserna i hexadecimal form längst till vänster i listan. Svar: _____________________________________________________________________________________ ——————————————————————————————————— Slut på hemuppgift 2.1 Vi skall studera vilka adresser som refereras under exekveringen av detta program. Detta görs genom att studera den s.k. lokalitetsgrafen för programmet. I lokalitetsgrafen avsätts adressrymden längs y-axeln och tiden (räknat i minnesreferenser) längs x-axeln. 5 6
Page 1: Laboration 2 Laboration 2 Syftet me
Page 5 and 6: Laboration 2 Cacheorganisationer oc
Page 7 and 8: Laboration 2 Laboration 2 Exekvera
Page 9 and 10: Laboration 2 Börja med en blocksto
Page 11 and 12: Laboration 2 Laboration 2 Hur lång

Laboration 2

Create successful ePaper yourself

Delete template?

Save as template?