Virtueller Speicher Einführung

Vorwort: 

Virtueller Speicher 

Die virtuelle Speichertechnik besitzt ein sehr breites Spektrum an verschiedenen 

Realisierungen. Es gibt praktisch keine zwei Architekturen, welche genau die gleiche 

Implementierung der virtuellen Speichertechnik besitzen. Es würde deshalb den Rahmen 

sprengen auf jedes Detail einzugehen. Es sollen deshalb vielmehr die Grundideen und 

Prinzipien der virtuellen Speichertechnik vermittelt werden. 

• Inhalt 

• Einführung 

o Motivation 

• Allgemeine Prinzipien 

o Prinzip der Lokalität 

o Speicherhierarchie 

• Adreßumsetzung 

o Mapping 

o Seitentafel (page table) 

Mehrstufige Seitentafel 

Invertierte Seitentafel 

• Seitenverwaltung 

o Blockplazierung 

o Blockersetzung 

o Schreibstrategie 

o Seitenfehler 

o Seitengröße 

o Seitengrößenerweiterung (page size extension) 

• Adreßumsetzungspuffer (TLB) 

• Speicherschutz 

• Zusammenfassung 

• Literatur 

• Über dieses Dokument ... 

Einführung 

1962 hatte Kilburn die Idee, die zwei Ebenen Kern- und Trommelspeicher automatisch zu 

verwalten und als eine Ebene erscheinen zu lassen. Er demonstrierte seine Idee eines 

virtuellen Speichers an einem Atlas-Computer an der University of Manchester [1].

Zuerst wurde die virtuelle Speichertechnik nur in Großrechnern implementiert. Erst seit 

Entwicklung des 386-Prozessor (interne MMU ) findet sie auch in der Welt des PCs 

Verwendung. Seit über 10 Jahren ist die virtuelle Speichertechnik in jeder Workstation 

implementiert. Es gibt aber spezielle Systeme (Embedded Systems) die keinen virtuellen 

Speicher benutzen, da sie besonders zeiteffektive Serverfunktionen durchführen. 

Die MMU (memory management unit) ist ein Bestandteil von Mikroprozessoren, der 

die internen Register und Speicherbereiche wie z.B. virtuellen Speicher und 

Prozessor-Caches steuert. 

. 

Motivation 

Der Wunsch von Programmierern ist es, über einen scheinbar unbeschränkt großen Speicher 

zu verfügen, um nicht darauf achten zu müssen, daß die Programme zu groß werden. 

Deswegen benötigt man eine Speichertechnik, welche mehr Code und Daten im Speicher 

unterbringen kann als realer Speicher (Hauptspeicher) vorhanden ist. 

Ein weiteres Problem der Speicherverwaltung ist die Fragmentierung des realen Speichers, da 

Code und Daten eines Prozesses fortlaufende Adressen haben müssen. Dies kann dazu führen, 

daß für einen Prozeß kein Platz mehr frei ist, obwohl noch an anderer Stelle Platz im Speicher 

frei ist. Dies wird in Abb. 1.1 dargestellt. 

Abbildung 1.1: Ohne virtuellen Speicher hat Prozeß 2 zuwenig Platz, um noch weitere Seiten 

zu benutzen. Mit virtuellem Speicher kann er Platz an einer anderen freien Stelle im 

Hauptspeicher verwenden. 

In den heutigen Multiprocessing-Betriebssystemen laufen mehrere Prozesse gleichzeitig. 

Dabei ist ein Schutz von Daten und Code der einzelnen Prozesse nötig, sowie die Möglichkeit 

der Kommunikation zwischen den Prozessen und der gemeinsamen Nutzung von Code und

Daten. Dazu muß der physikalische Speicher auch auf mehrere Prozesse aufgeteilt werden 

können, um sinnvoll mit Multiprocessing zu arbeiten. Die virtuelle Speichertechnik löst diese 

Probleme, indem sie die Ebenen Hauptspeicher und sekundären Speicher automatisch und 

geschickt steuert. 

Prinzip der Lokalität 

Die meisten Programme greifen nicht gleichmäßig auf ihren Code und ihre Daten zu [2]. Die 

Untersuchung dieser Feststellung führt zum Prinzip der Lokalität, daß sich in zeitliche und 

räumliche Lokalität aufteilt. 

• räumliche Lokalität: Nachdem auf eine Adresse zugegriffen wurde, erfolgt 

wahrscheinlich ein Zugriff auf eine benachbarte Adresse. 

Das linke Beispiel in Abb. 2.1 zeigt die räumliche Lokalität anhand eines 

Codestückes. Der lineare Verlauf stellt die normale Programmabarbeitung dar, bei der 

der Programmzähler laufend incrementiert wird. Die Wiederholung deutet auf eine 

Schleife hin, die vier mal durchlaufen wird. Danach gibt es eine Sprunganweisung und 

das Programm wird weiter abgearbeitet. 

• zeitliche Lokalität: Nachdem auf eine Adresse zugegriffen wurde, erfolgt 

wahrscheinlich bald ein weiterer Zugriff auf dieselbe Adresse. 

Das rechte Beispiel von Abb. 2.1 stellt die zeitliche Lokalität dar. Die Quadrate 

könnten z.B. Variablen sein. Eine Variable steht immer an der gleichen Adresse, die 

Adresse wird aber öfters benutzt um auf den Wert der Variablen zuzugreifen oder um 

an der Adresse einen neuen Wert zu speichern. 

Abbildung 2.1: Beispiele für räumliche und zeitliche Lokalität. 

Das Prinzip der Lokalität ist von großer Bedeutung beim Entwurf einer Speicherhierarchie. Es 

führt zum Konzept einer auf unterschiedlichen Geschwindigkeiten und Kapazitäten 

basierenden Hierarchie. 

Speicherhierarchie

Eine Speicherhierarchie ist eine Organisationsform von Speichern. Die verschiedenen 

Speicherarten werden in Ebenen aufgeteilt (z.B. Register, Cache, Hauptspeicher und 

Festplatte). Jede Ebene ist schneller, kleiner und teurer (Preis pro Byte) als die Ebene darunter 

(vgl. Abb. 2.1). Alle Daten einer Ebene sind auch in der Ebene darunter enthalten. Die 

kleinste Informationseinheit in einer Speicherhierarchie nennt man Block. Zwischen den 

Ebenen werden immer nur komplette Blöcke verschoben. Einen Erfolg eines Zugriffs in einer 

Ebene nennt man Treffer (hit), einen Mißerfolg Fehlzugriff (miss) (Block nicht in der Ebene). 

Die Trefferrate (hit rate) ist der prozentuale Anteil der Treffer an den Zugriffen. Der 

prozentuale Anteil der Fehlzugriffe nennt man Fehlzugriffsrate. Das Ziel einer 

Speicherhierarchie ist es, mit dem großen Speicherbereich einer unteren Ebene zu arbeiten 

und dieses mit der Geschwindigkeit einer oberen Ebene. 

Abbildung 2.2: Speicherhierarchie 

Mapping 

Das Prinzip der virtuellen Speichertechnik ist die Trennung des Adreßraumes des 

Hauptspeichers vom Adreßraum, den die Prozesse benutzen (virtueller Adreßraum). Dabei 

kann jeder Prozeß seinen eigenen virtuellen Adreßraum benutzen. Sowohl der virtuelle 

Speicher als auch der reale Speicher werden in Blöcke gleicher Größe aufgeteilt. Beim 

virtuellen Speicher nennt man die Blöcke Seiten (pages), beim Hauptspeicher Rahmen 

(frames). Die Seiten des virtuellen Speichers werden auf die Rahmen im Hauptspeicher 

abgebildet (mapping). Dabei ist es egal, auf welchen Rahmen, man kann irgendeinen freien 

Rahmen wählen (vgl. Abb. 3.1).

Abbildung 3.1: Abbildung (Mapping) der virtuellen Adreßräume in den Hauptspeicher. 

Deshalb kann der Hauptspeicher besser ausgenutzt werden, die Prozesse müssen nicht am 

Stück im Hauptspeicher liegen und das Problem der Fragmentierung des Hauptspeichers ist 

somit beseitigt. Es kann auch Seiten geben, die auf keinen Rahmen abgebildet werden. Diese 

Seiten liegen dann nur auf einem externen Speicher (Festplatte). Dies wird ausgenutzt um 

einen wesentlich größeren Speicherbereich verwenden zu können als Hauptspeicher 

vorhanden ist. Wurde früher ein Programm zu groß für den Hauptspeicher war es das Problem 

des Programmierers, es irgendwie passend zu machen. Der virtuelle Adreßraum ist nicht nur 

größer als der physikalische Adreßraum, sondern kann auch Lücken besitzen (vgl. Abb.3.2). 

Die virtuelle Speichertechnik reduziert auch meistens die Startzeit eines Prozesses, da nicht 

der gesamte Code in den Hauptspeicher geladen werden muß, bevor der Prozeß starten kann. 

Abbildung 3.2: Virtueller Speicher > Hauptspeicher 

Über die Abbildungsvorschrift läßt sich die Position einer Seite im Hauptspeicher finden. Was 

aber wenn man auf eine bestimmte Adresse innerhalb einer Seite zugreifen will? Dazu wird 

eine virtuelle Adresse in zwei Hälften unterteilt, der werthöheren Hälfte, der Seitennummer 

und der wertniederen Hälfte, dem Offset. Die physikalische Adresse besteht entsprechend aus 

Rahmennummer und Offset (vgl. Abb. 3.3). Dabei ist die Seitennummer die Adresse einer 

einzelnen Seite im virtuellen Speicher. Der Offset ist die Adresse innerhalb einer Seite. Die 

Länge des Offsets ist abhängig von der Seitengröße, sie ist genau log2(Seitengröße). Die 

Länge der virtuellen Adresse ist architekturabhängig. Sie beträgt z.Z. meistens 32 Bit. Bei der 

Länge der physikalischen Adresse kommt es auf den Speicherausbau an. Da der 

Hauptspeicher die gleiche Blockgröße wie der virtuelle Speicher hat, kann bei der 

Adreßumsetzung der Offset der virtuellen Adresse einfach an die Rahmennummer angehängt 

werden. Es muß also nur die Seitennummer in die entsprechende Rahmennummer übersetzt 

werden. Die Abbildungsvorschrift wird in Form einer Seitentafel implementiert.

Abbildung 3.3: Umwandlung von virtueller in physikalische Adresse. Die Seiten- bzw. 

Rahmengröße beträgt 2 12 = 4 KB. Die Anzahl der Rahmen beträgt 2 18 (= 1GB Speicherplatz) 

und die Anzahl der Seiten beträgt 2 20 (= 4 GB Speicherplatz). 

Seitentafel (page table) 

Eine Seitentafel oder Seitentabelle ist eine Datenstruktur, die durch die Seitennummern 

indexiert wird, d.h. jede Seite muß einen Eintrag in der Seitentafel haben. Die Anfangsadresse 

der Seitentafel steht in einem Register, dem Seitentafelregister. Jeder Eintrag der Seitentafel 

enthält die Rahmennummer der zugehörigen Seitennummer, falls diese im realen Speicher ist, 

und eine Verwaltungseinheit mit verschiedenen Steuerbits. Jeder einzelne Eintrag hat eine 

Länge von 32 Bit. Durch ein Präsenzbit (Valid-Bit) wird angezeigt, ob sich eine Seite im 

Hautspeicher befindet (Valid-Bit gesetzt) oder nicht (Valid-Bit nicht gesetzt). Die Größe der 

Seitentafel ist von der Anzahl der Seiten im virtuellen Adreßraum abhängig, z.B. eine 

Seitentafel mit einem 32-Bit Adreßraum, 4 KB großen Seiten und 4 Byte pro Eintrag, hat eine 

Größe von 4 MB (2 20 x4 Byte). Hat man nun eine virtuelle Adresse, so nimmt man die 

Seitennummer und greift auf den entsprechenden Eintrag in der Seitentafel zu (z.B. 

Seitenummer 3210 würde ein Zugriff auf den 3210. Eintrag in der Seitentafel bedeuten). Falls 

sich die Seite im Hauptspeicher befindet, steht in diesem Eintrag die dazugehörige 

Rahmennummer. An diese wird dann der Offset der virtuellen Adresse angehängt, dann kann 

mit der entstandenen physikalischen Adresse auf den Hauptspeicher zugegriffen werden. Der 

ganze Vorgang ist in Abb. 3.4 graphisch dargestellt.

Abbildung 3.4: Adreßumsetzung mit Seitentafel 

Mehrstufige Seitentafel 

Es wäre verschwenderisch, so große Seitentafeln die ganze Zeit im Hauptspeicher zu halten. 

Deswegen wird meistens eine mehrstufige Seitentafel verwendet, wobei die Seitennummer in 

mehrere Teile zerlegt wird. Alle Teile, bis auf den untersten Teil, werden für den Zugriff auf 

Seitentafeln verwendet, welche keine Rahmennummer im Eintrag haben, sondern einen 

Pointer auf eine andere Seitentafel. Mit dem höchsten Teil der Seitennummer wird ein 

Seitentafeleintrag indexiert, dessen Pointer auf eine weitere Seitentafel zeigt. Mit dem 

nächsten Teil der Seitennummer wird dann diese Seitentafel indexiert, wodurch man wieder 

einen Eintrag mit einem Pointer auf eine andere Seitentafel erhält. Dies wird solange 

fortgesetzt, bis man am untersten Teil der Seitennummer angekommen ist. Dieser indexiert 

dann einen Seitentafeleintrag mit einer Rahmennummer anstatt einem Pointer. An diese 

Rahmennummer muß jetzt nur noch der Offset angehängt werden, um die physikalische 

Adresse zu erhalten. 

In Abb. 3.5 wird eine 20-Bit Seitennummer in 2x10 Bit aufgeteilt. Mit den oberen 10 Bit wird 

auf die Seitentafel, auf die das Seitentafelregister zeigt, zugegriffen. Ist im entsprechenden 

Eintrag der Seitentafel ein Nullpointer, so befindet sich der Adreßbereich nicht in Benutzung. 

Ansonsten gibt es in dem Eintrag einen Pointer auf eine normale Seitentafel, auf welche mit 

den unteren 10 Bit zugegriffen wird. Der indexierte Eintrag enthält dann, falls das Valid-Bit 

gesetzt ist, die Rahmennummer, ansonsten gibt es einen Seitenfehler. Die mehrstufige 

Seitentafel hat den Vorteil, daß alle Seitentafeln selber wieder in 4 KB große Seiten passen (4 

Byte x 2 10 Einträge, bei 4 Byte großen Einträgen) und damit auf externen Speicher 

ausgelagert werden können. Die Seitentafel mit den Pointern bleibt natürlich im 

Hauptspeicher.

Abbildung 3.5: Mehrstufige Seitentafel 

Invertierte Seitentafel 

Eine andere Möglichkeit, die Größe der Seitentafel zu reduzieren, ist die Benutzung einer 

invertierten Seitentafel (inverted page table). Die Idee dabei ist es, einen Eintrag pro Rahmen 

anstatt einen pro Seite in der Seitentafel zu verwenden. Dazu benötigt man eine Hash- 

Funktion, die die virtuellen Adressen auf die Rahmen aufteilt. Die Größe der Seitentafel ist 

jetzt nur noch von der Zahl der Rahmen im Hauptspeicher abhängig, welche normal 

wesentlich kleiner ist als die Anzahl der virtuellen Seiten, so daß man meist die ganze 

Seitentafel im Hauptspeicher halten kann. Ein Beispiel einer Architektur, die eine invertierte 

Seitentafel verwendet, ist der PowerPC (IBM/Motorola). 

Blockplazierung 

Die virtuelle Speichertechnik hat sehr hohe Zugriffszeiten bei Seitenfehlern, da die Seite nicht 

im Hauptspeicher ist und ein Zugriff auf Festplatte erfolgen muß (vgl. Tabelle 4.1). Deshalb 

versucht das Betriebssystem die Blöcke möglichst geschickt zu plazieren, um weniger 

Seitenfehler zu verursachen. Dazu nimmt man auch kompliziertere Plazierungsalgorithmen in 

Kauf. Man entscheidet sich deswegen für vollassoziative Blockplazierung, bei der die Blöcke 

irgendwo im Hauptspeicher plaziert werden können.

Blockersetzung 

Wenn alle Rahmen des Hauptspeichers belegt sind und eine neue Seite eingeräumt werden 

soll, muß irgendeine Seite auf den externen Speicher ausgeräumt werden. Um zu bestimmen, 

welcher Block ersetzt wird, gibt es folgende Ersetzungsalgorithmen: 

• Beim FIFO-Algorithmus (first in first out) wird der zuerst eingespeicherte Block 

ersetzt. Es gibt viele Beispiele, bei denen die Anwendung des FIFO-Algorithmuses 

schlecht ist, z.B. bei großen Schleifen kann es passieren, daß der Algorithmus die 

Adressen des Beginns der Schleife am Schluß der Schleife wieder austauscht. 

Deswegen wird er nur selten implementiert. 

• Beim LIFO-Algorithmus (last in first out) wird der zuletzt eingespeicherte Block 

ersetzt. Der Algorithmus wiederspricht dem Prinzip der Lokalität und wird nicht 

benutzt. 

• Beim LRU-Algorithmus (least recently used) wird der am längsten ungenutzte Block 

ersetzt. Der LRU-Algorithmus liefert sehr gute Ergebnisse, braucht aber eine 

umfangreiche Verwaltung, falls er explizit den am längsten unbenutzten Block 

bestimmen soll. 

• Beim LFU-Algorithmus (least frequently used) wird der am wenigsten benutze Block 

ersetzt. Der LFU-Algorithmus ist sehr ähnlich wie der LRU-Algorithmus. Auch er 

liefert sehr gute Ergebnisse, braucht aber auch eine umfangreiche Verwaltung, falls er 

explizit den am wenigsten benutzten Block bestimmen soll. Deswegen wird meist ein 

vereinfachter Algorithmus verwendet, der nur wenige Zustände zwischen oft und 

wenig benutzten Seiten hat. 

• Beim Random-Algorithmus wird ein zufällig gewählter Block ersetzt. Es kann dabei 

im schlechtesten Fall auch gerade der Block ersetzt werden, den man gerade 

verwendet hat. Im Mittel liefert er doch ein gutes Ergebnis und ist recht einfach zu 

implementieren. 

Besonders effektiv arbeitet das Betriebssystem, wenn mehrere Blöcke auf einmal ersetzt 

werden, da der E/A Aufwand bei größeren Schreib- bzw. Lesevorgängen im Verhältnis zu 

mehreren kleinen günstiger ist. 

Fast immer benutzen die Betriebssysteme eine Approximation des LRU-Algorithmus. Man 

benutzt Use-Bits in der Verwaltungseinheit der Seitentafel, welche beim Seitenzugriff gesetzt 

und periodisch wieder gelöscht werden. Es kann dann zu einer bestimmten Zeit gesagt 

werden, ob auf eine Seite innerhalb einer Periode zugegriffen wurde. Aus allen Seiten mit 

ungesetztem Use-Bit wird dann eine ausgewählt, die ersetzt wird. Am günstigsten ist immer 

eine Seite mit ungesetztem Dirty-Bit zu ersetzen, weil diese nicht zurückgeschrieben werden 

muß. Da bei diesem vereinfachten Algorithmus die am seltesten genutzen Seiten den am 

längsten nicht genutzten Seiten entsprechen, ist diese Methode gleichzeitig eine Art 

vereinfachter LFU-Algorithmus. 

Schreibstrategie 

• falls alle Seiten auch im externen Speicher sind 

Das Schreiben auf externen Speicher benötigt hunderttausende Taktzyklen, deswegen 

wäre es viel zu langsam, alle Änderungen direkt auf Platte zu schreiben. Die

Schreibstrategie ist also write-back, d.h. die Seiten werden erst bei Ersetzung auf den 

externen Speicher zurückgeschrieben. Um nur die Blöcke zurückzuschreiben, die 

verändert wurden, wird ein Dirty-Bit in der Verwaltungseinheit der Seitentafel 

benutzt. Ist es nicht gesetzt, wurde die Seite nicht geändert und die Seite muß nicht 

einmal zurückgeschrieben werden, wenn sie ersetzt wird. Ist das Dirty-Bit gesetzt, 

wurde die Seite verändert und ist bei der Ersetzung zurückzuschreiben. 

• falls nur Seiten die nicht im Hauptspeicher sind im externen Speicher sind 

Hierbei werden die Seiten einfach getauscht. Wenn eine Seite in den Hauptspeicher 

eingeräumt werden soll, wird einfach eine nach einem Ersetzungsalgorithmus 

ausgewählte Seite vom Hauptspeicher in den externen Speicher ausgeräumt und dann 

die gewünschte Seite in den Hauptspeicher eingeräumt. Diese befindet sich danach 

aber nicht mehr auf externem Speicher. Die Methode ist ein wenig langsamer, aber sie 

hat einen größeren virtuellen Speicherbereich; z.B. bei 64 MB Hauptspeicher und 128 

MB externen Speicher hat sie 196 MB virtuellen Speicher anstatt 128 MB bei der 

oberen Methode. Außerdem kann die Methode nahezu gleich schnell gemacht werden, 

indem darauf geachtet wird, daß man, sobald die Anzahl freier Seiten unter eine 

bestimmte untere Schranke sinkt, wieder freie Seiten schafft, bis eine bestimmte obere 

Schranke an freien Seiten erreicht wird. 

Seitenfehler 

Wird auf einen Eintrag in der Seitentafel zugegriffen, dessen Valid-Bit auf null ist, wird eine 

Ausnahme geworfen. Der Seitenüberwacher, ein Teil des Betriebssystems, der für das 

Seitenmanagement verantwortlich ist, muß die Seite nun in den Hauptspeicher holen. Die 

Auswahl der zu ersetzenden Seite erfolgt mit Hilfe eines Ersetzungsalgorithmuses. Hat sie ein 

gesetztes Dirty-Bit muß sie zuerst noch auf externen Speicher geschrieben werden. Die Seite, 

die eingeräumt werden soll, wird dann über eine externe Seitentafel gefunden. In ihr steht für 

jede Seite die Adresse, auf der sie sich auf dem externen Speicher befindet (vgl. Abb. 4.1). 

Nach dem Einräumen der Seite in den Hauptspeicher wird das dazugehörige Valid-Bit im 

entsprechenden Seitentafeleintrag gesetzt. Da der Speichertransfer sehr viel Zeit benötigt, 

muß die CPU in der Lage sein, während der Blockersetzung einen anderen Prozeß zu 

bearbeiten, falls einer vorhanden und von dem Seitenfehler nicht ebenfalls betroffen ist. Ist 

der Speichertransfer beendet, kann dann der vorherige Prozeß wiederhergestellt und weiter 

abgearbeitet werden. In der Praxis kommt ein Seitenfehler nur mit einer Wahrscheinlichkeit 

von 0.0001% vor, so daß man gut mit virtuellem Speicher arbeiten kann.

Abbildung 4.1: Seitenfehler 

Seitengröße 

Ein wichtiger Architekturparameter für virtuellen Speicher ist die Seitengröße. Einige Punkte 

sprechen für große, einige für kleine Seiten. Hier sind die Hauptpunkte: 

• Je größer die Seiten, desto kleiner die Seitentafel. Dadurch kann Speicher gespart 

werden. 

• Die Übertragung von großen Seiten ist effektiver, da der Aufwand für das Ein- und 

Ausräumen von Seiten sehr groß ist. Es ist besser einmal 4 KB zu übertragen als 4x1 

KB. 

• Für kleine Seiten spricht, daß diese nicht soviel Speicher verschwenden. Wenn ein 

Prozeß z.B. 5 KB benötigt, braucht er zwei Seiten (bei einer Seitengröße von 4 KB). 

Er hat also insgesamt 8 KB Speicherplatz verbraucht, obwohl die letzte Seite noch 3 

KB frei hat. Diese können aber nicht anderweitig verwendet werden, was als interne 

Fragmentierung bezeichnet wird. 

• Zu große Seiten können unter Umständen E/A-Bandbreite verschwenden. 

Am häufigsten werden 4 KB große Seiten verwendet, da diese einen guten Kompromiß aus 

den verschiedenen Punkten bilden und die Adreßumsetzung dabei erfahrungsgemäß gut 

funktioniert. 

Seitengrößenerweiterung (page size 

extension) 

Die meisten Architekturen, die virtuellen Speicher implementieren, erlauben es, außer der 

Standard-Seitengröße, besonders große Seiten zu verwenden (z.B. die Pentiumarchitektur). 

Dies geschieht mit der Hilfe eines PSE-Bit (Page Size Extension-Bit) in der 

Verwaltungseinheit der Seitentafel. Ist es nicht gesetzt, werden die Standardseiten verwendet, 

falls es gesetzt ist, wird eine große Seite benutzt. Das findet vor allem Anwendung bei der 

Abbildung von Hardware Ein-/Ausgabebereichen in den Speicher (Memory Mapped I/O),

weil dabei oft ein sehr großer, kontinuierlicher Speicherbereich benötigt wird, z.B. bei 

Grafikkarten. Anwendung findet die Technik z.B. in der Pentiumarchitektur [3], die es erlaubt 

4 MB große Seiten, anstatt 4 KB große Seiten zu verwenden, falls das PSE-Bit gesetzt ist. Der 

Vorteil der Seitengrößenerweiterung ist, daß man weniger Verwaltungsaufwand hat. Es kann 

z.B. eine 4 MB große Seite, die nur einen Eintrag in der Seitetafel benötigt, benutzt werden, 

anstatt 1024 Einträge, die man bei einer Seitengröße von 4 KB benötigen würde. 

Adreßumsetzungspuffer (TLB) 

Die Adreßumsetzung mit Hilfe der Seitentafel ist mit zusätzlichen Hauptspeicherzugriffen 

verbunden. Man benötigt erst zwei Hauptspeicherzugriffe für die Adreßumsetzung (bei 

zweistufiger Seitentafel) und erst dann erfolgt der eigentliche Hauptspeicherzugriff, falls die 

Seite den Zustand valid hat. Um überhaupt sinnvoll mit virtuellem Speicher arbeiten zu 

können, muß daher die Adreßumsetzung beschleunigt werden. Man greift dabei wieder auf 

das Prinzip der Lokalität zu. Es ist wahrscheinlich, daß die Adresse, die gerade übersetzt 

wurde, nochmal benutzt wird oder auf eine benachbarte zugegriffen wird. Deshalb wird ein 

zusätzlicher Schnellspeicher verwendet, der die letzten Umsetzungen von Seitennummern in 

Rahmennummern enthält. Dieser Schnellspeicher wird in der Fachsprache TLB (translationlookaside 

buffer) genannt. Er besteht meist aus 64-Bit Einträgen, die 

Verwaltungsinfomationen, ein Tag und eine Rahmennummer beinhalten. Das Tag beinhaltet 

die Seitennummer zur Rahmennummer im zugehörigen Eintrag. Es wird benötigt, weil nicht 

jede Seitennummer im TLB Platz findet und somit nicht direkt über die Seitennummer 

indexiert werden kann, wie bei der Seitentafel. 

Abbildung 5.1: Funktionsweise eines TLB 

Bei jeder Adreßumsetzung wird nun die zu übersetzende Seitennummer mit den einzelnen 

Tags verglichen. Stimmen sie überein und ist das Valid-Bit des Eintrags gesetzt, so hat man 

einen TLB-Treffer und kann die Rahmennummer direkt aus dem Eintrag im TLB lesen, ohne 

einen Zugriff auf die Seitentafel. Nun muß nur noch der Offset von der virtuellen Adresse 

angehängt werden und dann kann der Hauptspeicherzugriff erfolgen. Ist die Seite aber nicht

im TLB oder das Valid-Bit des betreffenden Eintrags auf Null gesetzt, dann muß die 

Umsetzung der Adresse über die Seitentafel erfolgen. Die Umsetzung wird danach in den 

TLB eingeräumt, so daß beim nächsten Zugriff auf die Seite die Umsetzung schon im TLB 

ist, falls sie nicht schon wieder ersetzt worden ist. Der gesamte Vorgang ist in Abb. 5.1 

nochmals graphisch dargestellt. Für die Ersetzung im TLB werden meist eine Approximation 

des LRU- oder der Random-Algorithmus verwendet. Die Blockplazierung erfolgt 

vollassoziativ oder set-assoziativ. Set-assoziativ bedeutet, daß eine Seitennummer nur in 

einen bestimmten Bereich (set) des TLB abgebildet werden kann. Nach dem 

Konsistenzkriterium kann es einen TLB-Treffer nur geben, falls es auch einen Treffer in der 

Seitentafel geben würde (vgl. Tabelle 5.1). Ein TLB kann zwischen 32 und 4096 Einträge 

besitzen. Die Zugriffszeit bei einem Treffer beträgt 1 Taktzyklus, bei einem Fehler beträgt sie 

10 bis 30 Taktzyklen. Die Fehlerrate liegt zwischen 0.01% und 1%. 

Speicherschutz 

Weil zur selben Zeit mehrere Prozesse ablaufen und es verschiedene Benutzer gibt, muß ein 

Weg zum sicheren Schutz und Teilen von Code und Daten zwischen den einzelnen Prozessen 

gefunden werden. Dabei muß das Betriebssystem in der Lage sein, jederzeit von einem 

Prozeß in einen anderen umschalten zu können und die verschiedenen Prozesse gleichzeitig 

im Hauptspeicher zu halten. Es gibt verschiedene Methoden den Speicher zwischen den 

Prozessen aufzuteilen. Eine ist es, den Hauptspeicher in verschiedene Regionen für die 

Benutzerprozesse aufzuteilen. Die Regionen können verschiedene Größen haben. Dabei muß 

der Überwacher darauf achten, daß die Ressourcen unter Berücksichtigung einer 

ökonomischen Rechnerauslastung auf die Prozesse verteilt werden. Der Überwacher belegt 

einen festen, gegen Schreibzugriffe von Nutzerprozessen geschützten Speicherbereich, der in 

den realen Speicher abgebildet wird (vgl. Abb.6.1). Die Seiten der Regionen werden auf die 

restlichen Rahmen abgebildet bzw. auf den externen Speicher, falls nicht genügend Platz im 

Hauptspeicher ist.

Abbildung 6.1: Abbildung eines geschützten virtuellen Speichers in den realen Speicher. 

Eine andere Möglichkeit ist es, jedem Prozeß den gesamten virtuellen Adreßraum zur 

Verfügung zu stellen. Ein Teil des virtuellen Adreßraumes von jedem Nutzerprozeß wird vom 

Überwacher belegt, es existiert aber nur eine Kopie davon im Hauptspeicher (vgl. Abb.6.2). 

Durch die Prozeß-ID sind die Adressen eindeutig bestimmt. Das ist vor allem für den TLB 

wichtig denn es wäre ineffektiv den TLB bei jeder Prozeßumschaltung ganz zu löschen, man 

könnte seine volle Kapazität gar nicht ausnutzen. Deswegen kann man einfach die Prozeß-ID 

im TLB-Eintrag verwenden, um damit die Einträge, die zu anderen Prozessen gehören, zu 

schützen, indem man die Prozeß-ID des aktiven Prozesses mit dem ID-Eintrag vergleicht. 

Abbildung 6.2: Seitenschutz, bei dem jeder Prozeß den vollen Adreßraum zur Verfügung 

stehen hat. 

Die Aufteilung des Hauptspeichers mit diesen beiden Methoden macht einen 

Schutzmechanismus nötig, um einen Prozeß zu hindern, einen anderen zu manipulieren oder 

seine Daten zu lesen. Andererseits sollen die Prozesse auch miteinander kommunizieren und 

auf Daten und Code gemeinsam zugreifen können. Am einfachsten läßt sich der Schutz mit 

Steuerbits in der Seitentafel realisieren. Man benutzt dafür z.B. ein Schreibschutz-Bit, um 

versehentliches Überschreiben von Code zu verhindern. Je nach Betriebssystem werden auch 

verschiedene Zugriffschutzbits für die verschiedenen Benutzerebenen verwendet und ein 

User-/Kernel-Bit, um zwischen Zugriffe von Benutzern oder vom Betriebssystem zu 

unterscheiden. Die Seitentafel darf nur im Kernel-Modus verändert werden, weil sonst der 

Speicherschutz nicht mehr funktionieren würde. Bei der gemeinsamen Nutzung von Code und 

Daten wird ein entsprechender Seitentafeleintrag in jedem Adreßraum eines Prozesses der auf

den Code und die Daten zugreifen können soll, eingerichtet, der auf den selben Rahmen im 

physikalischen Speicher zeigt. Speicherschutz erfordert auch einige Anforderungen an die 

Hardware, wie zwei verschiedene Modi, um zu entscheiden, ob der laufende Prozeß ein 

Betriebssystem- oder ein Nutzerprozeß ist und ein Mechanismus zum Umschalten vom 

Nutzermodus in den Supervisormodus und zurück. 

Zusammenfassung 

Die virtuelle Speichertechnik wird vom Betriebssystem gesteuert und beruht auf dem Prinzip 

der Lokalität. Sie steuert automatisch die Ebenen Hauptspeicher und sekundärer Speicher, und 

läßt diese als eine Ebene erscheinen. Ihre Implementierung stellt Anforderungen sowohl an 

Hardware (z.B. MMU) als auch an Software (z.B. Seitenüberwacher). Die Implementierung 

ist zwar sehr komplex, aber es gibt bis heute noch keine Alternative für die Bewältigung des 

Problems der Fragmentierung des Hauptspeichers, des Speicherschutzes und dem des 

beschränkten Hauptspeichers. Der Speicherschutz wird durch die Verwendung von User- 

/Kernel-Bits, Schreibschutz-Bit und diversen Zugriffs-Bits in der Verwaltungseinheit der 

Seitentafel realisiert. Sie erlaubt effiziente und sichere Teilung des Speichers für verschiedene 

Prozesse. Die Fragmentierung wird mit einer flexiblen Abbildung durch eine Seitentafel 

beseitigt. Einen größeren Adreßraum bekommt man dadurch, daß man die Ebene sekundärer 

Speicher mit einbezieht und automatisch verwaltet. Typische Werte für virtuellen Speicher 

sind in Tabelle 7.1 zu sehen. 

Selbst wenn RAM immer günstiger und größer wird und man eigentlich genügend Speicher 

auch für mehrere große Prozesse hat, ist die Implementierung des virtuellen Speichers immer 

noch sinnvoll. Sie stellt ja nicht nur einen größeren Speicherbereich zur Verfügung, sondern 

bietet auch sonst noch einige Vorteile, wie Speicherschutz und flexiblere 

Hauptspeichernutzung. Deswegen ist eine Ablösung der virtuellen Speichertechnik durch eine 

andere Technik auch noch nicht absehbar. 

Es gibt heute schon Betriebssysteme, die einen 64-Bit Adreßraum verwenden, wie das 

Betriebssytem Open VMS Alpha von DEC. Es benutzt 8 KB große Seiten und eine dreistufige 

Seitentafel, was einen virtuellen Adreßraum von 8 TB (1024 x 1024 x 1024 x 8KB) ergibt. 

Für die gesamte Abbildung in den Speicher werden dann, bei 8 Byte langen 

Seitentafelneinträgen, alleine insgesamt 8 GB (1024 x 1024 x 1024 x 8 Byte) für die 

Seitentafeln eines Prozesses benötigt. Das Betriebssystem ist vor allem für große

Datenbanksysteme geeignet. Einige Terabytes an virtuellen Speicher und mehrere Gigabytes 

an Hauptspeicher erlauben es, Datenbanken vollständig in den virtuellen Speicher zu laden, 

was viel Zeit bei Datenbankabfragen spart. 

Literatur 

1 

2 

3 

DAVID A. PATTERSON AND JOHN L. HENNESSY: 

Computer Organization & Design. 

2nd ed., Morgan-Kaufmann, 1997 

PAUL HERRMANN: 

Rechnerarchitektur. 

Vieweg, 1998 

DON ANDERSON AND TOM SHANLEY: 

Pentium Processor System Architecture. 

2nd ed., Addison-Wesley, 1995

Virtueller Speicher Einführung

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?