Grundlagen paralleler Architekturen

Weitere Magazine

Empfehlungen

Info

Vorlesung Rechnerarchitektur 2 Seite 21 Lehrstuhl für Rechnerarchitektur - Universität Mannheim Grundlagen paralleler Architekturen Maschinenbefehle - Instruction Level Parallelism (ILP) Analyseverfahren von Compilern, die über Kontrollflußgrenzen hinausgehen, wurden zur Erkennung und Nutzung dieser Parallelitätsebene entwickelt [Nic85] [Gas89] [Ess90]. Auch Schleifeniterationen von Berechnungen [Lil94] kann man auf diese Weise für die Ausnutzung der Parallelität heranziehen und dann ergeben sich erhebliche Gewinne, die zum Teil natürlich von den zugrunde liegenden Datenstrukturtypen stammen. Im Gegensatz zu den Vektoroperationen können aber auf dieser Ebene die Anweisungen innerhalb der Schleifen von größerer Allgemeinheit sein und müssen nicht auf Vektoroperationen abbildbar sein. Die Nutzung dieser Parallelitätsebene führt zu mehreren recht unterschiedlichen Architekturformen. Ihre gemeinsame Eigenschaft ist die enge Kopplung der Verarbeitungseinheiten, die den Aufwand für die Ablaufsteuerung und die Synchronisation zwischen den Verarbeitungseinheiten gering hält. Auch die mehrfädigen Architekturen (multi-threaded Architectures, MTA) nutzen diese Parallelitätsebene und versuchen die Latenzzeit der Synchronisation in der Bearbeitungszeit weiterer Basisblöcke zu verstecken. Die Parallelitätsebene der Maschinenbefehle enthält die Elementaroperation, die zur Lösung von arithmetischen Ausdrücken benötigt werden. Da diese Datenabhängigkeiten aufweisen, ist eine der wichtigsten Aufgaben des Compilers eine Datenabhängigkeitsanalyse zu erstellen, die es ermöglicht, den Abhängigkeitsgraph so zu transformieren [Kuc78], daß sich ein hohes Maß an konkurrenten Operationen ergibt. Die Ausnutzung dieser Parallelität geschieht durch parallele Funktionseinheiten innerhalb der Verarbeitungseinheiten. Die Ablaufsteuerung wird vom Compiler bereits zur Übersetzungszeit geplant oder zur Laufzeit von effizienten Hardwareresourcen innerhalb der Verarbeitungseinheiten ausgeführt. Beispiele hierfür sind VLIW-Prozessoren (‘very long instruction word’), superskalare Prozessoren und Pipeline-Prozessoren. Allerdings sind die Verarbeitungseinheiten, mit denen diese Parallelitätsebene gut ausnutzbar ist, immer nur so gut, wie der Compiler die dafür notwendigen Optimierungen beherrscht. Die feinkörnigen Datenflußsysteme nutzen ebenfalls diese Ebene, erkennen aber die parallel ausführbaren Operationen zur Laufzeit durch die in Hardware realisierte Datenflußsynchronisation. (Datenfluss vs. Kontrollfluss) WS03/04
Vorlesung Rechnerarchitektur 2 Seite 22 Granularität Lehrstuhl für Rechnerarchitektur - Universität Mannheim Grundlagen paralleler Architekturen Den Ebenen der Parallelität entsprechend kann man eine Körnigkeit oder Granularität der Parallelarbeit feststellen. Jede Ebene besitzt eine ihr eigene Granularität, die im folgenden nach [KrS88] definiert wird. Definition : Grob-körnige Parallelität ist die Art von Parallelität, die zwischen großen Teilen von Programmen, weit oberhalb der Prozedurebene, im gemeinsamen Adressraum der Applikation existiert (‘coarse-grain parallelism’). Definition : Fein-körnige Parallelität ist die Art von Parallelität, die man auf der Ebene von Instruktionen innerhalb eines oder auch zwischen wenigen Basisblöcken (‘basic blocks’) von sequentiellen Programmen findet (fine-grain parallelism’). Für die bei numerischen Problemen sehr häufig auftretenden Schleifeniterationen, die eine der wesentlichen Quellen der Parallelität in numerischen Programmen ist, wird häufig auch noch die Definition der mittel-körnigen Granularität verwendet. Definition : Mittel-körnige Parallelität ist die Art von Parallelität, die zwischen längeren Sequenzen von Instruktionen existiert. Sie tritt hauptsächlich bei Schleifeniterationen auf und stammt im wesentlichen von der datenparallelen Verarbeitung von strukturierten Datenobjekten (‘loop-level parallelism’, ’medium-grain parallelism’). Granularität des Algorithmus Je kleiner die Granularität des Algorithmus, desto schwieriger wird die Parallelisierung sein. Feine Granularität bevorzugt Architekturen bzw. Implementierungen mit kurzen ’start up’- Zeiten und leistungsfähiger Kommunikation. Als grundlegende Regel gilt, daß die Kosten (d.h. die Bearbeitungszeit) der Teiloperation wesentlich grösser als die Kosten der Kommunikation/Synchronisation sein sollte. WS03/04
Seite 1 und 2: Vorlesung Rechnerarchitektur 2 Seit
Seite 7: Vorlesung Rechnerarchitektur 2 Seit
Seite 13: Vorlesung Rechnerarchitektur 2 Seit

Grundlagen paralleler Architekturen

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?