22.12.2013 Aufrufe

Verbindungsnetzwerke für parallel und verteilte Systeme.pdf

Verbindungsnetzwerke für parallel und verteilte Systeme.pdf

Verbindungsnetzwerke für parallel und verteilte Systeme.pdf

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

In Bild 5.26 findet eine Kommunikation nach dem Muster<br />

PU1->PU2->PU3->PU4->PU1 statt. Alternativ zu dieser Übertragung können<br />

auch Daten in Rückrichtung blockierungsfrei transferiert werden (gestrichelt<br />

dargestellt). Bei der hybriden Topologie der Hitachi-Rechner treten dann Blokkierungen<br />

im Netz auf, wenn die Exchanger gleichzeitig sowohl von einem Datenpaket<br />

zum Dimensionswechsel als auch von einem an den Exchanger angeschlossenen<br />

Netzknoten benötigt werden.<br />

Partitionierbarkeit<br />

Eine SR 2001 läßt sich logisch in vier (die SR 2201 in acht) voneinander getrennte<br />

Blöcke zerlegen, die sich gegenseitig nicht beeinflussen können. Die<br />

Zerlegung wird mit Hilfe von hardware-mäßigen Zusatzeinrichtungen bewerkstelligt,<br />

die da<strong>für</strong> sorgen, daß neben Datenpaketen auch Broadcast <strong>und</strong> Signalling<br />

die Blockgrenzen nicht überschreiten. Zusätzlich zur Hardware-Partitionierung<br />

der Maschine gibt es noch eine Software-Partionierung in Form einer<br />

Betriebssystemfunktion, die die Blöcke bzgl. der Datenpakete voneinander abschottet.<br />

Die Synchronisationsfunktionen bleiben davon unberührt.<br />

Die Partitionierung dient zur besseren Auslastung der Maschine, da gleichzeitig<br />

mehrere Benutzern damit arbeiten können. Im Vergleich zur Exemplar<br />

erfolgt hier jedoch ein statische Allokation von Prozessoren zu Benutzern.<br />

Multicast <strong>und</strong> Barrierensynchronisation<br />

Bei der der SR2001/2201 wird anders als bei der IBM SP2 beispielsweise die<br />

Multicast-Funktion per Hardware unterstützt. Schnelle Multicasts sind zum<br />

Versenden gemeinsamer Datenblöcke sowie zum gleichzeitigen Starten <strong>und</strong><br />

Stoppen von Prozessen außerordentlich nützlich.<br />

Das zweite Synchronisationsmittel stellt die Barrierensynchronisation dar,<br />

die wie bei der Cray in Hardware implementiert ist. Sie wird hier nicht in einem<br />

separaten Netzwerk ausgeführt, sondern gehört zum 3-D Crossbar. Ebenfalls<br />

anders als bei der Cray sind 4 <strong>und</strong> nicht log2N Schritte nötig, um eine Synchronisaton<br />

durchzuführen; die Zahl der Schritte ist unabhängig von der Größe des<br />

Rechners. Bei der Ausführung der Synchronisationsfunktion wird zuerst festgestellt,<br />

wann die Prozessoren einer bestimmten Partition ihre Prozesse beendet<br />

haben, <strong>und</strong> danach wird dieser Zustand per Multicast den Prozessoren mitgeteilt.<br />

Die Synchronisation kann deshalb in zwei Phasen unterteilt werden:<br />

In der ersten Phase werden im 1. Schritt die Fertigmeldungen der beteiligten<br />

Prozessoren von den Kreuzschienenverteilern der x-Richtung eingesammelt.<br />

Sobald alle Meldungen eingetroffen sind, wird von diesen Kreuzschienenverteilern<br />

ein Signal gesetzt. Im 2. Schritt werden die Signale aller x-Crossbars einer<br />

Ebene von den y-Crossbars gelesen <strong>und</strong> mittels einer UND-Verknüpfung<br />

das Summensignal gebildet. Dazu würde im Prinzip ein einziger y-Kreuzschienenverteiler<br />

genügen, es wird jedoch dieselbe Operation von allen y-Crossbars<br />

einer Ebene durchgeführt, um die Ausführung der 2. Phase zu beschleunigen.<br />

283

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!