22.12.2013 Aufrufe

Verbindungsnetzwerke für parallel und verteilte Systeme.pdf

Verbindungsnetzwerke für parallel und verteilte Systeme.pdf

Verbindungsnetzwerke für parallel und verteilte Systeme.pdf

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

schnelle Daten- <strong>und</strong> Synchronisationsnetz bei, das Multicast-/inversen Multicast-,<br />

Reduktions-, Swap- <strong>und</strong> Fetch-Operationen in Hardware realisiert. Diese<br />

Funktionen können vor allem bei größeren Prozessorzahlen (ab ca. 256) ein Absinken<br />

der Effizienz verhindern.<br />

Ping-Pong-Kommunikationstest:<br />

r∞ [MB/s] n 1/2 [B] Start Up<br />

unidirek. (P1 zu P2) 106 von 300 161 1,5 µs<br />

bidirektional P1 mit P2 188 " 600 250 1,3 µs<br />

LINPACK-Rechentest (256 Prozessoren, Problemgröße 38912):<br />

21 GFLOPS von 38 möglichen<br />

Tabelle 5.3: Kommunikations- <strong>und</strong> Rechenleistung der T3D nach [Oed94].<br />

Folgende Maßnahmen, die ebenfalls zur Effiziensteigerung beitragen, sind<br />

beim Verbindungsnetzwerk der Cray T3D nicht implementiert:<br />

• Mehrfachverkehr auf den Ringen (Slotted Ring Protocol). Zu jedem Zeitpunkt<br />

kann auf jedem Ringsegment ein Datenpaket unterwegs sein, was bis<br />

zu 16 gleichzeitige Pakete auf einem Ring aus 16 Teilnehmern erlauben würde.<br />

• Netzweite, automatische Cache-Konsistenz gemeinsamer Variablen. Das<br />

Schreiben einer gemeinsamen Variablen invalidiert ohne Zutun des Benutzers<br />

Kopien gemeinsamer Variablen, die in anderen Prozessor-Caches gehalten<br />

werden.<br />

• Automatisches Verbergen der Latenzzeiten des Speichers. Multithreading<br />

beispielsweise würde beim Zugriff auf das Netz auf einen anderen Prozeßfaden<br />

umschalten. Bislang muß der Benutzer durch eine explizite "READ<br />

AHEAD Direktive" vorausschauend Variable anfordern.<br />

5.2 Das Verbindungsnetzwerk der IBM SP2<br />

5.2.1 Einleitung<br />

Im Jahre 1990 initiierte IBM in Kingston, New York, das Forschungsprojekt<br />

"Vulcan" [Stunkel94b]. Zwei Jahre später wurde das "Highly Parallel Supercomputing<br />

Systems Laboratory (HPSSL)" gegründet <strong>und</strong> der erste Vulcan-Prototyp<br />

fertiggestellt, der den direkten Vorläufer der SP1-Maschine darstellt.<br />

262

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!