IT-Management in der Praxis Seminar ? WS 2004/05 - am ...
IT-Management in der Praxis Seminar ? WS 2004/05 - am ...
IT-Management in der Praxis Seminar ? WS 2004/05 - am ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
High Performance Interconnects<br />
Christian Gärtner<br />
Kurzfassung<br />
Für den Betrieb von Clustern (Rechnerbündeln) ist die Wahl des geeigneten Interconnects<br />
von fund<strong>am</strong>entaler Bedeutung. Die Kommunikation zweier Knoten ist um Größenordnungen<br />
langs<strong>am</strong>er als <strong>der</strong> Zugriff auf den Hauptspeicher des lokalen Rechners. Deshalb s<strong>in</strong>d<br />
die Latenzzeit und die Bandbreite des Interconnects die entscheidenden Faktoren, welche<br />
die Fähigkeit e<strong>in</strong>es Clusters bestimmen, Aufgaben effizient verteilt zu verarbeiten.<br />
Dies gilt <strong>in</strong>sbeson<strong>der</strong>e bei Clustern mit vielen Knoten und bei Anwendungen mit häufiger<br />
Kommunikation. In dieser Sem<strong>in</strong>ararbeit werden ausgehend von Gigabit Ethernet unterschiedliche<br />
Interconnect-Techniken vorgestellt und h<strong>in</strong>sichtlich ihrer Leistungsfähigkeit<br />
und Kosten charakterisiert.<br />
1 E<strong>in</strong>leitung<br />
Möchte man e<strong>in</strong>e Aufgabe auf mehrere Rechner verteilt ausführen, so besteht <strong>in</strong> gewissen zeitlichen<br />
Abständen Kommunikationsbedarf zwischen den Knoten. Der Zugriff auf e<strong>in</strong> Datum<br />
im lokalen Hauptspeicher erfolgt <strong>in</strong>nerhalb von etwa tH = 10ns (PC400, DDR-R<strong>am</strong>, Stand<br />
<strong>2004</strong>). Soll h<strong>in</strong>gegen auf e<strong>in</strong> Datum im Hauptspeicher e<strong>in</strong>es an<strong>der</strong>en Knoten über e<strong>in</strong> Netzwerk<br />
zugegriffen werden, so benötigt <strong>der</strong> Zugriff wesentlich länger. Gigabit Ethernet (ohne<br />
Verbesserungen) benötigt hierfür beispielsweise etwa tNW = 100µs. Dieser große Unterschied<br />
führt bei häufiger Kommunikation zu e<strong>in</strong>er deutlichen Verlangs<strong>am</strong>ung.<br />
Bei zunehmen<strong>der</strong> Anzahl an Rechenknoten steigt auch das Kommunikationsaufkommen. Dies<br />
ist beispielsweise auf e<strong>in</strong>e häufiger notwendige Synchronisation zurückzuführen. Wegen <strong>der</strong><br />
sehr unterschiedlichen Zugriffszeiten tH und tNW nimmt <strong>der</strong> zeitliche Anteil für die Kommunikation<br />
an <strong>der</strong> Ges<strong>am</strong>tzeit spürbar zu. Dies kann dazu führen, dass ab e<strong>in</strong>er bestimmten<br />
Anzahl an Knoten ke<strong>in</strong> Geschw<strong>in</strong>digkeitsgew<strong>in</strong>n durch Erhöhung <strong>der</strong> Knotenzahl erreichbar<br />
ist. Diese maximale Knotenzahl wird durch die Häufigkeit <strong>der</strong> Kommunikation sowie durch<br />
die Leistungsfähigkeit des Interconnects bestimmt. Aus diesem Grund ist es von großer Wichtigkeit,<br />
e<strong>in</strong>en Interconnect mit ausreichen<strong>der</strong> Leistung zu verwenden.<br />
Anwendungsbeispiel — Dieser Zus<strong>am</strong>menhang soll an e<strong>in</strong>em Beispiel verdeutlicht werden.<br />
Wir setzen e<strong>in</strong>e Hauptspeicher-Zugriffszeit von tH = 10ns vorraus. Auf e<strong>in</strong>en an<strong>der</strong>en Knoten<br />
soll über das Netzwerk <strong>in</strong> tNW = 100µs zugegriffen werden können, was <strong>in</strong> etwa <strong>der</strong> Leistungsfähigkeit<br />
von Gigabit Ethernet entspricht. Es wird angenommen, dass sich <strong>der</strong> Kommunikationsbedarf<br />
quadratisch mit <strong>der</strong> Zahl <strong>der</strong> Knoten nnodeim Cluster erhöht. Bei zwei Knoten sei<br />
e<strong>in</strong>er unter 10 9 Befehlen e<strong>in</strong> Kommunikationsbefehl. Der Anteil von Rechenzeit und Kommunikationszeit<br />
an <strong>der</strong> Ges<strong>am</strong>tzeit ist <strong>in</strong> Abbildung 1 <strong>in</strong> Abhängigkeit <strong>der</strong> Knotenzahl aufgetragen.<br />
Wird nur e<strong>in</strong> Knoten verwendet, so setzt sich die Ges<strong>am</strong>tzeit zur Ausführung erwartungsgemäß<br />
nur aus Rechenzeit zus<strong>am</strong>men. Werden nun mehr als e<strong>in</strong> Knoten verwendet, so s<strong>in</strong>kt die<br />
Rechenzeit, jedoch kommt e<strong>in</strong> steigen<strong>der</strong> Anteil an Kommunikationszeit h<strong>in</strong>zu. Man erkennt<br />
e<strong>in</strong> M<strong>in</strong>imum <strong>der</strong> Ges<strong>am</strong>t-Ausführungszeit bei 10 Knoten von 181,0 Zeite<strong>in</strong>heiten. In diesem