31.07.2015 Aufrufe

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3.9 Aufwand der Verfahrenmuss man zusätzlich die Anzahl c der Farben berücksichtigen, da hierdurch (im wesentlichen)die Anzahl der Teilschritte pro Schritt bestimmt wird. Jeder Teilschritt bestehtaus einer Kommunikationsoperation und einer festen Anzahl von Rechenoperationen. Dadarüber hinaus die Größe der kommunizierten Daten recht klein ist, wird der Zeit<strong>auf</strong>wandpraktisch ausschließlich durch die Zahl der Kommunikationen bestimmt.Die DE-OPX-Verfahren benötigen c(m − 1) Kommunikationsschritte. Beim SDE-OPXwerden pro Eigenwert alle Farben zweimal verwendet, was <strong>auf</strong> 2c(m − 1) Schritte führt.Um Zeit zu sparen, kann man jedoch <strong>auf</strong>einander folgende Teilschritte <strong>mit</strong> der gleichenFarbe zusammenfassen, vergleiche Abbildung 3.12. Dann genügen (2c − 2)(m − 1) + 1Kommunikationsschritte.1 2 3 4 4 3 2 1 1 2 3 4 4 3 2 1 1 2 3 4 4 3 2 1Abbildung 3.12: Kommunikationsschritte beim SDE-OPX am Beispiel c = 4, m = 4Hierzu bedarf es folgender kleiner Abänderung im Verfahren: Zwischen den Knoten kund l gebe es eine Kante der Farbe c. Zu Beginn des c-ten Teilschritts müssen k und lihre aktuellen Lastwerte w k und w l austauschen. Danach berechnen beide Prozessorennicht nur ihren eigenen Lastwert neu sondern auch den ihres Nachbarn. Dadurch entfälltdie Kommunikation zu Beginn des nächsten Teilschrittes, dem wiederum die Farbe czugeordnet ist. Analog wird für Farbe 1 vorgegangen. Der Vorteil dieser Technik machtsich am stärksten bei Graphen <strong>mit</strong> nur zwei Farben bemerkbar, da in diesem Fall nurein einziger Kommunikationsschritt mehr gebraucht wird verglichen <strong>mit</strong> DE-OPX.Wie in den Abschnitten 3.7.1 und 3.7.2 bereits angedeutet, stimmt der Aufwand vonDE-OPXfb <strong>mit</strong> SDE-OPX überein und für DE-OPXcc ergeben sich c(m−1)+c−1 Schritte.Die direkte Zuordnung der Kommunikationsschritte zu den Farben ergibt in einigenFällen bloß eine obere Schranke für den tatsächlichen Zeitbedarf. Dies betrifft solche Graphenbei denen die Anzahl der Farben größer ist als der maximale Knotengrad. Betrachteals Beispiel hierzu Abbildung 3.13. Durch Vermischung der zu den Farben gehörendenTeilschritte sind für 5 Schritte (Eigenwerte) nicht 5 · 3 = 15 sonder nur 11 Kommunikationsschrittenotwendig. Diese Beobachtung wurde bereits in [XL95] beschrieben.Nun wird die Situation für beliebiges n betrachtet Jeder Prozessor muss pro Eigenwert<strong>mit</strong> zwei Nachbarn kommunizieren; insgesamt führt dies <strong>auf</strong> n(m−1) Kommunikationen.Wie die Abbildung verdeutlicht, finden in jedem Kommunikationsschritt⌈ n−12Kommunikationenstatt. Die Gesamtzahl der Kommunikationsschritte ist daher 2n⌉n−1 (m − 1)und nicht 3(m−1), wie obige Formel vermuten ließe. ⌈ Ähnliche⌉Überlegungen ergeben fürden Torus T n [6] , dass nicht 6(m − 1) sondern nur 4nn−1 (m − 1) Kommunikationsschritteanfallen.Dieselben Überlegungen gelten für die Diffusionsverfahren im One-Port-Kommunikationsmodell.83

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!