31.07.2015 Aufrufe

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

6.3 Messergebnisseobiger Definition lokaler Greedy-Scheduler, als dass in einem Schritt Lasteinheiten voneinem Knoten aus versandt werden können, die zuvor im selben Schritt erst eingetroffensind.while x e ≠ 0 für mindestens eine inzidente Kante e dofor j = 1, . . . , c do {Farbschleife}if es gibt eine Kante e der Farbe j <strong>mit</strong> x e > 0 thensende max {x e , w} Lasteinheiten über Kante e, wobeiw die aktuelle Last istelse if es gibt ein e der Farbe j <strong>mit</strong> x e < 0 thenend ifend forend whileversuche, Last über x ezu empfangenAlgorithmus 6.2: DE-Sched aus Sicht eines Prozessors6.3 MessergebnisseVergleich der KonvergenzBevor die L<strong>auf</strong>zeiten verglichen werden, wird die Konvergenz der vier Verfahren untersucht.Bei einer zufälligen Ausgangslastverteilung und einem <strong>Loadbalancing</strong>-Verfahren,das (annähernd) minimale Flüsse erzeugt, sind alle Verfahren sehr schnell und unterscheidensich kaum: In der Regel werden hier nur ein bis drei Schritte benötigt. Erst beikünstlich erhöhten Flüssen, wie in Abbildung 6.1 werden Unterschiede deutlich. In allengezeigten Beispielen erhält man die typische Reihenfolge, dass DE-Sched am schnellstenkonvergiert, gefolgt von PPG, SRRG und RRG.ImplementierungsdetailsWie schon in Abschnitt 5.2 beschrieben, werden die Lasten <strong>mit</strong> <strong>Hilfe</strong> eines Vektors vonZeigern <strong>auf</strong> Speicherbereiche fester Größe (die eigentlichen Lasteinheiten) verwaltet. ZuBeginn des Schedulings wird <strong>auf</strong> jedem Knoten i, der insgesamt mehr Last erhält als erabgeben muss, Speicher für w i −wi 0 Lasteinheiten beschafft. Unter Umständen muss aberbei solchen Knoten, die Lasten von einem Nachbarn zu einem anderen durchleiten“,”während des Schedulings weiterer Speicher alloziert werden. Die Freigabe nicht mehrbenötigten Speichers erfolgt erst nach Herstellung der Gleichverteilung. Bevor jeweilsLasten verschickt werden können, müssen sich beide beteiligten Prozessoren über dieAnzahl der Einheiten verständigen, wozu vorher eine Nachricht in Richtung des Flussesgesandt wird. Gegebenenfalls wird hier eine Null versandt, falls ein Prozessor, der Datensenden müsste, gerade keine Last hat.Die Ergebnisse der Zeitmessungen <strong>auf</strong> ALiCE (vergleiche Abschnitt 5.7) sind in Tabelle6.1 zusammengefasst. Die Zeiten sind so skaliert, dass 100 dem <strong>Loadbalancing</strong> <strong>mit</strong>DE-OPT und α = 1 2entspricht. Der betrachtete Graph ist stets ein 8 × 8-Torus, die123

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!