Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Weitere Magazine

Empfehlungen

Info

5 Details zur Implementierung und Messergebnisseweitestgehend vernachlässigt werden.Verfahren Schritte Zeiten‖x‖Fluss: 2‖x min ‖ 2ALiCE PSC PC-Cluster Rand PeakAsync-FOS 341 1866 1333 1787 0,999 1Async-SOS 45 298 225 256 1 1Async-Čebyšev 37 255 196 215 1 1OPT 16 100 100 100 1,001 1FB-Async-OPT 16 51 60 57 1,001 1Async-OPS 16 95 74 90 1 1DE-FOS 17 153 152 123 1,02 1,037DE-OPT 8 39 56 54 1,002 1,001DE-OPTfb 8 42 60 57 1 1DE-OPTcc 8 42 62 57 1 1SDE-OPT 8 52 58 57 1,002 1,001DE-OPS 8 39 56 54 1,002 1,001Tabelle 5.2: Ergebnisse für den Zyklus C 32Der komplette Graph aus Tabelle 5.3 entspricht am ehesten der Topologie vieler Parallelrechner,bei denen mit Hilfe von Switches oder Crossbars jeder Prozessor mit jedemanderen gleichberechtigt kommunizieren kann. Allerdings ist es technisch ausgeschlossen,alle möglichen Verbindungen gleichzeitig zu benutzen. Da dieser Graph nur einen vonNull verschiedenen Eigenwert hat, sind Diffusionsverfahren hierfür relativ schnell. Dennochsteigt der Aufwand mit der Gesamtzahl der Prozessoren, da mit allen Nachbarneinmal kommuniziert werden muss. Für das nachfolgende Scheduling bedeutet dies, dassdie Lasten über wesentlich mehr Kanten verschoben werden als bei anderen Graphen.Nichtsdestotrotz ist Dimension-Exchange im Falle dieses speziellen Graphen den Diffusionsverfahrensowohl in Bezug auf die Laufzeiten als auch auf die Flüsse klar unterlegen.Die beiden wichtigsten Graphen sind sicherlich das Gitter G 8 in Tabelle 5.4 sowie derTorus T 8 in Tabelle 5.5, da man an diesen Beispielen (fast) alle Verfahren vergleichenkann und gerade der Torus in der Praxis als Topologie einiger Parallelrechner verwendetwird. Unter den Verfahren, die die Produktgraphstruktur nicht ausnutzen, sticht vorallem das DE-OPTcc hervor, das in vergleichsweise kurzer Zeit Flüsse berechnet, die nurwenig über dem Minimum liegen. Unter den ADI-Verfahren ist DE-ADC-OPT dasjenige,das geringe Zeiten und kleine Flüsse am besten vereint. Legt man ausschließlich Wertauf eine möglichst geringe Laufzeit, kommen vor allem FB-SDI-OPT und DE-ADI-OPTin Betracht; sollen die Flüsse möglichst klein gehalten werden, ist eher Async-ADC-OPSmit genügend großem η das Verfahren der Wahl, oder auch das wegen der komplexerenImplementierung nur für den Torus getestete DE-ADC-OPTcc. Die recht hohen Zeitenauf der PSC für Tori scheinen nicht repräsentativ zu sein und sollten nicht überbewertetwerden.Der Hypercube aus Tabelle 5.6 verhält sich ähnlich wie Gitter und Tori, auch hier istDE-OPTcc das zu bevorzugende Verfahren. Die aufgeführten ADI-Verfahren sind zwar116
5.8 Ergebnisse der Zeit- und FlussmessungenVerfahren Schritte Zeiten‖x‖Fluss: 2‖x min ‖ 2ALiCE PSC PC-Cluster Rand PeakAsync-FOS 2 200 153 191 0,997 1Async-SOS 2 202 153 194 1 1Async-Čebyšev 2 201 152 195 1 1OPT 1 100 100 100 1 1FB-Async-OPT 1 76 60 91 1 1Async-OPS 1 72 46 91 1 1DE-FOS 6 577 577 545 2,83 3,00DE-OPT 7 405 590 568 2,83 3,00DE-OPTfb 7 754 1107 1039 1,91 1,90DE-OPTcc 7 573 920 699 1,10 1,06SDE-OPT 4 616 635 646 2,78 2,76DE-OPS 7 411 590 572 2,82 3,00Tabelle 5.3: Ergebnisse für den kompletten Graphen K 16durchführbar, indem man den Hypercube als Produkt von P 2 -Pfaden auffasst, die resultierendenVerfahren entsprechen aber alle entweder DE-OPT oder DE-OPTcc, bringen dafüraber einen zusätzlichen Verwaltungsaufwand mit sich. Die Zeiten auf dem PC-Clustersind für den Hypercube dadurch etwas verfälscht, dass eine von sechs Kommunikationenlokal erfolgte.Der ”zufällige“ Graph (Tabelle 5.7) ist für alle Testfälle identisch. Er besteht aus32 Knoten, 96 Kanten, hat einen Knotengrad zwischen 2 und 9 und lässt sich mit 9Farben einfärben. Hier lieferte DE-FOS die Gleichverteilung am schnellsten, aber aufKosten recht hoher Flüsse; am zweitschnellsten war das asynchrone Čebyšev-Verfahren,das sogar minimale Flüsse erzeugt. Sinnvoll könnte noch das hier nicht getestete DE-FOScc sein. Der Grund für die Überlegenheit gegenüber eigenwertbasierten Verfahrendürfte sein, dass der hier gewählte Zufallsgraph einen recht kleinen Durchmesser hatte.Bei unregelmäßigen Gittern, wie sie bei der Aufteilung von Teilgebieten auf Prozessorenin Finite-Elemente-Anwendungen entstehen, lohnen sich endliche Verfahren eher.117
Seite 1:
Loadbalancingauf Parallelrechnernmi
Seite 5:
Inhaltsverzeichnis8 Zusammenfassung
Seite 9:
Abbildungsverzeichnis2.1 Konvergenz
Seite 13 und 14:
VorwortLoadbalancing-Verfahren werd
Seite 15:
Kapitel 5 enthält Hinweise zur Imp
Seite 18:
1 EinleitungVor Ausführung eines L
Seite 21 und 22:
1.5 Kommunikationsmodelle und Verfa
Seite 23:
1.9 Bezeichnungen für spezielle Ma
Seite 26 und 27:
2 Diffusionsverfahren(Definition 2.
Seite 28 und 29:
2 DiffusionsverfahrenLemma 2.17 ([D
Seite 30 und 31:
2 DiffusionsverfahrenDie zugehörig
Seite 32 und 33:
2 DiffusionsverfahrenC 1210 210 00
Seite 34 und 35:
2 DiffusionsverfahrenG keinem der o
Seite 36 und 37:
2 Diffusionsverfahren• Leja (1) (
Seite 38 und 39:
2 DiffusionsverfahrenP 810 210 010
Seite 40 und 41:
3 Dimension-Exchange-VerfahrenBeim
Seite 43 und 44:
3.4 Ein erstes Dimension-Exchange-V
Seite 45:
3.4 Ein erstes Dimension-Exchange-V
Seite 48 und 49:
3 Dimension-Exchange-Verfahrenŵ 0
Seite 50 und 51:
3 Dimension-Exchange-Verfahrenbekan
Seite 52 und 53:
3 Dimension-Exchange-VerfahrenDefin
Seite 54 und 55:
3 Dimension-Exchange-Verfahrenmit(
Seite 56 und 57:
3 Dimension-Exchange-Verfahren1 2 3
Seite 58 und 59:
3 Dimension-Exchange-Verfahrenwobei
Seite 60 und 61:
3 Dimension-Exchange-VerfahrenM DE
Seite 62 und 63:
3 Dimension-Exchange-Verfahrenbzw.
Seite 64 und 65:
3 Dimension-Exchange-VerfahrenGraph
Seite 66 und 67: 3 Dimension-Exchange-Verfahren‖x(
Seite 68 und 69: 3 Dimension-Exchange-VerfahrenKommu
Seite 70 und 71: 3 Dimension-Exchange-Verfahrenfolge
Seite 72 und 73: 3 Dimension-Exchange-VerfahrenBewei
Seite 74 und 75: 3 Dimension-Exchange-Verfahren2. Di
Seite 76 und 77: 3 Dimension-Exchange-VerfahrenNach
Seite 82 und 83: 3 Dimension-Exchange-VerfahrenDie l
Seite 84 und 85: 3 Dimension-Exchange-VerfahrenK.-Sc
Seite 86 und 87: 3 Dimension-Exchange-VerfahrenGraph
Seite 88 und 89: 3 Dimension-Exchange-Verfahrenverbe
Seite 90 und 91: 4 Verfahren für Produktgraphenfor
Seite 92 und 93: 4 Verfahren für Produktgraphen‖x
Seite 94 und 95: 4 Verfahren für ProduktgraphenG 16
Seite 96 und 97: 4 Verfahren für Produktgraphenx =
Seite 98 und 99: 4 Verfahren für ProduktgraphenWäh
Seite 100 und 101: 4 Verfahren für Produktgraphen( )(
Seite 102 und 103: 4 Verfahren für ProduktgraphenExpe
Seite 104 und 105: 4 Verfahren für Produktgraphen1.25
Seite 106 und 107: 4 Verfahren für ProduktgraphenVerf
Seite 108 und 109: 108
Seite 110 und 111: 5 Details zur Implementierung und M
Seite 122 und 123: 6 Scheduling-VerfahrenGemäß [DFM9
Seite 124 und 125: 6 Scheduling-Verfahren∥ ∥ x k
Seite 126 und 127: 6 Scheduling-Verfahrenα Ges.-last
Seite 128 und 129: 7 Kurze AusblickeWeitere, insbesond
Seite 130 und 131: 8 Zusammenfassung der Ergebnisse∥
Seite 132 und 133: Literaturverzeichnis[EFMP99] Robert
Alle anzeigen

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?