Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Weitere Magazine

Empfehlungen

Info

3 Dimension-Exchange-VerfahrenDie letzte Umformung gilt wiederum nach Lemma 3.43. Die Summe der Beträge derElemente jeder Zeile von N ist damitNach Satz von Geršgorin ist damit gezeigt:∥∥A DET L DE+ A∥ = 1 ∥2 42 + 12 d−2 · 2d−1 + (d − 1) · 2 = 2d + 2 .∥N 2∥ ∥2= 1 4 ‖2N‖ 2 = 1 2 ‖N‖ 2 = 1 2 ϱ (N) 1 2 ≤12√2d + 2 =√d + 12√dBemerkung 3.45. Man beachte, dass die experimentell ermittelte Schranke bei2√stattd+12aus letztem Satz liegt. Im Gegensatz zu den vorangegangenen Sätze erhält manhier also nur eine Abschätzung der Flussnorm. Dennoch ist hiermit bewiesen, dass dasVorwärts-und Rückwärts-Durchlaufen der Farben eine Verbesserung des Verfahrens bewirkt.Alle bisher angegebenen Schranken für Flüsse bezogen sich auf endliche Verfahrenund das Kantengewicht α = 1 2. Beim DE-FOS und dessen Abwandlungen hängt daslaufzeitoptimale α aber von der Größe des Graphen ab und liegt zwischen 1 2und 1,vergleiche Satz 3.11. Die in Abbildung 3.11 dargestellten Schranken für Gitter und Torider Größen 2 bzw. 4 bis 24 verdeutlichen, dass hierdurch höhere Flüsse entstehen als beiOPT und OPS.‖x(DE)‖ 2‖x min ‖ 28765432DE-FOS10 5 10 15 20k‖x(DEfb)‖ 2‖x min ‖ 232DE-FOSfb10 5 10 15 20k‖x(DEcc)‖ 2‖x min ‖ 232DE-FOScc10 5 10 15 20kAbbildung 3.11: Schranken für die Normen der Flüsse bei DE-FOS, DE-FOSfb und DE-FOScc für Gitter G k (gestrichelt) und Tori T k (durchgezogene Linie)verschiedener Größe mit laufzeitoptimiertem α3.9 Aufwand der VerfahrenZur Beurteilung, welches Verfahren bei einem gegebenem Graphen das schnellste ist,reicht es nicht aus, die Zahl m der verschiedenen Eigenwerte zu betrachten. Vielmehr82
3.9 Aufwand der Verfahrenmuss man zusätzlich die Anzahl c der Farben berücksichtigen, da hierdurch (im wesentlichen)die Anzahl der Teilschritte pro Schritt bestimmt wird. Jeder Teilschritt bestehtaus einer Kommunikationsoperation und einer festen Anzahl von Rechenoperationen. Dadarüber hinaus die Größe der kommunizierten Daten recht klein ist, wird der Zeitaufwandpraktisch ausschließlich durch die Zahl der Kommunikationen bestimmt.Die DE-OPX-Verfahren benötigen c(m − 1) Kommunikationsschritte. Beim SDE-OPXwerden pro Eigenwert alle Farben zweimal verwendet, was auf 2c(m − 1) Schritte führt.Um Zeit zu sparen, kann man jedoch aufeinander folgende Teilschritte mit der gleichenFarbe zusammenfassen, vergleiche Abbildung 3.12. Dann genügen (2c − 2)(m − 1) + 1Kommunikationsschritte.1 2 3 4 4 3 2 1 1 2 3 4 4 3 2 1 1 2 3 4 4 3 2 1Abbildung 3.12: Kommunikationsschritte beim SDE-OPX am Beispiel c = 4, m = 4Hierzu bedarf es folgender kleiner Abänderung im Verfahren: Zwischen den Knoten kund l gebe es eine Kante der Farbe c. Zu Beginn des c-ten Teilschritts müssen k und lihre aktuellen Lastwerte w k und w l austauschen. Danach berechnen beide Prozessorennicht nur ihren eigenen Lastwert neu sondern auch den ihres Nachbarn. Dadurch entfälltdie Kommunikation zu Beginn des nächsten Teilschrittes, dem wiederum die Farbe czugeordnet ist. Analog wird für Farbe 1 vorgegangen. Der Vorteil dieser Technik machtsich am stärksten bei Graphen mit nur zwei Farben bemerkbar, da in diesem Fall nurein einziger Kommunikationsschritt mehr gebraucht wird verglichen mit DE-OPX.Wie in den Abschnitten 3.7.1 und 3.7.2 bereits angedeutet, stimmt der Aufwand vonDE-OPXfb mit SDE-OPX überein und für DE-OPXcc ergeben sich c(m−1)+c−1 Schritte.Die direkte Zuordnung der Kommunikationsschritte zu den Farben ergibt in einigenFällen bloß eine obere Schranke für den tatsächlichen Zeitbedarf. Dies betrifft solche Graphenbei denen die Anzahl der Farben größer ist als der maximale Knotengrad. Betrachteals Beispiel hierzu Abbildung 3.13. Durch Vermischung der zu den Farben gehörendenTeilschritte sind für 5 Schritte (Eigenwerte) nicht 5 · 3 = 15 sonder nur 11 Kommunikationsschrittenotwendig. Diese Beobachtung wurde bereits in [XL95] beschrieben.Nun wird die Situation für beliebiges n betrachtet Jeder Prozessor muss pro Eigenwertmit zwei Nachbarn kommunizieren; insgesamt führt dies auf n(m−1) Kommunikationen.Wie die Abbildung verdeutlicht, finden in jedem Kommunikationsschritt⌈ n−12Kommunikationenstatt. Die Gesamtzahl der Kommunikationsschritte ist daher 2n⌉n−1 (m − 1)und nicht 3(m−1), wie obige Formel vermuten ließe. ⌈ Ähnliche⌉Überlegungen ergeben fürden Torus T n [6] , dass nicht 6(m − 1) sondern nur 4nn−1 (m − 1) Kommunikationsschritteanfallen.Dieselben Überlegungen gelten für die Diffusionsverfahren im One-Port-Kommunikationsmodell.83
Seite 1:
Loadbalancingauf Parallelrechnernmi
Seite 5:
Inhaltsverzeichnis8 Zusammenfassung
Seite 9:
Abbildungsverzeichnis2.1 Konvergenz
Seite 13 und 14:
VorwortLoadbalancing-Verfahren werd
Seite 15:
Kapitel 5 enthält Hinweise zur Imp
Seite 18:
1 EinleitungVor Ausführung eines L
Seite 21 und 22:
1.5 Kommunikationsmodelle und Verfa
Seite 23:
1.9 Bezeichnungen für spezielle Ma
Seite 26 und 27:
2 Diffusionsverfahren(Definition 2.
Seite 28 und 29:
2 DiffusionsverfahrenLemma 2.17 ([D
Seite 30 und 31:
2 DiffusionsverfahrenDie zugehörig
Seite 32 und 33: 2 DiffusionsverfahrenC 1210 210 00
Seite 34 und 35: 2 DiffusionsverfahrenG keinem der o
Seite 36 und 37: 2 Diffusionsverfahren• Leja (1) (
Seite 38 und 39: 2 DiffusionsverfahrenP 810 210 010
Seite 40 und 41: 3 Dimension-Exchange-VerfahrenBeim
Seite 43 und 44: 3.4 Ein erstes Dimension-Exchange-V
Seite 45: 3.4 Ein erstes Dimension-Exchange-V
Seite 48 und 49: 3 Dimension-Exchange-Verfahrenŵ 0
Seite 50 und 51: 3 Dimension-Exchange-Verfahrenbekan
Seite 52 und 53: 3 Dimension-Exchange-VerfahrenDefin
Seite 54 und 55: 3 Dimension-Exchange-Verfahrenmit(
Seite 56 und 57: 3 Dimension-Exchange-Verfahren1 2 3
Seite 58 und 59: 3 Dimension-Exchange-Verfahrenwobei
Seite 60 und 61: 3 Dimension-Exchange-VerfahrenM DE
Seite 62 und 63: 3 Dimension-Exchange-Verfahrenbzw.
Seite 64 und 65: 3 Dimension-Exchange-VerfahrenGraph
Seite 66 und 67: 3 Dimension-Exchange-Verfahren‖x(
Seite 68 und 69: 3 Dimension-Exchange-VerfahrenKommu
Seite 70 und 71: 3 Dimension-Exchange-Verfahrenfolge
Seite 72 und 73: 3 Dimension-Exchange-VerfahrenBewei
Seite 74 und 75: 3 Dimension-Exchange-Verfahren2. Di
Seite 76 und 77: 3 Dimension-Exchange-VerfahrenNach
Seite 84 und 85: 3 Dimension-Exchange-VerfahrenK.-Sc
Seite 86 und 87: 3 Dimension-Exchange-VerfahrenGraph
Seite 88 und 89: 3 Dimension-Exchange-Verfahrenverbe
Seite 90 und 91: 4 Verfahren für Produktgraphenfor
Seite 92 und 93: 4 Verfahren für Produktgraphen‖x
Seite 94 und 95: 4 Verfahren für ProduktgraphenG 16
Seite 96 und 97: 4 Verfahren für Produktgraphenx =
Seite 98 und 99: 4 Verfahren für ProduktgraphenWäh
Seite 100 und 101: 4 Verfahren für Produktgraphen( )(
Seite 102 und 103: 4 Verfahren für ProduktgraphenExpe
Seite 104 und 105: 4 Verfahren für Produktgraphen1.25
Seite 106 und 107: 4 Verfahren für ProduktgraphenVerf
Seite 108 und 109: 108
Seite 110 und 111: 5 Details zur Implementierung und M
Seite 122 und 123: 6 Scheduling-VerfahrenGemäß [DFM9
Seite 124 und 125: 6 Scheduling-Verfahren∥ ∥ x k
Seite 126 und 127: 6 Scheduling-Verfahrenα Ges.-last
Seite 128 und 129: 7 Kurze AusblickeWeitere, insbesond
Seite 130 und 131: 8 Zusammenfassung der Ergebnisse∥
Seite 132 und 133:
Literaturverzeichnis[EFMP99] Robert
Alle anzeigen

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?