Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Weitere Magazine

Empfehlungen

Info

1 Einleitungbehandelten Loadbalancing-Verfahren. Im Gegensatz dazu hat bei Rechnern mit verteiltemSpeicher (distributed memory) jeder Rechner seinen eigenen, von den anderenProzessoren unabhängigen Speicher. Der Datenaustausch erfolgt durch das Versendenvon Nachrichten (message passing) über ein Netzwerk.Bei den verwendeten Netzwerken sind viele verschiedene Topologien anzutreffen. Besondersauf etwas älteren Rechnern sind die Prozessoren oftmals in Form eines Gitters,Torus oder Hypercubes angeordnet, manchmal auch als Zyklus oder als Baum. Währendder Datenaustausch zwischen zwei Prozessoren, die in dieser Struktur benachbartsind, in der Regel sehr schnell ist, kann die Kommunikation zwischen zwei beliebigenKnoten um ein Vielfaches länger dauern. In solchen Fällen ist der für das Loadbalancingverwendete Graph dieser Topologie anzupassen. Beispiele für Rechner mit solch festerTopologie sind die Cray T3E (3-D Torus), Fujitsu AP3000 (2D-Torus), SGI Origin 2000(Hypercube mit 4 Prozessoren pro Knoten) oder der schon etwas ältere (1993) nCUBE2S (Hypercube der maximalen Dimension 12).Vielfach werden in neueren Parallelrechnern aber Switches bzw. Crossbars eingesetzt,so dass jeder Prozessor mit jedem beliebigen anderen Prozessor in etwa gleich schnellkommunizieren kann. Bei mehr als etwa 64 Prozessen werden in der Regel mehrstufigeCrossbars verwendet. Beispiele hierfür sind Fujitsu VPP5000 (einstufiger Crossbar),Hitachi SR8000 (bis zu dreistufiger Crossbar) und NEC SX-6 (mehrstufiger Crossbar).Diese Architektur lässt sich zwar am ehesten durch einen vollständigen Graphen beschreiben;allerdings ist es nicht möglich, dass jeder Prozessor mit allen anderen Prozessorengleichzeitig kommuniziert. Der Vorteil ist vielmehr, dass durch Auswahl einzelnerVerbindungen beliebige Teilgraphen verwendet werden können. In diesem Fall kann manentweder einen für die Anwendung passenden Graphen wählen (z. B. bei Finite-Elemente-Anwendungen) oder einen an die zur Verfügung stehende Anzahl an Prozessoren angepasstenGraphen, also beispielsweise bei einer Zweierpotenz einen Hypercube, oder sonsteinen mehrdimensionalen Torus.In diese zweite Kategorie von Rechnern ohne bestimmte Topologie fallen auch dieimmer häufiger anzutreffenden Cluster. Hierbei werden aus Standardkomponenten bestehendeRechner (z. B. normale PCs) miteinander vernetzt, im einfachsten Fall mit normalenEthernet-Karten, falls bessere Datentransferraten erzielt werden sollen mit spezialisierterHardware wie zum Beispiel einem Myrinet-Netzwerk. Mit dem Linux NetworX(2304 Intel-Xeon-Prozessoren, 11 TFlop/s Peak-Performance) und dem HPTi (1536 Prozessoren)befinden sich sogar zwei Cluster unter den ersten zehn Plätzen der TOP500-Liste vom November 2002.Eine ganz andere Art von ”Cluster“ stellen lose vernetzte Rechner dar, die nur gelegentlichgemeinsam für große Rechenaufgaben benutzt werden und daher keine besondersschnelle Netzwerkanbindung besitzen. Ein weiteres mögliches Anwendungsgebiet fürLoadbalancing in der Zukunft stellt das Grid-Computing dar, bei dem mehrere, räumlichunter Umständen weit entfernte, Rechner gemeinsam benutzt werden. Bei diesen letztenbeiden Fällen ist ein schnelles Loadbalancing-Verfahren noch wichtiger als bei echtenParallelrechnern mit schneller spezialisierter Kommunikationshardware.Einen guten Überblick über Parallelrechner-Topologien liefert das Einführungskapitelin [ALO02], ausführlichere Informationen zur Hardware finden sich in [vdSD02]. Dieser20
1.5 Kommunikationsmodelle und VerfahrensklassenBericht wird jährlich aktualisiert.1.5 Kommunikationsmodelle und VerfahrensklassenNeben der im letzten Abschnitt erläuterten Kategorisierung von Parallelrechnern gibtes noch ein weiteres Unterscheidungsmerkmal, das für Loadbalancing-Algorithmen vongroßer Wichtigkeit ist, nämlich ob der Nachrichtenaustausch immer auf zwei Prozessorenbeschränkt ist oder nicht. Beim so genannten All-Port-Modell wird davon ausgegangen,dass ein Prozessor mit all seinen Nachbarn gleichzeitig kommunizieren kann. Hieraufbasieren die in dieser Arbeit zuerst vorgestellten Diffusionsverfahren. Die meisten tatsächlichenParallelrechner entsprechen dagegen eher dem One-Port-Modell, bei dem derDatenaustausch immer paarweise zwischen zwei Prozessoren erfolgt. Die Dimension-Exchange-Verfahren, denen der wesentliche Teil dieser Arbeit gewidmet ist, sind speziellfür dieses Modell konstruiert.1.6 Anforderungen an Loadbalancing-VerfahrenEine erste Anforderung ergibt sich dadurch, dass die übergeordnete Rechnung für dieDauer des Loadbalancings unterbrochen werden muss, die Bestimmung des ausgleichendenFlusses (erste Phase) sollte also möglichst schnell sein. Bei der Geschwindigkeitheutiger Rechner und Netzwerkhardware wird die Schnelligkeit des Verfahrens allerdingserst bei sehr vielen Prozessoren zu einem wichtigen Kriterium. Zum zweiten sollteein möglichst kleiner ausgleichender Fluss berechnet werden. Sind die Flüsse unnötiggroß, bedeutet dies, dass Lasten auf Umwegen oder gar im Kreis verschoben werdenund dann die zweite Phase (das Scheduling) zu lang dauert. Des weiteren sollte derLoadbalancing-Algorithmus numerisch stabil arbeiten, was bei unüberlegter Anwendungeiniger Verfahren nicht garantiert ist.Eine gleichzeitige Minimierung der Laufzeit und des Flusses hat sich bisher als unmöglichherausgestellt. Das Ziel in den nachfolgenden Kapiteln ist es daher, diesen Anforderungenmöglichst nahe zu kommen.1.7 Häufig verwendete StandardgraphenEs gibt eine Reihe von Standardgraphen, die im Laufe der Arbeit immer wieder verwendetwerden. Dies sind: der Pfad der Länge n (P n ), der Zyklus der Länge n (C n ),k × l-Gitter (G k,l ), k × l-Torus (T k,l ), Hypercube der Dimension d (H d ), Stern aus nKnoten (S n ), kompletter Graph aus n Knoten (K n ) und zufälliger Graph mit n Knotenund N Kanten (R n,N ). Siehe hierzu auch Tabelle 1.1. Quadratische Gitter G k,k und ToriT k,k werden im Folgenden mit G k bzw. T k bezeichnet.21
Seite 1: Loadbalancingauf Parallelrechnernmi
Seite 5: Inhaltsverzeichnis8 Zusammenfassung
Seite 9: Abbildungsverzeichnis2.1 Konvergenz
Seite 13 und 14: VorwortLoadbalancing-Verfahren werd
Seite 15: Kapitel 5 enthält Hinweise zur Imp
Seite 18: 1 EinleitungVor Ausführung eines L
Seite 23: 1.9 Bezeichnungen für spezielle Ma
Seite 26 und 27: 2 Diffusionsverfahren(Definition 2.
Seite 28 und 29: 2 DiffusionsverfahrenLemma 2.17 ([D
Seite 30 und 31: 2 DiffusionsverfahrenDie zugehörig
Seite 32 und 33: 2 DiffusionsverfahrenC 1210 210 00
Seite 34 und 35: 2 DiffusionsverfahrenG keinem der o
Seite 36 und 37: 2 Diffusionsverfahren• Leja (1) (
Seite 38 und 39: 2 DiffusionsverfahrenP 810 210 010
Seite 40 und 41: 3 Dimension-Exchange-VerfahrenBeim
Seite 43 und 44: 3.4 Ein erstes Dimension-Exchange-V
Seite 45: 3.4 Ein erstes Dimension-Exchange-V
Seite 48 und 49: 3 Dimension-Exchange-Verfahrenŵ 0
Seite 50 und 51: 3 Dimension-Exchange-Verfahrenbekan
Seite 52 und 53: 3 Dimension-Exchange-VerfahrenDefin
Seite 54 und 55: 3 Dimension-Exchange-Verfahrenmit(
Seite 56 und 57: 3 Dimension-Exchange-Verfahren1 2 3
Seite 58 und 59: 3 Dimension-Exchange-Verfahrenwobei
Seite 60 und 61: 3 Dimension-Exchange-VerfahrenM DE
Seite 62 und 63: 3 Dimension-Exchange-Verfahrenbzw.
Seite 64 und 65: 3 Dimension-Exchange-VerfahrenGraph
Seite 66 und 67: 3 Dimension-Exchange-Verfahren‖x(
Seite 68 und 69: 3 Dimension-Exchange-VerfahrenKommu
Seite 70 und 71:
3 Dimension-Exchange-Verfahrenfolge
Seite 72 und 73:
3 Dimension-Exchange-VerfahrenBewei
Seite 74 und 75:
3 Dimension-Exchange-Verfahren2. Di
Seite 76 und 77:
3 Dimension-Exchange-VerfahrenNach
Seite 78 und 79:
Seite 80 und 81:
Seite 82 und 83:
3 Dimension-Exchange-VerfahrenDie l
Seite 84 und 85:
3 Dimension-Exchange-VerfahrenK.-Sc
Seite 86 und 87:
3 Dimension-Exchange-VerfahrenGraph
Seite 88 und 89:
3 Dimension-Exchange-Verfahrenverbe
Seite 90 und 91:
4 Verfahren für Produktgraphenfor
Seite 92 und 93:
4 Verfahren für Produktgraphen‖x
Seite 94 und 95:
4 Verfahren für ProduktgraphenG 16
Seite 96 und 97:
4 Verfahren für Produktgraphenx =
Seite 98 und 99:
4 Verfahren für ProduktgraphenWäh
Seite 100 und 101:
4 Verfahren für Produktgraphen( )(
Seite 102 und 103:
4 Verfahren für ProduktgraphenExpe
Seite 104 und 105:
4 Verfahren für Produktgraphen1.25
Seite 106 und 107:
4 Verfahren für ProduktgraphenVerf
Seite 108 und 109:
108
Seite 110 und 111:
5 Details zur Implementierung und M
Seite 112 und 113:
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Seite 120 und 121:
Seite 122 und 123:
6 Scheduling-VerfahrenGemäß [DFM9
Seite 124 und 125:
6 Scheduling-Verfahren∥ ∥ x k
Seite 126 und 127:
6 Scheduling-Verfahrenα Ges.-last
Seite 128 und 129:
7 Kurze AusblickeWeitere, insbesond
Seite 130 und 131:
8 Zusammenfassung der Ergebnisse∥
Seite 132 und 133:
Literaturverzeichnis[EFMP99] Robert
Alle anzeigen

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?