31.07.2015 Aufrufe

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

5 Details zur Implementierung und Messergebnissedes <strong>Loadbalancing</strong>s ohne Kommunikation lokal berechnen zu können. Eine parallele Berechnungder Eigenwerte würde sich nur für große unstrukturierte Graphen lohnen.Ergänzungen für Verfahren, die die Kanten vorwärts und rückwärts durchl<strong>auf</strong>enBei einigen Verfahren wie DE-OPTfb oder SDE-OPT werden die Kanten des Graphenim Wechsel vorwärts und rückwärts durchl<strong>auf</strong>en. Hat ein Knoten A als ersten Nachbarnden Knoten B und ist gleichzeitig A erster Nachbar von B, dann gibt es für beide zwei<strong>auf</strong>einander folgende Kommunikationsoperationen über die gemeinsame Kante. Diesezwei Kommunikationen lassen sich zu einer vereinen. Dasselbe gilt für den jeweils letztenNachbarn eines Knotens. So haben die Knoten 1 und 2 des Graphen in Abbildung 5.2 a)z. B. eine solche spezielle erste Kante, Knoten 3 dagegen nicht. Ergänzend muss alsogespeichert werden, ob die erste und die letzte Kante eine solch spezielle Kante ist odernicht.Ergänzungen für das zyklische Durchl<strong>auf</strong>en der FarbenGegeben sei ein <strong>mit</strong> c Farben gefärbter Graph. Im Gegensatz zu früher startet die ersteRechnung nun <strong>mit</strong> Farbe zwei, die letzte (c-te) Rechnung entspricht dem Abl<strong>auf</strong> des einfachenVerfahrens. Gemäß Abbildung 5.1 wird die gesamte Rechnung <strong>auf</strong>geteilt in einenersten Halbschritt, m − 2 reguläre Schritte und einen abschließenden Halbschritt. Diedicken grauen Linien deuten an, wo innerhalb der Einzelrechnung eine Schleife über alleFarben komplett ist. Gibt es Knoten, deren Grad kleiner ist als c, so muss diese Infor-Rechnung 1:Rechnung 2:Rechnung 3:Rechnung 4:2 33ersterHalbschritt4 1 2 3 4 1 2 3 4 1 2 3 4 14 1 2 3 4 1 2 3 4 1 2 3 44 1 2 3 4 1 2 3 4 1 2 3 41122 31 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4reguläre SchritteletzterHalbschrittAbbildung 5.1: Abl<strong>auf</strong> von DE-OPTccmation extra gespeichert werden. Als Beispiel hierzu wird der C 3 aus Abbildung 5.2 a)betrachtet. Kursiv neben jedem Knoten eingetragen ist die lokale Nummerierung derNachbarn. Teil b) der Abbildung enthält wiederum den Abl<strong>auf</strong> der Rechnung inklusiveder Markierungen, wo jeweils eine Schleife über alle Nachbarn beendet ist. Diese Informationmuss in einem separaten Vektor gespeichert werden; für den Prozessor 3 aus demBeispiel ergibt sich also (0, 1, 2). Auf den Prozessoren 1 und 2 lautet die Vektoren (1, 1, 2)und (1, 2, 2); sie tragen im Algorithmus 5.1 zum DE-OPTcc die Bezeichnung ccend.5.4 Berechnung und Speicherung der FlüsseDie Flüsse <strong>auf</strong> jedem Prozessor werden in einem Vektor gespeichert, dessen Länge derAnzahl der Nachbarn entspricht. Während des <strong>Loadbalancing</strong>s wird <strong>mit</strong> Gleitkommazahlengerechnet, die am Ende <strong>auf</strong> die nächste ganze Zahl gerundet werden, denn es110

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!