31.07.2015 Aufrufe

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5.8 Ergebnisse der Zeit- und FlussmessungenAusnahme hiervon stellt vielleicht das DE-FOS bei unstrukturierten Graphen dar, wo zurBestimmung des optimalen α eine Art binäre Suche <strong>mit</strong> mehreren Eigenwertberechnungendurchgeführt wird. Um die Zeiten der verschieden schnellen Rechner besser vergleichenzu können, sind skalierte statt absoluter Zeiten abgedruckt. Als Referenz dient daseinfachste (d. h. am leichtesten zu implementierende) endliche Verfahren, nämlich OPT;dessen Zeiten werden <strong>auf</strong> 100 gesetzt. Die realen Zeiten für dieses Verfahren sind in Tabelle5.1 ersichtlich. Sie liegen in der Regel im Bereich weniger Milli- bis Zentisekunden.Graph ALiCE PSC PC-ClusterC 32 1,41 4,26 16,83K 16 0,751 2,26 10,2G 8 5,23 14,6 191T 8 2,14 6,88 94,8H 6 1,65 9,85 92,0R 32,96 10,7 29,3 110Tabelle 5.1: Zeiten für OPT <strong>auf</strong> den Graphen der nachfolgenden Tabellen in Millisekunden(im Falle des PC-Clusters sind die gemessenen Zeiten dividiert durchdie Anzahl der Prozesse pro Prozessor)Im Falle des PC-Clusters sind die gemessen Zeiten durch die Anzahl der Prozesse proRechner dividiert. Mit Ausnahme der Hypercubes und vielleicht des zufälligen Graphenwar hier sichergestellt, dass keine zwei zu benachbarten Knoten gehörenden Prozesse <strong>auf</strong>dem selben Prozessor liefen. Als Referenz für den minimalen Fluss wurden die Resultatedes OPS-Verfahrens verwendet, da dieses ein besonders stabiles Konvergenzverhaltenzeigt.Von maximal 28 verschiedenen Verfahren wurden jeweils die durchgeführt, die <strong>auf</strong> denjeweiligen Graphen anwendbar sind.Der Wert für das konstante Kantengewicht α wurde für alle nicht-endlichen Verfahrenjeweils optimal gewählt, bei allen <strong>Dimension</strong>-Exchange-Verfahren gleich 1 2, und beimOPS so, dass alle Diagonalelemente von M Diff positiv bleiben (0,4 / 0,06 / 0,2 / 0,2/ 0,15 / 0,1 für C / K / G / T / H / R). Bei den endlichen Verfahren wurden dieEigenwerte <strong>mit</strong>tels Leja-Sortierung angeordnet; als Exponent g für die Gewichtsfunktionwurde 1 bei Nicht-ADI- und 1,5 bei ADI-Verfahren benutzt. Der Wert für η bei ADI-OPSund dessen Varianten wurde <strong>auf</strong> 4 gesetzt.Um die Zeiten im Millisekundenbereich exakt genug messen zu können, wurden erstensmindestens 50 Messungen hintereinander ausgeführt und zweitens wurde mindestens 20Sekunden lang gemessen. Diese Prozedur wurde sechsmal wiederholt. Nach Streichungdes kleinsten und größten Wertes wurde über die vier übrigen Werte ge<strong>mit</strong>telt.Die erste Tabelle 5.2 zum Zyklus C 32 zeigt, dass sich die OPT-Zeiten, in Übereinstimmung<strong>mit</strong> den Vorhersagen in Tabelle 3.4, etwa <strong>auf</strong> die Hälfte reduzieren lassen. Esist zu erkennen, dass die Verfahren DE-OPTfb und SDE-OPT bei einem Graphen <strong>mit</strong>nur zwei Farben wegen der Zusammenfassung von je zwei Teilschritten tatsächlich kaumlänger dauern als DE-OPT. Das Problem der nicht-minimalen Flüsse kann bei Zyklen115

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!