Vielteilchentheorien in Modellräumen mit diskreter Darstellung

Weitere Magazine

Empfehlungen

Info

52 Kapitel 4 Technische Aspekte berechnet oder nicht. Jeder der zur Verfüngung stehenden Prozessoren kann so einen Teil der Vektoreinträge berechnen, da diese über den Index des Felds v[i] in verschiedene Speicherbereiche geschrieben werden. Natürlich können auch kompliziertere Schleifen parallelisiert werden, da die Vorgehensweise aber immer auf dem gleichen Prinzip beruht, soll hier nicht näher darauf eingegangen werden. Angemerkt sei noch, daß man bei ineinander verschachtelten Schleifen immer versuchen sollte, die äußerste Schleife zu parallelisieren, damit möglichst wenig Kommunikation erforderlich ist. Außerdem sollte man in diesem Fall nie mehr als eine der Schleifen parallelisieren. Wird eine der Schleifen auf die Anzahl der Prozessoren verteilt, ist die Leistung des Systems bereits optimal ausgelastet und eine weitere Parallelisierung würde Ressourcen anfordern, die es nicht gibt. Virtuelle Threads und hohe Kommunikationsverluste wären die Folge. Parallele Tasks Eine der Parallelisierung von Schleifen ähnliche, aber etwas universeller anwendbare Technik ist die taskparallele Programmierung. Auch hierbei wird ausgenützt, daß Programmteile die nicht gegenseitig voneinander abhängen, gleichzeitig ausgeführt werden können. Die Parallelisierung von Schleifen ist im Prinzip nichts anderes als ein Spezialfall paralleler Tasks, deren Verwaltung der Compiler übernimmt. Während bei parallelen Schleifen wie der Matrix–Vektor–Multiplikation jeder Task dieselben Rechenschritte durchführt, können bei der taskparallelen Programmierung die einzelnen Prozesse völlig unterschiedliche Rechenoperationen durchführen. So kann z. B. ein Task mit einem Parametersatz einen Least–Square–Fit durchführen und so zu einen Vektor �v aus bestmöglichen Koeffizienten gelangen, während ein anderer Task gleichzeitig eine Matrix A invertiert. Nach Beendigung der Tasks wäre dann das lineare Gleichungssystem A�u = �v mit �u = A −1 �v bereits gelöst. Im Gegensatz zu parallelen Schleifen, ist es so mit taskparalleler Programmierung möglich, gleichzeitig verschiedene Rechenoperationen ablaufen zu lassen. Bei dieser Vorgehensweise muß allerdings für jeden Task ein eigener Quellcode geschrieben werden, was die Programmierung etwas umständlicher macht. Auch ist darauf zu achten, daß jeder Task nur seine privaten Variablen verändert und daß globale Variablen nur als Input verwendet werden. Darüberhinaus ist es bei taskparalleler Programmierung schwieriger die einzelnen Aufgaben gleichmäßig auf die einzelnen Prozessoren zu verteilen. Der Vorteil der Parallelisierung kann fast völlig zunichte gemacht werden, wenn ein Task sehr viel länger zur Bewältigung seiner Rechenoperationen benötigt, als die anderen. Der weitere Programmablauf wird nämlich erst dann fortgesetzt, wenn alle Tasks beendet sind. Während man bei Schleifen durch einfaches dividieren der Gesamtiterationszahl durch die Anzahl der benützten Prozessoren
4.3 Programmiertechniken 53 zu einer gleichmäßigen Verteilung gelangt, ist es manchmal nötig Laufzeitmessungen der Prozeduren in den unterschiedlichen Tasks durchzuführen, um eine asymmetrische Verteilung der Rechenzeiten auf die Einzelnen Prozessoren zu vermeiden. Bei sorgfältiger Vorgehensweise kann aber gerade bei der taskparallelen Programmierung, insbesondere wenn die einzelnen parallelen Blöcke jeweils viel Arbeit übernehmen können, eine beachtliche Laufzeitverkürzung des Gesamtprogramms erzielt werden. Performance Inwieweit ein Programm parallelisiert werden kann, hängt selbstverständlich von den durchzuführenden Rechenoperationen ab. Es wird nie möglich sein, ein Programm komplett zu parallelisieren, da die Ergebnisse der verschiedenen parallelen Blöcke schließlich irgendwann zusammengefügt werden müssen. So wird man sich immer auf einzelne Regionen des Programms beschränken, die gut parallelisiert werden können. Da, wie schon erwähnt, die parallelen Programmteile miteinander kommunizieren müssen, gibt eine Performanceanalyse am besten Aufschluß darüber, ob und inwieweit es sinnvoll ist das Programm zu parallelisieren. Einige Laufzeitmessungen für das zweidimensionale Hubbard– Modell für unterschiedliche maximale Polanzahlen und daraus resultierenden Dimensionen der SCGF–Matrix sind in Tabelle 4.3.4 zusammengestellt. Es zeigt sich, daß schon für die kleinste Matrixdimension ein Zeitgewinn durch Parallelisierung erzielt werden kann. Bei Laufzeiten von wenigen Minuten ist das allerdings nicht sonderlich relevant. In den ersten beiden Zeilen sind die Laufzeiten für vier bzw. acht Prozessoren praktisch gleich. In diesen Fällen genügt es, das Programm mit vier Prozessoren arbeiten zu lassen, da das Plus an Rechenkapazität durch die nötige Kommunikation zunichte gemacht wird. In Modell Polzahl Dim. Mat. 1CPU 4CPU 8CPU t [h] t [h] t [h] 4 × 4 32 37226 0.4 0.2 0.2 4 × 4 48 129749 4.2 1.9 2.0 6 × 6 72 393627 34.5 12.7 8.9 Tabelle 4.3.4: Programmlaufzeiten in Abhängigkeit der Anzahl von Prozessoren für unterschiedliche maximale Polanzahlen und daraus resultierenden Matrixdimensionen. Alle Angaben beziehen sich auf das zweidimensionale Hubbard–Modell mit U =4und t =1.
Seite 1 und 2:
Vielteilchentheorien in Modellräum
Seite 3:
”All right! ... The Answer to the
Seite 6 und 7:
ii Inhaltsverzeichnis 4.2 Besetzung
Seite 8 und 9:
iv Inhaltsverzeichnis
Seite 10 und 11: 2 Kapitel 1 Einleitung systemen, da
Seite 12 und 13: 4 Kapitel 1 Einleitung methoden in
Seite 14 und 15: 6 Kapitel 1 Einleitung gonalisierun
Seite 16 und 17: 8 Kapitel 2 Vielteilchenmethoden 2.
Seite 18 und 19: 10 Kapitel 2 Vielteilchenmethoden k
Seite 20 und 21: 12 Kapitel 2 Vielteilchenmethoden A
Seite 22 und 23: 14 Kapitel 2 Vielteilchenmethoden
Seite 24 und 25: 16 Kapitel 2 Vielteilchenmethoden =
Seite 28 und 29: 20 Kapitel 2 Vielteilchenmethoden a
Seite 30 und 31: 22 Kapitel 2 Vielteilchenmethoden D
Seite 32 und 33: 24 Kapitel 2 Vielteilchenmethoden D
Seite 36 und 37: 28 Kapitel 2 Vielteilchenmethoden Z
Seite 38 und 39: 30 Kapitel 2 Vielteilchenmethoden
Seite 40 und 41: 32 Kapitel 2 Vielteilchenmethoden B
Seite 42 und 43: Kapitel 3 Modelle und Modellräume
Seite 44 und 45: 36 Kapitel 3 Modelle und Modellräu
Seite 50 und 51: Kapitel 4 Technische Aspekte In die
Seite 52 und 53: 44 Kapitel 4 Technische Aspekte Inn
Seite 54 und 55: 46 Kapitel 4 Technische Aspekte fü
Seite 56 und 57: 48 Kapitel 4 Technische Aspekte Abb
Seite 58 und 59: 50 Kapitel 4 Technische Aspekte Ver
Seite 62 und 63: 54 Kapitel 4 Technische Aspekte der
Seite 64 und 65: 56 Kapitel 5 Ergebnisse zwischen zw
Seite 66 und 67: 58 Kapitel 5 Ergebnisse CDBonn96 CD
Seite 68 und 69: 60 Kapitel 5 Ergebnisse p −1 3/2
Seite 70 und 71: 62 Kapitel 5 Ergebnisse Arbeit von
Seite 72 und 73: 64 Kapitel 5 Ergebnisse liefert und
Seite 74 und 75: 66 Kapitel 5 Ergebnisse kräften zu
Seite 76 und 77: 68 Kapitel 5 Ergebnisse NB NB NB ex
Seite 78 und 79: 70 Kapitel 5 Ergebnisse Bei der num
Seite 80 und 81: 72 Kapitel 5 Ergebnisse |G| =0.2 |G
Seite 82 und 83: 74 Kapitel 5 Ergebnisse Auch für a
Seite 84 und 85: 76 Kapitel 5 Ergebnisse Abbildung 5
Seite 86 und 87: 78 Kapitel 5 Ergebnisse Setzt man n
Seite 88 und 89: 80 Kapitel 5 Ergebnisse magnetische
Seite 90 und 91: 82 Kapitel 5 Ergebnisse 1 oder 0 un
Seite 92 und 93: 84 Kapitel 5 Ergebnisse 1. Bei perf
Seite 94 und 95: 86 Kapitel 5 Ergebnisse Konvergenzv
Seite 96 und 97: 88 Kapitel 5 Ergebnisse E0 − EN 2
Seite 98 und 99: 90 Kapitel 5 Ergebnisse Für U/t =
Seite 100 und 101: 92 Kapitel 5 Ergebnisse nahezu repr
Seite 102 und 103: 94 Kapitel 5 Ergebnisse die Normier
Seite 104 und 105: 96 Kapitel 5 Ergebnisse gie. Die re
Seite 106 und 107: 98 Kapitel 5 Ergebnisse SCGF, HF un
Seite 108 und 109: 100 Kapitel 5 Ergebnisse (kx,ky) ε
Seite 110 und 111:
102 Kapitel 5 Ergebnisse Spektrosko
Seite 112 und 113:
104 Kapitel 5 Ergebnisse 0.8 0.6 0.
Seite 114 und 115:
Kapitel 6 Zusammenfassung und Ausbl
Seite 116 und 117:
108 Kapitel 6 Zusammenfassung und A
Seite 118 und 119:
Anhang A Meson-Austausch-Potentiale
Seite 120 und 121:
112 Anhang A Meson-Austausch-Potent
Seite 122 und 123:
114 Anhang B QMC-Formalismus Die Fr
Seite 124 und 125:
116 Anhang B QMC-Formalismus wird d
Seite 126 und 127:
118 LITERATURVERZEICHNIS [Eng97] L.
Seite 128 und 129:
120 LITERATURVERZEICHNIS [Rin80] P.
Seite 130 und 131:
122 ABBILDUNGSVERZEICHNIS 3.3.1 Mod
Seite 132 und 133:
Tabellenverzeichnis 4.3.1 Zeilenwei
Seite 134:
126 Tabellenverzeichnis 5.3.7 Vergl
Alle anzeigen

Vielteilchentheorien in Modellräumen mit diskreter Darstellung

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?