2. Abschattung Kosmischer Strahlung durch den Mond in IceCube

Weitere Magazine

Empfehlungen

Info

$Planungsraster FP C SoSe2013 Di. 13:30-18:00 h Gruppe \ Tag 9.4 ...$

Berechnungen mit Graphik Prozessoren (GPU) 3. Bei einer kleinen Anzahl von Punkten gibt es zudem die Möglichkeit, beide zuvor beschriebenen Strategien zu kombinieren. Da Threads innerhalb eines Blocks über den shared-Memory kommunizieren können, ist es möglich die Minimierung der − log L-Funktion pro Gridpunkt auf einem Block durchzuführen. Hierbei übernimmt ein Thread pro Block die Minimierungsrechnungen. Alle weiteren Threads berechnen bei Funktionsaufrufen Teilsummen der − log L- Funktion, um somit gemeinsam schneller die Gesamtsumme zu errechnen. Folglich macht jeder Block die Minimierung und jeder Thread im Block hilft bei der − log L- Berechnung. Auch hier wird die CPU kaum benötigt. Strategie 3 bietet gegenüber der zweiten Strategie für hinreichend viele Gridpunkte keinen Vorteil, da einige Blöcke warten müssten, bis die ersten Blöcke fertig berechnet wurden. Weiterhin ist die Strategie 2 speziell für große Summen in Funktionsaufrufen geeignet und ist am einfachsten zu implementieren. Für diese Arbeit wird Strategie 2 implementiert, da die Analyse mit vielen Gridpunken (16384) durchgeführt wird. Zur Umsetzung wird ein C++-Programm mit ROOT-Funktionen erstellt. In diesem Programm werden die Daten, die im ROOT-Format vorhanden sind, zunächst eingelesen und eine Hintergrundverteilung bestimmt. Für die Ereignisse, für die die Qualitätskriterien (siehe Abschnitt 3.3) erfüllt sind, werden die Daten in einem Array gespeichert. Hierbei werden je Event die Werte δ azimuth , δ zenith (siehe Gleichung 2.5), der Wert der Background-Verteilung für diese Winkel und die benötigten Fehler auf die Schätzung gespeichert. Von diesem Programm aus wird eine C- Funktion aufgerufen, die als Schnittstelle dient. Als Parameter dienen die Arrays mit den Daten der Events, sowie einige Hilfsparameter um die Minimierung durchzuführen und später die Ergebnisse zu erhalten. Die C-Funktion ist der Teil des Programms, der die Schnittstelle zwischen CPU und GPU darstellt. Ihre Aufgabe ist es, Speicher auf der GPU zu reservieren, die übergebenen Daten auf den Speicher in der GPU zu kopieren und die Grid- und Blockdimensionen festzulegen. Anschließend ruft sie den Kernel auf, der die Berechnungen auf der GPU durchführt. Nach Beendigung des Kernels wird in dieser Funktion das Ergebnis der Berechnung von der GPU auf den Hauptspeicher des Computers zurück kopiert und der Speicher auf der GPU freigegeben. Damit der Kernel für jeden Thread eine Minimierung auf einem eigenen Gridpunkt ausführen kann, wird mithilfe der CUDA-Konstanten BlockIdx.x, BlockIdx.y und ThreadIdx.x ein eindeutiger Index für diesen Thread berechnet. Aus diesem Index wird zum einen durch eine ganzzahlige Division und zum anderen durch eine Modulo-Operation die Position des Gridpunktes berechnet. Jeder Thread berechnet nun nach dem in Abschnitt 4.5 beschriebenen Minimierungsverfahren das n s , für das die − log L-Funktion den minimalen Wert, am entsprechenden Gridpunkt, annimmt. Beim Funktionsaufruf wird eine __device__-Funktion aufgerufen, die die Berechnung der − log L- Funktion auf dem Thread durchführt. Der n s -Wert und der Wert der − log L-Funktion am Ort des Minimums sowie die Anzahl der Iterationen werden in je einem Array im Global Memory der GPU gespeichert. Die Position im Array, an der die Daten gespeichert werden, entspricht dem einmaligen Index, den jeder Thread besitzt. Durch den CUDA-Funktionsaufruf __syncthreads() wird die Berechnung eines Blocks erst weiter fortgesetzt, wenn alle Threads fertig berechnet wurden. Da die Anzahl der Iterationen annähernd gleich groß sein sollte, wird an dieser Stelle kaum Zeit verloren. Die Ergebnisse werden an die C-Funktion zurückgegeben und von dort aus weiter an das Hauptprogramm. Hier können die Ergebnisse aus den Arrays aufgrund ihres Indexes an die korrekten Stellen in Histogramme geschrieben und in Dateien gespeichert werden. Die resultierenden Ergebnisse können anschließend einer weiteren Analyse unterzogen und graphisch dargestellt werden. Das Programm, sowie der CPU- und GPU-Einsatz, ist schematisch in Abbildung 4.5 dargestellt. Der Programm-Code ist unter http://code.icecube.wisc.edu/svn/sandbox/reimann/ verfügbar. 16 RWTH Aachen
4.5. Minimierungsverfahren Abbildung 4.5.: Schematischer Programmaufbau. Der Einsatz von CPU und GPU ist zu sehen und durch die rote Linie getrennt. Die grauen Kästchen stellen die Unterprogramme dar. 4.5. Minimierungsverfahren Um den besten Schätzer für n s zu bekommen, muss die − log L-Funktion in Bezug auf n s an den jeweiligen Gridpunkten minimiert werden. Für die Berechnung des Minimums muss ein Minimierungsalgorithmus verwendet werden. Das Verfahren ist ein erweiterter Brent-Algorithmus und wird im Folgenden vorgestellt. Die − log L-Funktion ist aufgrund der endlichen Summe über die Events eine diskrete und sehr komplizierte Funktion, somit kann für diese keine einfache analytische Ableitung bestimmt werden. Aus diesem Grund muss ein Minimierungsalgorithmus verwendet werden, der ohne Ableitungen auskommt. Das grundlegende Prinzip aller Algorithmen, die hier behandelt werden, beruht auf dem gleichen Verfahren (siehe Abbildung 4.6). Es werden die obere und untere Grenze der Minimierung, sowie ein weiterer dritter Punkt in dem Minimierungsintervall gegeben. Die Grenzen sollten das Minimum umschließen, sonst wird der Algorithmus auf eine der Grenzen konvergieren. Die Funktion muss zunächst nur an dem dritten Punkt ausgewertet werden. Je nach Minimierungsverfahren (siehe die folgenden Abschnitte) wird ein vierter Punkt im Intervall gewählt und an diesem Punkt die Funktion ausgewertet. Nun kann entschieden werden, in welchem Bereich das Minimum liegen kann, bzw. in welchem Bereich es nicht liegt. Hierbei gibt es genau 24 Möglichkeiten. Bei jeder dieser Möglichkeiten kann eine der Grenzen verschoben werden, sodass sich der Wertebereich verkleinert. Wenn A, B, C, D die Funktionswerte für die n s -Werte mit a ind, kann bei A > B < C < D somit c als obere Grenze gewählt werden. Für den Fall, das A D kann b oder c durch a bzw. d ersetzt werden. Nun kann ein neuer vierter Punkt gewählt werden, um den Bereich weiter zu verkleinern. Dieses Verfahren wird so oft wiederholt, bis eine vorgegebene Breite, auch Toleranz genannt, des Wertebereiches erreicht ist. Als Schätzung für das Minimum wird die Stelle mit dem kleinsten Funktionswert gewählt. René Reimann 17
Seite 1: Untersuchungen mit Graphik-Prozesso
Seite 4 und 5: Inhaltsverzeichnis A.2.6. Differenz
Seite 6 und 7: Einleitung Neutrinos werden in viel
Seite 8 und 9: Abschattung Kosmischer Strahlung du
Seite 10 und 11: Abschattung Kosmischer Strahlung du
Seite 12 und 13: Mondschattenanalyse 3. Mondschatten
Seite 14 und 15: Mondschattenanalyse beobachtet (sie
Seite 16 und 17: Berechnungen mit Graphik Prozessore
Seite 24 und 25: Test des Verfahrens 5. Test des Ver
Seite 26 und 27: Test des Verfahrens Abbildung 5.2.:
Seite 28 und 29: Test des Verfahrens Abbildung 5.5.:
Seite 30 und 31: Test des Verfahrens In den Histogra
Seite 32 und 33: Test des Verfahrens Abbildung 5.12.
Seite 34 und 35: Test des Verfahrens Abbildung 5.13.
Seite 36 und 37: Test des Verfahrens Fazit Insgesamt
Seite 38 und 39: Weiterführende Untersuchungen Abbi
Seite 40 und 41: Weiterführende Untersuchungen Abbi
Seite 42 und 43: Zusammenfassung und Ausblick 7. Zus
Seite 44 und 45: Anhang A.1. Zur Toleranzstudie mit
Seite 46 und 47: Anhang A.1.3. Toleranz von 1 in n s
Seite 48 und 49: Anhang A.1.5. Differenzplots für v
Seite 50 und 51: Anhang A.2.2. Toleranz von 10 in n
Seite 52 und 53: Anhang A.2.4. Toleranz von 0,1 in n
Seite 54 und 55: Anhang A.2.6. Differenzplots für v
Seite 56 und 57: Anhang Abbildung A.13.: Signifikanz
Seite 58 und 59: Anhang A.4.2. Untersuchungen für E
Seite 60 und 61: Anhang A.5. Fitergebnisse für n s
Seite 62 und 63: Literaturverzeichnis [17] URL http:
Seite 64 und 65: Abbildungsverzeichnis 5.4. Häufigk
Seite 66 und 67: Abbildungsverzeichnis A.16.Signifik
Seite 68 und 69: Selbstständigkeitserklärung Ich v

2. Abschattung Kosmischer Strahlung durch den Mond in IceCube

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?