2. Abschattung Kosmischer Strahlung durch den Mond in IceCube

Untersuchungen mit Graphik-Prozessoren (GPU) 

zur Messung der Abschattung kosmischer 

Strahlung durch den Mond in IceCube 

von 

René Reimann 

Bachelorarbeit in P H Y S I K 

vorgelegt der 

Fakultät für Mathematik, Informatik und 

Naturwissenschaften 

der Rheinisch-Westfälischen Technischen Hochschule Aachen 

im 

Juli 2011 

angefertigt am 

III. Physikalischen Institut B 

Prof. Dr. Christopher Wiebusch

Inhaltsverzeichnis 


1. Einleitung 1 

2. Abschattung Kosmischer Strahlung durch den Mond in IceCube 3 

2.1. Kosmische Strahlung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 

2.2. Abschattung durch den Mond . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 

2.3. Nachweisprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 

2.4. IceCube-Detektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

2.5. Mondfilter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 

3. Mondschattenanalyse 8 

3.1. Ungebinntes log-Likelihood-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . 8 

3.2. Signalmodell und Hintergrundverteilung . . . . . . . . . . . . . . . . . . . . . . . . 9 

3.3. Cut-Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

3.4. Komplexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

4. Berechnungen mit Graphik Prozessoren (GPU) 12 

4.1. Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 

4.2. Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

4.3. CUDA-Maschine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

4.4. GPU-Strategie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

4.5. Minimierungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 

5. Test des Verfahrens 20 

5.1. Genauigkeit des Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 

5.2. Ergebnisse und Vergleich der Analyse . . . . . . . . . . . . . . . . . . . . . . . . . 25 

5.3. Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 

6. Weiterführende Untersuchungen 33 

6.1. Symmetrischer vs. elliptischer Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . 33 

6.2. Die Energieabhängigkeit des Mondschatten . . . . . . . . . . . . . . . . . . . . . . 35 

7. Zusammenfassung und Ausblick 38 

A. Anhang 39 

A.1. Zur Toleranzstudie mit Brent Algorithmus . . . . . . . . . . . . . . . . . . . . . . . 40 

A.1.1. Toleranz von 100 in n s mit Brent Algorithmus . . . . . . . . . . . . . . . . 40 

A.1.2. Toleranz von 10 in n s mit Brent Algorithmus . . . . . . . . . . . . . . . . . 41 

A.1.3. Toleranz von 1 in n s mit Brent Algorithmus . . . . . . . . . . . . . . . . . . 42 

A.1.4. Toleranz von 0,1 in n s mit Brent Algorithmus . . . . . . . . . . . . . . . . . 43 

A.1.5. Differenzplots für verschiedene Toleranzen in n s mit Brent Algorithmus . . 44 

A.2. Zur Toleranzstudie mit erweitertem Brent Algorithmus . . . . . . . . . . . . . . . . 45 

A.2.1. Toleranz von 100 in n s mit erweitertem Brent Algorithmus . . . . . . . . . 45 

A.2.2. Toleranz von 10 in n s mit erweitertem Brent Algorithmus . . . . . . . . . . 46 

A.2.3. Toleranz von 1 in n s mit erweitertem Brent Algorithmus . . . . . . . . . . . 47 

A.2.4. Toleranz von 0,1 in n s mit erweitertem Brent Algorithmus . . . . . . . . . . 48 

A.2.5. Signifikanzplots für verschiedene Toleranz mit erweitertem Brent Algorithmus 49 

René Reimann 

iii


A.2.6. Differenzplots für verschiedene Toleranzen in n s mit erweitertem Brent Algorithmus 

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 

A.3. Untersuchungen mit elliptischem Signalmodell . . . . . . . . . . . . . . . . . . . . . 51 

A.4. Untersuchungen mit NChannel Schnitt . . . . . . . . . . . . . . . . . . . . . . . . . 53 

A.4.1. Untersuchungen für Events mit niedrigem NChannel . . . . . . . . . . . . . 53 

A.4.2. Untersuchungen für Events mit hohem NChannel . . . . . . . . . . . . . . . 54 

A.4.3. Signifikanzplots mit NChannel Schnitt . . . . . . . . . . . . . . . . . . . . . 55 

A.5. Fitergebnisse für n s -Landschaften der On-Source Region . . . . . . . . . . . . . . . 56 

Literaturverzeichnis 

Abbildungsverzeichnis 

Tabellenverzeichnis 

I 

III 

VII 

iv 

RWTH Aachen

1. Einleitung 

Um astrophysikalische Prozesse und Objekte zu untersuchen und zu verstehen, benötigt man Informationen 

über ihr Verhalten und ihre Eigenschaften. Da diese Objekte viele Lichtjahre von der 

Erde entfernt sind, ist die einzige Möglichkeit, Informationen von ihnen zu erhalten, die Untersuchung 

der Strahlung, die sie aussenden. Diese Teilchen werden kosmische Boten genannt. Es 

handelt sich dabei um hadronischen Teilchen wie Protonen und Atomkernen, sowie Photonen und 

Neutrinos. 

Neutrions sind in der Astrophysik von besonderer Bedeutung, denn sie enthalten die besten 

Informationen über die Richtung ihrer Quelle. Aufgrund ihrer schwachen Wechselwirkung durchqueren 

sie auch interstellaren Staub – im Gegensatz zu Photonen – nahezu ohne Abschwächung. Da 

Neutrinos keine Ladung tragen, werden sie auch nicht durch kosmische Magnetfelder abgelenkt, 

wie es bei den meisten stabilen Hadronen der Fall ist.[1] Dies ist in Abbildung 1.1 schematisch 

verdeutlicht. 

Abbildung 1.1.: Kosmische Botenteilchen auf dem Weg zur Erde. Geladene Teilchen (blau) verlieren 

ihre Richtungsinformation. Photonen (gelb) können absorbiert werden. Neutrinos 

(rot) wechselwirken nur sehr schwach.[1] 

René Reimann 1

Einleitung 

Neutrinos werden in vielen astrophysikalischen Prozessen erzeugt. Die Vermessung dieser Neutrinos 

macht Rückschlüsse auf die zugrundeliegende Physik möglich. Durch Fusionsprozesse werden sie 

in jedem Stern erzeugt. Bei einer Sternmasse von etwa dem vierfachen der Sonnenmasse durchläuft 

ein Stern eine Supernova. Der innere Kern wird sich nach der Explosion wieder zusammen ziehen. 

Da aufgrund des enormen gravitativen Drucks Elektronen und Protonen zusammengedrückt werden, 

bilden sich Neutronen und Neutrinos. Somit können sie Informationen über Neutronensterne 

und schwarze Löcher übermitteln.[2] 

Hochenergetische Neutrinos werden auch in hochenergetischen hadronischen Teilchenreaktionen 

der kosmischen Strahlung produziert. Besonders Pionen- und Kaonen-Produktionen sind hierbei 

von Bedeutung. Pionen zerfallen bevorzugt zu Myonen, da die Elektronproduktion aufgrund der 

Helizität stark unterdrückt ist. Die Myonen zerfallen weiter in Elektron und Neutrino. Somit ergibt 

sich ein Neutrinoverhältnis von (¯ν e : ¯ν µ : ¯ν τ ) = (ν e : ν µ : ν τ ) = (1 : 2 : 0), da Tauneutrinos 

bevorzugt durch D ± S -Zerfälle entstehen, wobei der Wirkungsquerschnitt für D± S 

-Produktionen bei 

niedrigen Energien selbst sehr gering ist. [3] Somit können auch über viele andere Quellen Informationen 

durch Neutrinos zu uns auf die Erde gebracht werden. 

IceCube wurde 2001 geplant um Punktquellen hochenergetischer Neutrinos wie Gamma Ray 

Bursts (GRB), Active Galactic Nuclei (AGN) oder Supernovae zu suchen. Weiterhin erhofft man 

sich, Informationen über Weakly Interacting Massive Particles (WIMPs) zu erhalten. Zudem motivierte 

die Suche nach magnetischen Monopolen und weiteren exotischen Teilchen, sowie nach 

weiteren unerwarteten Phänomenen.[4] 

Um die Position einer Punktquelle korrekt und um die Genauigkeit der Position angeben zu 

können, ist es wichtig, die Winkelauflösung und die Systematik des Detektors zu kennen. Da es 

bis zum jetzigen Zeitpunkt keine Standardkerze für Neutrino-Punktquellen gibt, kann die Winkelauflösung 

mithilfe von Monte-Carlo-Simulationen bestimmt werden. Hierbei treten jedoch viele 

Unsicherheiten auf, wenn die Monte-Carlo-Simulation den Detektor nicht richtig beschreibt. 

Der Nachweis von Neutrinos erfolgt wegen des geringen Wirkungsquerschnittes indirekt über 

Einfangreaktionen. Hierbei kann man zwischen Wechselwirkungen mit neutralem (NC) und geladenem 

(CC) Strom unterscheiden. 

ν + N → ν + X (NC) (1.1) 

ν + N → l + X (CC) (1.2) 

Hierbei steht ν für das Neutrino, N für den Kern, durch den das Neutrino eingefangen wird, l für 

das zugehörige geladene Lepton und X für die hadronische Kaskade. 

Da der IceCube-Detektor Neutrinos über Leptonen aus der geladene Wechselwirkung detektiert, 

werden auch Leptonen aus Luftschauern, die durch hochenergetische kosmische Strahlung 

erzeugt werden, gemessen. Für die meisten Messungen in IceCube bilden Myonen ein großes Untergrundsignal, 

doch für die Bestimmung der Winkelauflösung bieten sie die einzige experimentelle 

Möglichkeit. 

Auch für die kosmische Strahlung ist noch keine Standartkerze bekannt, doch bildet der Mond 

durch Abschattung der kosmischen Teilchen eine Senke. Da für eine Punktquellensuche auch eine 

Punktsenke analysiert werden kann, bietet der Schatten des Mondes in der kosmischen Strahlung 

die Möglichkeit, die Winkelauflösung des IceCube-Detektors zu ermitteln. 

In dieser Arbeit soll der Schatten des Mondes in der kosmischen Strahlung untersucht werden. 

Hierzu wird im zweiten Kapitel die kosmische Strahlung, der Detektor und die Datennahme vorgestellt. 

Im dritten Kapitel wird die Analysemethode erklärt. Kapitel vier bietet einen Einblick in 

die Umsetzung der Analyse auf einer Graphikkarte. In Kapitel fünf wird zunächst die Analyse getestet, 

bevor in Kapitel sechs einige Untersuchungen mithilfe dieser Methode durchgeführt werden. 

Kapitel sieben zieht ein Fazit und gibt einen Ausblick für weitere Analysen. 

2 RWTH Aachen

2. Abschattung Kosmischer Strahlung durch 

den Mond in IceCube 

2.1. Kosmische Strahlung 

Die kosmische Höhenstrahlung wurde von Victor F. Hess 1912 in einem Ballonexperiment unerwartet 

entdeckt. Er wollte mit seinem Ballonexperiment zeigen, dass die Strahlenbelastung mit dem 

Abstand zur Erdoberfläche abnimmt, fand jedoch, dass sie ab einigen Kilometern Höhe wieder 

zunahm. In den Folgejahren untersuchte er die Eigenschaften der kosmischen Höhenstrahlung [5] 

und es wurden viele bis dahin unbekannte Teilchen in ihr gefunden, die heute unter dem Zoo der 

Elementarteilchen bekannt sind.[6] 

Die kosmische Höhenstrahlung besteht bei geringer Energie zu etwa 90% aus Protonen und zu 

etwa 9% aus Heliumkernen. Der Rest sind schwere Kerne bis hin zu Eisen, sowie Anti-Protonen.[7] 

[8, Kapitel 2] 

Das Energiespektrum aller Teilchen der kosmischen Höhenstrahlung folgt einem Potenzgesetz. 

N(E) ∝ E −γ (2.1) 

Der Spektrale Index γ hat für verschiedene Energien einen unterschiedlichen Wert (siehe Tabelle 

2.1). [[8]] 

Tabelle 2.1.: Spektrale Indize für verschiedene Energien der kosmischen Strahlung 

E < 10 15.5 eV γ = −2.7 

10 15.5 eV < E < 10 17.7 eV γ = −3 

10 17.7 eV < E < 10 18.5 eV γ = −3.1 

10 18.5 eV < E γ = −2.7 

Die Übergänge in diesem Spektrum haben traditionell die Namen „knee“, „dip“ und „ankle“. 

Teilchen mit Energien oberhalb von 10 19.5 eV sollten nach dem sogenannte GZK-Cutoff nicht auftreten. 

Er wurde von Greisen, Zatsepin und Kuzmin 1966 eingeführt. Hierbei geht man davon aus, 

dass die hochenergetischen Protonen mit Photonen der 2,7 K Hintergrundstrahlung wechselwirken 

und somit nach 

γ + p → ∆ + → pπ 0 

γ + p → ∆ + → nπ + (2.2) 

weniger energiereiche Pionen, Protonen und Neutronen erzeugen. [7] [8, Kapitel 2 & 6] 

Die unterschiedlichen Spektralen Indize lassen auf unterschiedliche Herkunft, Entstehung und 

Beschleunigung schließen. Es wird vermutet, dass Teilchen mit Energien unter 10 15.5 hauptsächlich 

aus unserer Milchstraße kommen. Teilchen mit noch höheren Energien kommen von außerhalb 

unserer Galaxie. Als Quellen für kosmische Strahlung kommen z.B. Supernovae Explosionen, Pulsare, 

Aktive Galaktische Kerne (AGN), rotierende schwarze Löcher, Gamma Ray Bursts (GRB) 

in Frage. Eine mögliche Erklärung des Beschleunigungsmechanismus kann durch den nach Enrico 

Fermi benannte Fermi Mechanismus erster Art beschrieben werden.[8, Kapitel 3] [9] 

Würde die kosmische Strahlung ohne Abschirmung und Abschwächung auf die Erdoberfläche einfallen, 

so könnte es nicht zu lebenden Organismen, wie wir sie kennen, auf der Erde kommen. Erst 

durch die Erdatmosphäre, die in etwa 15-20 km Höhe beginnt, wird die Strahlung so abgeschwächt, 

René Reimann 3

Abschattung Kosmischer Strahlung durch den Mond in IceCube 

dass Leben auf unserem Planeten möglich ist. Die primär einfallenden Teilchen stoßen mit Atomen 

und Molekülen in den oberen Schichten der Atmosphäre zusammen. Zum Großteil wird dadurch 

die obere Schicht der Atmosphäre ionisiert. Hochenergetische Teilchen erzeugen durch ihren Stoß 

verschiedene andere Teilchen, mit weniger Energie, die dann weiter zur Erde rasen und gegebenenfalls 

auch stoßen. Dadurch entsteht ein lawinenartiger Schauer von Myonen, Elektronen, Photonen, 

Neutrinos und verschiedenen anderen Teilchen.[10] 

Elektronen verlieren aufgrund der Bremsstrahlung soviel Energie, dass sie die Erde nur mit 

niedrigen Energien erreichen. 

Myonen zerfallen im Ruhesystem nach einer Halbwertszeit von 2.197 µs [15], erreichen aufgrund 

der Zeitdilatation bzw. aufgrund der Längenkontraktion (hängt vom Bezugssystem ab) den Erdboden 

und zerfallen nicht vorher. Ihnen geht auf dem Weg durch die Atmosphäre etwa 2 GeV verloren. 

Myonen die in der Atmosphäre aufgrund von Schauern entstehen werden atmosphärische Myonen 

genannt. 

2.2. Abschattung durch den Mond 

Der Mond ist der einzige Trabant der Erde. Er hat einen Radius von 1737.1 km und umkreist die 

Erde in einer mittleren Entfernung von 378000 km in 27.32 Tagen. Der Mond hat eine elliptische 

Laufbahn mit einer Exzentrität von 0.05 und einem Winkel von 5.15 ◦ zur Ekliptic. Somit hat der 

Mond von der Erdoberfläche aus gesehen einen Winkelradius von 0.246 ◦ bis 0.258 ◦ .[11] 

Der Mond hat eine Masse von 7.349 · 10 22 kg und somit eine Dichte von 3350 kg / m 3 . [12] Bei 

einer solchen Dichte werden kosmische Strahlen auf wenigen km abgebremst. Folglich können sie den 

Mond nicht durchdringen und der Mond hinterlässt einen Schatten in der kosmischen Strahlung. 

Der Schatten des Mondes in der kosmischen Strahlung kann versetzt zu der wahren Mondposition 

sein. Dies liegt daran, dass die kosmische Strahlung hauptsächlich aus geladenen Teilchen besteht, 

die von Magnetfeldern zwischen Erde und Mond abgelenkt werden. 

Diese Ablenkung konnte beispielsweise im ARGO Experiment für niederenergetische Teilchen 

gezeigt werden.[13] 

2.3. Nachweisprinzip 

IceCube ist ein Neutrino Observatorium, mit einem Detektorvolumen von 1 km 3 klarem antarktischen 

Eis an der „Amundsen-Scott South Pole Station“ am geographischen Südpol. 

Im Eis lösen Elektronen aufgrund der starken Bremsstrahlung einen elektromagnetischen Schauer 

aus. 

Myonen, die etwa 200 mal schwerer sind [15], strahlen kaum Bremsstrahlung ab. Sie können 

über den Cherenkov-Effekt nachgewiesen werden. Hierbei liegt die Geschwindigkeit des Myons, 

das nahezu Vakuumlichtgeschwindigkeit hat, über der Lichtgeschwindigkeit im Eis. Somit werden 

die Atome nahe der Teilchenspur polarisiert und strahlen Licht ab. Dieses Licht hat die Form eines 

Kegels und wird Cherenkov-Kegel genannt. Für den Cherenkov-Kegel gilt allgemein die Beziehung 

2.3. 

cos ϑ C = (nβ) −1 (2.3) 

Der Öffnungswinkel ergibt sich für Eis mit einem Brechungsindex von n=1.32 und Myonen mit 

Geschwindigkeiten nahe der Lichtgeschwindigkeit β ≈ 1 zu ϑ C ≈ 41 ◦ . Das Cherenkov-Licht breitet 

sich im Eis aus und ist auch in einigen Metern Entfernung noch gut sichtbar.[14] 

Tau-Leptonen haben die Eigenschaft, dass sie nach sehr kurzer Zeit zerfallen. Ihre Lebensdauer 

beträgt 0.29 ps.[15] Demnach lassen sie sich anhand des hadronischen Schauers am Startpunkt und 

eines weiteren Schauers am Endpunkt ihrer Flugbahn erkennen. Die Lebensdauer ist so kurz, dass 

sowohl Start-, als auch Endpunkt, abhängig von der Energie, nur einige Meter auseinander liegen 

können. Für niederenergetische Tau-Leptonen liegen die zwei Schauer sogar ineinander. 

4 RWTH Aachen

2.4. IceCube-Detektor 

2.4. IceCube-Detektor 

Der IceCube-Detektor ist ein Nachfolger des „Antarctic Muon And Neutrino Detector Arrays“ 

(AMANDA), das von 1994 bis 2008 Daten sammelte. Der IceCube-Detektor wurde im arktischen 

Sommer 2010/2011 fertig gestellt und besteht jetzt aus 86 Strings mit jeweils 60 Digitalen Optischen 

Modulen (DOM), die das Cherenkov-Licht von Myonen mit Energien überhalb von 10 GeV 

detektieren. 

Der Großteil von IceCube liegt in einer Tiefe von 1450 m bis 2450 m im klaren antarktischen 

Eis (siehe Abbildung 2.1). Er besteht aus 5160 Digitalen Optischen Modulen welche auf 86 Strings 

aufgeteilt sind. Ein Digitales Optisches Modul (DOM) besteht aus einem empfindlichen Photomultiplier 

und einer zugehörigen Ausleseelektronik. Diese Strings sind in einem annähernd hexagonalen 

Gitter auf einem Gebiet von 1 km 2 verteilt. Ein String besteht aus 60 DOMs, die jeweils einen 

Abstand von 17 m haben. [16] 

In den Vorjahren wurden bereits Daten mit dem unvollständigen Detektor genommen. Diese 

Daten, sowie der Detektor in seinen verschiedenen Ausbaustadien, werden durch die Anzahl an 

Strings charakterisiert. 2005 wurde ein Teststring betrieben. Im arktischen Sommer 2005-2006 

kamen acht Strings hinzu. Diese Konfiguration wird IC9 genannt. Die folgenden Konfigurationen 

sind IC22, IC40, IC59 und IC79. Der vollständige Detektor wird IC86 genannt. Für IC22, IC40, 

IC59 und IC79 wurden die Daten eines Jahres gesammelt. Dabei ist zu beachten, dass nur IC86 

und IC79 einen symmetrischen Aufbau in Azimut hat. [16] 

In dieser Arbeit werden, soweit nicht anders erwähnt, Daten von IC59 verwendet. 

2.5. Mondfilter 

Aufgrund einer enormen Datenmenge, die in IceCube produziert wird, müssen die Daten bereits 

am Südpol vorselektiert werden, bevor sie über einen Satelliten, mit begrenzter Bandbreite, auf die 

nördliche Halbkugel übertragen werden. Hierzu werden zunächst Qualitätsschnitte auf die Daten 

angewendet. Die Anzahl der getroffenen Strings (NString) muss größer gleich drei und die Anzahl 

der getroffenen DOMs (NChannel) muss größer gleich zwölf sein. Aus diesem Grund kann eine 

Online-Spurrekonstruktion durchgeführt werden, bei der die mittlere Winkelauflösung hinreichend 

gut ist. 

Diese Spurrekonstruktion basiert auf einer Maximum Likelihood Methode. Die Spur wird so rekonstruiert, 

dass die Ankunftzeiten und Amplituden von Licht in den DOMs am besten beschrieben 

werden. Hierbei hat der Zeitunterschied zwischen theoretisch erwarteter Ankunftszeit durch das 

Modell in Abbildung 2.2 und der gemessenen Ankunftszeit den größten Einfluss.[18] 

Um den Schatten des Mondes zu beobachten, werden nur Daten aus Richtung des Mondes 

benötigt. Da der Mond nicht still steht, sondern täglich etwa einmal über den gesamten Horizont 

wandert und zudem seine Deklination ändert, müssen die Daten in Relativkoordinaten 

δ azimuth = (ϕ event − ϕ moon ) · sin(ϑ event ) (2.4) 

δ zenith = ϑ event − ϑ moon (2.5) 

gegeben werden. Das die Differenz in Azimut mit dem Sinus des Zenitwertes multipliziert wird, 

führt zu einer korrekten Skalierung für eine kartesische Darstellung. 

Die Deklination des Mondes schwankt zwischen -25 ◦ bis +25 ◦ . Da für zu geringe Winkel der 

Weg durch die Atmosphäre und das Eis, für die kosmische Strahlung, immer länger wird, ist für 

sehr kleine Deklinationen die Datennahme nicht sinnvoll. Der Mondfilter selektiert Daten, wenn 

der Mond höher als 15 ◦ am Horizont steht. Dies ist an etwa 8 Tagen im Monat der Fall. 

Da nur Daten in der Nähe des Mondes von Interesse sind, jedoch auch Off-Source-Regionen beobachtet 

werden müssen, selektiert der Mondfilter Events, die in einem Fenster von ±40 ◦ in Azimut 

multipliziert mit dem Sinus des Zenit und ±10 ◦ in Zenit um den Mond detektiert werden.[19] 

Eine Offline-Spurrekonstruktion basiert ebenfalls auf der oben beschriebenen Likelihood Maximierung, 

wird jedoch durch mehrfache Iteration eine andere, meist näher an der Wahrheit liegende 

René Reimann 5

Abschattung Kosmischer Strahlung durch den Mond in IceCube 

Abbildung 2.1.: IceCube-Detektor am geographischen Südpol. Die verschiedenen Detektorkomponenten 

sind eingezeichnet. Die unterschiedlichen Farben der Strings zeigen das 

Jahr der Inbetriebnahme an.[17] 

Spur finden. Um die resultierende Spur wird auf zwei Kreisen an je acht Punkten die Likelihoodfunktion 

berechnet. Durch diese Punkte wird eine Paraboloidfunktion gefittet. Die Schärfe des 

Paraboloids gibt Auskunft über die Güte der Rekonstruktion. In dieser Analyse wird die Likelihood 

Rekonstruktion SPE (Single Photo-Elektron) verwendet.[20] 

Die rekonstruierte Paraboloidfunktion hat die Parameter σ 1 , σ 2 und α. Hierbei ist σ 1 die größere 

Halbachse der 1-Sigma-Ellipse. α ist der Winkel von der Azimut-Achse bis zu σ 1 (siehe Abbildung 

2.3).[21] 

Da die Online und Offline-Rekonstruktion unterschiedliche δ azimuth und δ zenith Werte ergeben 

können, kann es sein, dass Spuren, die übertragen worden sind außerhalb bzw. Spuren, die nicht 

übertragen worden sind innerhalb des Mondfensters liegen. Um diese Randeffekte zu minimieren, 

wird ein Fenster von ±36 ◦ in Azimut multipliziert mit Sinus des Zenits und ±8 ◦ in Zenit um 

den Mond gewählt. Für die Analyse werden eine On-Source und zwei Off-Source Regionen wie in 

Abbildung 2.4 definiert. Jede Region ist 8 ◦ in Zenit und 8 ◦ in Azimut/sin ϑ groß. Die On-Source 

Region enthält 22198152, die Off-Source 1 Region 22174047 und die Off-Source 2 Region 22143731 

Events für IC59. 

6 RWTH Aachen

2.5. Mondfilter 

Abbildung 2.2.: Zur Rekonstruktion der Myonspur wird der Unterschied der theoretisch zu erwartenen 

und gemessenen Ankunftszeit ermittelt. Die Likelihoodfunktion zur Berechnung 

der Spur basiert zum Großteil auf diesem Zeitunterschied.[18] 

Abbildung 2.3.: Zur Definition von σ 1 , σ 2 und α. [21] 

Abbildung 2.4.: Fenster des Mondschattenfensters (rot) und Definition der Off-Source Regionen 

(gelb) und der On-Source Region (grau). Für die Analyse wurden nur Daten aus 

dem blauen Fenster verwendet.[11] 

René Reimann 7

Mondschattenanalyse 

3. Mondschattenanalyse 

3.1. Ungebinntes log-Likelihood-Verfahren 

In dieser Arbeit wird das ungebinnte Likelihood-Verfahren zur Rekonstruktion des Mondschattens 

der kosmischen Strahlung verwendet, wie es in der Diplomarbeit „Measurements of the Shadowing 

of Cosmic Rays by the Moon with the IceCube Neutrino Observatory“ von Jan Blumenthal 

behandelt wurde.[11] 

Das Verfahren basiert auf einer Methode zur Punktquellensuche für Neutrinos [22]. In dieser 

Methode wird nach dem optimalen Schätzer für die Anzahl von Source-Events n s gesucht. Bei der 

Mondschatten Analyse sucht man nicht nach einer Neutrinoquelle, sondern beobachtet eine Senke 

für kosmische Strahlung. Folglich kann n s als Anzahl der abgeschatteten Events bezeichnet werden. 

Gibt es eine Schätzung für den Hintergrund und ein Modell für das Signal bzw. die Senke, so 

kann eine Likelihoodfunktion aufgestellt werden. Durch diese Likelihoodfunktion soll die Anzahl 

von abgeschatteten Events ermittelt werden, für die die Kombination von Hintergrund bzw. Signal 

am besten die gegebenen Daten beschreibt. Da es sich bei Hintergrund- und Signalverteilung um 

Wahrscheinlichkeitsdichten handelt, sollten beide Funktionen seperat normiert sein. 

Für ein Event ist die Likelihoodfunktion L i entweder mehr dem Signal oder Hintergrund ähnlich. 

Auf Grund dessen ergibt sich eine Likelihoodfunktion für ein Event mit der Signalverteilung an 

einer bestimmten Position ⃗x: 

L i (⃗x, n s ) = n ( 

s 

N S i(⃗x) + 

1 − n s 

N 

) 

B i (⃗x) (3.1) 

Hierbei ist N die Anzahl der Gesamtevents und sorgt für die korrekte Normierung der Likelihoodfunktion. 

Insgesamt ergibt sich für N Events eine Likelihoodfunktion für die der Schatten eine Stärke n s 

hat und um ⃗x von der nominellen Position verschoben ist. 

L(⃗x, n s ) = 

N∏ 

L i (⃗x, n s ) (3.2) 

i=1 

Das n s , welches diese Funktion maximiert, ist der beste Schätzer für die Beschreibung der Daten 

mit diesem Modell. Um die Berechnung zu vereinfachen kann der Logarithmus dieser Funktion 

verwendet werden, da es sich hierbei um eine monotone Funktion handelt und somit das Maximum 

nicht verschiebt. Da für Computer meist ein Minimierungsalgorithmus verwendet wird, kann das 

Maximum durch Hinzufügen eines Minuszeichens in ein Minimum umgewandelt werden. Also ergibt 

sich: 

− log L(⃗x, n s ) = − 

N∑ 

i=1 

( ns 

( 

log 

N S i(⃗x) + 

1 − n s 

N 

) ) 

B i (⃗x) 

Es sei darauf hingewiesen, dass die negative log-Likelihoodfunktion (− log L) eine Funktion in 

⃗x und n s ist. Für jedes beliebige ⃗x kann sie in n s minimiert werden. Die Minimierung ist eine 

konkrete Zuweisung, daher erhält man eine Funktion, die nur von ⃗x abhängt. Diese Funktion ist 

jedoch nicht beziehungsweise sehr schwer analytisch aus der − log L-Funktion berechenbar, sondern 

muss an jedem Punkt einzelnd ausgewertet werden. Deswegen ist eine kontinuierliche Darstellung 

schwierig bzw. bei unendlich vielen Punkten unmöglich. Daher muss zur Analyse des Mondschatten 

eine Auswahl an Punkten dieser Funktion ausreichen. 

(3.3) 

8 RWTH Aachen

3.2. Signalmodell und Hintergrundverteilung 

Hierzu wird die − log L-Funktion auf einem Grid in der ⃗x-Ebene berechnet. Jeder Gridpunkt 

hat darum die Koordinaten δ zenith = ϑ Moon − ϑ grid und δ azimuth = (ϕ Moon − ϕ grid ) · sin(ϑ grid ). 

Als Konsequenz ergibt sich eine Landschaft in n s und in − log L. 

Für eine gute Auflösung in den Landschaften werden 128 x 128 (16384) Gridpunkte berechnet. 

Um Randeffekte zu vermeiden wird die − log L nur in einem 4 ◦ x 4 ◦ großen Fenster berechnet, 

wobei jedoch die Daten aus einem 8 ◦ x 8 ◦ großen Fenster stammen. Da auch der Punkt (0,0) 

berechnet werden soll, muss das Grid um 1 2 · 4◦ 

128 

in negative Zenit- und Azimutrichtung verschoben 

werden. Exemplarisch ist auch ein grobes Grid, wie es in der Arbeit von Jan Blumenthal verwendet 

wurde, in Abbildung 3.1 gezeigt. 

Abbildung 3.1.: Links: Ein Gridfenster um den Mond mit 31 x 31 Punkten in Zenit und Azimut 

wie es in [11] benutzt wurde. Rechts: Ein Gridfenster um den Mond mit 128 x 

128 Punkten in Zenit und Azimut wie es in dieser Arbeit benutzt wird. Das Grid 

enthält den Punkt (0,0). 

3.2. Signalmodell und Hintergrundverteilung 

Hintergrundverteilung 

Für die Hintergrundverteilung wird ein Seperationsansatz gewählt: 

B i (δ zen , δ azi ) = B(δ zen,i ) · B(δ azi,i ) (3.4) 

Obwohl die Azimutverteilung allein aufgrund der Detektorgeometrie nicht flach ist, wird dieser 

Effekt bei einem kompletten Mondzyklus annähernd herausgemittelt, da es sich bei δ azimuth 

um Relativkoordinaten handelt. Dies ist nur möglich, wenn die Datennahme über den kompletten 

Mondzyklus stattfindet. Dies kann aufgrund von Umbauphasen, Updates, Ausfällen oder Ähnlichem 

nicht der Fall sein. Jedoch wurden die Daten für jeden Mondzyklus der untersuchten IC59 

Daten in über 90% der Zeit genommen. Auch durch Betrachten wurde auf eine flache Verteilung 

geschlossen. Insofern lässt sich eine Gleichverteilung in Azimut rechtfertigen. [11] 

In Zenit ist die Hintergrundverteilung nicht annähernd flach. Dies ist durch den unterschiedlich 

langen Weg, bei verschiedenen Zenitwinkeln, für Myonen durch die Atmosphäre und das Eis zu 

begründen. Demnach wird für größere Zenitwinkel ein geringerer Fluss erwartet [23] und auch 

René Reimann 9

Mondschattenanalyse 

beobachtet (siehe Abbildung 3.2). Für die Hintergrundverteilung wird die Zenitverteilung aus einem 

bzw. beiden Off-Source Bereichen erstellt und normiert. Für die Berechnung werden die Werte für 

die Zenitverteilung interpoliert.[11] 

Abbildung 3.2.: Normierte Hintergrundverteilung in Zenit. Für die Berechnung des − log L-Wertes 

wird die Verteilung in Radiant umgerechnet. 

Signalmodell 

Für das Signalmodell stehen σ 1 , σ 2 und α aus der Rekonstruktion zur Verfügung. Hieraus wird 

eine elliptische Gaussverteilung für das Signalmodell angenommen. 

S el,i (∆ϕ g , ∆ϑ g , ∆ϕ i , ∆ϑ i ) = Ae −(a(∆ϕi−∆ϕg)2 +2b(∆ϕ i−∆ϕ g)(∆ϑ i−∆ϑ g)+c(∆ϑ i−∆ϑ g) 2 ) 

A = 

1 

2πσ 1 σ 2 

a = cos2 α 

2σ1 

2 + sin2 α 

2σ2 

2 

b = sin(2α) 

4σ 2 1 

c = sin2 α 

2σ 2 1 

− sin(2α) 

4σ 2 2 

+ cos2 α 

2σ 2 2 

(3.5) 

Als eine Vereinfachung dient eine symmetrische Gaussverteilung. Sie sollte in guter Näherung 

das Signal beschreiben. Daher wird sie auch häufig in anderen IceCube-Analysen verwendet. 

S sym,i (∆ϕ g , ∆ϑ g , ∆ϕ i , ∆ϑ i ) = Ae − (∆ϕ i −∆ϕg )2 +(∆ϑ i −∆ϑg ) 2 

2σ 2 

σ = 

A = 

√ 

σ 

2 

1 + σ 2 2 

1 

2πσ 2 

2 

(3.6) 

10 RWTH Aachen

3.3. Cut-Parameter 

3.3. Cut-Parameter 

Um für eine korrekte Normierung der Signalverteilung zu sorgen, muss ein Schnitt auf den Fehler 

des Paraboloids durchgeführt werden. Dadurch wird garantiert, dass bei allen Events die Ausläufer 

der Wahrscheinlichkeitsverteilung, nach wenigen Grad Abweichung vom Mittelwert, vernachlässigbar 

sind. Weiterhin ist es aus numerischen Gründen notwendig, dass dieser Fehler nicht zu klein 

wird. Da dieser Schnitt nur sehr wenige Events betrifft, spielt er eine untergeordnete Rolle. Für 

das Analyseverfahren des Mondschattens, das in dieser Arbeit verwendet wird, wurden die Cut- 

Parameter von Jan Blumenthal bereits zu 0.075 ◦ < σ < 1.5 ◦ bestimmt.[11] σ ist definiert in Formel 

3.7. 

Als Qualitätsmerkmal der Rekonstruktion wird ein reduzierter log-Likelihood rlogl angegeben. 

Hierbei wird der log-Likelihood der Rekonstruktion durch die Anzahl der Freiheitsgrade geteilt.[21] 

Die Schnitte werden analog zu den rlogl-Cuts aus [11] zu 6.5 < rlogl < 8 entnommen. 

3.4. Komplexität 

Auch nach den Cuts verbleiben etwa 11 Millionen Events für die Berechnung des Mondschattens 

aus den IC59 Daten übrig. Demzufolge besteht die Berechnung der − log L-Funktion aus über 

11 Millionen Summanden, deren Berechnung jeweils eine Berechnung der Signalverteilung und 

der Hintergrundverteilung beinhaltet. Um die − log L-Funktion für n s zu minimieren, muss die 

− log L-Funktion an mehreren Stellen ausgewertet werden und somit die enorm große Summe 

berechnet werden. Die Anzahl der Funktionsaufrufe hängt von dem Minimierungsbereich, dem 

Minimierungsverfahren, der Toleranz und der Position des Minimums ab. Doch auch im besten 

Fall müssen etwa 20 Funktionsaufrufe durchgeführt werden. 

Dieser Rechenaufwand, der auf einer 64 Bit CPU mit 3 GHz etwa 20 Minuten dauert, muss für 

jeden Gridpunkt aufgewendet werden, um die resultierenden Landschaften zu erhalten. Um nun 

feine Auflösungen zu erhalten, benötigt man eine alternative Methode, um den Rechenaufwand 

möglichst schnell zu bewältigen. Daher wird in dieser Arbeit ein Graphik-Prozessor (GPU) zur 

Berechnung eingesetzt. Dieser soll im folgenden Kapitel beschrieben und dessen Verwendung bei 

der Analyse erklärt werden. 

René Reimann 11

Berechnungen mit Graphik Prozessoren (GPU) 

4. Berechnungen mit Graphik Prozessoren 

(GPU) 

4.1. Motivation 

Graphik-Prozessoren (GPU) wurden für Videospiele konzipiert. Bei den modernen Spielen soll die 

Landschaft möglichst realistisch dargestellt werden. Sie wird aus einer großen Anzahl von Pologonen 

zusammengesetzt, deren Oberflächen mit vielen unterschiedlichen Texturen belegt werden. Um die 

Informationen über die Pologonen und Texturen schnell zu verwenden, ist ein schneller Speicher 

und schnelle Prozessoren nötig. 

Da für jedes Pixel des Bildes die Informationen benötigt werden und die Berechnung weitgehend 

unabhängig ist, sollten die einzelnen Berechnungen möglichst parallel durchgeführt werden. 

Graphikkarten erfüllen die Herausforderung der Parallelität und des schnellen Speichers. Daraus 

entsteht eine enorme Beschleunigung bei bestimmten Berechnungen, wie in Abbildung 4.1 zu sehen 

ist. CUDA ist eine spezielle Sprache, die nur auf NVIDIA-Graphikkarten läuft und Hardwareoptimiert 

ist. Es ist zu beachten, dass „OpenGL“ hier für die Verwendung der Programmiersprache 

GLSL steht, die für graphische Nutzung entwickelt wurde, und nicht für die mit CUDA konkurrierende 

mächtigere GPGPU-Programmiersprache OpenCL. 

Abbildung 4.1.: Vergleich von Berechnungsgeschwindigkeit zwischen einer CPU und einer GPU 

unter Verwendung der Programmiersprachen CUDA und OpenGL (GLSL) am 

Beispiel eines Scan-Algorithmus. Die verwendete GPU ist eine GeForce 8800 GTX 

und die verwendete CPU ist ein Intel Core2-Duo Extreme 2.93 GHz. [29] 

Zudem entwickeln sich die Videospiele immer schneller weiter, so dass ein ständiger Entwicklungsprozess 

stattfindet. Da Videospiele inzwischen Massenprodukte sind, werden auch Graphikkarten 

in Massen von der Industrie hergestellt. Hierbei kommt es zwar zu kleinen Produktionsfehlern, 

diese werden aber oft in Kauf genommen, da in einem Spiel die winzigen resultierenden Fehler 

kaum auffallen. Dadurch ist eine GPU preiswert in der Anschaffung.[30] 

12 RWTH Aachen

4.2. Funktion 

Seit einigen Jahren werden Graphikkarten auch außerhalb ihres ursprünglichen Verwendungszwecks 

eingesetzt. Aufgrund des schnellen Speichers und der hohen Parallelität, die sie bieten, sind 

sie für Teile rechenaufwändiger Programme oder Berechnungen von großem Nutzen. 

4.2. Funktion 

In dieser Arbeit wird die von der Firma NVIDIA entwickelte Sprache CUDA benutzt, um die 

Berechnungen zur Mondschattenanalyse auf einer GPU durchzuführen. CUDA ist eine Erweiterung 

der Programmiersprache C. Die Strukturen und Begriffe sind teilweise CUDA-spezifisch, lassen sich 

jedoch meist auch auf andere Sprachen übertragen. 

Ein Programm, das auf der GPU ausgeführt wird, wird Kernel genannt. Ein Kernel erzeugt 

ein Grid von Threads, die den Programmcode des Kernels parallel durchlaufen. Threads sind in 

Blöcken organisiert. In einem Block ist es möglich, Daten zwischen Threads auszutauschen. Ein 

Block kann bis zu drei Dimensionen haben, das heißt, dass die Threads in einem Block drei Indize 

bekommen, durch die sie im Programmcode unterschieden werden können. Diese Dimensionen 

können bei der Programmierung festgelegt werden und an das entsprechende Problem angepasst 

werden. 

Auch Blöcke haben zwei Indize, um im Programmcode unterschieden zu werden (siehe Abbildung 

4.2 links). Diese Indize können über BlockIdx und ThreadIdx abgerufen werden. 

Die Anzahl der Blöcke, die parallel ausgeführt werden, hängt von der Anzahl der Kerne der 

verwendeten Graphikkarte ab. Jedoch muss dies nicht bei der Programmierung berücksichtigt 

werden, da die GPU die Aufrufe selbst übernimmt. Hierbei gibt es keine festgelegte Reihenfolge. 

Folglich kann es sein, dass Programme auf unterschiedlichen Graphikarten unterschiedlich schnell 

laufen (siehe Abbildeung 4.2 rechts). 

Abbildung 4.2.: Links: Organisation von Threads und Blocks auf einem Grid.[31] Rechts: Aufrufe 

von Blöcken in unterschiedlichen Maschinen.[32] 

Jeder Thread hat einen kleinen Speicher für lokale Variablen. Dieser Speicher ist in der Graphikkarte 

dicht an den Prozessor gebaut, um einen schnellen Zugriff zu erlauben. Zudem gibt es 

René Reimann 13


pro Block einen begrenzten Shared Memory, um Daten zwischen Threads auszutauschen. Threads 

können nicht ohne weiteres Daten mit Threads in anderen Blöcken austauschen. 

Um Daten für alle Threads zugänglich zu machen, gibt es den Global Memory. Das Lesen oder 

Schreiben von Daten auf den Global Memory dauert jedoch etwa 200 mal so lange wie der Zugriff 

auf Shared oder Local Memory. Zudem gibt es extra Textur und Constant Memory, von denen 

die Daten nur gelesen werden können. Dabei handelt es sich jedoch nur um eine andere Methode 

Global Memory anzusprechen. Da diese Speicher speziell für viele gleichzeitige Zugriffe konzipiert 

wurden, gibt es keine Kollisionen, wenn mehrere Threads gleichzeitig auf die Daten zugreifen (siehe 

Abbildung 4.3). 

Abbildung 4.3.: Struktur des Speichers in einer GPU.[31] 

Ist es notwendig, z.B. beim Austausch von Daten über den Shared Memory, dass an einer bestimmten 

Stelle des Programms alle Threads in einem Block die gleiche Stelle erreicht haben, so 

kann dies durch den CUDA Befehl __syncthreads erzwungen werden. 

Um die Daten und die Ergebnisse zwischen GPU und CPU auszutauschen, benötigt man ein C- 

oder C++-Programm (CUDA Toolkit 3.2 mit Shader Model 2.0), das diese Aufgabe übernimmt. 

In CUDA wird die CPU immer als „host“ und die GPU als „device“ bezeichnet. Die CPU kann 

mit den CUDA Befehlen cudaMalloc(), cudaMemcpy() und cudaFree() Speicher auf dem device 

reservieren, zwischen device und host kopieren und auf dem device wieder freigeben. Der Aufruf 

der Kernels geschieht mit der CUDA-Syntax KernelName >() vom 

host aus (siehe Abbildung 4.4). 

Der Kernel muss mit dem Prefix __global__ ausgestattet werden, um vom host aus aufgerufen 

werden zu können. Werden im Kernel Unterfunktionen verwendet, müssen diese mit __device__ 

deklariert werden. Funktionen auf dem host sollten mit __host__ versehen werden. Dies ist jedoch 

nicht zwingend notwendig, da dies der Default-Wert ist. 

4.3. CUDA-Maschine 

Für diese Thesis wurde die CUDA-Maschine im Rechnerraum des Physikzentrums der RWTH 

Aachen benutzt. Dieser Rechner ist mit drei baugleichen GeForce GTX 480 (GPUs) von Point of 

View [33] ausgestattet. Bei der CPU handelt es sich um einen Intel Core i7-980X EE, betrieben 

bei 3,59GHz. Die CPU besitzt sechs Kerne und unterstützt zusätzlich HyperThreading, so dass 

14 RWTH Aachen

4.4. GPU-Strategie 

Abbildung 4.4.: Skizze zur Kommunikation zwischen CPU und GPU.[30] 

insgesammt zwölf virtuelle Kerne zur Verfügung stehen. Zur Analyse wurde immer nur eine GPU 

verwendet. 

4.4. GPU-Strategie 

In diesem wie auch in den folgenden Abschnitten ist mit Grid, so lange nicht explizit anders 

angegeben, immer das Grid zur Berechnung der − log L-Funktion, wie in Abbildung 3.1 dargestellt, 

gemeint. 

Eine zentrale Bedeutung bei einer schnellen, jedoch sorgfältigen Analyse spielt der Einsatz der 

GPU-Rechenleistung. Hierzu ist es wichtig, den „bottleneck“, also die Schwachstelle der Hardware 

zu kennen und die Vorteile der GPU auszunutzen. 

Die Analyse besteht aus mehreren Teilen. Zuerst müssen die Daten eingelesen werden, anschließend 

muss für jeden Gridpunkt die Minimierung der − log L-Funktion erfolgen und schließlich muss 

das Gesamtergebnis gespeichert und dargestellt werden. Da die GPU weder Daten selbstständig 

einlesen noch auslesen kann, müssen diese Schritte von der CPU bewältigt werden. 

Für die Berechnung der n s -Minima jedes Gridpunktes gibt es nun verschiedene Möglichkeiten, 

um die Parallelität der GPU auszunutzen. 

1. Da die Berechnung der − log L-Funktion aufgrund der enormen Summe über Events sehr 

lange dauert und einzelne Teilsummen gleichzeitig durchgeführt werden können, kann jeder 

Thread eine Teilsumme berechnen und anschließend die Gesamtsumme gebildet werden. 

Hierdurch wird die Zeit der Berechnung eines Funktionsaufruf deutlich verkleinert. Jedoch 

muss die Minimierung auf den einzelnen Gridpunkten sequenziell erfolgen. 

Somit wird die Minimierung von der CPU durchgeführt und die GPU berechnet ausschließlich 

− log L-Werte. 

2. Für jeden Gridpunkt ist die Minimierung unabhängig von anderen Gridpunkten. Für viele 

Gridpunkte ist es daher sinnvoll, dass jeder Thread für sich eine Minimierung durchführt und 

dabei die nötigen Funktionsaufrufe auch alleine berechnet. Da die GPU aufgrund ihrer Speicherverwaltung 

dafür gemacht ist, dass viele Threads gleichzeitig auf Daten zugreifen, wird es 

hier, bei geeigneter Programmierung, keine Kollisionen oder Geschwindigkeitseinbußen beim 

Funktionsaufruf geben. 

Daher führt jeder Thread sowohl − log L-Berechnung als auch Minimierung durch. Die CPU 

wird für diese Strategie kaum benötigt. 

René Reimann 15


3. Bei einer kleinen Anzahl von Punkten gibt es zudem die Möglichkeit, beide zuvor beschriebenen 

Strategien zu kombinieren. Da Threads innerhalb eines Blocks über den shared-Memory 

kommunizieren können, ist es möglich die Minimierung der − log L-Funktion pro Gridpunkt 

auf einem Block durchzuführen. Hierbei übernimmt ein Thread pro Block die Minimierungsrechnungen. 

Alle weiteren Threads berechnen bei Funktionsaufrufen Teilsummen der − log L- 

Funktion, um somit gemeinsam schneller die Gesamtsumme zu errechnen. 

Folglich macht jeder Block die Minimierung und jeder Thread im Block hilft bei der − log L- 

Berechnung. Auch hier wird die CPU kaum benötigt. 

Strategie 3 bietet gegenüber der zweiten Strategie für hinreichend viele Gridpunkte keinen Vorteil, 

da einige Blöcke warten müssten, bis die ersten Blöcke fertig berechnet wurden. Weiterhin ist die 

Strategie 2 speziell für große Summen in Funktionsaufrufen geeignet und ist am einfachsten zu 

implementieren. 

Für diese Arbeit wird Strategie 2 implementiert, da die Analyse mit vielen Gridpunken (16384) 

durchgeführt wird. 

Zur Umsetzung wird ein C++-Programm mit ROOT-Funktionen erstellt. In diesem Programm 

werden die Daten, die im ROOT-Format vorhanden sind, zunächst eingelesen und eine Hintergrundverteilung 

bestimmt. Für die Ereignisse, für die die Qualitätskriterien (siehe Abschnitt 3.3) 

erfüllt sind, werden die Daten in einem Array gespeichert. Hierbei werden je Event die Werte 

δ azimuth , δ zenith (siehe Gleichung 2.5), der Wert der Background-Verteilung für diese Winkel 

und die benötigten Fehler auf die Schätzung gespeichert. Von diesem Programm aus wird eine C- 

Funktion aufgerufen, die als Schnittstelle dient. Als Parameter dienen die Arrays mit den Daten der 

Events, sowie einige Hilfsparameter um die Minimierung durchzuführen und später die Ergebnisse 

zu erhalten. 

Die C-Funktion ist der Teil des Programms, der die Schnittstelle zwischen CPU und GPU darstellt. 

Ihre Aufgabe ist es, Speicher auf der GPU zu reservieren, die übergebenen Daten auf den 

Speicher in der GPU zu kopieren und die Grid- und Blockdimensionen festzulegen. Anschließend 

ruft sie den Kernel auf, der die Berechnungen auf der GPU durchführt. Nach Beendigung des Kernels 

wird in dieser Funktion das Ergebnis der Berechnung von der GPU auf den Hauptspeicher des 

Computers zurück kopiert und der Speicher auf der GPU freigegeben. 

Damit der Kernel für jeden Thread eine Minimierung auf einem eigenen Gridpunkt ausführen 

kann, wird mithilfe der CUDA-Konstanten BlockIdx.x, BlockIdx.y und ThreadIdx.x ein 

eindeutiger Index für diesen Thread berechnet. Aus diesem Index wird zum einen durch eine ganzzahlige 

Division und zum anderen durch eine Modulo-Operation die Position des Gridpunktes 

berechnet. 

Jeder Thread berechnet nun nach dem in Abschnitt 4.5 beschriebenen Minimierungsverfahren 

das n s , für das die − log L-Funktion den minimalen Wert, am entsprechenden Gridpunkt, annimmt. 

Beim Funktionsaufruf wird eine __device__-Funktion aufgerufen, die die Berechnung der − log L- 

Funktion auf dem Thread durchführt. 

Der n s -Wert und der Wert der − log L-Funktion am Ort des Minimums sowie die Anzahl der 

Iterationen werden in je einem Array im Global Memory der GPU gespeichert. Die Position im 

Array, an der die Daten gespeichert werden, entspricht dem einmaligen Index, den jeder Thread 

besitzt. Durch den CUDA-Funktionsaufruf __syncthreads() wird die Berechnung eines Blocks 

erst weiter fortgesetzt, wenn alle Threads fertig berechnet wurden. Da die Anzahl der Iterationen 

annähernd gleich groß sein sollte, wird an dieser Stelle kaum Zeit verloren. 

Die Ergebnisse werden an die C-Funktion zurückgegeben und von dort aus weiter an das Hauptprogramm. 

Hier können die Ergebnisse aus den Arrays aufgrund ihres Indexes an die korrekten 

Stellen in Histogramme geschrieben und in Dateien gespeichert werden. 

Die resultierenden Ergebnisse können anschließend einer weiteren Analyse unterzogen und graphisch 

dargestellt werden. 

Das Programm, sowie der CPU- und GPU-Einsatz, ist schematisch in Abbildung 4.5 dargestellt. 

Der Programm-Code ist unter http://code.icecube.wisc.edu/svn/sandbox/reimann/ verfügbar. 

16 RWTH Aachen

4.5. Minimierungsverfahren 

Abbildung 4.5.: Schematischer Programmaufbau. Der Einsatz von CPU und GPU ist zu sehen und 

durch die rote Linie getrennt. Die grauen Kästchen stellen die Unterprogramme 

dar. 


Um den besten Schätzer für n s zu bekommen, muss die − log L-Funktion in Bezug auf n s an den 

jeweiligen Gridpunkten minimiert werden. Für die Berechnung des Minimums muss ein Minimierungsalgorithmus 

verwendet werden. Das Verfahren ist ein erweiterter Brent-Algorithmus und wird 

im Folgenden vorgestellt. 

Die − log L-Funktion ist aufgrund der endlichen Summe über die Events eine diskrete und sehr 

komplizierte Funktion, somit kann für diese keine einfache analytische Ableitung bestimmt werden. 

Aus diesem Grund muss ein Minimierungsalgorithmus verwendet werden, der ohne Ableitungen 

auskommt. 

Das grundlegende Prinzip aller Algorithmen, die hier behandelt werden, beruht auf dem gleichen 

Verfahren (siehe Abbildung 4.6). Es werden die obere und untere Grenze der Minimierung, sowie 

ein weiterer dritter Punkt in dem Minimierungsintervall gegeben. Die Grenzen sollten das Minimum 

umschließen, sonst wird der Algorithmus auf eine der Grenzen konvergieren. Die Funktion muss 

zunächst nur an dem dritten Punkt ausgewertet werden. Je nach Minimierungsverfahren (siehe 

die folgenden Abschnitte) wird ein vierter Punkt im Intervall gewählt und an diesem Punkt die 

Funktion ausgewertet. 

Nun kann entschieden werden, in welchem Bereich das Minimum liegen kann, bzw. in welchem 

Bereich es nicht liegt. Hierbei gibt es genau 24 Möglichkeiten. Bei jeder dieser Möglichkeiten kann 

eine der Grenzen verschoben werden, sodass sich der Wertebereich verkleinert. Wenn A, B, C, D 

die Funktionswerte für die n s -Werte mit a ind, kann bei A > B < C < D somit c 

als obere Grenze gewählt werden. Für den Fall, das A D kann b oder c durch a bzw. 

d ersetzt werden. 

Nun kann ein neuer vierter Punkt gewählt werden, um den Bereich weiter zu verkleinern. Dieses 

Verfahren wird so oft wiederholt, bis eine vorgegebene Breite, auch Toleranz genannt, des 

Wertebereiches erreicht ist. Als Schätzung für das Minimum wird die Stelle mit dem kleinsten 

Funktionswert gewählt. 

René Reimann 17


Abbildung 4.6.: Schema zur Verdeutlichung des Minimierungsalgorithmus. In diesem Fall wird die 

Obergrenze im nächsten Iterationsschritt als c gewählt. 

Die Wahl des vierten Punktes hat entscheidene Bedeutung für das Konvergenzverhalten bzw. 

für die Konvergenzgeschwindigkeit. 

Bei der Methode „golden section“ wird der vierte Punkt im Verhältnis des Goldenen Schnittes 

im größeren der beiden Bereiche gewählt. Der goldene Schnitt ist die positive Lösung der Gleichung 

Φ 2 − Φ − 1 = 0. Der Wert ist 1+√ 5 

2 

≈ 1.618. Das Verhältnis des goldenen Schnitts wird vom 

Menschen als harmonisch empfunden und wird daher schon seit der Antike in Musik und Kunst 

verwendet. Das Verhältnis ist auch in der Biologie oft zu finden und hat zahlreiche interessante 

mathematische Eigenschaften, auf die hier nicht näher eingegangen werden kann. Dieses Minimierungsverfahren 

hat ein lineares Konvergenzverhalten. Durch das Verhältnis des Goldenen Schnittes 

wird die Effizienz der Minimierung optimiert.[24] 

Eine weitere Methode ist die Parabel-Interpolation. Hierbei wird davon ausgegangen, dass eine 

Funktion in der Nähe des Minimums immer durch eine Funktion zweiten Grades approximiert 

werden kann. Dies ist für hinreichend glatte Funktionen der Fall. Eine Parabel ist durch drei 

Wertepaare festgelegt. Als vierter Punkt wird nun der Scheitelpunkt der Parabel gewählt. Dies 

kann zu einem sehr schnellen Konvergenzverhalten führen, wenn die Funktion wirklich annähernd 

parabelförmig ist. Jedoch kann es auch zu sehr kleinen Schrittweiten und zu Extrapolationen, also 

berechneten Punkten außerhalb der Grenzen, kommen. 

Brent hat 1972 diese beiden Verfahren zu einem optimierten Verfahren vereint.[25] Hierbei wird 

für die ersten Schritte die „golden section“ Methode benutzt. Im Weiteren wird jedes Mal der 

Scheitelpunkt der Parabel berechnet. Bringt dieses Verfahren eine schnellere Konvergenz, also 

angemessene Schrittweiten, im Gegensatz zu dem „golden section“-Verfahren, wird die Parabelinterpolation 

vorgezogen. 

Wie bereits von N. Ghosh und W. W. Hager beschrieben, kommt es beim Brent-Algorithmus 

zu numerischen Instabilitäten, wenn die Abbruchstoleranz zu klein gewählt wurde.[26] Dies wurde 

auch in dieser Arbeit beobachtet (siehe Abschnitt 5.1). Daher wird eine Erweiterung des Brent- 

Algorithmus verwendet. Sie besteht auf der Grundlage der GSL-Funktion quad_golden, in der 

eine sichere Schrittweite verwendet wird. Das bedeutet, dass im Zweifelsfall die Schrittweite der 

vorherigen Iteration verwendet wird. [27] [28] 

Um die Berechnung des Minimums mit möglichst wenigen Funktionsaufrufen zu berechnen, muss 

ein angemessener Wertebereich sowie eine realistische Toleranz angegeben werden. Hierbei muss be- 

18 RWTH Aachen


achtet werden, dass der Wertebereich das Minimum umschließen muss, und dass die Toleranz klein 

genug sein muss, um die physikalische Bedeutung nicht zu verfälschen. In der − log L-Landschaft 

sollte es aufgrund der Toleranz keine größeren Abweichungen als 0.5 zum wahren Wert geben. Da 

die − log L-Landschaft eine Funktion von n s ist, kann die Abbruchbedingung in beiden Variablen 

verfasst werden. Da jedoch die − log L-Landschaft keinen physikalischen Inhalt trägt, wird die 

Abbruchbedingung auf den n s -Bereich gewählt. Eine genauere Studie zur Toleranzgröße wird in 

Abschnitt 5.1 durchgeführt. 

René Reimann 19

Test des Verfahrens 

5. Test des Verfahrens 

In diesem Kapitel soll das Verfahren anhand seiner Ergebnisse getestet werden. Die direkten Ergebnisse 

sind die Landschaften, die sich durch Berechnung der minimalen n s und der − log L-Werte 

jedes einzelnen Gridpunktes, wie in Abbildung 3.1 dargestellt, ergeben. 

5.1. Genauigkeit des Verfahrens 

„single precision“ vs. „double precision“ 

GPUs sind darauf spezialisiert möglichst schnell viele Pixel, beispielsweise für ein Computerspiel, 

zu berechnen. Hierbei kommt es nicht auf die einwandfreie Berechnung an, da die Pixel nach kurzer 

Zeit wieder überschrieben werden. Weiterhin sind diese Berechnungen nur auf „single precision“ 

Berechnungen optimiert. Eine „double precision floating point“ Berechnung benötigt wesentlich 

mehr Zeit. 

Um zu prüfen, ob eine „floating point“ Berechnung ausreichend ist, wird die Analyse sowohl 

mit „floating point“ als auch mit „double precision floating point“ berechnet. Hierbei wurde eine 

symmetrische Gaussverteilung als Signal und als Daten die On-Source Region gewählt. 

Die resultierenden n s -Landschaften sind in Abbildung 5.1 zu sehen. Auf der oberen Hälfte von 5.1 

sieht man das Ergebnis der „floating point“ Analyse. In den beispielhaft eingekreisten Bereichen 

sind klare unstetige Gridpunkte zu erkennen. Dies darf aufgrund der Korrelation benachbarter 

Gridpunkte nicht der Fall sein und ist auf der unteren Hälfte von 5.1 auch nicht zu sehen. 

Diese unstetigen Gridpunkte entstehen aufgrund der großen − log L-Werte, die sich jedoch nur 

in letzten Ziffern unterscheiden. Ein „single precision“-Wert hat etwa sieben signifikante Ziffern, 

ein „double precision“-Wert hingegen 16. Somit muss für eine korrekte Berechnung − log L-Werte 

und deren Werte im Minimierungsalgorithmus als „double precision“ berechnet und gespeichert 

werden. 

Test des Minimierungsalgorithmus 

Um die korrekte Berechnung des Minimums durch den Brent-Algorithmus zu untersuchen, wird 

die Analyse für mehrere Toleranzen auf n s durchgeführt, da der Brent-Algorithmus selbst von 

der Toleranz abhängt. Die Differenz der resultierenden n s -Landschaften sollte bei einem korrekten 

Verhalten in der Größenordnung der größeren Toleranz liegen, da für diese die Berechnung mit 

kleinerer Toleranz annähernd als Wahrheit angesehen werden kann. 

Beispielhaft ist die Differenz der n s - Landschaften mit einer Toleranz von 0.1 und 1 in Abbildung 

5.2 zu sehen. Auf der linken Seite in Abbildung 5.2 ist die Absolutdifferenz der n s -Landschaften 

zu erkennen. Die Differenzen sind auf der rechten Seite in einem Histogramm eingetragen. Weiter 

Differenz-Landschaften befinden sich im Anhang unter A.1.4. 

Die Differenzen in der n s - Landschaft sind deutlich größer als O(1). Daher wird die Berechnung 

mit einer Erweiterung des Brent-Algorithmus, wie in Abbschnitt 4.5 beschrieben, durchgeführt. 

Mit diesem Algorithmus erhalten wir für die Absolutdifferenz der n s -Landschaften für Toleranzen 

von 0.1 und 1 die in Abbildung 5.3 zusehende Verteilung. Die weiteren Landschaften befinden sich 

im Anhang A.2.6. 

Die maximalen Differenzen sind in diesem Fall wesentlich kleiner und liegen in einer akzeptablen 

Größenordnung. Daher wird für die folgenden Analysen immer der erweiterte Brent-Algorithmus 

verwendet. 

Da der wahre Wert für das Minimum unbekannt ist und die Differenz der n s -Landschaften größer 

eins ist, kann hier eine Quelle für einen systematischen Fehler sein. 

20 RWTH Aachen


Abbildung 5.1.: n s - Landkarte für eine floating point Berechnung (oben) und eine double precision 

Berechnung (unten). Beispielhaft sind Bereiche mit unstetigen Gridpunktübergängen 

gezeigt. 

Spektrum der n s -Verteilung 

Um zu überprüfen, ob nur bestimmte diskrete Werte für n s bevorzugt werden, werden die n s -Werte 

aus der n s -Landkarte in ein Histogramm eingetragen. Dieses Histogramm ist in Abbildung 5.4 für 

eine Analyse mit symmetrischer Gaussverteilung und einer Toleranz von 1 in n s dargestellt. 

Es ergibt sich ein Spektrum mit vielen schmalen Peaks. Die breiten Peaks in dieser Verteilung 

stammen von Plateaus fast konstanter n s -Werte in der n s -Landschaft und sind kein Hinweis auf 

ein Fehlverhalten des Minimierungsalgorithmus. Es ist eine Korrelation zwischen benachbarten 

Gridpunkten zu erkennen. Die Spikes bzw. die sehr scharfe Peaks hängen wahrscheinlich mit dem 

Minimierungsalgorithmus zusammen. Hierbei werden wahrscheinlich einzelne Werte aufgrund der 

„golden section“ Methode bevorzugt, die jedoch sehr kleine Abstände, etwa 10 in n s , haben. 

René Reimann 21


Abbildung 5.2.: Links: Landschaft der absoluten n s Differenzen zwischen einer Minimierung mit 

einer Toleranz von 0.1 und 1 in n s , berechnet mit dem Brent Algorithmus. 

Rechts: Die Häufigkeitsverteilung der absoluten Differenzen in n s für die beiden 

Toleranzen. 

Abbildung 5.3.: Links: Landschaft der absoluten n s Differenzen zwischen einer Minimierung mit einer 

Toleranz von 0.1 und 1 in n s , berechnet mit dem erweiterten Brentalgorithmus. 


Toleranzen. 

Einflüsse durch die GPU 

Bei der Produktion von GPUs wird der Geschwindigkeitsvorteil im Gegensatz zur Präzision bevorzugt. 

Deshalb können leicht fehlerhafte Berechnungen durchgeführt werden. Dies sind meistens 

Memory Fehler und somit Hardware abhängig. Um den Einfluss durch die verwendete GPU zu 

quantifizieren, wird eine identische Analyse auf allen drei GPUs, die auf der in Abschnitt 4.3 

beschriebenen Maschine vorhanden sind, durchgeführt. Damit die Unterschiede sichtbar werden, 

wurden von den Ergebnissen Differenzplots, sowohl in der n s - als auch in der − log L-Landschaft, 

erstellt. 

Das Ergebnis dieser Differenzplots ist equivalent zu null. Es gibt an keinem einzigen Gridpunkt 

eine Differenz, die nicht null ist. Dies ist für die n s - und die − log L-Landschaft der Fall. Da 

aus diesen Landschaften alle weiteren zur Analyse verwendeten Größen berechnet werden, gibt es 

22 RWTH Aachen


Abbildung 5.4.: Häufigkeitsverteilung für absolute n s Werte bei einer Minimierung mit einer Toleranz 

von 1 in n s . 

keinen Hardware bedingten Einfluss. 

Die GPUs der unter 4.3 beschriebenen Maschine sind zum Zeitpunkt der Berechnungen ein 

halbes Jahr alt gewesen. Es ist möglich, dass durch den Gebrauch der GPUs zu einem späteren 

Zeitpunkt doch ein Hardware Effekt erkennbar wird. 

Toleranz 

Die Wahl der Toleranz hat entscheidenden Einfluss auf die Rechenzeit. Hierbei muss ein Kompromiss 

zwischen genauer Berechnung und Verschwendung von Rechenzeit gefunden werden. 

Die Zeit, die für eine Analyse benötigt wird, ist in Abhängigkeit von der Toleranz in n s in Tabelle 

5.1 dargestellt. 

Tabelle 5.1.: Rechenzeit bei gegebener Toleranz auf n s für eine Analyse mit einer symmetrischen 

Gausssignalverteilung. 

Toleranz auf n s Rechenzeit in min 

100 45 

10 67 

1 94 

0.1 211 

Die Rechenzeit ist vor allem durch die Iterationen, die für die Minimierung der − log L-Funktion 

an einem Gridpunkt benötigt werden, gegeben. Bei einer optimalen Auslastung müssten alle Gridpunkte 

gleich viele Iterationen durchlaufen, um nicht auf andere Berechnungen zu warten. 

In Abbildung 5.5 ist eine Landschaft dargestellt, an der man die Anzahl der Iterationen, die für 

die Minimierung an dem jeweiligen Gridpunkt benötigt wurden, ablesen kann. 

Auf der linken Seite von Abbildung 5.5 ist gut zu erkennen, dass die meisten Gridpunkte 19 

Iterationen benötigen, und dass die restlichen Gridpunkte mit abweichenden Iterationen in der 

Größenordnung von zwei berechnet werden. Für die Iterationslandschaft bei einer Toleranz von 0.1 

in n s ist dies nicht der Fall. Die meisten Punkte benötigen etwa 20 Iterationen, jedoch gibt es vereinzelt 

Punkte, an denen 50 Iterationen benötigt werden, um das Minimum zu finden. Dies erklärt 

René Reimann 23


Abbildung 5.5.: Landschaft der Iterationen, die für die Minimierung der − log L-Funktion benötigt 

wurden. Links: Berechnung mit einer Toleranz von 1 in n s . Rechts: Berechnung 

mit einer Toleranz von 0.1 in n s . 

die enorme Rechenzeitverlängerung. Obwohl nur wenige Punkte so viele Iterationen durchlaufen, 

müssen jedoch die anderen Threats bei der Berechnung am Ende auf diese warten. 

Um nun den Einfluss der Toleranzen auf die Landschaften selbst zu untersuchen, wurde die 

Analyse für Toleranzen von 0.1, 1, 10 und 100 in n s durchgeführt. In Abbildung 5.6 ist die Differenz 

der n s -Landschaften für Toleranzen von 1 und 10 in n s dargestellt. Weitere Differenzplots sind im 

Anhang A.2.6 zu sehen. 

Abbildung 5.6.: Landschaft der absoluten n s Differenz für Minimierungen mit einer Toleranz von 

1 und 10 in n s . 

Da eine Abweichung von 20 in n s schon sehr groß ist, muss die Toleranz wesentlich kleiner als 10 

in n s sein. Da n s die Anzahl der abgeschatteten Events durch den Mond darstellt, hat diese Größe 

eine physikalische Bedeutung und kann theoretisch nur ganzzahlige Werte annehmen. Daher ist 

es nicht notwendig n s kleiner als mit einer Toleranz von 1 zu berechnen. Hierfür spricht auch der 

enorm große Rechenzeitzuwachs von einer Toleranz von 1 zu 0.1 in n s . Somit wird für die folgenden 

Auswertungen, soweit nicht anders erwähnt, die Toleranz auf 1 in n s gesetzt. 

24 RWTH Aachen

5.2. Ergebnisse und Vergleich der Analyse 


Zum Test der Mondschattenanalyse auf einer GPU sollen die erziehlten Ergebnisse mit den Berechnungen 

auf einem CPU Cluster verglichen werden. Die Abbildungen und Berechnungen mit CPU 

Clustern stammen alle aus [11] von Jan Blumenthal. Alle Landschaften aus den GPU Analysen 

befinden sich im Anhang. 

Off-Source Bereiche 

Zunächst sollen die Off-Source Bereiche untersucht werden und aus den Fluktuationen in n s ein 

RMS auf die Berechnungen zum Mondschatten berechnet werden. 

In Abbildung 5.7 sind zunächst die n s Landschaften für eine Berechnung mit einer GPU dargestellt. 

Auf den ersten Blick ist eine Landschaft mit einem n s um null für Off-Source Region 1 und 

2 zu erkennen. Hierbei ist zu beachten, dass aus Konsistenz mit der On-Source Region die Werte 

der Farbskala von 9000 bis -9000 gehen. 

Abbildung 5.7.: n s Landschaften von Off-Source 1 (links) und Off-Source 2 (rechts) bei einer Toleranz 


Die zugehörigen − log L-Landschaften sind in Abbildung 5.8 dargestellt. Hier sind die Fluktuationen 

besser zu erkennen, weil die Farbskala an die minimalen und maximalen Werte angepasst 

wurde. 

Abbildung 5.8.: − log L-Landschaften von Off-Source 1 (links) und Off-Source 2 (rechts) bei einer 

Toleranz von 1 in n s . 

René Reimann 25


In den Histogrammen in Abbildung 5.9 wurden die berechneten n s Werte aus den n s -Landschaften 

eingetragen. Ein Grund für die Spikes bzw. die scharfen Peaks in der Verteilung wurde bereits in 

Abschnitt 5.1 diskutiert. Für Off-Source Region 1 erkennt man eine Asymmetrie mit einer Verschiebung 

zu leicht negativen n s . Dies zeigt auch der Mittelwert an, doch die Werte sind wesentlich 

kleiner als der RMS von 565. Für Off-Source Region 2 ergibt sich eine symmetrische Verteilung. 

Der Mittelwert liegt bei -11 und somit nahe dem erwarteten Wert von null. Der RMS ergibt sich 

zu 683. Die Asymmetrie hängt damit zusammen, dass die Werte in der zweidimensionalen Landschaft 

korreliert sind. Daher wird auch der RMS anstatt einer Gaussfitbreite zur Charakterisierung 

verwendet. 

Abbildung 5.9.: n s Histogramme von Off-Source 1 (links) und Off-Source 2 (rechts) bei einer Toleranz 


Bei den Berechnungen mit CPU Clustern wurde in der Off-Source Region 1 ein RMS von 565 und 

in Off-Source Region 2 ein RMS von 681. Dies ist ein konsistentes Ergebnis. Die feinere Auflösung 

im Histogramm, durch die die Asymmetrie sichtbar wird, war mit der Berechnung auf dem CPU 

Cluster nicht möglich, weil hierfür zu wenig Einträge vorhanden waren. 

Die Fluktuationen in den Off-Source Regionen entsprechen auch den Fluktuationen auf die 

Messung des Mondschattens, demzufolge wird ein statistischer Fehler von σ stat = 565+683 

2 

= 624 

angenommen. 

On-Source n s -Landschaft 

Um nun auch die On-Source Regionen zu vergleichen, werden die Landschaften einer GPU und 

einer CPU Berechnung gegenüber gestellt. Die n s -Landschaften sind in Abbildung 5.10 zu sehen. 

Hierbei ist zu beachten, dass die Landschaft auf der linken Seite von Abbildung 5.10 mit 31 x 

31 Gridpunkten berechnet wurde. Die n s Landschaft auf der rechten Seite wurde mit 128 x 128 

Gridpunkten erstellt und ist in einem einfachen Histogramm dargestellt. 

Auf den ersten Blick erkennt man kaum einen Unterschied und die Analysen sehen konsistent 

aus. Daher wird zur besseren Bewertung die Differenz der Landschaften berechnet. Hierzu wird 

auf einem Grid mit einem Gridpunktabstand von 0.0625 ◦ die Differenz berechnet. Für die GPU 

Berechnung wird der direkt berechnete Wert verwendet, wobei für die CPU Berechnung der Wert 

interpoliert wird. Da der Interpolation am Rand des Grids zu wenig Punkte zur Verfügung stehen, 

wird die Differenzlandschaft nicht für die äußeren fünf Reihen betrachtet. Die resultierende 

Landschaft ist in Abbildung 5.11 dargestellt. 

Im zentralen Bereich des Mondschattens ist ein deutlicher Unterschied von bis zu 250 in n s zu 

erkennen. Auch gibt es drei Spots, in denen eine negative Differenz zu erkennen ist. Dies lässt auf 

eine inkonsistente Berechnung im Bereich des Mondschattens schließen. 

Um den Grund der Inkonsistenz zu ermitteln, wird die Landschaft noch einmal in der Zenit- 

Azimut-Ebene in Abbildung 5.12 dargestellt. 

26 RWTH Aachen


Abbildung 5.10.: n s Landschaften der On-Source Region. Links: Berechnet mit einem CPU Cluster 

und 31 x 31 Gridpunkten [34]. Rechts: Berechnung mit einer GPU und einem Grid 

von 128 x 128. 

Abbildung 5.11.: Landschaft der n s Differenzen, bei der Berechnung mit einem CPU-Cluster und 

einer GPU. Zur Berechnung wurden die Werte der CPU Berechungn an der jeweiligen 

Stelle interpoliert. Es ist eine starke Differenz im Zentrum zu erkennen. 

René Reimann 27


Abbildung 5.12.: Landschaft der n s Differenzen, bei der Berechnung mit einem CPU-Cluster und 

einer GPU. Zur Berechnung wurden die Werte der CPU Berechnung an der jeweiligen 

Stelle interpoliert. Es ist ein klares Muster zu erkennen. 

In dieser Abbildung ist eine klare Struktur zu erkennen. Es gibt ein gitterförmiges Muster, das 

über die ganze Landschaft gezogen ist. Auf diesem Gitter haben die n s Differenzen Werte nahezu 

null, was man an der hellblauen bis helltürkisen Farbe erkennt. Die gitterförmigen Linien haben 

genau den Abstand von zwei Gridpunkten bei einer Berechnung mit einem 31 x 31 Grid. Die 

Kreuzungspunkte liegen genau auf den mit dem CPU Cluster berechneten Gridpunkten. 

Daraus lässt sich schließen, dass die Berechnungen konsistente Ergebnisse liefern, jedoch die 

Interpolation der n s Landschaft in den Zwischenräumen im zentralen Bereich nicht die berechneten 

Werte beschreibt. Dies liegt möglicherweise daran, dass die Interpolation von einem linearen 

Gradienten in der Landschaft ausgeht, dies jedoch nicht der Fall ist. 

Neben den Landschaften sind auch die Positionen der minimalen n s , für die Bestimmung der 

Mondposition, von Interesse. 

In [11] wurde, mit einer CPU Analyse und einem 31 x 31 Grid, das minimale n s am Punkt 

(∆ϕ, ∆ϑ) = (0, 0) mit einem Wert von -8660 gefunden. Für die GPU Analyse mit einem 128 x 

128 Grid liegt das minimale n s bei (∆ϕ, ∆ϑ) = (0, 0) mit einem Wert von -8653. Somit stimmen 

die Positionen genau überein und die berechneten Werte unterscheiden sich um 7. Dies ist in der 

Größenordnung, bei der die Minimierung abbricht, wie es in Abbschnitt 5.1 beschrieben wurde. 

Folglich ist auch dieses Ergebnis konsistent. 

Eine weitere Eigenschaft des Mondschattens ist seine Breite. Um diese zu messen, muss eine 

Funktion an die n s Landschaft gefittet werden. Als Funktion wird eine elliptische Gaussfunktion 

28 RWTH Aachen


mit skalierbarer Höhe und einem konstanten Offset, wie in Gleichung 5.1 beschrieben, gewählt. 

f el = scale · Ae −(a(∆ϕi−∆ϕg)2 +2b(∆ϕ i−∆ϕ g)(∆ϑ i−∆ϑ g)+c(∆ϑ i−∆ϑ g) 2) + offset 

A = 

1 

2πσ 1 σ 2 

a = cos2 α 

2σ1 

2 + sin2 α 

2σ2 

2 

b = sin(2α) 

4σ 2 1 

c = sin2 α 

2σ 2 1 

− sin(2α) 

4σ 2 2 

+ cos2 α 

2σ 2 2 

(5.1) 

Diese Funktion wird nur in einem zentralen Bereich von 2 ◦ x 2 ◦ an die Daten gefittet, um wirklich 

das Signal zu fitten. Für die Mondschattenanalyse mit einer GPU ergeben sich als Fitparameter 

die Werte in Tabelle 5.2. Da der Fit mit ROOT durchgeführt wurde, jedoch keine individuellen 

statistischen Fehler für die n s -Werte gegeben werden, sind die von ROOT angegebenen Fehler auf 

die Fitparameter nicht vertrauenswürdig und werden deswegen in den Tabellen weggelassen. 

Tabelle 5.2.: Ergebnis eines Fits von Funktion 5.1 an die n s Landschaft einer GPU Analyse im 

zentralen 2 ◦ x2 ◦ bereich. 

δ azi [deg] -0.034 

δ zen [deg] 0.048 

σ 1 [deg] 0.850 

σ 2 [deg] 0.743 

α [rad] 1.673 

scale -9034 

offset 8.35 

Die Fehler auf δ azi , δ zen , σ 1 und σ 2 werden aufgrund des Gridpunktabstands von 0.0625 ◦ gleichverteilt 

zu 0.018 ◦ angenommen. Da der Mondschatten annähernd rund ist, ist α beliebig, so dass 

hierin ein sehr großer Fehler liegt. 

Eine andere Schätzung für die Fehler auf δ azi und δ zen erhält man durch Signifikanzplots, die 

weiter unten besprochen werden. Die 1-Sigma-Ellipse in diesen Plots sollten den 39% Konfidenzbereich 

beschreiben. 

Die berechneten δ azi und δ zen Werte liegen innerhalb eines Gridpunktabstandes zu (0,0) und 

stimmen insoweit mit den vorherigen Ergebnissen überein. Die berechneten Breiten von 0.850 ◦ 

und 0.743 ◦ liegen in der gleichen Größenordnung, wie die Werte 0.83 ◦ und 0.91 ◦ , die in [11] für die 

Landschaft eines 31 x 31 Grids bei einer CPU Analyse berechnet wurden. Dass die berechneten 

Breiten um etwa 0.1 ◦ unterschiedlich sind, hängt wahrscheinlich mit der Auflösung sowie mit der 

Größe des Fitbereichs zusammen. 

On-Source − log L-Landschaft 

Nun sollen auch die − log L-Landschaften verglichen werden. Die − log L-Landschaft, mit den Werten 

zur GPU Analayse ist in Abbildung 5.13 oben dargestellt. Hierbei wird − log L aufgetragen, 

weil bei dieser Berechnung ein Minimierungsalgorithmus verwendet wurde. 

In Abbildung 5.13 unten ist die − log L-Landschaft der CPU-Cluster Analyse dargestellt. Hierbei 

wurde die log L maximiert. Aus diesem Grund unterscheiden sich die Farbskalen durch ein Minus. 

Da aufgrund der verschiedenen Auflösungen kaum Unterschiede erkennbar sind und die Hauptstrukturen 

sich gleichen, muss die Darstellung anders erfolgen. 

René Reimann 29


Abbildung 5.13.: − log L-Landschaft für die On-Source Region, berechnet mit einer GPU (oben) 

und einem Grid von 128 x 128, sowie einer Toleranz von 1 in n s . Unten ist die 

− log L-Landschaft der On-Source Region für eine CPU-Berechnung mit einem 

Grid von 31 x 31 dargestellt[11]. 

Signifikanz 

Aus der − log L-Landschaft lässt sich eine Signifikanz Landschaft berechnen. 

L − L 0 = σ2 

(5.2) 

2 

Folglich kann man jedem Likelihoodwert L eine Signifikanz σ zuweisen. Hierbei ist L 0 der Minimale 

− log L-Wert. 

σ = √ 2 · (L − L 0 ) (5.3) 

Die so berechnete Signifikanz gibt an wie stark die Abweichung vom minimalen n s Wert ist. Für 

die On-Source Region beschreibt das minimale n s die Position des Mondes. Deswegen gibt hier die 

Signifikanzlandschaft an, mit welcher Wahrscheinlichkeit sich der Mond nicht an dieser Position 

befindet. 

30 RWTH Aachen


Für die GPU Analyse ist diese Landschaft für den On-Source Bereich in Abbildung 5.14 oben 

dargestellt. Der Großteil der beobachteten Landschaft schließt mit 16 Sigma aus, dass an dieser 

Stelle die Position des Mondschattens ist. 

Abbildung 5.14.: Signifikanz-Landschaft für die Position des Mondes, berechnet mit einer GPU 

(oben) auf einem 128x128 Grid und mit einer CPU (unten) auf einem 31x31 Grid 

[34]. 

In Abbildung 5.14 unten ist die Signifikanz Landschaft für die CPU-Analyse dargestellt. 

Auch diese Landschaften zeigen eine hohe Übereinstimmung und somit auch eine konsistente 

Beschreibung. 

Alternativ könnte eine Signifikanz-Landschaft aus der n s -Landschaft berechnet werden. Hierbei 

teilt man den Wert der n s -Landschaft durch die oben (Abschnitt 5.2) berechneten statistische 

Unsicherheit σ stat [11]. 

René Reimann 31


Fazit 

Insgesamt kann eine recht konsistente Beschreibung der Analyse mit einer GPU und mit einem 

CPU-Cluster nachgewiesen werden. 

5.3. Performance 

Zwischen einer Mondschattenanalyse mit CPU und GPU ist ein klarer Performanzunterschied zu 

erkennen. Jedoch kann dieser schlecht direkt verglichen werden, da es unterschiedliche Vorraussetzungen 

gibt. 

Bei einer CPU Analyse wurde die Berechnung des minimalen − log L-Werte für jeden Gridpunkt 

sequentiell berechnet. Die Rechenzeit auf einer 64 Bit CPU mit 3 GHz beträgt etwa 20 Minuten pro 

Gridpunkt.[11] Auch bei Berechnungen auf einem Cluster mit etwa 500 Computern benötigt die 

Analyse im Optimalfall bei einem Grid mit 31x31 Gridpunkten etwa eine Stunde. Der Optimalfall, 

das alle Computer eines Clusters gleichzeitig frei sind und nur für die Analyse verwendet werden 

können, tritt selten auf. Die Rechendauer hängt stark von der Auslastung des Clusters ab und 

beträgt in der Regel einige Stunden. Aus diesem Grund ist es nicht möglich hohe Auflösungen in 

der Analyse zu erreichen. Würde die Analyse für ein 31x31 Grid auf einer einzigen CPU berechnet, 

so würde die Rechendauer etwa 450 Stunden (18,75 Tage) betragen. 

Die Mondschattenanalyse auf einer GPU wurde mit einem Grid von 128x128 durchgeführt. Dies 

ist möglich, da diese Rechnungen parallel ausgeführt werden. Hierbei kommt es nicht auf einige 

Gridpunkte mehr oder weniger an, da sich die Rechenzeit erst verlängert, wenn die Anzahl der 

Blöcke dadurch größer als das nächste Vielfache der Kerne auf der verwendeten Graphikkarte 

wird. 

Die Verwendung einer einzigen GPU bietet die Möglichkeit diese Analyse innerhalb von eineinhalb 

Stunden durchzuführen. Hierbei wird kein Cluster benötigt. Jedoch hängt die Rechenzeit 

stark von der Genauigkeit der Minimierung ab. Die genauen Rechenzeiten für unterschiedliche 

Toleranzen sind in Tabelle 5.1 aufgeführt. Zudem sind auf der unter Abbschnit 4.3 beschriebenen 

Maschine drei Graphikkarten installiert. Darum können drei Analysen, beispielsweise für On-Source 

und Off-Source 1 und 2, gleichzeitig durchgeführt werden. 

Somit wird im Regelfall die Analyse mit einer GPU wesentlich schneller sein als mit CPU Clustern. 

Um nun die Vorteile der Berechnung der Mondschattenanalyse auf Graphikkarten auszunutzen, 

werden im folgenden Kapitel zwei kleine Untersuchungen durchgeführt. 

32 RWTH Aachen

6. Weiterführende Untersuchungen 

6.1. Symmetrischer vs. elliptischer Gauss 

In vielen IceCube-Anwendungen wird für Berechnungen das genäherte Signalmodell (siehe Abschnitt 

3.2) mit einem gemittelten Fehler benutzt. Das Signalmodell mit mehr Information ist das 

Modell mit einer elliptischen Gaussverteilung. Dies liegt daran, dass es eine gewisse Verteilung des 

Rotationswinkel α gibt, die nicht gleichverteilt ist, und dass die Exzentrizität nicht immer null ist. 

Die Verteilung von α ist in Abbildung 6.1 dargestellt. In diesem Abschnitt soll daher der Einfluss 

des verwendeten Signalmodells untersucht werden. 

Abbildung 6.1.: Verteilung von α der Paraboloid Rekonstruktion. Es ist zu beachten, dass die y- 

Achse nicht bei 0 beginnt. 

In Abbildung 6.2 ist die Landschaft der minimalen n s Werte links, für einer Berechnung mit 

elliptischem und symmetrischem Signalmodell, zu sehen. Auf der rechten Seite ist die Landschaft 

der zugehörigen − log L-Werte dargestellt. 

Um die Breite des Schattens zu ermitteln, wird in einem zentralen Bereich von 2 ◦ x2 ◦ die Funktion 

5.1 an die n s Landschaft gefittet. Die resultierenden Fitparameter sind in Tabelle 6.1 aufgeführt. 

Die Position des Mondes wird anhand des minimalen n s für das elliptische Signalmodell abgelesen 

und liegt auf dem Gridpunkt (0,0.0625) mit einem n s Wert von -8129.68. Der minimale − log L- 

Wert liegt ebenfalls auf dem Gridpunkt (0,0.0625). 

Für das symmetrische Signalmodell ergibt sich die Position des Mondes aus der n s -Landschaft 

zu (0,0) bei einem Minimalen n s von -8707.8 und aus der − log L-Landschaft zu (0,0.0625). Da dies 

benachbarte Gridpunkte sind, kann es sein, dass die wahre Mondposition im Zwischenraum liegt. 

Die Verwendung des elliptischen und des symmetrischen Signalmodells lässt sich optisch nicht signifikant 

unterscheiden. Ein Unterschied ist kaum zu erkennen und lässt keine der beiden Versionen 

bevorzugt erscheinen. 

René Reimann 33

Weiterführende Untersuchungen 

Abbildung 6.2.: Berechnung der n s Landschaft (links) und der − log L-Landschaft (rechts) bei einer 

Toleranz von 1 in n s und unter Verwendung eines elliptischen Signalmodels (oben) 

und eins symmetrischen (unten). 

Tabelle 6.1.: Ergebnis eines Fits mit der Funktion 5.1 an die n s Landschaft mit elliptischem und 

symmetrischem Signalmodell. 

elliptisch symmetrisch 

δ azi [deg] -0.0019 -0.0334 

δ zen [deg] 0.0515 0.0480 

σ 1 [deg] 0.7167 0.8496 

σ 2 [deg] 0.8548 0.7431 

α [rad] 1.797 0.029 

scale -8663 -9034 

offset 6.45 8.4 

Die minimalen n s Werte unterscheiden sich um einen Gridpunkt. Die minimalen − log L-Werte 

sind am gleichen Gridpunkt. Dies lässt darauf schließen, dass auch die Position im Rahmen der 

Unsicherheit benachbarter Gridpunkte ebenfalls konsistent ist. 

Der Schatten des Mondes hat in beiden Analysen eine annähernd gleiche Breite. Der Winkel 

zwischen der Azimutachse und σ 1 ist stark unterschiedlich. Dies liegt jedoch daran, dass bei den 

Berechnungen die Werte von σ 1 und σ 2 getauscht wurden. Insofern sollte α ell − α sym ≈ π 2 gelten. 

Außerdem ist der Schatten annähernd kreisförmig und folglich ist α für keine Richtung ausgezeichnet. 

Nur die Skalierung des Signals ist um einige 100 in n s unterschiedlich. Dies wurde bereits in der 

34 RWTH Aachen

6.2. Die Energieabhängigkeit des Mondschatten 

Arbeit von Jan Blumenthal festgestellt.[11] Doch dieser Unterschied in der Berechnung ist nicht 

sehr signifikant. Folglich hat die Berechnung mit elliptischem oder symmetrischen Signalmodell 

keinen Einfluss auf viele Eigenschaften, wie Form, Position und Breite. 


In diesem Abschnitt soll die Energieabhängigkeit des Mondschattens qualitativ erfolgen. Eine quantitative 

Analyse benötigt wesentlich genauere und differenziertere Analysen. 

Die Anzahl der DOMs, die Cherenkov-Licht detektieren, hängen von der Energie der Myonen 

ab. Darum ist die Anzahl der getroffenen DOMs, NChannel genannt, eine Schätzung der Energie. 

Für die gesamten Daten von IC59 hat NChannel die Verteilung in Abbildung 6.3. Für NChannel 

kleiner 12 wurden die Events bereits weggeschnitten (siehe 2.5). 

Abbildung 6.3.: Verteilung von NChannel der mit IC59 und Mondschattenfilter regestrierten 

Events. 

Die Energie hängt mit dem Impuls des Teilchens zusammen. Da die Ablenkung in kosmischen 

Magnetfeldern ebenfalls impulsabhängig ist, sollte der Schatten des Mondes für kleine NChannel 

stärker verformt oder verschoben sein als für große NChannel. Weiterhin ist die Rekonstruktion der 

Spur für große NChannel besser, da es mehr Freiheitsgrade gibt. Folglich ist auch die Unsicherheit 

auf die Spur-Rekonstruktion besser und es kommt zu kleineren Verschmierungen als für kleine 

NChannel. 

Um diese Effekte zu untersuchen, wird der Datensatz in zwei Hälften aufgeteilt. Als Grenze 

dient der Median der NChannel-Verteilung, der aus den Daten zu NChannel Median = 21 bestimmt 

wurde. Die n s -Landschaften für die Off-Source Regionen 1 und 2 sind in den Abbildungen A.15, 

dargestellt. Für die On-Source Region ist die n s -Landschaft in Abbildung 6.5 zu sehen. Auch die 

− log L-Landschaften sind für die Off-Source Regionen 1 und 2 in den Abbildungen A.15, sowie für 

die On-Source Region in Abbildung 6.6, zu sehen. In Abbildung 6.4 ist weiterhin die n s -Verteilung 

von Off-Source Region 1 für große und kleine NChannel gezeigt. 

In den Off-Source Bereichen sind starke Unterschiede zu sehen, so dass noch nicht einmal große 

Plateau an den gleichen Stellen liegen. Auch sind die Farbskalen für die − log L-Landschaften 

unterschiedlich gewählt wurden, da die Werte stark verschieden waren. Die Streuung der n s -Werte 

ist für große NChannel etwas kleiner als für kleine NChannel. 

René Reimann 35

Weiterführende Untersuchungen 

Abbildung 6.4.: Histogramm der n s -Werte der Off-Source Region 1 für große (links) und kleine 

(rechts) NChannel. 

Abbildung 6.5.: n s -Landschaft der On-Source Region. Links berechnet für NChannel größer 

NChannel Median und rechts für NChannel kleiner NChannel Median . 

Abbildung 6.6.: − log L-Landschaft der On-Source Region. Links berechnet für NChannel größer 


Auch für die On-Source Region ist ein Unterschied erkennbar. Für große NChannel sieht der 

Schatten des Mondes wesentlich kreisförmiger aus als für kleine. Auch ist der Mondschatten für 

36 RWTH Aachen


große NChannel deutlich kleiner und schärfer. Das ist auch aufgrund einer besseren Rekonstruktion 

zu erwarten. Die Mondposition ist in beiden Fällen nicht von (0,0) verschoben. 

An die On-Source n s -Landschaften mit großen und kleinen NChannel wird die Funktion (5.1) 

im zentralen Bereich gefittet. Die Fitergebnisse befinden sich in Tabelle 6.2. 

Tabelle 6.2.: Fitergebnisse der Funktion (5.1) im zentralen Bereich von 2 ◦ x 2 ◦ der n s -Landschaft 

der On-Source Region. 

kleine NChannel große NChannel 

δ azi [deg] -0.21 -0.0043 

δ zen [deg] -0.038 0.062 

σ 1 [deg] 0.74 0.80 

σ 2 [deg] 1.02 0.71 

α [rad] 1.97 -0.36 

scale -3731 -5234 

offset -9.7 24.0 

Bei den Fitergebnissen sind die Werte für σ 1 und σ 2 vertauscht. Da der Schatten annähernd 

kreisförmig ist, gibt es für der Winkel α keine ausgezeichnete Richtung und die Werte lassen 

sich schwer vergleichen. Es ist zu erkennen, dass δ zen gut übereinstimmt. δ azi weist einen kleinen 

Unterschied auf, wobei die Mondposition für kleine NChannel stärker verschoben ist. Dies ist jedoch 

noch kein signifikanter Unterschied. Um die Verschiebung des Mondschattens für kleine NChannel 

durch das Erdmagnetfeld nachzuweisen, sind weitere Untersuchungen nötig. Auch ist für kleine 

NChannel die Breite größer. 

Die Signifikanz nach Gleichung 5.3 ist für die On-Source Region in Abbildung 6.7 dargestellt. 

Abbildung 6.7.: Signifikanz-Landschaft der On-Source Region. Links berechnet für NChannel größer 


Obwohl für die Berechnung mit großen NChannel 28% weniger Events zur Verfügung standen als 

für kleine NChannel, da NChannel Median aufgerundet wird, wird hierbei eine größere Signifikanz 

erzielt. 

Der scharfe Schatten und die größere Signifikanz entsprechen der Erwartung, dass für große 

NChannel die Rekonstruktion bessere Ergebnisse liefert. 

René Reimann 37

Zusammenfassung und Ausblick 

7. Zusammenfassung und Ausblick 

In dieser Bachelorarbeit mit dem Titel „Untersuchungen mit Graphik-Prozessoren (GPU) zur Messung 

der Abschattung kosmischer Strahlung durch den Mond in IceCube“ wurde die Mondschattenanalyse 

aus [11] auf Graphikprozessoren implementiert, um die Rechenzeit und die Auflösung 

zu verbessern. Hierzu wurde der Vorteil der GPU, die parallele Berechnung vieler Threads bzw. 

Gridpunkte, verwendet. 

Als Minimierungsalgorithmus wurde eine Erweiterung des Brentalgorithmus gewählt. Ein Einfluss 

der verwendeten Hardware konnte auf die Analyse des Mondschattens ausgeschlossen werden. 

Ein Vergleich mit einer Mondschattenanalyse auf CPUs wurde gemacht. Hierbei wurden die 

Fitergebnisse für On-Source und Off-Source verglichen. Es wurden durchweg konsistente Ergebnisse 

mit den Analysen aus [11] von Jan Blumenthal erzielt. 

Ein Performanzvergleich zwischen der GPU Analyse und der CPU-Cluster Analyse wurde besprochen. 

Die GPU Analyse ist nicht nur wesentlich schneller, sondern bietet auch eine höhere 

Auflösung. 

Die Analyse mithilfe der GPU wurde für zwei Untersuchungen verwendet. So konnten keine signifikanten 

Unterschiede zwischen symmetrischen und elliptischen Gausssignalmodell festgestellt 

werden. Die Energieabhängigkeit wurde kurz qualitativ anhand eines NChannel-Schnittes behandelt. 

Hierbei ist erkennbar, dass für große NChannel der Mondschatten schärfer ist als für kleine 

NChannel. Diese energieabhängige Analyse sollte in Zukunft quantitativ durchgeführt werden. 

Hieraus kann man Rückschlüsse auf den Einfluss des Erdmagnetfeldes und des Sonnenwindes sowie 

auf die Güte der Rekonstruktion ziehen. 

In den nächsten Jahren wird IceCube weitere Daten sammeln. Die Analyse dieser Daten wird 

durch den Einsatz von GPUs wesentlich schneller erfolgen können. Momentan gibt es noch ein Datenlimit 

von 1.6 GB auf der verwendeten GPU, doch die Industrie wird dieses Limit wahrscheinlich 

schneller erhöhen als Daten in IceCube gesammelt werden können. Zudem ist es momentan möglich 

nur Teildatensätze zu untersuchen, beispielsweise durch harte Schnitte oder monatsweise Analysen 

durchzuführen, für die n s -Landschaften addiert werden können. 

Die Vorteile der Analyse mit GPUs bei der Minimierung von Likelihoodfunktionen kann auch 

in anderen Anwendungen eingesetzt werden. Generell wird der Einsatz von GPUs und ein neuer 

Programmierstil, der auf Parallelität beruht, in den kommenden Jahren zunehmen, da die CPUs 

nicht wesentlich schneller werden können. 

38 RWTH Aachen

A. Anhang 

René Reimann 39

Anhang 

A.1. Zur Toleranzstudie mit Brent Algorithmus 

A.1.1. Toleranz von 100 in n s mit Brent Algorithmus 

Abbildung A.1.: n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), 

berechnet mit dem Brent Algorithmus und einer Toleranz von 100. Ein symmetrisches 

Signalmodell wurde benutzt. 

40 RWTH Aachen


A.1.2. Toleranz von 10 in n s mit Brent Algorithmus 

Abbildung A.2.: n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 1 

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet 

mit dem Brent Algorithmus und einer Toleranz von 10. Ein symmetrisches 


René Reimann 41

Anhang 

A.1.3. Toleranz von 1 in n s mit Brent Algorithmus 

Abbildung A.3.: n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 1 




42 RWTH Aachen


A.1.4. Toleranz von 0,1 in n s mit Brent Algorithmus 

Abbildung A.4.: n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 1 


mit dem Brent Algorithmus und einer Toleranz von 0,1. Ein symmetrisches 


René Reimann 43

Anhang 

A.1.5. Differenzplots für verschiedene Toleranzen in n s mit Brent 

Algorithmus 

Abbildung A.5.: Differenzplots der n s -Landschaften der On-Source Region (unten) für verschiedene 

Toleranzen, berechnet mit dem Brent Algorithmus. Ein symmetrisches Signalmodell 

wurde benutzt. Die absoluten Fluktuationen sind für kleine Zenitwinkel größer, 

da aus dieser Richtung mehr Teilchen detektiert werden. 

44 RWTH Aachen

A.2. Zur Toleranzstudie mit erweitertem Brent Algorithmus 


A.2.1. Toleranz von 100 in n s mit erweitertem Brent Algorithmus 



berechnet mit dem erweitertem Brent Algorithmus und einer Toleranz von 100. 

Ein symmetrisches Signalmodell wurde benutzt. 

René Reimann 45

Anhang 

A.2.2. Toleranz von 10 in n s mit erweitertem Brent Algorithmus 



berechnet mit dem erweitertem Brent Algorithmus und einer Toleranz von 10. 


46 RWTH Aachen


A.2.3. Toleranz von 1 in n s mit erweitertem Brent Algorithmus 



berechnet mit dem erweitertem Brent Algorithmus und einer Toleranz von 1. Ein 

symmetrisches Signalmodell wurde benutzt. 

René Reimann 47

Anhang 

A.2.4. Toleranz von 0,1 in n s mit erweitertem Brent Algorithmus 



berechnet mit dem erweitertem Brent Algorithmus und einer Toleranz von 0,1. 


48 RWTH Aachen


A.2.5. Signifikanzplots für verschiedene Toleranz mit erweitertem Brent 

Algorithmus 

Abbildung A.10.: Signifikanz-Landschaften der On-Source Region, berechnet mit dem erweitertem 

Brent Algorithmus und einer Toleranz von 100 (oben links), 10 (oben rechts), 

1 (unten links) und 0,1 (unten rechts). Ein symmetrisches Signalmodell wurde 

benutzt. 

René Reimann 49

Anhang 

A.2.6. Differenzplots für verschiedene Toleranzen in n s mit erweitertem 

Brent Algorithmus 

Abbildung A.11.: Differenzplots der n s -Landschaften der On-Source Region (unten) für verschiedene 

Toleranzen, berechnet mit dem erweiterten Brent Algorithmus. Ein symmetrisches 

Signalmodell wurde benutzt. Die absoluten Fluktuationen sind für kleine 

Zenitwinkel größer, da aus dieser Richtung mehr Teilchen detektiert werden. 

50 RWTH Aachen

A.3. Untersuchungen mit elliptischem Signalmodell 

A.3. Untersuchungen mit elliptischem Signalmodell 

Abbildung A.12.: n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 



elliptisches Signalmodell wurde benutzt. 

René Reimann 51

Anhang 


Brent Algorithmus und einer Toleranz von 1 in n s . Ein elliptisches Signalmodell 

wurde benutzt. 

52 RWTH Aachen

A.4. Untersuchungen mit NChannel Schnitt 


A.4.1. Untersuchungen für Events mit niedrigem NChannel 




symmetrisches Signalmodell wurde benutzt. Es wurden nur Daten mit NChannel 

kleiner NChannel Median benutzt. 

René Reimann 53

Anhang 

A.4.2. Untersuchungen für Events mit hohem NChannel 





größer NChannel Median benutzt. 

54 RWTH Aachen


A.4.3. Signifikanzplots mit NChannel Schnitt 


Brent Algorithmus und einer Toleranz von 1 in n s . Ein symmetrisches Signalmodell 

wurde benutzt. Für den oberen Plot wurden nur Events mit NChannel 

kleiner NChannel Median und für den unteren nur Events mit NChannel größer 

NChannel Median verwendet. 

René Reimann 55

Anhang 

A.5. Fitergebnisse für n s -Landschaften der On-Source Region 

Tabelle A.1.: Fitergebnisse der Funktion 5.1 im zentralen Bereich von 2 ◦ x 2 ◦ der jeweiligen n s - 

Landschaft der On-Source Region. 

Fit zu Abbildung δ azi [deg] δ zen [deg] σ 1 [deg] σ 2 [deg] α [rad] scale offset 

A.1 -0.017 -0.050 0.85 0.72 -0.033 -9303 17.9 

A.2 -0.038 0.050 0.85 0.74 -0.009 -9073 9.8 

A.3 -0.033 0.048 0.85 0.74 0.029 -9034 8.4 

A.4 -0.032 0.034 0.85 0.74 0.035 -9066 5.0 

A.6 -0.027 0.047 0.86 0.74 0.066 -8992 9.7 

A.7 -0.028 0.047 0.86 0.75 0.026 -8958 6.9 

A.8 -0.033 0.048 0.85 0.74 0.029 -9034 8.4 

A.9 -0.032 0.048 0.85 0.74 0.038 -9044 8.3 

A.12 -0.0019 0.052 0.72 0.85 1.80 -8663 6.5 

A.14 -0.21 -0.038 0.74 1.02 1.97 -3731 -9.7 

A.15 -0.0043 0.062 0.80 0.71 -0.36 -5234 24.0 

56 RWTH Aachen


[1] Sebastian Euler: „On the Detection of Low Energy Neutrino Events with Full- 

Sky Acceptance with the IceCube DeepCore Detector“ Diplomarbeit, RWTH 

Aachen Juni 2008 

[2] A. Weigert, H.J. Wendker, L. Wisotzki: „Astronomie und Astrophysik“ Wiley- 

Vch-Verlag 5. Auflage, 2009 

[3] Marius Wallraff: „Design, Implementation and Test of a New Feature Extractor 

for the IceCube Neutrino Observatory“ Diplomarbeit, RWTH Aachen, 2010 

[4] Ahrens, J. et al.: „IceCube Preliminary Design Document“. Tech. Rep., The 

IceCube Collaboration, Oct 2001 

[5] Victor F. Hess: „II. Time Variations of Cosmic Rays, The Significane of Variations 

in Cosmic-Ray Intensity and Their Relation to Solar, Earthmagnetic and 

Atmospheric Phenomena“ Reviews of modern physics 1939 

[6] Wolfgang Demtröder: „Experimantalphysik 4 Kern-, Teilchen- und Astrophysik“ 

Springer-Verlag 3. Auflage 2009 

[7] K. Nakamura et al. (Particle Data Group): „chapter 24. cosmic rays revised“ 

Review of Particle Physics August 2009 by T.K. Gaisser and T. Stanev 

[8] Luis Anchordoqui, Thomas Paul, Stephen Reucroft and John Swain: „Ultrahigh 

Energy Cosmic Rays: The state of the art before the AUGER Observatory“ 25 

October 2002 

[9] A. R. Bellw and S. G. Lucek: „Cosmic ray acceleration to very high energy 

through the non-linear amplification by cosmic rays of the seed magnetic field“ 

Mon. Not. R. Astron. Soc. 321, 433-438 (2001) 

[10] Lisa Åström: „A study of cosmic ray air shower properties“ Master’s Thesis, 

Royal Institute of Technology Stockholm, Sweden 2006 

[11] Jan Blumenthal: „Measurements of the Shadowing of Cosmic Rays by the Moon 

with the IceCube Neutrino Observatory“ Diplomarbeit, RWTH Aachen, Januar 

2011 

[12] NASA: „Moon Fact Sheet“, Juni 2011 

URL http://nssdc.gsfc.nasa.gov/planetary/factsheet/moonfact.html 

[13] Wang Bo et al.: „Moon shadow analysis –Using ARGO experiment“ URL 

physics.njnu.edu.cn/hep10th/BWang.ppt Mai 2011 

[14] Peter Romanczyk: „Untersuchungen zur effektiven Fläche für Neutrinos aus der 

Richtung des galaktischen Zentrums für die von IceCube-79 gemessenen Daten“ 

Bachelorarbeit, RWTH Aachen (November 2010) 

[15] K. Nakamura et al. (Particle Data Group) JP G 37, 075021 (2010) 

[16] Albrecht Karle, for the IceCube Collaboration: „IceCube“ Proceedings of 31st 

ICRC, Lodz 2009 

René Reimann 

I


[17] URL http://gallery.icecube.wisc.edu/internal/v/graphics/sketchup/ 

16 Juni 2011 

[18] J. Ahrens et al. „Muon trackreconstruction and data selection techniques in 

AMANDA“ Nuclear Instruments and Methods in Physics Research A 524 

169–194 (2004) 

[19] Lars Schönherr: „Charakterisierung der mit IceCube aus Richtung des Mondes 

selektierten Myonenereignisse“ Bachelorarbeit, RWTH Aachen, Juli 2010 

[20] Ahrens, J. et al.: „Muon Track Reconstruction and Data Selection Techniques in 

AMANDA“. Nucl. Instrum. Meth., vol. A524, pp. 169–194, 2004. doi:10.1016/j. 

nima.2004.01.065. 

[21] Hugo Stiebel: „Study of the angular resolution of the IceCube 59 string detector 

using the shadowing of cosmic rays by the Moon“ Master Thesis, University 

of Wisconsin-Madison and Stockholm University 13 Januar 2011 URL 

http://www.icecube.wisc.edu/science/publications/pdd/pddwhole.php 

[22] Braun, J. et al.: „Methods for point source analysis in high energy neutrino 

telescopes“ Astropart. Phys., vol. 29, pp. 299–305, 2008 

doi:10.1016/j.astropartphys.2008.02.007. 

[23] I.A. Belolaptikov: „The Baikal underwater neutrino telescope: Design, performance, 

and first results“ Astroparticle Physics, vol. 7(3), pp. 263–282, August 

1997. 

[24] Prof. Dr. Bernd Hartke: „Kapitel 8: Suche nach Nullstellen und Extremwerten“ 

Universität Kiel, Mai 2011 

URL ravel.phc.uni-kiel.de/scripts/Comp_Anwendg/folien8.pdf 

[25] Richard Brent: „Algorithms for Minimization without derivatives“ Prentice-Hall 

Inc., Englewood Cliffs, NJ, 1973 

[26] N. Ghosh and W. W. Hager: „A derivative-free bracketing scheme for univariate 

minimization“ Computers Math. Applic. Vol. 20, No. 2, pp. 23-34, 1990 

[27] Brian Gough, Source Code quad_golden.c 2009, GNU Scientific Library Version 

1.15 vom 6 Mai 2011, URL http://ftp.u-tx.net/gnu/gsl/ 

[28] Philip E. Gill and Walter Murray: „Safeguarded Steplength Algorithms for Optimization 

using Descent Methods“, Division of Numerical Analysis and Computing, 

National Physical Laboratory, Teddington, United Kingdom NPL Report 

NAC 37, August 1974 

[29] M. Harris, S. Sengupta, and J. D. Owens: „Parallel prefix sum (scan) with CU- 

DA“ GPU Gems 3, H. Nguyen, Ed. Reading, MA: Addison-Wesley, Aug. 2007, 

pp. 851–876. 

[30] Marius Wallraff et al.: „Scientific Computing on Graphics Processing Units for 

the Example Case of IceCube“ DPG Frühjahrstagung Karlsruhe 30 März 2011 

[31] Johan Seland: „CUDA Programming“ Geilo Winter School Juni 2011 

URL http://heim.ifi.uio.no/~knutm/geilo2008/seland.pdf 

[32] NVIDIA CUDA: „Programming Guide“ Version 3.0 20 Februar 2010 

[33] URL http://www.pointofview-online.com/ 

showroom.php?shop_mode=product_detail&product_id=149 20 Juni 2011 

[34] Jan Blumenthal: „private E-Mail“ 5 Juli 2011 RWTH Aachen 

II 

RWTH Aachen



1.1. Kosmische Botenteilchen auf dem Weg zur Erde. Geladene Teilchen (blau) verlieren 

ihre Richtungsinformation. Photonen (gelb) können absorbiert werden. Neutrinos 

(rot) wechselwirken nur sehr schwach.[1] . . . . . . . . . . . . . . . . . . . . . . . . 1 

2.1. IceCube-Detektor am geographischen Südpol. Die verschiedenen Detektorkomponenten 

sind eingezeichnet. Die unterschiedlichen Farben der Strings zeigen das Jahr 

der Inbetriebnahme an.[17] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

2.2. Zur Rekonstruktion der Myonspur wird der Unterschied der theoretisch zu erwartenen 

und gemessenen Ankunftszeit ermittelt. Die Likelihoodfunktion zur Berechnung 

der Spur basiert zum Großteil auf diesem Zeitunterschied.[18] . . . . . . . . . . . . 7 

2.3. Zur Definition von σ 1 , σ 2 und α. [21] . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

2.4. Fenster des Mondschattenfensters (rot) und Definition der Off-Source Regionen 

(gelb) und der On-Source Region (grau). Für die Analyse wurden nur Daten aus 

dem blauen Fenster verwendet.[11] . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

3.1. Links: Ein Gridfenster um den Mond mit 31 x 31 Punkten in Zenit und Azimut 

wie es in [11] benutzt wurde. Rechts: Ein Gridfenster um den Mond mit 128 x 128 

Punkten in Zenit und Azimut wie es in dieser Arbeit benutzt wird. Das Grid enthält 

den Punkt (0,0). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 

3.2. Normierte Hintergrundverteilung in Zenit. Für die Berechnung des − log L-Wertes 

wird die Verteilung in Radiant umgerechnet. . . . . . . . . . . . . . . . . . . . . . . 10 

4.1. Vergleich von Berechnungsgeschwindigkeit zwischen einer CPU und einer GPU unter 

Verwendung der Programmiersprachen CUDA und OpenGL (GLSL) am Beispiel 

eines Scan-Algorithmus. Die verwendete GPU ist eine GeForce 8800 GTX und die 

verwendete CPU ist ein Intel Core2-Duo Extreme 2.93 GHz. [29] . . . . . . . . . . 12 

4.2. Links: Organisation von Threads und Blocks auf einem Grid.[31] Rechts: Aufrufe 

von Blöcken in unterschiedlichen Maschinen.[32] . . . . . . . . . . . . . . . . . . . 13 

4.3. Struktur des Speichers in einer GPU.[31] . . . . . . . . . . . . . . . . . . . . . . . . 14 

4.4. Skizze zur Kommunikation zwischen CPU und GPU.[30] . . . . . . . . . . . . . . . 15 

4.5. Schematischer Programmaufbau. Der Einsatz von CPU und GPU ist zu sehen und 

durch die rote Linie getrennt. Die grauen Kästchen stellen die Unterprogramme dar. 17 

4.6. Schema zur Verdeutlichung des Minimierungsalgorithmus. In diesem Fall wird die 

Obergrenze im nächsten Iterationsschritt als c gewählt. . . . . . . . . . . . . . . . . 18 

5.1. n s - Landkarte für eine floating point Berechnung (oben) und eine double precision 

Berechnung (unten). Beispielhaft sind Bereiche mit unstetigen Gridpunktübergängen 

gezeigt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 

5.2. Links: Landschaft der absoluten n s Differenzen zwischen einer Minimierung mit einer 

Toleranz von 0.1 und 1 in n s , berechnet mit dem Brent Algorithmus. Rechts: Die 

Häufigkeitsverteilung der absoluten Differenzen in n s für die beiden Toleranzen. . . 22 

5.3. Links: Landschaft der absoluten n s Differenzen zwischen einer Minimierung mit einer 

Toleranz von 0.1 und 1 in n s , berechnet mit dem erweiterten Brentalgorithmus. 


Toleranzen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 

René Reimann 

III


5.4. Häufigkeitsverteilung für absolute n s Werte bei einer Minimierung mit einer Toleranz 

von 1 in n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 

5.5. Landschaft der Iterationen, die für die Minimierung der − log L-Funktion benötigt 

wurden. Links: Berechnung mit einer Toleranz von 1 in n s . Rechts: Berechnung mit 

einer Toleranz von 0.1 in n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

5.6. Landschaft der absoluten n s Differenz für Minimierungen mit einer Toleranz von 1 

und 10 in n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 

5.7. n s Landschaften von Off-Source 1 (links) und Off-Source 2 (rechts) bei einer Toleranz 


5.8. − log L-Landschaften von Off-Source 1 (links) und Off-Source 2 (rechts) bei einer 

Toleranz von 1 in n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 

5.9. n s Histogramme von Off-Source 1 (links) und Off-Source 2 (rechts) bei einer Toleranz 


5.10. n s Landschaften der On-Source Region. Links: Berechnet mit einem CPU Cluster 

und 31 x 31 Gridpunkten [34]. Rechts: Berechnung mit einer GPU und einem Grid 

von 128 x 128. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

5.11. Landschaft der n s Differenzen, bei der Berechnung mit einem CPU-Cluster und einer 

GPU. Zur Berechnung wurden die Werte der CPU Berechungn an der jeweiligen 

Stelle interpoliert. Es ist eine starke Differenz im Zentrum zu erkennen. . . . . . . 27 

5.12. Landschaft der n s Differenzen, bei der Berechnung mit einem CPU-Cluster und einer 

GPU. Zur Berechnung wurden die Werte der CPU Berechnung an der jeweiligen 

Stelle interpoliert. Es ist ein klares Muster zu erkennen. . . . . . . . . . . . . . . . 28 

5.13. − log L-Landschaft für die On-Source Region, berechnet mit einer GPU (oben) und 

einem Grid von 128 x 128, sowie einer Toleranz von 1 in n s . Unten ist die − log L- 

Landschaft der On-Source Region für eine CPU-Berechnung mit einem Grid von 31 

x 31 dargestellt[11]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 

5.14. Signifikanz-Landschaft für die Position des Mondes, berechnet mit einer GPU (oben) 

auf einem 128x128 Grid und mit einer CPU (unten) auf einem 31x31 Grid [34]. . . 31 

6.1. Verteilung von α der Paraboloid Rekonstruktion. Es ist zu beachten, dass die y- 

Achse nicht bei 0 beginnt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 

6.2. Berechnung der n s Landschaft (links) und der − log L-Landschaft (rechts) bei einer 

Toleranz von 1 in n s und unter Verwendung eines elliptischen Signalmodels (oben) 

und eins symmetrischen (unten). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 

6.3. Verteilung von NChannel der mit IC59 und Mondschattenfilter regestrierten Events. 35 

6.4. Histogramm der n s -Werte der Off-Source Region 1 für große (links) und kleine 

(rechts) NChannel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 

6.5. n s -Landschaft der On-Source Region. Links berechnet für NChannel größer NChannel Median 

und rechts für NChannel kleiner NChannel Median . . . . . . . . . . . . . . . . . . . 36 

6.6. − log L-Landschaft der On-Source Region. Links berechnet für NChannel größer 

NChannel Median und rechts für NChannel kleiner NChannel Median . . . . . . . . . . 36 

6.7. Signifikanz-Landschaft der On-Source Region. Links berechnet für NChannel größer 

NChannel Median und rechts für NChannel kleiner NChannel Median . . . . . . . . . . 37 

A.1. n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 1 



Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 

A.2. n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 1 




IV 

RWTH Aachen








mit dem Brent Algorithmus und einer Toleranz von 0,1. Ein symmetrisches 


A.5. Differenzplots der n s -Landschaften der On-Source Region (unten) für verschiedene 

Toleranzen, berechnet mit dem Brent Algorithmus. Ein symmetrisches Signalmodell 

wurde benutzt. Die absoluten Fluktuationen sind für kleine Zenitwinkel größer, da 

aus dieser Richtung mehr Teilchen detektiert werden. . . . . . . . . . . . . . . . . 44 



mit dem erweitertem Brent Algorithmus und einer Toleranz von 100. Ein 

symmetrisches Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . 45 











mit dem erweitertem Brent Algorithmus und einer Toleranz von 0,1. Ein 


A.10.Signifikanz-Landschaften der On-Source Region, berechnet mit dem erweitertem 

Brent Algorithmus und einer Toleranz von 100 (oben links), 10 (oben rechts), 1 

(unten links) und 0,1 (unten rechts). Ein symmetrisches Signalmodell wurde benutzt. 49 

A.11.Differenzplots der n s -Landschaften der On-Source Region (unten) für verschiedene 

Toleranzen, berechnet mit dem erweiterten Brent Algorithmus. Ein symmetrisches 

Signalmodell wurde benutzt. Die absoluten Fluktuationen sind für kleine Zenitwinkel 

größer, da aus dieser Richtung mehr Teilchen detektiert werden. . . . . . . . . . . 50 

A.12.n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 1 



elliptisches Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . 51 


Brent Algorithmus und einer Toleranz von 1 in n s . Ein elliptisches Signalmodell 

wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 

A.14.n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 1 




kleiner NChannel Median benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 

A.15.n s -Landschaften (links) und − log L-Landschaft (rechts) der Off-Source Region 1 




größer NChannel Median benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 

René Reimann 

V



Brent Algorithmus und einer Toleranz von 1 in n s . Ein symmetrisches Signalmodell 

wurde benutzt. Für den oberen Plot wurden nur Events mit NChannel kleiner 

NChannel Median und für den unteren nur Events mit NChannel größer NChannel Median 

verwendet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

VI 

RWTH Aachen

Tabellenverzeichnis 

2.1. Spektrale Indize für verschiedene Energien der kosmischen Strahlung . . . . . . . . 3 

5.1. Rechenzeit bei gegebener Toleranz auf n s für eine Analyse mit einer symmetrischen 

Gausssignalverteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 

5.2. Ergebnis eines Fits von Funktion 5.1 an die n s Landschaft einer GPU Analyse im 

zentralen 2 ◦ x2 ◦ bereich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 

6.1. Ergebnis eines Fits mit der Funktion 5.1 an die n s Landschaft mit elliptischem und 

symmetrischem Signalmodell. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 

6.2. Fitergebnisse der Funktion (5.1) im zentralen Bereich von 2 ◦ x 2 ◦ der n s -Landschaft 

der On-Source Region. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 

A.1. Fitergebnisse der Funktion 5.1 im zentralen Bereich von 2 ◦ x 2 ◦ der jeweiligen n s - 

Landschaft der On-Source Region. . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 

René Reimann 

VII

Selbstständigkeitserklärung 

Ich versichere, dass ich die Arbeit selbstständig verfasst und keine anderen, als die angegebenen 

Quellen und Hilfsmittel benutzt sowie Zitate kenntlich gemacht habe. 

Aachen, den 8. Juli 2011 

René Reimann 

VIII 

RWTH Aachen

Danksagung 

Diese Arbeit war ohne Unterstützung von einer Vielzahl von Personen nicht möglich. Ich möchte 

mich zuerst bei Prof. Wiebusch bedanken, der mir diese Arbeit ermöglichte und mir somit ein 

interessantes Thema bot. 

Mein besonderer Dank gilt Dr. David Boersma, der mich über die gesamte Arbeit sehr gut 

betreute. Trotz einiger Auslandsaufenthalte, schaffte er es immer Zeit für mich zu finden, mir 

Sachen zu erklären, Wissen zu vermitteln, Daten zu interpretieren und mit mir zu diskutieren. 

Ebenfalls möchte ich mich ganz herzlich bei Jan Blumenthal bedanken, dessen Diplomarbeit die 

Grundlage für meine Arbeit war. Er stellte mir Plots und Daten zur Verfügung und diskutierte 

viel und häufig mit mir über meine Ergebnisse. 

Marius Wallraff möchte ich danken, da auch er viele Diskusionen mit mir führte und vorallem 

in technischen Angelegenheiten immer einen Ratschlag für mich hatte. 

Der gesammten IceCube-Gruppe Aachen danken ich, denn sie hat mich freundlich aufgenommen 

und ein sehr entspanntes und produktives Umfeld geschaffen. 

Für Tipps und Ratschläge bedanke ich mich bei Martin Leuermann, Kai Krings und Kai Jagielski 

die sich mit mir den Arbeitsplatz im Tanzsaal teilten. 

Für das Korrekturlesen gilt mein Dank Dr. David Boersma, Jan Blumenthal, Marius Wallraff, 

Nadine Schumacher und Sandra Orlowski. 

Zuletzt möchte ich mich bei meiner Familie und Sandra Orlowski für die Unterstützung während 

des gesamten Studiums bedanken. Sie unterstützten mich in dem was ich machen wollte und waren 

eine Stütze, die ich nicht vermissen möchte. 

René Reimann 

IX

2. Abschattung Kosmischer Strahlung durch den Mond in IceCube

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?