19.02.2014 Aufrufe

2. Abschattung Kosmischer Strahlung durch den Mond in IceCube

2. Abschattung Kosmischer Strahlung durch den Mond in IceCube

2. Abschattung Kosmischer Strahlung durch den Mond in IceCube

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Untersuchungen mit Graphik-Prozessoren (GPU)<br />

zur Messung der <strong>Abschattung</strong> kosmischer<br />

<strong>Strahlung</strong> <strong>durch</strong> <strong>den</strong> <strong>Mond</strong> <strong>in</strong> <strong>IceCube</strong><br />

von<br />

René Reimann<br />

Bachelorarbeit <strong>in</strong> P H Y S I K<br />

vorgelegt der<br />

Fakultät für Mathematik, Informatik und<br />

Naturwissenschaften<br />

der Rhe<strong>in</strong>isch-Westfälischen Technischen Hochschule Aachen<br />

im<br />

Juli 2011<br />

angefertigt am<br />

III. Physikalischen Institut B<br />

Prof. Dr. Christopher Wiebusch


Inhaltsverzeichnis<br />

Inhaltsverzeichnis<br />

1. E<strong>in</strong>leitung 1<br />

<strong>2.</strong> <strong>Abschattung</strong> <strong>Kosmischer</strong> <strong>Strahlung</strong> <strong>durch</strong> <strong>den</strong> <strong>Mond</strong> <strong>in</strong> <strong>IceCube</strong> 3<br />

<strong>2.</strong>1. Kosmische <strong>Strahlung</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

<strong>2.</strong><strong>2.</strong> <strong>Abschattung</strong> <strong>durch</strong> <strong>den</strong> <strong>Mond</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />

<strong>2.</strong>3. Nachweispr<strong>in</strong>zip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />

<strong>2.</strong>4. <strong>IceCube</strong>-Detektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />

<strong>2.</strong>5. <strong>Mond</strong>filter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />

3. <strong>Mond</strong>schattenanalyse 8<br />

3.1. Ungeb<strong>in</strong>ntes log-Likelihood-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . 8<br />

3.<strong>2.</strong> Signalmodell und H<strong>in</strong>tergrundverteilung . . . . . . . . . . . . . . . . . . . . . . . . 9<br />

3.3. Cut-Parameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

3.4. Komplexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

4. Berechnungen mit Graphik Prozessoren (GPU) 12<br />

4.1. Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />

4.<strong>2.</strong> Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

4.3. CUDA-Masch<strong>in</strong>e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

4.4. GPU-Strategie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

4.5. M<strong>in</strong>imierungsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

5. Test des Verfahrens 20<br />

5.1. Genauigkeit des Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

5.<strong>2.</strong> Ergebnisse und Vergleich der Analyse . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

5.3. Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

6. Weiterführende Untersuchungen 33<br />

6.1. Symmetrischer vs. elliptischer Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

6.<strong>2.</strong> Die Energieabhängigkeit des <strong>Mond</strong>schatten . . . . . . . . . . . . . . . . . . . . . . 35<br />

7. Zusammenfassung und Ausblick 38<br />

A. Anhang 39<br />

A.1. Zur Toleranzstudie mit Brent Algorithmus . . . . . . . . . . . . . . . . . . . . . . . 40<br />

A.1.1. Toleranz von 100 <strong>in</strong> n s mit Brent Algorithmus . . . . . . . . . . . . . . . . 40<br />

A.1.<strong>2.</strong> Toleranz von 10 <strong>in</strong> n s mit Brent Algorithmus . . . . . . . . . . . . . . . . . 41<br />

A.1.3. Toleranz von 1 <strong>in</strong> n s mit Brent Algorithmus . . . . . . . . . . . . . . . . . . 42<br />

A.1.4. Toleranz von 0,1 <strong>in</strong> n s mit Brent Algorithmus . . . . . . . . . . . . . . . . . 43<br />

A.1.5. Differenzplots für verschie<strong>den</strong>e Toleranzen <strong>in</strong> n s mit Brent Algorithmus . . 44<br />

A.<strong>2.</strong> Zur Toleranzstudie mit erweitertem Brent Algorithmus . . . . . . . . . . . . . . . . 45<br />

A.<strong>2.</strong>1. Toleranz von 100 <strong>in</strong> n s mit erweitertem Brent Algorithmus . . . . . . . . . 45<br />

A.<strong>2.</strong><strong>2.</strong> Toleranz von 10 <strong>in</strong> n s mit erweitertem Brent Algorithmus . . . . . . . . . . 46<br />

A.<strong>2.</strong>3. Toleranz von 1 <strong>in</strong> n s mit erweitertem Brent Algorithmus . . . . . . . . . . . 47<br />

A.<strong>2.</strong>4. Toleranz von 0,1 <strong>in</strong> n s mit erweitertem Brent Algorithmus . . . . . . . . . . 48<br />

A.<strong>2.</strong>5. Signifikanzplots für verschie<strong>den</strong>e Toleranz mit erweitertem Brent Algorithmus 49<br />

René Reimann<br />

iii


Inhaltsverzeichnis<br />

A.<strong>2.</strong>6. Differenzplots für verschie<strong>den</strong>e Toleranzen <strong>in</strong> n s mit erweitertem Brent Algorithmus<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

A.3. Untersuchungen mit elliptischem Signalmodell . . . . . . . . . . . . . . . . . . . . . 51<br />

A.4. Untersuchungen mit NChannel Schnitt . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />

A.4.1. Untersuchungen für Events mit niedrigem NChannel . . . . . . . . . . . . . 53<br />

A.4.<strong>2.</strong> Untersuchungen für Events mit hohem NChannel . . . . . . . . . . . . . . . 54<br />

A.4.3. Signifikanzplots mit NChannel Schnitt . . . . . . . . . . . . . . . . . . . . . 55<br />

A.5. Fitergebnisse für n s -Landschaften der On-Source Region . . . . . . . . . . . . . . . 56<br />

Literaturverzeichnis<br />

Abbildungsverzeichnis<br />

Tabellenverzeichnis<br />

I<br />

III<br />

VII<br />

iv<br />

RWTH Aachen


1. E<strong>in</strong>leitung<br />

Um astrophysikalische Prozesse und Objekte zu untersuchen und zu verstehen, benötigt man Informationen<br />

über ihr Verhalten und ihre Eigenschaften. Da diese Objekte viele Lichtjahre von der<br />

Erde entfernt s<strong>in</strong>d, ist die e<strong>in</strong>zige Möglichkeit, Informationen von ihnen zu erhalten, die Untersuchung<br />

der <strong>Strahlung</strong>, die sie aussen<strong>den</strong>. Diese Teilchen wer<strong>den</strong> kosmische Boten genannt. Es<br />

handelt sich dabei um hadronischen Teilchen wie Protonen und Atomkernen, sowie Photonen und<br />

Neutr<strong>in</strong>os.<br />

Neutrions s<strong>in</strong>d <strong>in</strong> der Astrophysik von besonderer Bedeutung, <strong>den</strong>n sie enthalten die besten<br />

Informationen über die Richtung ihrer Quelle. Aufgrund ihrer schwachen Wechselwirkung <strong>durch</strong>queren<br />

sie auch <strong>in</strong>terstellaren Staub – im Gegensatz zu Photonen – nahezu ohne Abschwächung. Da<br />

Neutr<strong>in</strong>os ke<strong>in</strong>e Ladung tragen, wer<strong>den</strong> sie auch nicht <strong>durch</strong> kosmische Magnetfelder abgelenkt,<br />

wie es bei <strong>den</strong> meisten stabilen Hadronen der Fall ist.[1] Dies ist <strong>in</strong> Abbildung 1.1 schematisch<br />

verdeutlicht.<br />

Abbildung 1.1.: Kosmische Botenteilchen auf dem Weg zur Erde. Gela<strong>den</strong>e Teilchen (blau) verlieren<br />

ihre Richtungs<strong>in</strong>formation. Photonen (gelb) können absorbiert wer<strong>den</strong>. Neutr<strong>in</strong>os<br />

(rot) wechselwirken nur sehr schwach.[1]<br />

René Reimann 1


E<strong>in</strong>leitung<br />

Neutr<strong>in</strong>os wer<strong>den</strong> <strong>in</strong> vielen astrophysikalischen Prozessen erzeugt. Die Vermessung dieser Neutr<strong>in</strong>os<br />

macht Rückschlüsse auf die zugrundeliegende Physik möglich. Durch Fusionsprozesse wer<strong>den</strong> sie<br />

<strong>in</strong> jedem Stern erzeugt. Bei e<strong>in</strong>er Sternmasse von etwa dem vierfachen der Sonnenmasse <strong>durch</strong>läuft<br />

e<strong>in</strong> Stern e<strong>in</strong>e Supernova. Der <strong>in</strong>nere Kern wird sich nach der Explosion wieder zusammen ziehen.<br />

Da aufgrund des enormen gravitativen Drucks Elektronen und Protonen zusammengedrückt wer<strong>den</strong>,<br />

bil<strong>den</strong> sich Neutronen und Neutr<strong>in</strong>os. Somit können sie Informationen über Neutronensterne<br />

und schwarze Löcher übermitteln.[2]<br />

Hochenergetische Neutr<strong>in</strong>os wer<strong>den</strong> auch <strong>in</strong> hochenergetischen hadronischen Teilchenreaktionen<br />

der kosmischen <strong>Strahlung</strong> produziert. Besonders Pionen- und Kaonen-Produktionen s<strong>in</strong>d hierbei<br />

von Bedeutung. Pionen zerfallen bevorzugt zu Myonen, da die Elektronproduktion aufgrund der<br />

Helizität stark unterdrückt ist. Die Myonen zerfallen weiter <strong>in</strong> Elektron und Neutr<strong>in</strong>o. Somit ergibt<br />

sich e<strong>in</strong> Neutr<strong>in</strong>overhältnis von (¯ν e : ¯ν µ : ¯ν τ ) = (ν e : ν µ : ν τ ) = (1 : 2 : 0), da Tauneutr<strong>in</strong>os<br />

bevorzugt <strong>durch</strong> D ± S -Zerfälle entstehen, wobei der Wirkungsquerschnitt für D± S<br />

-Produktionen bei<br />

niedrigen Energien selbst sehr ger<strong>in</strong>g ist. [3] Somit können auch über viele andere Quellen Informationen<br />

<strong>durch</strong> Neutr<strong>in</strong>os zu uns auf die Erde gebracht wer<strong>den</strong>.<br />

<strong>IceCube</strong> wurde 2001 geplant um Punktquellen hochenergetischer Neutr<strong>in</strong>os wie Gamma Ray<br />

Bursts (GRB), Active Galactic Nuclei (AGN) oder Supernovae zu suchen. Weiterh<strong>in</strong> erhofft man<br />

sich, Informationen über Weakly Interact<strong>in</strong>g Massive Particles (WIMPs) zu erhalten. Zudem motivierte<br />

die Suche nach magnetischen Monopolen und weiteren exotischen Teilchen, sowie nach<br />

weiteren unerwarteten Phänomenen.[4]<br />

Um die Position e<strong>in</strong>er Punktquelle korrekt und um die Genauigkeit der Position angeben zu<br />

können, ist es wichtig, die W<strong>in</strong>kelauflösung und die Systematik des Detektors zu kennen. Da es<br />

bis zum jetzigen Zeitpunkt ke<strong>in</strong>e Standardkerze für Neutr<strong>in</strong>o-Punktquellen gibt, kann die W<strong>in</strong>kelauflösung<br />

mithilfe von Monte-Carlo-Simulationen bestimmt wer<strong>den</strong>. Hierbei treten jedoch viele<br />

Unsicherheiten auf, wenn die Monte-Carlo-Simulation <strong>den</strong> Detektor nicht richtig beschreibt.<br />

Der Nachweis von Neutr<strong>in</strong>os erfolgt wegen des ger<strong>in</strong>gen Wirkungsquerschnittes <strong>in</strong>direkt über<br />

E<strong>in</strong>fangreaktionen. Hierbei kann man zwischen Wechselwirkungen mit neutralem (NC) und gela<strong>den</strong>em<br />

(CC) Strom unterschei<strong>den</strong>.<br />

ν + N → ν + X (NC) (1.1)<br />

ν + N → l + X (CC) (1.2)<br />

Hierbei steht ν für das Neutr<strong>in</strong>o, N für <strong>den</strong> Kern, <strong>durch</strong> <strong>den</strong> das Neutr<strong>in</strong>o e<strong>in</strong>gefangen wird, l für<br />

das zugehörige gela<strong>den</strong>e Lepton und X für die hadronische Kaskade.<br />

Da der <strong>IceCube</strong>-Detektor Neutr<strong>in</strong>os über Leptonen aus der gela<strong>den</strong>e Wechselwirkung detektiert,<br />

wer<strong>den</strong> auch Leptonen aus Luftschauern, die <strong>durch</strong> hochenergetische kosmische <strong>Strahlung</strong><br />

erzeugt wer<strong>den</strong>, gemessen. Für die meisten Messungen <strong>in</strong> <strong>IceCube</strong> bil<strong>den</strong> Myonen e<strong>in</strong> großes Untergrundsignal,<br />

doch für die Bestimmung der W<strong>in</strong>kelauflösung bieten sie die e<strong>in</strong>zige experimentelle<br />

Möglichkeit.<br />

Auch für die kosmische <strong>Strahlung</strong> ist noch ke<strong>in</strong>e Standartkerze bekannt, doch bildet der <strong>Mond</strong><br />

<strong>durch</strong> <strong>Abschattung</strong> der kosmischen Teilchen e<strong>in</strong>e Senke. Da für e<strong>in</strong>e Punktquellensuche auch e<strong>in</strong>e<br />

Punktsenke analysiert wer<strong>den</strong> kann, bietet der Schatten des <strong>Mond</strong>es <strong>in</strong> der kosmischen <strong>Strahlung</strong><br />

die Möglichkeit, die W<strong>in</strong>kelauflösung des <strong>IceCube</strong>-Detektors zu ermitteln.<br />

In dieser Arbeit soll der Schatten des <strong>Mond</strong>es <strong>in</strong> der kosmischen <strong>Strahlung</strong> untersucht wer<strong>den</strong>.<br />

Hierzu wird im zweiten Kapitel die kosmische <strong>Strahlung</strong>, der Detektor und die Datennahme vorgestellt.<br />

Im dritten Kapitel wird die Analysemethode erklärt. Kapitel vier bietet e<strong>in</strong>en E<strong>in</strong>blick <strong>in</strong><br />

die Umsetzung der Analyse auf e<strong>in</strong>er Graphikkarte. In Kapitel fünf wird zunächst die Analyse getestet,<br />

bevor <strong>in</strong> Kapitel sechs e<strong>in</strong>ige Untersuchungen mithilfe dieser Methode <strong>durch</strong>geführt wer<strong>den</strong>.<br />

Kapitel sieben zieht e<strong>in</strong> Fazit und gibt e<strong>in</strong>en Ausblick für weitere Analysen.<br />

2 RWTH Aachen


<strong>2.</strong> <strong>Abschattung</strong> <strong>Kosmischer</strong> <strong>Strahlung</strong> <strong>durch</strong><br />

<strong>den</strong> <strong>Mond</strong> <strong>in</strong> <strong>IceCube</strong><br />

<strong>2.</strong>1. Kosmische <strong>Strahlung</strong><br />

Die kosmische Höhenstrahlung wurde von Victor F. Hess 1912 <strong>in</strong> e<strong>in</strong>em Ballonexperiment unerwartet<br />

entdeckt. Er wollte mit se<strong>in</strong>em Ballonexperiment zeigen, dass die Strahlenbelastung mit dem<br />

Abstand zur Erdoberfläche abnimmt, fand jedoch, dass sie ab e<strong>in</strong>igen Kilometern Höhe wieder<br />

zunahm. In <strong>den</strong> Folgejahren untersuchte er die Eigenschaften der kosmischen Höhenstrahlung [5]<br />

und es wur<strong>den</strong> viele bis dah<strong>in</strong> unbekannte Teilchen <strong>in</strong> ihr gefun<strong>den</strong>, die heute unter dem Zoo der<br />

Elementarteilchen bekannt s<strong>in</strong>d.[6]<br />

Die kosmische Höhenstrahlung besteht bei ger<strong>in</strong>ger Energie zu etwa 90% aus Protonen und zu<br />

etwa 9% aus Heliumkernen. Der Rest s<strong>in</strong>d schwere Kerne bis h<strong>in</strong> zu Eisen, sowie Anti-Protonen.[7]<br />

[8, Kapitel 2]<br />

Das Energiespektrum aller Teilchen der kosmischen Höhenstrahlung folgt e<strong>in</strong>em Potenzgesetz.<br />

N(E) ∝ E −γ (<strong>2.</strong>1)<br />

Der Spektrale Index γ hat für verschie<strong>den</strong>e Energien e<strong>in</strong>en unterschiedlichen Wert (siehe Tabelle<br />

<strong>2.</strong>1). [[8]]<br />

Tabelle <strong>2.</strong>1.: Spektrale Indize für verschie<strong>den</strong>e Energien der kosmischen <strong>Strahlung</strong><br />

E < 10 15.5 eV γ = −<strong>2.</strong>7<br />

10 15.5 eV < E < 10 17.7 eV γ = −3<br />

10 17.7 eV < E < 10 18.5 eV γ = −3.1<br />

10 18.5 eV < E γ = −<strong>2.</strong>7<br />

Die Übergänge <strong>in</strong> diesem Spektrum haben traditionell die Namen „knee“, „dip“ und „ankle“.<br />

Teilchen mit Energien oberhalb von 10 19.5 eV sollten nach dem sogenannte GZK-Cutoff nicht auftreten.<br />

Er wurde von Greisen, Zatsep<strong>in</strong> und Kuzm<strong>in</strong> 1966 e<strong>in</strong>geführt. Hierbei geht man davon aus,<br />

dass die hochenergetischen Protonen mit Photonen der 2,7 K H<strong>in</strong>tergrundstrahlung wechselwirken<br />

und somit nach<br />

γ + p → ∆ + → pπ 0<br />

γ + p → ∆ + → nπ + (<strong>2.</strong>2)<br />

weniger energiereiche Pionen, Protonen und Neutronen erzeugen. [7] [8, Kapitel 2 & 6]<br />

Die unterschiedlichen Spektralen Indize lassen auf unterschiedliche Herkunft, Entstehung und<br />

Beschleunigung schließen. Es wird vermutet, dass Teilchen mit Energien unter 10 15.5 hauptsächlich<br />

aus unserer Milchstraße kommen. Teilchen mit noch höheren Energien kommen von außerhalb<br />

unserer Galaxie. Als Quellen für kosmische <strong>Strahlung</strong> kommen z.B. Supernovae Explosionen, Pulsare,<br />

Aktive Galaktische Kerne (AGN), rotierende schwarze Löcher, Gamma Ray Bursts (GRB)<br />

<strong>in</strong> Frage. E<strong>in</strong>e mögliche Erklärung des Beschleunigungsmechanismus kann <strong>durch</strong> <strong>den</strong> nach Enrico<br />

Fermi benannte Fermi Mechanismus erster Art beschrieben wer<strong>den</strong>.[8, Kapitel 3] [9]<br />

Würde die kosmische <strong>Strahlung</strong> ohne Abschirmung und Abschwächung auf die Erdoberfläche e<strong>in</strong>fallen,<br />

so könnte es nicht zu leben<strong>den</strong> Organismen, wie wir sie kennen, auf der Erde kommen. Erst<br />

<strong>durch</strong> die Erdatmosphäre, die <strong>in</strong> etwa 15-20 km Höhe beg<strong>in</strong>nt, wird die <strong>Strahlung</strong> so abgeschwächt,<br />

René Reimann 3


<strong>Abschattung</strong> <strong>Kosmischer</strong> <strong>Strahlung</strong> <strong>durch</strong> <strong>den</strong> <strong>Mond</strong> <strong>in</strong> <strong>IceCube</strong><br />

dass Leben auf unserem Planeten möglich ist. Die primär e<strong>in</strong>fallen<strong>den</strong> Teilchen stoßen mit Atomen<br />

und Molekülen <strong>in</strong> <strong>den</strong> oberen Schichten der Atmosphäre zusammen. Zum Großteil wird da<strong>durch</strong><br />

die obere Schicht der Atmosphäre ionisiert. Hochenergetische Teilchen erzeugen <strong>durch</strong> ihren Stoß<br />

verschie<strong>den</strong>e andere Teilchen, mit weniger Energie, die dann weiter zur Erde rasen und gegebenenfalls<br />

auch stoßen. Da<strong>durch</strong> entsteht e<strong>in</strong> law<strong>in</strong>enartiger Schauer von Myonen, Elektronen, Photonen,<br />

Neutr<strong>in</strong>os und verschie<strong>den</strong>en anderen Teilchen.[10]<br />

Elektronen verlieren aufgrund der Bremsstrahlung soviel Energie, dass sie die Erde nur mit<br />

niedrigen Energien erreichen.<br />

Myonen zerfallen im Ruhesystem nach e<strong>in</strong>er Halbwertszeit von <strong>2.</strong>197 µs [15], erreichen aufgrund<br />

der Zeitdilatation bzw. aufgrund der Längenkontraktion (hängt vom Bezugssystem ab) <strong>den</strong> Erdbo<strong>den</strong><br />

und zerfallen nicht vorher. Ihnen geht auf dem Weg <strong>durch</strong> die Atmosphäre etwa 2 GeV verloren.<br />

Myonen die <strong>in</strong> der Atmosphäre aufgrund von Schauern entstehen wer<strong>den</strong> atmosphärische Myonen<br />

genannt.<br />

<strong>2.</strong><strong>2.</strong> <strong>Abschattung</strong> <strong>durch</strong> <strong>den</strong> <strong>Mond</strong><br />

Der <strong>Mond</strong> ist der e<strong>in</strong>zige Trabant der Erde. Er hat e<strong>in</strong>en Radius von 1737.1 km und umkreist die<br />

Erde <strong>in</strong> e<strong>in</strong>er mittleren Entfernung von 378000 km <strong>in</strong> 27.32 Tagen. Der <strong>Mond</strong> hat e<strong>in</strong>e elliptische<br />

Laufbahn mit e<strong>in</strong>er Exzentrität von 0.05 und e<strong>in</strong>em W<strong>in</strong>kel von 5.15 ◦ zur Ekliptic. Somit hat der<br />

<strong>Mond</strong> von der Erdoberfläche aus gesehen e<strong>in</strong>en W<strong>in</strong>kelradius von 0.246 ◦ bis 0.258 ◦ .[11]<br />

Der <strong>Mond</strong> hat e<strong>in</strong>e Masse von 7.349 · 10 22 kg und somit e<strong>in</strong>e Dichte von 3350 kg / m 3 . [12] Bei<br />

e<strong>in</strong>er solchen Dichte wer<strong>den</strong> kosmische Strahlen auf wenigen km abgebremst. Folglich können sie <strong>den</strong><br />

<strong>Mond</strong> nicht <strong>durch</strong>dr<strong>in</strong>gen und der <strong>Mond</strong> h<strong>in</strong>terlässt e<strong>in</strong>en Schatten <strong>in</strong> der kosmischen <strong>Strahlung</strong>.<br />

Der Schatten des <strong>Mond</strong>es <strong>in</strong> der kosmischen <strong>Strahlung</strong> kann versetzt zu der wahren <strong>Mond</strong>position<br />

se<strong>in</strong>. Dies liegt daran, dass die kosmische <strong>Strahlung</strong> hauptsächlich aus gela<strong>den</strong>en Teilchen besteht,<br />

die von Magnetfeldern zwischen Erde und <strong>Mond</strong> abgelenkt wer<strong>den</strong>.<br />

Diese Ablenkung konnte beispielsweise im ARGO Experiment für niederenergetische Teilchen<br />

gezeigt wer<strong>den</strong>.[13]<br />

<strong>2.</strong>3. Nachweispr<strong>in</strong>zip<br />

<strong>IceCube</strong> ist e<strong>in</strong> Neutr<strong>in</strong>o Observatorium, mit e<strong>in</strong>em Detektorvolumen von 1 km 3 klarem antarktischen<br />

Eis an der „Amundsen-Scott South Pole Station“ am geographischen Südpol.<br />

Im Eis lösen Elektronen aufgrund der starken Bremsstrahlung e<strong>in</strong>en elektromagnetischen Schauer<br />

aus.<br />

Myonen, die etwa 200 mal schwerer s<strong>in</strong>d [15], strahlen kaum Bremsstrahlung ab. Sie können<br />

über <strong>den</strong> Cherenkov-Effekt nachgewiesen wer<strong>den</strong>. Hierbei liegt die Geschw<strong>in</strong>digkeit des Myons,<br />

das nahezu Vakuumlichtgeschw<strong>in</strong>digkeit hat, über der Lichtgeschw<strong>in</strong>digkeit im Eis. Somit wer<strong>den</strong><br />

die Atome nahe der Teilchenspur polarisiert und strahlen Licht ab. Dieses Licht hat die Form e<strong>in</strong>es<br />

Kegels und wird Cherenkov-Kegel genannt. Für <strong>den</strong> Cherenkov-Kegel gilt allgeme<strong>in</strong> die Beziehung<br />

<strong>2.</strong>3.<br />

cos ϑ C = (nβ) −1 (<strong>2.</strong>3)<br />

Der Öffnungsw<strong>in</strong>kel ergibt sich für Eis mit e<strong>in</strong>em Brechungs<strong>in</strong>dex von n=1.32 und Myonen mit<br />

Geschw<strong>in</strong>digkeiten nahe der Lichtgeschw<strong>in</strong>digkeit β ≈ 1 zu ϑ C ≈ 41 ◦ . Das Cherenkov-Licht breitet<br />

sich im Eis aus und ist auch <strong>in</strong> e<strong>in</strong>igen Metern Entfernung noch gut sichtbar.[14]<br />

Tau-Leptonen haben die Eigenschaft, dass sie nach sehr kurzer Zeit zerfallen. Ihre Lebensdauer<br />

beträgt 0.29 ps.[15] Demnach lassen sie sich anhand des hadronischen Schauers am Startpunkt und<br />

e<strong>in</strong>es weiteren Schauers am Endpunkt ihrer Flugbahn erkennen. Die Lebensdauer ist so kurz, dass<br />

sowohl Start-, als auch Endpunkt, abhängig von der Energie, nur e<strong>in</strong>ige Meter ause<strong>in</strong>ander liegen<br />

können. Für niederenergetische Tau-Leptonen liegen die zwei Schauer sogar <strong>in</strong>e<strong>in</strong>ander.<br />

4 RWTH Aachen


<strong>2.</strong>4. <strong>IceCube</strong>-Detektor<br />

<strong>2.</strong>4. <strong>IceCube</strong>-Detektor<br />

Der <strong>IceCube</strong>-Detektor ist e<strong>in</strong> Nachfolger des „Antarctic Muon And Neutr<strong>in</strong>o Detector Arrays“<br />

(AMANDA), das von 1994 bis 2008 Daten sammelte. Der <strong>IceCube</strong>-Detektor wurde im arktischen<br />

Sommer 2010/2011 fertig gestellt und besteht jetzt aus 86 Str<strong>in</strong>gs mit jeweils 60 Digitalen Optischen<br />

Modulen (DOM), die das Cherenkov-Licht von Myonen mit Energien überhalb von 10 GeV<br />

detektieren.<br />

Der Großteil von <strong>IceCube</strong> liegt <strong>in</strong> e<strong>in</strong>er Tiefe von 1450 m bis 2450 m im klaren antarktischen<br />

Eis (siehe Abbildung <strong>2.</strong>1). Er besteht aus 5160 Digitalen Optischen Modulen welche auf 86 Str<strong>in</strong>gs<br />

aufgeteilt s<strong>in</strong>d. E<strong>in</strong> Digitales Optisches Modul (DOM) besteht aus e<strong>in</strong>em empf<strong>in</strong>dlichen Photomultiplier<br />

und e<strong>in</strong>er zugehörigen Ausleseelektronik. Diese Str<strong>in</strong>gs s<strong>in</strong>d <strong>in</strong> e<strong>in</strong>em annähernd hexagonalen<br />

Gitter auf e<strong>in</strong>em Gebiet von 1 km 2 verteilt. E<strong>in</strong> Str<strong>in</strong>g besteht aus 60 DOMs, die jeweils e<strong>in</strong>en<br />

Abstand von 17 m haben. [16]<br />

In <strong>den</strong> Vorjahren wur<strong>den</strong> bereits Daten mit dem unvollständigen Detektor genommen. Diese<br />

Daten, sowie der Detektor <strong>in</strong> se<strong>in</strong>en verschie<strong>den</strong>en Ausbaustadien, wer<strong>den</strong> <strong>durch</strong> die Anzahl an<br />

Str<strong>in</strong>gs charakterisiert. 2005 wurde e<strong>in</strong> Teststr<strong>in</strong>g betrieben. Im arktischen Sommer 2005-2006<br />

kamen acht Str<strong>in</strong>gs h<strong>in</strong>zu. Diese Konfiguration wird IC9 genannt. Die folgen<strong>den</strong> Konfigurationen<br />

s<strong>in</strong>d IC22, IC40, IC59 und IC79. Der vollständige Detektor wird IC86 genannt. Für IC22, IC40,<br />

IC59 und IC79 wur<strong>den</strong> die Daten e<strong>in</strong>es Jahres gesammelt. Dabei ist zu beachten, dass nur IC86<br />

und IC79 e<strong>in</strong>en symmetrischen Aufbau <strong>in</strong> Azimut hat. [16]<br />

In dieser Arbeit wer<strong>den</strong>, soweit nicht anders erwähnt, Daten von IC59 verwendet.<br />

<strong>2.</strong>5. <strong>Mond</strong>filter<br />

Aufgrund e<strong>in</strong>er enormen Datenmenge, die <strong>in</strong> <strong>IceCube</strong> produziert wird, müssen die Daten bereits<br />

am Südpol vorselektiert wer<strong>den</strong>, bevor sie über e<strong>in</strong>en Satelliten, mit begrenzter Bandbreite, auf die<br />

nördliche Halbkugel übertragen wer<strong>den</strong>. Hierzu wer<strong>den</strong> zunächst Qualitätsschnitte auf die Daten<br />

angewendet. Die Anzahl der getroffenen Str<strong>in</strong>gs (NStr<strong>in</strong>g) muss größer gleich drei und die Anzahl<br />

der getroffenen DOMs (NChannel) muss größer gleich zwölf se<strong>in</strong>. Aus diesem Grund kann e<strong>in</strong>e<br />

Onl<strong>in</strong>e-Spurrekonstruktion <strong>durch</strong>geführt wer<strong>den</strong>, bei der die mittlere W<strong>in</strong>kelauflösung h<strong>in</strong>reichend<br />

gut ist.<br />

Diese Spurrekonstruktion basiert auf e<strong>in</strong>er Maximum Likelihood Methode. Die Spur wird so rekonstruiert,<br />

dass die Ankunftzeiten und Amplitu<strong>den</strong> von Licht <strong>in</strong> <strong>den</strong> DOMs am besten beschrieben<br />

wer<strong>den</strong>. Hierbei hat der Zeitunterschied zwischen theoretisch erwarteter Ankunftszeit <strong>durch</strong> das<br />

Modell <strong>in</strong> Abbildung <strong>2.</strong>2 und der gemessenen Ankunftszeit <strong>den</strong> größten E<strong>in</strong>fluss.[18]<br />

Um <strong>den</strong> Schatten des <strong>Mond</strong>es zu beobachten, wer<strong>den</strong> nur Daten aus Richtung des <strong>Mond</strong>es<br />

benötigt. Da der <strong>Mond</strong> nicht still steht, sondern täglich etwa e<strong>in</strong>mal über <strong>den</strong> gesamten Horizont<br />

wandert und zudem se<strong>in</strong>e Dekl<strong>in</strong>ation ändert, müssen die Daten <strong>in</strong> Relativkoord<strong>in</strong>aten<br />

δ azimuth = (ϕ event − ϕ moon ) · s<strong>in</strong>(ϑ event ) (<strong>2.</strong>4)<br />

δ zenith = ϑ event − ϑ moon (<strong>2.</strong>5)<br />

gegeben wer<strong>den</strong>. Das die Differenz <strong>in</strong> Azimut mit dem S<strong>in</strong>us des Zenitwertes multipliziert wird,<br />

führt zu e<strong>in</strong>er korrekten Skalierung für e<strong>in</strong>e kartesische Darstellung.<br />

Die Dekl<strong>in</strong>ation des <strong>Mond</strong>es schwankt zwischen -25 ◦ bis +25 ◦ . Da für zu ger<strong>in</strong>ge W<strong>in</strong>kel der<br />

Weg <strong>durch</strong> die Atmosphäre und das Eis, für die kosmische <strong>Strahlung</strong>, immer länger wird, ist für<br />

sehr kle<strong>in</strong>e Dekl<strong>in</strong>ationen die Datennahme nicht s<strong>in</strong>nvoll. Der <strong>Mond</strong>filter selektiert Daten, wenn<br />

der <strong>Mond</strong> höher als 15 ◦ am Horizont steht. Dies ist an etwa 8 Tagen im Monat der Fall.<br />

Da nur Daten <strong>in</strong> der Nähe des <strong>Mond</strong>es von Interesse s<strong>in</strong>d, jedoch auch Off-Source-Regionen beobachtet<br />

wer<strong>den</strong> müssen, selektiert der <strong>Mond</strong>filter Events, die <strong>in</strong> e<strong>in</strong>em Fenster von ±40 ◦ <strong>in</strong> Azimut<br />

multipliziert mit dem S<strong>in</strong>us des Zenit und ±10 ◦ <strong>in</strong> Zenit um <strong>den</strong> <strong>Mond</strong> detektiert wer<strong>den</strong>.[19]<br />

E<strong>in</strong>e Offl<strong>in</strong>e-Spurrekonstruktion basiert ebenfalls auf der oben beschriebenen Likelihood Maximierung,<br />

wird jedoch <strong>durch</strong> mehrfache Iteration e<strong>in</strong>e andere, meist näher an der Wahrheit liegende<br />

René Reimann 5


<strong>Abschattung</strong> <strong>Kosmischer</strong> <strong>Strahlung</strong> <strong>durch</strong> <strong>den</strong> <strong>Mond</strong> <strong>in</strong> <strong>IceCube</strong><br />

Abbildung <strong>2.</strong>1.: <strong>IceCube</strong>-Detektor am geographischen Südpol. Die verschie<strong>den</strong>en Detektorkomponenten<br />

s<strong>in</strong>d e<strong>in</strong>gezeichnet. Die unterschiedlichen Farben der Str<strong>in</strong>gs zeigen das<br />

Jahr der Inbetriebnahme an.[17]<br />

Spur f<strong>in</strong><strong>den</strong>. Um die resultierende Spur wird auf zwei Kreisen an je acht Punkten die Likelihoodfunktion<br />

berechnet. Durch diese Punkte wird e<strong>in</strong>e Paraboloidfunktion gefittet. Die Schärfe des<br />

Paraboloids gibt Auskunft über die Güte der Rekonstruktion. In dieser Analyse wird die Likelihood<br />

Rekonstruktion SPE (S<strong>in</strong>gle Photo-Elektron) verwendet.[20]<br />

Die rekonstruierte Paraboloidfunktion hat die Parameter σ 1 , σ 2 und α. Hierbei ist σ 1 die größere<br />

Halbachse der 1-Sigma-Ellipse. α ist der W<strong>in</strong>kel von der Azimut-Achse bis zu σ 1 (siehe Abbildung<br />

<strong>2.</strong>3).[21]<br />

Da die Onl<strong>in</strong>e und Offl<strong>in</strong>e-Rekonstruktion unterschiedliche δ azimuth und δ zenith Werte ergeben<br />

können, kann es se<strong>in</strong>, dass Spuren, die übertragen wor<strong>den</strong> s<strong>in</strong>d außerhalb bzw. Spuren, die nicht<br />

übertragen wor<strong>den</strong> s<strong>in</strong>d <strong>in</strong>nerhalb des <strong>Mond</strong>fensters liegen. Um diese Randeffekte zu m<strong>in</strong>imieren,<br />

wird e<strong>in</strong> Fenster von ±36 ◦ <strong>in</strong> Azimut multipliziert mit S<strong>in</strong>us des Zenits und ±8 ◦ <strong>in</strong> Zenit um<br />

<strong>den</strong> <strong>Mond</strong> gewählt. Für die Analyse wer<strong>den</strong> e<strong>in</strong>e On-Source und zwei Off-Source Regionen wie <strong>in</strong><br />

Abbildung <strong>2.</strong>4 def<strong>in</strong>iert. Jede Region ist 8 ◦ <strong>in</strong> Zenit und 8 ◦ <strong>in</strong> Azimut/s<strong>in</strong> ϑ groß. Die On-Source<br />

Region enthält 22198152, die Off-Source 1 Region 22174047 und die Off-Source 2 Region 22143731<br />

Events für IC59.<br />

6 RWTH Aachen


<strong>2.</strong>5. <strong>Mond</strong>filter<br />

Abbildung <strong>2.</strong><strong>2.</strong>: Zur Rekonstruktion der Myonspur wird der Unterschied der theoretisch zu erwartenen<br />

und gemessenen Ankunftszeit ermittelt. Die Likelihoodfunktion zur Berechnung<br />

der Spur basiert zum Großteil auf diesem Zeitunterschied.[18]<br />

Abbildung <strong>2.</strong>3.: Zur Def<strong>in</strong>ition von σ 1 , σ 2 und α. [21]<br />

Abbildung <strong>2.</strong>4.: Fenster des <strong>Mond</strong>schattenfensters (rot) und Def<strong>in</strong>ition der Off-Source Regionen<br />

(gelb) und der On-Source Region (grau). Für die Analyse wur<strong>den</strong> nur Daten aus<br />

dem blauen Fenster verwendet.[11]<br />

René Reimann 7


<strong>Mond</strong>schattenanalyse<br />

3. <strong>Mond</strong>schattenanalyse<br />

3.1. Ungeb<strong>in</strong>ntes log-Likelihood-Verfahren<br />

In dieser Arbeit wird das ungeb<strong>in</strong>nte Likelihood-Verfahren zur Rekonstruktion des <strong>Mond</strong>schattens<br />

der kosmischen <strong>Strahlung</strong> verwendet, wie es <strong>in</strong> der Diplomarbeit „Measurements of the Shadow<strong>in</strong>g<br />

of Cosmic Rays by the Moon with the <strong>IceCube</strong> Neutr<strong>in</strong>o Observatory“ von Jan Blumenthal<br />

behandelt wurde.[11]<br />

Das Verfahren basiert auf e<strong>in</strong>er Methode zur Punktquellensuche für Neutr<strong>in</strong>os [22]. In dieser<br />

Methode wird nach dem optimalen Schätzer für die Anzahl von Source-Events n s gesucht. Bei der<br />

<strong>Mond</strong>schatten Analyse sucht man nicht nach e<strong>in</strong>er Neutr<strong>in</strong>oquelle, sondern beobachtet e<strong>in</strong>e Senke<br />

für kosmische <strong>Strahlung</strong>. Folglich kann n s als Anzahl der abgeschatteten Events bezeichnet wer<strong>den</strong>.<br />

Gibt es e<strong>in</strong>e Schätzung für <strong>den</strong> H<strong>in</strong>tergrund und e<strong>in</strong> Modell für das Signal bzw. die Senke, so<br />

kann e<strong>in</strong>e Likelihoodfunktion aufgestellt wer<strong>den</strong>. Durch diese Likelihoodfunktion soll die Anzahl<br />

von abgeschatteten Events ermittelt wer<strong>den</strong>, für die die Komb<strong>in</strong>ation von H<strong>in</strong>tergrund bzw. Signal<br />

am besten die gegebenen Daten beschreibt. Da es sich bei H<strong>in</strong>tergrund- und Signalverteilung um<br />

Wahrsche<strong>in</strong>lichkeitsdichten handelt, sollten beide Funktionen seperat normiert se<strong>in</strong>.<br />

Für e<strong>in</strong> Event ist die Likelihoodfunktion L i entweder mehr dem Signal oder H<strong>in</strong>tergrund ähnlich.<br />

Auf Grund dessen ergibt sich e<strong>in</strong>e Likelihoodfunktion für e<strong>in</strong> Event mit der Signalverteilung an<br />

e<strong>in</strong>er bestimmten Position ⃗x:<br />

L i (⃗x, n s ) = n (<br />

s<br />

N S i(⃗x) +<br />

1 − n s<br />

N<br />

)<br />

B i (⃗x) (3.1)<br />

Hierbei ist N die Anzahl der Gesamtevents und sorgt für die korrekte Normierung der Likelihoodfunktion.<br />

Insgesamt ergibt sich für N Events e<strong>in</strong>e Likelihoodfunktion für die der Schatten e<strong>in</strong>e Stärke n s<br />

hat und um ⃗x von der nom<strong>in</strong>ellen Position verschoben ist.<br />

L(⃗x, n s ) =<br />

N∏<br />

L i (⃗x, n s ) (3.2)<br />

i=1<br />

Das n s , welches diese Funktion maximiert, ist der beste Schätzer für die Beschreibung der Daten<br />

mit diesem Modell. Um die Berechnung zu vere<strong>in</strong>fachen kann der Logarithmus dieser Funktion<br />

verwendet wer<strong>den</strong>, da es sich hierbei um e<strong>in</strong>e monotone Funktion handelt und somit das Maximum<br />

nicht verschiebt. Da für Computer meist e<strong>in</strong> M<strong>in</strong>imierungsalgorithmus verwendet wird, kann das<br />

Maximum <strong>durch</strong> H<strong>in</strong>zufügen e<strong>in</strong>es M<strong>in</strong>uszeichens <strong>in</strong> e<strong>in</strong> M<strong>in</strong>imum umgewandelt wer<strong>den</strong>. Also ergibt<br />

sich:<br />

− log L(⃗x, n s ) = −<br />

N∑<br />

i=1<br />

( ns<br />

(<br />

log<br />

N S i(⃗x) +<br />

1 − n s<br />

N<br />

) )<br />

B i (⃗x)<br />

Es sei darauf h<strong>in</strong>gewiesen, dass die negative log-Likelihoodfunktion (− log L) e<strong>in</strong>e Funktion <strong>in</strong><br />

⃗x und n s ist. Für jedes beliebige ⃗x kann sie <strong>in</strong> n s m<strong>in</strong>imiert wer<strong>den</strong>. Die M<strong>in</strong>imierung ist e<strong>in</strong>e<br />

konkrete Zuweisung, daher erhält man e<strong>in</strong>e Funktion, die nur von ⃗x abhängt. Diese Funktion ist<br />

jedoch nicht beziehungsweise sehr schwer analytisch aus der − log L-Funktion berechenbar, sondern<br />

muss an jedem Punkt e<strong>in</strong>zelnd ausgewertet wer<strong>den</strong>. Deswegen ist e<strong>in</strong>e kont<strong>in</strong>uierliche Darstellung<br />

schwierig bzw. bei unendlich vielen Punkten unmöglich. Daher muss zur Analyse des <strong>Mond</strong>schatten<br />

e<strong>in</strong>e Auswahl an Punkten dieser Funktion ausreichen.<br />

(3.3)<br />

8 RWTH Aachen


3.<strong>2.</strong> Signalmodell und H<strong>in</strong>tergrundverteilung<br />

Hierzu wird die − log L-Funktion auf e<strong>in</strong>em Grid <strong>in</strong> der ⃗x-Ebene berechnet. Jeder Gridpunkt<br />

hat darum die Koord<strong>in</strong>aten δ zenith = ϑ Moon − ϑ grid und δ azimuth = (ϕ Moon − ϕ grid ) · s<strong>in</strong>(ϑ grid ).<br />

Als Konsequenz ergibt sich e<strong>in</strong>e Landschaft <strong>in</strong> n s und <strong>in</strong> − log L.<br />

Für e<strong>in</strong>e gute Auflösung <strong>in</strong> <strong>den</strong> Landschaften wer<strong>den</strong> 128 x 128 (16384) Gridpunkte berechnet.<br />

Um Randeffekte zu vermei<strong>den</strong> wird die − log L nur <strong>in</strong> e<strong>in</strong>em 4 ◦ x 4 ◦ großen Fenster berechnet,<br />

wobei jedoch die Daten aus e<strong>in</strong>em 8 ◦ x 8 ◦ großen Fenster stammen. Da auch der Punkt (0,0)<br />

berechnet wer<strong>den</strong> soll, muss das Grid um 1 2 · 4◦<br />

128<br />

<strong>in</strong> negative Zenit- und Azimutrichtung verschoben<br />

wer<strong>den</strong>. Exemplarisch ist auch e<strong>in</strong> grobes Grid, wie es <strong>in</strong> der Arbeit von Jan Blumenthal verwendet<br />

wurde, <strong>in</strong> Abbildung 3.1 gezeigt.<br />

Abbildung 3.1.: L<strong>in</strong>ks: E<strong>in</strong> Gridfenster um <strong>den</strong> <strong>Mond</strong> mit 31 x 31 Punkten <strong>in</strong> Zenit und Azimut<br />

wie es <strong>in</strong> [11] benutzt wurde. Rechts: E<strong>in</strong> Gridfenster um <strong>den</strong> <strong>Mond</strong> mit 128 x<br />

128 Punkten <strong>in</strong> Zenit und Azimut wie es <strong>in</strong> dieser Arbeit benutzt wird. Das Grid<br />

enthält <strong>den</strong> Punkt (0,0).<br />

3.<strong>2.</strong> Signalmodell und H<strong>in</strong>tergrundverteilung<br />

H<strong>in</strong>tergrundverteilung<br />

Für die H<strong>in</strong>tergrundverteilung wird e<strong>in</strong> Seperationsansatz gewählt:<br />

B i (δ zen , δ azi ) = B(δ zen,i ) · B(δ azi,i ) (3.4)<br />

Obwohl die Azimutverteilung alle<strong>in</strong> aufgrund der Detektorgeometrie nicht flach ist, wird dieser<br />

Effekt bei e<strong>in</strong>em kompletten <strong>Mond</strong>zyklus annähernd herausgemittelt, da es sich bei δ azimuth<br />

um Relativkoord<strong>in</strong>aten handelt. Dies ist nur möglich, wenn die Datennahme über <strong>den</strong> kompletten<br />

<strong>Mond</strong>zyklus stattf<strong>in</strong>det. Dies kann aufgrund von Umbauphasen, Updates, Ausfällen oder Ähnlichem<br />

nicht der Fall se<strong>in</strong>. Jedoch wur<strong>den</strong> die Daten für je<strong>den</strong> <strong>Mond</strong>zyklus der untersuchten IC59<br />

Daten <strong>in</strong> über 90% der Zeit genommen. Auch <strong>durch</strong> Betrachten wurde auf e<strong>in</strong>e flache Verteilung<br />

geschlossen. Insofern lässt sich e<strong>in</strong>e Gleichverteilung <strong>in</strong> Azimut rechtfertigen. [11]<br />

In Zenit ist die H<strong>in</strong>tergrundverteilung nicht annähernd flach. Dies ist <strong>durch</strong> <strong>den</strong> unterschiedlich<br />

langen Weg, bei verschie<strong>den</strong>en Zenitw<strong>in</strong>keln, für Myonen <strong>durch</strong> die Atmosphäre und das Eis zu<br />

begrün<strong>den</strong>. Demnach wird für größere Zenitw<strong>in</strong>kel e<strong>in</strong> ger<strong>in</strong>gerer Fluss erwartet [23] und auch<br />

René Reimann 9


<strong>Mond</strong>schattenanalyse<br />

beobachtet (siehe Abbildung 3.2). Für die H<strong>in</strong>tergrundverteilung wird die Zenitverteilung aus e<strong>in</strong>em<br />

bzw. bei<strong>den</strong> Off-Source Bereichen erstellt und normiert. Für die Berechnung wer<strong>den</strong> die Werte für<br />

die Zenitverteilung <strong>in</strong>terpoliert.[11]<br />

Abbildung 3.<strong>2.</strong>: Normierte H<strong>in</strong>tergrundverteilung <strong>in</strong> Zenit. Für die Berechnung des − log L-Wertes<br />

wird die Verteilung <strong>in</strong> Radiant umgerechnet.<br />

Signalmodell<br />

Für das Signalmodell stehen σ 1 , σ 2 und α aus der Rekonstruktion zur Verfügung. Hieraus wird<br />

e<strong>in</strong>e elliptische Gaussverteilung für das Signalmodell angenommen.<br />

S el,i (∆ϕ g , ∆ϑ g , ∆ϕ i , ∆ϑ i ) = Ae −(a(∆ϕi−∆ϕg)2 +2b(∆ϕ i−∆ϕ g)(∆ϑ i−∆ϑ g)+c(∆ϑ i−∆ϑ g) 2 )<br />

A =<br />

1<br />

2πσ 1 σ 2<br />

a = cos2 α<br />

2σ1<br />

2 + s<strong>in</strong>2 α<br />

2σ2<br />

2<br />

b = s<strong>in</strong>(2α)<br />

4σ 2 1<br />

c = s<strong>in</strong>2 α<br />

2σ 2 1<br />

− s<strong>in</strong>(2α)<br />

4σ 2 2<br />

+ cos2 α<br />

2σ 2 2<br />

(3.5)<br />

Als e<strong>in</strong>e Vere<strong>in</strong>fachung dient e<strong>in</strong>e symmetrische Gaussverteilung. Sie sollte <strong>in</strong> guter Näherung<br />

das Signal beschreiben. Daher wird sie auch häufig <strong>in</strong> anderen <strong>IceCube</strong>-Analysen verwendet.<br />

S sym,i (∆ϕ g , ∆ϑ g , ∆ϕ i , ∆ϑ i ) = Ae − (∆ϕ i −∆ϕg )2 +(∆ϑ i −∆ϑg ) 2<br />

2σ 2<br />

σ =<br />

A =<br />

√<br />

σ<br />

2<br />

1 + σ 2 2<br />

1<br />

2πσ 2<br />

2<br />

(3.6)<br />

10 RWTH Aachen


3.3. Cut-Parameter<br />

3.3. Cut-Parameter<br />

Um für e<strong>in</strong>e korrekte Normierung der Signalverteilung zu sorgen, muss e<strong>in</strong> Schnitt auf <strong>den</strong> Fehler<br />

des Paraboloids <strong>durch</strong>geführt wer<strong>den</strong>. Da<strong>durch</strong> wird garantiert, dass bei allen Events die Ausläufer<br />

der Wahrsche<strong>in</strong>lichkeitsverteilung, nach wenigen Grad Abweichung vom Mittelwert, vernachlässigbar<br />

s<strong>in</strong>d. Weiterh<strong>in</strong> ist es aus numerischen Grün<strong>den</strong> notwendig, dass dieser Fehler nicht zu kle<strong>in</strong><br />

wird. Da dieser Schnitt nur sehr wenige Events betrifft, spielt er e<strong>in</strong>e untergeordnete Rolle. Für<br />

das Analyseverfahren des <strong>Mond</strong>schattens, das <strong>in</strong> dieser Arbeit verwendet wird, wur<strong>den</strong> die Cut-<br />

Parameter von Jan Blumenthal bereits zu 0.075 ◦ < σ < 1.5 ◦ bestimmt.[11] σ ist def<strong>in</strong>iert <strong>in</strong> Formel<br />

3.7.<br />

Als Qualitätsmerkmal der Rekonstruktion wird e<strong>in</strong> reduzierter log-Likelihood rlogl angegeben.<br />

Hierbei wird der log-Likelihood der Rekonstruktion <strong>durch</strong> die Anzahl der Freiheitsgrade geteilt.[21]<br />

Die Schnitte wer<strong>den</strong> analog zu <strong>den</strong> rlogl-Cuts aus [11] zu 6.5 < rlogl < 8 entnommen.<br />

3.4. Komplexität<br />

Auch nach <strong>den</strong> Cuts verbleiben etwa 11 Millionen Events für die Berechnung des <strong>Mond</strong>schattens<br />

aus <strong>den</strong> IC59 Daten übrig. Demzufolge besteht die Berechnung der − log L-Funktion aus über<br />

11 Millionen Summan<strong>den</strong>, deren Berechnung jeweils e<strong>in</strong>e Berechnung der Signalverteilung und<br />

der H<strong>in</strong>tergrundverteilung be<strong>in</strong>haltet. Um die − log L-Funktion für n s zu m<strong>in</strong>imieren, muss die<br />

− log L-Funktion an mehreren Stellen ausgewertet wer<strong>den</strong> und somit die enorm große Summe<br />

berechnet wer<strong>den</strong>. Die Anzahl der Funktionsaufrufe hängt von dem M<strong>in</strong>imierungsbereich, dem<br />

M<strong>in</strong>imierungsverfahren, der Toleranz und der Position des M<strong>in</strong>imums ab. Doch auch im besten<br />

Fall müssen etwa 20 Funktionsaufrufe <strong>durch</strong>geführt wer<strong>den</strong>.<br />

Dieser Rechenaufwand, der auf e<strong>in</strong>er 64 Bit CPU mit 3 GHz etwa 20 M<strong>in</strong>uten dauert, muss für<br />

je<strong>den</strong> Gridpunkt aufgewendet wer<strong>den</strong>, um die resultieren<strong>den</strong> Landschaften zu erhalten. Um nun<br />

fe<strong>in</strong>e Auflösungen zu erhalten, benötigt man e<strong>in</strong>e alternative Methode, um <strong>den</strong> Rechenaufwand<br />

möglichst schnell zu bewältigen. Daher wird <strong>in</strong> dieser Arbeit e<strong>in</strong> Graphik-Prozessor (GPU) zur<br />

Berechnung e<strong>in</strong>gesetzt. Dieser soll im folgen<strong>den</strong> Kapitel beschrieben und dessen Verwendung bei<br />

der Analyse erklärt wer<strong>den</strong>.<br />

René Reimann 11


Berechnungen mit Graphik Prozessoren (GPU)<br />

4. Berechnungen mit Graphik Prozessoren<br />

(GPU)<br />

4.1. Motivation<br />

Graphik-Prozessoren (GPU) wur<strong>den</strong> für Videospiele konzipiert. Bei <strong>den</strong> modernen Spielen soll die<br />

Landschaft möglichst realistisch dargestellt wer<strong>den</strong>. Sie wird aus e<strong>in</strong>er großen Anzahl von Pologonen<br />

zusammengesetzt, deren Oberflächen mit vielen unterschiedlichen Texturen belegt wer<strong>den</strong>. Um die<br />

Informationen über die Pologonen und Texturen schnell zu verwen<strong>den</strong>, ist e<strong>in</strong> schneller Speicher<br />

und schnelle Prozessoren nötig.<br />

Da für jedes Pixel des Bildes die Informationen benötigt wer<strong>den</strong> und die Berechnung weitgehend<br />

unabhängig ist, sollten die e<strong>in</strong>zelnen Berechnungen möglichst parallel <strong>durch</strong>geführt wer<strong>den</strong>.<br />

Graphikkarten erfüllen die Herausforderung der Parallelität und des schnellen Speichers. Daraus<br />

entsteht e<strong>in</strong>e enorme Beschleunigung bei bestimmten Berechnungen, wie <strong>in</strong> Abbildung 4.1 zu sehen<br />

ist. CUDA ist e<strong>in</strong>e spezielle Sprache, die nur auf NVIDIA-Graphikkarten läuft und Hardwareoptimiert<br />

ist. Es ist zu beachten, dass „OpenGL“ hier für die Verwendung der Programmiersprache<br />

GLSL steht, die für graphische Nutzung entwickelt wurde, und nicht für die mit CUDA konkurrierende<br />

mächtigere GPGPU-Programmiersprache OpenCL.<br />

Abbildung 4.1.: Vergleich von Berechnungsgeschw<strong>in</strong>digkeit zwischen e<strong>in</strong>er CPU und e<strong>in</strong>er GPU<br />

unter Verwendung der Programmiersprachen CUDA und OpenGL (GLSL) am<br />

Beispiel e<strong>in</strong>es Scan-Algorithmus. Die verwendete GPU ist e<strong>in</strong>e GeForce 8800 GTX<br />

und die verwendete CPU ist e<strong>in</strong> Intel Core2-Duo Extreme <strong>2.</strong>93 GHz. [29]<br />

Zudem entwickeln sich die Videospiele immer schneller weiter, so dass e<strong>in</strong> ständiger Entwicklungsprozess<br />

stattf<strong>in</strong>det. Da Videospiele <strong>in</strong>zwischen Massenprodukte s<strong>in</strong>d, wer<strong>den</strong> auch Graphikkarten<br />

<strong>in</strong> Massen von der Industrie hergestellt. Hierbei kommt es zwar zu kle<strong>in</strong>en Produktionsfehlern,<br />

diese wer<strong>den</strong> aber oft <strong>in</strong> Kauf genommen, da <strong>in</strong> e<strong>in</strong>em Spiel die w<strong>in</strong>zigen resultieren<strong>den</strong> Fehler<br />

kaum auffallen. Da<strong>durch</strong> ist e<strong>in</strong>e GPU preiswert <strong>in</strong> der Anschaffung.[30]<br />

12 RWTH Aachen


4.<strong>2.</strong> Funktion<br />

Seit e<strong>in</strong>igen Jahren wer<strong>den</strong> Graphikkarten auch außerhalb ihres ursprünglichen Verwendungszwecks<br />

e<strong>in</strong>gesetzt. Aufgrund des schnellen Speichers und der hohen Parallelität, die sie bieten, s<strong>in</strong>d<br />

sie für Teile rechenaufwändiger Programme oder Berechnungen von großem Nutzen.<br />

4.<strong>2.</strong> Funktion<br />

In dieser Arbeit wird die von der Firma NVIDIA entwickelte Sprache CUDA benutzt, um die<br />

Berechnungen zur <strong>Mond</strong>schattenanalyse auf e<strong>in</strong>er GPU <strong>durch</strong>zuführen. CUDA ist e<strong>in</strong>e Erweiterung<br />

der Programmiersprache C. Die Strukturen und Begriffe s<strong>in</strong>d teilweise CUDA-spezifisch, lassen sich<br />

jedoch meist auch auf andere Sprachen übertragen.<br />

E<strong>in</strong> Programm, das auf der GPU ausgeführt wird, wird Kernel genannt. E<strong>in</strong> Kernel erzeugt<br />

e<strong>in</strong> Grid von Threads, die <strong>den</strong> Programmcode des Kernels parallel <strong>durch</strong>laufen. Threads s<strong>in</strong>d <strong>in</strong><br />

Blöcken organisiert. In e<strong>in</strong>em Block ist es möglich, Daten zwischen Threads auszutauschen. E<strong>in</strong><br />

Block kann bis zu drei Dimensionen haben, das heißt, dass die Threads <strong>in</strong> e<strong>in</strong>em Block drei Indize<br />

bekommen, <strong>durch</strong> die sie im Programmcode unterschie<strong>den</strong> wer<strong>den</strong> können. Diese Dimensionen<br />

können bei der Programmierung festgelegt wer<strong>den</strong> und an das entsprechende Problem angepasst<br />

wer<strong>den</strong>.<br />

Auch Blöcke haben zwei Indize, um im Programmcode unterschie<strong>den</strong> zu wer<strong>den</strong> (siehe Abbildung<br />

4.2 l<strong>in</strong>ks). Diese Indize können über BlockIdx und ThreadIdx abgerufen wer<strong>den</strong>.<br />

Die Anzahl der Blöcke, die parallel ausgeführt wer<strong>den</strong>, hängt von der Anzahl der Kerne der<br />

verwendeten Graphikkarte ab. Jedoch muss dies nicht bei der Programmierung berücksichtigt<br />

wer<strong>den</strong>, da die GPU die Aufrufe selbst übernimmt. Hierbei gibt es ke<strong>in</strong>e festgelegte Reihenfolge.<br />

Folglich kann es se<strong>in</strong>, dass Programme auf unterschiedlichen Graphikarten unterschiedlich schnell<br />

laufen (siehe Abbildeung 4.2 rechts).<br />

Abbildung 4.<strong>2.</strong>: L<strong>in</strong>ks: Organisation von Threads und Blocks auf e<strong>in</strong>em Grid.[31] Rechts: Aufrufe<br />

von Blöcken <strong>in</strong> unterschiedlichen Masch<strong>in</strong>en.[32]<br />

Jeder Thread hat e<strong>in</strong>en kle<strong>in</strong>en Speicher für lokale Variablen. Dieser Speicher ist <strong>in</strong> der Graphikkarte<br />

dicht an <strong>den</strong> Prozessor gebaut, um e<strong>in</strong>en schnellen Zugriff zu erlauben. Zudem gibt es<br />

René Reimann 13


Berechnungen mit Graphik Prozessoren (GPU)<br />

pro Block e<strong>in</strong>en begrenzten Shared Memory, um Daten zwischen Threads auszutauschen. Threads<br />

können nicht ohne weiteres Daten mit Threads <strong>in</strong> anderen Blöcken austauschen.<br />

Um Daten für alle Threads zugänglich zu machen, gibt es <strong>den</strong> Global Memory. Das Lesen oder<br />

Schreiben von Daten auf <strong>den</strong> Global Memory dauert jedoch etwa 200 mal so lange wie der Zugriff<br />

auf Shared oder Local Memory. Zudem gibt es extra Textur und Constant Memory, von <strong>den</strong>en<br />

die Daten nur gelesen wer<strong>den</strong> können. Dabei handelt es sich jedoch nur um e<strong>in</strong>e andere Methode<br />

Global Memory anzusprechen. Da diese Speicher speziell für viele gleichzeitige Zugriffe konzipiert<br />

wur<strong>den</strong>, gibt es ke<strong>in</strong>e Kollisionen, wenn mehrere Threads gleichzeitig auf die Daten zugreifen (siehe<br />

Abbildung 4.3).<br />

Abbildung 4.3.: Struktur des Speichers <strong>in</strong> e<strong>in</strong>er GPU.[31]<br />

Ist es notwendig, z.B. beim Austausch von Daten über <strong>den</strong> Shared Memory, dass an e<strong>in</strong>er bestimmten<br />

Stelle des Programms alle Threads <strong>in</strong> e<strong>in</strong>em Block die gleiche Stelle erreicht haben, so<br />

kann dies <strong>durch</strong> <strong>den</strong> CUDA Befehl __syncthreads erzwungen wer<strong>den</strong>.<br />

Um die Daten und die Ergebnisse zwischen GPU und CPU auszutauschen, benötigt man e<strong>in</strong> C-<br />

oder C++-Programm (CUDA Toolkit 3.2 mit Shader Model <strong>2.</strong>0), das diese Aufgabe übernimmt.<br />

In CUDA wird die CPU immer als „host“ und die GPU als „device“ bezeichnet. Die CPU kann<br />

mit <strong>den</strong> CUDA Befehlen cudaMalloc(), cudaMemcpy() und cudaFree() Speicher auf dem device<br />

reservieren, zwischen device und host kopieren und auf dem device wieder freigeben. Der Aufruf<br />

der Kernels geschieht mit der CUDA-Syntax KernelName >() vom<br />

host aus (siehe Abbildung 4.4).<br />

Der Kernel muss mit dem Prefix __global__ ausgestattet wer<strong>den</strong>, um vom host aus aufgerufen<br />

wer<strong>den</strong> zu können. Wer<strong>den</strong> im Kernel Unterfunktionen verwendet, müssen diese mit __device__<br />

deklariert wer<strong>den</strong>. Funktionen auf dem host sollten mit __host__ versehen wer<strong>den</strong>. Dies ist jedoch<br />

nicht zw<strong>in</strong>gend notwendig, da dies der Default-Wert ist.<br />

4.3. CUDA-Masch<strong>in</strong>e<br />

Für diese Thesis wurde die CUDA-Masch<strong>in</strong>e im Rechnerraum des Physikzentrums der RWTH<br />

Aachen benutzt. Dieser Rechner ist mit drei baugleichen GeForce GTX 480 (GPUs) von Po<strong>in</strong>t of<br />

View [33] ausgestattet. Bei der CPU handelt es sich um e<strong>in</strong>en Intel Core i7-980X EE, betrieben<br />

bei 3,59GHz. Die CPU besitzt sechs Kerne und unterstützt zusätzlich HyperThread<strong>in</strong>g, so dass<br />

14 RWTH Aachen


4.4. GPU-Strategie<br />

Abbildung 4.4.: Skizze zur Kommunikation zwischen CPU und GPU.[30]<br />

<strong>in</strong>sgesammt zwölf virtuelle Kerne zur Verfügung stehen. Zur Analyse wurde immer nur e<strong>in</strong>e GPU<br />

verwendet.<br />

4.4. GPU-Strategie<br />

In diesem wie auch <strong>in</strong> <strong>den</strong> folgen<strong>den</strong> Abschnitten ist mit Grid, so lange nicht explizit anders<br />

angegeben, immer das Grid zur Berechnung der − log L-Funktion, wie <strong>in</strong> Abbildung 3.1 dargestellt,<br />

geme<strong>in</strong>t.<br />

E<strong>in</strong>e zentrale Bedeutung bei e<strong>in</strong>er schnellen, jedoch sorgfältigen Analyse spielt der E<strong>in</strong>satz der<br />

GPU-Rechenleistung. Hierzu ist es wichtig, <strong>den</strong> „bottleneck“, also die Schwachstelle der Hardware<br />

zu kennen und die Vorteile der GPU auszunutzen.<br />

Die Analyse besteht aus mehreren Teilen. Zuerst müssen die Daten e<strong>in</strong>gelesen wer<strong>den</strong>, anschließend<br />

muss für je<strong>den</strong> Gridpunkt die M<strong>in</strong>imierung der − log L-Funktion erfolgen und schließlich muss<br />

das Gesamtergebnis gespeichert und dargestellt wer<strong>den</strong>. Da die GPU weder Daten selbstständig<br />

e<strong>in</strong>lesen noch auslesen kann, müssen diese Schritte von der CPU bewältigt wer<strong>den</strong>.<br />

Für die Berechnung der n s -M<strong>in</strong>ima jedes Gridpunktes gibt es nun verschie<strong>den</strong>e Möglichkeiten,<br />

um die Parallelität der GPU auszunutzen.<br />

1. Da die Berechnung der − log L-Funktion aufgrund der enormen Summe über Events sehr<br />

lange dauert und e<strong>in</strong>zelne Teilsummen gleichzeitig <strong>durch</strong>geführt wer<strong>den</strong> können, kann jeder<br />

Thread e<strong>in</strong>e Teilsumme berechnen und anschließend die Gesamtsumme gebildet wer<strong>den</strong>.<br />

Hier<strong>durch</strong> wird die Zeit der Berechnung e<strong>in</strong>es Funktionsaufruf deutlich verkle<strong>in</strong>ert. Jedoch<br />

muss die M<strong>in</strong>imierung auf <strong>den</strong> e<strong>in</strong>zelnen Gridpunkten sequenziell erfolgen.<br />

Somit wird die M<strong>in</strong>imierung von der CPU <strong>durch</strong>geführt und die GPU berechnet ausschließlich<br />

− log L-Werte.<br />

<strong>2.</strong> Für je<strong>den</strong> Gridpunkt ist die M<strong>in</strong>imierung unabhängig von anderen Gridpunkten. Für viele<br />

Gridpunkte ist es daher s<strong>in</strong>nvoll, dass jeder Thread für sich e<strong>in</strong>e M<strong>in</strong>imierung <strong>durch</strong>führt und<br />

dabei die nötigen Funktionsaufrufe auch alle<strong>in</strong>e berechnet. Da die GPU aufgrund ihrer Speicherverwaltung<br />

dafür gemacht ist, dass viele Threads gleichzeitig auf Daten zugreifen, wird es<br />

hier, bei geeigneter Programmierung, ke<strong>in</strong>e Kollisionen oder Geschw<strong>in</strong>digkeitse<strong>in</strong>bußen beim<br />

Funktionsaufruf geben.<br />

Daher führt jeder Thread sowohl − log L-Berechnung als auch M<strong>in</strong>imierung <strong>durch</strong>. Die CPU<br />

wird für diese Strategie kaum benötigt.<br />

René Reimann 15


Berechnungen mit Graphik Prozessoren (GPU)<br />

3. Bei e<strong>in</strong>er kle<strong>in</strong>en Anzahl von Punkten gibt es zudem die Möglichkeit, beide zuvor beschriebenen<br />

Strategien zu komb<strong>in</strong>ieren. Da Threads <strong>in</strong>nerhalb e<strong>in</strong>es Blocks über <strong>den</strong> shared-Memory<br />

kommunizieren können, ist es möglich die M<strong>in</strong>imierung der − log L-Funktion pro Gridpunkt<br />

auf e<strong>in</strong>em Block <strong>durch</strong>zuführen. Hierbei übernimmt e<strong>in</strong> Thread pro Block die M<strong>in</strong>imierungsrechnungen.<br />

Alle weiteren Threads berechnen bei Funktionsaufrufen Teilsummen der − log L-<br />

Funktion, um somit geme<strong>in</strong>sam schneller die Gesamtsumme zu errechnen.<br />

Folglich macht jeder Block die M<strong>in</strong>imierung und jeder Thread im Block hilft bei der − log L-<br />

Berechnung. Auch hier wird die CPU kaum benötigt.<br />

Strategie 3 bietet gegenüber der zweiten Strategie für h<strong>in</strong>reichend viele Gridpunkte ke<strong>in</strong>en Vorteil,<br />

da e<strong>in</strong>ige Blöcke warten müssten, bis die ersten Blöcke fertig berechnet wur<strong>den</strong>. Weiterh<strong>in</strong> ist die<br />

Strategie 2 speziell für große Summen <strong>in</strong> Funktionsaufrufen geeignet und ist am e<strong>in</strong>fachsten zu<br />

implementieren.<br />

Für diese Arbeit wird Strategie 2 implementiert, da die Analyse mit vielen Gridpunken (16384)<br />

<strong>durch</strong>geführt wird.<br />

Zur Umsetzung wird e<strong>in</strong> C++-Programm mit ROOT-Funktionen erstellt. In diesem Programm<br />

wer<strong>den</strong> die Daten, die im ROOT-Format vorhan<strong>den</strong> s<strong>in</strong>d, zunächst e<strong>in</strong>gelesen und e<strong>in</strong>e H<strong>in</strong>tergrundverteilung<br />

bestimmt. Für die Ereignisse, für die die Qualitätskriterien (siehe Abschnitt 3.3)<br />

erfüllt s<strong>in</strong>d, wer<strong>den</strong> die Daten <strong>in</strong> e<strong>in</strong>em Array gespeichert. Hierbei wer<strong>den</strong> je Event die Werte<br />

δ azimuth , δ zenith (siehe Gleichung <strong>2.</strong>5), der Wert der Background-Verteilung für diese W<strong>in</strong>kel<br />

und die benötigten Fehler auf die Schätzung gespeichert. Von diesem Programm aus wird e<strong>in</strong>e C-<br />

Funktion aufgerufen, die als Schnittstelle dient. Als Parameter dienen die Arrays mit <strong>den</strong> Daten der<br />

Events, sowie e<strong>in</strong>ige Hilfsparameter um die M<strong>in</strong>imierung <strong>durch</strong>zuführen und später die Ergebnisse<br />

zu erhalten.<br />

Die C-Funktion ist der Teil des Programms, der die Schnittstelle zwischen CPU und GPU darstellt.<br />

Ihre Aufgabe ist es, Speicher auf der GPU zu reservieren, die übergebenen Daten auf <strong>den</strong><br />

Speicher <strong>in</strong> der GPU zu kopieren und die Grid- und Blockdimensionen festzulegen. Anschließend<br />

ruft sie <strong>den</strong> Kernel auf, der die Berechnungen auf der GPU <strong>durch</strong>führt. Nach Beendigung des Kernels<br />

wird <strong>in</strong> dieser Funktion das Ergebnis der Berechnung von der GPU auf <strong>den</strong> Hauptspeicher des<br />

Computers zurück kopiert und der Speicher auf der GPU freigegeben.<br />

Damit der Kernel für je<strong>den</strong> Thread e<strong>in</strong>e M<strong>in</strong>imierung auf e<strong>in</strong>em eigenen Gridpunkt ausführen<br />

kann, wird mithilfe der CUDA-Konstanten BlockIdx.x, BlockIdx.y und ThreadIdx.x e<strong>in</strong><br />

e<strong>in</strong>deutiger Index für diesen Thread berechnet. Aus diesem Index wird zum e<strong>in</strong>en <strong>durch</strong> e<strong>in</strong>e ganzzahlige<br />

Division und zum anderen <strong>durch</strong> e<strong>in</strong>e Modulo-Operation die Position des Gridpunktes<br />

berechnet.<br />

Jeder Thread berechnet nun nach dem <strong>in</strong> Abschnitt 4.5 beschriebenen M<strong>in</strong>imierungsverfahren<br />

das n s , für das die − log L-Funktion <strong>den</strong> m<strong>in</strong>imalen Wert, am entsprechen<strong>den</strong> Gridpunkt, annimmt.<br />

Beim Funktionsaufruf wird e<strong>in</strong>e __device__-Funktion aufgerufen, die die Berechnung der − log L-<br />

Funktion auf dem Thread <strong>durch</strong>führt.<br />

Der n s -Wert und der Wert der − log L-Funktion am Ort des M<strong>in</strong>imums sowie die Anzahl der<br />

Iterationen wer<strong>den</strong> <strong>in</strong> je e<strong>in</strong>em Array im Global Memory der GPU gespeichert. Die Position im<br />

Array, an der die Daten gespeichert wer<strong>den</strong>, entspricht dem e<strong>in</strong>maligen Index, <strong>den</strong> jeder Thread<br />

besitzt. Durch <strong>den</strong> CUDA-Funktionsaufruf __syncthreads() wird die Berechnung e<strong>in</strong>es Blocks<br />

erst weiter fortgesetzt, wenn alle Threads fertig berechnet wur<strong>den</strong>. Da die Anzahl der Iterationen<br />

annähernd gleich groß se<strong>in</strong> sollte, wird an dieser Stelle kaum Zeit verloren.<br />

Die Ergebnisse wer<strong>den</strong> an die C-Funktion zurückgegeben und von dort aus weiter an das Hauptprogramm.<br />

Hier können die Ergebnisse aus <strong>den</strong> Arrays aufgrund ihres Indexes an die korrekten<br />

Stellen <strong>in</strong> Histogramme geschrieben und <strong>in</strong> Dateien gespeichert wer<strong>den</strong>.<br />

Die resultieren<strong>den</strong> Ergebnisse können anschließend e<strong>in</strong>er weiteren Analyse unterzogen und graphisch<br />

dargestellt wer<strong>den</strong>.<br />

Das Programm, sowie der CPU- und GPU-E<strong>in</strong>satz, ist schematisch <strong>in</strong> Abbildung 4.5 dargestellt.<br />

Der Programm-Code ist unter http://code.icecube.wisc.edu/svn/sandbox/reimann/ verfügbar.<br />

16 RWTH Aachen


4.5. M<strong>in</strong>imierungsverfahren<br />

Abbildung 4.5.: Schematischer Programmaufbau. Der E<strong>in</strong>satz von CPU und GPU ist zu sehen und<br />

<strong>durch</strong> die rote L<strong>in</strong>ie getrennt. Die grauen Kästchen stellen die Unterprogramme<br />

dar.<br />

4.5. M<strong>in</strong>imierungsverfahren<br />

Um <strong>den</strong> besten Schätzer für n s zu bekommen, muss die − log L-Funktion <strong>in</strong> Bezug auf n s an <strong>den</strong><br />

jeweiligen Gridpunkten m<strong>in</strong>imiert wer<strong>den</strong>. Für die Berechnung des M<strong>in</strong>imums muss e<strong>in</strong> M<strong>in</strong>imierungsalgorithmus<br />

verwendet wer<strong>den</strong>. Das Verfahren ist e<strong>in</strong> erweiterter Brent-Algorithmus und wird<br />

im Folgen<strong>den</strong> vorgestellt.<br />

Die − log L-Funktion ist aufgrund der endlichen Summe über die Events e<strong>in</strong>e diskrete und sehr<br />

komplizierte Funktion, somit kann für diese ke<strong>in</strong>e e<strong>in</strong>fache analytische Ableitung bestimmt wer<strong>den</strong>.<br />

Aus diesem Grund muss e<strong>in</strong> M<strong>in</strong>imierungsalgorithmus verwendet wer<strong>den</strong>, der ohne Ableitungen<br />

auskommt.<br />

Das grundlegende Pr<strong>in</strong>zip aller Algorithmen, die hier behandelt wer<strong>den</strong>, beruht auf dem gleichen<br />

Verfahren (siehe Abbildung 4.6). Es wer<strong>den</strong> die obere und untere Grenze der M<strong>in</strong>imierung, sowie<br />

e<strong>in</strong> weiterer dritter Punkt <strong>in</strong> dem M<strong>in</strong>imierungs<strong>in</strong>tervall gegeben. Die Grenzen sollten das M<strong>in</strong>imum<br />

umschließen, sonst wird der Algorithmus auf e<strong>in</strong>e der Grenzen konvergieren. Die Funktion muss<br />

zunächst nur an dem dritten Punkt ausgewertet wer<strong>den</strong>. Je nach M<strong>in</strong>imierungsverfahren (siehe<br />

die folgen<strong>den</strong> Abschnitte) wird e<strong>in</strong> vierter Punkt im Intervall gewählt und an diesem Punkt die<br />

Funktion ausgewertet.<br />

Nun kann entschie<strong>den</strong> wer<strong>den</strong>, <strong>in</strong> welchem Bereich das M<strong>in</strong>imum liegen kann, bzw. <strong>in</strong> welchem<br />

Bereich es nicht liegt. Hierbei gibt es genau 24 Möglichkeiten. Bei jeder dieser Möglichkeiten kann<br />

e<strong>in</strong>e der Grenzen verschoben wer<strong>den</strong>, sodass sich der Wertebereich verkle<strong>in</strong>ert. Wenn A, B, C, D<br />

die Funktionswerte für die n s -Werte mit a < b < c < d s<strong>in</strong>d, kann bei A > B < C < D somit c<br />

als obere Grenze gewählt wer<strong>den</strong>. Für <strong>den</strong> Fall, das A < B < C > D kann b oder c <strong>durch</strong> a bzw.<br />

d ersetzt wer<strong>den</strong>.<br />

Nun kann e<strong>in</strong> neuer vierter Punkt gewählt wer<strong>den</strong>, um <strong>den</strong> Bereich weiter zu verkle<strong>in</strong>ern. Dieses<br />

Verfahren wird so oft wiederholt, bis e<strong>in</strong>e vorgegebene Breite, auch Toleranz genannt, des<br />

Wertebereiches erreicht ist. Als Schätzung für das M<strong>in</strong>imum wird die Stelle mit dem kle<strong>in</strong>sten<br />

Funktionswert gewählt.<br />

René Reimann 17


Berechnungen mit Graphik Prozessoren (GPU)<br />

Abbildung 4.6.: Schema zur Verdeutlichung des M<strong>in</strong>imierungsalgorithmus. In diesem Fall wird die<br />

Obergrenze im nächsten Iterationsschritt als c gewählt.<br />

Die Wahl des vierten Punktes hat entschei<strong>den</strong>e Bedeutung für das Konvergenzverhalten bzw.<br />

für die Konvergenzgeschw<strong>in</strong>digkeit.<br />

Bei der Methode „gol<strong>den</strong> section“ wird der vierte Punkt im Verhältnis des Gol<strong>den</strong>en Schnittes<br />

im größeren der bei<strong>den</strong> Bereiche gewählt. Der gol<strong>den</strong>e Schnitt ist die positive Lösung der Gleichung<br />

Φ 2 − Φ − 1 = 0. Der Wert ist 1+√ 5<br />

2<br />

≈ 1.618. Das Verhältnis des gol<strong>den</strong>en Schnitts wird vom<br />

Menschen als harmonisch empfun<strong>den</strong> und wird daher schon seit der Antike <strong>in</strong> Musik und Kunst<br />

verwendet. Das Verhältnis ist auch <strong>in</strong> der Biologie oft zu f<strong>in</strong><strong>den</strong> und hat zahlreiche <strong>in</strong>teressante<br />

mathematische Eigenschaften, auf die hier nicht näher e<strong>in</strong>gegangen wer<strong>den</strong> kann. Dieses M<strong>in</strong>imierungsverfahren<br />

hat e<strong>in</strong> l<strong>in</strong>eares Konvergenzverhalten. Durch das Verhältnis des Gol<strong>den</strong>en Schnittes<br />

wird die Effizienz der M<strong>in</strong>imierung optimiert.[24]<br />

E<strong>in</strong>e weitere Methode ist die Parabel-Interpolation. Hierbei wird davon ausgegangen, dass e<strong>in</strong>e<br />

Funktion <strong>in</strong> der Nähe des M<strong>in</strong>imums immer <strong>durch</strong> e<strong>in</strong>e Funktion zweiten Grades approximiert<br />

wer<strong>den</strong> kann. Dies ist für h<strong>in</strong>reichend glatte Funktionen der Fall. E<strong>in</strong>e Parabel ist <strong>durch</strong> drei<br />

Wertepaare festgelegt. Als vierter Punkt wird nun der Scheitelpunkt der Parabel gewählt. Dies<br />

kann zu e<strong>in</strong>em sehr schnellen Konvergenzverhalten führen, wenn die Funktion wirklich annähernd<br />

parabelförmig ist. Jedoch kann es auch zu sehr kle<strong>in</strong>en Schrittweiten und zu Extrapolationen, also<br />

berechneten Punkten außerhalb der Grenzen, kommen.<br />

Brent hat 1972 diese bei<strong>den</strong> Verfahren zu e<strong>in</strong>em optimierten Verfahren vere<strong>in</strong>t.[25] Hierbei wird<br />

für die ersten Schritte die „gol<strong>den</strong> section“ Methode benutzt. Im Weiteren wird jedes Mal der<br />

Scheitelpunkt der Parabel berechnet. Br<strong>in</strong>gt dieses Verfahren e<strong>in</strong>e schnellere Konvergenz, also<br />

angemessene Schrittweiten, im Gegensatz zu dem „gol<strong>den</strong> section“-Verfahren, wird die Parabel<strong>in</strong>terpolation<br />

vorgezogen.<br />

Wie bereits von N. Ghosh und W. W. Hager beschrieben, kommt es beim Brent-Algorithmus<br />

zu numerischen Instabilitäten, wenn die Abbruchstoleranz zu kle<strong>in</strong> gewählt wurde.[26] Dies wurde<br />

auch <strong>in</strong> dieser Arbeit beobachtet (siehe Abschnitt 5.1). Daher wird e<strong>in</strong>e Erweiterung des Brent-<br />

Algorithmus verwendet. Sie besteht auf der Grundlage der GSL-Funktion quad_gol<strong>den</strong>, <strong>in</strong> der<br />

e<strong>in</strong>e sichere Schrittweite verwendet wird. Das bedeutet, dass im Zweifelsfall die Schrittweite der<br />

vorherigen Iteration verwendet wird. [27] [28]<br />

Um die Berechnung des M<strong>in</strong>imums mit möglichst wenigen Funktionsaufrufen zu berechnen, muss<br />

e<strong>in</strong> angemessener Wertebereich sowie e<strong>in</strong>e realistische Toleranz angegeben wer<strong>den</strong>. Hierbei muss be-<br />

18 RWTH Aachen


4.5. M<strong>in</strong>imierungsverfahren<br />

achtet wer<strong>den</strong>, dass der Wertebereich das M<strong>in</strong>imum umschließen muss, und dass die Toleranz kle<strong>in</strong><br />

genug se<strong>in</strong> muss, um die physikalische Bedeutung nicht zu verfälschen. In der − log L-Landschaft<br />

sollte es aufgrund der Toleranz ke<strong>in</strong>e größeren Abweichungen als 0.5 zum wahren Wert geben. Da<br />

die − log L-Landschaft e<strong>in</strong>e Funktion von n s ist, kann die Abbruchbed<strong>in</strong>gung <strong>in</strong> bei<strong>den</strong> Variablen<br />

verfasst wer<strong>den</strong>. Da jedoch die − log L-Landschaft ke<strong>in</strong>en physikalischen Inhalt trägt, wird die<br />

Abbruchbed<strong>in</strong>gung auf <strong>den</strong> n s -Bereich gewählt. E<strong>in</strong>e genauere Studie zur Toleranzgröße wird <strong>in</strong><br />

Abschnitt 5.1 <strong>durch</strong>geführt.<br />

René Reimann 19


Test des Verfahrens<br />

5. Test des Verfahrens<br />

In diesem Kapitel soll das Verfahren anhand se<strong>in</strong>er Ergebnisse getestet wer<strong>den</strong>. Die direkten Ergebnisse<br />

s<strong>in</strong>d die Landschaften, die sich <strong>durch</strong> Berechnung der m<strong>in</strong>imalen n s und der − log L-Werte<br />

jedes e<strong>in</strong>zelnen Gridpunktes, wie <strong>in</strong> Abbildung 3.1 dargestellt, ergeben.<br />

5.1. Genauigkeit des Verfahrens<br />

„s<strong>in</strong>gle precision“ vs. „double precision“<br />

GPUs s<strong>in</strong>d darauf spezialisiert möglichst schnell viele Pixel, beispielsweise für e<strong>in</strong> Computerspiel,<br />

zu berechnen. Hierbei kommt es nicht auf die e<strong>in</strong>wandfreie Berechnung an, da die Pixel nach kurzer<br />

Zeit wieder überschrieben wer<strong>den</strong>. Weiterh<strong>in</strong> s<strong>in</strong>d diese Berechnungen nur auf „s<strong>in</strong>gle precision“<br />

Berechnungen optimiert. E<strong>in</strong>e „double precision float<strong>in</strong>g po<strong>in</strong>t“ Berechnung benötigt wesentlich<br />

mehr Zeit.<br />

Um zu prüfen, ob e<strong>in</strong>e „float<strong>in</strong>g po<strong>in</strong>t“ Berechnung ausreichend ist, wird die Analyse sowohl<br />

mit „float<strong>in</strong>g po<strong>in</strong>t“ als auch mit „double precision float<strong>in</strong>g po<strong>in</strong>t“ berechnet. Hierbei wurde e<strong>in</strong>e<br />

symmetrische Gaussverteilung als Signal und als Daten die On-Source Region gewählt.<br />

Die resultieren<strong>den</strong> n s -Landschaften s<strong>in</strong>d <strong>in</strong> Abbildung 5.1 zu sehen. Auf der oberen Hälfte von 5.1<br />

sieht man das Ergebnis der „float<strong>in</strong>g po<strong>in</strong>t“ Analyse. In <strong>den</strong> beispielhaft e<strong>in</strong>gekreisten Bereichen<br />

s<strong>in</strong>d klare unstetige Gridpunkte zu erkennen. Dies darf aufgrund der Korrelation benachbarter<br />

Gridpunkte nicht der Fall se<strong>in</strong> und ist auf der unteren Hälfte von 5.1 auch nicht zu sehen.<br />

Diese unstetigen Gridpunkte entstehen aufgrund der großen − log L-Werte, die sich jedoch nur<br />

<strong>in</strong> letzten Ziffern unterschei<strong>den</strong>. E<strong>in</strong> „s<strong>in</strong>gle precision“-Wert hat etwa sieben signifikante Ziffern,<br />

e<strong>in</strong> „double precision“-Wert h<strong>in</strong>gegen 16. Somit muss für e<strong>in</strong>e korrekte Berechnung − log L-Werte<br />

und deren Werte im M<strong>in</strong>imierungsalgorithmus als „double precision“ berechnet und gespeichert<br />

wer<strong>den</strong>.<br />

Test des M<strong>in</strong>imierungsalgorithmus<br />

Um die korrekte Berechnung des M<strong>in</strong>imums <strong>durch</strong> <strong>den</strong> Brent-Algorithmus zu untersuchen, wird<br />

die Analyse für mehrere Toleranzen auf n s <strong>durch</strong>geführt, da der Brent-Algorithmus selbst von<br />

der Toleranz abhängt. Die Differenz der resultieren<strong>den</strong> n s -Landschaften sollte bei e<strong>in</strong>em korrekten<br />

Verhalten <strong>in</strong> der Größenordnung der größeren Toleranz liegen, da für diese die Berechnung mit<br />

kle<strong>in</strong>erer Toleranz annähernd als Wahrheit angesehen wer<strong>den</strong> kann.<br />

Beispielhaft ist die Differenz der n s - Landschaften mit e<strong>in</strong>er Toleranz von 0.1 und 1 <strong>in</strong> Abbildung<br />

5.2 zu sehen. Auf der l<strong>in</strong>ken Seite <strong>in</strong> Abbildung 5.2 ist die Absolutdifferenz der n s -Landschaften<br />

zu erkennen. Die Differenzen s<strong>in</strong>d auf der rechten Seite <strong>in</strong> e<strong>in</strong>em Histogramm e<strong>in</strong>getragen. Weiter<br />

Differenz-Landschaften bef<strong>in</strong><strong>den</strong> sich im Anhang unter A.1.4.<br />

Die Differenzen <strong>in</strong> der n s - Landschaft s<strong>in</strong>d deutlich größer als O(1). Daher wird die Berechnung<br />

mit e<strong>in</strong>er Erweiterung des Brent-Algorithmus, wie <strong>in</strong> Abbschnitt 4.5 beschrieben, <strong>durch</strong>geführt.<br />

Mit diesem Algorithmus erhalten wir für die Absolutdifferenz der n s -Landschaften für Toleranzen<br />

von 0.1 und 1 die <strong>in</strong> Abbildung 5.3 zusehende Verteilung. Die weiteren Landschaften bef<strong>in</strong><strong>den</strong> sich<br />

im Anhang A.<strong>2.</strong>6.<br />

Die maximalen Differenzen s<strong>in</strong>d <strong>in</strong> diesem Fall wesentlich kle<strong>in</strong>er und liegen <strong>in</strong> e<strong>in</strong>er akzeptablen<br />

Größenordnung. Daher wird für die folgen<strong>den</strong> Analysen immer der erweiterte Brent-Algorithmus<br />

verwendet.<br />

Da der wahre Wert für das M<strong>in</strong>imum unbekannt ist und die Differenz der n s -Landschaften größer<br />

e<strong>in</strong>s ist, kann hier e<strong>in</strong>e Quelle für e<strong>in</strong>en systematischen Fehler se<strong>in</strong>.<br />

20 RWTH Aachen


5.1. Genauigkeit des Verfahrens<br />

Abbildung 5.1.: n s - Landkarte für e<strong>in</strong>e float<strong>in</strong>g po<strong>in</strong>t Berechnung (oben) und e<strong>in</strong>e double precision<br />

Berechnung (unten). Beispielhaft s<strong>in</strong>d Bereiche mit unstetigen Gridpunktübergängen<br />

gezeigt.<br />

Spektrum der n s -Verteilung<br />

Um zu überprüfen, ob nur bestimmte diskrete Werte für n s bevorzugt wer<strong>den</strong>, wer<strong>den</strong> die n s -Werte<br />

aus der n s -Landkarte <strong>in</strong> e<strong>in</strong> Histogramm e<strong>in</strong>getragen. Dieses Histogramm ist <strong>in</strong> Abbildung 5.4 für<br />

e<strong>in</strong>e Analyse mit symmetrischer Gaussverteilung und e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s dargestellt.<br />

Es ergibt sich e<strong>in</strong> Spektrum mit vielen schmalen Peaks. Die breiten Peaks <strong>in</strong> dieser Verteilung<br />

stammen von Plateaus fast konstanter n s -Werte <strong>in</strong> der n s -Landschaft und s<strong>in</strong>d ke<strong>in</strong> H<strong>in</strong>weis auf<br />

e<strong>in</strong> Fehlverhalten des M<strong>in</strong>imierungsalgorithmus. Es ist e<strong>in</strong>e Korrelation zwischen benachbarten<br />

Gridpunkten zu erkennen. Die Spikes bzw. die sehr scharfe Peaks hängen wahrsche<strong>in</strong>lich mit dem<br />

M<strong>in</strong>imierungsalgorithmus zusammen. Hierbei wer<strong>den</strong> wahrsche<strong>in</strong>lich e<strong>in</strong>zelne Werte aufgrund der<br />

„gol<strong>den</strong> section“ Methode bevorzugt, die jedoch sehr kle<strong>in</strong>e Abstände, etwa 10 <strong>in</strong> n s , haben.<br />

René Reimann 21


Test des Verfahrens<br />

Abbildung 5.<strong>2.</strong>: L<strong>in</strong>ks: Landschaft der absoluten n s Differenzen zwischen e<strong>in</strong>er M<strong>in</strong>imierung mit<br />

e<strong>in</strong>er Toleranz von 0.1 und 1 <strong>in</strong> n s , berechnet mit dem Brent Algorithmus.<br />

Rechts: Die Häufigkeitsverteilung der absoluten Differenzen <strong>in</strong> n s für die bei<strong>den</strong><br />

Toleranzen.<br />

Abbildung 5.3.: L<strong>in</strong>ks: Landschaft der absoluten n s Differenzen zwischen e<strong>in</strong>er M<strong>in</strong>imierung mit e<strong>in</strong>er<br />

Toleranz von 0.1 und 1 <strong>in</strong> n s , berechnet mit dem erweiterten Brentalgorithmus.<br />

Rechts: Die Häufigkeitsverteilung der absoluten Differenzen <strong>in</strong> n s für die bei<strong>den</strong><br />

Toleranzen.<br />

E<strong>in</strong>flüsse <strong>durch</strong> die GPU<br />

Bei der Produktion von GPUs wird der Geschw<strong>in</strong>digkeitsvorteil im Gegensatz zur Präzision bevorzugt.<br />

Deshalb können leicht fehlerhafte Berechnungen <strong>durch</strong>geführt wer<strong>den</strong>. Dies s<strong>in</strong>d meistens<br />

Memory Fehler und somit Hardware abhängig. Um <strong>den</strong> E<strong>in</strong>fluss <strong>durch</strong> die verwendete GPU zu<br />

quantifizieren, wird e<strong>in</strong>e i<strong>den</strong>tische Analyse auf allen drei GPUs, die auf der <strong>in</strong> Abschnitt 4.3<br />

beschriebenen Masch<strong>in</strong>e vorhan<strong>den</strong> s<strong>in</strong>d, <strong>durch</strong>geführt. Damit die Unterschiede sichtbar wer<strong>den</strong>,<br />

wur<strong>den</strong> von <strong>den</strong> Ergebnissen Differenzplots, sowohl <strong>in</strong> der n s - als auch <strong>in</strong> der − log L-Landschaft,<br />

erstellt.<br />

Das Ergebnis dieser Differenzplots ist equivalent zu null. Es gibt an ke<strong>in</strong>em e<strong>in</strong>zigen Gridpunkt<br />

e<strong>in</strong>e Differenz, die nicht null ist. Dies ist für die n s - und die − log L-Landschaft der Fall. Da<br />

aus diesen Landschaften alle weiteren zur Analyse verwendeten Größen berechnet wer<strong>den</strong>, gibt es<br />

22 RWTH Aachen


5.1. Genauigkeit des Verfahrens<br />

Abbildung 5.4.: Häufigkeitsverteilung für absolute n s Werte bei e<strong>in</strong>er M<strong>in</strong>imierung mit e<strong>in</strong>er Toleranz<br />

von 1 <strong>in</strong> n s .<br />

ke<strong>in</strong>en Hardware bed<strong>in</strong>gten E<strong>in</strong>fluss.<br />

Die GPUs der unter 4.3 beschriebenen Masch<strong>in</strong>e s<strong>in</strong>d zum Zeitpunkt der Berechnungen e<strong>in</strong><br />

halbes Jahr alt gewesen. Es ist möglich, dass <strong>durch</strong> <strong>den</strong> Gebrauch der GPUs zu e<strong>in</strong>em späteren<br />

Zeitpunkt doch e<strong>in</strong> Hardware Effekt erkennbar wird.<br />

Toleranz<br />

Die Wahl der Toleranz hat entschei<strong>den</strong><strong>den</strong> E<strong>in</strong>fluss auf die Rechenzeit. Hierbei muss e<strong>in</strong> Kompromiss<br />

zwischen genauer Berechnung und Verschwendung von Rechenzeit gefun<strong>den</strong> wer<strong>den</strong>.<br />

Die Zeit, die für e<strong>in</strong>e Analyse benötigt wird, ist <strong>in</strong> Abhängigkeit von der Toleranz <strong>in</strong> n s <strong>in</strong> Tabelle<br />

5.1 dargestellt.<br />

Tabelle 5.1.: Rechenzeit bei gegebener Toleranz auf n s für e<strong>in</strong>e Analyse mit e<strong>in</strong>er symmetrischen<br />

Gausssignalverteilung.<br />

Toleranz auf n s Rechenzeit <strong>in</strong> m<strong>in</strong><br />

100 45<br />

10 67<br />

1 94<br />

0.1 211<br />

Die Rechenzeit ist vor allem <strong>durch</strong> die Iterationen, die für die M<strong>in</strong>imierung der − log L-Funktion<br />

an e<strong>in</strong>em Gridpunkt benötigt wer<strong>den</strong>, gegeben. Bei e<strong>in</strong>er optimalen Auslastung müssten alle Gridpunkte<br />

gleich viele Iterationen <strong>durch</strong>laufen, um nicht auf andere Berechnungen zu warten.<br />

In Abbildung 5.5 ist e<strong>in</strong>e Landschaft dargestellt, an der man die Anzahl der Iterationen, die für<br />

die M<strong>in</strong>imierung an dem jeweiligen Gridpunkt benötigt wur<strong>den</strong>, ablesen kann.<br />

Auf der l<strong>in</strong>ken Seite von Abbildung 5.5 ist gut zu erkennen, dass die meisten Gridpunkte 19<br />

Iterationen benötigen, und dass die restlichen Gridpunkte mit abweichen<strong>den</strong> Iterationen <strong>in</strong> der<br />

Größenordnung von zwei berechnet wer<strong>den</strong>. Für die Iterationslandschaft bei e<strong>in</strong>er Toleranz von 0.1<br />

<strong>in</strong> n s ist dies nicht der Fall. Die meisten Punkte benötigen etwa 20 Iterationen, jedoch gibt es vere<strong>in</strong>zelt<br />

Punkte, an <strong>den</strong>en 50 Iterationen benötigt wer<strong>den</strong>, um das M<strong>in</strong>imum zu f<strong>in</strong><strong>den</strong>. Dies erklärt<br />

René Reimann 23


Test des Verfahrens<br />

Abbildung 5.5.: Landschaft der Iterationen, die für die M<strong>in</strong>imierung der − log L-Funktion benötigt<br />

wur<strong>den</strong>. L<strong>in</strong>ks: Berechnung mit e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s . Rechts: Berechnung<br />

mit e<strong>in</strong>er Toleranz von 0.1 <strong>in</strong> n s .<br />

die enorme Rechenzeitverlängerung. Obwohl nur wenige Punkte so viele Iterationen <strong>durch</strong>laufen,<br />

müssen jedoch die anderen Threats bei der Berechnung am Ende auf diese warten.<br />

Um nun <strong>den</strong> E<strong>in</strong>fluss der Toleranzen auf die Landschaften selbst zu untersuchen, wurde die<br />

Analyse für Toleranzen von 0.1, 1, 10 und 100 <strong>in</strong> n s <strong>durch</strong>geführt. In Abbildung 5.6 ist die Differenz<br />

der n s -Landschaften für Toleranzen von 1 und 10 <strong>in</strong> n s dargestellt. Weitere Differenzplots s<strong>in</strong>d im<br />

Anhang A.<strong>2.</strong>6 zu sehen.<br />

Abbildung 5.6.: Landschaft der absoluten n s Differenz für M<strong>in</strong>imierungen mit e<strong>in</strong>er Toleranz von<br />

1 und 10 <strong>in</strong> n s .<br />

Da e<strong>in</strong>e Abweichung von 20 <strong>in</strong> n s schon sehr groß ist, muss die Toleranz wesentlich kle<strong>in</strong>er als 10<br />

<strong>in</strong> n s se<strong>in</strong>. Da n s die Anzahl der abgeschatteten Events <strong>durch</strong> <strong>den</strong> <strong>Mond</strong> darstellt, hat diese Größe<br />

e<strong>in</strong>e physikalische Bedeutung und kann theoretisch nur ganzzahlige Werte annehmen. Daher ist<br />

es nicht notwendig n s kle<strong>in</strong>er als mit e<strong>in</strong>er Toleranz von 1 zu berechnen. Hierfür spricht auch der<br />

enorm große Rechenzeitzuwachs von e<strong>in</strong>er Toleranz von 1 zu 0.1 <strong>in</strong> n s . Somit wird für die folgen<strong>den</strong><br />

Auswertungen, soweit nicht anders erwähnt, die Toleranz auf 1 <strong>in</strong> n s gesetzt.<br />

24 RWTH Aachen


5.<strong>2.</strong> Ergebnisse und Vergleich der Analyse<br />

5.<strong>2.</strong> Ergebnisse und Vergleich der Analyse<br />

Zum Test der <strong>Mond</strong>schattenanalyse auf e<strong>in</strong>er GPU sollen die erziehlten Ergebnisse mit <strong>den</strong> Berechnungen<br />

auf e<strong>in</strong>em CPU Cluster verglichen wer<strong>den</strong>. Die Abbildungen und Berechnungen mit CPU<br />

Clustern stammen alle aus [11] von Jan Blumenthal. Alle Landschaften aus <strong>den</strong> GPU Analysen<br />

bef<strong>in</strong><strong>den</strong> sich im Anhang.<br />

Off-Source Bereiche<br />

Zunächst sollen die Off-Source Bereiche untersucht wer<strong>den</strong> und aus <strong>den</strong> Fluktuationen <strong>in</strong> n s e<strong>in</strong><br />

RMS auf die Berechnungen zum <strong>Mond</strong>schatten berechnet wer<strong>den</strong>.<br />

In Abbildung 5.7 s<strong>in</strong>d zunächst die n s Landschaften für e<strong>in</strong>e Berechnung mit e<strong>in</strong>er GPU dargestellt.<br />

Auf <strong>den</strong> ersten Blick ist e<strong>in</strong>e Landschaft mit e<strong>in</strong>em n s um null für Off-Source Region 1 und<br />

2 zu erkennen. Hierbei ist zu beachten, dass aus Konsistenz mit der On-Source Region die Werte<br />

der Farbskala von 9000 bis -9000 gehen.<br />

Abbildung 5.7.: n s Landschaften von Off-Source 1 (l<strong>in</strong>ks) und Off-Source 2 (rechts) bei e<strong>in</strong>er Toleranz<br />

von 1 <strong>in</strong> n s .<br />

Die zugehörigen − log L-Landschaften s<strong>in</strong>d <strong>in</strong> Abbildung 5.8 dargestellt. Hier s<strong>in</strong>d die Fluktuationen<br />

besser zu erkennen, weil die Farbskala an die m<strong>in</strong>imalen und maximalen Werte angepasst<br />

wurde.<br />

Abbildung 5.8.: − log L-Landschaften von Off-Source 1 (l<strong>in</strong>ks) und Off-Source 2 (rechts) bei e<strong>in</strong>er<br />

Toleranz von 1 <strong>in</strong> n s .<br />

René Reimann 25


Test des Verfahrens<br />

In <strong>den</strong> Histogrammen <strong>in</strong> Abbildung 5.9 wur<strong>den</strong> die berechneten n s Werte aus <strong>den</strong> n s -Landschaften<br />

e<strong>in</strong>getragen. E<strong>in</strong> Grund für die Spikes bzw. die scharfen Peaks <strong>in</strong> der Verteilung wurde bereits <strong>in</strong><br />

Abschnitt 5.1 diskutiert. Für Off-Source Region 1 erkennt man e<strong>in</strong>e Asymmetrie mit e<strong>in</strong>er Verschiebung<br />

zu leicht negativen n s . Dies zeigt auch der Mittelwert an, doch die Werte s<strong>in</strong>d wesentlich<br />

kle<strong>in</strong>er als der RMS von 565. Für Off-Source Region 2 ergibt sich e<strong>in</strong>e symmetrische Verteilung.<br />

Der Mittelwert liegt bei -11 und somit nahe dem erwarteten Wert von null. Der RMS ergibt sich<br />

zu 683. Die Asymmetrie hängt damit zusammen, dass die Werte <strong>in</strong> der zweidimensionalen Landschaft<br />

korreliert s<strong>in</strong>d. Daher wird auch der RMS anstatt e<strong>in</strong>er Gaussfitbreite zur Charakterisierung<br />

verwendet.<br />

Abbildung 5.9.: n s Histogramme von Off-Source 1 (l<strong>in</strong>ks) und Off-Source 2 (rechts) bei e<strong>in</strong>er Toleranz<br />

von 1 <strong>in</strong> n s .<br />

Bei <strong>den</strong> Berechnungen mit CPU Clustern wurde <strong>in</strong> der Off-Source Region 1 e<strong>in</strong> RMS von 565 und<br />

<strong>in</strong> Off-Source Region 2 e<strong>in</strong> RMS von 681. Dies ist e<strong>in</strong> konsistentes Ergebnis. Die fe<strong>in</strong>ere Auflösung<br />

im Histogramm, <strong>durch</strong> die die Asymmetrie sichtbar wird, war mit der Berechnung auf dem CPU<br />

Cluster nicht möglich, weil hierfür zu wenig E<strong>in</strong>träge vorhan<strong>den</strong> waren.<br />

Die Fluktuationen <strong>in</strong> <strong>den</strong> Off-Source Regionen entsprechen auch <strong>den</strong> Fluktuationen auf die<br />

Messung des <strong>Mond</strong>schattens, demzufolge wird e<strong>in</strong> statistischer Fehler von σ stat = 565+683<br />

2<br />

= 624<br />

angenommen.<br />

On-Source n s -Landschaft<br />

Um nun auch die On-Source Regionen zu vergleichen, wer<strong>den</strong> die Landschaften e<strong>in</strong>er GPU und<br />

e<strong>in</strong>er CPU Berechnung gegenüber gestellt. Die n s -Landschaften s<strong>in</strong>d <strong>in</strong> Abbildung 5.10 zu sehen.<br />

Hierbei ist zu beachten, dass die Landschaft auf der l<strong>in</strong>ken Seite von Abbildung 5.10 mit 31 x<br />

31 Gridpunkten berechnet wurde. Die n s Landschaft auf der rechten Seite wurde mit 128 x 128<br />

Gridpunkten erstellt und ist <strong>in</strong> e<strong>in</strong>em e<strong>in</strong>fachen Histogramm dargestellt.<br />

Auf <strong>den</strong> ersten Blick erkennt man kaum e<strong>in</strong>en Unterschied und die Analysen sehen konsistent<br />

aus. Daher wird zur besseren Bewertung die Differenz der Landschaften berechnet. Hierzu wird<br />

auf e<strong>in</strong>em Grid mit e<strong>in</strong>em Gridpunktabstand von 0.0625 ◦ die Differenz berechnet. Für die GPU<br />

Berechnung wird der direkt berechnete Wert verwendet, wobei für die CPU Berechnung der Wert<br />

<strong>in</strong>terpoliert wird. Da der Interpolation am Rand des Grids zu wenig Punkte zur Verfügung stehen,<br />

wird die Differenzlandschaft nicht für die äußeren fünf Reihen betrachtet. Die resultierende<br />

Landschaft ist <strong>in</strong> Abbildung 5.11 dargestellt.<br />

Im zentralen Bereich des <strong>Mond</strong>schattens ist e<strong>in</strong> deutlicher Unterschied von bis zu 250 <strong>in</strong> n s zu<br />

erkennen. Auch gibt es drei Spots, <strong>in</strong> <strong>den</strong>en e<strong>in</strong>e negative Differenz zu erkennen ist. Dies lässt auf<br />

e<strong>in</strong>e <strong>in</strong>konsistente Berechnung im Bereich des <strong>Mond</strong>schattens schließen.<br />

Um <strong>den</strong> Grund der Inkonsistenz zu ermitteln, wird die Landschaft noch e<strong>in</strong>mal <strong>in</strong> der Zenit-<br />

Azimut-Ebene <strong>in</strong> Abbildung 5.12 dargestellt.<br />

26 RWTH Aachen


5.<strong>2.</strong> Ergebnisse und Vergleich der Analyse<br />

Abbildung 5.10.: n s Landschaften der On-Source Region. L<strong>in</strong>ks: Berechnet mit e<strong>in</strong>em CPU Cluster<br />

und 31 x 31 Gridpunkten [34]. Rechts: Berechnung mit e<strong>in</strong>er GPU und e<strong>in</strong>em Grid<br />

von 128 x 128.<br />

Abbildung 5.11.: Landschaft der n s Differenzen, bei der Berechnung mit e<strong>in</strong>em CPU-Cluster und<br />

e<strong>in</strong>er GPU. Zur Berechnung wur<strong>den</strong> die Werte der CPU Berechungn an der jeweiligen<br />

Stelle <strong>in</strong>terpoliert. Es ist e<strong>in</strong>e starke Differenz im Zentrum zu erkennen.<br />

René Reimann 27


Test des Verfahrens<br />

Abbildung 5.1<strong>2.</strong>: Landschaft der n s Differenzen, bei der Berechnung mit e<strong>in</strong>em CPU-Cluster und<br />

e<strong>in</strong>er GPU. Zur Berechnung wur<strong>den</strong> die Werte der CPU Berechnung an der jeweiligen<br />

Stelle <strong>in</strong>terpoliert. Es ist e<strong>in</strong> klares Muster zu erkennen.<br />

In dieser Abbildung ist e<strong>in</strong>e klare Struktur zu erkennen. Es gibt e<strong>in</strong> gitterförmiges Muster, das<br />

über die ganze Landschaft gezogen ist. Auf diesem Gitter haben die n s Differenzen Werte nahezu<br />

null, was man an der hellblauen bis helltürkisen Farbe erkennt. Die gitterförmigen L<strong>in</strong>ien haben<br />

genau <strong>den</strong> Abstand von zwei Gridpunkten bei e<strong>in</strong>er Berechnung mit e<strong>in</strong>em 31 x 31 Grid. Die<br />

Kreuzungspunkte liegen genau auf <strong>den</strong> mit dem CPU Cluster berechneten Gridpunkten.<br />

Daraus lässt sich schließen, dass die Berechnungen konsistente Ergebnisse liefern, jedoch die<br />

Interpolation der n s Landschaft <strong>in</strong> <strong>den</strong> Zwischenräumen im zentralen Bereich nicht die berechneten<br />

Werte beschreibt. Dies liegt möglicherweise daran, dass die Interpolation von e<strong>in</strong>em l<strong>in</strong>earen<br />

Gradienten <strong>in</strong> der Landschaft ausgeht, dies jedoch nicht der Fall ist.<br />

Neben <strong>den</strong> Landschaften s<strong>in</strong>d auch die Positionen der m<strong>in</strong>imalen n s , für die Bestimmung der<br />

<strong>Mond</strong>position, von Interesse.<br />

In [11] wurde, mit e<strong>in</strong>er CPU Analyse und e<strong>in</strong>em 31 x 31 Grid, das m<strong>in</strong>imale n s am Punkt<br />

(∆ϕ, ∆ϑ) = (0, 0) mit e<strong>in</strong>em Wert von -8660 gefun<strong>den</strong>. Für die GPU Analyse mit e<strong>in</strong>em 128 x<br />

128 Grid liegt das m<strong>in</strong>imale n s bei (∆ϕ, ∆ϑ) = (0, 0) mit e<strong>in</strong>em Wert von -8653. Somit stimmen<br />

die Positionen genau übere<strong>in</strong> und die berechneten Werte unterschei<strong>den</strong> sich um 7. Dies ist <strong>in</strong> der<br />

Größenordnung, bei der die M<strong>in</strong>imierung abbricht, wie es <strong>in</strong> Abbschnitt 5.1 beschrieben wurde.<br />

Folglich ist auch dieses Ergebnis konsistent.<br />

E<strong>in</strong>e weitere Eigenschaft des <strong>Mond</strong>schattens ist se<strong>in</strong>e Breite. Um diese zu messen, muss e<strong>in</strong>e<br />

Funktion an die n s Landschaft gefittet wer<strong>den</strong>. Als Funktion wird e<strong>in</strong>e elliptische Gaussfunktion<br />

28 RWTH Aachen


5.<strong>2.</strong> Ergebnisse und Vergleich der Analyse<br />

mit skalierbarer Höhe und e<strong>in</strong>em konstanten Offset, wie <strong>in</strong> Gleichung 5.1 beschrieben, gewählt.<br />

f el = scale · Ae −(a(∆ϕi−∆ϕg)2 +2b(∆ϕ i−∆ϕ g)(∆ϑ i−∆ϑ g)+c(∆ϑ i−∆ϑ g) 2) + offset<br />

A =<br />

1<br />

2πσ 1 σ 2<br />

a = cos2 α<br />

2σ1<br />

2 + s<strong>in</strong>2 α<br />

2σ2<br />

2<br />

b = s<strong>in</strong>(2α)<br />

4σ 2 1<br />

c = s<strong>in</strong>2 α<br />

2σ 2 1<br />

− s<strong>in</strong>(2α)<br />

4σ 2 2<br />

+ cos2 α<br />

2σ 2 2<br />

(5.1)<br />

Diese Funktion wird nur <strong>in</strong> e<strong>in</strong>em zentralen Bereich von 2 ◦ x 2 ◦ an die Daten gefittet, um wirklich<br />

das Signal zu fitten. Für die <strong>Mond</strong>schattenanalyse mit e<strong>in</strong>er GPU ergeben sich als Fitparameter<br />

die Werte <strong>in</strong> Tabelle 5.<strong>2.</strong> Da der Fit mit ROOT <strong>durch</strong>geführt wurde, jedoch ke<strong>in</strong>e <strong>in</strong>dividuellen<br />

statistischen Fehler für die n s -Werte gegeben wer<strong>den</strong>, s<strong>in</strong>d die von ROOT angegebenen Fehler auf<br />

die Fitparameter nicht vertrauenswürdig und wer<strong>den</strong> deswegen <strong>in</strong> <strong>den</strong> Tabellen weggelassen.<br />

Tabelle 5.<strong>2.</strong>: Ergebnis e<strong>in</strong>es Fits von Funktion 5.1 an die n s Landschaft e<strong>in</strong>er GPU Analyse im<br />

zentralen 2 ◦ x2 ◦ bereich.<br />

δ azi [deg] -0.034<br />

δ zen [deg] 0.048<br />

σ 1 [deg] 0.850<br />

σ 2 [deg] 0.743<br />

α [rad] 1.673<br />

scale -9034<br />

offset 8.35<br />

Die Fehler auf δ azi , δ zen , σ 1 und σ 2 wer<strong>den</strong> aufgrund des Gridpunktabstands von 0.0625 ◦ gleichverteilt<br />

zu 0.018 ◦ angenommen. Da der <strong>Mond</strong>schatten annähernd rund ist, ist α beliebig, so dass<br />

hier<strong>in</strong> e<strong>in</strong> sehr großer Fehler liegt.<br />

E<strong>in</strong>e andere Schätzung für die Fehler auf δ azi und δ zen erhält man <strong>durch</strong> Signifikanzplots, die<br />

weiter unten besprochen wer<strong>den</strong>. Die 1-Sigma-Ellipse <strong>in</strong> diesen Plots sollten <strong>den</strong> 39% Konfi<strong>den</strong>zbereich<br />

beschreiben.<br />

Die berechneten δ azi und δ zen Werte liegen <strong>in</strong>nerhalb e<strong>in</strong>es Gridpunktabstandes zu (0,0) und<br />

stimmen <strong>in</strong>soweit mit <strong>den</strong> vorherigen Ergebnissen übere<strong>in</strong>. Die berechneten Breiten von 0.850 ◦<br />

und 0.743 ◦ liegen <strong>in</strong> der gleichen Größenordnung, wie die Werte 0.83 ◦ und 0.91 ◦ , die <strong>in</strong> [11] für die<br />

Landschaft e<strong>in</strong>es 31 x 31 Grids bei e<strong>in</strong>er CPU Analyse berechnet wur<strong>den</strong>. Dass die berechneten<br />

Breiten um etwa 0.1 ◦ unterschiedlich s<strong>in</strong>d, hängt wahrsche<strong>in</strong>lich mit der Auflösung sowie mit der<br />

Größe des Fitbereichs zusammen.<br />

On-Source − log L-Landschaft<br />

Nun sollen auch die − log L-Landschaften verglichen wer<strong>den</strong>. Die − log L-Landschaft, mit <strong>den</strong> Werten<br />

zur GPU Analayse ist <strong>in</strong> Abbildung 5.13 oben dargestellt. Hierbei wird − log L aufgetragen,<br />

weil bei dieser Berechnung e<strong>in</strong> M<strong>in</strong>imierungsalgorithmus verwendet wurde.<br />

In Abbildung 5.13 unten ist die − log L-Landschaft der CPU-Cluster Analyse dargestellt. Hierbei<br />

wurde die log L maximiert. Aus diesem Grund unterschei<strong>den</strong> sich die Farbskalen <strong>durch</strong> e<strong>in</strong> M<strong>in</strong>us.<br />

Da aufgrund der verschie<strong>den</strong>en Auflösungen kaum Unterschiede erkennbar s<strong>in</strong>d und die Hauptstrukturen<br />

sich gleichen, muss die Darstellung anders erfolgen.<br />

René Reimann 29


Test des Verfahrens<br />

Abbildung 5.13.: − log L-Landschaft für die On-Source Region, berechnet mit e<strong>in</strong>er GPU (oben)<br />

und e<strong>in</strong>em Grid von 128 x 128, sowie e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s . Unten ist die<br />

− log L-Landschaft der On-Source Region für e<strong>in</strong>e CPU-Berechnung mit e<strong>in</strong>em<br />

Grid von 31 x 31 dargestellt[11].<br />

Signifikanz<br />

Aus der − log L-Landschaft lässt sich e<strong>in</strong>e Signifikanz Landschaft berechnen.<br />

L − L 0 = σ2<br />

(5.2)<br />

2<br />

Folglich kann man jedem Likelihoodwert L e<strong>in</strong>e Signifikanz σ zuweisen. Hierbei ist L 0 der M<strong>in</strong>imale<br />

− log L-Wert.<br />

σ = √ 2 · (L − L 0 ) (5.3)<br />

Die so berechnete Signifikanz gibt an wie stark die Abweichung vom m<strong>in</strong>imalen n s Wert ist. Für<br />

die On-Source Region beschreibt das m<strong>in</strong>imale n s die Position des <strong>Mond</strong>es. Deswegen gibt hier die<br />

Signifikanzlandschaft an, mit welcher Wahrsche<strong>in</strong>lichkeit sich der <strong>Mond</strong> nicht an dieser Position<br />

bef<strong>in</strong>det.<br />

30 RWTH Aachen


5.<strong>2.</strong> Ergebnisse und Vergleich der Analyse<br />

Für die GPU Analyse ist diese Landschaft für <strong>den</strong> On-Source Bereich <strong>in</strong> Abbildung 5.14 oben<br />

dargestellt. Der Großteil der beobachteten Landschaft schließt mit 16 Sigma aus, dass an dieser<br />

Stelle die Position des <strong>Mond</strong>schattens ist.<br />

Abbildung 5.14.: Signifikanz-Landschaft für die Position des <strong>Mond</strong>es, berechnet mit e<strong>in</strong>er GPU<br />

(oben) auf e<strong>in</strong>em 128x128 Grid und mit e<strong>in</strong>er CPU (unten) auf e<strong>in</strong>em 31x31 Grid<br />

[34].<br />

In Abbildung 5.14 unten ist die Signifikanz Landschaft für die CPU-Analyse dargestellt.<br />

Auch diese Landschaften zeigen e<strong>in</strong>e hohe Übere<strong>in</strong>stimmung und somit auch e<strong>in</strong>e konsistente<br />

Beschreibung.<br />

Alternativ könnte e<strong>in</strong>e Signifikanz-Landschaft aus der n s -Landschaft berechnet wer<strong>den</strong>. Hierbei<br />

teilt man <strong>den</strong> Wert der n s -Landschaft <strong>durch</strong> die oben (Abschnitt 5.2) berechneten statistische<br />

Unsicherheit σ stat [11].<br />

René Reimann 31


Test des Verfahrens<br />

Fazit<br />

Insgesamt kann e<strong>in</strong>e recht konsistente Beschreibung der Analyse mit e<strong>in</strong>er GPU und mit e<strong>in</strong>em<br />

CPU-Cluster nachgewiesen wer<strong>den</strong>.<br />

5.3. Performance<br />

Zwischen e<strong>in</strong>er <strong>Mond</strong>schattenanalyse mit CPU und GPU ist e<strong>in</strong> klarer Performanzunterschied zu<br />

erkennen. Jedoch kann dieser schlecht direkt verglichen wer<strong>den</strong>, da es unterschiedliche Vorraussetzungen<br />

gibt.<br />

Bei e<strong>in</strong>er CPU Analyse wurde die Berechnung des m<strong>in</strong>imalen − log L-Werte für je<strong>den</strong> Gridpunkt<br />

sequentiell berechnet. Die Rechenzeit auf e<strong>in</strong>er 64 Bit CPU mit 3 GHz beträgt etwa 20 M<strong>in</strong>uten pro<br />

Gridpunkt.[11] Auch bei Berechnungen auf e<strong>in</strong>em Cluster mit etwa 500 Computern benötigt die<br />

Analyse im Optimalfall bei e<strong>in</strong>em Grid mit 31x31 Gridpunkten etwa e<strong>in</strong>e Stunde. Der Optimalfall,<br />

das alle Computer e<strong>in</strong>es Clusters gleichzeitig frei s<strong>in</strong>d und nur für die Analyse verwendet wer<strong>den</strong><br />

können, tritt selten auf. Die Rechendauer hängt stark von der Auslastung des Clusters ab und<br />

beträgt <strong>in</strong> der Regel e<strong>in</strong>ige Stun<strong>den</strong>. Aus diesem Grund ist es nicht möglich hohe Auflösungen <strong>in</strong><br />

der Analyse zu erreichen. Würde die Analyse für e<strong>in</strong> 31x31 Grid auf e<strong>in</strong>er e<strong>in</strong>zigen CPU berechnet,<br />

so würde die Rechendauer etwa 450 Stun<strong>den</strong> (18,75 Tage) betragen.<br />

Die <strong>Mond</strong>schattenanalyse auf e<strong>in</strong>er GPU wurde mit e<strong>in</strong>em Grid von 128x128 <strong>durch</strong>geführt. Dies<br />

ist möglich, da diese Rechnungen parallel ausgeführt wer<strong>den</strong>. Hierbei kommt es nicht auf e<strong>in</strong>ige<br />

Gridpunkte mehr oder weniger an, da sich die Rechenzeit erst verlängert, wenn die Anzahl der<br />

Blöcke da<strong>durch</strong> größer als das nächste Vielfache der Kerne auf der verwendeten Graphikkarte<br />

wird.<br />

Die Verwendung e<strong>in</strong>er e<strong>in</strong>zigen GPU bietet die Möglichkeit diese Analyse <strong>in</strong>nerhalb von e<strong>in</strong>e<strong>in</strong>halb<br />

Stun<strong>den</strong> <strong>durch</strong>zuführen. Hierbei wird ke<strong>in</strong> Cluster benötigt. Jedoch hängt die Rechenzeit<br />

stark von der Genauigkeit der M<strong>in</strong>imierung ab. Die genauen Rechenzeiten für unterschiedliche<br />

Toleranzen s<strong>in</strong>d <strong>in</strong> Tabelle 5.1 aufgeführt. Zudem s<strong>in</strong>d auf der unter Abbschnit 4.3 beschriebenen<br />

Masch<strong>in</strong>e drei Graphikkarten <strong>in</strong>stalliert. Darum können drei Analysen, beispielsweise für On-Source<br />

und Off-Source 1 und 2, gleichzeitig <strong>durch</strong>geführt wer<strong>den</strong>.<br />

Somit wird im Regelfall die Analyse mit e<strong>in</strong>er GPU wesentlich schneller se<strong>in</strong> als mit CPU Clustern.<br />

Um nun die Vorteile der Berechnung der <strong>Mond</strong>schattenanalyse auf Graphikkarten auszunutzen,<br />

wer<strong>den</strong> im folgen<strong>den</strong> Kapitel zwei kle<strong>in</strong>e Untersuchungen <strong>durch</strong>geführt.<br />

32 RWTH Aachen


6. Weiterführende Untersuchungen<br />

6.1. Symmetrischer vs. elliptischer Gauss<br />

In vielen <strong>IceCube</strong>-Anwendungen wird für Berechnungen das genäherte Signalmodell (siehe Abschnitt<br />

3.2) mit e<strong>in</strong>em gemittelten Fehler benutzt. Das Signalmodell mit mehr Information ist das<br />

Modell mit e<strong>in</strong>er elliptischen Gaussverteilung. Dies liegt daran, dass es e<strong>in</strong>e gewisse Verteilung des<br />

Rotationsw<strong>in</strong>kel α gibt, die nicht gleichverteilt ist, und dass die Exzentrizität nicht immer null ist.<br />

Die Verteilung von α ist <strong>in</strong> Abbildung 6.1 dargestellt. In diesem Abschnitt soll daher der E<strong>in</strong>fluss<br />

des verwendeten Signalmodells untersucht wer<strong>den</strong>.<br />

Abbildung 6.1.: Verteilung von α der Paraboloid Rekonstruktion. Es ist zu beachten, dass die y-<br />

Achse nicht bei 0 beg<strong>in</strong>nt.<br />

In Abbildung 6.2 ist die Landschaft der m<strong>in</strong>imalen n s Werte l<strong>in</strong>ks, für e<strong>in</strong>er Berechnung mit<br />

elliptischem und symmetrischem Signalmodell, zu sehen. Auf der rechten Seite ist die Landschaft<br />

der zugehörigen − log L-Werte dargestellt.<br />

Um die Breite des Schattens zu ermitteln, wird <strong>in</strong> e<strong>in</strong>em zentralen Bereich von 2 ◦ x2 ◦ die Funktion<br />

5.1 an die n s Landschaft gefittet. Die resultieren<strong>den</strong> Fitparameter s<strong>in</strong>d <strong>in</strong> Tabelle 6.1 aufgeführt.<br />

Die Position des <strong>Mond</strong>es wird anhand des m<strong>in</strong>imalen n s für das elliptische Signalmodell abgelesen<br />

und liegt auf dem Gridpunkt (0,0.0625) mit e<strong>in</strong>em n s Wert von -8129.68. Der m<strong>in</strong>imale − log L-<br />

Wert liegt ebenfalls auf dem Gridpunkt (0,0.0625).<br />

Für das symmetrische Signalmodell ergibt sich die Position des <strong>Mond</strong>es aus der n s -Landschaft<br />

zu (0,0) bei e<strong>in</strong>em M<strong>in</strong>imalen n s von -8707.8 und aus der − log L-Landschaft zu (0,0.0625). Da dies<br />

benachbarte Gridpunkte s<strong>in</strong>d, kann es se<strong>in</strong>, dass die wahre <strong>Mond</strong>position im Zwischenraum liegt.<br />

Die Verwendung des elliptischen und des symmetrischen Signalmodells lässt sich optisch nicht signifikant<br />

unterschei<strong>den</strong>. E<strong>in</strong> Unterschied ist kaum zu erkennen und lässt ke<strong>in</strong>e der bei<strong>den</strong> Versionen<br />

bevorzugt ersche<strong>in</strong>en.<br />

René Reimann 33


Weiterführende Untersuchungen<br />

Abbildung 6.<strong>2.</strong>: Berechnung der n s Landschaft (l<strong>in</strong>ks) und der − log L-Landschaft (rechts) bei e<strong>in</strong>er<br />

Toleranz von 1 <strong>in</strong> n s und unter Verwendung e<strong>in</strong>es elliptischen Signalmodels (oben)<br />

und e<strong>in</strong>s symmetrischen (unten).<br />

Tabelle 6.1.: Ergebnis e<strong>in</strong>es Fits mit der Funktion 5.1 an die n s Landschaft mit elliptischem und<br />

symmetrischem Signalmodell.<br />

elliptisch symmetrisch<br />

δ azi [deg] -0.0019 -0.0334<br />

δ zen [deg] 0.0515 0.0480<br />

σ 1 [deg] 0.7167 0.8496<br />

σ 2 [deg] 0.8548 0.7431<br />

α [rad] 1.797 0.029<br />

scale -8663 -9034<br />

offset 6.45 8.4<br />

Die m<strong>in</strong>imalen n s Werte unterschei<strong>den</strong> sich um e<strong>in</strong>en Gridpunkt. Die m<strong>in</strong>imalen − log L-Werte<br />

s<strong>in</strong>d am gleichen Gridpunkt. Dies lässt darauf schließen, dass auch die Position im Rahmen der<br />

Unsicherheit benachbarter Gridpunkte ebenfalls konsistent ist.<br />

Der Schatten des <strong>Mond</strong>es hat <strong>in</strong> bei<strong>den</strong> Analysen e<strong>in</strong>e annähernd gleiche Breite. Der W<strong>in</strong>kel<br />

zwischen der Azimutachse und σ 1 ist stark unterschiedlich. Dies liegt jedoch daran, dass bei <strong>den</strong><br />

Berechnungen die Werte von σ 1 und σ 2 getauscht wur<strong>den</strong>. Insofern sollte α ell − α sym ≈ π 2 gelten.<br />

Außerdem ist der Schatten annähernd kreisförmig und folglich ist α für ke<strong>in</strong>e Richtung ausgezeichnet.<br />

Nur die Skalierung des Signals ist um e<strong>in</strong>ige 100 <strong>in</strong> n s unterschiedlich. Dies wurde bereits <strong>in</strong> der<br />

34 RWTH Aachen


6.<strong>2.</strong> Die Energieabhängigkeit des <strong>Mond</strong>schatten<br />

Arbeit von Jan Blumenthal festgestellt.[11] Doch dieser Unterschied <strong>in</strong> der Berechnung ist nicht<br />

sehr signifikant. Folglich hat die Berechnung mit elliptischem oder symmetrischen Signalmodell<br />

ke<strong>in</strong>en E<strong>in</strong>fluss auf viele Eigenschaften, wie Form, Position und Breite.<br />

6.<strong>2.</strong> Die Energieabhängigkeit des <strong>Mond</strong>schatten<br />

In diesem Abschnitt soll die Energieabhängigkeit des <strong>Mond</strong>schattens qualitativ erfolgen. E<strong>in</strong>e quantitative<br />

Analyse benötigt wesentlich genauere und differenziertere Analysen.<br />

Die Anzahl der DOMs, die Cherenkov-Licht detektieren, hängen von der Energie der Myonen<br />

ab. Darum ist die Anzahl der getroffenen DOMs, NChannel genannt, e<strong>in</strong>e Schätzung der Energie.<br />

Für die gesamten Daten von IC59 hat NChannel die Verteilung <strong>in</strong> Abbildung 6.3. Für NChannel<br />

kle<strong>in</strong>er 12 wur<strong>den</strong> die Events bereits weggeschnitten (siehe <strong>2.</strong>5).<br />

Abbildung 6.3.: Verteilung von NChannel der mit IC59 und <strong>Mond</strong>schattenfilter regestrierten<br />

Events.<br />

Die Energie hängt mit dem Impuls des Teilchens zusammen. Da die Ablenkung <strong>in</strong> kosmischen<br />

Magnetfeldern ebenfalls impulsabhängig ist, sollte der Schatten des <strong>Mond</strong>es für kle<strong>in</strong>e NChannel<br />

stärker verformt oder verschoben se<strong>in</strong> als für große NChannel. Weiterh<strong>in</strong> ist die Rekonstruktion der<br />

Spur für große NChannel besser, da es mehr Freiheitsgrade gibt. Folglich ist auch die Unsicherheit<br />

auf die Spur-Rekonstruktion besser und es kommt zu kle<strong>in</strong>eren Verschmierungen als für kle<strong>in</strong>e<br />

NChannel.<br />

Um diese Effekte zu untersuchen, wird der Datensatz <strong>in</strong> zwei Hälften aufgeteilt. Als Grenze<br />

dient der Median der NChannel-Verteilung, der aus <strong>den</strong> Daten zu NChannel Median = 21 bestimmt<br />

wurde. Die n s -Landschaften für die Off-Source Regionen 1 und 2 s<strong>in</strong>d <strong>in</strong> <strong>den</strong> Abbildungen A.15,<br />

dargestellt. Für die On-Source Region ist die n s -Landschaft <strong>in</strong> Abbildung 6.5 zu sehen. Auch die<br />

− log L-Landschaften s<strong>in</strong>d für die Off-Source Regionen 1 und 2 <strong>in</strong> <strong>den</strong> Abbildungen A.15, sowie für<br />

die On-Source Region <strong>in</strong> Abbildung 6.6, zu sehen. In Abbildung 6.4 ist weiterh<strong>in</strong> die n s -Verteilung<br />

von Off-Source Region 1 für große und kle<strong>in</strong>e NChannel gezeigt.<br />

In <strong>den</strong> Off-Source Bereichen s<strong>in</strong>d starke Unterschiede zu sehen, so dass noch nicht e<strong>in</strong>mal große<br />

Plateau an <strong>den</strong> gleichen Stellen liegen. Auch s<strong>in</strong>d die Farbskalen für die − log L-Landschaften<br />

unterschiedlich gewählt wur<strong>den</strong>, da die Werte stark verschie<strong>den</strong> waren. Die Streuung der n s -Werte<br />

ist für große NChannel etwas kle<strong>in</strong>er als für kle<strong>in</strong>e NChannel.<br />

René Reimann 35


Weiterführende Untersuchungen<br />

Abbildung 6.4.: Histogramm der n s -Werte der Off-Source Region 1 für große (l<strong>in</strong>ks) und kle<strong>in</strong>e<br />

(rechts) NChannel.<br />

Abbildung 6.5.: n s -Landschaft der On-Source Region. L<strong>in</strong>ks berechnet für NChannel größer<br />

NChannel Median und rechts für NChannel kle<strong>in</strong>er NChannel Median .<br />

Abbildung 6.6.: − log L-Landschaft der On-Source Region. L<strong>in</strong>ks berechnet für NChannel größer<br />

NChannel Median und rechts für NChannel kle<strong>in</strong>er NChannel Median .<br />

Auch für die On-Source Region ist e<strong>in</strong> Unterschied erkennbar. Für große NChannel sieht der<br />

Schatten des <strong>Mond</strong>es wesentlich kreisförmiger aus als für kle<strong>in</strong>e. Auch ist der <strong>Mond</strong>schatten für<br />

36 RWTH Aachen


6.<strong>2.</strong> Die Energieabhängigkeit des <strong>Mond</strong>schatten<br />

große NChannel deutlich kle<strong>in</strong>er und schärfer. Das ist auch aufgrund e<strong>in</strong>er besseren Rekonstruktion<br />

zu erwarten. Die <strong>Mond</strong>position ist <strong>in</strong> bei<strong>den</strong> Fällen nicht von (0,0) verschoben.<br />

An die On-Source n s -Landschaften mit großen und kle<strong>in</strong>en NChannel wird die Funktion (5.1)<br />

im zentralen Bereich gefittet. Die Fitergebnisse bef<strong>in</strong><strong>den</strong> sich <strong>in</strong> Tabelle 6.<strong>2.</strong><br />

Tabelle 6.<strong>2.</strong>: Fitergebnisse der Funktion (5.1) im zentralen Bereich von 2 ◦ x 2 ◦ der n s -Landschaft<br />

der On-Source Region.<br />

kle<strong>in</strong>e NChannel große NChannel<br />

δ azi [deg] -0.21 -0.0043<br />

δ zen [deg] -0.038 0.062<br />

σ 1 [deg] 0.74 0.80<br />

σ 2 [deg] 1.02 0.71<br />

α [rad] 1.97 -0.36<br />

scale -3731 -5234<br />

offset -9.7 24.0<br />

Bei <strong>den</strong> Fitergebnissen s<strong>in</strong>d die Werte für σ 1 und σ 2 vertauscht. Da der Schatten annähernd<br />

kreisförmig ist, gibt es für der W<strong>in</strong>kel α ke<strong>in</strong>e ausgezeichnete Richtung und die Werte lassen<br />

sich schwer vergleichen. Es ist zu erkennen, dass δ zen gut übere<strong>in</strong>stimmt. δ azi weist e<strong>in</strong>en kle<strong>in</strong>en<br />

Unterschied auf, wobei die <strong>Mond</strong>position für kle<strong>in</strong>e NChannel stärker verschoben ist. Dies ist jedoch<br />

noch ke<strong>in</strong> signifikanter Unterschied. Um die Verschiebung des <strong>Mond</strong>schattens für kle<strong>in</strong>e NChannel<br />

<strong>durch</strong> das Erdmagnetfeld nachzuweisen, s<strong>in</strong>d weitere Untersuchungen nötig. Auch ist für kle<strong>in</strong>e<br />

NChannel die Breite größer.<br />

Die Signifikanz nach Gleichung 5.3 ist für die On-Source Region <strong>in</strong> Abbildung 6.7 dargestellt.<br />

Abbildung 6.7.: Signifikanz-Landschaft der On-Source Region. L<strong>in</strong>ks berechnet für NChannel größer<br />

NChannel Median und rechts für NChannel kle<strong>in</strong>er NChannel Median .<br />

Obwohl für die Berechnung mit großen NChannel 28% weniger Events zur Verfügung stan<strong>den</strong> als<br />

für kle<strong>in</strong>e NChannel, da NChannel Median aufgerundet wird, wird hierbei e<strong>in</strong>e größere Signifikanz<br />

erzielt.<br />

Der scharfe Schatten und die größere Signifikanz entsprechen der Erwartung, dass für große<br />

NChannel die Rekonstruktion bessere Ergebnisse liefert.<br />

René Reimann 37


Zusammenfassung und Ausblick<br />

7. Zusammenfassung und Ausblick<br />

In dieser Bachelorarbeit mit dem Titel „Untersuchungen mit Graphik-Prozessoren (GPU) zur Messung<br />

der <strong>Abschattung</strong> kosmischer <strong>Strahlung</strong> <strong>durch</strong> <strong>den</strong> <strong>Mond</strong> <strong>in</strong> <strong>IceCube</strong>“ wurde die <strong>Mond</strong>schattenanalyse<br />

aus [11] auf Graphikprozessoren implementiert, um die Rechenzeit und die Auflösung<br />

zu verbessern. Hierzu wurde der Vorteil der GPU, die parallele Berechnung vieler Threads bzw.<br />

Gridpunkte, verwendet.<br />

Als M<strong>in</strong>imierungsalgorithmus wurde e<strong>in</strong>e Erweiterung des Brentalgorithmus gewählt. E<strong>in</strong> E<strong>in</strong>fluss<br />

der verwendeten Hardware konnte auf die Analyse des <strong>Mond</strong>schattens ausgeschlossen wer<strong>den</strong>.<br />

E<strong>in</strong> Vergleich mit e<strong>in</strong>er <strong>Mond</strong>schattenanalyse auf CPUs wurde gemacht. Hierbei wur<strong>den</strong> die<br />

Fitergebnisse für On-Source und Off-Source verglichen. Es wur<strong>den</strong> <strong>durch</strong>weg konsistente Ergebnisse<br />

mit <strong>den</strong> Analysen aus [11] von Jan Blumenthal erzielt.<br />

E<strong>in</strong> Performanzvergleich zwischen der GPU Analyse und der CPU-Cluster Analyse wurde besprochen.<br />

Die GPU Analyse ist nicht nur wesentlich schneller, sondern bietet auch e<strong>in</strong>e höhere<br />

Auflösung.<br />

Die Analyse mithilfe der GPU wurde für zwei Untersuchungen verwendet. So konnten ke<strong>in</strong>e signifikanten<br />

Unterschiede zwischen symmetrischen und elliptischen Gausssignalmodell festgestellt<br />

wer<strong>den</strong>. Die Energieabhängigkeit wurde kurz qualitativ anhand e<strong>in</strong>es NChannel-Schnittes behandelt.<br />

Hierbei ist erkennbar, dass für große NChannel der <strong>Mond</strong>schatten schärfer ist als für kle<strong>in</strong>e<br />

NChannel. Diese energieabhängige Analyse sollte <strong>in</strong> Zukunft quantitativ <strong>durch</strong>geführt wer<strong>den</strong>.<br />

Hieraus kann man Rückschlüsse auf <strong>den</strong> E<strong>in</strong>fluss des Erdmagnetfeldes und des Sonnenw<strong>in</strong>des sowie<br />

auf die Güte der Rekonstruktion ziehen.<br />

In <strong>den</strong> nächsten Jahren wird <strong>IceCube</strong> weitere Daten sammeln. Die Analyse dieser Daten wird<br />

<strong>durch</strong> <strong>den</strong> E<strong>in</strong>satz von GPUs wesentlich schneller erfolgen können. Momentan gibt es noch e<strong>in</strong> Datenlimit<br />

von 1.6 GB auf der verwendeten GPU, doch die Industrie wird dieses Limit wahrsche<strong>in</strong>lich<br />

schneller erhöhen als Daten <strong>in</strong> <strong>IceCube</strong> gesammelt wer<strong>den</strong> können. Zudem ist es momentan möglich<br />

nur Teildatensätze zu untersuchen, beispielsweise <strong>durch</strong> harte Schnitte oder monatsweise Analysen<br />

<strong>durch</strong>zuführen, für die n s -Landschaften addiert wer<strong>den</strong> können.<br />

Die Vorteile der Analyse mit GPUs bei der M<strong>in</strong>imierung von Likelihoodfunktionen kann auch<br />

<strong>in</strong> anderen Anwendungen e<strong>in</strong>gesetzt wer<strong>den</strong>. Generell wird der E<strong>in</strong>satz von GPUs und e<strong>in</strong> neuer<br />

Programmierstil, der auf Parallelität beruht, <strong>in</strong> <strong>den</strong> kommen<strong>den</strong> Jahren zunehmen, da die CPUs<br />

nicht wesentlich schneller wer<strong>den</strong> können.<br />

38 RWTH Aachen


A. Anhang<br />

René Reimann 39


Anhang<br />

A.1. Zur Toleranzstudie mit Brent Algorithmus<br />

A.1.1. Toleranz von 100 <strong>in</strong> n s mit Brent Algorithmus<br />

Abbildung A.1.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region<br />

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten),<br />

berechnet mit dem Brent Algorithmus und e<strong>in</strong>er Toleranz von 100. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt.<br />

40 RWTH Aachen


A.1. Zur Toleranzstudie mit Brent Algorithmus<br />

A.1.<strong>2.</strong> Toleranz von 10 <strong>in</strong> n s mit Brent Algorithmus<br />

Abbildung A.<strong>2.</strong>: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem Brent Algorithmus und e<strong>in</strong>er Toleranz von 10. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt.<br />

René Reimann 41


Anhang<br />

A.1.3. Toleranz von 1 <strong>in</strong> n s mit Brent Algorithmus<br />

Abbildung A.3.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt.<br />

42 RWTH Aachen


A.1. Zur Toleranzstudie mit Brent Algorithmus<br />

A.1.4. Toleranz von 0,1 <strong>in</strong> n s mit Brent Algorithmus<br />

Abbildung A.4.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem Brent Algorithmus und e<strong>in</strong>er Toleranz von 0,1. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt.<br />

René Reimann 43


Anhang<br />

A.1.5. Differenzplots für verschie<strong>den</strong>e Toleranzen <strong>in</strong> n s mit Brent<br />

Algorithmus<br />

Abbildung A.5.: Differenzplots der n s -Landschaften der On-Source Region (unten) für verschie<strong>den</strong>e<br />

Toleranzen, berechnet mit dem Brent Algorithmus. E<strong>in</strong> symmetrisches Signalmodell<br />

wurde benutzt. Die absoluten Fluktuationen s<strong>in</strong>d für kle<strong>in</strong>e Zenitw<strong>in</strong>kel größer,<br />

da aus dieser Richtung mehr Teilchen detektiert wer<strong>den</strong>.<br />

44 RWTH Aachen


A.<strong>2.</strong> Zur Toleranzstudie mit erweitertem Brent Algorithmus<br />

A.<strong>2.</strong> Zur Toleranzstudie mit erweitertem Brent Algorithmus<br />

A.<strong>2.</strong>1. Toleranz von 100 <strong>in</strong> n s mit erweitertem Brent Algorithmus<br />

Abbildung A.6.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region<br />

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten),<br />

berechnet mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 100.<br />

E<strong>in</strong> symmetrisches Signalmodell wurde benutzt.<br />

René Reimann 45


Anhang<br />

A.<strong>2.</strong><strong>2.</strong> Toleranz von 10 <strong>in</strong> n s mit erweitertem Brent Algorithmus<br />

Abbildung A.7.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region<br />

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten),<br />

berechnet mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 10.<br />

E<strong>in</strong> symmetrisches Signalmodell wurde benutzt.<br />

46 RWTH Aachen


A.<strong>2.</strong> Zur Toleranzstudie mit erweitertem Brent Algorithmus<br />

A.<strong>2.</strong>3. Toleranz von 1 <strong>in</strong> n s mit erweitertem Brent Algorithmus<br />

Abbildung A.8.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region<br />

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten),<br />

berechnet mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt.<br />

René Reimann 47


Anhang<br />

A.<strong>2.</strong>4. Toleranz von 0,1 <strong>in</strong> n s mit erweitertem Brent Algorithmus<br />

Abbildung A.9.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region<br />

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten),<br />

berechnet mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 0,1.<br />

E<strong>in</strong> symmetrisches Signalmodell wurde benutzt.<br />

48 RWTH Aachen


A.<strong>2.</strong> Zur Toleranzstudie mit erweitertem Brent Algorithmus<br />

A.<strong>2.</strong>5. Signifikanzplots für verschie<strong>den</strong>e Toleranz mit erweitertem Brent<br />

Algorithmus<br />

Abbildung A.10.: Signifikanz-Landschaften der On-Source Region, berechnet mit dem erweitertem<br />

Brent Algorithmus und e<strong>in</strong>er Toleranz von 100 (oben l<strong>in</strong>ks), 10 (oben rechts),<br />

1 (unten l<strong>in</strong>ks) und 0,1 (unten rechts). E<strong>in</strong> symmetrisches Signalmodell wurde<br />

benutzt.<br />

René Reimann 49


Anhang<br />

A.<strong>2.</strong>6. Differenzplots für verschie<strong>den</strong>e Toleranzen <strong>in</strong> n s mit erweitertem<br />

Brent Algorithmus<br />

Abbildung A.11.: Differenzplots der n s -Landschaften der On-Source Region (unten) für verschie<strong>den</strong>e<br />

Toleranzen, berechnet mit dem erweiterten Brent Algorithmus. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt. Die absoluten Fluktuationen s<strong>in</strong>d für kle<strong>in</strong>e<br />

Zenitw<strong>in</strong>kel größer, da aus dieser Richtung mehr Teilchen detektiert wer<strong>den</strong>.<br />

50 RWTH Aachen


A.3. Untersuchungen mit elliptischem Signalmodell<br />

A.3. Untersuchungen mit elliptischem Signalmodell<br />

Abbildung A.1<strong>2.</strong>: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region<br />

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten),<br />

berechnet mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong><br />

elliptisches Signalmodell wurde benutzt.<br />

René Reimann 51


Anhang<br />

Abbildung A.13.: Signifikanz-Landschaften der On-Source Region, berechnet mit dem erweitertem<br />

Brent Algorithmus und e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s . E<strong>in</strong> elliptisches Signalmodell<br />

wurde benutzt.<br />

52 RWTH Aachen


A.4. Untersuchungen mit NChannel Schnitt<br />

A.4. Untersuchungen mit NChannel Schnitt<br />

A.4.1. Untersuchungen für Events mit niedrigem NChannel<br />

Abbildung A.14.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region<br />

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten),<br />

berechnet mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt. Es wur<strong>den</strong> nur Daten mit NChannel<br />

kle<strong>in</strong>er NChannel Median benutzt.<br />

René Reimann 53


Anhang<br />

A.4.<strong>2.</strong> Untersuchungen für Events mit hohem NChannel<br />

Abbildung A.15.: n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region<br />

1 (oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten),<br />

berechnet mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt. Es wur<strong>den</strong> nur Daten mit NChannel<br />

größer NChannel Median benutzt.<br />

54 RWTH Aachen


A.4. Untersuchungen mit NChannel Schnitt<br />

A.4.3. Signifikanzplots mit NChannel Schnitt<br />

Abbildung A.16.: Signifikanz-Landschaften der On-Source Region, berechnet mit dem erweitertem<br />

Brent Algorithmus und e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s . E<strong>in</strong> symmetrisches Signalmodell<br />

wurde benutzt. Für <strong>den</strong> oberen Plot wur<strong>den</strong> nur Events mit NChannel<br />

kle<strong>in</strong>er NChannel Median und für <strong>den</strong> unteren nur Events mit NChannel größer<br />

NChannel Median verwendet.<br />

René Reimann 55


Anhang<br />

A.5. Fitergebnisse für n s -Landschaften der On-Source Region<br />

Tabelle A.1.: Fitergebnisse der Funktion 5.1 im zentralen Bereich von 2 ◦ x 2 ◦ der jeweiligen n s -<br />

Landschaft der On-Source Region.<br />

Fit zu Abbildung δ azi [deg] δ zen [deg] σ 1 [deg] σ 2 [deg] α [rad] scale offset<br />

A.1 -0.017 -0.050 0.85 0.72 -0.033 -9303 17.9<br />

A.2 -0.038 0.050 0.85 0.74 -0.009 -9073 9.8<br />

A.3 -0.033 0.048 0.85 0.74 0.029 -9034 8.4<br />

A.4 -0.032 0.034 0.85 0.74 0.035 -9066 5.0<br />

A.6 -0.027 0.047 0.86 0.74 0.066 -8992 9.7<br />

A.7 -0.028 0.047 0.86 0.75 0.026 -8958 6.9<br />

A.8 -0.033 0.048 0.85 0.74 0.029 -9034 8.4<br />

A.9 -0.032 0.048 0.85 0.74 0.038 -9044 8.3<br />

A.12 -0.0019 0.052 0.72 0.85 1.80 -8663 6.5<br />

A.14 -0.21 -0.038 0.74 1.02 1.97 -3731 -9.7<br />

A.15 -0.0043 0.062 0.80 0.71 -0.36 -5234 24.0<br />

56 RWTH Aachen


Literaturverzeichnis<br />

[1] Sebastian Euler: „On the Detection of Low Energy Neutr<strong>in</strong>o Events with Full-<br />

Sky Acceptance with the <strong>IceCube</strong> DeepCore Detector“ Diplomarbeit, RWTH<br />

Aachen Juni 2008<br />

[2] A. Weigert, H.J. Wendker, L. Wisotzki: „Astronomie und Astrophysik“ Wiley-<br />

Vch-Verlag 5. Auflage, 2009<br />

[3] Marius Wallraff: „Design, Implementation and Test of a New Feature Extractor<br />

for the <strong>IceCube</strong> Neutr<strong>in</strong>o Observatory“ Diplomarbeit, RWTH Aachen, 2010<br />

[4] Ahrens, J. et al.: „<strong>IceCube</strong> Prelim<strong>in</strong>ary Design Document“. Tech. Rep., The<br />

<strong>IceCube</strong> Collaboration, Oct 2001<br />

[5] Victor F. Hess: „II. Time Variations of Cosmic Rays, The Significane of Variations<br />

<strong>in</strong> Cosmic-Ray Intensity and Their Relation to Solar, Earthmagnetic and<br />

Atmospheric Phenomena“ Reviews of modern physics 1939<br />

[6] Wolfgang Demtröder: „Experimantalphysik 4 Kern-, Teilchen- und Astrophysik“<br />

Spr<strong>in</strong>ger-Verlag 3. Auflage 2009<br />

[7] K. Nakamura et al. (Particle Data Group): „chapter 24. cosmic rays revised“<br />

Review of Particle Physics August 2009 by T.K. Gaisser and T. Stanev<br />

[8] Luis Anchordoqui, Thomas Paul, Stephen Reucroft and John Swa<strong>in</strong>: „Ultrahigh<br />

Energy Cosmic Rays: The state of the art before the AUGER Observatory“ 25<br />

October 2002<br />

[9] A. R. Bellw and S. G. Lucek: „Cosmic ray acceleration to very high energy<br />

through the non-l<strong>in</strong>ear amplification by cosmic rays of the seed magnetic field“<br />

Mon. Not. R. Astron. Soc. 321, 433-438 (2001)<br />

[10] Lisa Åström: „A study of cosmic ray air shower properties“ Master’s Thesis,<br />

Royal Institute of Technology Stockholm, Swe<strong>den</strong> 2006<br />

[11] Jan Blumenthal: „Measurements of the Shadow<strong>in</strong>g of Cosmic Rays by the Moon<br />

with the <strong>IceCube</strong> Neutr<strong>in</strong>o Observatory“ Diplomarbeit, RWTH Aachen, Januar<br />

2011<br />

[12] NASA: „Moon Fact Sheet“, Juni 2011<br />

URL http://nssdc.gsfc.nasa.gov/planetary/factsheet/moonfact.html<br />

[13] Wang Bo et al.: „Moon shadow analysis –Us<strong>in</strong>g ARGO experiment“ URL<br />

physics.njnu.edu.cn/hep10th/BWang.ppt Mai 2011<br />

[14] Peter Romanczyk: „Untersuchungen zur effektiven Fläche für Neutr<strong>in</strong>os aus der<br />

Richtung des galaktischen Zentrums für die von <strong>IceCube</strong>-79 gemessenen Daten“<br />

Bachelorarbeit, RWTH Aachen (November 2010)<br />

[15] K. Nakamura et al. (Particle Data Group) JP G 37, 075021 (2010)<br />

[16] Albrecht Karle, for the <strong>IceCube</strong> Collaboration: „<strong>IceCube</strong>“ Proceed<strong>in</strong>gs of 31st<br />

ICRC, Lodz 2009<br />

René Reimann<br />

I


Literaturverzeichnis<br />

[17] URL http://gallery.icecube.wisc.edu/<strong>in</strong>ternal/v/graphics/sketchup/<br />

16 Juni 2011<br />

[18] J. Ahrens et al. „Muon trackreconstruction and data selection techniques <strong>in</strong><br />

AMANDA“ Nuclear Instruments and Methods <strong>in</strong> Physics Research A 524<br />

169–194 (2004)<br />

[19] Lars Schönherr: „Charakterisierung der mit <strong>IceCube</strong> aus Richtung des <strong>Mond</strong>es<br />

selektierten Myonenereignisse“ Bachelorarbeit, RWTH Aachen, Juli 2010<br />

[20] Ahrens, J. et al.: „Muon Track Reconstruction and Data Selection Techniques <strong>in</strong><br />

AMANDA“. Nucl. Instrum. Meth., vol. A524, pp. 169–194, 2004. doi:10.1016/j.<br />

nima.2004.01.065.<br />

[21] Hugo Stiebel: „Study of the angular resolution of the <strong>IceCube</strong> 59 str<strong>in</strong>g detector<br />

us<strong>in</strong>g the shadow<strong>in</strong>g of cosmic rays by the Moon“ Master Thesis, University<br />

of Wiscons<strong>in</strong>-Madison and Stockholm University 13 Januar 2011 URL<br />

http://www.icecube.wisc.edu/science/publications/pdd/pddwhole.php<br />

[22] Braun, J. et al.: „Methods for po<strong>in</strong>t source analysis <strong>in</strong> high energy neutr<strong>in</strong>o<br />

telescopes“ Astropart. Phys., vol. 29, pp. 299–305, 2008<br />

doi:10.1016/j.astropartphys.2008.0<strong>2.</strong>007.<br />

[23] I.A. Belolaptikov: „The Baikal underwater neutr<strong>in</strong>o telescope: Design, performance,<br />

and first results“ Astroparticle Physics, vol. 7(3), pp. 263–282, August<br />

1997.<br />

[24] Prof. Dr. Bernd Hartke: „Kapitel 8: Suche nach Nullstellen und Extremwerten“<br />

Universität Kiel, Mai 2011<br />

URL ravel.phc.uni-kiel.de/scripts/Comp_Anwendg/folien8.pdf<br />

[25] Richard Brent: „Algorithms for M<strong>in</strong>imization without derivatives“ Prentice-Hall<br />

Inc., Englewood Cliffs, NJ, 1973<br />

[26] N. Ghosh and W. W. Hager: „A derivative-free bracket<strong>in</strong>g scheme for univariate<br />

m<strong>in</strong>imization“ Computers Math. Applic. Vol. 20, No. 2, pp. 23-34, 1990<br />

[27] Brian Gough, Source Code quad_gol<strong>den</strong>.c 2009, GNU Scientific Library Version<br />

1.15 vom 6 Mai 2011, URL http://ftp.u-tx.net/gnu/gsl/<br />

[28] Philip E. Gill and Walter Murray: „Safeguarded Steplength Algorithms for Optimization<br />

us<strong>in</strong>g Descent Methods“, Division of Numerical Analysis and Comput<strong>in</strong>g,<br />

National Physical Laboratory, Tedd<strong>in</strong>gton, United K<strong>in</strong>gdom NPL Report<br />

NAC 37, August 1974<br />

[29] M. Harris, S. Sengupta, and J. D. Owens: „Parallel prefix sum (scan) with CU-<br />

DA“ GPU Gems 3, H. Nguyen, Ed. Read<strong>in</strong>g, MA: Addison-Wesley, Aug. 2007,<br />

pp. 851–876.<br />

[30] Marius Wallraff et al.: „Scientific Comput<strong>in</strong>g on Graphics Process<strong>in</strong>g Units for<br />

the Example Case of <strong>IceCube</strong>“ DPG Frühjahrstagung Karlsruhe 30 März 2011<br />

[31] Johan Seland: „CUDA Programm<strong>in</strong>g“ Geilo W<strong>in</strong>ter School Juni 2011<br />

URL http://heim.ifi.uio.no/~knutm/geilo2008/seland.pdf<br />

[32] NVIDIA CUDA: „Programm<strong>in</strong>g Guide“ Version 3.0 20 Februar 2010<br />

[33] URL http://www.po<strong>in</strong>tofview-onl<strong>in</strong>e.com/<br />

showroom.php?shop_mode=product_detail&product_id=149 20 Juni 2011<br />

[34] Jan Blumenthal: „private E-Mail“ 5 Juli 2011 RWTH Aachen<br />

II<br />

RWTH Aachen


Abbildungsverzeichnis<br />

Abbildungsverzeichnis<br />

1.1. Kosmische Botenteilchen auf dem Weg zur Erde. Gela<strong>den</strong>e Teilchen (blau) verlieren<br />

ihre Richtungs<strong>in</strong>formation. Photonen (gelb) können absorbiert wer<strong>den</strong>. Neutr<strong>in</strong>os<br />

(rot) wechselwirken nur sehr schwach.[1] . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

<strong>2.</strong>1. <strong>IceCube</strong>-Detektor am geographischen Südpol. Die verschie<strong>den</strong>en Detektorkomponenten<br />

s<strong>in</strong>d e<strong>in</strong>gezeichnet. Die unterschiedlichen Farben der Str<strong>in</strong>gs zeigen das Jahr<br />

der Inbetriebnahme an.[17] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

<strong>2.</strong><strong>2.</strong> Zur Rekonstruktion der Myonspur wird der Unterschied der theoretisch zu erwartenen<br />

und gemessenen Ankunftszeit ermittelt. Die Likelihoodfunktion zur Berechnung<br />

der Spur basiert zum Großteil auf diesem Zeitunterschied.[18] . . . . . . . . . . . . 7<br />

<strong>2.</strong>3. Zur Def<strong>in</strong>ition von σ 1 , σ 2 und α. [21] . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

<strong>2.</strong>4. Fenster des <strong>Mond</strong>schattenfensters (rot) und Def<strong>in</strong>ition der Off-Source Regionen<br />

(gelb) und der On-Source Region (grau). Für die Analyse wur<strong>den</strong> nur Daten aus<br />

dem blauen Fenster verwendet.[11] . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

3.1. L<strong>in</strong>ks: E<strong>in</strong> Gridfenster um <strong>den</strong> <strong>Mond</strong> mit 31 x 31 Punkten <strong>in</strong> Zenit und Azimut<br />

wie es <strong>in</strong> [11] benutzt wurde. Rechts: E<strong>in</strong> Gridfenster um <strong>den</strong> <strong>Mond</strong> mit 128 x 128<br />

Punkten <strong>in</strong> Zenit und Azimut wie es <strong>in</strong> dieser Arbeit benutzt wird. Das Grid enthält<br />

<strong>den</strong> Punkt (0,0). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />

3.<strong>2.</strong> Normierte H<strong>in</strong>tergrundverteilung <strong>in</strong> Zenit. Für die Berechnung des − log L-Wertes<br />

wird die Verteilung <strong>in</strong> Radiant umgerechnet. . . . . . . . . . . . . . . . . . . . . . . 10<br />

4.1. Vergleich von Berechnungsgeschw<strong>in</strong>digkeit zwischen e<strong>in</strong>er CPU und e<strong>in</strong>er GPU unter<br />

Verwendung der Programmiersprachen CUDA und OpenGL (GLSL) am Beispiel<br />

e<strong>in</strong>es Scan-Algorithmus. Die verwendete GPU ist e<strong>in</strong>e GeForce 8800 GTX und die<br />

verwendete CPU ist e<strong>in</strong> Intel Core2-Duo Extreme <strong>2.</strong>93 GHz. [29] . . . . . . . . . . 12<br />

4.<strong>2.</strong> L<strong>in</strong>ks: Organisation von Threads und Blocks auf e<strong>in</strong>em Grid.[31] Rechts: Aufrufe<br />

von Blöcken <strong>in</strong> unterschiedlichen Masch<strong>in</strong>en.[32] . . . . . . . . . . . . . . . . . . . 13<br />

4.3. Struktur des Speichers <strong>in</strong> e<strong>in</strong>er GPU.[31] . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

4.4. Skizze zur Kommunikation zwischen CPU und GPU.[30] . . . . . . . . . . . . . . . 15<br />

4.5. Schematischer Programmaufbau. Der E<strong>in</strong>satz von CPU und GPU ist zu sehen und<br />

<strong>durch</strong> die rote L<strong>in</strong>ie getrennt. Die grauen Kästchen stellen die Unterprogramme dar. 17<br />

4.6. Schema zur Verdeutlichung des M<strong>in</strong>imierungsalgorithmus. In diesem Fall wird die<br />

Obergrenze im nächsten Iterationsschritt als c gewählt. . . . . . . . . . . . . . . . . 18<br />

5.1. n s - Landkarte für e<strong>in</strong>e float<strong>in</strong>g po<strong>in</strong>t Berechnung (oben) und e<strong>in</strong>e double precision<br />

Berechnung (unten). Beispielhaft s<strong>in</strong>d Bereiche mit unstetigen Gridpunktübergängen<br />

gezeigt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

5.<strong>2.</strong> L<strong>in</strong>ks: Landschaft der absoluten n s Differenzen zwischen e<strong>in</strong>er M<strong>in</strong>imierung mit e<strong>in</strong>er<br />

Toleranz von 0.1 und 1 <strong>in</strong> n s , berechnet mit dem Brent Algorithmus. Rechts: Die<br />

Häufigkeitsverteilung der absoluten Differenzen <strong>in</strong> n s für die bei<strong>den</strong> Toleranzen. . . 22<br />

5.3. L<strong>in</strong>ks: Landschaft der absoluten n s Differenzen zwischen e<strong>in</strong>er M<strong>in</strong>imierung mit e<strong>in</strong>er<br />

Toleranz von 0.1 und 1 <strong>in</strong> n s , berechnet mit dem erweiterten Brentalgorithmus.<br />

Rechts: Die Häufigkeitsverteilung der absoluten Differenzen <strong>in</strong> n s für die bei<strong>den</strong><br />

Toleranzen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

René Reimann<br />

III


Abbildungsverzeichnis<br />

5.4. Häufigkeitsverteilung für absolute n s Werte bei e<strong>in</strong>er M<strong>in</strong>imierung mit e<strong>in</strong>er Toleranz<br />

von 1 <strong>in</strong> n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23<br />

5.5. Landschaft der Iterationen, die für die M<strong>in</strong>imierung der − log L-Funktion benötigt<br />

wur<strong>den</strong>. L<strong>in</strong>ks: Berechnung mit e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s . Rechts: Berechnung mit<br />

e<strong>in</strong>er Toleranz von 0.1 <strong>in</strong> n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

5.6. Landschaft der absoluten n s Differenz für M<strong>in</strong>imierungen mit e<strong>in</strong>er Toleranz von 1<br />

und 10 <strong>in</strong> n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

5.7. n s Landschaften von Off-Source 1 (l<strong>in</strong>ks) und Off-Source 2 (rechts) bei e<strong>in</strong>er Toleranz<br />

von 1 <strong>in</strong> n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

5.8. − log L-Landschaften von Off-Source 1 (l<strong>in</strong>ks) und Off-Source 2 (rechts) bei e<strong>in</strong>er<br />

Toleranz von 1 <strong>in</strong> n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

5.9. n s Histogramme von Off-Source 1 (l<strong>in</strong>ks) und Off-Source 2 (rechts) bei e<strong>in</strong>er Toleranz<br />

von 1 <strong>in</strong> n s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26<br />

5.10. n s Landschaften der On-Source Region. L<strong>in</strong>ks: Berechnet mit e<strong>in</strong>em CPU Cluster<br />

und 31 x 31 Gridpunkten [34]. Rechts: Berechnung mit e<strong>in</strong>er GPU und e<strong>in</strong>em Grid<br />

von 128 x 128. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

5.11. Landschaft der n s Differenzen, bei der Berechnung mit e<strong>in</strong>em CPU-Cluster und e<strong>in</strong>er<br />

GPU. Zur Berechnung wur<strong>den</strong> die Werte der CPU Berechungn an der jeweiligen<br />

Stelle <strong>in</strong>terpoliert. Es ist e<strong>in</strong>e starke Differenz im Zentrum zu erkennen. . . . . . . 27<br />

5.1<strong>2.</strong> Landschaft der n s Differenzen, bei der Berechnung mit e<strong>in</strong>em CPU-Cluster und e<strong>in</strong>er<br />

GPU. Zur Berechnung wur<strong>den</strong> die Werte der CPU Berechnung an der jeweiligen<br />

Stelle <strong>in</strong>terpoliert. Es ist e<strong>in</strong> klares Muster zu erkennen. . . . . . . . . . . . . . . . 28<br />

5.13. − log L-Landschaft für die On-Source Region, berechnet mit e<strong>in</strong>er GPU (oben) und<br />

e<strong>in</strong>em Grid von 128 x 128, sowie e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s . Unten ist die − log L-<br />

Landschaft der On-Source Region für e<strong>in</strong>e CPU-Berechnung mit e<strong>in</strong>em Grid von 31<br />

x 31 dargestellt[11]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

5.14. Signifikanz-Landschaft für die Position des <strong>Mond</strong>es, berechnet mit e<strong>in</strong>er GPU (oben)<br />

auf e<strong>in</strong>em 128x128 Grid und mit e<strong>in</strong>er CPU (unten) auf e<strong>in</strong>em 31x31 Grid [34]. . . 31<br />

6.1. Verteilung von α der Paraboloid Rekonstruktion. Es ist zu beachten, dass die y-<br />

Achse nicht bei 0 beg<strong>in</strong>nt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

6.<strong>2.</strong> Berechnung der n s Landschaft (l<strong>in</strong>ks) und der − log L-Landschaft (rechts) bei e<strong>in</strong>er<br />

Toleranz von 1 <strong>in</strong> n s und unter Verwendung e<strong>in</strong>es elliptischen Signalmodels (oben)<br />

und e<strong>in</strong>s symmetrischen (unten). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34<br />

6.3. Verteilung von NChannel der mit IC59 und <strong>Mond</strong>schattenfilter regestrierten Events. 35<br />

6.4. Histogramm der n s -Werte der Off-Source Region 1 für große (l<strong>in</strong>ks) und kle<strong>in</strong>e<br />

(rechts) NChannel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

6.5. n s -Landschaft der On-Source Region. L<strong>in</strong>ks berechnet für NChannel größer NChannel Median<br />

und rechts für NChannel kle<strong>in</strong>er NChannel Median . . . . . . . . . . . . . . . . . . . 36<br />

6.6. − log L-Landschaft der On-Source Region. L<strong>in</strong>ks berechnet für NChannel größer<br />

NChannel Median und rechts für NChannel kle<strong>in</strong>er NChannel Median . . . . . . . . . . 36<br />

6.7. Signifikanz-Landschaft der On-Source Region. L<strong>in</strong>ks berechnet für NChannel größer<br />

NChannel Median und rechts für NChannel kle<strong>in</strong>er NChannel Median . . . . . . . . . . 37<br />

A.1. n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem Brent Algorithmus und e<strong>in</strong>er Toleranz von 100. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40<br />

A.<strong>2.</strong> n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem Brent Algorithmus und e<strong>in</strong>er Toleranz von 10. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41<br />

IV<br />

RWTH Aachen


Abbildungsverzeichnis<br />

A.3. n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

A.4. n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem Brent Algorithmus und e<strong>in</strong>er Toleranz von 0,1. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

A.5. Differenzplots der n s -Landschaften der On-Source Region (unten) für verschie<strong>den</strong>e<br />

Toleranzen, berechnet mit dem Brent Algorithmus. E<strong>in</strong> symmetrisches Signalmodell<br />

wurde benutzt. Die absoluten Fluktuationen s<strong>in</strong>d für kle<strong>in</strong>e Zenitw<strong>in</strong>kel größer, da<br />

aus dieser Richtung mehr Teilchen detektiert wer<strong>den</strong>. . . . . . . . . . . . . . . . . 44<br />

A.6. n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 100. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . 45<br />

A.7. n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 10. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . 46<br />

A.8. n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . 47<br />

A.9. n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 0,1. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . 48<br />

A.10.Signifikanz-Landschaften der On-Source Region, berechnet mit dem erweitertem<br />

Brent Algorithmus und e<strong>in</strong>er Toleranz von 100 (oben l<strong>in</strong>ks), 10 (oben rechts), 1<br />

(unten l<strong>in</strong>ks) und 0,1 (unten rechts). E<strong>in</strong> symmetrisches Signalmodell wurde benutzt. 49<br />

A.11.Differenzplots der n s -Landschaften der On-Source Region (unten) für verschie<strong>den</strong>e<br />

Toleranzen, berechnet mit dem erweiterten Brent Algorithmus. E<strong>in</strong> symmetrisches<br />

Signalmodell wurde benutzt. Die absoluten Fluktuationen s<strong>in</strong>d für kle<strong>in</strong>e Zenitw<strong>in</strong>kel<br />

größer, da aus dieser Richtung mehr Teilchen detektiert wer<strong>den</strong>. . . . . . . . . . . 50<br />

A.1<strong>2.</strong>n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong><br />

elliptisches Signalmodell wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . 51<br />

A.13.Signifikanz-Landschaften der On-Source Region, berechnet mit dem erweitertem<br />

Brent Algorithmus und e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s . E<strong>in</strong> elliptisches Signalmodell<br />

wurde benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52<br />

A.14.n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt. Es wur<strong>den</strong> nur Daten mit NChannel<br />

kle<strong>in</strong>er NChannel Median benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />

A.15.n s -Landschaften (l<strong>in</strong>ks) und − log L-Landschaft (rechts) der Off-Source Region 1<br />

(oben), der Off-Source Region 2 (mitte) und der On-Source Region (unten), berechnet<br />

mit dem erweitertem Brent Algorithmus und e<strong>in</strong>er Toleranz von 1. E<strong>in</strong><br />

symmetrisches Signalmodell wurde benutzt. Es wur<strong>den</strong> nur Daten mit NChannel<br />

größer NChannel Median benutzt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54<br />

René Reimann<br />

V


Abbildungsverzeichnis<br />

A.16.Signifikanz-Landschaften der On-Source Region, berechnet mit dem erweitertem<br />

Brent Algorithmus und e<strong>in</strong>er Toleranz von 1 <strong>in</strong> n s . E<strong>in</strong> symmetrisches Signalmodell<br />

wurde benutzt. Für <strong>den</strong> oberen Plot wur<strong>den</strong> nur Events mit NChannel kle<strong>in</strong>er<br />

NChannel Median und für <strong>den</strong> unteren nur Events mit NChannel größer NChannel Median<br />

verwendet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55<br />

VI<br />

RWTH Aachen


Tabellenverzeichnis<br />

<strong>2.</strong>1. Spektrale Indize für verschie<strong>den</strong>e Energien der kosmischen <strong>Strahlung</strong> . . . . . . . . 3<br />

5.1. Rechenzeit bei gegebener Toleranz auf n s für e<strong>in</strong>e Analyse mit e<strong>in</strong>er symmetrischen<br />

Gausssignalverteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23<br />

5.<strong>2.</strong> Ergebnis e<strong>in</strong>es Fits von Funktion 5.1 an die n s Landschaft e<strong>in</strong>er GPU Analyse im<br />

zentralen 2 ◦ x2 ◦ bereich. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

6.1. Ergebnis e<strong>in</strong>es Fits mit der Funktion 5.1 an die n s Landschaft mit elliptischem und<br />

symmetrischem Signalmodell. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34<br />

6.<strong>2.</strong> Fitergebnisse der Funktion (5.1) im zentralen Bereich von 2 ◦ x 2 ◦ der n s -Landschaft<br />

der On-Source Region. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37<br />

A.1. Fitergebnisse der Funktion 5.1 im zentralen Bereich von 2 ◦ x 2 ◦ der jeweiligen n s -<br />

Landschaft der On-Source Region. . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

René Reimann<br />

VII


Selbstständigkeitserklärung<br />

Ich versichere, dass ich die Arbeit selbstständig verfasst und ke<strong>in</strong>e anderen, als die angegebenen<br />

Quellen und Hilfsmittel benutzt sowie Zitate kenntlich gemacht habe.<br />

Aachen, <strong>den</strong> 8. Juli 2011<br />

René Reimann<br />

VIII<br />

RWTH Aachen


Danksagung<br />

Diese Arbeit war ohne Unterstützung von e<strong>in</strong>er Vielzahl von Personen nicht möglich. Ich möchte<br />

mich zuerst bei Prof. Wiebusch bedanken, der mir diese Arbeit ermöglichte und mir somit e<strong>in</strong><br />

<strong>in</strong>teressantes Thema bot.<br />

Me<strong>in</strong> besonderer Dank gilt Dr. David Boersma, der mich über die gesamte Arbeit sehr gut<br />

betreute. Trotz e<strong>in</strong>iger Auslandsaufenthalte, schaffte er es immer Zeit für mich zu f<strong>in</strong><strong>den</strong>, mir<br />

Sachen zu erklären, Wissen zu vermitteln, Daten zu <strong>in</strong>terpretieren und mit mir zu diskutieren.<br />

Ebenfalls möchte ich mich ganz herzlich bei Jan Blumenthal bedanken, dessen Diplomarbeit die<br />

Grundlage für me<strong>in</strong>e Arbeit war. Er stellte mir Plots und Daten zur Verfügung und diskutierte<br />

viel und häufig mit mir über me<strong>in</strong>e Ergebnisse.<br />

Marius Wallraff möchte ich danken, da auch er viele Diskusionen mit mir führte und vorallem<br />

<strong>in</strong> technischen Angelegenheiten immer e<strong>in</strong>en Ratschlag für mich hatte.<br />

Der gesammten <strong>IceCube</strong>-Gruppe Aachen danken ich, <strong>den</strong>n sie hat mich freundlich aufgenommen<br />

und e<strong>in</strong> sehr entspanntes und produktives Umfeld geschaffen.<br />

Für Tipps und Ratschläge bedanke ich mich bei Mart<strong>in</strong> Leuermann, Kai Kr<strong>in</strong>gs und Kai Jagielski<br />

die sich mit mir <strong>den</strong> Arbeitsplatz im Tanzsaal teilten.<br />

Für das Korrekturlesen gilt me<strong>in</strong> Dank Dr. David Boersma, Jan Blumenthal, Marius Wallraff,<br />

Nad<strong>in</strong>e Schumacher und Sandra Orlowski.<br />

Zuletzt möchte ich mich bei me<strong>in</strong>er Familie und Sandra Orlowski für die Unterstützung während<br />

des gesamten Studiums bedanken. Sie unterstützten mich <strong>in</strong> dem was ich machen wollte und waren<br />

e<strong>in</strong>e Stütze, die ich nicht vermissen möchte.<br />

René Reimann<br />

IX

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!