Verbesserung der UntergrundunterdrÃ¼ckung eines neuen CAST ...

Weitere Magazine

Empfehlungen

Info

6 Klassifikation mittels TMVA 1 Normalized occurence 0.05 X-ray events 0.04 Background 0.03 0.02 0.01 0 -30 -25 -20 -15 -10 -5 0 5 10 Likelihood ratio logQ Software efficiency 0.95 0.9 0.85 0.8 0.75 0.7 0.65 0.6 0.55 Photopeak Escape peak 0.975 0.98 0.985 0.99 0.995 Background rejection (a) (b) Abbildung 6.1: (a) Bisherige Klassifikation aus [22] mittels einer logarithmischen Likelihood Methode. Die gestrichelte Linie markiert den Schnittwert. X-ray events = Signal und Background = Untergrund. (b) Die zu (a) gehörige Untergrundunterdrückung. Eingezeichnet sind die Signaleffizienzen für den Schnittwert log Q = 5. nicht anders beschrieben, gilt, dass die Hälfte der Daten zum Trainieren und die andere Hälfte zum Testen der Methoden verwendet wird. Die Verteilungen aller Eingabevariablen sind im Anhang A.2 dargestellt. Die Optionen der gebuchten Methoden sind in Tabelle 6.1 zusammengefasst. MLP Es wurde jeweils einmal das Backpropagation und das BFGS Verfahren trainiert. Wie zuvor beschrieben, werden die Eingabedaten normiert. Um die Rechenzeit zu minimieren, werden nur 30 % der Trainingsdaten verwendet; diese werden zufällig ausgewählt. Beide Netzwerke haben eine Zwischenebene mit N+5 Neuronen, wobei N die Anzahl der Variablen ist. Es wurden 20 Variablen verwendet. N+5 bietet einen Kompromiss aus Genauigkeit und Rechenzeit. Alle 5 Durchläufe sollen vier (MLP_BFGS) bzw. sechs (MLP_BP) aufeinanderfolgende Konvergenztests durchgeführt werden. Die Lernrate wird auf 0,05 gesetzt. SVM Da die SVM, anders als die neuronalen Netzwerke, keine Parameter zur Beschränkung des Trainingsdatensatzes bieten, laufen sie unter einem weiteren Factory Objekt. In diesem werden 10000 Ereignisse aus dem Signaldatensatz und die Hälfte des Untergrunddatensatz zum Training verwendet. Die drei verfügbaren Parameter (beschrieben in 4.2.4) der SVM bieten sehr viel Spielraum und müssen dem Problem entsprechend angepasst werden. Die Werte in Tabelle 6.1 bilden einen guten Kompromiss zwischen Genauigkeit und geringem Overtraining. BDT Es wurden zwei verschiedene Methoden für Boosted Decision Trees verwendet. Einerseits eine Sammlung simpler Trees, mit einer maximalen Tiefe von 3 und andererseits eine erlaubte Tiefe von 15. Beide BDTs bestehen aus einem forest mit 300 Trees und einer minimalen Anzahl von Ereignissen pro Knotenpunkt von 43. In beiden Fällen wird pruning angewendet, wobei TMVA den optimalen Schnittwert selber sucht. Der beim Boosting auftretende Parameter β wird auf 0.6 gesetzt. Mit diesen Einstellungen wird nun das Training durchgeführt. In Abbildung 6.3 sind die Verteilungen der einzelnen Methoden für die Trainings- und Testdatensätze dargestellt. 34
6.1 Trainieren mit allen Daten MLPs Option MLP_BFGS MLP_BP VarTransform Norm Norm TrainingMethod BFGS BP Sampling 0.3 0.3 SamplingImportance 1 1 HiddenLayers N+5 N+5 ConvergenceTests 4 6 TestRate 5 5 LearningRate 0.05 0.05 BDTs Option BDT_AdaBoost BDT_AdaBoost_Depth VarTransform Deco Deco BoostType AdaBoost AdaBoost NTrees 300 300 MaxDepth 3 15 nEventsMin 43 43 PruneStrength -1 -1 PruneMethod CostComplexity CostComplexity AdaBoostBeta 0.6 0.6 SVM Option SVM VarTranfsorm None C 4 Tol 0.05 Gamma 0.25 MaxIter 1000 Tabelle 6.1: Tabelle der gebuchten Methoden mit ihren gewählten Optionen. Jeweils zwei MLPs und BDTs mit leicht unterschiedlichen Optionen und eine SVM. 35
Seite 1 und 2: Verbesserung der Untergrundunterdr
Seite 3 und 4: Inhaltsverzeichnis 1 Einleitung 1 2
Seite 5: KAPITEL 1 Einleitung Das Standardmo
Seite 8 und 9: 2 Axionen Abbildung 2.1: Darstellun
Seite 11 und 12: KAPITEL 3 CERN Axion Solar Telescop
Seite 13 und 14: 3.2 Daten und Spektrum der 55 Fe Qu
Seite 15 und 16: KAPITEL 4 TMVA Das Toolkit for Mult
Seite 17 und 18: 4.1 Aufbau wiederum Variablen eines
Seite 19 und 20: 4.2 Methoden schen Signal und Unter
Seite 21 und 22: 4.2 Methoden Klassifikation mittels
Seite 23 und 24: 4.2 Methoden die Likelihood-Methode
Seite 25 und 26: 4.2 Methoden Backpropagation - BP A
Seite 27 und 28: 4.2 Methoden x 2 Support Vectors Hy
Seite 29 und 30: 4.2 Methoden Knotenpunkt einen gewi
Seite 31 und 32: KAPITEL 5 Vorbereitung der Daten Al
Seite 33 und 34: 5.1 Energiekalibrierung Gesamtladun
Seite 35 und 36: 5.2 Erzeugung künstlicher, niedere
Seite 37: KAPITEL 6 Klassifikation mittels TM
Seite 41 und 42: 6.1 Trainieren mit allen Daten TMVA
Seite 43 und 44: 6.2 Trainieren mit Schnitt auf Ener
Seite 45 und 46: 6.3 Vergleich mit Likelihood Method
Seite 47 und 48: 6.4 Klassifikation der künstlich e
Seite 49: 6.4 Klassifikation der künstlich e
Seite 52 und 53: 7 Betrachtung falsch klassifizierte
Seite 55 und 56: KAPITEL 8 Zusammenfassung und Ausbl
Seite 57 und 58: ANHANG A Anhang A.1 Quellcode Der f
Seite 59 und 60: A.1 Quellcode } // mussen in beiden
Seite 61 und 62: A.1 Quellcode delete factory [2]; d
Seite 63 und 64: A.1 Quellcode theTree ->SetBranchAd
Seite 65 und 66: A.2 Eingabe-Daten aller Variablen A
Seite 67 und 68: A.3 Klassifikation A.3 Klassifikati
Seite 69 und 70: A.3 Klassifikation A.3.2 Schnitt au
Seite 71 und 72: A.3 Klassifikation A.3.3 Energetisc
Seite 73 und 74: A.4 Falsch klassifizierte Ereigniss
Seite 75 und 76: Literatur [1] C. A. Baker u. a.,
Seite 77: Literatur [22] C. Krieger, J. Kamin

Verbesserung der UntergrundunterdrÃ¼ckung eines neuen CAST ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?