Monte-Carlo Tests - Mathematik - Heinrich-Heine-Universität ...
Monte-Carlo Tests - Mathematik - Heinrich-Heine-Universität ...
Monte-Carlo Tests - Mathematik - Heinrich-Heine-Universität ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong><br />
Diplomarbeit<br />
Wiebke Werft<br />
Mathematisches Institut<br />
der<br />
<strong>Heinrich</strong>-<strong>Heine</strong>-<strong>Universität</strong> Düsseldorf<br />
Düsseldorf im Dezember 2003<br />
Betreuung: Prof. Dr. Arnold Janssen
Inhaltsverzeichnis<br />
Einleitung 1<br />
1 Grundlagen 4<br />
1.1 Orderstatistiken . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />
1.2 Suffizienz und Vollständigkeit . . . . . . . . . . . . . . . . . . . . 5<br />
2 <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> 8<br />
2.1 Formulierung des Testproblems . . . . . . . . . . . . . . . . . . . 8<br />
2.2 Definition des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> . . . . . . . . . . . . . . . . . . 9<br />
2.3 Die Schärfe des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> . . . . . . . . . . . . . . . . . 13<br />
2.3.1 Die Schärfefunktion . . . . . . . . . . . . . . . . . . . . . . 13<br />
2.3.2 Die Schärfe des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> in Abhängigkeit des Si-<br />
mulationsstichprobenumfangs m . . . . . . . . . . . . . . . 17<br />
3 Der <strong>Monte</strong>-<strong>Carlo</strong> Test als bedingter Test 22<br />
3.1 Theorie bedingter <strong>Tests</strong> . . . . . . . . . . . . . . . . . . . . . . . 23<br />
3.2 Darstellung des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> als bedingter Test . . . . . . . 29<br />
3.3 Optimalitätsaussagen über <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> als bedingten <strong>Tests</strong> 33<br />
4 p-Werte des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> 36<br />
4.1 Definition des p-Wertes . . . . . . . . . . . . . . . . . . . . . . . . 37<br />
4.2 Schätzen der Güte . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />
4.2.1 Schätzen der Güte eines <strong>Tests</strong> mit exakt berechenbarem<br />
p-Wert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
4.2.2 Schätzen der Güte eines <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> . . . . . . . . . 39<br />
I
4.2.3 Wie wird die Anzahl I der simulierten Datensätze gewählt? 43<br />
4.3 Methoden zur Verbesserung bzw.<br />
Vereinfachung der Schätzung der Güte . . . . . . . . . . . . . . . 47<br />
4.3.1 Extrapolationsmethode . . . . . . . . . . . . . . . . . . . . 47<br />
4.3.2 Ermittlung der Stützstellen für die Extrapolationsmethode,<br />
falls nur I = I1 Datensätze simuliert werden. . . . . . . . . 52<br />
Zusammenfassung 56<br />
A Rechtsstetige inverse Verteilungsfunktion 58<br />
Symbol- und Abkürzungsverzeichnis 62<br />
Abbildungsverzeichnis 65<br />
Literaturverzeichnis 66<br />
Erklärung 68<br />
II
Einleitung<br />
Die statistische Testtheorie ist eine der am weitesten ausgebauten Theorien der<br />
Statistik. In der empirischen Forschung ist das statistische Absichern von Hypo-<br />
thesen durch Signifikanztests nicht mehr wegzudenken. Dabei ist die Kenntnis der<br />
Verteilung der <strong>Tests</strong>tatistik unter der Nullhypothese, der sogenannten Prüfvertei-<br />
lung, für die Entscheidungsfindung von großer Bedeutung. Mit der Prüfverteilung<br />
wird der kritische Wert des Testproblems bestimmt, der den Ablehnungs- bzw.<br />
Annahmebereich definiert.<br />
Falls nun die exakte Verteilung der <strong>Tests</strong>tatistik unter der Nullhypothese nicht<br />
bekannt oder nicht mit vertretbarem Rechenaufwand bestimmbar ist, tritt die<br />
grundlegende Problematik der Statistik auf: Wie erhält man Kenntnisse über die<br />
unbekannte Verteilung einer Zufallsvariablen X. Häufig befindet sich der Stati-<br />
stiker in der Lage, die Auswahl direkt auf eine parametrische Familie<br />
P = {Pϑ : ϑ ∈ Θ} von Verteilungen eingrenzen zu können. Doch die Kenntnis<br />
der Prüfverteilung bleibt das Nadelöhr, durch das der Statistiker hindurch muss.<br />
Bedingt durch die immer weiter verbreitete Verwendung von Simulationsmetho-<br />
den stammen unabhängig voneinander zwei Vorschläge von Dwass [6] 1957 und<br />
Barnard [1] 1963, dieses Problem mit <strong>Monte</strong>-<strong>Carlo</strong> Methoden zu lösen. Die Idee<br />
des sogenannten <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> besteht darin, mit Hilfe eines Simulations-<br />
experiments stochastisch unabhängige Realisierungen der <strong>Tests</strong>tatistik unter der<br />
Nullhypothese zu erzeugen. Die Nullhypothese wird dann verworfen, wenn der<br />
Wert der <strong>Tests</strong>tatistik des ursprünglichen Beobachtungsmaterials in einem ganz<br />
bestimmten Sinn nicht mehr mit den durch <strong>Monte</strong>-<strong>Carlo</strong> Methoden erzeugten<br />
1
Einleitung 2<br />
Stichproben in Beziehung gesetzt werden kann. Dieses Verfahren muss zwar für<br />
jeden neu vorliegenden Datensatz erneut durchgeführt werden, aber der <strong>Monte</strong>-<br />
<strong>Carlo</strong> Test hält unter bestimmten Voraussetzungen das vorgegebene Signifikanz-<br />
niveau immer ein.<br />
In der vorliegenden Diplomarbeit wird der Fall einer stetigen Prüfverteilung be-<br />
trachtet, da bereits Jöckel [12] gezeigt hat, dass sich der diskrete Fall auf den<br />
stetigen Fall zurückführen lässt. Sie ist in vier Kapitel gegliedert.<br />
Da im Rahmen der Untersuchung von <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> im großen Maße auf<br />
den Bereich der Orderstatistiken sowie die Eigenschaften der Suffizienz und Voll-<br />
ständigkeit zurückgegriffen wird, werden in Kapitel 1 die verwendeten Notationen<br />
sowie relevante Aussagen zu diesen Begriffen kurz vorgestellt.<br />
In Kapitel 2 wird zunächst das allgemeine Wesen von Testproblemen dargelegt.<br />
Im Anschluss daran wird der <strong>Monte</strong>-<strong>Carlo</strong> Test vorgestellt, der Anwendung fin-<br />
det, falls die Prüfverteilung des zu Grunde liegenden Testproblems nicht bekannt<br />
ist. Der Test basiert auf m zusätzlich unter der Nullhypothese simulierten Daten-<br />
sätze, der kritische Wert wird dann aus der k-ten Orderstatistik der m simulierten<br />
Daten geschätzt. Darüber hinaus wird in diesem Kapitel die Schärfe des <strong>Monte</strong>-<br />
<strong>Carlo</strong> <strong>Tests</strong> berechnet und eine Aussage darüber getroffen, wie sich die Schärfe<br />
mit wachsendem Simulationsstichprobenumfang verhält.<br />
Hauptsächliche Thematik des dritten Kapitels ist die Darstellung des <strong>Monte</strong>-<br />
<strong>Carlo</strong> <strong>Tests</strong> als bedingter Test. Nach einer kurzen Präsentation der Theorie der<br />
<strong>Tests</strong> mit Neyman-Struktur wird zunächst der <strong>Monte</strong>-<strong>Carlo</strong> Test so umformu-<br />
liert, dass die Darstellung als bedingter Test sofort erkennbar ist. Die für die<br />
Konstruktion notwendige suffiziente Statistik ist in diesem Fall die Orderstatistik.<br />
Daraufhin werden Optimalitätsaussagen für den <strong>Monte</strong>-<strong>Carlo</strong> Test basierend auf<br />
der Darstellung als bedingter Test getroffen. Abschließend wird ein anderer Zu-<br />
gang als im Kapitel 2 herausgearbeitet, wie man den Schärfezuwachs mit größer<br />
werdendem Simulationsstichprobenumfang begründen kann.<br />
In Kapitel 4 wird der <strong>Monte</strong>-<strong>Carlo</strong> Test mit Hilfe von p-Werten dargestellt. Dazu<br />
wird im ersten Teil die Definition des p-Wertes eingeführt und eine vom p-Wert<br />
abhängige Darstellung des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> gegeben. Im zweiten Teil wird ein
Einleitung 3<br />
Schätzverfahren für die Güte eines <strong>Tests</strong> mit p-Wert Gestalt vorgestellt, welches<br />
auf Boos und Zhang [4] basiert. Diese Schätzung erfolgt für zwei Fälle. Zunächst<br />
wird ein Test betrachtet, für den der p-Wert als bekannt vorausgesetzt wird. Die<br />
Güte wird durch ein <strong>Monte</strong>-<strong>Carlo</strong> Verfahren geschätzt, welches auf O Simulatio-<br />
nen beruht. Im zweiten Fall ist der p-Wert unbekannt. Der Schätzung der Güte<br />
wird eine Schätzung des p-Wertes wiederum durch <strong>Monte</strong>-<strong>Carlo</strong> Verfahren vor-<br />
angestellt, welches nun auf I Simulationen beruht. <strong>Tests</strong>, die einen geschätzten<br />
p-Wert zu Grunde legen, werden allgemein als <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> bezeichnet. Für<br />
die Schätzung der Güte eines <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> benötigt man dementsprechend<br />
ein verschachteltes <strong>Monte</strong>-<strong>Carlo</strong> Verahren mit insgesamt O · I generierten Daten-<br />
sätzen. Zum Abschluss dieses Kapitels wird eine Methode vorgestellt, wie man<br />
diese Schätzung der Güte für den <strong>Monte</strong>-<strong>Carlo</strong> Test verbessern kann. Sie beruht<br />
darauf, die vorangestellte Schätzung des p-Wertes zu verbessern. Die dafür be-<br />
nutzte Extrapolationsmethode wird explizit an einem Beispiel diskutiert. Eine<br />
Überprüfungsmöglichkeit dieser Methode wird mit Hilfe der hypergeometrischen<br />
Verteilung vorgestellt.<br />
Da in dieser Diplomarbeit die Nullhypothese verworfen wird, falls der Wert der<br />
<strong>Tests</strong>tatistik niedrig ausfällt, benötigt man für die Bestimmung des kritischen<br />
Wertes die rechtsstetige inverse Verteilungsfunktion. Aufgrund der Tatsache, dass<br />
in der Literatur vorwiegend mit der linksstetigen inversen Verteilungsfunktion<br />
gearbeitet wird, ist der Umgang mit der rechtsstetigen etwas ungewohnt. Daher<br />
beinhaltet der Anhang eine kurze Zusammenfassung der Darstellung sowie Eigen-<br />
schaften dieser speziellen inversen Verteilungsfunktion, die an zentralen Stellen<br />
dieser Arbeit verwendet wird.<br />
Die in dieser Arbeit eingebundenen Abbildungen wurden mit Matlab (Version<br />
6.1.0.450, Release 12.1) bzw. Latex erstellt.