06.10.2013 Aufrufe

Monte-Carlo Tests - Mathematik - Heinrich-Heine-Universität ...

Monte-Carlo Tests - Mathematik - Heinrich-Heine-Universität ...

Monte-Carlo Tests - Mathematik - Heinrich-Heine-Universität ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong><br />

Diplomarbeit<br />

Wiebke Werft<br />

Mathematisches Institut<br />

der<br />

<strong>Heinrich</strong>-<strong>Heine</strong>-<strong>Universität</strong> Düsseldorf<br />

Düsseldorf im Dezember 2003<br />

Betreuung: Prof. Dr. Arnold Janssen


Inhaltsverzeichnis<br />

Einleitung 1<br />

1 Grundlagen 4<br />

1.1 Orderstatistiken . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4<br />

1.2 Suffizienz und Vollständigkeit . . . . . . . . . . . . . . . . . . . . 5<br />

2 <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> 8<br />

2.1 Formulierung des Testproblems . . . . . . . . . . . . . . . . . . . 8<br />

2.2 Definition des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> . . . . . . . . . . . . . . . . . . 9<br />

2.3 Die Schärfe des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> . . . . . . . . . . . . . . . . . 13<br />

2.3.1 Die Schärfefunktion . . . . . . . . . . . . . . . . . . . . . . 13<br />

2.3.2 Die Schärfe des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> in Abhängigkeit des Si-<br />

mulationsstichprobenumfangs m . . . . . . . . . . . . . . . 17<br />

3 Der <strong>Monte</strong>-<strong>Carlo</strong> Test als bedingter Test 22<br />

3.1 Theorie bedingter <strong>Tests</strong> . . . . . . . . . . . . . . . . . . . . . . . 23<br />

3.2 Darstellung des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> als bedingter Test . . . . . . . 29<br />

3.3 Optimalitätsaussagen über <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> als bedingten <strong>Tests</strong> 33<br />

4 p-Werte des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> 36<br />

4.1 Definition des p-Wertes . . . . . . . . . . . . . . . . . . . . . . . . 37<br />

4.2 Schätzen der Güte . . . . . . . . . . . . . . . . . . . . . . . . . . 38<br />

4.2.1 Schätzen der Güte eines <strong>Tests</strong> mit exakt berechenbarem<br />

p-Wert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4.2.2 Schätzen der Güte eines <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> . . . . . . . . . 39<br />

I


4.2.3 Wie wird die Anzahl I der simulierten Datensätze gewählt? 43<br />

4.3 Methoden zur Verbesserung bzw.<br />

Vereinfachung der Schätzung der Güte . . . . . . . . . . . . . . . 47<br />

4.3.1 Extrapolationsmethode . . . . . . . . . . . . . . . . . . . . 47<br />

4.3.2 Ermittlung der Stützstellen für die Extrapolationsmethode,<br />

falls nur I = I1 Datensätze simuliert werden. . . . . . . . . 52<br />

Zusammenfassung 56<br />

A Rechtsstetige inverse Verteilungsfunktion 58<br />

Symbol- und Abkürzungsverzeichnis 62<br />

Abbildungsverzeichnis 65<br />

Literaturverzeichnis 66<br />

Erklärung 68<br />

II


Einleitung<br />

Die statistische Testtheorie ist eine der am weitesten ausgebauten Theorien der<br />

Statistik. In der empirischen Forschung ist das statistische Absichern von Hypo-<br />

thesen durch Signifikanztests nicht mehr wegzudenken. Dabei ist die Kenntnis der<br />

Verteilung der <strong>Tests</strong>tatistik unter der Nullhypothese, der sogenannten Prüfvertei-<br />

lung, für die Entscheidungsfindung von großer Bedeutung. Mit der Prüfverteilung<br />

wird der kritische Wert des Testproblems bestimmt, der den Ablehnungs- bzw.<br />

Annahmebereich definiert.<br />

Falls nun die exakte Verteilung der <strong>Tests</strong>tatistik unter der Nullhypothese nicht<br />

bekannt oder nicht mit vertretbarem Rechenaufwand bestimmbar ist, tritt die<br />

grundlegende Problematik der Statistik auf: Wie erhält man Kenntnisse über die<br />

unbekannte Verteilung einer Zufallsvariablen X. Häufig befindet sich der Stati-<br />

stiker in der Lage, die Auswahl direkt auf eine parametrische Familie<br />

P = {Pϑ : ϑ ∈ Θ} von Verteilungen eingrenzen zu können. Doch die Kenntnis<br />

der Prüfverteilung bleibt das Nadelöhr, durch das der Statistiker hindurch muss.<br />

Bedingt durch die immer weiter verbreitete Verwendung von Simulationsmetho-<br />

den stammen unabhängig voneinander zwei Vorschläge von Dwass [6] 1957 und<br />

Barnard [1] 1963, dieses Problem mit <strong>Monte</strong>-<strong>Carlo</strong> Methoden zu lösen. Die Idee<br />

des sogenannten <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> besteht darin, mit Hilfe eines Simulations-<br />

experiments stochastisch unabhängige Realisierungen der <strong>Tests</strong>tatistik unter der<br />

Nullhypothese zu erzeugen. Die Nullhypothese wird dann verworfen, wenn der<br />

Wert der <strong>Tests</strong>tatistik des ursprünglichen Beobachtungsmaterials in einem ganz<br />

bestimmten Sinn nicht mehr mit den durch <strong>Monte</strong>-<strong>Carlo</strong> Methoden erzeugten<br />

1


Einleitung 2<br />

Stichproben in Beziehung gesetzt werden kann. Dieses Verfahren muss zwar für<br />

jeden neu vorliegenden Datensatz erneut durchgeführt werden, aber der <strong>Monte</strong>-<br />

<strong>Carlo</strong> Test hält unter bestimmten Voraussetzungen das vorgegebene Signifikanz-<br />

niveau immer ein.<br />

In der vorliegenden Diplomarbeit wird der Fall einer stetigen Prüfverteilung be-<br />

trachtet, da bereits Jöckel [12] gezeigt hat, dass sich der diskrete Fall auf den<br />

stetigen Fall zurückführen lässt. Sie ist in vier Kapitel gegliedert.<br />

Da im Rahmen der Untersuchung von <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> im großen Maße auf<br />

den Bereich der Orderstatistiken sowie die Eigenschaften der Suffizienz und Voll-<br />

ständigkeit zurückgegriffen wird, werden in Kapitel 1 die verwendeten Notationen<br />

sowie relevante Aussagen zu diesen Begriffen kurz vorgestellt.<br />

In Kapitel 2 wird zunächst das allgemeine Wesen von Testproblemen dargelegt.<br />

Im Anschluss daran wird der <strong>Monte</strong>-<strong>Carlo</strong> Test vorgestellt, der Anwendung fin-<br />

det, falls die Prüfverteilung des zu Grunde liegenden Testproblems nicht bekannt<br />

ist. Der Test basiert auf m zusätzlich unter der Nullhypothese simulierten Daten-<br />

sätze, der kritische Wert wird dann aus der k-ten Orderstatistik der m simulierten<br />

Daten geschätzt. Darüber hinaus wird in diesem Kapitel die Schärfe des <strong>Monte</strong>-<br />

<strong>Carlo</strong> <strong>Tests</strong> berechnet und eine Aussage darüber getroffen, wie sich die Schärfe<br />

mit wachsendem Simulationsstichprobenumfang verhält.<br />

Hauptsächliche Thematik des dritten Kapitels ist die Darstellung des <strong>Monte</strong>-<br />

<strong>Carlo</strong> <strong>Tests</strong> als bedingter Test. Nach einer kurzen Präsentation der Theorie der<br />

<strong>Tests</strong> mit Neyman-Struktur wird zunächst der <strong>Monte</strong>-<strong>Carlo</strong> Test so umformu-<br />

liert, dass die Darstellung als bedingter Test sofort erkennbar ist. Die für die<br />

Konstruktion notwendige suffiziente Statistik ist in diesem Fall die Orderstatistik.<br />

Daraufhin werden Optimalitätsaussagen für den <strong>Monte</strong>-<strong>Carlo</strong> Test basierend auf<br />

der Darstellung als bedingter Test getroffen. Abschließend wird ein anderer Zu-<br />

gang als im Kapitel 2 herausgearbeitet, wie man den Schärfezuwachs mit größer<br />

werdendem Simulationsstichprobenumfang begründen kann.<br />

In Kapitel 4 wird der <strong>Monte</strong>-<strong>Carlo</strong> Test mit Hilfe von p-Werten dargestellt. Dazu<br />

wird im ersten Teil die Definition des p-Wertes eingeführt und eine vom p-Wert<br />

abhängige Darstellung des <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> gegeben. Im zweiten Teil wird ein


Einleitung 3<br />

Schätzverfahren für die Güte eines <strong>Tests</strong> mit p-Wert Gestalt vorgestellt, welches<br />

auf Boos und Zhang [4] basiert. Diese Schätzung erfolgt für zwei Fälle. Zunächst<br />

wird ein Test betrachtet, für den der p-Wert als bekannt vorausgesetzt wird. Die<br />

Güte wird durch ein <strong>Monte</strong>-<strong>Carlo</strong> Verfahren geschätzt, welches auf O Simulatio-<br />

nen beruht. Im zweiten Fall ist der p-Wert unbekannt. Der Schätzung der Güte<br />

wird eine Schätzung des p-Wertes wiederum durch <strong>Monte</strong>-<strong>Carlo</strong> Verfahren vor-<br />

angestellt, welches nun auf I Simulationen beruht. <strong>Tests</strong>, die einen geschätzten<br />

p-Wert zu Grunde legen, werden allgemein als <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> bezeichnet. Für<br />

die Schätzung der Güte eines <strong>Monte</strong>-<strong>Carlo</strong> <strong>Tests</strong> benötigt man dementsprechend<br />

ein verschachteltes <strong>Monte</strong>-<strong>Carlo</strong> Verahren mit insgesamt O · I generierten Daten-<br />

sätzen. Zum Abschluss dieses Kapitels wird eine Methode vorgestellt, wie man<br />

diese Schätzung der Güte für den <strong>Monte</strong>-<strong>Carlo</strong> Test verbessern kann. Sie beruht<br />

darauf, die vorangestellte Schätzung des p-Wertes zu verbessern. Die dafür be-<br />

nutzte Extrapolationsmethode wird explizit an einem Beispiel diskutiert. Eine<br />

Überprüfungsmöglichkeit dieser Methode wird mit Hilfe der hypergeometrischen<br />

Verteilung vorgestellt.<br />

Da in dieser Diplomarbeit die Nullhypothese verworfen wird, falls der Wert der<br />

<strong>Tests</strong>tatistik niedrig ausfällt, benötigt man für die Bestimmung des kritischen<br />

Wertes die rechtsstetige inverse Verteilungsfunktion. Aufgrund der Tatsache, dass<br />

in der Literatur vorwiegend mit der linksstetigen inversen Verteilungsfunktion<br />

gearbeitet wird, ist der Umgang mit der rechtsstetigen etwas ungewohnt. Daher<br />

beinhaltet der Anhang eine kurze Zusammenfassung der Darstellung sowie Eigen-<br />

schaften dieser speziellen inversen Verteilungsfunktion, die an zentralen Stellen<br />

dieser Arbeit verwendet wird.<br />

Die in dieser Arbeit eingebundenen Abbildungen wurden mit Matlab (Version<br />

6.1.0.450, Release 12.1) bzw. Latex erstellt.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!