Monte-Carlo Tests - Mathematik - Heinrich-Heine-Universität ...

Monte-Carlo Tests 

Diplomarbeit 

Wiebke Werft 

Mathematisches Institut 

der 

Heinrich-Heine-Universität Düsseldorf 

Düsseldorf im Dezember 2003 

Betreuung: Prof. Dr. Arnold Janssen

Inhaltsverzeichnis 

Einleitung 1 

1 Grundlagen 4 

1.1 Orderstatistiken . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 

1.2 Suffizienz und Vollständigkeit . . . . . . . . . . . . . . . . . . . . 5 

2 Monte-Carlo Tests 8 

2.1 Formulierung des Testproblems . . . . . . . . . . . . . . . . . . . 8 

2.2 Definition des Monte-Carlo Tests . . . . . . . . . . . . . . . . . . 9 

2.3 Die Schärfe des Monte-Carlo Tests . . . . . . . . . . . . . . . . . 13 

2.3.1 Die Schärfefunktion . . . . . . . . . . . . . . . . . . . . . . 13 

2.3.2 Die Schärfe des Monte-Carlo Tests in Abhängigkeit des Si- 

mulationsstichprobenumfangs m . . . . . . . . . . . . . . . 17 

3 Der Monte-Carlo Test als bedingter Test 22 

3.1 Theorie bedingter Tests . . . . . . . . . . . . . . . . . . . . . . . 23 

3.2 Darstellung des Monte-Carlo Tests als bedingter Test . . . . . . . 29 

3.3 Optimalitätsaussagen über Monte-Carlo Tests als bedingten Tests 33 

4 p-Werte des Monte-Carlo Tests 36 

4.1 Definition des p-Wertes . . . . . . . . . . . . . . . . . . . . . . . . 37 

4.2 Schätzen der Güte . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

4.2.1 Schätzen der Güte eines Tests mit exakt berechenbarem 

p-Wert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

4.2.2 Schätzen der Güte eines Monte-Carlo Tests . . . . . . . . . 39 

I

4.2.3 Wie wird die Anzahl I der simulierten Datensätze gewählt? 43 

4.3 Methoden zur Verbesserung bzw. 

Vereinfachung der Schätzung der Güte . . . . . . . . . . . . . . . 47 

4.3.1 Extrapolationsmethode . . . . . . . . . . . . . . . . . . . . 47 

4.3.2 Ermittlung der Stützstellen für die Extrapolationsmethode, 

falls nur I = I1 Datensätze simuliert werden. . . . . . . . . 52 

Zusammenfassung 56 

A Rechtsstetige inverse Verteilungsfunktion 58 

Symbol- und Abkürzungsverzeichnis 62 

Abbildungsverzeichnis 65 

Literaturverzeichnis 66 

Erklärung 68 

II

Einleitung 

Die statistische Testtheorie ist eine der am weitesten ausgebauten Theorien der 

Statistik. In der empirischen Forschung ist das statistische Absichern von Hypo- 

thesen durch Signifikanztests nicht mehr wegzudenken. Dabei ist die Kenntnis der 

Verteilung der Teststatistik unter der Nullhypothese, der sogenannten Prüfvertei- 

lung, für die Entscheidungsfindung von großer Bedeutung. Mit der Prüfverteilung 

wird der kritische Wert des Testproblems bestimmt, der den Ablehnungs- bzw. 

Annahmebereich definiert. 

Falls nun die exakte Verteilung der Teststatistik unter der Nullhypothese nicht 

bekannt oder nicht mit vertretbarem Rechenaufwand bestimmbar ist, tritt die 

grundlegende Problematik der Statistik auf: Wie erhält man Kenntnisse über die 

unbekannte Verteilung einer Zufallsvariablen X. Häufig befindet sich der Stati- 

stiker in der Lage, die Auswahl direkt auf eine parametrische Familie 

P = {Pϑ : ϑ ∈ Θ} von Verteilungen eingrenzen zu können. Doch die Kenntnis 

der Prüfverteilung bleibt das Nadelöhr, durch das der Statistiker hindurch muss. 

Bedingt durch die immer weiter verbreitete Verwendung von Simulationsmetho- 

den stammen unabhängig voneinander zwei Vorschläge von Dwass [6] 1957 und 

Barnard [1] 1963, dieses Problem mit Monte-Carlo Methoden zu lösen. Die Idee 

des sogenannten Monte-Carlo Tests besteht darin, mit Hilfe eines Simulations- 

experiments stochastisch unabhängige Realisierungen der Teststatistik unter der 

Nullhypothese zu erzeugen. Die Nullhypothese wird dann verworfen, wenn der 

Wert der Teststatistik des ursprünglichen Beobachtungsmaterials in einem ganz 

bestimmten Sinn nicht mehr mit den durch Monte-Carlo Methoden erzeugten 

1

Einleitung 2 

Stichproben in Beziehung gesetzt werden kann. Dieses Verfahren muss zwar für 

jeden neu vorliegenden Datensatz erneut durchgeführt werden, aber der Monte- 

Carlo Test hält unter bestimmten Voraussetzungen das vorgegebene Signifikanz- 

niveau immer ein. 

In der vorliegenden Diplomarbeit wird der Fall einer stetigen Prüfverteilung be- 

trachtet, da bereits Jöckel [12] gezeigt hat, dass sich der diskrete Fall auf den 

stetigen Fall zurückführen lässt. Sie ist in vier Kapitel gegliedert. 

Da im Rahmen der Untersuchung von Monte-Carlo Tests im großen Maße auf 

den Bereich der Orderstatistiken sowie die Eigenschaften der Suffizienz und Voll- 

ständigkeit zurückgegriffen wird, werden in Kapitel 1 die verwendeten Notationen 

sowie relevante Aussagen zu diesen Begriffen kurz vorgestellt. 

In Kapitel 2 wird zunächst das allgemeine Wesen von Testproblemen dargelegt. 

Im Anschluss daran wird der Monte-Carlo Test vorgestellt, der Anwendung fin- 

det, falls die Prüfverteilung des zu Grunde liegenden Testproblems nicht bekannt 

ist. Der Test basiert auf m zusätzlich unter der Nullhypothese simulierten Daten- 

sätze, der kritische Wert wird dann aus der k-ten Orderstatistik der m simulierten 

Daten geschätzt. Darüber hinaus wird in diesem Kapitel die Schärfe des Monte- 

Carlo Tests berechnet und eine Aussage darüber getroffen, wie sich die Schärfe 

mit wachsendem Simulationsstichprobenumfang verhält. 

Hauptsächliche Thematik des dritten Kapitels ist die Darstellung des Monte- 

Carlo Tests als bedingter Test. Nach einer kurzen Präsentation der Theorie der 

Tests mit Neyman-Struktur wird zunächst der Monte-Carlo Test so umformu- 

liert, dass die Darstellung als bedingter Test sofort erkennbar ist. Die für die 

Konstruktion notwendige suffiziente Statistik ist in diesem Fall die Orderstatistik. 

Daraufhin werden Optimalitätsaussagen für den Monte-Carlo Test basierend auf 

der Darstellung als bedingter Test getroffen. Abschließend wird ein anderer Zu- 

gang als im Kapitel 2 herausgearbeitet, wie man den Schärfezuwachs mit größer 

werdendem Simulationsstichprobenumfang begründen kann. 

In Kapitel 4 wird der Monte-Carlo Test mit Hilfe von p-Werten dargestellt. Dazu 

wird im ersten Teil die Definition des p-Wertes eingeführt und eine vom p-Wert 

abhängige Darstellung des Monte-Carlo Tests gegeben. Im zweiten Teil wird ein

Einleitung 3 

Schätzverfahren für die Güte eines Tests mit p-Wert Gestalt vorgestellt, welches 

auf Boos und Zhang [4] basiert. Diese Schätzung erfolgt für zwei Fälle. Zunächst 

wird ein Test betrachtet, für den der p-Wert als bekannt vorausgesetzt wird. Die 

Güte wird durch ein Monte-Carlo Verfahren geschätzt, welches auf O Simulatio- 

nen beruht. Im zweiten Fall ist der p-Wert unbekannt. Der Schätzung der Güte 

wird eine Schätzung des p-Wertes wiederum durch Monte-Carlo Verfahren vor- 

angestellt, welches nun auf I Simulationen beruht. Tests, die einen geschätzten 

p-Wert zu Grunde legen, werden allgemein als Monte-Carlo Tests bezeichnet. Für 

die Schätzung der Güte eines Monte-Carlo Tests benötigt man dementsprechend 

ein verschachteltes Monte-Carlo Verahren mit insgesamt O · I generierten Daten- 

sätzen. Zum Abschluss dieses Kapitels wird eine Methode vorgestellt, wie man 

diese Schätzung der Güte für den Monte-Carlo Test verbessern kann. Sie beruht 

darauf, die vorangestellte Schätzung des p-Wertes zu verbessern. Die dafür be- 

nutzte Extrapolationsmethode wird explizit an einem Beispiel diskutiert. Eine 

Überprüfungsmöglichkeit dieser Methode wird mit Hilfe der hypergeometrischen 

Verteilung vorgestellt. 

Da in dieser Diplomarbeit die Nullhypothese verworfen wird, falls der Wert der 

Teststatistik niedrig ausfällt, benötigt man für die Bestimmung des kritischen 

Wertes die rechtsstetige inverse Verteilungsfunktion. Aufgrund der Tatsache, dass 

in der Literatur vorwiegend mit der linksstetigen inversen Verteilungsfunktion 

gearbeitet wird, ist der Umgang mit der rechtsstetigen etwas ungewohnt. Daher 

beinhaltet der Anhang eine kurze Zusammenfassung der Darstellung sowie Eigen- 

schaften dieser speziellen inversen Verteilungsfunktion, die an zentralen Stellen 

dieser Arbeit verwendet wird. 

Die in dieser Arbeit eingebundenen Abbildungen wurden mit Matlab (Version 

6.1.0.450, Release 12.1) bzw. Latex erstellt.

Monte-Carlo Tests - Mathematik - Heinrich-Heine-Universität ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?