14.11.2013 Aufrufe

11. Parametrische Signifikanztests

11. Parametrische Signifikanztests

11. Parametrische Signifikanztests

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>11.</strong> <strong>Parametrische</strong> <strong>Signifikanztests</strong><br />

In den vorangegangenen Sitzungen wurde davon ausgegangen, dass einzelne empirische<br />

Verteilungen durch entsprechende theoretische Verteilungen wiedergegeben<br />

werden können. Auf dieser Grundlage wurden Wahrscheinlichkeiten berechnet. Die<br />

Frage ob die empirischen Verteilungen tatsächlich den theoretischen entsprechen<br />

oder die aus der Stichprobe berechneten Parameter die der Grundgesamtheit wiedergeben,<br />

blieb dabei unbeantwortet.<br />

Zur Klärung dieser Frage stellt die schließende Statistik die <strong>Signifikanztests</strong> zur Verfügung<br />

mit denen geprüft werden kann ob:<br />

• Der Mittelwert oder die Varianz einer Stichprobe gleich, ungleich, größer oder<br />

kleiner dem Mittelwert oder der Varianz der Grundgesamtheit ist (Parametertests)<br />

• Die empirische Verteilung durch eine theoretische Verteilung erklärt werden<br />

kann (Anpassungstests)<br />

Zur Beantwortung entsprechender Fragestellungen werden in der Statistik <strong>Signifikanztests</strong><br />

durchgeführt die nach folgendem Schema aufgebaut sind:<br />

1. Spezifikation einer Null- und einer Alternativhypothese<br />

2. Festlegung eines Signifikanzniveaus<br />

3. Auswahl einer Testfunktion<br />

4. Berechnung des Testwertes und Entscheidung<br />

Für jeden dieser vier Schritte existieren klare Vorgaben, die von der Fragestellung,<br />

die jeweils untersucht wird, abhängen. Unterschieden werden:<br />

• <strong>Parametrische</strong> Tests – die sich mit der Untersuchung von einzelnen<br />

Parametern (µ,σ,σ² ...) befassen, und<br />

• Nichtparametrische Tests – die sich mit Aussagen über die Verteilung<br />

(z.B. Normalverteilung) befassen<br />

Beispiel für einen parametrischen Test:<br />

Von der Abfüllanlage einer Brauerei werden Flaschen gefüllt, wobei die Füllmenge X<br />

pro Flasche gewissen Schwankungen unterliegt. In den Herstellerangaben der Abfüllanlage<br />

wurde angegeben, dass die durchschnittliche Füllmenge µ0 = 500 cm³, mit<br />

einer Standardabweichung von σ = 1.5, betrage. Anhand einer Stichprobe vom Umfang<br />

n = 25 wurde die durchschnittliche Füllmenge von 499.28 cm³ (= µ1) empirisch<br />

ermittelt. Anhand dieser beiden Werte können nun unterschiedliche Fragestellungen<br />

untersucht werden, abhängig von der Interessenlage der Personen, die die Untersuchung<br />

durchführen.<br />

a) eine Eichkommission ist an der generellen Abweichung vom Sollwert interessiert.<br />

b) ein Verbraucherschutzverband ist daran interessiert ob der Istwert deutlich<br />

kleiner als der Sollwert ist.<br />

c) der Brauereibesitzer ist daran interessiert ob im Mittel zuviel abgefüllt wird<br />

11-1


<strong>11.</strong>1. Formulierung der Hypothesen<br />

Beim Aufbau eines <strong>Signifikanztests</strong> werden immer zwei Hypothesen formuliert:<br />

Die Nullhypothese die mit H0 bezeichnet wird und immer die Fragestellung beschreibt,<br />

die untersucht werden soll. Im allgemeinen Formuliert die Nullhypothese die<br />

Gleichheit. Für das Beispiel wäre H0:<br />

„Ist der Mittelwert der Stichprobe gleich dem Mittelwert, den der Hersteller angegeben<br />

hat?“ Also:<br />

H0: µ0 = µ1<br />

Eine Alternativhypothese, die mit HA oder H1 bezeichnet wird und sich als Gegenhypothese<br />

aus der Fragestellung und H0 ergibt. Für das Beispiel können folgende<br />

HA formuliert werden:<br />

a) HA: µ 0 ≠µ 1<br />

b) HA: µ 1 < µ 0<br />

c) HA: µ 1 > µ 0<br />

Bei der Bestimmung des Mittelwertes µ 1 aus einer Stichprobe ist zu erwarten, dass<br />

nicht genau der tatsächliche Wert der Grundgesamtheit getroffen wird. Ist die Stichprobe<br />

repräsentativ kann aber davon ausgegangen werden das µ 1 nicht allzusehr<br />

vom tatsächlichen Wert µ 0 abweicht. Für die formulierten Hypothesen bedeutet dies:<br />

H0 (µ 1 = µ 0 ) wird abgelehnt und damit die Alternativhypothese angenommen, wenn je<br />

nach Fragestellung gilt:<br />

a) HA: µ 0 ≠µ 1 , wenn |µ 1 - µ 0 | sehr groß ist<br />

b) HA: µ 1 < µ 0 , wenn µ 1 sehr viel kleiner als µ 0 ist<br />

c) HA: µ 1 > µ 0 , wenn µ 1 sehr viel größer als µ 0 ist.<br />

Zur Präzisierung der Entscheidungen ob die Abweichungen „sehr groß“ oder „sehr<br />

viel größer bzw. kleiner“ sind, wird das Signifikanzniveau festgelegt.<br />

<strong>11.</strong>2. Signifikanzniveau<br />

Das Signifikanzniveau bezeichnet die akzeptierte Irrtumswahrscheinlichkeit mit der<br />

die Nullhypothese abgelehnt wird obwohl sie richtig ist. Oder anders ausgedrückt<br />

bezeichnet das Signifikanzniveau die Güte des Tests. Die Festlegung eines geeigneten<br />

Signifikanzniveaus ist problemorientiert, entsprechend der Fragestellung vorzunehmen.<br />

Alternativ kann das Signifikanzniveau auch als Risiko betrachtet werden, wenn es<br />

beispielsweise darum geht die Wahrscheinlichkeit für Schäden zu beziffern.<br />

In der Wasserwirtschaft werden Deiche oft so konstruiert, dass das Risiko eines Ü-<br />

berflutens zu 95% ausgeschlossen ist. Für die Sicherheit von Kernkraftwerken ist ein<br />

niedrigeres Risiko wünschenswert, so dass Unfälle mit nahezu 100%iger Sicherheit<br />

ausgeschlossen werden können.<br />

Für das Beispiel sei ein Signifikanzniveau α = 0.01 vorgegeben.<br />

11-2


Das bedeutet, dass die Wahrscheinlichkeit für die Entscheidung die Nullhypothese<br />

abzulehnen obwohl sie richtig ist bei 1% liegt. Anders ausgedrückt bedeutet dies: Die<br />

Wahrscheinlichkeit für eine richtige Entscheidung liegt bei 99%.<br />

Sehr oft muss α nicht frei bestimmt werden sondern ist durch die Vorgaben der Interessensgruppe<br />

oder durch die Aufgabenstellung a priori festgelegt.<br />

Denkbar wäre beispielsweise, dass die Eichkommission höhere Anforderungen an<br />

die Güte des Testes stellt als die Verbraucherschutzorganisationen.<br />

<strong>11.</strong>3. Auswahl der Testfunktion<br />

Die Auswahl einer geeigneten Testfunktion ist von verschiedenen Kriterien abhängig:<br />

a) Von der Art des Tests: parametrisch oder nichtparametrisch<br />

b) Vom Parameter, der durch die Nullhypothese untersucht werden soll; µ, σ, σ²<br />

c) Von der Verteilung der Grundgesamtheit aus der die Stichprobe ermittelt wurde.<br />

Die Testfunktion beschreibt nicht mehr die Verteilung der Grundgesamtheit sondern<br />

die Verteilung der Testgröße (im Falle des Beispieles die Verteilung des Mittelwerts).<br />

<strong>11.</strong>3.1. Gaußtest<br />

Beim Beispiel handelte es sich um:<br />

a) Einen parametrischen Test (Mittelwert wird untersucht)<br />

b) Untersucht wird H 0 : µ 1 = µ 0<br />

c) Die Grundgesamtheit war normalverteilt mit µ = 500 und σ = 1.5<br />

Aus diesen Kriterien folgt, dass die Testgröße N(0,1) also standardnormalverteilt ist.<br />

D.h. würden sehr viele Stichproben aus der Grundgesamtheit gezogen und die Verteilung<br />

der Mittelwerte betrachtet, wäre diese auch normalverteilt.<br />

0,45<br />

0,40<br />

0,35<br />

0,30<br />

0,25<br />

0,20<br />

0,15<br />

0,10<br />

0,05<br />

0,00<br />

-5 -4 -3 -2 -1 0 1 2 3 4 5<br />

11-3


Berechnung des Testwertes<br />

Die Testgröße v berechnet sich im Falle der Normalverteilung nach:<br />

v<br />

=<br />

X<br />

− µ 0<br />

σ<br />

Die Testgröße wird nun gegen die Werte der Standardnormalverteilung an den Signifikanzstellen<br />

verglichen um zu einer Entscheidung zu gelangen.<br />

Bei einem Signifikanzniveau von α = 0.01 bedeutet dies für die Hypothesen:<br />

H 0 : µ 0 = µ 1 wird verworfen wenn im Fall:<br />

a) HA: µ1 ≠ µ0 v außerhalb eines zentralen 99% Intervalls liegt<br />

b) HA: µ1 < µ0 v kleiner als der 1% Wert ist.<br />

c) HA: µ1 > µ0 v größer als der 99% Wert ist.<br />

n<br />

0,45<br />

0,40<br />

0,35<br />

0,30<br />

0,25<br />

0,20<br />

0,15<br />

0,10<br />

0,05<br />

0,00<br />

-5 -4 -3 -2 -1 0 1 2 3 4 5<br />

Es müssen also folgende Sachverhalte für die drei unterschiedlichen Fragestellungen<br />

bestimmt werden:<br />

H 0 : µ 1 = µ 0 ist zu verwerfen<br />

a) gegen H A : µ 1 ≠ µ 0 falls v < -X 1-α/2 oder v > X 1- α/2<br />

c) gegen HA: µ 1 < µ 0 falls v < -X 1- α<br />

d) gegen HA: µ 1 > µ 0 falls v > X 1- α<br />

11-4


Beispiel: Als Stichprobenmittel der n=25 Flaschen wurde eine Füllmenge von 499.28<br />

cm³ ermittelt.<br />

Damit berechnet sich v nach:<br />

X − µ<br />

0<br />

499.28 − 500<br />

v = n =<br />

25 = −2.4<br />

σ<br />

1.5<br />

Die Werte der Standardnormalverteilung für:<br />

-X( 1- α /2), X( 1- α /2), -X( 1- α ) und X( 1- α ) werden wie in der letzten Sitzung dargestellt aus<br />

Tabellen ermittelt. Es ergibt sich:<br />

Für a.)<br />

-X( 1- α /2) = -X(0.995) = -2.575 und<br />

X( 1- α /2) = X(0.995) = 2.575<br />

Für b.)<br />

-X( 1- α ) = -X(0.99) = -2.327<br />

Für c.)<br />

X( 1- α ) = X(0.99) = 2.327<br />

Entscheidung<br />

Mit den berechneten Parametern lassen sich nun die Hypothesen prüfen:<br />

H 0 : µ 1 = µ 0 ist zu verwerfen<br />

a) gegen H A : µ 1 ≠ µ 0 falls -2.4 < -2.575 oder 2.4 > 2.575<br />

b) gegen H A : µ 1 < µ 0 falls -2.4 < -2.372<br />

c) gegen H A : µ 1 > µ 0 falls 2.4 > 2.372<br />

Die Ergebnisse lassen sich folgendermaßen interpretieren:<br />

a) Die Eichkommission kommt zum Schluss, dass die mittlere Füllmenge der<br />

Stichprobe dem Sollwert entspricht.<br />

b) Die Verbraucherschutzkommission kommt zum Schluss, dass die mittlere<br />

Füllmenge nicht dem Sollwert entspricht.<br />

c) Der Brauereibesitzer kommt zum Schluss, die mittlere Füllmenge entspricht<br />

dem Sollwert.<br />

<strong>11.</strong>3.2. Der t-Test<br />

Der t-Test kommt zur Anwendung, wenn ein Mittelwerttest mit einer Stichprobe (mit n<br />

≤ 30) aus einer Grundgesamtheit, bei der σ oder σ² nicht bekannt ist, durchgeführt<br />

werden soll.<br />

Der Testfunktionswert v ergibt sich dabei nach:<br />

11-5


X − µ<br />

s<br />

v<br />

0<br />

=<br />

Anstelle der unbekannten Standardabweichung σ der Grundgesamtheit wird hier die<br />

Standardabweichung der Stichprobe s benutzt. Sie berechnet sich nach:<br />

n<br />

s<br />

=<br />

1<br />

n −1<br />

n<br />

∑<br />

i=<br />

1<br />

( x i<br />

− x)<br />

2<br />

Die t-Verteilung ist der Standardnormalverteilung sehr ähnlich. Ihre Funktionswerte<br />

sind von der Anzahl der Freiheitsgrade abhängig. Mit zunehmenden FG nähert sie<br />

sich immer mehr der SNV an.<br />

Die FG berechnen sich aus dem Stichprobenumfang n nach:<br />

FG<br />

= n −1<br />

0.400<br />

0.350<br />

0.300<br />

FG = 3<br />

FG = 7<br />

FG = 25<br />

0.250<br />

0.200<br />

0.150<br />

0.100<br />

0.050<br />

0.000<br />

-4 -3 -2 -1 0 1 2 3 4<br />

Beispiel für die Anwendung des t-Tests:<br />

Zehn Hohlkarabiner einer bestimmten Marke wurden der Produktion entnommen und<br />

dem Zerreißversuch unterzogen, d.h. die Belastung des Karabiners wurde solange<br />

erhöht, bis er brach. Der Bruch geschah bei folgenden Werten x i :<br />

2100, 2130, 2150, 2170, 2210, 2070, 2230, 2150, 2230, 2200 [kp]<br />

Aus versicherungstechnischen Gründen soll nun überprüft werden, ob der vom Hersteller<br />

angegebene Sollwert von 2000 kp mit 99%iger Sicherheit gewährleistet ist.<br />

Daraus ergeben sich als Hypothesen:<br />

H 0 : µ 1 = µ 0 Der Mittelwert der Stichprobe entspricht dem Sollwert<br />

H A : µ 1 < µ 0 Der Mittelwert der Stichprobe ist signifikant kleiner<br />

11-6


Aus der 99%igen Sicherheit ergibt sich das Signifikanzniveau: α = 0.01<br />

Aus dem Stichprobenumfang ergeben sich die Freiheitsgrade: FG = n – 1 = 9<br />

Zunächst müssen nun der Mittelwert und die Standardabweichung der Stichprobe<br />

bestimmt werden:<br />

n<br />

1<br />

2<br />

µ<br />

1<br />

= ∑ X i<br />

= 2164 s = ∑(<br />

x i<br />

− x)<br />

= 2960 = 54. 4<br />

n<br />

n −1<br />

1 10 i= 1<br />

i=<br />

1<br />

Und dann der Testwert berechnet werden:<br />

X − µ 2164 − 2000<br />

v = 0 n =<br />

10 9.53<br />

s<br />

54.4<br />

=<br />

Der Wert der t-Verteilung für FG = 9 und α = 0.01 wird der Tabelle entnommen und<br />

beträgt: 2.8214<br />

Entscheidung:<br />

Nullhypothese wird beibehalten da: t(9;0.01) < v (2.8214 < 9.53)<br />

Der Hersteller geht also davon aus, dass seine Karabiner dem Sollwert entsprechen.<br />

<strong>11.</strong>3.4. Der χ²-Test für Varianzen<br />

Der χ²-Test kommt zur Anwendung, wenn ein Varianzentest mit einer Stichprobe aus<br />

einer normalverteilten Grundgesamtheit durchgeführt werden soll.<br />

Der Testfunktionswert v ergibt sich dabei nach:<br />

2<br />

s<br />

v = ( n −1)<br />

2<br />

σ<br />

0<br />

1<br />

=<br />

σ<br />

2<br />

0<br />

⋅<br />

n<br />

∑<br />

i=<br />

1<br />

( x i<br />

− x)<br />

Wobei s² wiederum die Varianz der Stichprobe, σ² dagegen die Varianz der Grundgesamtheit<br />

darstellt.<br />

Die χ²-Verteilung ist eine linksteile/rechtschiefe Verteilung die einen ausschließlich<br />

positiven Wertebereich besitzt. Ihre Funktionswerte sind wie bei der t-Verteilung von<br />

der Anzahl der Freiheitsgrade abhängig.<br />

Die FG berechnen sich aus dem Stichprobenumfang n nach:<br />

FG = n −1<br />

2<br />

11-7


Beispiel für die Anwendung des t-Tests:<br />

Zehn Hohlkarabiner einer bestimmten Marke wurden der Produktion entnommen und<br />

dem Zerreißversuch unterzogen, d.h. die Belastung des Karabiners wurde solange<br />

erhöht, bis er brach. Der Bruch geschah bei folgenden Werten x i :<br />

2100, 2130, 2150, 2170, 2210, 2070, 2230, 2150, 2230, 2200 [kp]<br />

Der Hersteller möchte wissen, ob die vom Maschinenhersteller angegebene Streuung<br />

von σ 0 = 40 im Durchschnitt bei 95% der Produktion erreicht wird oder nicht.<br />

Hypothesen:<br />

H 0 : σ² 1 = σ² 0<br />

H A : σ² 1 ≠ σ² 0<br />

Signifikanzniveau:<br />

α = 0.05<br />

Freiheitsgrade:<br />

FG = 10 – 1 = 9<br />

Mittelwert und Standardabweichung der Stichprobe:<br />

n<br />

1<br />

2<br />

µ<br />

1<br />

= ∑ X i<br />

= 2164 s = ∑(<br />

x i<br />

− x)<br />

= 2960 = 54. 4<br />

n<br />

n −1<br />

1 10 i= 1<br />

Testgröße v:<br />

2<br />

n<br />

s 1<br />

v = ( n −1)<br />

= ⋅ ( − )<br />

2 2 ∑ x i<br />

x<br />

σ σ<br />

0<br />

0<br />

i=<br />

1<br />

i=<br />

1<br />

2<br />

=<br />

1<br />

1600<br />

26640 = 16.65<br />

11-8


Die Werte der χ²-Verteilung für FG=9 an den Signifikanzstellen werden der Tabelle<br />

entnommen und betragen:<br />

χ²(0.025; 9) = 2.7 und χ²(0.975; 9) = 19.023<br />

Entscheidung:<br />

Auch in diesem Fall kann die Nullhypothese beibehalten werden da:<br />

2<br />

2<br />

χ (0.025;9) < v < χ (0.975;9)<br />

2.70 < 16.65 < 19.023<br />

Zur Veranschaulichung können die Werte auch retransformiert werden mit:<br />

2<br />

² = v ⋅σ<br />

0<br />

s<br />

( n −1)<br />

Dadurch ergibt sich das Werteintervall: 22 < 40 < 58<br />

Das bedeutet die Standardabweichung der Stichprobe liegt im Intervall. Damit weicht<br />

sie nicht signifikant von der Sollgröße ab.<br />

11-9


<strong>11.</strong>4. Übungsaufgaben<br />

Aufgabe 1:<br />

Die mittlere Länge von 18 Lorbeerblätter ist 151 mm und die Standardabweichung ist<br />

15 mm. Wenn sie die Länge als normalverteilt annehmen, dann bestimmen Sie, wie<br />

viele Lorbeerblätter:<br />

a) Welche Verteilungsfunktion legen Sie für die Stichprobe zugrunde.<br />

b) zwischen 115 und 145 mm lang sind<br />

c) über 183 mm lang sind.<br />

Aufgabe 2:<br />

Ein Test der Bruchstärken von 6 Seilen, die von einer Firma hergestellt wurden, ergab<br />

eine mittlere Bruchstärke von 7750 N bei einer Standardabweichung von 145 N,<br />

während der Hersteller eine mittlere Bruchstärke von 8000 N behauptete.<br />

Können Sie bei einer Irrtumswahrscheinlichkeit von<br />

a) 0.05<br />

b) 0.01<br />

Diese Behauptung des Herstellers unterstützen?<br />

Aufgabe 3:<br />

Eine einfache Stichprobe vom Umfang 16 aus einer NV(µ, 2.5) verteilten Grundgesamtheit<br />

ergab den Mittelwert 998.2875.<br />

Testen Sie jeweils zum Signifikanzniveau α = 0.05 mit Hilfe des Gausstest:<br />

a) H 0 : µ = 1000 gegen H 1 µ ≠ 1000<br />

b) H 0 : µ ≥ 1000 gegen H 1 µ < 1000<br />

c) H 0 : µ ≤ 1000 gegen H 1 µ > 1000<br />

Aufgabe 4:<br />

Die mittlere Lebensdauer einer Stichprobe von 100 Glühbirnen, die von einer Firma<br />

hergestellt wurden, wurden mit 1570 Stunden bei einer Standardabweichung von 120<br />

Stunden berechnet. Der Hersteller vermutet, dass die mittlere Lebensdauer seiner<br />

Glühbirnen betrage 1600 Stunden betrage. Nun möchte er mit 95 %iger Sicherheit<br />

feststellen, ob diese Vermutung richtig ist.<br />

a) Stellen Sie einen geeigneten Test auf, indem Sie die Hypothesen formulieren,<br />

einen geeigneten Test wählen, dann den Test durchführen und schließlich Ihr<br />

Ergebnis in einem kurzen Text darstellen.<br />

11-10


) Die Verbraucherschutzministerin möchte wissen, wie hoch die Lebensdauer<br />

von mindestens 80% der Produktion ist. Bestimmen Sie diesen Wert für Frau<br />

Kühnast.<br />

Aufgabe 5:<br />

Bei wie vielen von 800 Familien mit 5 Kindern würden Sie:<br />

a) 3 Jungen<br />

b) 5 Mädchen<br />

c) 2 oder 3 Jungen erwarten?<br />

Wobei die Wahrscheinlichkeit für die Geburt eines Jungens gleich der für die Geburt<br />

eines Mädchens sei.<br />

Aufgabe 6:<br />

In folgender Abbildung ist die χ²-Quadrat Verteilung mit 5 Freiheitsgraden dargestellt.<br />

Bestimmen Sie die kritischen Werte von χ 2 , für die<br />

a) die Fläche rechts von Grenze 2 = 0.05 ist<br />

b) die Fläche links von Grenze 1 = 0.10 ist<br />

c) die Fläche rechts von Grenze 2 = 0.01 ist<br />

d) die Flächen rechts von Grenze 2 und links von Grenze 2 gemeinsam = 0.05<br />

ist<br />

(Hinweis zur Frage d): es gibt viele<br />

kritische Werte, für die die gesamte<br />

schraffierte Fläche gleich 0.05 ist.<br />

Nehmen Sie an, dass die beiden<br />

Flächen die gleiche Größe<br />

Grenze 1<br />

Grenze 2<br />

Aufgabe 7:<br />

Die Standardabweichung der Körpergrößen von 16 Schülern, die zufällig in einer<br />

Schule von 1000 Schülern gewählt wurden, war 2.40 cm. Bestimmen Sie die<br />

a.) 95%<br />

b.) 99%<br />

Konfidenzgrenzen für die Standardabweichung aller Schüler dieser Schule.<br />

Aufgabe 8<br />

In der Vergangenheit waren Mittelwert und Standardabweichung der Schneehöhe in<br />

Sibirien 40 cm bzw. 2.5 cm. Eine Zufallsstichprobe von 20 Messwerten im Jahr 2002<br />

ergab eine Standardabweichung von 3.2 cm. Prüfen Sie, bei einer Irrtumswahrscheinlichkeit<br />

von<br />

11-11


a.) 0.05<br />

b.) 0.01<br />

ob die scheinbare Erhöhung der Streuung signifikant ist?<br />

<strong>11.</strong>5. Musterlösung zu den Übungsaufgaben<br />

Aufgabe 1:<br />

Die mittlere Länge von 18 Lorbeerblätter ist 151 mm und die Standardabweichung ist<br />

15 mm. Wenn sie die Länge als normalverteilt annehmen, dann bestimmen Sie, wie<br />

viele Lorbeerblätter:<br />

a) Welche Verteilungsfunktion legen Sie für die Stichprobe zugrunde.<br />

Lösung: Das nur 18 Elemente in der Stichprobe vorliegen muss anstelle der Normalverteilung<br />

die t-Verteilung angewendet werden.<br />

b) zwischen 115 und 145 mm lang sind<br />

Die Vorgehensweise ist analog zur Vorgehensweise bei der Normalverteilung, mit dem<br />

Unterschied, dass die t-Verteilung über ihre Freiheitsgrade definiert ist. Diese ergeben<br />

sich aus dem Stichprobenumfang nach FG = n – 1. Also 17 Freiheitsgrade.<br />

Nun müssen die realen Werte in t-Verteilungswerte transformiert werden, nach:<br />

( X − µ )<br />

v= ⋅ n<br />

σ<br />

(115 −151)<br />

v(115) = ⋅ 18 =−10.18<br />

15<br />

(145 −151)<br />

v(145) = ⋅ 18 =−1.697<br />

15<br />

Für diese Werte können nun die tabellierten t-Verteilungswerte (FG 17) in der Tabelle in<br />

der Formelsammlung nachgesehen werden. Ein Problem dabei stellt der Wert von -10.18<br />

bzw. +10.18 dar, da er nicht tabelliert ist. Dies liegt daran, dass dieser Wert sehr weit<br />

außen in der t-Verteilung liegt und daher sehr klein bzw. sehr groß ist. In solch einem Fall<br />

kann der Wert mit 0 angenommen werden. Wir lesen also aus der Tabelle<br />

tV(-10.18) = 0 und tV(-1.697) = (1 - 0.94) = 0.06.<br />

Somit können wir folgern, dass 6% der Blätter eine Länge von 115 – 145 mm besitzen. Also<br />

maximal 1 Blatt.<br />

c) über 183 mm lang sind.<br />

Lösung: Der Funktionswert der t-Verteilung ist v(183) = +9.05. Auch dieser Wert ist<br />

nicht tabelliert. Daraus lässt sich folgern, dass die Wahrscheinlichkeit ein Blatt von einer<br />

Länge 183 mm in der Stichprobe vorzufinden, verschwindend gering ist. Die Berechnung<br />

mit Excel ergibt eine Wahrscheinlichkeit von 3.27 * 10 -8<br />

11-12


Aufgabe 2:<br />

Ein Test der Bruchstärken von 6 Seilen, die von einer Firma hergestellt wurden, ergab<br />

eine mittlere Bruchstärke von 7750 N bei einer Standardabweichung von 145 N,<br />

während der Hersteller eine mittlere Bruchstärke von 8000 N behauptete.<br />

Können Sie bei einer Irrtumswahrscheinlichkeit von<br />

a) 0.05<br />

b) 0.01<br />

Diese Behauptung des Herstellers unterstützen?<br />

Lösung: Hier handelt es sich um eine klassische Testaufgabe.<br />

Gegeben ist: µ 0 = 8000; σ = 145; µ 1 = 7750; n = 6 sowie die beiden verschiedenen Irrtumswahrscheinlichkeiten<br />

α 1 = 0.05 und α 2 = 0.01<br />

Gefragt ist: Sind die Mittelwerte gleich, was bedeutet die Abweichung ist allein auf die Stichprobenauswahl<br />

zurückzuführen. Oder ist der Mittelwert der Stichprobe (µ 1 ) signifikant kleiner<br />

als der den der Hersteller angab (µ 0 ) also systematisch.<br />

Daraus ergeben sich die Hypothesen:<br />

H 0 : µ 1 = µ 0<br />

H 1 : µ 1 < µ 0<br />

Durchzuführen ist also ein einseitiger Test der Mittelwerte (=Gausstest):<br />

Berechnung des Testwertes nach:<br />

( X −µ ) (7750 −8000)<br />

v= n = 6 =−4.223<br />

σ<br />

145<br />

Bestimmung der Funktionswerte an den Signifikanzstellen. Vorsicht, da der Stichprobenumfang<br />

nur 6 Seile beträgt muss die t-Verteilung mit n-1 Freiheitsgraden gewählt werden!<br />

Für das Signifikanzniveau α 1 = 0.05 bei 5 FG entnehmen wir den Wert: -2.01<br />

Für das Signifikanzniveau α 2 = 0.01 bei 5 FG entnehmen wir den Wert: -3.36<br />

Wir können diese Werte nun mit dem Testwert vergleichen:<br />

a) Ist -4.223 kleiner als -2.01 ?<br />

b) Ist -4.223 kleiner als -3.36 ?<br />

In beiden Fällen ist dies Wahr. Daraus folgt, dass die Alternativhypothese H 1 richtig ist und<br />

die Nullhypothese H 0 zu verwerfen ist.<br />

Dies bedeutet der Mittelwert der aus der Stichprobe ermittelt wurde weicht beide Male signifikant<br />

von der Herstellerangabe ab. Die Seile sind also weniger belastbar als der Hersteller<br />

angibt.<br />

Anschaulicher lassen sich die Werte vergleichen, wenn Sie zunächst retransformiert werden<br />

nach:<br />

11-13


X = v ⋅σ+µ<br />

n<br />

X 2.01<br />

1<br />

= − ⋅ 145 + 8000 = 7881<br />

6<br />

X 3.36<br />

2<br />

= − ⋅ 145 + 8000 = 7801<br />

6<br />

Die Ergebnisse zeigen dass der Mittelwert der Stichprobe (7750) beide Male deutlich kleiner<br />

ist als die Testwerte.<br />

Aufgabe 3:<br />

Eine einfache Stichprobe vom Umfang 16 aus einer NV(µ, 2.5) verteilten Grundgesamtheit<br />

ergab den Mittelwert 998.2875.<br />

Testen Sie jeweils zum Signifikanznievau α = 0.05 mit Hilfe des Gausstest:<br />

a) H 0 : µ = 1000 gegen H 1 µ ≠ 1000<br />

b) H 0 : µ ≥ 1000 gegen H 1 µ < 1000<br />

c) H 0 : µ ≤ 1000 gegen H 1 µ > 1000<br />

Lösung:<br />

Gegeben n = 16 (also t-verteilte Testgröße); µ = 998.2875; σ = 2.5; α = 0.05<br />

( X −µ ) (998.2875 −1000)<br />

Berechnen der Testgröße v: v= n = 16 =−2.74<br />

σ<br />

2.5<br />

Für a)<br />

Zweiseitiger Test da Ungleichheit gefragt:<br />

Hierfür werden die Werte der t-Verteilung an den Stellen 0.025 und 0.975 bei 15 Freiheitsgraden<br />

benötigt und werden aus der Tabelle bestimmt nach:<br />

t(0.025, 15) = -2.1315 und t(0.975, 15) = 2.1315<br />

Nun wird geprüft ob der Testwert im Intervall liegt: -2.1315 ?< -2.74 ?< 2.1315<br />

Wir stellen fest, er liegt außerhalb. Das bedeutet er ist signifikant unterschiedlich, damit wird<br />

H 1 angenommen und H 0 verworfen.<br />

Für b)<br />

Einseitiger Test da Kleiner Beziehung in H 1 gefragt:<br />

Wert der t-Verteilung an der Stelle 0.05: t(0.05, 15) = -1.7531<br />

Wir prüfen mit der Alternativhypothese ob der Testwert kleiner als der Wert der T-Funktion: -<br />

2.74 ?< -1.7531.<br />

Wir stellen fest, dies ist wahr. Deshalb nehmen wir die Alternativhypothese an und verwerfen<br />

die Nullhypothese. µ ist signifikant kleiner als 1000 und nicht signifikant größer.<br />

11-14


Für c)<br />

Einseitiger Test da Größer Beziehung in H 1 gefragt:<br />

Wert der t-Verteilung an der Stelle 0.95: t(0.95, 15) = 1.7531<br />

Wir prüfen mit der Alternativhypothese ob der Testwert kleiner als der Wert der T-Funktion:<br />

-2.74 ?> 1.7531.<br />

Wir stellen fest, dies ist falsch. Deshalb verwerfen wir die Alternativhypothese und nehmen<br />

die Nullhypothese an. µ ist nicht signifikant größer als 1000 sondern signifikant kleiner.<br />

Aufgabe 4:<br />

Die mittlere Lebensdauer einer Stichprobe von 100 Glühbirnen, die von einer Firma<br />

hergestellt wurden, wurden mit 1570 Stunden bei einer Standardabweichung von 120<br />

Stunden berechnet. Der Hersteller vermutet, dass die mittlere Lebensdauer seiner<br />

Glühbirnen 1600 Stunden betrage. Nun möchte er mit 95 %iger Sicherheit feststellen,<br />

ob diese Vermutung richtig ist.<br />

a) Stellen Sie einen geeigneten Test auf, indem Sie die Hypothesen formulieren,<br />

einen geeigneten Test wählen, dann den Test durchführen und schließlich Ihr<br />

Ergebnis in einem kurzen Text darstellen.<br />

Lösung: Gegeben n = 100; µ 0 = 1600, σ = 120; µ 1 = 1570; α = 0.05<br />

Der Hersteller fragt sich ob der berechnete Mittelwert signifikant von seiner Vermutung<br />

abweicht. Daraus ergeben sich die Hypothesen:<br />

H 0 : µ 0 = µ 1<br />

H 1 : µ 0 ≠ µ 1<br />

Aus den Hypothesen ergibt sich ein zweiseitiger Test, mit der Testgröße:<br />

( X −µ ) (1570 −1600)<br />

v= n = 100 =−2.5<br />

σ<br />

120<br />

Da die Mittelwerte bei ausreichend großer Stichprobe ( >30) normalverteilt sind wird der<br />

Testwert mit der SNV an den Stellen (0.025) und (0.975), nämlich dem 95% Intervall um<br />

den Wert verglichen.<br />

SNV(0.025) = -1.96 und SNV(0.975) = 1.96<br />

Nun prüfen wir ob der Wert im Intervall liegt und stellen fest, er liegt außerhalb. Deshalb<br />

nehmen wir die Alternativhypothese an und verwerfen die Nullhypothese. Die Mittelwerte<br />

sind also signifikant unterschiedlich. Der Hersteller liegt also mit seiner Annahme falsch.<br />

b) Die Verbraucherschutzministerin möchte wissen, wie hoch die Lebensdauer<br />

von mindestens 80% der Produktion ist. Bestimmen Sie diesen Wert für Frau<br />

Kühnast.<br />

Lösung: Hier ist einfach eine Intervallschätzung gefragt. KEIN TEST!!<br />

Hierfür überführen wir die gegebene Normalverteilung in eine SNV, bzw. überführen<br />

den Wert der SNV an der Stelle 0.8 SNV(0.8) = 0.845 in die Normalverteilung nach:<br />

X = Z ⋅σ+µ= 0.845⋅ 120 + 1570 = 1671<br />

11-15


Wir können Frau Kühnast also mitteilen, dass die Lebensdauer von 80% der Produktion<br />

zwischen 0 und 1671 Stunden liegt.<br />

Aufgabe 5:<br />

Bei wie vielen von 800 Familien mit 5 Kindern würden Sie:<br />

a) 3 Jungen<br />

b) 5 Mädchen<br />

c) 2 oder 3 Jungen erwarten?<br />

Wobei die Wahrscheinlichkeit für die Geburt eines Jungens gleich der für die Geburt<br />

eines Mädchens sei.<br />

Lösung: Gesucht sind Erwartungswerte einer Binominalverteilung mit unterschiedlichen<br />

Wahrscheinlichkeiten p die zunächst ausgerechnet werden müssen.<br />

Gegeben ist also zunächst eine BNV(0.5, 5)<br />

Die Wahrscheinlichkeit für berechnet sich damit für<br />

a)<br />

⎛5⎞<br />

3 2<br />

f (3) = ⎜ 0.5 ⋅ 0.5 = 10 ⋅0.125⋅ 0.25 = 0.3125<br />

3<br />

⎟<br />

⎝ ⎠<br />

b)<br />

⎛5⎞<br />

0 5<br />

f (0) = ⎜ 0.5 ⋅ 0.5 = 1⋅1⋅ 0.03125 = 0.03125<br />

0<br />

⎟<br />

⎝ ⎠<br />

c)<br />

f (2) + f (3) = 0.3125 + 0.3125 = 0.625<br />

Daraus ergeben sich nun die zu erwartenden Werte:<br />

a) n * f(3) = 800 * 0.3125 = 250 Es können also bei 250 Familien 3 Jungen erwartet<br />

werden.<br />

b) n * f(0) = 800 * 0.03125 = 25 Es können also bei 25 Familien 5 Mädchen erwartet<br />

werden.<br />

c) n * (f(2) + f(3)) = 800 * 0.625 = 500 Es können also bei 500 Familien 2 oder 3<br />

Jungen erwartet werden.<br />

11-16


Aufgabe 6<br />

Das Schaubild der Chi-Quadrat Verteilung mit 5 Freiheitsgraden ist in der Abbildung<br />

dargestellt. Bestimmen Sie die kritischen Werte von χ 2 , für die<br />

a.) die Fläche rechts von Grenze 2 = 0.05 ist<br />

b.) die Fläche links von Grenze 1 = 0.10 ist<br />

c.) die Fläche rechts von Grenze 2 = 0.01 ist<br />

d.) die Flächen rechts von Grenze 2 und links von Grenze 2 gemeinsam = 0.05<br />

ist<br />

(Hinweis zur Frage d): es gibt viele<br />

kritische Werte, für die die gesamte<br />

schraffierte Fläche gleich 0.05 ist.<br />

Nehmen Sie an, dass die beiden<br />

Flächen die gleiche Größe haben).<br />

Grenze 1<br />

Grenze 2<br />

Lösung: Die Gesamtfläche unter der Verteilung beträgt 1.<br />

a) Wenn die Fläche rechts von G2 0.05 sein soll ergibt sich die linke Seite als 1-0.05 also<br />

0.95. Dieser Wert kann aus der Tabelle abgelesen werden bei 5 FG und ergibt<br />

χ²(0.95;5) = <strong>11.</strong>070.<br />

b) χ²(0.1;5) = 0.554<br />

c) wie a) χ²(0.99;5) = 15.086<br />

d) χ²(0.025;5) = 0.831 und χ²(0.975;5) = 12.832<br />

Aufgabe 7<br />

Die Standardabweichung der Körpergrößen von 16 Schülern, die zufällig in einer<br />

Schule von 1000 Schülern gewählt wurden, war 2.40 cm. Bestimmen Sie die<br />

a.) 95%<br />

b.) 99%<br />

Konfidenzgrenzen für die Standardabweichung aller Schüler dieser Schule.<br />

Lösung: Paramtertest auf Varianz<br />

Aus s = 2.4 folgt s² = 5.76. Die Umstellung der Testfunktion nach 0 ² ergibt:<br />

v<br />

( n 1)<br />

s<br />

= − σ<br />

2<br />

2<br />

s −<br />

0<br />

σ =<br />

2<br />

2<br />

0<br />

( n 1)<br />

v<br />

11-17


für a) ergeben sich folgende χ²-Werte χ²(0.975;15) = 27.488 und χ²(0.025;15) = 6.262.<br />

Einsetzen in die Gleichung ergibt:<br />

( )<br />

2<br />

5.76 15<br />

σ<br />

0.025<br />

= = 13.79<br />

6.262<br />

2<br />

5.76( 15)<br />

σ<br />

0.975<br />

= = 3.143<br />

27.488<br />

Durch Wurzelziehen erhalten wir wieder die Standardabweichungen. Wir können also mit<br />

95%iger Sicherheit sagen, dass die Standardabweichung der Grundgesamtheit zwischen 1.77<br />

cm und 3.71 cm liegt.<br />

für b) ergeben sich folgende χ²-Werte χ²(0.995;15) = 32.801 und χ²(0.005;15) = 4.601.<br />

Einsetzen in die Gleichung ergibt:<br />

( )<br />

2<br />

5.76 15<br />

σ<br />

0.005<br />

= = 18.78<br />

4.601<br />

2<br />

5.76( 15)<br />

σ<br />

0.995<br />

= = 2.634<br />

32.801<br />

Durch Wurzelziehen erhalten wir wieder die Standardabweichungen. Wir können also mit<br />

99%iger Sicherheit sagen, dass die Standardabweichung der Grundgesamtheit zwischen 1.63<br />

cm und 4.33 cm liegt.<br />

Aufgabe 8<br />

In der Vergangenheit waren Mittelwert und Standardabweichung der Schneehöhe in<br />

Sibirien 40 cm bzw. 2.5 cm. Eine Zufallsstichprobe von 20 Messwerten im Jahr 2002<br />

ergab eine Standardabweichung von 3.2 cm. Prüfen Sie, bei einer Irrtumswahrscheinlichkeit<br />

von<br />

a.) 0.05<br />

b.) 0.01<br />

ob die scheinbare Erhöhung der Streuung signifikant ist?<br />

Lösung:<br />

Geg: µ0 = 40; σ = 2.5; n = 20; s = 3.2 σ² = 6.25 und s² = 10.24<br />

Gefr: Ist s² signifikant größer als σ²<br />

1. Hypothesen: H0: s² > σ² gegen H1: s² < σ²<br />

2<br />

s 10.24<br />

2. Berechnung des Testwertes: v= ( n− 1)<br />

= 19 ⋅ = 31.13<br />

2<br />

σ0<br />

6.25<br />

3. Bestimmung des Funktionswertes an der Konfidenzstelle:<br />

a. für 0.05 χ²(0.95; 19) = 30.144<br />

11-18


. für 0.01 χ²(0.99; 19) = 36.191<br />

4. Entscheidung:<br />

a. v ?

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!