19.08.2012 Aufrufe

Stochastisches Denken als Voraussetzung für statistisches Handeln

Stochastisches Denken als Voraussetzung für statistisches Handeln

Stochastisches Denken als Voraussetzung für statistisches Handeln

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

24 1 <strong>Stochastisches</strong> <strong>Denken</strong><br />

<strong>Stochastisches</strong> <strong>Denken</strong> <strong>als</strong> <strong>Voraussetzung</strong> <strong>für</strong><br />

<strong>statistisches</strong> <strong>Handeln</strong><br />

Etwas allgemeiner formuliert, ist das stochastische <strong>Denken</strong> <strong>als</strong> eine Strategie des<br />

Lernens, <strong>Handeln</strong>s und der wissenschaftlichen Methode aufzufassen, indem die<br />

Unsicherheit und Variabilität vonDatensowieihremöglicheEntstehung<br />

auf Entscheidungen berücksichtigt wird, um Variabilitätsursachen zu erkennen<br />

und zu verringern und Problemlösungen und Handlungen zu ermöglichen,<br />

die zur stetigen Verbesserung von Produkten, Systemen und Prozessen führen,<br />

etwa in der Industrie: vgl. z. B. [Kleppmann 2001], [Snee und Hoerl 2003],<br />

[Weihs und Jessenberger 1999], [Weiss 1987] sowie [19: Nr. 7, 10, 13, 20 und 22],<br />

in der Umwelt [19: Nr. 12 und 18] oder generell zur Abschätzung von Risiken<br />

([Bernstein 1996]) und zur Aufdeckung von Betrügereien ([Bolton und Hand<br />

2002]).<br />

Datenerzeugende Prozesse – meist höchstens angenähert stabil in der Zeit – gilt<br />

es zu identifizieren, zu charakterisieren, zu quantifizieren und zu kontrollieren.<br />

Ziel ist es, durch Verringerung der Variabilität Prozesse besser zu verstehen,<br />

so daß präzisere Voraussagen möglich werden, sowie Entscheidungen zu<br />

objektivieren und zu formalisieren. Hierzu müssen sich<br />

(1) spezielles Fachwissen,<br />

(2) <strong>statistisches</strong> Wissen und<br />

(3) nach Plan gewonnene und kontrollierte Daten<br />

ergänzen. Stets angebracht ist eine skeptische Grundhaltung und die Suche nach<br />

besseren Erklärungen, d. h. „mindestens eine Bedingung oder Ursache nennen<br />

oder besser alle“ (Multikausalitätsannahme). Wichtig ist auch das <strong>Denken</strong> in<br />

Kausalnetzen, insbesondere zur Kontrolle unbeobachteter oder nichtbeabsichtigter<br />

Neben- oder Rückwirkungen, Auswirkungen aller Art; denn jeder<br />

5<br />

<strong>Stochastisches</strong> <strong>Denken</strong> (vgl. [6] und Kapitel 4) ist die kritische Einschätzung<br />

der Variabilität und Unsicherheit, Größen werden <strong>als</strong> Zufallsvariable<br />

gedacht, ihre mögliche Entstehung wird modelliert und im Gegensatz zur<br />

deterministischen Mathematik werden unter Einbeziehung der Unsicherheit<br />

mit Hilfe mathematischer Modelle Entscheidungssituationen<br />

transparent gemacht, wobei Wahrscheinlichkeitsaussagen resultieren, z. B.<br />

<strong>als</strong> Vertrauensbereiche oder anhand von Hypothesentests. <strong>Stochastisches</strong><br />

<strong>Denken</strong> ist somit das Bestreben, über Variabilität und Unsicherheit Klarheit<br />

zu gewinnen. Unsicheres Wissen mit dem Wissen um Größe und Anteil der<br />

Unsicherheit ist nützliches Wissen.


Übersicht über die Stochastik 25<br />

Sachverhalt hat mehrere Ursachen und mehrere Auswirkungen. Außerdem<br />

ist stets zu bedenken: Zu welchen anderen Ereignissen trägt ein Sachverhalt<br />

bei und von welchen anderen Bedingungen hängen Auswirkungen dieses<br />

Sachverhaltes ab. Hier ist auch „common sense“ hilfreich, Kritikfähigkeit ohne<br />

besonderes Sachwissen. Andererseits wächst der Abstand zwischen dem in unserem<br />

Fachgebiet Möglichen und dem allgemein Verständlichen: Formalisierung,<br />

Professionalisierung und Internationalisierung (vgl. die Anmerkungen A3<br />

bis A5) dominieren die Wissenschaften. Hinzu kommen interdisziplinäre Arbeitsgemeinschaften<br />

und die enge Zusammenarbeit mit der Industrie.<br />

Übersicht über die Stochastik [6] mit der<br />

Sonderstellung der Beurteilenden Statistik<br />

Wir werden uns nun punktuell mit einigen Aspekten des riesigen Gebietes „Stochastik“<br />

befassen, die in den folgenden Kapiteln durch ausgewählte, besonders<br />

charakteristische Themen der „Beurteilenden Statistik“ ergänzt werden. Ein Blick<br />

auf [6] zeigt, daß die „Beschreibende Statistik“ (vgl. [Burkschat und Mitarbeiter<br />

2004]) zur Stochastik gerechnet werden kann. Ihre Aufgaben werden in<br />

[6], [7], [9] bis [11] knapp umrissen, sie werden durch die der Beurteilenden<br />

Statistik [6] und [8] bis [13] ergänzt.<br />

Die in [6] rechts unten genannten „Stochastischen Prozesse“ behandeln Modelle<br />

<strong>für</strong> den zeitlichen Ablauf zufälliger Vorgänge. Beispiele hier<strong>für</strong> sind Populationsprozesse:<br />

Wachstumsmodelle, Modelle <strong>für</strong> Kettenreaktionen, Diffusionsprozesse<br />

sowie Warteschlangen: Telefonsysteme, Verkehrssteuerungen.<br />

Näheres ist [Beichelt und Montgomery 2003] sowie Nr. 19 und 21 in [19] zu entnehmen.<br />

Dieses Gebiet gehört in [16] zu Nr. 4.<br />

Der sich mit der mathematischen Behandlung von Zufallserscheinungen befassende<br />

Wissenschaftsbereich, der durch Wahrscheinlichkeitsrechnung, Beurteilende<br />

Statistik und deren Anwendungsgebiete gekennzeichnet ist, wird <strong>als</strong> Stochastik<br />

bezeichnet (Spezialliteratur: siehe [19]).<br />

Die Wahrscheinlichkeitsrechnung, ein Teilgebiet der Mathematik, ist die<br />

Theorie zufälliger Ereignisse und der Verteilung aller mit Zufallsvariablen zusammenhängenden<br />

möglichen Ereignissen, d. h. es werden Modelle <strong>für</strong> die Entstehung<br />

von Daten beschrieben. Sie entstand im 17. Jahrhundert mit dem Ziel,<br />

Zufallsmechanismen von Glücksspielen zu analysieren. Hierher gehören Würfelspiele,<br />

Kartenspiele und Roulette (vgl. auch (3.4)). Im Jahr 1933 erschien das<br />

grundlegende Werk zum axiomatischen Aufbau der Wahrscheinlichkeitstheorie<br />

von Andrej Nikolajewitsch Kolmogoroff (1903–1987).


26 1 <strong>Stochastisches</strong> <strong>Denken</strong><br />

6<br />

Stochastik<br />

✘✘✘❳❳❳❳<br />

✘✘<br />

�❅<br />

❳❳❳❳❳❳❳③<br />

✘✘✘<br />

� ❅<br />

✘✾ ✘✘<br />

�✠ ❅❘<br />

Wahrscheinlich- Beschreibende Beurteilende Spezialgebiete<br />

keitsrechnung Statistik<br />

Statistik<br />

(I) (II) (III) (IV)<br />

Grundlagen mit Grundlagen Grundlagen mit Planung von Ex-<br />

Kombinatorik Häufigkeitsverteilung: Beschreibender perimenten und<br />

Diskrete<br />

– eines Merkm<strong>als</strong> Statistik und Erhebungen<br />

Verteilungen –2Merkmale Wahrscheinlich- Stichprobentheorie<br />

(Urnenmodelle) zugleich<br />

keitsrechnung Qualitätskontrolle<br />

Gesetze der Statistische<br />

Punktschätzungen Zuverlässigkeits-<br />

großen Zahlen Abhängigkeit: Bereichstheorie<br />

Normalverteilungen –Kontingenz schätzungen Simulationen<br />

Grenzwertsätze – Korrelation Tests<br />

Bedienungstheorie<br />

Stochastische – Regression Analyseverfahren: Spieltheorie<br />

Prozesse mit – Zeitreihen<br />

z. B. Varianz- Entscheidungstheorie<br />

Zeitreihenanalyse<br />

analyse Stochastische<br />

Prozesse<br />

7<br />

I. In der Beschreibenden Statistik werden nur Daten strukturiert und<br />

zusammengefaßt. Eine den Daten zugrundeliegende definierte Grundgesamtheit<br />

existiert nicht. Schlußfolgerungen über den Beobachtungsbereich<br />

hinaus sind daher nicht zulässig. Man begnügt sich mit tabellarischen und<br />

graphischen Darstellungen und charakterisiert die Nicht-Zufallsstichproben<br />

durch Kennwerte (Maßzahlen, Statistiken). Hierzu gehören auch Warenkorbwerte,<br />

Preis- und Mengenindizes sowie die Zerlegung von Zeitreihen in<br />

ihre Komponenten. Liegen Grundgesamtheiten (1) oder Nichtzufallsstichproben<br />

(2) vor, so wird man nur Methoden der Beschreibenden<br />

Statistik anwenden. Das gilt auch <strong>für</strong> sehr große Zufallsstichproben (3)<br />

und häufig auch dann, wenn neue Resultate mit alten zu vergleichen sind (4),<br />

sowie auch dann, wenn die Ereignisse eine weitergehende Analyse anhand von<br />

Methoden der Beurteilenden Statistik weder wünschenswert noch notwendig<br />

erscheinen lassen (5).


Übersicht über die Stochastik 27<br />

8<br />

II. In der Beurteilenden Statistik schließt man induktiv anhand<br />

einer Zufallsstichprobe auf die zugrundeliegende Grundgesamtheit.<br />

Vorausgesetzt werden Zufallsvariablen. Wichtig ist die Wiederholbarkeit<br />

der die Daten liefernden Zufallsexperimente. Der Schluß auf die Grundgesamtheit<br />

erfolgt mit Hilfe von Vertrauensbereichen und statistischen<br />

Tests. Hierzu werden Wahrscheinlichkeitsmodelle entwickelt und angewendet,<br />

um wesentliche Effekte von zufälligen Effekten zu isolieren und beide<br />

möglichst exakt zu charakterisieren. Modelliert werden zufallsabhängige<br />

Phänomene, bestehende und mögliche reale Strukturen, die <strong>als</strong><br />

Vorbilder <strong>für</strong> Planung und Entwicklung oder <strong>als</strong> Hypothesen zur Erklärung<br />

realer Phänomene dienen können. So erhält man unvollständige, aber<br />

aufschlußreiche Beschreibungen von Phänomenen, die zu kompliziert sind,<br />

<strong>als</strong> daß sie vollständig durch ein Modell erfaßt werden. Stochastische<br />

Modelle weisen mindestens eine Zufallsvariable auf. Diese Modelle sind<br />

notwendig, um:<br />

• zufällige Schwankungen, zufällige Unregelmäßigkeiten einzelner Beobachtungen<br />

<strong>als</strong> statistische Gesetzmäßigkeiten zu erklären,<br />

• und sie gestatten es, brauchbare Erklärungsmodelle vorausgesetzt, unbekannte<br />

Werte der Modell-Parameter zu ermitteln.<br />

Beispielsweise läßt sich prüfen:<br />

• die Verträglichkeit des Mittelwertes einer Gruppe von Beobachtungen<br />

mit einem Sollwert,<br />

• die weitgehende Gleichheit zweier Gruppen von Beobachtungen bezüglich<br />

bestimmter Parameter der ihnen zugrundeliegenden Grundgesamtheiten;<br />

anhand von Wahrscheinlichkeitsaussagen kann jetzt entschieden werden:<br />

• ob der Gruppenmittelwert (anhand eines sog. Einstichprobentests)<br />

noch eher rein zufällig vom Sollwert abweicht oder nicht, d.h.nicht<br />

zufällig, sondern eher systematisch von ihm abweicht (5. Kapitel);<br />

• ob die gefundenen Unterschiede (anhand eines sog. Zweistichprobentests)<br />

wirklich existieren oder eher rein zufällig zustandegekommen<br />

sein dürften (6. Kapitel).


28 1 <strong>Stochastisches</strong> <strong>Denken</strong><br />

Die Beurteilende Statistik (III in [6]) ist<br />

(1) auffaßbar <strong>als</strong> mathematische Theorie beobachtbarer Daten,<br />

(2) deren Entstehung auf einen zufallsabhängigen physikalischen Prozeß zurückgeführt<br />

wird,<br />

(3) der das Verhalten umfangreicher Objekt- bzw. Ereignisgruppen beschreibt,<br />

d. h.,<br />

(4) deren Grundstruktur und Variabilität charakterisiert.<br />

Sie basiert auf zwei Annahmen:<br />

(1) Beobachtungen sind Realisierungen von Zufallsvariablen [8],<br />

(2) die einer bestimmten Familie von Wahrscheinlichkeitsverteilungen folgen,<br />

über deren unbekannte Parameter Aussagen erwünscht sind.<br />

Die Wiedergeburt der Beschreibenden Statistik <strong>als</strong> ehrenwerte Wissenschaft hängt<br />

mit der Bedeutung großer Datenkörper, mehrdimensionaler Datensätze zusammen,<br />

die, oft automatisch erfaßt – elegant graphisch dargestellt (zum Beispiel<br />

[Rinne 2003, S. 92–98]), – sich durch Wahrscheinlichkeitsansätze kaum zufriedenstellend<br />

analysieren lassen. Außerdem haben in solchen Fällen statistisch signifikante<br />

Effekte, eher Zufall (?), selten eine praktische Bedeutung. Generell gilt, daß<br />

die Wahl der statistischen Methodik abhängen sollte vom Umfang und der<br />

Natur des Datenkörpers und vom Zweck und Ziel der Studie. In Anmerkungen<br />

zu diesem Kapitel (A1 und A2) wird dieses Thema vertieft.<br />

Ausgangspunkt und Kern jeder Datenanalyse sind graphische Darstellungen (vgl.<br />

auch A1).<br />

Die Beurteilende Statistik hat zwei Wurzeln:<br />

Modelle, die die Mathematik liefert, und Daten, die wir der Wirklichkeit abgewinnen<br />

und denen – im Unterschied zur Mathematik – eine Unsicherheit zukommt,<br />

über die wir aufgeklärt werden wollen. Die Beurteilende Statistik ([8]<br />

bis [13]) ist daher eines der wichtigsten Forschungsinstrumente <strong>für</strong> die meisten<br />

empirischen Wissenschaften, denen sie zahlreiche Anregungen verdankt. Durch<br />

Gegenüberstellung empirischer Befunde mit Ergebnissen, die man aus Modellen<br />

herleitet, ermöglicht sie die Überprüfung wissenschaftlicher Theorien. Dem<br />

Praktiker in der Industrie, Wirtschaft und Gesellschaft liefert sie unentbehrliche<br />

Informationen <strong>als</strong> Grundlage <strong>für</strong> seine Entscheidungen.


Übersicht über die Stochastik 29<br />

9<br />

Zur Sprache der Statistik<br />

Nr. Aussage Formaler Rahmen<br />

1 Karl ist fast 2 m groß Umgangssprache<br />

2 Karl hat eine Körpergröße von<br />

198 cm<br />

Exakte Umgangssprache<br />

3 An dem Merkm<strong>als</strong>träger Karl ist Sprache der Beschreiben-<br />

das Merkmal Körpergröße mit der<br />

Merkm<strong>als</strong>ausprägung „198 cm“<br />

festgestellt worden<br />

den Statistik<br />

4 Fassen wir die Körpergröße <strong>als</strong><br />

Zufallsvariable auf und bezeichnen<br />

wirsiemit„X“, dann ist<br />

„xKarl = 198 cm“ eine<br />

Realisierung von X<br />

10<br />

Datenbeschreibung oder Verallgemeinerung?<br />

Sprache der Beurteilenden<br />

Statistik<br />

Aufgabe <strong>Voraussetzung</strong> Ziel Tätigkeit<br />

(1) Beschreiben keine Zusammenfassung einen Datenkörper<br />

knapp<br />

charakerisieren<br />

(2) Schätzen Vertrauensbereich einen Para-<br />

(3) Entscheiden<br />

Zufallsstichprobe<br />

einer<br />

definierten<br />

Grundgesamtheit<br />

bzw. randomisierteBeobachtungen<br />

meter mit<br />

vorgegebener<br />

Ungenauigkeit<br />

schätzen<br />

Statistischer Test eine Nullhypothese<br />

mit<br />

vorgegebener<br />

Ungenauigkeit<br />

prüfen


30 1 <strong>Stochastisches</strong> <strong>Denken</strong><br />

Entsprechend der Zielsetzung – beschreibend oder beurteilend – läßt sich die<br />

Statistik mit [11] zusammenfassend charakterisieren:<br />

• zahlenmäßig-strukturelle Untersuchung beliebiger Daten mit graphisch-tabellarischer<br />

Darstellung ihrer Ergebnisse bzw. <strong>als</strong><br />

• Ansatz, um aus nach allgemein anerkannten Verfahren gewonnenen Daten<br />

realer (und denkbarer) Phänomene allgemein akzeptierbare Erkenntnisse<br />

zu gewinnen und Entscheidungen zu treffen, die über den Beobachtungsbereich<br />

hinausgehen, um Unsicherheit zu überwinden, Erscheinungen unserer<br />

Umwelt zu beschreiben und spezifische Fragen zu beantworten.<br />

11<br />

Statistik Erforderliche Daten Aussagen sind<br />

Beschreibende Beliebig viele Beobachtungen<br />

einer<br />

Stichprobe oder<br />

Grundgesamtheit<br />

Beurteilende Eine dem Zweck entsprechende<br />

Anzahl<br />

(1) ohne systematische<br />

Fehler<br />

gewonnener Beobachtungen<br />

(2)<br />

einer definierten<br />

Grundgesamtheit<br />

Bei geringem Aufwand <strong>für</strong> den<br />

Beobachtungsbereich sicher, formal<br />

sind es Punktschätzungen<br />

[30]<br />

Bei hohem Aufwand weit über<br />

den Beobachtungsbereich hinaus<br />

wahrscheinlich mit P > ∼ 90%; formal<br />

sind es bevorzugt Bereichsschätzungen<br />

[63]; ermöglicht werden<br />

allgemein nachvollziehbare<br />

Schlüsse über die den Daten zugrundeliegenden<br />

Parameter oder<br />

Verteilungen<br />

Hierzu benötigen wir, wie gesagt, Zufallsstichproben oder randomisierte Beobachtungen.<br />

Ihre Gewinnung wird in Kapitel 2 beschrieben.<br />

Wesentliche Inhalte der Beurteilenden Statistik sind Prinzipien der Versuchsplanung<br />

und der Planung und Analyse von Erhebungen, Wahrscheinlichkeitsrechnung,<br />

Vertrauensbereiche, Hypothesenprüfung und Zusammenhangsanalysen. Im<br />

Vordergrund steht die Entwicklung und Anpassung spezieller Verfahren, die den<br />

jeweiligen Besonderheiten und Fragestellungen gerecht werden und die es ermöglichen,<br />

induktiv auf allgemeine Gesetzmäßigkeiten zu schließen, die über den<br />

Beobachtungsraum hinaus gültig sind, d. h. zu datenbasierten Entscheidungen<br />

und Schlußfolgerungen zu gelangen und deren Unsicherheit abzuschätzen.<br />

Vorausgesetzt wird eine sorgfältige Planung, die es gestattet, hier<strong>für</strong><br />

aussagekräftige Daten zu gewinnen und diese dann angemessen auszuwerten,<br />

so daß sie ihre Herkunft offenbaren, eine Abschätzung ihrer Unsicherheit sowie<br />

auch die angestrebte Verallgemeinerung möglich wird (vgl. auch [11] bis [13]).


Übersicht über die Stochastik 31<br />

Dies genau ist das Ziel von Wissenschaftlern und anderen Datennutzern. So kamen<br />

viele Anregungen <strong>für</strong> methodische Verbesserungen und neue statistische<br />

Ansätze aus der Praxis der zahlreichen Anwender aus Wissenschaft – hier sind<br />

insbesondere Chemiker zu nennen – und Gesellschaft.<br />

12<br />

Grundgesamtheit des<br />

Umfanges N<br />

❄<br />

�<br />

�✠<br />

✛<br />

Beschreibung Parameter<br />

Gewinnung Schlußfolgerung<br />

Zufallsstichprobe des<br />

Umfanges n<br />

Aufbereitung<br />

✲<br />

✻<br />

Beschreibung Kennwerte<br />

✻<br />

Berechnung<br />

Tabellarische und<br />

graphische Darstellung<br />

13<br />

Der induktive Schluß von den Schätzwerten einer Zufallsstichprobe auf die<br />

Parameter der Grundgesamtheit<br />

Der Schluß auf die Grundgesamtheit (GG)<br />

GG: μ σ<br />

N(μ; σ)<br />

¯x<br />

s<br />

Ziehen einer<br />

Zufallsstichprobe<br />

Punkt- und<br />

Bereichsschätzungen<br />

Daß wir hier die Normalverteilung N(μ; σ) vorgeben, bedeutet: sie ist ein<br />

wichtiges Modell (vgl. [38] bis [48]), das im folgenden Text knapp erläutert<br />

wird.


32 1 <strong>Stochastisches</strong> <strong>Denken</strong><br />

Beurteilende Statistik. Erste Hinweise über die der Zufallsstichprobe zugrundeliegende<br />

Grundgesamtheit, über die man Aussagen anstrebt, gewinnt man aus<br />

der tabellarischen und graphischen Darstellung der Daten der Zufallsstichprobe.<br />

Durch sogenannte Vertrauensbereiche und statistische Tests, die man dann<br />

aufgrund der Kennwerte berechnet, erhält man bei nicht zu kleinem Umfang<br />

n der Zufallsstichprobe Aufschluß über die (d. h. eine Beschreibung<br />

der) Grundgesamtheit, deren Umfang N man häufig <strong>als</strong> sehr groß, <strong>als</strong> unendlich<br />

groß, auffaßt.<br />

Der Prozeß der Verallgemeinerung der Resultate einer Zufallsstichprobe des<br />

Umfanges n auf die entsprechende Grundgesamtheit des Umfanges N, hier eine<br />

Normalverteilung [13] (vgl. [40]) mit den unbekannten Parametern mü (μ) und<br />

sigma (σ) –dassindfeste Zahlen, die Modelleigenschaften beschreiben –<br />

wird statistischer Rückschluß (auf Parameter; „statistical inference“) genannt.<br />

Er umfaßt drei Bereiche:<br />

• die Punktschätzung, hier die Berechnung des arithmetischen Mittels ¯x<br />

(x-quer) und der Standardabweichnung s (vgl. [30: (1),(2)]).<br />

• die Bereichsschätzung, die anhand von ¯x und s (beide werden sich rein<br />

zufällig von μ und σ unterscheiden, vgl. [13]) Grenzwerte festlegt, zwischen<br />

denen μ und σ mit vorgewählter Wahrscheinlichkeit (<strong>für</strong> die langfristig angewandte<br />

Methodik, nicht aber <strong>für</strong> den konkreten Einzelfall) liegen werden<br />

(vgl. Kapitel 5) und<br />

• den Hypothesentest, d. h. die Prüfung von Annahmen oder Hypothesen<br />

meist über unbekannte Parameter anhand eines statistischen Tests.<br />

Hierauf wird in Kapitel 5 näher eingegangen. Wesentlich ist, daß ¯x und s die<br />

Parameter μ (Erwartungswert genannt) und σ einer Normalverteilung, knapp<br />

<strong>als</strong> „N(μ; σ)“ symbolisiert, schätzen; und zwar mit einem Zufallsfehler, der anhand<br />

einer Bereichsschätzung erfaßt wird. Ein Hypothesentest wird z. B. dann<br />

erforderlich, wenn μ und/oder σ mit Sollwerten zu vergleichen sind (vgl. [60]<br />

und [61]) oder wenn mehrere Normalverteilungen auf eine mögliche Gleichheit<br />

ihrer Parameter geprüft werden sollen (vgl. [78] bis [83]).<br />

Alle diese Vergleiche werden rechnerisch mit den sogenannten empirischen Mittelwerten<br />

¯x1, ¯x2 und den empirischen Standardabweichungen s1,s2 durchgeführt<br />

(vgl. [30], wenn z. B. N(μ1,σ1) mit N(μ2,σ2) zu vergleichen ist). Mehrere Mittelwerte<br />

¯xi werden in (6.10) und (6.11) verglichen. Weiterführende Details bietet<br />

das 5. Kapitel mit [63].<br />

Fassen wir zusammen und modifizieren wir das eingangs über den Statistiker<br />

Gesagte. Ziel der Beurteilenden Statistik (vgl. [8]) istes:<br />

• das Problemfeld zu charakterisieren und


Übersicht über die Stochastik 33<br />

• die entscheidenden Fragestellungen zu formulieren,<br />

• den Problemen einer möglichst optimalen Datengewinnung nachzugehen,<br />

• den konkreten Ansatz zur Gewinnung der Daten zu formulieren,<br />

• die Daten zunächst graphisch und dann ohne oder mit Modell zu analysieren,<br />

• die Resultate übersichtlich zusammenzustellen,<br />

• die Resultate zu interpretieren, mit kritischen Details und Entscheidungen,<br />

sowie<br />

• übereinstimmende unabhängige Befunde zusammenzufassen (Meta-Analyse<br />

genannt).<br />

Mankannauchdrei Phasen und einige Stufen der Problemlösung unterscheiden.<br />

(1) Die Studienplanung mit den Themen:<br />

• Fragestellung und erstrebte Information,<br />

• Entwicklung alternativer Vorgehensweisen,<br />

• Bewertung dieser Ansätze unter Beachtung der Kosten, des Nutzens<br />

und der erforderlichen Aussagen-Sicherheit,<br />

• Entscheidung und Auswahl der Vorgehensweise.<br />

(2) Die Datengewinnung, Meßverfahren, Kontrollen; Erfassung und Speicherung<br />

der Daten.<br />

(3) Die Datenanalyse<br />

• Statistische Analyse mit den erzielten Befunden,<br />

• Bewertung der Sicherheit der Aussagen,<br />

• Erstellung eines Berichts über die Studie,<br />

• Praktische Konsequenzen der Studienresultate.<br />

Im allgemeinen stehen uns hier<strong>für</strong> sogenannte offene Grundgesamtheiten in der<br />

Zeit zur Verfügung. In der Praxis wird eine abgeschlossene Grundgesamtheit<br />

mit festen Parametern postuliert. Auf diese fiktive Grundgesamtheit –man<br />

hofft, sie sei repräsentativ <strong>für</strong> die offene Grundgesamtheit – beziehen sich dann<br />

alle Schlüsse, die die Zufallsstichprobe(n) gestatten, wobei angenommen wird,<br />

mögliche Auswahl- oder Selektionseffekte seien zu vernachlässigen.<br />

Die genannten Ziele, Phasen und Schritte im Ansatz zu kennen und mit einem<br />

Grundwissen über einfache statistische Begriffe, Konzepte und Verfahren zu


34 1 <strong>Stochastisches</strong> <strong>Denken</strong><br />

verknüpfen [14], ist unerläßlich, um statistische Befunde über unsere reale Welt<br />

zu verstehen und kritisch zu interpretieren (im englischen Sprachraum<br />

wird diese Fähigkeit „Statistical Literacy“ genannt).<br />

14<br />

Statistische Kompetenz (Statistical Literacy) bedeutet Vertrautheit<br />

mit<br />

• statistischen Begriffen, Konzepten und Modellen,<br />

• der Planung und Realisierung wissenschaftlicher Studien,<br />

• der Gewinnung, Strukturierung, Darstellung und Analyse von Daten<br />

sowie<br />

• der Fähigkeit hierüber kritisch, elegant und nachdrücklich schriftlich<br />

und mündlich zu kommunizieren.<br />

H. A. David [David und Edwards 2001] hat sich die Mühe gemacht, den Quellen zahlreicher<br />

statistischer Begriffe nachzuspüren und die Fundstellen anzugeben.<br />

Besonders aktuell sind jetzt stochastische Ansätze in Gentechnik und Immunologie,<br />

zentrale Gebiete der Lebenswissenschaften; aber auch in den Natur-,<br />

Ingenieur-, Sozial-, Geistes- und Rechtswissenschaften ist die Nutzung und praktische<br />

Umsetzung hier dargestellter Ideen <strong>als</strong> Schlüsselkompetenz aufzufassen,<br />

die es zu schärfen gilt.<br />

Die folgende Übersicht [15] berücksichtigt auch die Amtliche Statistik, die Multivariate<br />

Statistik und die erkundende oder explorative Datenanalyse, die die<br />

Beschreibende Statistik ergänzt.<br />

∗ Statistisches Bundesamt, D-65189 Wiesbaden, Gustav-Stresemann-Ring 11 mit der<br />

Website: www.destatis.de. Sie bietet tagesaktuelle Statistiknachrichten, Basis- und Wirtschaftsdaten,<br />

internationale Übersichten, methodisches Hintergrundwissen, Ansprechpartner<br />

und zahlreiche Links.<br />

In [15: (1) bis (3)] dominiert im konkreten Fall ein spezielles Problem, das gelöst<br />

werden soll. Demgegenüber sammelt die Amtliche Statistik [15: (4)] routinemäßig<br />

demographische, soziale, die Wirtschaft betreffende und andere Daten<br />

<strong>als</strong> richtungsweisende Indikatoren. Erstellt werden gesellschaftlich relevante<br />

Basisdaten, stark bestimmt von den Wünschen des Gesetzgebers und den staatlichen<br />

Verwaltungen.<br />

Da sehr umfangreiche Datenkörper anfallen, sind Zerlegungen in überschaubare<br />

Kategorien die Regel. Wertgrößen werden in eine Preis- und eine Mengenkomponente,<br />

Zeitreihen in eine Trend-, eine Saison- und eine Restkomponente,<br />

Produktivitätsmaßzahlen in eine Struktur- und eine Sachkomponente zerlegt.<br />

Häufig wird bei einer Untersuchung der zeitlichen Entwicklung eine der Kompo-


Übersicht über die Stochastik 35<br />

15<br />

Einteilung der Statistik in vier Gebiete mit angedeuteten Zusammenhängen<br />

∗ Amtlich (4)<br />

Erkundend<br />

Beschreibend<br />

(1)<br />

(3)<br />

Mehrdimensional<br />

multivariat<br />

(2) Beurteilend<br />

∗ Außerhalb von Bevölkerung, Staat und Gesellschaft hat praktisch jede Disziplin<br />

„ihre“ Statistik, etwa die Ökonometrie, die Biometrie, die Psychometrie,<br />

die Jurimetrie und die Technometrie.<br />

nenten konstant gehalten, woraus neue Konstrukte entstehen.<br />

Daten der Amtlichen Statistik findet man im „Statistischen Jahrbuch <strong>für</strong> die<br />

Bundesrepublik Deutschland“ und in der Zeitschrift „Wirtschaft und Statistik“.<br />

Daneben gibt es die nichtamtliche Statistik, deren Träger Verbände, Organisationen,<br />

Kammern, Institute und größere Unternehmen sind.<br />

Mehrdimensionale Ansätze<br />

Werden an n>2 Untersuchungseinheiten jeweils p>2 Merkmale oder Zufallsvariablen<br />

gemessen und gemeinsam analysiert, dann liegen mehrdimensionale<br />

Daten vor, die anhand multivariater Verfahren und leistungsfähiger Computer<br />

auf Struktureigenheiten untersucht werden.<br />

Multivariate Methoden dienen zur:<br />

(1) Datenreduktion: Summarische Beschreibung anhand statistischer Maßzahlen,<br />

(2) Gruppierung und zum Vergleich von Daten,<br />

(3) Untersuchung der Abhängigkeit zwischen Variablen,


36 1 <strong>Stochastisches</strong> <strong>Denken</strong><br />

(4) Voraussage sowie zur<br />

(5) Bildung und Prüfung von Hypothesen.<br />

Die beiden Hauptziele sind:<br />

• die Entdeckung von Zusammenhängen zwischen Variablen: untersucht<br />

wird z. B. die Ähnlichkeitsstruktur zwischen Variablen oder Untersuchungseinheiten;<br />

• die Überprüfung von Zusammenhängen, die der Anwender aufgrund<br />

sachlogischer oder theoretischer Überlegungen erwartet: hierher gehören<br />

z. B. Regressionsansätze (vgl. Kapitel 4).<br />

Einige multivariate Verfahren beschreibt [Rinne 2003, 3. Kapitel]. Auf die in [15]<br />

hingewiesene erkundende oder explorative (Statistik oder besser) Datenanalyse<br />

wird am Ende dieses Kapitels in der ersten Anmerkung näher eingegangen.<br />

Weitere Verfahren<br />

Viele Tests setzen zumindest angenähert normalverteilte Daten aus normalverteilten<br />

Grundgesamtheiten voraus. Die sogenannten verteilungsunabhängigen<br />

statistischen Verfahren machen keine <strong>Voraussetzung</strong>en hinsichtlich der Form der<br />

Verteilung [16]. Sie setzen lediglich Zufallsstichproben bzw. randomisierte Beobachtungen<br />

voraus (vgl. [19: Nr. 4]). In Kapitel 6 geben wir Beispiele.<br />

Statistische Ansätze und ihre <strong>Voraussetzung</strong>en<br />

Während Ansatz 1 („Beschreibende Statistik“) eine nicht unbedingt typische Momentaufnahme<br />

gewährt, ermöglichen die Ansätze 2 bis 4 („Beurteilende Statistik“)<br />

Verallgemeinerungen und Voraussagen. Häufig gewählte Ansätze<br />

sind 1 bzw. 2 und etwas seltener auch 3; Ansatz 4 ist anspruchsvoll.<br />

Kausalitätsansprüche spielen in der Statistik eine Rolle, lassen sich jedoch nur<br />

sachlogisch von Experten der betreffenden Disziplin sichern, häufig durch eine<br />

Synthese unterschiedlicher Studien. Hierbei kann der Statistiker helfend eingreifen:<br />

Randomisierte Experimente sind aussagekräftiger <strong>als</strong> beobachtende Studien<br />

(vgl. Kapitel 7) oder Stichprobenerhebungen mit z. B. durch sozial wünschenswerte<br />

Antworten verzerrten Aussagen. Hierzu kommen u. a. Stichprobenfehler<br />

und Nichtstichprobenfehler wie fehlende Erfassung und fehlende Antwort. Übrigens,<br />

eine kausale Korrelation nachzuweisen, ist unabhängig von der Größe des<br />

Korrelationskoeffizienten (vgl. [30]).<br />

Ausgeprägte Assoziationen, sogar kausale Zusammenhänge können dann auftreten,<br />

wenn randomisierte Experimente (Kapitel 2) bzw. Regressionsanalysen<br />

(Kapitel 4) Störgrößen ausschließen und der Effekt


Übersicht über die Stochastik 37<br />

16<br />

Vorgehensweisen nach zunehmender Aussagensicherheit<br />

Nr. Ansatz <strong>Voraussetzung</strong>en seitens der<br />

anhand von Software<br />

und vertiefendem<br />

Lehrbuch<br />

1 beschreibend keine<br />

Daten Untersucher<br />

2 „verteilungsunabhängig“ Randomisierte<br />

Beobachtungen bzw.<br />

Zufallsstichproben<br />

mit<br />

(a) beliebigem<br />

(b) vergleichbarem<br />

Verteilungstyp<br />

3 verteilungsgebunden<br />

mit vorliegendem<br />

Modell<br />

4 Modell muß entwickelt<br />

werden<br />

• deutlich ist,<br />

Unabhängige<br />

Beobachtungen bzw.<br />

Beobachtungspaare,<br />

die bestimmten Verteilungsannahmen<br />

folgen<br />

dem Problem<br />

angemessen<br />

• in unabhängigen Studien wiederholbar ist,<br />

Umgang mit den<br />

Symbolen<br />

+, − ,·, :,/<br />

a 2 , √ a, lg a<br />

sowie die Bereitschaft,Unklarheiten,<br />

auch<br />

Nr. 1 betreffend,<br />

mit einem/einer<br />

Statistiker/in zu<br />

klären<br />

Studium der<br />

Mathematik<br />

und/oder der<br />

Statistik<br />

• einen monotonen Zusammenhang mit der „Dosis“ aufweist, nach einer Null-<br />

Dosis verschwindet und danach wiederholt werden kann sowie<br />

• aufgrund bisherigen Wissens plausibel erscheint bzw. anhand einer vernünftigen<br />

Theorie voraussagbar ist.<br />

Hierbei ist stets an unbekannte Einfluß- und Störgrößen zu denken, auch an<br />

Betrügereien (vgl. [Bolton und Hand 2002]).<br />

Die „Produkte“ der Mathematik sind im Verlauf von Jahrhunderten entstanden.<br />

[Hischer und Lambert 2003] betonen: „Mathematik ist Problem, Prozeß und Produkt.“<br />

Wesentlich ist der schwierige Prozeß einer immer besseren – unterschiedliche<br />

Ansätze nutzenden – Ausformulierung und präziseren Darstellung des Produktes.<br />

Entsprechendes gilt <strong>für</strong> Statistik und Stochastik, <strong>für</strong> ihre Werkzeuge


38 1 <strong>Stochastisches</strong> <strong>Denken</strong><br />

und <strong>für</strong> die mit ihrer Hilfe gewonnenen theoretischen und praktischen Erkenntnisse.<br />

Einige Werkzeuge werden in den folgenden Kapiteln vorgestellt.<br />

Zunächst fünf Anmerkungen zur Stochastik: Die zweite Anmerkung wird auch<br />

gern <strong>als</strong> „Ausreißer“ betrachtet.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!