23.05.2014 Aufrufe

Fehlerrechnung für Einsteiger - Universität Hamburg

Fehlerrechnung für Einsteiger - Universität Hamburg

Fehlerrechnung für Einsteiger - Universität Hamburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Fehlerrechnung</strong> für <strong>Einsteiger</strong><br />

Eine beispielorientierte Einführung für Studierende der TUHH<br />

1. Messungen und Ungenauigkeit<br />

Viele physikalische Größen (z.B. eine Länge, Temperatur oder eine Masse) können durch<br />

Messungen direkt bestimmt werden. Solche Messwerte haben die Eigenschaft, daß sie um den<br />

wahren Wert verteilt sind, man sagt, sie „streuen“. Stellen Sie sich zehnmal hintereinander auf<br />

eine „genaue“ Personenwaage und Sie bekommen zehn verschiedene Ergebnisse – obwohl<br />

Sie jedesmal ganz sicher die gleiche Masse mitbringen. Das liegt daran, daß jeder Meßvorgang<br />

von Natur aus mit einer Ungenauigkeit behaftet ist, die gemeinhin als „Fehler“ bezeichnet<br />

wird. Damit Sie und andere den Meßwert von 78,34655 kg, den Sie an Ihrer genauen<br />

Waage ablesen, überhaupt interpretieren können, ist es nötig, die besagte Ungenauigkeit mit<br />

anzugeben.<br />

In wissenschaftlichen Experimenten ist die Angabe solcher Ungenauigkeiten besonders wichtig,<br />

um einzuschätzen, in welchem Wertebereich der wahre Wert mit welcher Wahrscheinlichkeit<br />

liegt, diesen Wert also „einzugrenzen“. Ohne eine solche Eingrenzung ist die Angabe eines<br />

Wertes, wie etwa Ihre 78,34655 kg, aussage- und sinnlos. Was also ist zu tun? Wir müssen...<br />

• ...das Experiment so entwerfen, daß der Fehler möglichst klein wird. Im Praktikum ist<br />

in dieser Hinsicht nicht sehr viel Handlungsspielraum gegeben, weil die meisten<br />

Versuche und deren Ablauf vorgegeben sind.<br />

• ...die Ungenauigkeit des Ergebnisses bestimmen.<br />

• ...rauskriegen, wie groß die Wahrscheinlichkeit dafür ist, daß bei einer Wiederholung<br />

des Experiments das Ergebnis in diesem Fehlerbereich liegt.<br />

Das typische Vorgehen ist, wie im Beispiel der Personenwaage, daß man die Messung ein und<br />

derselben Größe mehrmals durchführt, was zu einer Meßreihe führt. Mehrere Meßreihen kann<br />

man auch zu einer einzigen, großen zusammenfassen, allerdings muß man dann unterscheiden,<br />

ob alle Meßreihen unter den gleichen Bedingungen stattgefunden haben, oder ob diese<br />

zwischendurch geändert wurden (z.B. ein anderes Meßgerät benutzt), denn dann ändert sich<br />

i.a. auch die Streuung der Meßwerte.<br />

Bis einschließlich Kapitel 5 gehen wir von Meßreihen unter gleichen Bedingungen aus.<br />

Wie gebe ich Fehler an? Der Fehler, besser: die Ungenauigkeit einer physikalischen Größe x<br />

wird oft als ∆x bezeichnet, was nicht mit einer Differenz verwechselt werden darf. Eine bestimmte<br />

Sorte Fehler ist die Standardabweichung σ x , auf die wir später noch eingehen werden.<br />

Der Index gibt die physikalische Größe an, auf die sich dieser Fehler bezieht.<br />

Fehlerwerte können<br />

• absolut (∆x),<br />

• relativ (∆x/x) oder<br />

• prozentual (∆x/x·100%)<br />

angegeben werden.<br />

absolut : m=(78,35±0,61) kg<br />

relativ: m=78,35 kg ±7,8·10 -3<br />

prozentual: m=78,35 kg ±0,78 %<br />

Die Fehler sind hier nur Phantasiewerte,<br />

um die Notation deutlich zu machen.<br />

1


Im Beispielkasten rechts sehen Sie, daß ich nicht alle Nachkommastellen mitgenommen habe,<br />

die Ihre Waage angezeigt hat, denn wenn der Fehler ∆m=0,61 kg beträgt, macht es natürlich<br />

keinen Sinn, noch mehr Nachkommastellen für m anzugeben – diese sind ja viel kleiner als<br />

die Ungenauigkeit. Wichtig ist also: Mehr Stellen hinter dem Komma machen den Zahlenwert<br />

nicht genauer! Das gilt für Personenwaagen ebenso wie für Elementarteilchen-Detektoren in<br />

Wohnblockgröße.<br />

Die <strong>Fehlerrechnung</strong> liefert das Handwerkszeug, um aus den Meßwerten einer physikalischen<br />

Größe den Fehler dieser Größe zu bestimmen. Auch hier beim Fehlerwert spuckt der Rechner<br />

wieder viele Nachkommastellen aus, aber wieviele davon sollte man eigentlich angeben? Wie<br />

genau kann ein Fehler sein? Hierfür gibt es zwar keine harte Vorschrift, aber die mehr oder<br />

weniger verbreitete Konvention, daß zwei signifikante Stellen angegeben werden. Dabei darf<br />

auch gerundet werden. Hier also nochmal das Beispiel zusammengefaßt:<br />

Das wurde am Meßgerät (Waage) abgelesen:<br />

m=78,34655 kg<br />

Dieser Fehler wurde berechnet:<br />

∆m=0,612549 kg<br />

So wird der Wert mit dem (absoluten) Fehler angegeben: m=(78,35±0,61) kg<br />

∆m ist nicht wirklich berechnet worden, der Wert ist wieder nur aus der Luft<br />

gegriffen, um das Prinzip deutlich zu machen.<br />

2. Fehler ist Fehler – oder nicht?<br />

Klare Antwort: Nö! Denn die Ungenauigkeiten, die bei einer Messung auftreten, können verschiedene<br />

prinzipielle Ursachen haben. Jeder Fehler eines Meßwerts oder auch einer daraus<br />

berechneten Größe fällt in eine der folgenden beiden Kategorien:<br />

2.1 Statistische Fehler<br />

Diese Fehler beeinflussen das Meßergebnis auf eine Art und Weise, die nicht vorhersehbar<br />

und nicht kontrollierbar ist. Man sagt deshalb auch Zufallsfehler. Was können Ursachen sein?<br />

• Unzulänglichkeiten der menschlichen Sinnesorgane (etwa das begrenzte Auflösungsvermögen<br />

des Auges, wenn es um die Frage geht, ob zwei haarfeine Linien übereinander<br />

oder leicht nebeneinander liegen),<br />

• Ungeschicklichkeit beim Messen und Ablesen (etwa Parallaxefehler),<br />

• Statistisch wirkende äußere Einflüsse (etwa Erschütterungen).<br />

Statistische Fehler lassen sich mathematisch mit den Werkzeugen der Statistik behandeln. Beachten<br />

Sie, daß diese Fehler beiderlei Vorzeichen haben (deshalb das „±“ im Kasten oben).<br />

Bei mehrfachen Messungen – sie stellen sich 10-mal auf die Waage – streuen die einzelnen<br />

Meßergebnisse um einen Mittelwert. Dieser Mittelwert ist i.a. nicht der tatsächliche Wert, den<br />

Sie gerne wissen wollen. Je länger aber eine Meßreihe ist, umso weiter nähert sich der Mittelwert<br />

dem tatsächlichen Wert an. Für Forscher und Praktikanten bedeutet das: Meßreihen sollten<br />

möglichst lang sein. Sie vertrauen ja auch keinem Medikament, das nur an fünf Leuten getestet<br />

wurde.<br />

Man kann es gar nicht oft genug betonen: Eine Einzelmessung sagt im Prinzip überhaupt<br />

nichts aus. Erst wenn man die Genauigkeit des Meßverfahrens durch viele Wiederholungen<br />

ermittelt hat, kann man wissen, wie die Ergebnisse der Einzelmessungen um eine Näherung<br />

für den wahren Wert schwanken. Diese Näherung muß natürlich sinnvoll und geeignet sein<br />

und aus den Einzelmessungen berechnet werden.<br />

2


2.2 Systematische Fehler<br />

Die systematischen Fehler zeichnen sich dadurch aus, daß sie sich auf alle Einzelmessungen<br />

in der gleichen Weise auswirken. Sie sind reproduzierbar, d.h. bei wiederholten Messungen<br />

unter gleichen Bedingungen treten sie in gleicher Größe und mit gleichem Vorzeichen auf.<br />

Dies ist ganz angenehm, weil dann das Meßergebnis entsprechend korrigiert werden kann<br />

(und muß). Beachten Sie, daß das bei den statistischen Fehlern nicht geht!<br />

Was führt zu einem systematischen Fehler in der Messung? Hier spielen beispielsweise Eichfehler<br />

von Meßgeräten eine Rolle (z.B. wenn die Personenwaage nicht Null anzeigt, wenn<br />

niemand darauf steht), oder Einflüsse, die im Praktikum weitestgehend vernachlässigbar sind,<br />

etwa Temperaturen und Drücke, die sich im Verlauf einer Meßreihe ändern, oder auch elektrische<br />

und magnetische Streufelder, wie sie durch Stromleitungen entstehen.<br />

In einer <strong>Fehlerrechnung</strong> werden grundsätzlich nur die statistischen, aber nicht die systematische<br />

Fehler behandelt.<br />

3. Häufigkeitsverteilung von Meßergebnissen<br />

Da habe ich nun geschwitzt und geflucht, um mein Ergebnis auszurechnen: (32±2) cm kommt<br />

raus. So weit, so gut. Nur leider ist der Referenzwert aus der Literatur mit 35 cm angegeben.<br />

Da habe ich also doch irgendwie nicht gut genug gearbeitet, es ist doch zu dumm!<br />

Dies ist die Reaktion vieler Praktikanten, wenn sie ihr Ergebnis mit einem Literaturwert vergleichen.<br />

Klären wir also nun, was es eigentlich bedeutet, wenn „±2 cm“ da steht. Heißt das,<br />

kein gemessener Wert ist größer gewesen als 34 cm und keiner kleiner als 30 cm? Schon mal<br />

vorweg: Das heißt es nicht. Jetzt kommt ein Experiment:<br />

Gemessen wird eine physikalische Größe, die ich der Einfachheit halber x nenne. Das kann also<br />

eine Temperatur, Zeit, Länge, oder was immer sonst sein. Wie immer wird die Messung<br />

mehrmals unter immer den gleichen Bedingungen durchgeführt, und zwar genau N-mal. Das<br />

Meßergebnis der i-ten Messung heißt x i . Nun kann es passieren, daß man bei einer oder mehreren<br />

anderen Messungen nochmal dasselbe Meßergebnis bekommt. Die Zahl N i gibt dann an,<br />

bei wievielen der N Messungen ich das Meßergebnis x i bekommen habe. Jetzt kommt noch<br />

ein kleiner Schritt: Teilt man N i durch die Gesamtzahl der Messungen, N, bekommt man die<br />

relative Häufigkeit n(x i ) des Meßwerts x i . Nochmal als Formel:<br />

Ni<br />

n( xi<br />

)<br />

N<br />

Anzahl der Messungen mit Ergebnis x<br />

Gesamtzahl aller Messungen<br />

i<br />

= = (1)<br />

Erinnern wir uns, daß die gemessenen Werte keine Zufallszahlen sind, sondern irgendwie um<br />

einen Mittelwert streuen. Tragen wir die relative Häufigkeit für einen Meßwert x i gegen die<br />

möglichen Meßwerte x auf, dann kommen wir diesem „irgendwie“ ein gutes Stück näher. Es<br />

zeigt sich nämlich, daß die entstehende Kurve sich mit größerem N immer besser der sog.<br />

Gaußverteilung (oder Normalverteilung) annähert. Man sagt, die Meßwerte sind gaußverteilt<br />

bzw. normalverteilt. Hier die Formel für die Gaußkurve:<br />

1<br />

n( x)<br />

= ⋅ e<br />

σ ⋅ 2π<br />

3<br />

( x−x<br />

) 2<br />

−<br />

2<br />

2σ<br />

Wichtig: Die Gaußverteilung ergibt sich nur für N → ∞. Die Verteilung Ihrer Meßwerte wird<br />

natürlich ganz anders aussehen, wenn Sie nur sehr wenige Messungen machen.<br />

(2)


Und hier ist die grafische Darstellung der Gaußverteilung:<br />

Welche Eigenschaften hat nun diese Verteilung?<br />

• n(x) ist die Verteilung einer Wahrscheinlichkeitsdichte. n(x)dx ist die Wahrscheinlichkeit<br />

dafür, daß bei einer Messung der Meßwert im Intervall [x, x+dx] liegt.<br />

• x ist der am häufigsten vorkommende Meßwert. Für N → ∞ ist er identisch mit dem wahren<br />

Wert von x.<br />

• In der Grafik sehen Sie, daß die Kurve zwei Wendepunkte hat, die sich bei x − σ und<br />

x + σ befinden. σ gibt also den Abstand der Wendepunkte von x an.<br />

Da n(x) eine Wahrscheinlichkeitsdichte ist, gibt die Fläche unter der Kurve eine Wahrscheinlichkeit<br />

an. Demzufolge ist<br />

∞<br />

∫ n( x) dx = 1, (3)<br />

−∞<br />

denn die Wahrscheinlichkeit, irgendeinen Wert zwischen -∞ und +∞ zu messen muß natürlich<br />

1 sein (Normierungsbedingung).<br />

Die beiden im Zusammenhang mit der Gaußverteilung definierten Größen x und σ haben –<br />

Sie ahnen es – praktische Bedeutung für die Auswertung Ihrer Messungen:<br />

• x heißt Mittelwert der Verteilung. Er ist das am häufigsten vorkommende Meßergebnis<br />

und für uns deshalb interessant, weil er für lange Meßreihen (N → ∞) eine gute Näherung<br />

an den wahren Wert einer physikalischen Größe darstellt.<br />

• σ heißt Standardabweichung der Verteilung. Sie ist ein Maß für die Streuung der einzelnen<br />

Meßergebnisse um den Mittelwert. Ein großer Wert von σ bedeutet, daß die Gaußverteilung<br />

sehr breit aussieht und bei einem kleinen Wert von σ eher eine schmale Nadel ist.<br />

Im ersten Fall streuen die Meßergebnisse sehr stark um x , im zweiten Fall liegen sie<br />

meistens in der Nähe des Mittelwertes. Somit ist die Standardabweichung geeignet, um<br />

die Genauigkeit eines Meßverfahrens anzugeben.<br />

Wenn, wie im Praktikum, verschiedene physikalische Größen benutzt werden schreibt man σ x<br />

für die Standardabweichung, die sich auf die Größe x bezieht. Aber was genau gibt σ denn<br />

nun quantitativ an? Ganz einfach:<br />

[ x − σ , x + σ ] ist dasjenige Intervall um x , in dem 68,3% aller Meßwerte liegen, denn die<br />

Wahrscheinlichkeit, daß das Meßergebnis in diesem Intervall liegt, beträgt<br />

4


Entsprechend gilt:<br />

x +σ<br />

∫ n( x) dx = 0,683 . (4)<br />

x −σ<br />

95,4% der Meßergebnisse liegen in [ x − 2 σ , x + 2σ ] und<br />

99,7% der Meßergebnisse liegen in [ x − 3 σ , x + 3σ ].<br />

Dies macht deutlich, daß man nicht sagen darf, daß alle Meßergebnisse innerhalb der 3-, 4-<br />

oder 5-fachen Standardabweichung liegen. Es gibt zu jedem noch so großen Intervall um x<br />

eine Wahrscheinlichkeit größer als Null, daß der nächste Meßwert außerhalb dieses Intervalls<br />

liegt.<br />

Um zum Anfang dieses Kapitels zurückzukommen: Der Literaturwert ist niemals der wahre<br />

Wert, sondern ein Mittelwert, der genau wie im Praktikum aus experimentellen Daten gewonnen<br />

wurde (außer wenn es ein theoretisch hergeleiteter Wert ist, der dann ausdrücklich als<br />

Theoriewert gekennzeichnet sein sollte). Nebenbei bemerkt sind Literaturangaben auch nur<br />

dann wirklich brauchbar, wenn deren Fehler angegeben werden. Nun, wenn Sie (32±2) cm<br />

bekommen und der Literaturwert mit 35 cm angegeben ist (häufig fehlen in den Büchern die<br />

Fehlerangaben dazu), dürfen Sie behaupten, daß die Werte innerhalb der zweifachen Standardabweichung<br />

übereinstimmen<br />

Der nächste Schritt besteht nun darin zu klären, wie man Mittelwerte und Standardabweichungen<br />

ausrechnet, wenn man eine Meßreihe hat. Vorher will ich aber noch eine Sache klarstellen,<br />

in der man sich leicht verheddert, wenn man seine ersten <strong>Fehlerrechnung</strong>en macht: Es<br />

geht in der <strong>Fehlerrechnung</strong> darum Ungenauigkeiten zu bestimmen von Werten, die bei der<br />

Messung direkt abgelesen werden, oder von Werten, die nicht gemessen, sondern durch Einsetzen<br />

der Meßwerte in irgendeine Formel berechnet werden. Der Input, den wir dazu zur<br />

Verfügung haben, sind die Meßwerte selbst, sowie schon vorhandene Fehlerangaben über die<br />

Genauigkeit von Meßgeräten. Solche Fehler, also die Ungenauigkeit von Meßgeräten, herauszubekommen,<br />

ist nicht Ziel der <strong>Fehlerrechnung</strong>. Häufig wird vom Hersteller die Genauigkeit<br />

angegeben, wenn nicht muß die Genauigkeit von Ihnen geschätzt werden.<br />

Hier eine Skizze der Skala eines Quecksilberthermometers:<br />

°C<br />

33<br />

32<br />

Was zeigt das Thermometer an? Zunächst einmal<br />

32,8 °C und dann noch ein bißchen.... Egal, was<br />

wir ablesen, es wird auf jeden Fall ungenau, weil<br />

man an dieser Skala gar nicht exakt ablesen kann.<br />

In diesem Beispiel könnte man sich höchstens trauen<br />

zu sagen, ob das Quecksilber eher auf einem<br />

Strich oder eher in der Mitte dazwischen ist (das<br />

zweite!). Wir lesen also ab: Temperatur T=32,9 °C.<br />

Die Ablese-Ungenauigkeit beträgt ∆T =0,1 °C, das<br />

ist der Abstand zwischen „Strich“ und „genau zwischen<br />

zwei Strichen“. Genauer geht es nicht. Beachten<br />

Sie, daß dieser Fehler geschätzt und nicht<br />

berechnet wurde!<br />

5


4. Mittelwert und Standardabweichung<br />

Weiter oben haben wir schon ein ganz zentrales Ergebnis der <strong>Fehlerrechnung</strong> gesehen: Der<br />

wahre Wert einer gemessenen Größe, nennen wir sie x, ergibt sich als arithmetischer Mittelwert<br />

im Grenzfall einer unendlich großen Zahl N von Messungen, d.h. einer unendlich langen<br />

Meßreihe. Mathematisch läßt sich das so ausdrücken:<br />

x<br />

wahr<br />

N<br />

1<br />

= lim ∑ xi<br />

(5)<br />

N →∞ N<br />

i=<br />

1<br />

x i ist hier das Meßergebnis der i-ten Messung der Größe x.<br />

Man kann verständlicherweise keine unendlich langen Meßreihen aufnehmen, sondern mit<br />

sinnvollem Zeitaufwand nur eine endliche Zahl N von Messungen durchführen. In der Statistik<br />

sagt man dazu, daß man eine Stichprobe macht.<br />

Was interessiert uns denn überhaupt? Wir wollen...<br />

1. ...eine möglichst gute Schätzung x für den wahren Wert bekommen,<br />

2. ...die Standardabweichung σ x , die angibt, wie die einzelnen Meßwerte um diesen<br />

Mittelwert streuen (siehe vorheriger Abschnitt) und<br />

3. ...die Ungenauigkeit σ x<br />

des Mittelwertes, die uns sagt, wie alle Mittelwerte, die<br />

möglich sind um den wahren Wert streuen.<br />

Fangen wir also mit Punkt 1 an: Als beste Schätzung für den wahren Wert erhält man den<br />

arithmetischen Mittelwert aus allen Meßergebnissen:<br />

x<br />

x + x + K + x<br />

= =<br />

1 N 1 2<br />

N<br />

∑ xi<br />

N i=<br />

1 N<br />

(6)<br />

i<br />

T (°C)<br />

1 38,6<br />

2 38,8<br />

3 38,9<br />

4 38,9<br />

5 39,1<br />

6 38,8<br />

7 38,7<br />

8 38,4<br />

Links ist eine Meßreihe, die bei der Messung der<br />

Körpertemperatur T mit einem Fieberthermometer<br />

entstanden ist (ich war krank und mir war<br />

langweilig).<br />

Der wahre Wert von T kann wegen der endlichen<br />

Länge N der Stichprobe nicht berechnet werden.<br />

Als Mittelwert ergibt sich aber:<br />

1<br />

T = ⋅ ( 38,6 ° C + K + 38,4 ° C)<br />

= 38,775 ° C .<br />

8<br />

Nun zu Punkt 2: Eine Größe, die angibt, wie die Ergebnisse der einzelnen Messungen um den<br />

Mittelwert x streuen ist die Standardabweichung σ x . Sie gibt den Mittelwert des Quadrates<br />

der Entfernung eines Meßergebnisses vom Mittelwert x an. Das mit den Quadraten macht<br />

6


man deshalb so, weil die Summe der einzelnen Abstände von Meßergebnissen zum Mittelwert<br />

Null ergeben würde (weil die Meßwerte ja über und unter dem Mittelwert verteilt liegen).<br />

Die mathematische Formel ist etwas sperrig und sieht so aus:<br />

N<br />

1<br />

σ<br />

x<br />

= ⋅∑<br />

i<br />

−<br />

−<br />

N 1 i=<br />

1<br />

( x x ) 2<br />

1<br />

= ⋅ ⎡( x ) 2 ( ) 2 ( )<br />

2<br />

1<br />

− x + x2<br />

− x + K + xN<br />

− x ⎤ . (7)<br />

N −1<br />

⎣<br />

⎦<br />

Dies ist die Standardabweichung der Einzelmessung vom Mittelwert. Sie wird auch als<br />

Stichprobenfehler bezeichnet.<br />

Als Beispiel bleiben wir bei der Temperatur-Meßreihe aus dem Kasten oben:<br />

Als Mittelwert hatten wir<br />

Messungen.<br />

T (°C) ( T T ) 2<br />

− (°C 2 )<br />

38,6 0,030625<br />

38,8 0,000625<br />

38,9 0,015625<br />

38,9 0,015625<br />

39,1 0,105625<br />

38,8 0,000625<br />

38,7 0,005625<br />

38,4 0,140625<br />

T = 38,775 ° C bestimmt, berechnet aus N=8<br />

Die Summe aus der rechten Spalte ergibt<br />

0,315 °C 2 (Lassen Sie sich von der Einheit<br />

„Grad Celsius zum Quadrat“ nicht irritieren!).<br />

Dies wird jetzt durch N-1=7 geteilt,<br />

was 0,045 °C 2 ergibt. Daraus die Wurzel,<br />

und wir haben die mittlere quadratische<br />

Abweichung der Einzelmessung vom Mittelwert<br />

T (d.h. die Standardabweichung der<br />

Einzelmessung):<br />

σ<br />

T<br />

= 0,21°C (auf zwei signifikante<br />

Stellen genau angegeben)<br />

Der mit (6) berechnete Mittelwert ist eine Schätzung für den wahren Wert der Größe x. Nehme<br />

ich nun verschiedene Meßreihen auf, so werden diese i.a. etwas verschiedene Mittelwerte<br />

liefern. Das bedeutet, daß der Mittelwert selbst mit einem Fehler behaftet ist. Alle Mittelwerte,<br />

die theoretisch möglich sind, sind um den wahren Wert x wahr verteilt. Wir berechnen also<br />

jetzt die Standardabweichung des Mittelwertes vom wahren Wert, womit wir bei Punkt 3 wären.<br />

Der wahre Wert selbst bleibt wie immer im Verborgenen, doch erstaunlicherweise können<br />

wir diese Standardabweichung trotzdem wie folgt ausrechnen:<br />

N<br />

1<br />

σ<br />

x<br />

= ⋅∑<br />

i<br />

−<br />

N ⋅ N − =<br />

( 1)<br />

( N −1)<br />

i 1<br />

( x x ) 2<br />

1<br />

= ⋅ ⎡<br />

1<br />

− +<br />

2<br />

− +…+<br />

N<br />

−<br />

N ⋅ ⎣<br />

1<br />

= ⋅ σ<br />

N<br />

x<br />

( x x ) ( x x ) ( x x )<br />

2 2 2<br />

⎤<br />

⎦<br />

(8)<br />

7


Beachten Sie den kleinen Unterschied zur Standardabweichung der Einzelmessung! Er beinhaltet<br />

die Tatsache, daß die mittlere quadratische Abweichung des Mittelwertes vom wahren<br />

1<br />

Wert sich mit zunehmender Stichprobenlänge N um den Faktor verkleinert. Hier sieht<br />

N<br />

man sozusagen mathematisch, warum eine Meßreihe möglichst lang sein sollte.<br />

Teilen wir σ = 0,21 °C aus dem vorherigen Kasten durch<br />

T<br />

8 , so kennen wir die Standardabweichung des Mittelwertes:<br />

σ = 0,074 °C<br />

T<br />

Wenn man einen Mittelwert, der ja eine Abschätzung des<br />

wahren Wertes ist, bestimmt, ist man i.a. an seiner mittleren<br />

quadratischen Abweichung vom wahren Wert interessiert, und<br />

weniger an der Standardabweichung der Einzelmessung. Als<br />

Ergebnis der ganzen Aktion ist es hier also sinnvoll zu<br />

schreiben (beachten Sie, daß Zahlenwert und Fehlerangabe mit<br />

gleich vielen Nachkommastellen notiert werden):<br />

T =(38,775±0,074) °C.<br />

Soviel zu meiner Körpertemperatur. Hieraus eine medizinische<br />

Diagnose zu erstellen überlasse ich nun Ihnen.<br />

In der Statistik findet man im Zusammenhang mit Fehlerangaben häufig noch einen weiteren<br />

Begriff, die Varianz Var(x) einer Meßgrösse x. Sie ist definiert als σ 2 , also als das Quadrat der<br />

Standardabweichung.<br />

5. Fehlerfortpflanzung<br />

Im Praktikum werden Sie oft feststellen, daß Sie mehrere verschiedene physikalische Größen<br />

messen müssen, um daraus diejenige Größe, die Sie interessiert, zu berechnen. Sie tun dies,<br />

weil die gesuchte Größe, nennen wir sie z, nicht für eine direkte Messung zugänglich ist. Die<br />

gemessenen Größen nenne ich im folgenden x 1 , x 2 ,..., x m . Beachten Sie den Unterschied zu<br />

den vorherigen Kapiteln: Dort stand der Index für die Nummer der Messung, und es wurde<br />

immer dieselbe Größe gemessen. Hier steht der Index für eine ganz neue Größe, z.B. könnte<br />

x 1 eine Temperatur sein, x 2 eine elektrische Spannung, usw. Daß man z aus den anderen<br />

Größen berechnen kann bedeutet, daß man z als Funktion von x 1 ,..., x m schreiben kann: z =<br />

f(x 1 , ..., x m ). Hier geht es nun darum, wie man den Fehler von z berechnet, wenn die Fehler<br />

von x 1 , ..., x m bekannt sind. Diese Fehler sind häufig Angaben von Herstellerfirmen von Meßgeräten<br />

über deren Ungenauigkeit.<br />

8


5.1 Fehlerfortpflanzungsgesetz<br />

Um die <strong>Fehlerrechnung</strong> im engeren Sinn anwenden zu können müssen zwei Bedingungen<br />

erfüllt sein:<br />

1) Die Meßergebnisse der Messgrößen x 1 , ..., x m müssen normalverteilt sein.<br />

2) Die einzelnen Meßgrößen x 1 , ..., x m müssen statistisch voneinander unabhängig sein.<br />

Die zweite Bedingung bedeutet, daß es zu keiner Meßgröße x i einen analytischen Zusammenhang<br />

mit einer anderen Meßgröße x j geben darf. Gäbe es ihn, könnte man nämlich x i mittels x j<br />

in der Form x i = f(x j ) ausdrücken, so daß man eine Meßgröße zuviel in der Rechnung hätte.<br />

Die Forderung ist also, daß die kleinstmögliche Anzahl von Meßgrößen verwendet wird. Folgendes<br />

Beispiel soll dies verdeutlichen:<br />

Ein Praktikumsteilnehmer will die Fläche A einer Kreisscheibe<br />

berechnen und mißt hierzu den Radius r und sicherheitshalber<br />

auch den Durchmesser d. Aus den Meßreihen berechnet er die<br />

Mittelwerte r und d . Da er beide Meßgrößen weiter auswerten<br />

will teilt er die Fläche A in zwei Hälften:<br />

1 2 1 ⎛ d ⎞<br />

A = A1 + A2<br />

= π r + π⎜ ⎟<br />

2 2 ⎝ 2 ⎠<br />

Diese Formel ist zweifellos richtig. Es spricht nichts dagegen,<br />

die Fläche A so zu berechnen. Die beiden Meßgrößen r und d<br />

sind allerdings nicht unabhängig voneinander, denn zwischen<br />

ihnen besteht der Zusammenhang d=2·r. Damit ist die Bedingung<br />

2) nicht erfüllt, und man kann das Fehlerfortpflanzungsgesetz<br />

hier nicht anwenden, um den Fehler von A zu berechnen.<br />

2<br />

Benutzt man aber die Gleichung A = π r sind beide Bedingungen<br />

erfüllt, und man arbeitet mit der kleinstmöglichen Anzahl<br />

von Meßgrößen.<br />

2<br />

Wir setzen noch voraus, daß aus den Meßreihen die Mittelwerte der verschiedenen Meßgrössen<br />

bekannt sind: x , x , K , x , ebenso die Standardabweichungen der Mittelwerte σ , K , σ .<br />

1 2<br />

Die beste Schätzung für den Mittelwert von z ist dann<br />

m<br />

( )<br />

x1<br />

x m<br />

z = f x , , 1<br />

K xm<br />

, (9)<br />

was unmittelbar plausibel ist. Die optimale Schätzung für den Fehler von z ist die Standardabweichung<br />

σ<br />

z<br />

. Sie berechnet sich nach dem Fehlerfortpflanzungsgesetz, das im Praktikum<br />

eine sehr große Rolle spielt:<br />

9


σ =<br />

z<br />

m<br />

∑<br />

j=<br />

1<br />

⎛ ∂f<br />

⎜<br />

⎝ ∂x<br />

2<br />

j<br />

⎞<br />

⎟<br />

⎠<br />

2<br />

⋅ σ<br />

2<br />

x j<br />

2 2<br />

⎜ ⎟ x ⎜ ⎟<br />

1<br />

x<br />

x<br />

m<br />

⎝ ∂<br />

1 ⎠ ⎝ ∂xm<br />

⎠<br />

2<br />

⎛ ∂f<br />

⎞ ⎛ ∂f<br />

⎞<br />

= ⋅ σ + K + ⋅ σ . (10)<br />

Hierbei bedeutet ∂/∂x j die partielle Ableitung nach x j (Sie wird genauso gebildet, wie die normale<br />

Ableitung), und der Querstrich zeigt an, daß in den in Klammern stehenden Ausdrücken<br />

die Mittelwerte der Meßgrößen eingesetzt werden sollen. Beispiel gefällig?<br />

Die Dichte ρ soll für einen Würfel berechnet werden. Hierzu<br />

wird die Kantenlänge a und die Masse m gemessen. Die Formel<br />

für die Dichte ist<br />

m<br />

ρ = .<br />

3<br />

a<br />

Um die Dichte auszurechnen werden die Mittelwerte von m<br />

und a benutzt:<br />

m<br />

ρ =<br />

3<br />

a<br />

Die Fehler σ<br />

m<br />

und σ<br />

a<br />

der Mittelwerte werden nach Gl. (8)<br />

berechnet. Gehen wir davon aus, daß sie schon bekannt sind.<br />

Der Fehler der Dichte berechnet sich nach dem Fehlerfortpflanzungsgesetz<br />

Gl. (10):<br />

2 2<br />

2 ∂ρ<br />

2<br />

m<br />

a<br />

⎛ ∂ρ<br />

⎞ ⎛ ⎞<br />

σ<br />

ρ<br />

= ⎜ ⋅ σ + ⋅σ<br />

∂m<br />

⎟ ⎜<br />

∂a<br />

⎟<br />

⎝ ⎠ ⎝ ⎠<br />

2 2<br />

2 − m 2<br />

σ<br />

3 m<br />

σ<br />

4 a<br />

⎛ 1 ⎞ ⎛ 3 ⎞<br />

= ⎜ ⋅ + ⋅<br />

a<br />

⎟ ⎜<br />

a<br />

⎟<br />

⎝ ⎠ ⎝ ⎠<br />

1 9m<br />

= ⋅ + ⋅<br />

a a<br />

2<br />

2 2<br />

σ<br />

6 m<br />

σ<br />

8 a<br />

Um den Fehler des Dichte-Mittelwertes zu bekommen werden<br />

die Mittelwerte der Meßgrößen, sowie deren Standardabweichungen<br />

eingesetzt:<br />

2<br />

1 2 9m<br />

2<br />

σ = 6 m 8 a<br />

a<br />

⋅ + a<br />

⋅<br />

ρ<br />

σ σ .<br />

10


5.2 Maximaler Fehler<br />

Es kann unter Umständen vorkommen, daß eine der Voraussetzungen (oder beide) für das<br />

Fehlerfortpflanzungsgesetz nicht erfüllt sind. Wenn das der Fall ist kann Gl. (10) nicht benutzt<br />

werden, um den Fehler der physikalischen Größe z anzugeben. Das heißt aber nicht, daß Sie<br />

überhaupt keinen Fehler angeben können (Sie kommen nicht drum herum), sondern hier ist<br />

die Angabe des Maximalfehlers ∆z sinnvoll. Er schreibt sich mathematisch so:<br />

∆ z =<br />

m<br />

∑<br />

j=<br />

1<br />

∂f<br />

∂x<br />

j<br />

⋅ ∆x<br />

j<br />

∂f ∂f ∂f<br />

= ⋅ ∆ x + ⋅ ∆ x + K + ⋅ ∆xm<br />

(11)<br />

∂x ∂x ∂x<br />

1 2<br />

1 2<br />

m<br />

Die Betragstriche stehen da, weil die partielle Ableitung von f negativ sein kann, die Beiträge<br />

aus den einzelnen Größen sich aber positiv addieren müssen.<br />

Für diejenigen Meßgrößen x j , deren Mittelwerte und Standardabweichungen aus einer Meßreihe<br />

bekannt sind, wird als Fehler<br />

∆ x j<br />

= σ x j<br />

,<br />

also die Standardabweichung des Mittelwertes eingesetzt. Für alle anderen Meßgrößen muß<br />

ein realistischer Schätzwert für den Fehler verwendet werden (Ein Beispiel zu diesen Schätzwerten<br />

finden Sie auf Seite 5.).<br />

Als kleines Exempel bleiben wir bei der Dichte-Berechnung von der vorigen Seite:<br />

Der einzige Unterschied zur Rechnung im vorherigen Beispiel-Kasten soll<br />

sein, daß die Fehler der Masse m und der Kantenlänge a nicht aus Meßreihen<br />

bestimmt wurden (Standardabweichungen), sondern Schätzwerte ∆m und ∆a<br />

sind. Auch damit könnte man das Fehlerfortpflanzungsgesetz benutzen, bekäme<br />

dann aber nicht die Standardabweichung von z , sondern nur eine Abschätzung<br />

des Fehlers ∆ z . Hier interessiert uns jedoch ausdrücklich der maximale<br />

Fehler der Dichte ρ, der mit Gl. (11) berechnet wird:<br />

∂ρ<br />

∂ρ<br />

∆ ρ = ⋅ ∆ m + ⋅ ∆a<br />

∂m<br />

∂a<br />

1 −3m<br />

= ⋅ ∆ m + ⋅ ∆ a<br />

3 4<br />

a a<br />

1<br />

= ⋅ a ⋅ ∆ m + 3m ⋅ ∆ a<br />

4<br />

a<br />

( )<br />

Die Betragsstriche konnten im letzten Schritt ebenso wie das Minuszeichen<br />

weggelassen werden, weil m, a und ihre Fehler ∆m und ∆a größer als Null<br />

sind. Der Maximalfehler des Dichte-Mittelwertes ergibt sich durch Einsetzen<br />

der Mittelwerte für m und a:<br />

1<br />

∆ ρ = ⋅<br />

4<br />

( a ⋅ ∆ m + 3m ⋅ ∆a)<br />

a<br />

11


6. Lineare Regression<br />

Häufig hängen zwei physikalische Größen x und y linear voneinander ab, so daß sie über eine<br />

Geradengleichung<br />

y = a·x+b (12)<br />

miteinander verknüpft sind. a ist die Steigung, b der y-Achsenabschnitt, und beide sind konstant.<br />

Ein Experiment läuft häufig so ab, daß man die Größe x nacheinander auf N verschiedene<br />

Werte x i einstellt und die Werte y i an einem Meßgerät abliest, wobei jeder Wert y i mit einem<br />

Zufallsfehler behaftet ist. Was den Experimentator interessiert sind die Parameter a und b<br />

(häufig Material- oder Naturkonstanten), und wie man an diese kommt, darum geht es in<br />

diesem Abschnitt.<br />

Nach N Messungen mit verschiedenen x i haben wir eine Meßreihe. Häufig findet man Praktikanten<br />

in lebhafte Diskussionen verstrickt, ob die Meßwerte, die in dieser Meßreihe stehen,<br />

denn nun einen linearen Zusammenhang zeigen oder nicht. Viel Zeit und Nerven kann man<br />

sich hier sparen, wenn man sich an ein bewährtes Hausmittel erinnert: Hinzeichnen! Stehen<br />

die Datenpunkte (x i , y i ) in einem Diagramm, so ist wesentlich besser zu erkennen, auf was für<br />

einer Kurve diese Punkte liegen, und hier sind wir am entscheidenden Punkt: Selbst wenn sich<br />

theoretisch ein linearer Zusammenhang der Größen x und y herleiten läßt, finden wir doch,<br />

daß die Meßpunkte (x i , y i ) nicht so ganz auf einer Geraden liegen. Das liegt natürlich am Fehler<br />

der Werte y i . Auch die Meßwerte x i haben in der Realität natürlich Fehler, wir nehmen hier<br />

aber ausdrücklich an, daß diese Fehler vernachlässigbar sind. Man kann bei der linearen Regression<br />

den Fehler von x i grundsätzlich auch mit berücksichtigen, dann erhöht sich aber der<br />

Rechenaufwand dramatisch und ist dem Praktikum nicht mehr angemessen.<br />

y<br />

x<br />

Typische Lage von Datenpunkten,<br />

wenn die Theorie einen linearen Zusammenhang<br />

zwischen x und y liefert.<br />

Nur die Fehler der y-Koordinaten sind<br />

berücksichtigt (Fehlerbalken).<br />

Die Aufgabe ist jetzt, eine Gerade zu finden, die, salopp gesagt, gut zu den Meßpunkten paßt,<br />

und deren Parameter a und b sind.<br />

In der einfachsten Variante kann man diese Gerade näherungsweise auf zeichnerischen Wege<br />

finden, indem man mit einem Lineal eine Gerade so in das Diagramm einzeichnet, daß nach<br />

dem Augenschein eine „ausgleichende“ Gerade entsteht. Dabei wird weniger die Anzahl der<br />

Punkte über und unter der Geraden, sondern vielmehr deren Abstand zur Geraden berücksichtigt.<br />

Diese Art, eine Ausgleichsgerade zu finden, ist sicher vielen von Ihnen aus der Schule<br />

bekannt. Aber Achtung: Die verbreitete Version, daß man nur den ersten und den letzten Datenpunkt<br />

zu einer Geraden verbinden müsse, ist falsch! Sie muß auch falsch sein, denn um<br />

eine Ausgleichsgerade zu finden müssen natürlich alle Wertepaare berücksichtigt werden<br />

(Leider gibt es anscheinend Lehrer, die von der falschen Methode so überzeugt sind, daß sie<br />

12


sie sogar unterrichten). Im nächsten Schritt ist es dann leicht, b an der y-Achse abzulesen und<br />

mittels eines eingezeichneten Steigungsdreiecks die Steigung a zu bestimmen.<br />

So weit, so gut. Es gibt natürlich auch eine mathematische, quantitative Methode, um die gesuchte<br />

Geradengleichung zu finden. Das Verfahren heißt lineare Regression und basiert auf<br />

der Forderung, daß die Summe aus den Abstands-Quadraten der Meßpunkte zu der Geraden<br />

minimal wird (damit sind die Abstände der y-Koordinaten gemeint):<br />

N<br />

!<br />

2<br />

∑ ⎡ yi<br />

− ( a ⋅ xi<br />

+ b) ⎤ = minimal<br />

(13)<br />

i=<br />

1<br />

⎣<br />

⎦<br />

Daran sehen Sie, daß es sich im Prinzip um eine Extremwertaufgabe handelt. Sie fragen sich<br />

bestimmt, warum die Summe der Quadrate und nicht die Summe der einfachen Abstände genommen<br />

wird. Die Antwort liegt in den Tiefen der mathematischen Statistik: Der Satz von<br />

Gauß-Markov besagt, daß man das bestangepaßte Modell, d.h. Geradengleichung, erhält,<br />

wenn die Methode der kleinsten Quadrate benutzt wird.<br />

y<br />

Methode der kleinsten Quadrate: Die Abstandsquadrate sind hier als graue<br />

Flächen gezeichnet. Die Regressionsgerade ist diejenige Gerade, für die die<br />

Summe der grauen Flächen am kleinsten ist. Die Fehlerbalken der Datenpunkte<br />

sind für die bessere Übersichtlichkeit weggelassen worden.<br />

Nach einer längeren Rechnung, die ich hier nicht detailliert aufführen will, ergeben sich als<br />

Lösung der Extremwertaufgabe Gl. (13) folgende beste Schätzwerte a’ und b’ der Parameter a<br />

und b:<br />

S<br />

a′ = ; b′ = y − a′<br />

⋅ x<br />

(14)<br />

S<br />

xy<br />

2<br />

x<br />

x<br />

mit folgenden Definitionen:<br />

1 N xi<br />

N i = 1<br />

x = ∑ ;<br />

N<br />

1<br />

S = x − x ⋅ y − y<br />

13<br />

1 N yi<br />

N i = 1<br />

y = ∑<br />

∑<br />

2<br />

( ) ( ) ; S ( ) 2<br />

x<br />

= xi<br />

− x<br />

−1<br />

1<br />

xy i i<br />

N i=<br />

1<br />

N<br />

1<br />

∑ (15)<br />

−<br />

N i=<br />

1


Wir sind hier in der verrückten Situation, daß wir Mittelwerte für x und y ausrechnen müssen,<br />

obwohl die x-Werte absichtlich während der Versuchsreihe verändert werden, sich also die<br />

Grössen x und y laufend ändern.<br />

Ich gebe Ihnen an dieser Stelle die herzliche Bitte mit auf den Weg, in Ihren Versuchsauswertungen<br />

auch immer alle Zwischenwerte (15) aufzuschreiben, wenn Ihnen eine lineare Regression<br />

begegnet – es erleichtert die Nachvollziehbarkeit und die Fehlersuche erheblich.<br />

Haben wir jetzt alles? Nicht ganz! Die Schätzwerte (14) für die Parameter a und b reichen<br />

zwar schon aus, um die Geradengleichung der Regressionsgeraden hinzuschreiben, allerdings<br />

sind diese – wie sollte es anders sein – fehlerbehaftet. Und wenn wir auf dem Wege der linearen<br />

Regression z.B. eine physikalische Konstante bestimmen wollen, ist deren Fehlerwert von<br />

allergrößtem Interesse.<br />

Aus Gl. (11) und Anwendung der Fehlerfortpflanzung (die Einzelheiten überspringen wir hier<br />

wieder, weil man wirklich nichts Neues draus lernt) findet man als beste Schätzung für den<br />

Fehler von y<br />

N<br />

1<br />

σ = ∑ ⎡ y − ( a′ ⋅ x + b′<br />

) ⎤<br />

2<br />

−<br />

⎣<br />

⎦ . (16)<br />

y i i<br />

N 2 i=<br />

1<br />

Dies ist die Standardabweichung der Einzelmessung. Ein Blick zurück zu Gl. (7) in Kapitel 4<br />

sagt Ihnen, daß dort die Standardabweichung der Einzelmessung etwas anders definiert worden<br />

ist, indem dort nämlich durch N-1 geteilt wurde. Machen Sie sich aber klar, daß dort die<br />

Abweichung der Einzelmessung vom Mittelwert behandelt wurde, während es hier um die Abweichung<br />

der Einzelmessung von der Regressionsgeraden geht. Im ersten Fall haben wir nur<br />

einen Parameter x variiert, im zweiten Fall jonglieren wir mit zwei Parametern a und b. Dies<br />

erklärt den kleinen Unterschied. Beachten Sie auch, daß Gl. (16) nicht etwa den y-Fehler angibt,<br />

der als Fehlerbalken ins Diagramm eingezeichnet wird!<br />

Als beste Abschätzungen der Fehler σ a’ und σ b’ der Schätzwerte a’ und b’ ergeben sich nun<br />

σ<br />

′<br />

= σ ⋅<br />

a<br />

y<br />

y<br />

= σ ⋅<br />

= σ ⋅<br />

y<br />

∑<br />

2<br />

i<br />

N<br />

( ∑ ) 2<br />

i<br />

N ⋅ x − x<br />

∑<br />

x<br />

1<br />

− N ⋅ x<br />

2 2<br />

i<br />

1<br />

∑( x ) 2<br />

i<br />

− x<br />

(17)<br />

für den Fehler der Geradensteigung und<br />

σ<br />

′<br />

= σ ⋅<br />

b<br />

y<br />

2<br />

∑ xi<br />

2<br />

∑ i<br />

− ( ∑ i )<br />

2<br />

∑ x<br />

2<br />

∑ i<br />

− ⋅<br />

2<br />

2<br />

∑ x<br />

2<br />

∑(<br />

i<br />

− )<br />

N ⋅ x x<br />

1 i<br />

= σ<br />

y<br />

⋅ ⋅<br />

N x N x<br />

1 i<br />

= σ<br />

y<br />

⋅ ⋅<br />

N x x<br />

2<br />

(18)<br />

14


für den Fehler des y-Achsenabschnitts. Alle Summen laufen von i=1 bis N.<br />

Liegt eine Ursprungsgerade der Form<br />

Berechung der Steigung<br />

y = a ⋅ x vor, gelten folgenden Formeln für die<br />

a<br />

n<br />

∑<br />

i<br />

i=<br />

1<br />

=<br />

n<br />

x ⋅ y<br />

∑<br />

i=<br />

1<br />

x<br />

2<br />

i<br />

i<br />

(19)<br />

und den Fehler der Steigung.<br />

n<br />

∑<br />

d<br />

i<br />

1 i=<br />

1<br />

σ<br />

a<br />

= , wobei d<br />

n<br />

i<br />

= yi<br />

− a ⋅ xi<br />

ist. (20)<br />

n −1<br />

2<br />

x<br />

∑<br />

i=<br />

1<br />

i<br />

2<br />

Vor diesen ganzen Formeln sollten Sie keinen großen Respekt haben, es ist viel einfacher, als<br />

es aussieht. Da Sie im Praktikum recht oft mit der linearen Regression konfrontiert werden ist<br />

an dieser Stelle wieder ein Beispiel angebracht: Haben Sie sich schon einmal gefragt, wie dick<br />

ein Blatt Papier in Ihrem Lehrbuch ist? Vermutlich nicht (Warum sollten Sie auch?), dennoch<br />

haben wir hier ein gutes Beispiel für etwas, das man nicht besonders gut direkt messen, wohl<br />

aber mittels linearer Regression bestimmen kann.<br />

---------------------------------------------------Beispiel----------------------------------------------------<br />

Ein Buch ist ein bisschen wie Quantenphysik: Die Dicke des Buches ist<br />

quantisiert, und ein „Buchquant“ ist die Dicke eines Blattes. Mit einem Messschieber<br />

wird die Dicke gemessen, nicht eines einzelnen Blattes, auch nicht<br />

des ganzen Buches, sondern von 10, 20, 30, usw. Blättern einschließlich des<br />

hinteren Buchdeckels (warum ich den mitnehme wird noch deutlich werden).<br />

Hier die Messreihe, bei der m die Anzahl der Blätter ist:<br />

Anzahl<br />

m<br />

Dicke<br />

d (mm)<br />

10 3,2<br />

20 4,2<br />

30 5,1<br />

40 5,8<br />

50 6,8<br />

60 7,7<br />

70 8,8<br />

80 9,7<br />

90 10,8<br />

100 11,7<br />

Zuerst werden die Zwischenergebnisse ausgerechnet:<br />

Mit Formel (6) bekommen wir die Mittelwerte von<br />

m und d:<br />

m =55 und d =7,38 mm.<br />

Als nächstes bekommen wir nach Gl. (15)<br />

S md =86,4444 mm und<br />

S m 2 =916,6666.<br />

Die optimalen Abschätzungen der Parameter a und b<br />

ergeben sich schließlich nach Gl.(14) zu<br />

a’=0,0943 mm und<br />

b’=2,1935 mm.<br />

15


Dies reicht schon aus, um eine Grafik mit der Regressionsgeraden zu zeichnen:<br />

Die Grafik wurde mit dem Programm Origin erstellt. Programme wie Excel<br />

oder Origin können die gesamte lineare Regression selbst durchführen und liefern<br />

nicht nur das Diagramm, sondern auch a’, b’ und deren Fehler.<br />

Die Geradengleichung, die wir bekommen, lautet nun<br />

d=0,0943 mm · m + 2,1935 mm.<br />

Jetzt fehlen noch die Fehlerangaben. Hierzu eine Tabelle mit Zwischenwerten:<br />

m i<br />

2<br />

(m i - m ) 2 (d i -(a’·m i +b’)) 2 (mm 2 )<br />

100 2025 0,00405<br />

400 1225 0,01457<br />

900 625 0,00604<br />

1600 225 0,02732<br />

2500 25 0,01172<br />

3600 25 0,02289<br />

4900 225 0,00003<br />

6400 625 0,00139<br />

8100 1225 0,01433<br />

10000 2025 0,00588<br />

Nur die Werte in der<br />

rechten Spalte haben<br />

Einheiten, denn m ist ja<br />

nur eine Anzahl.<br />

16


Zuerst erhalten wir mit Formel (16)<br />

10<br />

1<br />

σ = ⋅ ⎣ − ⋅ +<br />

2<br />

∑ ⎡d ( a′ m b′<br />

) ⎤ = 0,173 mm.<br />

d i i<br />

8 i=<br />

1<br />

Die Gleichungen (17) und (18), ich benutze jeweils die unterste Variante, liefern<br />

als Fehler<br />

σ a’ =0,0019 mm und σ b’ =0,12 mm<br />

Zusammengefasst bekommen wir also:<br />

a’=(0,0943±0,0019) mm<br />

b’=(2,19±0,12) mm<br />

Die Steigung a’ gibt an, wie dick ein Blatt des Buches (durchschnittlich) ist.<br />

Wir haben also das Buchquant bestimmt, und das noch mit Fehlerangabe!<br />

Der y-Achsenabschnitt b’ gibt die Dicke des unteren Buchdeckels an, also die<br />

Dicke, wenn Null Blatt Papier gemessen werden. Beides zusammen ergibt die<br />

Buchgleichung<br />

Buchdicke D = a’·m+2b’.<br />

Im rechten Summanden steht ein Faktor 2, weil man ja auch noch den oberen<br />

Buchdeckel zur gesamten Dicke rechnen muss.<br />

⎦<br />

Die Buchgleichung in diesem Beispiel entspricht einem Naturgesetz, und a’ und b’ entsprechen<br />

Materialparametern. Sie gelten immer nur für ein bestimmtes Buch, in diesem Fall war<br />

es Kohlrausch, Praktische Physik, 22. Auflage, B. G. Teubner, Stuttgart, 1968.<br />

--------------------------------------------------Beispielende------------------------------------------------<br />

Bis hierhin haben wir die allgemeine Form der linearen Regression besprochen. Es gibt einen<br />

wichtigen Spezialfall, bei dem man etwas andere Formeln benutzen darf und sich einige Arbeit<br />

sparen kann: Wenn der y-Achsenabschnitt Null ist und sich daher die Regressionsgerade<br />

als y=a·x schreiben läßt. Aber Achtung! Überlegen Sie sich vorher gründlich, ob das wirklich<br />

der Fall ist! Diese einfache Variante dürfen Sie nicht benutzen, wenn der y-Achsenabschnitt<br />

nur klein, aber vorhanden ist. Er muß exakt Null sein, wie etwa beim Zusammenhang zwischen<br />

der Länge einer Strecke und der Zeit, die ein Lichtstrahl braucht, um sie zurückzulegen.<br />

Für eine solche lineare Regression durch Null gelten folgende Formeln, mit denen man die<br />

beste Schätzung a’ der Steigung und deren Fehler bekommt:<br />

Die Standardabweichung der Einzelmessung von der Regressionsgeraden ist analog zu Gl.<br />

(16)<br />

N<br />

1<br />

σ = ⋅∑ [ y − a′<br />

⋅ x ] 2<br />

. (21)<br />

−<br />

y i i<br />

N 1 i=<br />

1<br />

17


Hier wird in der Wurzel jedoch durch N-1 geteilt, weil wir es nur mit einem Parameter zu tun<br />

haben. Die beste Schätzung für die Steigung ist<br />

a<br />

x<br />

⋅ y<br />

′ = ∑ ∑ , (22)<br />

i i<br />

2<br />

xi<br />

und als beste Schätzung des Fehlers ergibt sich<br />

σ<br />

′<br />

= σ ⋅<br />

a<br />

y<br />

1<br />

2<br />

∑ x , (23)<br />

i<br />

wobei die Summen immer von i=1 bis N laufen.<br />

Manchmal geben Rechenprogramme außer Steigung und y-Achsenabschnitt auch noch einen<br />

Koeffizienten aus, der meist R heißt. Es handelt sich dabei um den Pearson’schen empirischen<br />

Korrelationskoeffizienten. Er ist definiert als<br />

R =<br />

S<br />

S<br />

xy<br />

⋅ S<br />

2 2<br />

x y<br />

(24)<br />

N<br />

2 1<br />

mit den Definitionen Gl. (15) und S ( ) 2<br />

y<br />

= ∑ yi<br />

− y . R kann Werte zwischen -1 und 1<br />

N −1<br />

i=<br />

1<br />

annehmen und dient zur Überprüfung, ob die gemessenen Daten tatsächlich einen linearen<br />

Zusammenhang haben. Für R=+1 oder -1 liegen alle Meßpunkte exakt auf einer Geraden. Das<br />

Vorzeichen gibt nur an, ob deren Steigung positiv oder negativ ist. Für R=0 besteht überhaupt<br />

kein linearer Zusammenhang. Die Betonung liegt hier auf linear, denn die Größen x und y<br />

können dann sehr wohl noch nichtlinear und im Diagramm auch deutlich erkennbar korreliert<br />

sein.<br />

Literaturhinweise:<br />

Kamke,<br />

Der Umgang mit experimentellen Daten, insbesondere Fehleranalyse, im physikalischen<br />

Anfänger-Praktikum: Eine elementare Einführung.<br />

Verlag und Herausgeber: Wolfgang Kamke<br />

ISBN: 978-3-00-031620-3<br />

Eine hervorragende Einführung. Ausführlich ohne ein dickes Lehrbuch zu sein und für<br />

<strong>Einsteiger</strong> sehr gut verständlich. Auch zum späteren Nachschlagen geeignet.<br />

Bronstein, Semendjajew, Musiol, Mühlig,<br />

Taschenbuch der Mathematik.<br />

Verlag Harri Deutsch<br />

ISBN: 3-8171-2005-2<br />

Die Mutter aller Mathe-Formelsammlungen! Was hier nicht drinsteht ist unlösbar oder<br />

trivial.<br />

Ralf Dinter, Institut für Angewandte Physik, Universität <strong>Hamburg</strong>, Februar 2011<br />

18

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!