Fehlerrechnung für Einsteiger - Universität Hamburg
Fehlerrechnung für Einsteiger - Universität Hamburg
Fehlerrechnung für Einsteiger - Universität Hamburg
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Fehlerrechnung</strong> für <strong>Einsteiger</strong><br />
Eine beispielorientierte Einführung für Studierende der TUHH<br />
1. Messungen und Ungenauigkeit<br />
Viele physikalische Größen (z.B. eine Länge, Temperatur oder eine Masse) können durch<br />
Messungen direkt bestimmt werden. Solche Messwerte haben die Eigenschaft, daß sie um den<br />
wahren Wert verteilt sind, man sagt, sie „streuen“. Stellen Sie sich zehnmal hintereinander auf<br />
eine „genaue“ Personenwaage und Sie bekommen zehn verschiedene Ergebnisse – obwohl<br />
Sie jedesmal ganz sicher die gleiche Masse mitbringen. Das liegt daran, daß jeder Meßvorgang<br />
von Natur aus mit einer Ungenauigkeit behaftet ist, die gemeinhin als „Fehler“ bezeichnet<br />
wird. Damit Sie und andere den Meßwert von 78,34655 kg, den Sie an Ihrer genauen<br />
Waage ablesen, überhaupt interpretieren können, ist es nötig, die besagte Ungenauigkeit mit<br />
anzugeben.<br />
In wissenschaftlichen Experimenten ist die Angabe solcher Ungenauigkeiten besonders wichtig,<br />
um einzuschätzen, in welchem Wertebereich der wahre Wert mit welcher Wahrscheinlichkeit<br />
liegt, diesen Wert also „einzugrenzen“. Ohne eine solche Eingrenzung ist die Angabe eines<br />
Wertes, wie etwa Ihre 78,34655 kg, aussage- und sinnlos. Was also ist zu tun? Wir müssen...<br />
• ...das Experiment so entwerfen, daß der Fehler möglichst klein wird. Im Praktikum ist<br />
in dieser Hinsicht nicht sehr viel Handlungsspielraum gegeben, weil die meisten<br />
Versuche und deren Ablauf vorgegeben sind.<br />
• ...die Ungenauigkeit des Ergebnisses bestimmen.<br />
• ...rauskriegen, wie groß die Wahrscheinlichkeit dafür ist, daß bei einer Wiederholung<br />
des Experiments das Ergebnis in diesem Fehlerbereich liegt.<br />
Das typische Vorgehen ist, wie im Beispiel der Personenwaage, daß man die Messung ein und<br />
derselben Größe mehrmals durchführt, was zu einer Meßreihe führt. Mehrere Meßreihen kann<br />
man auch zu einer einzigen, großen zusammenfassen, allerdings muß man dann unterscheiden,<br />
ob alle Meßreihen unter den gleichen Bedingungen stattgefunden haben, oder ob diese<br />
zwischendurch geändert wurden (z.B. ein anderes Meßgerät benutzt), denn dann ändert sich<br />
i.a. auch die Streuung der Meßwerte.<br />
Bis einschließlich Kapitel 5 gehen wir von Meßreihen unter gleichen Bedingungen aus.<br />
Wie gebe ich Fehler an? Der Fehler, besser: die Ungenauigkeit einer physikalischen Größe x<br />
wird oft als ∆x bezeichnet, was nicht mit einer Differenz verwechselt werden darf. Eine bestimmte<br />
Sorte Fehler ist die Standardabweichung σ x , auf die wir später noch eingehen werden.<br />
Der Index gibt die physikalische Größe an, auf die sich dieser Fehler bezieht.<br />
Fehlerwerte können<br />
• absolut (∆x),<br />
• relativ (∆x/x) oder<br />
• prozentual (∆x/x·100%)<br />
angegeben werden.<br />
absolut : m=(78,35±0,61) kg<br />
relativ: m=78,35 kg ±7,8·10 -3<br />
prozentual: m=78,35 kg ±0,78 %<br />
Die Fehler sind hier nur Phantasiewerte,<br />
um die Notation deutlich zu machen.<br />
1
Im Beispielkasten rechts sehen Sie, daß ich nicht alle Nachkommastellen mitgenommen habe,<br />
die Ihre Waage angezeigt hat, denn wenn der Fehler ∆m=0,61 kg beträgt, macht es natürlich<br />
keinen Sinn, noch mehr Nachkommastellen für m anzugeben – diese sind ja viel kleiner als<br />
die Ungenauigkeit. Wichtig ist also: Mehr Stellen hinter dem Komma machen den Zahlenwert<br />
nicht genauer! Das gilt für Personenwaagen ebenso wie für Elementarteilchen-Detektoren in<br />
Wohnblockgröße.<br />
Die <strong>Fehlerrechnung</strong> liefert das Handwerkszeug, um aus den Meßwerten einer physikalischen<br />
Größe den Fehler dieser Größe zu bestimmen. Auch hier beim Fehlerwert spuckt der Rechner<br />
wieder viele Nachkommastellen aus, aber wieviele davon sollte man eigentlich angeben? Wie<br />
genau kann ein Fehler sein? Hierfür gibt es zwar keine harte Vorschrift, aber die mehr oder<br />
weniger verbreitete Konvention, daß zwei signifikante Stellen angegeben werden. Dabei darf<br />
auch gerundet werden. Hier also nochmal das Beispiel zusammengefaßt:<br />
Das wurde am Meßgerät (Waage) abgelesen:<br />
m=78,34655 kg<br />
Dieser Fehler wurde berechnet:<br />
∆m=0,612549 kg<br />
So wird der Wert mit dem (absoluten) Fehler angegeben: m=(78,35±0,61) kg<br />
∆m ist nicht wirklich berechnet worden, der Wert ist wieder nur aus der Luft<br />
gegriffen, um das Prinzip deutlich zu machen.<br />
2. Fehler ist Fehler – oder nicht?<br />
Klare Antwort: Nö! Denn die Ungenauigkeiten, die bei einer Messung auftreten, können verschiedene<br />
prinzipielle Ursachen haben. Jeder Fehler eines Meßwerts oder auch einer daraus<br />
berechneten Größe fällt in eine der folgenden beiden Kategorien:<br />
2.1 Statistische Fehler<br />
Diese Fehler beeinflussen das Meßergebnis auf eine Art und Weise, die nicht vorhersehbar<br />
und nicht kontrollierbar ist. Man sagt deshalb auch Zufallsfehler. Was können Ursachen sein?<br />
• Unzulänglichkeiten der menschlichen Sinnesorgane (etwa das begrenzte Auflösungsvermögen<br />
des Auges, wenn es um die Frage geht, ob zwei haarfeine Linien übereinander<br />
oder leicht nebeneinander liegen),<br />
• Ungeschicklichkeit beim Messen und Ablesen (etwa Parallaxefehler),<br />
• Statistisch wirkende äußere Einflüsse (etwa Erschütterungen).<br />
Statistische Fehler lassen sich mathematisch mit den Werkzeugen der Statistik behandeln. Beachten<br />
Sie, daß diese Fehler beiderlei Vorzeichen haben (deshalb das „±“ im Kasten oben).<br />
Bei mehrfachen Messungen – sie stellen sich 10-mal auf die Waage – streuen die einzelnen<br />
Meßergebnisse um einen Mittelwert. Dieser Mittelwert ist i.a. nicht der tatsächliche Wert, den<br />
Sie gerne wissen wollen. Je länger aber eine Meßreihe ist, umso weiter nähert sich der Mittelwert<br />
dem tatsächlichen Wert an. Für Forscher und Praktikanten bedeutet das: Meßreihen sollten<br />
möglichst lang sein. Sie vertrauen ja auch keinem Medikament, das nur an fünf Leuten getestet<br />
wurde.<br />
Man kann es gar nicht oft genug betonen: Eine Einzelmessung sagt im Prinzip überhaupt<br />
nichts aus. Erst wenn man die Genauigkeit des Meßverfahrens durch viele Wiederholungen<br />
ermittelt hat, kann man wissen, wie die Ergebnisse der Einzelmessungen um eine Näherung<br />
für den wahren Wert schwanken. Diese Näherung muß natürlich sinnvoll und geeignet sein<br />
und aus den Einzelmessungen berechnet werden.<br />
2
2.2 Systematische Fehler<br />
Die systematischen Fehler zeichnen sich dadurch aus, daß sie sich auf alle Einzelmessungen<br />
in der gleichen Weise auswirken. Sie sind reproduzierbar, d.h. bei wiederholten Messungen<br />
unter gleichen Bedingungen treten sie in gleicher Größe und mit gleichem Vorzeichen auf.<br />
Dies ist ganz angenehm, weil dann das Meßergebnis entsprechend korrigiert werden kann<br />
(und muß). Beachten Sie, daß das bei den statistischen Fehlern nicht geht!<br />
Was führt zu einem systematischen Fehler in der Messung? Hier spielen beispielsweise Eichfehler<br />
von Meßgeräten eine Rolle (z.B. wenn die Personenwaage nicht Null anzeigt, wenn<br />
niemand darauf steht), oder Einflüsse, die im Praktikum weitestgehend vernachlässigbar sind,<br />
etwa Temperaturen und Drücke, die sich im Verlauf einer Meßreihe ändern, oder auch elektrische<br />
und magnetische Streufelder, wie sie durch Stromleitungen entstehen.<br />
In einer <strong>Fehlerrechnung</strong> werden grundsätzlich nur die statistischen, aber nicht die systematische<br />
Fehler behandelt.<br />
3. Häufigkeitsverteilung von Meßergebnissen<br />
Da habe ich nun geschwitzt und geflucht, um mein Ergebnis auszurechnen: (32±2) cm kommt<br />
raus. So weit, so gut. Nur leider ist der Referenzwert aus der Literatur mit 35 cm angegeben.<br />
Da habe ich also doch irgendwie nicht gut genug gearbeitet, es ist doch zu dumm!<br />
Dies ist die Reaktion vieler Praktikanten, wenn sie ihr Ergebnis mit einem Literaturwert vergleichen.<br />
Klären wir also nun, was es eigentlich bedeutet, wenn „±2 cm“ da steht. Heißt das,<br />
kein gemessener Wert ist größer gewesen als 34 cm und keiner kleiner als 30 cm? Schon mal<br />
vorweg: Das heißt es nicht. Jetzt kommt ein Experiment:<br />
Gemessen wird eine physikalische Größe, die ich der Einfachheit halber x nenne. Das kann also<br />
eine Temperatur, Zeit, Länge, oder was immer sonst sein. Wie immer wird die Messung<br />
mehrmals unter immer den gleichen Bedingungen durchgeführt, und zwar genau N-mal. Das<br />
Meßergebnis der i-ten Messung heißt x i . Nun kann es passieren, daß man bei einer oder mehreren<br />
anderen Messungen nochmal dasselbe Meßergebnis bekommt. Die Zahl N i gibt dann an,<br />
bei wievielen der N Messungen ich das Meßergebnis x i bekommen habe. Jetzt kommt noch<br />
ein kleiner Schritt: Teilt man N i durch die Gesamtzahl der Messungen, N, bekommt man die<br />
relative Häufigkeit n(x i ) des Meßwerts x i . Nochmal als Formel:<br />
Ni<br />
n( xi<br />
)<br />
N<br />
Anzahl der Messungen mit Ergebnis x<br />
Gesamtzahl aller Messungen<br />
i<br />
= = (1)<br />
Erinnern wir uns, daß die gemessenen Werte keine Zufallszahlen sind, sondern irgendwie um<br />
einen Mittelwert streuen. Tragen wir die relative Häufigkeit für einen Meßwert x i gegen die<br />
möglichen Meßwerte x auf, dann kommen wir diesem „irgendwie“ ein gutes Stück näher. Es<br />
zeigt sich nämlich, daß die entstehende Kurve sich mit größerem N immer besser der sog.<br />
Gaußverteilung (oder Normalverteilung) annähert. Man sagt, die Meßwerte sind gaußverteilt<br />
bzw. normalverteilt. Hier die Formel für die Gaußkurve:<br />
1<br />
n( x)<br />
= ⋅ e<br />
σ ⋅ 2π<br />
3<br />
( x−x<br />
) 2<br />
−<br />
2<br />
2σ<br />
Wichtig: Die Gaußverteilung ergibt sich nur für N → ∞. Die Verteilung Ihrer Meßwerte wird<br />
natürlich ganz anders aussehen, wenn Sie nur sehr wenige Messungen machen.<br />
(2)
Und hier ist die grafische Darstellung der Gaußverteilung:<br />
Welche Eigenschaften hat nun diese Verteilung?<br />
• n(x) ist die Verteilung einer Wahrscheinlichkeitsdichte. n(x)dx ist die Wahrscheinlichkeit<br />
dafür, daß bei einer Messung der Meßwert im Intervall [x, x+dx] liegt.<br />
• x ist der am häufigsten vorkommende Meßwert. Für N → ∞ ist er identisch mit dem wahren<br />
Wert von x.<br />
• In der Grafik sehen Sie, daß die Kurve zwei Wendepunkte hat, die sich bei x − σ und<br />
x + σ befinden. σ gibt also den Abstand der Wendepunkte von x an.<br />
Da n(x) eine Wahrscheinlichkeitsdichte ist, gibt die Fläche unter der Kurve eine Wahrscheinlichkeit<br />
an. Demzufolge ist<br />
∞<br />
∫ n( x) dx = 1, (3)<br />
−∞<br />
denn die Wahrscheinlichkeit, irgendeinen Wert zwischen -∞ und +∞ zu messen muß natürlich<br />
1 sein (Normierungsbedingung).<br />
Die beiden im Zusammenhang mit der Gaußverteilung definierten Größen x und σ haben –<br />
Sie ahnen es – praktische Bedeutung für die Auswertung Ihrer Messungen:<br />
• x heißt Mittelwert der Verteilung. Er ist das am häufigsten vorkommende Meßergebnis<br />
und für uns deshalb interessant, weil er für lange Meßreihen (N → ∞) eine gute Näherung<br />
an den wahren Wert einer physikalischen Größe darstellt.<br />
• σ heißt Standardabweichung der Verteilung. Sie ist ein Maß für die Streuung der einzelnen<br />
Meßergebnisse um den Mittelwert. Ein großer Wert von σ bedeutet, daß die Gaußverteilung<br />
sehr breit aussieht und bei einem kleinen Wert von σ eher eine schmale Nadel ist.<br />
Im ersten Fall streuen die Meßergebnisse sehr stark um x , im zweiten Fall liegen sie<br />
meistens in der Nähe des Mittelwertes. Somit ist die Standardabweichung geeignet, um<br />
die Genauigkeit eines Meßverfahrens anzugeben.<br />
Wenn, wie im Praktikum, verschiedene physikalische Größen benutzt werden schreibt man σ x<br />
für die Standardabweichung, die sich auf die Größe x bezieht. Aber was genau gibt σ denn<br />
nun quantitativ an? Ganz einfach:<br />
[ x − σ , x + σ ] ist dasjenige Intervall um x , in dem 68,3% aller Meßwerte liegen, denn die<br />
Wahrscheinlichkeit, daß das Meßergebnis in diesem Intervall liegt, beträgt<br />
4
Entsprechend gilt:<br />
x +σ<br />
∫ n( x) dx = 0,683 . (4)<br />
x −σ<br />
95,4% der Meßergebnisse liegen in [ x − 2 σ , x + 2σ ] und<br />
99,7% der Meßergebnisse liegen in [ x − 3 σ , x + 3σ ].<br />
Dies macht deutlich, daß man nicht sagen darf, daß alle Meßergebnisse innerhalb der 3-, 4-<br />
oder 5-fachen Standardabweichung liegen. Es gibt zu jedem noch so großen Intervall um x<br />
eine Wahrscheinlichkeit größer als Null, daß der nächste Meßwert außerhalb dieses Intervalls<br />
liegt.<br />
Um zum Anfang dieses Kapitels zurückzukommen: Der Literaturwert ist niemals der wahre<br />
Wert, sondern ein Mittelwert, der genau wie im Praktikum aus experimentellen Daten gewonnen<br />
wurde (außer wenn es ein theoretisch hergeleiteter Wert ist, der dann ausdrücklich als<br />
Theoriewert gekennzeichnet sein sollte). Nebenbei bemerkt sind Literaturangaben auch nur<br />
dann wirklich brauchbar, wenn deren Fehler angegeben werden. Nun, wenn Sie (32±2) cm<br />
bekommen und der Literaturwert mit 35 cm angegeben ist (häufig fehlen in den Büchern die<br />
Fehlerangaben dazu), dürfen Sie behaupten, daß die Werte innerhalb der zweifachen Standardabweichung<br />
übereinstimmen<br />
Der nächste Schritt besteht nun darin zu klären, wie man Mittelwerte und Standardabweichungen<br />
ausrechnet, wenn man eine Meßreihe hat. Vorher will ich aber noch eine Sache klarstellen,<br />
in der man sich leicht verheddert, wenn man seine ersten <strong>Fehlerrechnung</strong>en macht: Es<br />
geht in der <strong>Fehlerrechnung</strong> darum Ungenauigkeiten zu bestimmen von Werten, die bei der<br />
Messung direkt abgelesen werden, oder von Werten, die nicht gemessen, sondern durch Einsetzen<br />
der Meßwerte in irgendeine Formel berechnet werden. Der Input, den wir dazu zur<br />
Verfügung haben, sind die Meßwerte selbst, sowie schon vorhandene Fehlerangaben über die<br />
Genauigkeit von Meßgeräten. Solche Fehler, also die Ungenauigkeit von Meßgeräten, herauszubekommen,<br />
ist nicht Ziel der <strong>Fehlerrechnung</strong>. Häufig wird vom Hersteller die Genauigkeit<br />
angegeben, wenn nicht muß die Genauigkeit von Ihnen geschätzt werden.<br />
Hier eine Skizze der Skala eines Quecksilberthermometers:<br />
°C<br />
33<br />
32<br />
Was zeigt das Thermometer an? Zunächst einmal<br />
32,8 °C und dann noch ein bißchen.... Egal, was<br />
wir ablesen, es wird auf jeden Fall ungenau, weil<br />
man an dieser Skala gar nicht exakt ablesen kann.<br />
In diesem Beispiel könnte man sich höchstens trauen<br />
zu sagen, ob das Quecksilber eher auf einem<br />
Strich oder eher in der Mitte dazwischen ist (das<br />
zweite!). Wir lesen also ab: Temperatur T=32,9 °C.<br />
Die Ablese-Ungenauigkeit beträgt ∆T =0,1 °C, das<br />
ist der Abstand zwischen „Strich“ und „genau zwischen<br />
zwei Strichen“. Genauer geht es nicht. Beachten<br />
Sie, daß dieser Fehler geschätzt und nicht<br />
berechnet wurde!<br />
5
4. Mittelwert und Standardabweichung<br />
Weiter oben haben wir schon ein ganz zentrales Ergebnis der <strong>Fehlerrechnung</strong> gesehen: Der<br />
wahre Wert einer gemessenen Größe, nennen wir sie x, ergibt sich als arithmetischer Mittelwert<br />
im Grenzfall einer unendlich großen Zahl N von Messungen, d.h. einer unendlich langen<br />
Meßreihe. Mathematisch läßt sich das so ausdrücken:<br />
x<br />
wahr<br />
N<br />
1<br />
= lim ∑ xi<br />
(5)<br />
N →∞ N<br />
i=<br />
1<br />
x i ist hier das Meßergebnis der i-ten Messung der Größe x.<br />
Man kann verständlicherweise keine unendlich langen Meßreihen aufnehmen, sondern mit<br />
sinnvollem Zeitaufwand nur eine endliche Zahl N von Messungen durchführen. In der Statistik<br />
sagt man dazu, daß man eine Stichprobe macht.<br />
Was interessiert uns denn überhaupt? Wir wollen...<br />
1. ...eine möglichst gute Schätzung x für den wahren Wert bekommen,<br />
2. ...die Standardabweichung σ x , die angibt, wie die einzelnen Meßwerte um diesen<br />
Mittelwert streuen (siehe vorheriger Abschnitt) und<br />
3. ...die Ungenauigkeit σ x<br />
des Mittelwertes, die uns sagt, wie alle Mittelwerte, die<br />
möglich sind um den wahren Wert streuen.<br />
Fangen wir also mit Punkt 1 an: Als beste Schätzung für den wahren Wert erhält man den<br />
arithmetischen Mittelwert aus allen Meßergebnissen:<br />
x<br />
x + x + K + x<br />
= =<br />
1 N 1 2<br />
N<br />
∑ xi<br />
N i=<br />
1 N<br />
(6)<br />
i<br />
T (°C)<br />
1 38,6<br />
2 38,8<br />
3 38,9<br />
4 38,9<br />
5 39,1<br />
6 38,8<br />
7 38,7<br />
8 38,4<br />
Links ist eine Meßreihe, die bei der Messung der<br />
Körpertemperatur T mit einem Fieberthermometer<br />
entstanden ist (ich war krank und mir war<br />
langweilig).<br />
Der wahre Wert von T kann wegen der endlichen<br />
Länge N der Stichprobe nicht berechnet werden.<br />
Als Mittelwert ergibt sich aber:<br />
1<br />
T = ⋅ ( 38,6 ° C + K + 38,4 ° C)<br />
= 38,775 ° C .<br />
8<br />
Nun zu Punkt 2: Eine Größe, die angibt, wie die Ergebnisse der einzelnen Messungen um den<br />
Mittelwert x streuen ist die Standardabweichung σ x . Sie gibt den Mittelwert des Quadrates<br />
der Entfernung eines Meßergebnisses vom Mittelwert x an. Das mit den Quadraten macht<br />
6
man deshalb so, weil die Summe der einzelnen Abstände von Meßergebnissen zum Mittelwert<br />
Null ergeben würde (weil die Meßwerte ja über und unter dem Mittelwert verteilt liegen).<br />
Die mathematische Formel ist etwas sperrig und sieht so aus:<br />
N<br />
1<br />
σ<br />
x<br />
= ⋅∑<br />
i<br />
−<br />
−<br />
N 1 i=<br />
1<br />
( x x ) 2<br />
1<br />
= ⋅ ⎡( x ) 2 ( ) 2 ( )<br />
2<br />
1<br />
− x + x2<br />
− x + K + xN<br />
− x ⎤ . (7)<br />
N −1<br />
⎣<br />
⎦<br />
Dies ist die Standardabweichung der Einzelmessung vom Mittelwert. Sie wird auch als<br />
Stichprobenfehler bezeichnet.<br />
Als Beispiel bleiben wir bei der Temperatur-Meßreihe aus dem Kasten oben:<br />
Als Mittelwert hatten wir<br />
Messungen.<br />
T (°C) ( T T ) 2<br />
− (°C 2 )<br />
38,6 0,030625<br />
38,8 0,000625<br />
38,9 0,015625<br />
38,9 0,015625<br />
39,1 0,105625<br />
38,8 0,000625<br />
38,7 0,005625<br />
38,4 0,140625<br />
T = 38,775 ° C bestimmt, berechnet aus N=8<br />
Die Summe aus der rechten Spalte ergibt<br />
0,315 °C 2 (Lassen Sie sich von der Einheit<br />
„Grad Celsius zum Quadrat“ nicht irritieren!).<br />
Dies wird jetzt durch N-1=7 geteilt,<br />
was 0,045 °C 2 ergibt. Daraus die Wurzel,<br />
und wir haben die mittlere quadratische<br />
Abweichung der Einzelmessung vom Mittelwert<br />
T (d.h. die Standardabweichung der<br />
Einzelmessung):<br />
σ<br />
T<br />
= 0,21°C (auf zwei signifikante<br />
Stellen genau angegeben)<br />
Der mit (6) berechnete Mittelwert ist eine Schätzung für den wahren Wert der Größe x. Nehme<br />
ich nun verschiedene Meßreihen auf, so werden diese i.a. etwas verschiedene Mittelwerte<br />
liefern. Das bedeutet, daß der Mittelwert selbst mit einem Fehler behaftet ist. Alle Mittelwerte,<br />
die theoretisch möglich sind, sind um den wahren Wert x wahr verteilt. Wir berechnen also<br />
jetzt die Standardabweichung des Mittelwertes vom wahren Wert, womit wir bei Punkt 3 wären.<br />
Der wahre Wert selbst bleibt wie immer im Verborgenen, doch erstaunlicherweise können<br />
wir diese Standardabweichung trotzdem wie folgt ausrechnen:<br />
N<br />
1<br />
σ<br />
x<br />
= ⋅∑<br />
i<br />
−<br />
N ⋅ N − =<br />
( 1)<br />
( N −1)<br />
i 1<br />
( x x ) 2<br />
1<br />
= ⋅ ⎡<br />
1<br />
− +<br />
2<br />
− +…+<br />
N<br />
−<br />
N ⋅ ⎣<br />
1<br />
= ⋅ σ<br />
N<br />
x<br />
( x x ) ( x x ) ( x x )<br />
2 2 2<br />
⎤<br />
⎦<br />
(8)<br />
7
Beachten Sie den kleinen Unterschied zur Standardabweichung der Einzelmessung! Er beinhaltet<br />
die Tatsache, daß die mittlere quadratische Abweichung des Mittelwertes vom wahren<br />
1<br />
Wert sich mit zunehmender Stichprobenlänge N um den Faktor verkleinert. Hier sieht<br />
N<br />
man sozusagen mathematisch, warum eine Meßreihe möglichst lang sein sollte.<br />
Teilen wir σ = 0,21 °C aus dem vorherigen Kasten durch<br />
T<br />
8 , so kennen wir die Standardabweichung des Mittelwertes:<br />
σ = 0,074 °C<br />
T<br />
Wenn man einen Mittelwert, der ja eine Abschätzung des<br />
wahren Wertes ist, bestimmt, ist man i.a. an seiner mittleren<br />
quadratischen Abweichung vom wahren Wert interessiert, und<br />
weniger an der Standardabweichung der Einzelmessung. Als<br />
Ergebnis der ganzen Aktion ist es hier also sinnvoll zu<br />
schreiben (beachten Sie, daß Zahlenwert und Fehlerangabe mit<br />
gleich vielen Nachkommastellen notiert werden):<br />
T =(38,775±0,074) °C.<br />
Soviel zu meiner Körpertemperatur. Hieraus eine medizinische<br />
Diagnose zu erstellen überlasse ich nun Ihnen.<br />
In der Statistik findet man im Zusammenhang mit Fehlerangaben häufig noch einen weiteren<br />
Begriff, die Varianz Var(x) einer Meßgrösse x. Sie ist definiert als σ 2 , also als das Quadrat der<br />
Standardabweichung.<br />
5. Fehlerfortpflanzung<br />
Im Praktikum werden Sie oft feststellen, daß Sie mehrere verschiedene physikalische Größen<br />
messen müssen, um daraus diejenige Größe, die Sie interessiert, zu berechnen. Sie tun dies,<br />
weil die gesuchte Größe, nennen wir sie z, nicht für eine direkte Messung zugänglich ist. Die<br />
gemessenen Größen nenne ich im folgenden x 1 , x 2 ,..., x m . Beachten Sie den Unterschied zu<br />
den vorherigen Kapiteln: Dort stand der Index für die Nummer der Messung, und es wurde<br />
immer dieselbe Größe gemessen. Hier steht der Index für eine ganz neue Größe, z.B. könnte<br />
x 1 eine Temperatur sein, x 2 eine elektrische Spannung, usw. Daß man z aus den anderen<br />
Größen berechnen kann bedeutet, daß man z als Funktion von x 1 ,..., x m schreiben kann: z =<br />
f(x 1 , ..., x m ). Hier geht es nun darum, wie man den Fehler von z berechnet, wenn die Fehler<br />
von x 1 , ..., x m bekannt sind. Diese Fehler sind häufig Angaben von Herstellerfirmen von Meßgeräten<br />
über deren Ungenauigkeit.<br />
8
5.1 Fehlerfortpflanzungsgesetz<br />
Um die <strong>Fehlerrechnung</strong> im engeren Sinn anwenden zu können müssen zwei Bedingungen<br />
erfüllt sein:<br />
1) Die Meßergebnisse der Messgrößen x 1 , ..., x m müssen normalverteilt sein.<br />
2) Die einzelnen Meßgrößen x 1 , ..., x m müssen statistisch voneinander unabhängig sein.<br />
Die zweite Bedingung bedeutet, daß es zu keiner Meßgröße x i einen analytischen Zusammenhang<br />
mit einer anderen Meßgröße x j geben darf. Gäbe es ihn, könnte man nämlich x i mittels x j<br />
in der Form x i = f(x j ) ausdrücken, so daß man eine Meßgröße zuviel in der Rechnung hätte.<br />
Die Forderung ist also, daß die kleinstmögliche Anzahl von Meßgrößen verwendet wird. Folgendes<br />
Beispiel soll dies verdeutlichen:<br />
Ein Praktikumsteilnehmer will die Fläche A einer Kreisscheibe<br />
berechnen und mißt hierzu den Radius r und sicherheitshalber<br />
auch den Durchmesser d. Aus den Meßreihen berechnet er die<br />
Mittelwerte r und d . Da er beide Meßgrößen weiter auswerten<br />
will teilt er die Fläche A in zwei Hälften:<br />
1 2 1 ⎛ d ⎞<br />
A = A1 + A2<br />
= π r + π⎜ ⎟<br />
2 2 ⎝ 2 ⎠<br />
Diese Formel ist zweifellos richtig. Es spricht nichts dagegen,<br />
die Fläche A so zu berechnen. Die beiden Meßgrößen r und d<br />
sind allerdings nicht unabhängig voneinander, denn zwischen<br />
ihnen besteht der Zusammenhang d=2·r. Damit ist die Bedingung<br />
2) nicht erfüllt, und man kann das Fehlerfortpflanzungsgesetz<br />
hier nicht anwenden, um den Fehler von A zu berechnen.<br />
2<br />
Benutzt man aber die Gleichung A = π r sind beide Bedingungen<br />
erfüllt, und man arbeitet mit der kleinstmöglichen Anzahl<br />
von Meßgrößen.<br />
2<br />
Wir setzen noch voraus, daß aus den Meßreihen die Mittelwerte der verschiedenen Meßgrössen<br />
bekannt sind: x , x , K , x , ebenso die Standardabweichungen der Mittelwerte σ , K , σ .<br />
1 2<br />
Die beste Schätzung für den Mittelwert von z ist dann<br />
m<br />
( )<br />
x1<br />
x m<br />
z = f x , , 1<br />
K xm<br />
, (9)<br />
was unmittelbar plausibel ist. Die optimale Schätzung für den Fehler von z ist die Standardabweichung<br />
σ<br />
z<br />
. Sie berechnet sich nach dem Fehlerfortpflanzungsgesetz, das im Praktikum<br />
eine sehr große Rolle spielt:<br />
9
σ =<br />
z<br />
m<br />
∑<br />
j=<br />
1<br />
⎛ ∂f<br />
⎜<br />
⎝ ∂x<br />
2<br />
j<br />
⎞<br />
⎟<br />
⎠<br />
2<br />
⋅ σ<br />
2<br />
x j<br />
2 2<br />
⎜ ⎟ x ⎜ ⎟<br />
1<br />
x<br />
x<br />
m<br />
⎝ ∂<br />
1 ⎠ ⎝ ∂xm<br />
⎠<br />
2<br />
⎛ ∂f<br />
⎞ ⎛ ∂f<br />
⎞<br />
= ⋅ σ + K + ⋅ σ . (10)<br />
Hierbei bedeutet ∂/∂x j die partielle Ableitung nach x j (Sie wird genauso gebildet, wie die normale<br />
Ableitung), und der Querstrich zeigt an, daß in den in Klammern stehenden Ausdrücken<br />
die Mittelwerte der Meßgrößen eingesetzt werden sollen. Beispiel gefällig?<br />
Die Dichte ρ soll für einen Würfel berechnet werden. Hierzu<br />
wird die Kantenlänge a und die Masse m gemessen. Die Formel<br />
für die Dichte ist<br />
m<br />
ρ = .<br />
3<br />
a<br />
Um die Dichte auszurechnen werden die Mittelwerte von m<br />
und a benutzt:<br />
m<br />
ρ =<br />
3<br />
a<br />
Die Fehler σ<br />
m<br />
und σ<br />
a<br />
der Mittelwerte werden nach Gl. (8)<br />
berechnet. Gehen wir davon aus, daß sie schon bekannt sind.<br />
Der Fehler der Dichte berechnet sich nach dem Fehlerfortpflanzungsgesetz<br />
Gl. (10):<br />
2 2<br />
2 ∂ρ<br />
2<br />
m<br />
a<br />
⎛ ∂ρ<br />
⎞ ⎛ ⎞<br />
σ<br />
ρ<br />
= ⎜ ⋅ σ + ⋅σ<br />
∂m<br />
⎟ ⎜<br />
∂a<br />
⎟<br />
⎝ ⎠ ⎝ ⎠<br />
2 2<br />
2 − m 2<br />
σ<br />
3 m<br />
σ<br />
4 a<br />
⎛ 1 ⎞ ⎛ 3 ⎞<br />
= ⎜ ⋅ + ⋅<br />
a<br />
⎟ ⎜<br />
a<br />
⎟<br />
⎝ ⎠ ⎝ ⎠<br />
1 9m<br />
= ⋅ + ⋅<br />
a a<br />
2<br />
2 2<br />
σ<br />
6 m<br />
σ<br />
8 a<br />
Um den Fehler des Dichte-Mittelwertes zu bekommen werden<br />
die Mittelwerte der Meßgrößen, sowie deren Standardabweichungen<br />
eingesetzt:<br />
2<br />
1 2 9m<br />
2<br />
σ = 6 m 8 a<br />
a<br />
⋅ + a<br />
⋅<br />
ρ<br />
σ σ .<br />
10
5.2 Maximaler Fehler<br />
Es kann unter Umständen vorkommen, daß eine der Voraussetzungen (oder beide) für das<br />
Fehlerfortpflanzungsgesetz nicht erfüllt sind. Wenn das der Fall ist kann Gl. (10) nicht benutzt<br />
werden, um den Fehler der physikalischen Größe z anzugeben. Das heißt aber nicht, daß Sie<br />
überhaupt keinen Fehler angeben können (Sie kommen nicht drum herum), sondern hier ist<br />
die Angabe des Maximalfehlers ∆z sinnvoll. Er schreibt sich mathematisch so:<br />
∆ z =<br />
m<br />
∑<br />
j=<br />
1<br />
∂f<br />
∂x<br />
j<br />
⋅ ∆x<br />
j<br />
∂f ∂f ∂f<br />
= ⋅ ∆ x + ⋅ ∆ x + K + ⋅ ∆xm<br />
(11)<br />
∂x ∂x ∂x<br />
1 2<br />
1 2<br />
m<br />
Die Betragstriche stehen da, weil die partielle Ableitung von f negativ sein kann, die Beiträge<br />
aus den einzelnen Größen sich aber positiv addieren müssen.<br />
Für diejenigen Meßgrößen x j , deren Mittelwerte und Standardabweichungen aus einer Meßreihe<br />
bekannt sind, wird als Fehler<br />
∆ x j<br />
= σ x j<br />
,<br />
also die Standardabweichung des Mittelwertes eingesetzt. Für alle anderen Meßgrößen muß<br />
ein realistischer Schätzwert für den Fehler verwendet werden (Ein Beispiel zu diesen Schätzwerten<br />
finden Sie auf Seite 5.).<br />
Als kleines Exempel bleiben wir bei der Dichte-Berechnung von der vorigen Seite:<br />
Der einzige Unterschied zur Rechnung im vorherigen Beispiel-Kasten soll<br />
sein, daß die Fehler der Masse m und der Kantenlänge a nicht aus Meßreihen<br />
bestimmt wurden (Standardabweichungen), sondern Schätzwerte ∆m und ∆a<br />
sind. Auch damit könnte man das Fehlerfortpflanzungsgesetz benutzen, bekäme<br />
dann aber nicht die Standardabweichung von z , sondern nur eine Abschätzung<br />
des Fehlers ∆ z . Hier interessiert uns jedoch ausdrücklich der maximale<br />
Fehler der Dichte ρ, der mit Gl. (11) berechnet wird:<br />
∂ρ<br />
∂ρ<br />
∆ ρ = ⋅ ∆ m + ⋅ ∆a<br />
∂m<br />
∂a<br />
1 −3m<br />
= ⋅ ∆ m + ⋅ ∆ a<br />
3 4<br />
a a<br />
1<br />
= ⋅ a ⋅ ∆ m + 3m ⋅ ∆ a<br />
4<br />
a<br />
( )<br />
Die Betragsstriche konnten im letzten Schritt ebenso wie das Minuszeichen<br />
weggelassen werden, weil m, a und ihre Fehler ∆m und ∆a größer als Null<br />
sind. Der Maximalfehler des Dichte-Mittelwertes ergibt sich durch Einsetzen<br />
der Mittelwerte für m und a:<br />
1<br />
∆ ρ = ⋅<br />
4<br />
( a ⋅ ∆ m + 3m ⋅ ∆a)<br />
a<br />
11
6. Lineare Regression<br />
Häufig hängen zwei physikalische Größen x und y linear voneinander ab, so daß sie über eine<br />
Geradengleichung<br />
y = a·x+b (12)<br />
miteinander verknüpft sind. a ist die Steigung, b der y-Achsenabschnitt, und beide sind konstant.<br />
Ein Experiment läuft häufig so ab, daß man die Größe x nacheinander auf N verschiedene<br />
Werte x i einstellt und die Werte y i an einem Meßgerät abliest, wobei jeder Wert y i mit einem<br />
Zufallsfehler behaftet ist. Was den Experimentator interessiert sind die Parameter a und b<br />
(häufig Material- oder Naturkonstanten), und wie man an diese kommt, darum geht es in<br />
diesem Abschnitt.<br />
Nach N Messungen mit verschiedenen x i haben wir eine Meßreihe. Häufig findet man Praktikanten<br />
in lebhafte Diskussionen verstrickt, ob die Meßwerte, die in dieser Meßreihe stehen,<br />
denn nun einen linearen Zusammenhang zeigen oder nicht. Viel Zeit und Nerven kann man<br />
sich hier sparen, wenn man sich an ein bewährtes Hausmittel erinnert: Hinzeichnen! Stehen<br />
die Datenpunkte (x i , y i ) in einem Diagramm, so ist wesentlich besser zu erkennen, auf was für<br />
einer Kurve diese Punkte liegen, und hier sind wir am entscheidenden Punkt: Selbst wenn sich<br />
theoretisch ein linearer Zusammenhang der Größen x und y herleiten läßt, finden wir doch,<br />
daß die Meßpunkte (x i , y i ) nicht so ganz auf einer Geraden liegen. Das liegt natürlich am Fehler<br />
der Werte y i . Auch die Meßwerte x i haben in der Realität natürlich Fehler, wir nehmen hier<br />
aber ausdrücklich an, daß diese Fehler vernachlässigbar sind. Man kann bei der linearen Regression<br />
den Fehler von x i grundsätzlich auch mit berücksichtigen, dann erhöht sich aber der<br />
Rechenaufwand dramatisch und ist dem Praktikum nicht mehr angemessen.<br />
y<br />
x<br />
Typische Lage von Datenpunkten,<br />
wenn die Theorie einen linearen Zusammenhang<br />
zwischen x und y liefert.<br />
Nur die Fehler der y-Koordinaten sind<br />
berücksichtigt (Fehlerbalken).<br />
Die Aufgabe ist jetzt, eine Gerade zu finden, die, salopp gesagt, gut zu den Meßpunkten paßt,<br />
und deren Parameter a und b sind.<br />
In der einfachsten Variante kann man diese Gerade näherungsweise auf zeichnerischen Wege<br />
finden, indem man mit einem Lineal eine Gerade so in das Diagramm einzeichnet, daß nach<br />
dem Augenschein eine „ausgleichende“ Gerade entsteht. Dabei wird weniger die Anzahl der<br />
Punkte über und unter der Geraden, sondern vielmehr deren Abstand zur Geraden berücksichtigt.<br />
Diese Art, eine Ausgleichsgerade zu finden, ist sicher vielen von Ihnen aus der Schule<br />
bekannt. Aber Achtung: Die verbreitete Version, daß man nur den ersten und den letzten Datenpunkt<br />
zu einer Geraden verbinden müsse, ist falsch! Sie muß auch falsch sein, denn um<br />
eine Ausgleichsgerade zu finden müssen natürlich alle Wertepaare berücksichtigt werden<br />
(Leider gibt es anscheinend Lehrer, die von der falschen Methode so überzeugt sind, daß sie<br />
12
sie sogar unterrichten). Im nächsten Schritt ist es dann leicht, b an der y-Achse abzulesen und<br />
mittels eines eingezeichneten Steigungsdreiecks die Steigung a zu bestimmen.<br />
So weit, so gut. Es gibt natürlich auch eine mathematische, quantitative Methode, um die gesuchte<br />
Geradengleichung zu finden. Das Verfahren heißt lineare Regression und basiert auf<br />
der Forderung, daß die Summe aus den Abstands-Quadraten der Meßpunkte zu der Geraden<br />
minimal wird (damit sind die Abstände der y-Koordinaten gemeint):<br />
N<br />
!<br />
2<br />
∑ ⎡ yi<br />
− ( a ⋅ xi<br />
+ b) ⎤ = minimal<br />
(13)<br />
i=<br />
1<br />
⎣<br />
⎦<br />
Daran sehen Sie, daß es sich im Prinzip um eine Extremwertaufgabe handelt. Sie fragen sich<br />
bestimmt, warum die Summe der Quadrate und nicht die Summe der einfachen Abstände genommen<br />
wird. Die Antwort liegt in den Tiefen der mathematischen Statistik: Der Satz von<br />
Gauß-Markov besagt, daß man das bestangepaßte Modell, d.h. Geradengleichung, erhält,<br />
wenn die Methode der kleinsten Quadrate benutzt wird.<br />
y<br />
Methode der kleinsten Quadrate: Die Abstandsquadrate sind hier als graue<br />
Flächen gezeichnet. Die Regressionsgerade ist diejenige Gerade, für die die<br />
Summe der grauen Flächen am kleinsten ist. Die Fehlerbalken der Datenpunkte<br />
sind für die bessere Übersichtlichkeit weggelassen worden.<br />
Nach einer längeren Rechnung, die ich hier nicht detailliert aufführen will, ergeben sich als<br />
Lösung der Extremwertaufgabe Gl. (13) folgende beste Schätzwerte a’ und b’ der Parameter a<br />
und b:<br />
S<br />
a′ = ; b′ = y − a′<br />
⋅ x<br />
(14)<br />
S<br />
xy<br />
2<br />
x<br />
x<br />
mit folgenden Definitionen:<br />
1 N xi<br />
N i = 1<br />
x = ∑ ;<br />
N<br />
1<br />
S = x − x ⋅ y − y<br />
13<br />
1 N yi<br />
N i = 1<br />
y = ∑<br />
∑<br />
2<br />
( ) ( ) ; S ( ) 2<br />
x<br />
= xi<br />
− x<br />
−1<br />
1<br />
xy i i<br />
N i=<br />
1<br />
N<br />
1<br />
∑ (15)<br />
−<br />
N i=<br />
1
Wir sind hier in der verrückten Situation, daß wir Mittelwerte für x und y ausrechnen müssen,<br />
obwohl die x-Werte absichtlich während der Versuchsreihe verändert werden, sich also die<br />
Grössen x und y laufend ändern.<br />
Ich gebe Ihnen an dieser Stelle die herzliche Bitte mit auf den Weg, in Ihren Versuchsauswertungen<br />
auch immer alle Zwischenwerte (15) aufzuschreiben, wenn Ihnen eine lineare Regression<br />
begegnet – es erleichtert die Nachvollziehbarkeit und die Fehlersuche erheblich.<br />
Haben wir jetzt alles? Nicht ganz! Die Schätzwerte (14) für die Parameter a und b reichen<br />
zwar schon aus, um die Geradengleichung der Regressionsgeraden hinzuschreiben, allerdings<br />
sind diese – wie sollte es anders sein – fehlerbehaftet. Und wenn wir auf dem Wege der linearen<br />
Regression z.B. eine physikalische Konstante bestimmen wollen, ist deren Fehlerwert von<br />
allergrößtem Interesse.<br />
Aus Gl. (11) und Anwendung der Fehlerfortpflanzung (die Einzelheiten überspringen wir hier<br />
wieder, weil man wirklich nichts Neues draus lernt) findet man als beste Schätzung für den<br />
Fehler von y<br />
N<br />
1<br />
σ = ∑ ⎡ y − ( a′ ⋅ x + b′<br />
) ⎤<br />
2<br />
−<br />
⎣<br />
⎦ . (16)<br />
y i i<br />
N 2 i=<br />
1<br />
Dies ist die Standardabweichung der Einzelmessung. Ein Blick zurück zu Gl. (7) in Kapitel 4<br />
sagt Ihnen, daß dort die Standardabweichung der Einzelmessung etwas anders definiert worden<br />
ist, indem dort nämlich durch N-1 geteilt wurde. Machen Sie sich aber klar, daß dort die<br />
Abweichung der Einzelmessung vom Mittelwert behandelt wurde, während es hier um die Abweichung<br />
der Einzelmessung von der Regressionsgeraden geht. Im ersten Fall haben wir nur<br />
einen Parameter x variiert, im zweiten Fall jonglieren wir mit zwei Parametern a und b. Dies<br />
erklärt den kleinen Unterschied. Beachten Sie auch, daß Gl. (16) nicht etwa den y-Fehler angibt,<br />
der als Fehlerbalken ins Diagramm eingezeichnet wird!<br />
Als beste Abschätzungen der Fehler σ a’ und σ b’ der Schätzwerte a’ und b’ ergeben sich nun<br />
σ<br />
′<br />
= σ ⋅<br />
a<br />
y<br />
y<br />
= σ ⋅<br />
= σ ⋅<br />
y<br />
∑<br />
2<br />
i<br />
N<br />
( ∑ ) 2<br />
i<br />
N ⋅ x − x<br />
∑<br />
x<br />
1<br />
− N ⋅ x<br />
2 2<br />
i<br />
1<br />
∑( x ) 2<br />
i<br />
− x<br />
(17)<br />
für den Fehler der Geradensteigung und<br />
σ<br />
′<br />
= σ ⋅<br />
b<br />
y<br />
2<br />
∑ xi<br />
2<br />
∑ i<br />
− ( ∑ i )<br />
2<br />
∑ x<br />
2<br />
∑ i<br />
− ⋅<br />
2<br />
2<br />
∑ x<br />
2<br />
∑(<br />
i<br />
− )<br />
N ⋅ x x<br />
1 i<br />
= σ<br />
y<br />
⋅ ⋅<br />
N x N x<br />
1 i<br />
= σ<br />
y<br />
⋅ ⋅<br />
N x x<br />
2<br />
(18)<br />
14
für den Fehler des y-Achsenabschnitts. Alle Summen laufen von i=1 bis N.<br />
Liegt eine Ursprungsgerade der Form<br />
Berechung der Steigung<br />
y = a ⋅ x vor, gelten folgenden Formeln für die<br />
a<br />
n<br />
∑<br />
i<br />
i=<br />
1<br />
=<br />
n<br />
x ⋅ y<br />
∑<br />
i=<br />
1<br />
x<br />
2<br />
i<br />
i<br />
(19)<br />
und den Fehler der Steigung.<br />
n<br />
∑<br />
d<br />
i<br />
1 i=<br />
1<br />
σ<br />
a<br />
= , wobei d<br />
n<br />
i<br />
= yi<br />
− a ⋅ xi<br />
ist. (20)<br />
n −1<br />
2<br />
x<br />
∑<br />
i=<br />
1<br />
i<br />
2<br />
Vor diesen ganzen Formeln sollten Sie keinen großen Respekt haben, es ist viel einfacher, als<br />
es aussieht. Da Sie im Praktikum recht oft mit der linearen Regression konfrontiert werden ist<br />
an dieser Stelle wieder ein Beispiel angebracht: Haben Sie sich schon einmal gefragt, wie dick<br />
ein Blatt Papier in Ihrem Lehrbuch ist? Vermutlich nicht (Warum sollten Sie auch?), dennoch<br />
haben wir hier ein gutes Beispiel für etwas, das man nicht besonders gut direkt messen, wohl<br />
aber mittels linearer Regression bestimmen kann.<br />
---------------------------------------------------Beispiel----------------------------------------------------<br />
Ein Buch ist ein bisschen wie Quantenphysik: Die Dicke des Buches ist<br />
quantisiert, und ein „Buchquant“ ist die Dicke eines Blattes. Mit einem Messschieber<br />
wird die Dicke gemessen, nicht eines einzelnen Blattes, auch nicht<br />
des ganzen Buches, sondern von 10, 20, 30, usw. Blättern einschließlich des<br />
hinteren Buchdeckels (warum ich den mitnehme wird noch deutlich werden).<br />
Hier die Messreihe, bei der m die Anzahl der Blätter ist:<br />
Anzahl<br />
m<br />
Dicke<br />
d (mm)<br />
10 3,2<br />
20 4,2<br />
30 5,1<br />
40 5,8<br />
50 6,8<br />
60 7,7<br />
70 8,8<br />
80 9,7<br />
90 10,8<br />
100 11,7<br />
Zuerst werden die Zwischenergebnisse ausgerechnet:<br />
Mit Formel (6) bekommen wir die Mittelwerte von<br />
m und d:<br />
m =55 und d =7,38 mm.<br />
Als nächstes bekommen wir nach Gl. (15)<br />
S md =86,4444 mm und<br />
S m 2 =916,6666.<br />
Die optimalen Abschätzungen der Parameter a und b<br />
ergeben sich schließlich nach Gl.(14) zu<br />
a’=0,0943 mm und<br />
b’=2,1935 mm.<br />
15
Dies reicht schon aus, um eine Grafik mit der Regressionsgeraden zu zeichnen:<br />
Die Grafik wurde mit dem Programm Origin erstellt. Programme wie Excel<br />
oder Origin können die gesamte lineare Regression selbst durchführen und liefern<br />
nicht nur das Diagramm, sondern auch a’, b’ und deren Fehler.<br />
Die Geradengleichung, die wir bekommen, lautet nun<br />
d=0,0943 mm · m + 2,1935 mm.<br />
Jetzt fehlen noch die Fehlerangaben. Hierzu eine Tabelle mit Zwischenwerten:<br />
m i<br />
2<br />
(m i - m ) 2 (d i -(a’·m i +b’)) 2 (mm 2 )<br />
100 2025 0,00405<br />
400 1225 0,01457<br />
900 625 0,00604<br />
1600 225 0,02732<br />
2500 25 0,01172<br />
3600 25 0,02289<br />
4900 225 0,00003<br />
6400 625 0,00139<br />
8100 1225 0,01433<br />
10000 2025 0,00588<br />
Nur die Werte in der<br />
rechten Spalte haben<br />
Einheiten, denn m ist ja<br />
nur eine Anzahl.<br />
16
Zuerst erhalten wir mit Formel (16)<br />
10<br />
1<br />
σ = ⋅ ⎣ − ⋅ +<br />
2<br />
∑ ⎡d ( a′ m b′<br />
) ⎤ = 0,173 mm.<br />
d i i<br />
8 i=<br />
1<br />
Die Gleichungen (17) und (18), ich benutze jeweils die unterste Variante, liefern<br />
als Fehler<br />
σ a’ =0,0019 mm und σ b’ =0,12 mm<br />
Zusammengefasst bekommen wir also:<br />
a’=(0,0943±0,0019) mm<br />
b’=(2,19±0,12) mm<br />
Die Steigung a’ gibt an, wie dick ein Blatt des Buches (durchschnittlich) ist.<br />
Wir haben also das Buchquant bestimmt, und das noch mit Fehlerangabe!<br />
Der y-Achsenabschnitt b’ gibt die Dicke des unteren Buchdeckels an, also die<br />
Dicke, wenn Null Blatt Papier gemessen werden. Beides zusammen ergibt die<br />
Buchgleichung<br />
Buchdicke D = a’·m+2b’.<br />
Im rechten Summanden steht ein Faktor 2, weil man ja auch noch den oberen<br />
Buchdeckel zur gesamten Dicke rechnen muss.<br />
⎦<br />
Die Buchgleichung in diesem Beispiel entspricht einem Naturgesetz, und a’ und b’ entsprechen<br />
Materialparametern. Sie gelten immer nur für ein bestimmtes Buch, in diesem Fall war<br />
es Kohlrausch, Praktische Physik, 22. Auflage, B. G. Teubner, Stuttgart, 1968.<br />
--------------------------------------------------Beispielende------------------------------------------------<br />
Bis hierhin haben wir die allgemeine Form der linearen Regression besprochen. Es gibt einen<br />
wichtigen Spezialfall, bei dem man etwas andere Formeln benutzen darf und sich einige Arbeit<br />
sparen kann: Wenn der y-Achsenabschnitt Null ist und sich daher die Regressionsgerade<br />
als y=a·x schreiben läßt. Aber Achtung! Überlegen Sie sich vorher gründlich, ob das wirklich<br />
der Fall ist! Diese einfache Variante dürfen Sie nicht benutzen, wenn der y-Achsenabschnitt<br />
nur klein, aber vorhanden ist. Er muß exakt Null sein, wie etwa beim Zusammenhang zwischen<br />
der Länge einer Strecke und der Zeit, die ein Lichtstrahl braucht, um sie zurückzulegen.<br />
Für eine solche lineare Regression durch Null gelten folgende Formeln, mit denen man die<br />
beste Schätzung a’ der Steigung und deren Fehler bekommt:<br />
Die Standardabweichung der Einzelmessung von der Regressionsgeraden ist analog zu Gl.<br />
(16)<br />
N<br />
1<br />
σ = ⋅∑ [ y − a′<br />
⋅ x ] 2<br />
. (21)<br />
−<br />
y i i<br />
N 1 i=<br />
1<br />
17
Hier wird in der Wurzel jedoch durch N-1 geteilt, weil wir es nur mit einem Parameter zu tun<br />
haben. Die beste Schätzung für die Steigung ist<br />
a<br />
x<br />
⋅ y<br />
′ = ∑ ∑ , (22)<br />
i i<br />
2<br />
xi<br />
und als beste Schätzung des Fehlers ergibt sich<br />
σ<br />
′<br />
= σ ⋅<br />
a<br />
y<br />
1<br />
2<br />
∑ x , (23)<br />
i<br />
wobei die Summen immer von i=1 bis N laufen.<br />
Manchmal geben Rechenprogramme außer Steigung und y-Achsenabschnitt auch noch einen<br />
Koeffizienten aus, der meist R heißt. Es handelt sich dabei um den Pearson’schen empirischen<br />
Korrelationskoeffizienten. Er ist definiert als<br />
R =<br />
S<br />
S<br />
xy<br />
⋅ S<br />
2 2<br />
x y<br />
(24)<br />
N<br />
2 1<br />
mit den Definitionen Gl. (15) und S ( ) 2<br />
y<br />
= ∑ yi<br />
− y . R kann Werte zwischen -1 und 1<br />
N −1<br />
i=<br />
1<br />
annehmen und dient zur Überprüfung, ob die gemessenen Daten tatsächlich einen linearen<br />
Zusammenhang haben. Für R=+1 oder -1 liegen alle Meßpunkte exakt auf einer Geraden. Das<br />
Vorzeichen gibt nur an, ob deren Steigung positiv oder negativ ist. Für R=0 besteht überhaupt<br />
kein linearer Zusammenhang. Die Betonung liegt hier auf linear, denn die Größen x und y<br />
können dann sehr wohl noch nichtlinear und im Diagramm auch deutlich erkennbar korreliert<br />
sein.<br />
Literaturhinweise:<br />
Kamke,<br />
Der Umgang mit experimentellen Daten, insbesondere Fehleranalyse, im physikalischen<br />
Anfänger-Praktikum: Eine elementare Einführung.<br />
Verlag und Herausgeber: Wolfgang Kamke<br />
ISBN: 978-3-00-031620-3<br />
Eine hervorragende Einführung. Ausführlich ohne ein dickes Lehrbuch zu sein und für<br />
<strong>Einsteiger</strong> sehr gut verständlich. Auch zum späteren Nachschlagen geeignet.<br />
Bronstein, Semendjajew, Musiol, Mühlig,<br />
Taschenbuch der Mathematik.<br />
Verlag Harri Deutsch<br />
ISBN: 3-8171-2005-2<br />
Die Mutter aller Mathe-Formelsammlungen! Was hier nicht drinsteht ist unlösbar oder<br />
trivial.<br />
Ralf Dinter, Institut für Angewandte Physik, Universität <strong>Hamburg</strong>, Februar 2011<br />
18