11.07.2015 Aufrufe

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II ...

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II ...

Trainingsaufgaben zur Klausurvorbereitung in Statistik I und II ...

MEHR ANZEIGEN
WENIGER ANZEIGEN
  • Keine Tags gefunden...

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik<strong>Tra<strong>in</strong><strong>in</strong>gsaufgaben</strong> <strong>zur</strong> <strong>Klausurvorbereitung</strong><strong>in</strong> <strong>Statistik</strong> I <strong>und</strong> <strong>II</strong>Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregressionAufgabe 1: Kfz-HaltungskostenVon 4 Kfz-Haltern s<strong>in</strong>d im letzten Jahr die Kfz-Haltungskosten pro km <strong>und</strong> die Kilometerleistungbekannt:Haltungskosten (e/km) 0.5 0.2 0.35 0.4Fahrleistung (km) 14000 42000 14000 25000(a) Bestimmen Sie die Koeffizienten der Regression ŷ(x) = a + b/x(b) Bestimmen Sie die mittleren Fixkosten, die variablen Kosten sowie die Preiselastizitätbei e<strong>in</strong>er Fahrleistung von 20000 km(c) Zeichnen Sie die Daten <strong>und</strong> die Regressionsfunktion <strong>in</strong> e<strong>in</strong> Diagramm e<strong>in</strong>.Lösungsvorschlag zu Aufgabe 1: Kfz-Haltungskosten(a) ŷ = a + b/x, a = 0.137e, b = 3396ekm(b) Fixkosten: 3396e; Variablen Kosten: 0.137e/km(c) Scatterplot mit Fitgeraden:Haltungskosten (Euro/km)0.60.50.40.30.20.100 10000 20000 30000 40000 50000Fahrleistung (km)www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 1


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikAufgabe 2: WeltenergieverbrauchDer Weltenergieverbrauch <strong>in</strong> Exajoule (EJ, 10 18 J) veränderte sich wie folgt:JahrWeltenergieverbrauch (EJ)1900 151920 301940 501960 1301972 230(i) Führen Sie die nichtl<strong>in</strong>eare Regression mit der Funktiondurch.ŷ(x) = ae bxLösungsvorschlag zu Aufgabe 2: WeltenergieverbrauchDurch die Variablentransformationz = lnywird die Aufgabe <strong>in</strong> e<strong>in</strong>e l<strong>in</strong>eare Regression übergeführt, dennẑ(x) = ln(ŷ(x)) = lna + bx = ã + bxDie Koeffizienten ã <strong>und</strong> b werden durch die übliche l<strong>in</strong>eare Regression bestimmt:ã = ¯z − b¯x, b =∑xi z i − n¯x¯z∑ x2i− n¯x 2Wir benötigen also vier Summen,n∑x i = n¯x,i=1n∑z i = n¯z,i=1n∑x i z i ,i=1n∑x 2 ii=1die wir, wie üblich, über e<strong>in</strong>e Arbeitstabelle berechnen:www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 2


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikJahr x i y i z i = lny i x 2 ix i z i1900 0 15 2.711920 20 30 3.401940 40 50 3.911960 60 130 4.871972 72 230 5.44n¯xn¯z∑ ni=1 x2 i∑ ni=1 x iz iDaraus ã = 2.63 <strong>und</strong> b = 0.03739, also<strong>und</strong> nach Rücktransformation y = e z :ẑ(x) = 2.63 + 0.03739xŷ(x) = eẑ(x) = e 2.63 e 0.03739x = 13.8 ∗ e 0.03739x .H<strong>in</strong>weis: Sie können statt mit dem natürlichen Logarithmus ln auch mit dem Zehnerlogarithmuslog rechnen. In diesem Fall erhalten Sieẑ(x) = log(ŷ(x)) = 1.14 + 0.01624x<strong>und</strong>ŷ(x) = 10ẑ(x) = 10 1.14 10 0.01624x = 13.8 ∗ 10 0.01624x .ln(Welt-Energieproduktion (EJ))65.554.543.532.51900 1920 1940 1960 1980Jahrwww.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 3


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikWelt-Energieproduktion (EJ)3002502001501005001900 1920 1940 1960 1980Jahr(ii) Wie hoch ist der mit diesen Zahlen prognostizierte Verbrauch 1980 <strong>und</strong> 2020? E<strong>in</strong>fachdie x-Werte e<strong>in</strong>setzen (drei signifikante Stellen):• 1980: x = 80, ŷ(x) = 13.8e 0.03739∗80 = 275 EJ• 2020: x = 120, ŷ(x) = 13.8e 0.03739∗120 = 1230 EJH<strong>in</strong>weis: Mit ŷ(x) = 13.8 ∗ 10 0.01624x erhalten Sie – bis auf R<strong>und</strong>ungsfehler – natürlichdieselben Ergebnisse.(iii) Im welchem Jahr wäre, bei unverändertem exponentiellen Wachstum, der Energieverbrauchso groß wie die jährliche Energie von 5 Millionen EJ, die von der Sonne auf dieErde trifft?Lösung: Es gilt lny = ln(5000000) = 15.42 <strong>und</strong> damitmit der LösungIm Jahreẑ(x) = 2.63 + 0.03739x = 15.42x = (15.42 − 2.63)/0.03739 = 342.1900 + 342 = 2242würden wir also so viel Energie verbrauchen, wie wir von der Sonne bekommen.Bemerkung zum H<strong>in</strong>tergr<strong>und</strong>. Dieses Ergebnis kann offensichtlich unmöglich e<strong>in</strong>treffen;aufgr<strong>und</strong> der Erderwärmung s<strong>in</strong>d auch viel niedrigere Verbräuche <strong>und</strong>enkbar. Darausergeben sich offensichtlich harte Grenzen des Wachstums. Zahlenmaterial <strong>und</strong>Überlegungen u.a. dieser Art waren Basis für den berühmten Bericht “Grenzen desWachstums” des Club of Rome (1972), der ökologisches Bewusstse<strong>in</strong> erstmals e<strong>in</strong>erweiten Öffentlichkeit nahebrachte. Der tatsächliche Energieverbrauch verließ übrigensab etwa 1973 (Ölkrise? Club of-Rome Bericht??) den Pfad des exponentiellen Wachstums.www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 4


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikAufgabe 3: F<strong>und</strong>amentaldiagramm des VerkehrsflussesBemerkung im Voraus: <strong>in</strong> der Aufgabe wird die l<strong>in</strong>eare <strong>und</strong> nichtl<strong>in</strong>eare Regression geübt. Dader Inhalt nicht e<strong>in</strong>fach aber wichtig ist, wird e<strong>in</strong>e ausführliche Musterlösung bereitgestellt.E<strong>in</strong>es der wichtigsten <strong>und</strong> e<strong>in</strong>fachsten Hilfsmittel <strong>zur</strong> Analyse von Verkehrs-Strömen <strong>und</strong><strong>zur</strong> Stauprognose ist das sogenannte F<strong>und</strong>amentaldiagramm, bei dem der VerkehrsflussQ (Fahrzeuge pro Zeite<strong>in</strong>heit, die e<strong>in</strong>e feste Stelle überqueren) <strong>in</strong> Abhängigkeit der Verkehrsdichteρ (Fahrzeuge pro Strecke) aufgetragen ist. Üblicherweise werden die Daten für jedeSpur getrennt mittels Doppel-Induktionsschleifen gewonnen <strong>und</strong> (z.B.) pro M<strong>in</strong>ute e<strong>in</strong> Wertfür die Dichte <strong>und</strong> den Fluss ausgegeben.Induktionschleifen − DetektorenKfz iv_i... messen (i) Zeiten t_i, (ii) Geschw<strong>in</strong>digkeiten v_i, (iii) SpurAls e<strong>in</strong>faches Beispiel betrachtenwir nun für freien <strong>und</strong> gestauten Verkehr je 6 Datenpunkte(enspricht 6 M<strong>in</strong>uten). Der Fluss ist <strong>in</strong> der E<strong>in</strong>heit Fz. pro St<strong>und</strong>e angegeben:Dichte (frei) 5 9 17 13 6 22Fluss (frei) 600 1140 1800 1440 660 2040Dichte (gestaut) 28 55 65 45 32 35Fluss (gestaut) 1320 480 720 1200 1560 1120(a) E<strong>in</strong> Messschleifen-Detektor e<strong>in</strong>er gegebenen Spur misst <strong>in</strong> jeder M<strong>in</strong>ute die Zahl der überihn gefahrenen Fahrzeuge sowie die Geschw<strong>in</strong>digkeiten v i der Fahrzeuge. Wie würde mandaraus die Werte <strong>in</strong> der Tabelle bestimmen, d.h. den Fluss Q <strong>und</strong> e<strong>in</strong>e bestmöglicheSchätzung für die Dichte ρ?(b) Berechnen Sie, jeweils getrennt für die sechs Punkte freien <strong>und</strong> gestauten Verkehrs, diel<strong>in</strong>earen RegressionenˆQ 1 (ρ) = a + bρ.(c) Bestimmen Sie für den freien Verkehr die mittlere “Wunschgeschw<strong>in</strong>digkeit” V 0 durchVergleich der Steigung der Regression ˆQ 1 (ρ) mit der BeziehungQ frei (ρ) = V 0 ρ.Anders aufgedrückt: Die Wunschgeschw<strong>in</strong>digkeit ist die Geschw<strong>in</strong>digkeit, die man ohneBee<strong>in</strong>flussung durch andere fahren möchte, d.h. die Steigung des F<strong>und</strong>amentaldiagrammsan der Stelle verschw<strong>in</strong>dener Dichte:V 0 = ∂Q∂ρ .www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 5


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik(d) Im Kolonnenverkehr wird zum Vorderfahrzeug je nach Fahrer e<strong>in</strong> gewisser zeitlicherAbstand T gehalten (Fahrschule: “Abstand=halber Tacho”). Bestimmen Sie aus der l<strong>in</strong>earenRegression des gestauten Verkehrs die mittlere Folgezeit T (Nettozeitlücke) derFahrer sowie die maximale Verkehrsdichte ρ max bei stehendem Verkehr durch den Vergleichmit der “Stauformel”Q stau (ρ) = 1 (1 − ρ ).T ρ maxWie verhält sich die Empfehlung der Fahrschule dazu?(e) Berechnen Sie Korrelationen <strong>und</strong> Bestimmungsmaß für die l<strong>in</strong>earen Regressionen desfreien <strong>und</strong> gestauten Verkehrs.(f) Warum ist die l<strong>in</strong>eare Regression für den freien Verkehr etwas fragwürdig? BetrachtenSie dazu den Wert der Regression an der Stelle ρ = 0. Führen Sie e<strong>in</strong>e nichtl<strong>in</strong>eareRegression durch mit der RegressionsfunktionˆQ 2 (ρ) = bρ + cρ 2 .Welchen Wert für die freie Wunschgeschw<strong>in</strong>digkeit V 0 erhält man mit diesem verbessertenAnsatz?(g) Man kann auch bei der l<strong>in</strong>earen Regression berücksichtigen, dass aus äußeren Gründender Punkt (0, 0) fest gegeben ist, <strong>in</strong>dem man den konstanten Term der Regressionsfunktionweglässt:ˆQ 3 (ρ) = bρZeichnen Sie auch für diesen Fall die Regressionsfunktion <strong>und</strong> bestimmen Sie die Geschw<strong>in</strong>digkeitim freien Verkehr.Lösungsvorschlag zu Aufgabe 3: F<strong>und</strong>amentaldiagramm des VerkehrsflussesAufgabe (a): Bestimmung von Q <strong>und</strong> ρ(a) Bestimmung des Flusses Q durch Zählung der Fahrzeuge, die z.B. <strong>in</strong> e<strong>in</strong>er M<strong>in</strong>ute überden Detektor fahren:Anzahl der FahrzeugeQ =ZeitDer Fluß wird aber meistens <strong>in</strong> der E<strong>in</strong>heit Fz. pro St<strong>und</strong>e angegeben (damit dieE<strong>in</strong>heit der Geschw<strong>in</strong>digkeit km/h ist, s.u.). Man m¨ßte also den M<strong>in</strong>utenwert mitdem Faktor 60 multiplizieren.(b) Bestimmung der bestmöglichen Schätzung der Dichte ρ: Die Dichte ist def<strong>in</strong>iert durchρ =Anzahl der Fahrzeuge.Laengewww.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 6


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikDer Fluss, die Geschw<strong>in</strong>digkeit V <strong>und</strong> die Dichte hängen über die GleichungQ = V ρzusammen, wie man aus den E<strong>in</strong>heiten sofort erkennt:#FZh= km h · #FZkm .Damit ergibt sich die Dichte aus der Division von Q <strong>und</strong> V , wobei man die Geschw<strong>in</strong>digkeitals Mittelwert der n gemessenen Geschw<strong>in</strong>digkeiten v i (z.B.) <strong>in</strong>nerhalb e<strong>in</strong>erM<strong>in</strong>ute nimmt. Z. B. erhält man V aus dem arithmetischen MittelV = 1 n∑v i .nBei dieser Mittlung werden allerd<strong>in</strong>gs die schnellen Fahrzeuge systematisch zu starkgewichtet, weil im Mittel mehr schnelle Fahrzeuge über den Detektor fahren. Denkbarwäre daher auch das harmonische Mittel V H , das die langsamen Geschw<strong>in</strong>digkeitenstärker gewichtet. Allgeme<strong>in</strong> gilt V H < V . 1(c) Die Darstellung “Fluss über Dichte” nennt man F<strong>und</strong>amentaldiagramm. Aus der Auftragungder 12 Datenpunkte bekommt man das folgende Diagramm.i22002000F<strong>und</strong>amentaldiagramm Q(ρ) mit 12 DatenpaarenFreier VerkehrGestauter VerkehrVerkehrsfluss Q (Fz./h)180016001400120010008006004000 10 20 30 40 50 60 70Verkehrsdichte ρ (Fz./km)Aufgabe (b): L<strong>in</strong>eare RegressionRegression mit l<strong>in</strong>earer Funktion:ˆQ(ρ) = a + bρ (1)b hat die Bedeutung e<strong>in</strong>er Geschw<strong>in</strong>digkeit, a ist der Betrag bei verschw<strong>in</strong>dener Dichte ρ =0. Die Normalengleichungen (quadratische Abweichungen m<strong>in</strong>imieren . . .) führen zu derallgeme<strong>in</strong>en Lösunga = Q − bρ, b = s ρQs 2 . (2)ρ1 Am besten wäre aber e<strong>in</strong> Mittlung über e<strong>in</strong>e feste Anzahl von Fahrzeugen N statt der Anzahl n pro M<strong>in</strong>ute,aber die empirischen Detektordaten werden <strong>in</strong> der Literatur meistens als Zeitmittel gemessen/angegeben.www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 7


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikDazu müssen die Mittelwerte Q, ρ, die Varianz s 2 ρ <strong>und</strong> die Kovarianz s ρQ berechnet werden.Weil der Mensch faul ist, programmiert er e<strong>in</strong>en Computer, der für e<strong>in</strong>en alle Werte aus denDaten (ρ i , Q i ) berechnet:Größe frei gestautQ 1280.0 1066.7ρ 12.0 43.3s 2 ρ 36.67 173.6s 2 Q290000 132089s ρQ 3210 -4008.9Damit ergeben sich die l<strong>in</strong>earen Regressionen (ger<strong>und</strong>et auf 3 Stellen)frei :ˆQ (ρ) = 230 + 87.5 ρgestaut : ˆQ(ρ) = 2070 − 23.1 ρ.2000Data (x,y)l<strong>in</strong>earer FitFreier Verkehr16001400Gestauter VerkehrData (x,y)l<strong>in</strong>earer FitVerkehrsfluss Q (Fz./h)15001000500Verkehrsfluss Q (Fz./h)1200100080060040020000 5 10 15 20 25Verkehrsdichte ρ (Fz./km)00 20 40 60 80 100Verkehrsdichte ρ (Fz./km)Aufgabe (c): Wunschgeschw<strong>in</strong>digkeit V 0 im freien VerkehrDie Wunschgeschw<strong>in</strong>digkeit im freien Verkehr ist die Geschw<strong>in</strong>digkeit, die man ohne Bee<strong>in</strong>flussungdurch andere Fahrzeuge fahren möchte. Sie ist durch den Anstieg des Flusses beiverschw<strong>in</strong>dener Dichte (d.h. ohne Bee<strong>in</strong>flussung durch andere) im freien Verkehr gegeben:Q frei (ρ) = V 0 ρ bzw. V 0 = dQ freidρ | 0. (3)Aus unserem Regressionsansatz erkennt man, dass der Parameter b im freien Verkehr derWunschgeschw<strong>in</strong>digkeit V 0 entspricht. Man bekommt aus der Regressionb ≡ V 0 ≈ 87.5 km h . (4)Die E<strong>in</strong>heit ergibt sich aus den E<strong>in</strong>heiten der vorliegenden Daten. Für e<strong>in</strong>en Detektor auf derrechten Spur sche<strong>in</strong>t die Größenordnung vernünftig, weil die LKW e<strong>in</strong>e deutlich niedrigere“Wunschgeschw<strong>in</strong>digkeit” haben. Für e<strong>in</strong>e l<strong>in</strong>ke Spur ist der erhaltende Wert für V 0 aber zuniedrig, da man m<strong>in</strong>destens e<strong>in</strong>e Geschw<strong>in</strong>digkeit von V 0 100 km/h erwartet. In Aufgabe6 verbessern wir den Regressionsansatz <strong>und</strong> erhalten e<strong>in</strong>e größere Steigung im Ursprung, sodass man beim Datensatz von e<strong>in</strong>em Detekor auf der l<strong>in</strong>ken Spur ausgehen kann.www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 8


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikZusatz: Man kann noch mehr aus der Regression schliessen. Die Steigung des gestauten Verkehrsergibt nämlich die Geschw<strong>in</strong>digkeit der Stop-and-Go-Wellen, hier V SG ≈ −23.1 km/h.Das M<strong>in</strong>uszeichen bedeutet, dass die Welle entgegen der Fahrtrichtung, also stromaufwärts,läuft.Aufgabe (d): Abstand im gestauten VerkehrBestimmen wir erstmal durch Vergleich mit der Stauformel (Jam-L<strong>in</strong>e)Q Stau (ρ) = 1 (1 − ρ )T ρ max(5)die Werte der mittleren Netto-Folgezeit bzw. Zeitlücke T <strong>und</strong> der maximalen Verkehrsdichteρ max :a = 1 T = 2070 1 ⇒ T = 1h 2070 h = 3600 s ≈ 1.74 s. (6)2070Im gestauten Verkehr liegt damit die mittlere Folgezeit bei ungefähr 1.7 s. Damit folgt fürρ maxb = − 1 = −23.1 km ⇒ ρ max = 2070 1 T ρ max hh · 1 km FZ≈ 89.623.1 h km . (7)Jetzt bleibt noch der Vergleich mit der “Faustregel” Abstand (<strong>in</strong> m) = halber Tacho. WelcheZeit entspricht der Aussage “Sicherheitsabstand m<strong>in</strong>destens gleich halber Tacho”? Wir benutzens = v · t, müssen aber die physikalischen Größen von s <strong>und</strong> v berücksichtigen, dennder Sicherheitsabstand gilt <strong>in</strong> m <strong>und</strong> der Tacho zeigt km/h. Am besten wir schreiben diephysikalischen Größen getrennt nach Skalar <strong>und</strong> E<strong>in</strong>heit als s = s ∗ · [s]. Mit [s] = m <strong>und</strong>[v] = km/h sowie s ∗ = v ∗ /2 ergibt sicht sicher = s v=s ∗ · mv ∗ · km/h= m · h2 · km= m · 3600 · s2 · 1000 · m= 3.6 · s2= 1.8 s.Diese 1.8 s gelten unabhängig von der gefahrenden Geschw<strong>in</strong>digkeit! Die Fahrschule könnteauch sagen: “Fahren sie mit e<strong>in</strong>em zeitlichen Abstand von 1.8 s, dann s<strong>in</strong>d die trotz Reaktionszeitvon ca. 1 s relativ auf der sicheren Seite.”Tatsächlich: die Faustregel ergibt e<strong>in</strong>e Zeitlücke <strong>in</strong> vernünftiger Größenordnung, denn dieFahrzeuge befolgen im Mittel dieses T (bzw. liegen knapp darunter).www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 9


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikAufgabe (e): Korrelation <strong>und</strong> BestimmtheitsmaßDer Korrelationskoeffizient (nach Pearson) berechnet sich nach der Formel r xy = s xy /s x s y ,so dass man die folgenden Ergebnisse für die Größen ρ <strong>und</strong> Q erhält:frei : r ρQ = s ρQs ρ s Q=3210 √36.67√290000≈ 0.98,gestaut : r ρQ =−4008.9√173.6√132089≈ −0.84.Der negative Wert für den gestauten Verkehr spiegelt das Verhalten abnehmendes Flussesmit zunehmender Dichte wider. Die Daten für den freien Verkehr zeigen e<strong>in</strong>en höheren Wertfür e<strong>in</strong>en l<strong>in</strong>earen Zusammenhang als der gestaute Verkehr.Das Bestimmtheitsmaß erhält man für l<strong>in</strong>eare Zusammenhänge durch Quadrieren von r xy :frei : B ρ Q = r 2 ρQ ≈ 0.96gestaut : B ρ Q = r 2 ρQ ≈ 0.70.Aufgabe (f): Nichtl<strong>in</strong>eare Regression für freien VerkehrWie <strong>in</strong> der l<strong>in</strong>earen Regression gesehen, bekommt man für den freien Verkehr bei ρ = 0 e<strong>in</strong>enFluss Q ≠ 0, was nicht vernünftig ist: bei ke<strong>in</strong>em Fahrzeug auf der Strecke, kann auch ke<strong>in</strong>esüber den Detektor fahren. Wir verbessern die Regression durch den AnsatzˆQ(ρ) = bρ + c ρ 2 . (8)Die Bedeutung des Parameters b ergibt sich aus se<strong>in</strong>er E<strong>in</strong>heit: [b] = Strecke/Zeit ist dieWunschgeschw<strong>in</strong>digkeit im freien Verkehr.Hier müssen wir e<strong>in</strong>e direkte Regression durch Lösung des Gleichungssystems durchführen.Die Gleichungen folgen aus der Bed<strong>in</strong>gung, dass die Fehler-Quadratsumme m<strong>in</strong>imal wird:n∑F(b, c) = e 2 i = ∑ (Q i − ˆQ(ρ i )) 2i i= ∑ i(Q i − bρ i − c ρ 2 i ) 2 .M<strong>in</strong>imiert man die Summe der Quadrate der Abweichungen nach den Parametern b <strong>und</strong> c,so erhält man e<strong>in</strong> Gleichungssystem für die zwei Größen.I :<strong>II</strong> :∂F∂bdFdc!= 0 = ∑ i!= 0 = ∑ i∂F∂b∂F∂c(Qi − bρ i − cρ 2 ) 2i ,(Qi − bρ i − cρ 2 ) 2i .Daraus ergeben sich die Gleichungen∑I :i Q iρ i= b ∑ iρ 2 i + c ∑ iρ 3 i<strong>II</strong> :∑i Q iρ 2 i= b ∑ iρ 3 i + c ∑ iρ 4 i .Wir benutzen wieder e<strong>in</strong>en Computer, um die Summen über Potenzen von ρ zu berechnen:www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 10


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik∑∑ i ρ2 i = 1084∑ i ρ3 i = 18828∑ i ρ4 i = 354820∑ i Q iρ i = 111420i Q iρ 2 i = 1882020Man bekommt mit den <strong>in</strong> der Tabelle gegebenen Koeffizieten e<strong>in</strong> l<strong>in</strong>eares Gleichungssystem(2 Gleichungen) für die Parameter b <strong>und</strong> c. Als Ergebnis ergibt sich die RegressionsfunktionˆQ (ρ) = 136ρ − 1.92 ρ 2 . (9)Mit diesem Ansatz bekommt man also e<strong>in</strong>e höhere Wunschgeschw<strong>in</strong>digkeit von V 0 ≈ 136 km/h. Dies hat man durch die Fixierung des Ursprungs (0, 0) erreicht. Weiterh<strong>in</strong> erkennt man anhandder Ableitung, dass die Steigung mit zunehmender Dichte abnimmt: die Durchschnittsgeschw<strong>in</strong>digkeitnimmt bei zunehmender Verkehrsdichte ab.Aufgabe (g): L<strong>in</strong>eare Regression ohne KonstanteE<strong>in</strong> weiterer Ansatz ist natürlich auch möglich: ˆQ(ρ) = bρ. Es ergibt sich lediglich e<strong>in</strong>eGleichung für den Parameter b:dFdb!=0 −→ ∑ iQ i ρ i = b ∑ iρ 2 i . (10)Damit ergibt sich der – schon ganz vernünftige – Wert b = 111420/1084 ≈ 102.8 km/h fürdie Wunschgeschw<strong>in</strong>digkeit.Achtung, der Ansatz mit e<strong>in</strong>er Ursprungsgeraden ist qualitativ etwas anderes als die l<strong>in</strong>eareRegression mit den zwei Parametern a <strong>und</strong> b. Das sieht man an der obigen Formel fürb. Die Gleichung ist anders als im System mit 2 Gleichungen für a, b.Merke: Das Ergebnis hängt vom Ansatz ab; mit e<strong>in</strong>em ungeeigneten Ansatz (hier ˆQ(ρ) =a + bρ) erhält man falsche Aussagen. Besser ist hier ˆQ(ρ) = bρ, am besten die nichtl<strong>in</strong>eareRegression.Freier Verkehr2000Data (x,y)quadratischer Fitl<strong>in</strong>earer FitVerkehrsfluss Q (Fz./h)1500100050000 5 10 15 20 25Verkehrsdichte ρ (Fz./km)www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 11


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikZusätzliche AnmerkungDie Wirklichkeit ist etwas komplizierter: zunächst muss man mehr Datenpunkte betrachtenum Aussagen treffen zu können. In dem nächsten Diagramm s<strong>in</strong>d echte Detektordatenaufgezeichnet. Man sieht sofort e<strong>in</strong>en Unterschied für Dichten im gestauten Verkehr. DieQ-Werte schwanken sehr stark <strong>und</strong> ansche<strong>in</strong>end völlg zufällig. Dieses Verhalten – <strong>in</strong> derwissenschaftlichen Diskussion als wide and erratic scatter<strong>in</strong>g bekannt – ist erst vor e<strong>in</strong>igenMonaten quantitativ erklärt worden. In der Arbeit wurde e<strong>in</strong>e Korrelationsanalyse durchgeführt<strong>und</strong> e<strong>in</strong> hoher Korrelationskoeffizient (nahe 1) für e<strong>in</strong>en verbesserten Ansatz derFit-Funtion bzw. Jam-L<strong>in</strong>e gef<strong>und</strong>en. Weiterh<strong>in</strong> wurde auch noch gezeigt, dass die Streuunge<strong>in</strong>zelner Datenpunkte – gemessen durch die Varianz – korreliert ist, d.h. die Varianz geradenicht wie N −1 abnimmt (wie es für unabhängige Zufallsvariablen gilt), sondern langsamermit ca. N −0.7 . Das Paper 2 kann man auf dem prepr<strong>in</strong>t-Server xxx.uni-augsburg.de im Katalogcond-mat unter “abstract” cond-mat/0212295 abrufen .30002500Fluss Q (Fz/h/Spur)20001500100050000 20 40 60 80 100Dichte ρ(Fz/km)Aufgabe 4: Bremsweg <strong>in</strong> Abhängigkeit der Geschw<strong>in</strong>digkeitEs wurde der Bremsweg s <strong>in</strong> Abhängigkeit von der gefahrenden Geschw<strong>in</strong>digkeit v untersucht.Sechs Messwerte s<strong>in</strong>d gegeben:Geschw<strong>in</strong>digkeit v <strong>in</strong> m/s 5 14 22 28 33 40Bremsweg s <strong>in</strong> m 15 49 146 254 340 4602 Experimental time gap distributions and erratic scatter<strong>in</strong>g <strong>in</strong> heterogeneous flows von K. Nish<strong>in</strong>ari, M.Treiber <strong>und</strong> D. Helb<strong>in</strong>g.www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 12


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik6050Bremsweg (m)4030201000 2 4 6 8 10 12 14 16Geschw<strong>in</strong>digkeit (m/s)(a) Zunächst brauchen wir e<strong>in</strong> “Modell” für e<strong>in</strong>e Regressionsfunktion. Leiten Sie den Bremswegs <strong>in</strong> Abhängigkeit von der Geschw<strong>in</strong>digkeit v her, <strong>in</strong>dem Sie von e<strong>in</strong>er konstantenBremsverzögerung a ausgehen.(b) Führen Sie nun e<strong>in</strong>e Regression mit dem entsprechenden Ansatz aus (a) durch,ŝ(v) = v22 a , (11)<strong>und</strong> bestimmen die die Größe a. Welchen Wert kann man ungefähr erwarten? Warumist die Regression “quasil<strong>in</strong>ear”?(c) Zusätzlich zum quadratischen Term betrachten wir nun den Ansatzŝ(v) = t reak v + v22 a . (12)Welche E<strong>in</strong>heit hat der Parameter t reak ? Wir <strong>in</strong>terpretieren ihn als Reaktionszeit. BestimmenSie t reak <strong>und</strong> a mittels Regression.Lösungsvorschlag zu Aufgabe 4: Bremsweg <strong>in</strong> Abhängigkeit der Geschw<strong>in</strong>digkeitWir sollten uns kurz den Zusammenhang von Bremsweg <strong>und</strong> Geschw<strong>in</strong>digkeit vergegenwärtigen.Für den e<strong>in</strong>fachsten Fall e<strong>in</strong>er konstanten Bremsverzögerung a ergeben sich die folgendenGleichungen:dv= ˙v = a = constdtdsdt = ṡ = v = a ts = 1 2 a t2 .Aus den beiden letzten Gleichungen kann man t elim<strong>in</strong>ieren <strong>und</strong> wir bekommen den Bremswegals Funktion der Geschw<strong>in</strong>digkeit:s(v) = v22 a . (13)Der Bremsweg hängt also quadratisch von der Geschw<strong>in</strong>digkeit v ab!www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 13


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikQuadratischer Ansatz60DatenFit x 2 /(2a)50Bremsweg (m)4030201000 2 4 6 8 10 12 14 16Geschw<strong>in</strong>digkeit (m/s)F<strong>in</strong>al set of parameters Asymptotic Standard Error======================= ==========================a = 1.67162 +/- 0.03819 (2.284%)Quadratischer Ansatz mit t reak60DatenFit tr*x+x 2 /(2a)50Bremsweg (m)4030201000 2 4 6 8 10 12 14 16Geschw<strong>in</strong>digkeit (m/s)f<strong>in</strong>al set of parametersAsymptotic Standard Errorwww.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 14


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik======================= ==========================a = 1.83677 +/- 0.2036 (11.08%)t_r = 0.920338 +/- 1.004 (109.1%)Aufgabe 5: Bremsweg: Berechnung des BestimmtheitsmaßesAus Fahrtests s<strong>in</strong>d 4 Messwerte gegeben:Geschw<strong>in</strong>digkeit v <strong>in</strong> m/s 3 6 10 15Bremsweg s <strong>in</strong> m 6.2 12.5 29.4 56.66050Bremsweg (m)4030201000 2 4 6 8 10 12 14 16Geschw<strong>in</strong>digkeit (m/s)(a) Die Regression mit der Modell-Funktionŝ(v) = v22a(14)hat für die Beschleunigung den Wert a = 1.92 m/s 2 ergeben. Bestimmen Sie das BestimmtheitsmaßB, <strong>in</strong>dem Sie zunächst das Unbestimmtheitsmaß U berechnen.(b) E<strong>in</strong> Regressionsansatz, der auch die Reaktionszeit t r beim Bremsvorgang berücksichtigt,ŝ(v) = t r v + v22 a , (15)ergibt die Parameter t r = 1.21 s <strong>und</strong> a = 2.92 m/s 2 . Bestimmen Sie ebenfalls das Bestimmtheitsmaß<strong>und</strong> vergleichen Sie mit Aufgabe (a).(c) Zum Vergleich probieren wir den l<strong>in</strong>earen Ansatzŝ(v) = αv, (16)der den Wert α = 3.34 s ergibt. Wie groß ist das Bestimmtheitsmaß mit diesem, offensichtlichfalschen Ansatz? Darf man <strong>in</strong> diesem Fall auch mit der Formel B = r 2 xyarbeiten?www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 15


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikLösungsvorschlag zu Aufgabe 5: Bremsweg: Berechnung desBestimmtheitsmaßesMit dem (Un-)Bestimmtheitsmaß hat man e<strong>in</strong> Maß, mit dem man die Qualität e<strong>in</strong>er Regressionbewerten kann: “Wie gut beschreibt der Regressionsansatz me<strong>in</strong>e Daten?” Das UnbestimmtheitsmaßU ist def<strong>in</strong>iert alsU = s2 es 2 y=Quadratsumme der nicht-erklärten Abweichungen. (17)Quadratsumme der GesamtabweichungenAn diesem Ausdruck sollte man sich den Fall U > 1 klarmachen: Die Streuung zwischen“Modell” <strong>und</strong> Daten s<strong>in</strong>d größer als die triviale Annahme e<strong>in</strong>er Konstanten, nämlich ȳ.Damit ist auch klar, dass U = 1 schon denkbar schlecht ist! Ausserdem sieht man sofort,wann U = 0 gilt: der Nenner verschw<strong>in</strong>det, wenn Regressionsfunktion <strong>und</strong> empirische Datenan jeden Punkt i identisch s<strong>in</strong>d. Die beiden Quadratsummen s<strong>in</strong>d def<strong>in</strong>iert als, wobei manabkürzend schreibt ŷ i ≡ ŷ(x i ):s 2 e = 1 ∑(y i − ŷ i ) 2 ,nis 2 y = 1 ∑(y i − ȳ i ) 2 .niBeachte, dass s 2 y die gewöhnliche Varianz darstellt, die sich aus den Daten ergibt. Bei dieserAufgabe ist die abhängige Variable der Bremsweg, der hier mit s bezeichnet ist. Für dieVarianz brauchen wir ihren Mittelwert,¯s = 1 ∑s i = 26.175 m ≈ 26.2 m, (18)4<strong>und</strong> damit ergibt sichs 2 y = 1 4∑ii(s i − ¯s) 2 = 1522.14≈ 380.5 m 2 . (19)Da wir hier nichtl<strong>in</strong>eare Funktionen vorliegen haben, müssen wir das Bestimmtheitsmaß Büber das Unbestimmtheitsmaß berechnen. Im Fall der l<strong>in</strong>earen Regression gibt es auch e<strong>in</strong>eBeziehung über die Kovarianz.Teil a)Für die Regressionsfunktion ŝ(v) = v22a muß man die Werte ŝ i ≡ ŝ(v i ) berechnen, um darauss 2 e bestimmen zu können:s 2 e = 1 4∑Damit ergibt sich das Unbestimmtheitsmaß<strong>und</strong> damit das Bestimmtheitsmaßi(s i − ŝ i ) 2 ≈ 39.894≈ 9.973. (20)U ≈ 9.973 ≈ 0.026 (21)380.5B = 1 − U ≈ 0.974. (22)Damit ist 97.4% der Streuung durch das “Modell” (des Regressionsansatz) erklärt.www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 16


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistikTeil b)Mit der Fit-Funktion ŝ(v) = t r v + v22 aDamit ergibt sichs 2 e = 1 4∑ierhält man analog zum obigen Vorgehen(s i − ŝ i ) 2 ≈ 1.9504≈ 0.488. (23)U ≈ 0.488 ≈ 0.00128 <strong>und</strong> B = 1 − U ≈ 0.999. (24)380.5Mit dem verbesserten Ansatz lassen sich immerh<strong>in</strong> 99.9% der Streuungen erklären.Teil c)Mit dem offensichtlich falschen Ansatz ŝ(v) = αv erhält mans 2 e ≈ 129.704≈ 32.43. (25)<strong>und</strong> damitU ≈ 0.0852 <strong>und</strong> B = 1 − U ≈ 0.915. (26)Mit B ≈ 92% ist dieser Ansatz erwartungsgemäß am wenigsten <strong>in</strong> der Lage, die Daten zubeschreiben.Aufgabe 6: Benötigkte Leistung bei KonstantfahrtDie maximale Geschw<strong>in</strong>digkeit hängt neben dem c w -Wert, der Stirnfläche <strong>und</strong> der Dichte derLuft vor allem von der Leistung des Motors ab. Wenn man die Leistung P des Motors alsunabhängige Variable auffasst, ergibt sich daraus die maximale Geschw<strong>in</strong>digkeit. Es liegen 5typische Kennzahlen bekannter Autos vor:Leistung P (PS) 25 34 90 180 420max. Geschw<strong>in</strong>digkeit v max 115 120 180 230 300300maximale Geschw<strong>in</strong>digkeit (km/h)2502001501005000 50 100 150 200 250 300 350 400 450Leistung (PS)www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 17


Technische Universität Dresden, Professur für Verkehrsökonometrie <strong>und</strong> -statistik(a) Theoretisch erwartet man den Zusammenhangv max ∼ P 1/3 (27)zwischen P <strong>und</strong> v max . Bestimmen Sie die Koeffizienten α <strong>und</strong> β aus dem nichtl<strong>in</strong>earenRegressionsansatzˆv max (P) = α · P β . (28)Stimmt das Ergebnis ungefähr mit der theoretischen Erwartung übere<strong>in</strong>?(b) Wie groß ist demnach die maximale Geschw<strong>in</strong>digkeit für e<strong>in</strong>en PKW mit 75 (bzw. 175)PS?Lösungsvorschlag zu Aufgabe 6: Benötigkte Leistung bei Konstantfahrtmaximale Geschw<strong>in</strong>digkeit (km/h)320300280260240220200180160140120100DatenFit0 50 100 150 200 250 300 350 400 450Leistung (PS)F<strong>in</strong>al set of parameters Asymptotic Standard Error======================= ==========================a = 37.1327 +/- 2.388 (6.431%)b = 0.347403 +/- 0.01214 (3.493%)www.mtreiber.de/statistikTra<strong>in</strong><strong>in</strong>gsaufg Thema: Nichtl<strong>in</strong>. E<strong>in</strong>fachregression, Seite 18

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!