10.07.2015 Views

Laboration - Matematikcentrum

Laboration - Matematikcentrum

Laboration - Matematikcentrum

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Matematikcentrum</strong> 1(4)Matematisk StatistikLunds UniversitetMASB11VT09<strong>Laboration</strong>Regressionsanalys2009-04-24, 08.15-12.00


Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner som finns i SPSSvad det gäller korrelations- och regressionsanalys. När ni arbetat er igenomlaborationshandledningen fortsätter ni med projektet eller de resterande momenten frånlaborationstillfälle 3.2Introduktion - Regressionsanalys i SPSSGenom hela introduktionen ställs frågor i anslutning till analyserna. Kortfattade svar finns islutet på introduktionen.Vi skall börja med att göra en regressionsanalys på följande datamaterial:Datamaterial: För 6 torskar har vi värden på variablerna Längd (cm) och Ålder (år).Längd (cm) Ålder (år)15 130 235 350 455 560 6Kan vi påvisa något samband (linjärt) mellan längd och ålder?1. Inläsning av data. Börja med att mata in data till SPSS. Lägg in värdena i två kolumner: Längdoch Ålder. Datamaterialet skall alltså innehålla 2 kolumner med 6 värden i varje kolumn.a) Beskrivning av data. Börja nu med en grafisk beskrivning av sambandet genom att användaGraphs>Scatter>Simple>Define. Lägg in Längd på Y Axis och Ålder på X Axis.b) Korrelationer. Vi börjar med att beskriva sambandet mellan variablerna med hjälp avkorrelationskoefficienten. Beräkna korrelationskoefficienten (Pearson) som du hittar underAnalyze>Correlate>Bivariate. Tyder resultaten på att det finns något samband mellan Längdoch Ålder?c) Enkel linjär regression. Vi skall nu undersöka hur sambandet mellan variablerna ser ut genomatt anpassa en rät linje till data. Ge Analyze>Regression>Linear och lägg in Längd somDependent och Ålder som Independent. Kryssa också i att ni vill ha konfidensintervall för deskattade parametrarna under Statistics. Gör analysen. Identifiera följande mått i utskriften: r –korrelationskoefficienten, r 2 – förklaringsgraden, s – residualspridningen, de skattadekoefficienterna med standardfel, t-test och konfidensintervall.d) Prognoser och konfidensintervall. Om man vill använda sin regressionsmodell för att göraprognoser så kan detta enkelt göras som en del av analysen. Gå då in underAnalyze>Regression>Linear följt av Save. Vill man ha prognoser markerar man härPredicted Values – Unstandardized. Gör detta. Markera även Mean och Individual underPrediction Intervals. Passa även på att spara residualerna (Unstandardized) (de behövs i nästadeluppgift). Gör analysen. Titta sedan i datamaterialet. Det bör finnas sex nya kolumner.


3pre_1res_1lmci_1umci_1lici_1uici_1- Prognoser- Residualer- Undre gräns för ett KI för medelvärdet på Y givet olika X- Övre gräns för ett KI för medelvärdet på Y givet olika X- Undre gräns för ett PI * för ett enskilt Y givet olika värden på X- Övre gräns för ett PI * för ett enskilt Y givet olika värden på X* PrognosIntervallAlla värden och KI är räknade för de värden på X som finns i datamaterialet. Vill man haprognoser/intervall för ett annat värde på X så lägger man till detta värde i X-kolumnen på enensam rad sist i datamaterialet och gör om analysen. Detta värde kommer inte med i analysen(det finns ju inget Y-värde), men man får prognoser/intervall i alla fall. Ta nu bort de sex nyakolumnerna och lägg till värdet 7 på rad 7 i X-kolumnen (Ålder). Gör sedan om analysen. Vadblir prognosen för längden för en sju år gammal torsk? Vad blir prognosintervallet?e) Kontroll av förutsättningar. Vi skall nu kontrollera två av de antagande som finns i analysen.För det första antagandet om normalfördelning och för det andra antagandet om lika varianser.Undersök nu om residualerna är normalfördelade genom att göra en Q-Q-plot. Ni kan också göraett test (Analyze>Nonparametric Tests>1-Sample K-S), ange residualerna på Test VariableList. Tyder det på att data avviker från en normalfördelning?Antagandet om lika varianser (konstant spridning kring linjen) kan vi undersöka genom att plottaresidualerna mot antingen Ålder eller de skattade värdena (pre_1). (Graphs>Scatter). Gör båda.Datamaterial: Bradfordmetoden. I laborationen ''Proteinbestämning enligt Bradford-metoden''i kursen cellbiologi undersöktes absorbansen hos prov med olika spädningar av Bovint SerumAlbumin (BSA)-standard. Prov med 0-10 μg protein spädes till 100 μl med vatten och två proverförberedes per koncentration.Data för en laborationsgrupp finns i filen LABBDATA.SAV som du hittar på kursens hemsidawww.maths.lth.se/matstat/kurser/masb11/material.Modell: Enligt Lambert-Beers lag gäller att absorbansen (A) kan beskrivas som en linjärfunktion av koncentrationen (c): A=k·c där konstanten k beror på ämnets moläraabsorptionskoefficient vid en viss våglängd samt kyvettens längd. Vid mätningar får mannaturligtvis räkna med en viss slumpmässig variation, en rimlig modell är att absorbansen vidmätning nr i, A i , beskrivs linjärt av koncentrationen c i plus ett slumpmässigt fel:A i = β 0 + β 1 ·c i + e idär e i är oberoende och normalfördelad slumpfel med väntevärde 0 och standardavvikelse σ.Här motsvaras konstanten β 1 av den tidigare k medan β 0 är absorbansen i den lösning somBSA:n är löst.2. a) Undersök på labbdata om den linjära regressionsmodellen ovan är rimlig att anpassa.


4b) Hur mycket ökar absorbansen då man ökar koncentrationen en enhet? Ange ett 95 %konfidensintervall för denna storhet.c) Vad är genomsnittlig absorbans för prov med koncentration 50 (mg/l). Ange ett 95 %konfidensintervall för denna storhet.d) Vi har ett prov med koncentration 50 (mg/l). Ange ett 95 % prediktionsintervall förabsorbansen i just detta prov.e) Huvudsyftet med mätningarna var att erhålla en standardkurva för hur absorbansen påverkasav koncentrationen. Anta att vi på ett prov med okänd koncentration c 0 uppmätte absorbansen0.43. Ange en skattning av c 0 - detta anges inte på något smidigt sätt i SPSS utan måste räknasfram. (Ta fram fler decimaler på skattningen av β 1 genom att dubbelklicka på resultattabellen,högerklicka på skattningen och gå in under Cell properties.)f) Man skulle också vilja ha ett intervall som uppskattar inom vilka gränser c 0 kan ligga – ettsådant intervall kallas kalibreringsintervall. Tyvärr kan man inte få det direkt i SPSS. Däremotkan man få en uppfattning om hur brett intervallet är eftersom kalibreringsintervallet ’’äromvändningen till’’ prediktionsintervallet. Rita ut prediktionsintervallets gränser m.h.a.Graphs>Interactive>Scatterplot. Sätt absorbans på y-axeln och koncentration på x-axeln,markera under fliken Fit att ni vill ha prediction lines (både mean och individual). Gå in ifiguren på absorbansen 0.43 (0.43 på y-axeln) och titta på prediktionsintervallets bredd på x-axeln för detta y-värde. Genom att ’’avläsa’’ (svårt i figuren) motsvarande koncentrationer har nifått det sökta kalibreringsintervallet.Svar:1. b) Ja ! r p = 0,982 => p=0,000 / r s = 1,000 => p p=0,000d) Prognos vid åldern 7 år = 72,33 / PI 58,5-86,2e) NF: Nej ! p=0,990 / Konstant varians: Ej helt lätt att bedöma (få värden)2. b) 0.0008 intervall: 0,00063-0,0011c) KI 0,425 – 0,441d) PI 0,407 – 0,459e) c 0 skattas till 47 mg/lf) Intervallet skattas till 15 - 78Sammanfattning SPSSGraphs>ScatterAnalyze>Nonparametric Tests>1-Sample K-SAnalyze>Correlate>BivariateAnalyze>Regression>LinearSpridningdiagramTest av NfKorrelationerLinjär regression

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!