12.07.2015 Views

Analiza brojčanih podataka, korelacija i regresija TESTIRANJE ...

Analiza brojčanih podataka, korelacija i regresija TESTIRANJE ...

Analiza brojčanih podataka, korelacija i regresija TESTIRANJE ...

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Unos <strong>podataka</strong> o mjerenjimana nezavisnim skupinama• npr. mjerenje dobi; skupine po spolu-broj mogućih skupina: 2varijabla koja sadrživrijednost mjerenjavarijabla koja definirapripadnost skupiniDobSpol......ispitanik1ispitanik2ispitanik3ispitanik435373233MMMZPDDS MOLBIO7Unos <strong>podataka</strong> o mjerenjimana nezavisnim skupinama• npr. mjerenje visine; skupine po razredu (osnovna škola)-broj mogućih skupina: 8varijabla koja sadrživrijednost mjerenjavarijabla koja definirapripadnost skupiniVisinaRazred......ispitanik1ispitanik2ispitanik3ispitanik41101401001762217PDDS MOLBIO8


Mjerenjem su dobiveni sljedeći rezultati (u sekundama):PDDS MOLBIOKontrolna skupina (37 0 C)78968108129111089778Pokusna skupina (15 0 C)8689101211878899917• nezavisne skupine2 varijable:protrombinsko vrijemeskupina1 – kontrolna skupina2 – pokusna skupinaPDDS MOLBIO18


pvrijemeskupina718191::717181826282::9292PDDS MOLBIO9219Opis varijabliprotrombinsko vrijeme:– numerička varijabla, omjerna ljestvicaskupina:– kategorička varijabla, nominalna ljestvica• ispitati mjere sredine i raspršenja za PV usvakoj skupini• ispitati normalnost raspodjele PV u svakojskupiniPDDS MOLBIO20


Opisna statistika i ispitivanje normalnosti - MedCalc:Statistics-> Summary statisticsza kontrolnu skupinu:Variable -> pvrijemeSelect -> skupina=1Options -> Test for normal distributionza pokusnu skupinu:Variable -> pvrijemeSelect -> skupina=2Options -> Test for normal distributionPDDS MOLBIO21PDDS MOLBIO22


PDDS MOLBIO23PDDS MOLBIO24


PDDS MOLBIO25Homogenost varijanci - MedCalc:- preko usporedbe standardnih devijacija:Tests-> Comparison of... -> standard deviations (F-test)PDDS MOLBIO26


Homogenost varijanci - MedCalc:PDDS MOLBIO27Studentov t-test t test - MedCalc:Statistics-> T testsPDDS MOLBIO28


0.05=> ne odbacujemo H 030PDDS MOLBIO29ŠTO AKO NISU ZADOVOLJENI UVJETI ?Mann-WhitneyWhitney-Wilcoxon Wilcoxon test(Mann-Whitney U test)MedCalc:Statistics-> Wilcoxon testsPDDS MOLBIO


PDDS MOLBIO31T-TEST TEST DIFERENCIJA(t-test test za zavisne uzorke)PDDS MOLBIO32


za što se koristi:• testiranje razlike između dvije zavisne skupineispitanika (ponavljana mjerenja na istim ispitanicima)pod kojim uvjetima:• razlike parova vrijednosti mjerene su najmanjeintervalnom skalom• razlike parova vrijednosti imaju normalnu razdiobuPDDS MOLBIO33ttest statistika:d= −( µ A −µB )2sdnima Studentovu (t) razdiobus n-1 stupnjeva sloboded=x A− x Bsrednja razlikas2d=∑i( din − 1− d )2varijanca razlikePDDS MOLBIO34


ZADATAK 2PDDS MOLBIO35Ispitivan je utjecaj alkohola na vrijeme reakcije vozača.Izvršeno je mjerenje vremena reakcije 14 vozača nastandardne zadatke prije i nakon konzumacije određenekoličine alkohola.PDDS MOLBIO36


Mjerenjem su dobiveni slijedeći rezultati:prije nakon1 0.68 0.732 0.64 0.663 0.68 0.664 0.82 0.925 0.58 0.686 0.80 0.877 0.72 0.778 0.65 0.709 0.84 0.8810 0.73 0.7911 0.63 0.6812 0.72 0.6813 0.68 0.7514 0.69 0.78PDDS MOLBIO37• zavisne skupine2 varijable:prijenakonPDDS MOLBIO38


PDDS MOLBIOprije0.680.640.680.820.580.800.720.650.840.730.630.720.680.69nakon0.730.660.660.920.680.870.770.700.880.790.680.680.750.7839Opis varijabliprije, nakon:– numeričke, omjerna ljestvicaza obje varijable:•ispitati mjere sredine i raspršenjakreirati novu varijablu prije-nakon:•ispitati normalnostPDDS MOLBIO40


Opisna statistika i ispitivanje normalnosti - MedCalc:Statistics-> Summary statisticsprije:Variable -> prijeposlije:Variable -> poslijerazlika:Variable-> razlikaOptions -> Test for normal distributionPDDS MOLBIO41PDDS MOLBIO42


PDDS MOLBIO43PDDS MOLBIO44


PDDS MOLBIO45T-test diferencija - MedCalc:Statistics-> T testsPDDS MOLBIO46


azlika < 0 i p < 0.05 => vrijeme reakcije vozača nakonkonzumacije te količine alkohola značajno je dulje negoprije konzumacije te količine alkoholaPDDS MOLBIO47ŠTO AKO NISU ZADOVOLJENI UVJETI ?Wilcoxonov testMedCalc:Statistics-> Wilcoxon testsPDDS MOLBIO48


PDDS MOLBIO49JEDNOSMJERNA ANALIZA VARIJANCE(One-way ANOVA)PDDS MOLBIO50


za što se koristi:• testiranje razlike između tri i više skupinafaktor• kategorička varijabla prema kojoj su definirane skupinejednosmjerna analiza varijance• analiza varijance s jednim faktoromPDDS MOLBIO51• postupak u kojem donosimo dvije procjene varijance zapromatrane grupe (model):– procjenu koja odražava varijabilitet između grupa– procjenu koja odražava varijabilitet unutar grupaOSNOVNA IDEJA:• utvrditi je li varijabilitet između grupa veći od varijabilitetaunutar grupaPDDS MOLBIO52


VARIJABILITET IZMEĐUGRUPA VEĆI JE ODVARIJABILITETA UNUTARGRUPAVARIJABILITET UNUTARGRUPA VEĆI JE ODVARIJABILITETA IZMEĐUGRUPAPDDS MOLBIO53pretpostavke:• varijabla koju testiramo mjerena je najmanjeintervalnom skalom• varijabla koju testiramo ima normalnu razdiobu upromatranim skupinama• varijance mjerenja varijable koju testiramo upromatranim skupinama su slične (homogenostvarijanci)PDDS MOLBIO54


test statistika:MSF =MStretmanpogreškaprocjena koja odražavavarijabilitet IZMEĐU grupaprocjena koja odražavavarijabilitet UNUTAR grupa- F ima F razdiobu s k-1, N-k stupnjeva slobodePDDS MOLBIO55ZADATAK 3PDDS MOLBIO56


Bolesnici s uznapredovalim stadijem raka želuca,bronhija, kolona i dojke tretirani su novim lijekom. Svrhaistraživanja je utvrditi je li preživljenje bolesnikapovezano sa zahvaćenim organom. Vrijeme preživljenja(u mjesecima) dano je u tablici:PDDS MOLBIO57PDDS MOLBIOŽeludac Bronhiji Kolon Dojke11 9 16 358 21 19 459 4 14 407 21 8 3420 16 13 4611 13 23 3533 8 23 5212 8 21 2810 12 20 4219 29 19 4912 12 31 3818 13 28 3220 6 19 4318 15 13 2817 12 1010 8 416 1758


• nezavisne skupine4 skupine , ali 2 varijable:vrijemeorgan1 - želudac2 - bronhiji3 - kolon4 - dojkePDDS MOLBIO59organ1:12:23:34:4vrijeme11:109:1616:1735:28PDDS MOLBIO60


Opisna statistika i ispitivanje normalnosti - MedCalc:Statistics-> Summary statisticsza želudac:Variable -> vrijemeSelect -> organ=1Options -> Test for normal distributionza bronhije:Variable -> vrijemeSelect -> organ=2Options -> Test for normal distributionza kolon:Variable -> vrijemeSelect -> organ=3Options -> Test for normal distributionza dojke:Variable -> vrijemeSelect -> organ=4Options -> Test for normal distributionPDDS MOLBIO61PDDS MOLBIO62


Test homogenosti varijanci - MedCalc:- ver. 4.1 NEMA!!!!Test homogenosti varijanci - SPSS:Test of Homogeneity of VariancesvrijemeLeveneStatistic df1 df2 Sig..410 3 60 .746PDDS MOLBIO63PDDS MOLBIO64


najmanje jedna skupina značajno je različita od neke odPDDS preostalihMOLBIO65KORELACIJAPDDS MOLBIO66


KORELACIJA• veza među obilježjima (varijablama)• obilježja koja “variraju zajedno”KOEFICIJENT KORELACIJE• mjera stupnja povezanostiPEARSONOV KOEFICIJENT KORELACIJE r• mjera stupnja linearne povezanosti dviju kvantitativnihvarijabliPDDS MOLBIO67-1 ≤ r ≤ 1nema povezanostir= 0stohastička povezanost0 < r < 1 -1 < r < 0funkcionalna povezanostr = 1 r = -1PDDS MOLBIO68


x, y ....nizovi vrijednosti varijabli čiju povezanost ocjenjujemoPOSTUPAK ZA OCJENU KORELACIJEa) crtanje korelacionog dijagramab) ocjena postojanja povezanostic) u slučaju da postoji linearna povezanost, računamokoeficijent korelacije rPDDS MOLBIOr=N∑ z zi=1xiN − 1yiz xi , z yi .... standardizirane vrijednosti pojedinačnih vrijednostivarijabli x i y, tj.xi− x yi− yzxi= zyi=ssxy69skraćeni postupak računanja r:r=N 1 N∑ xy i i − ⎛ ⎜ ∑ xN ⎝⎞⎟⎛ ⎜⎝∑ yii= 1 i= 1 ⎠ i=12⎡ NN NN∑ xi− ⎛ ⎞ ⎤⎡2 1⎢ ⎜ ∑ xi⎟ ⎥ yiyi N ⎝ i ⎠ i N⎣⎢⎦⎥ ∑ 2 1⎢ − ⎛ ⎜ ∑= 1 = 1⎝⎣⎢= 1 i=1Ni⎞⎟⎠i⎞⎟⎠2⎤⎥⎦⎥PDDS MOLBIO70


ZNAČAJNOST AJNOST KOEFICIJENTA KORELACIJE• testiramo je li r značajno različit od 0• test statistikat=rN − 21−r2slijedi t razdiobu uz df = N - 2PDDS MOLBIO71ZADATAK 4PDDS MOLBIO72


Izmjerena je visina u centimetrima i vitalni kapacitet pluća (VC) ulitrama 33 studentice prve godine. Dobiveni su sljedeći rezultati:Rbr.1.2.3.4.5.6.7.8.9.10.11.Visina180.6168.0163.0171.0177.0169.4161.0170.0158.0161.0163.0VC4.743.633.403.754.233.202.903.882.402.602.72Rbr.12.13.14.15.16.17.18.19.20.21.22.Visina155.0171.0171.5167.6160.2166.6167.0163.0172.0158.0165.0VC2.203.383.823.262.633.063.522.823.412.813.07Rbr.23.24.25.26.27.28.29.30.31.32.33.Visina174.2167.0162.0172.0161.0155.0162.0174.0161.0166.0166.0VC4.273.452.884.132.902.653.124.022.803.463.26Ocijenite postoji li povezanost visine i vitalnog kapaciteta plućaPDDS MOLBIO73Crtanje korelacionog dijagrama(točkasti“scatter” grafikon)MedCalc:Statistics -> Correlation -> Scatter diagramvisina -> X osVC -> Y osPDDS MOLBIO74


PDDS MOLBIO75Izračun koeficijenta korelacije - MedCalc:Statistics -> Correlation -> Correlation coefficientPDDS MOLBIO76


PDDS MOLBIO77Interpretacija koeficijenta korelacijestatistička značajnost• ocjenjuje je li r značajno različit od 0• ovisi o veličini uzorka - za velike uzorke, mali r ćebiti značajanpraktična značajnost• ocjenjuje se pomoću koeficijenta determinacije r 2• koliki udio varijabilnosti je “zajednički”PDDS MOLBIO78


Interpretacija koeficijenta korelacijePDDS MOLBION1020304050100200300500Najmanjiznačajni r(p


VAŽNO:Korelacija daje povezanost, a ne UZROČNOST !PDDS MOLBIO81VAŽNO:Na koeficijent korelacije jako utječu ekstremne vrijednosti!160.0140.0Pearsonov r=0.833120.0100.080.060.040.020.00.0140.0 160.0 180.0 200.0 220.0 240.0 260.0 280.0 300.0PDDS MOLBIO82


160.0140.0Pearsonov r = -0.002120.0100.080.060.040.020.00.0140.0 160.0 180.0 200.0 220.0 240.0 260.0 280.0 300.0PDDS MOLBIO83SPEARMANOV KOEFICIJENT KORELACIJE ρ- neparametrijski koeficijent korelacije• Dvije ordinalne varijableKADA?• Jedna ili obje numeričke varijable nisu normalnodistribuirane• Prisustvo ekstremnih vrijednostiPDDS MOLBIO84


LINEARNA REGRESIJA-ako parovi varijabli pokazuju prisustvo korelacije, funkcionalnuvezu prikazuje JEDNADŽBA REGRESIJEREGRESIJA -prognoza iz jedne varijable u drugulinearni slučaj --povezanost varijabli je linearnajednadžba regresije je jednadžba pravca okokojeg se grupiraju parovi varijabli ukorelacionom dijagramuPDDS MOLBIO85y = a + bxOPĆI OBLIK JEDNADŽBELINEARNE REGRESIJEx ... nezavisna varijabla (prediktorska)y ... zavisna varijabla (kriterijska)b ... koeficijent smjera−u realnoj situaciji:PDDS MOLBIO86


-jednadžba regresijskog pravca dobiva se METODOMNAJMANJIH KVADRATAy' i... vrijednost na regresijskom pravcu koja odgovara x i∑ y − y' = 0iii∑ ( y − y' ) = miniN∑ yi=1iiiz normalnih jednadžbii2N= Na + b∑xi=1iN∑ x yi=1iiN= a ∑ xi=1iN+ b∑xi=12iPDDS MOLBIO87b=N 1 N∑ xy i i − ⎛ ⎜ ∑ xN ⎝N N2 1∑ xi− ⎛ ⎜ ∑ xN ⎝N∑ yi= 1ii= 1 ⎠ i=12i= 1 i=1⎞⎟⎛ ⎜⎝i⎞⎟⎠i⎞⎟⎠KOEFICIJENTREGRESIJEa ...odsječak na ordinatia= y − bx-pravac regresije izražava "prosječni odnos" ("prosječnu vezu")varijabli x i yPDDS MOLBIO88


86% varijabilnosti vitalnog kapaciteta pluća može seobjasniti visinomSample size = 33Coefficient of determination = 0.8655Residual standard deviation = 0.2206standardna devijacija reziduala (standardna pogreškaprocjene)PDDS MOLBIO91-- REGRESSION EQUATION --------------------------------------Y = -11.5374 + 0.0893 XParameter Coefficient Std.Error T-value PIntercept -11.53739 1.05028 -10.9851 0.0000Slope 0.08927 0.00632 14.1213 0.0000PDDS MOLBIO92


β 0 β 1-- REGRESSION EQUATION --------------------------------------Y = -11.5374 + 0.0893 XParameter Coefficient Std.Error T-value PIntercept -11.53739 1.05028 -10.9851 0.0000Slope 0.08927 0.00632 14.1213 0.0000vitalni kapacitet pluća=β 0 +β 1 * Visina = −11.537+0.089 * VisinaVAŽNO:Predviđanja se smiju raditi samo za vrijednosti iz postojećeg rasponavarijabli!npr. za visinu 175,vitalni kapacitet pluća= -11.537+0.089 x 175 = 4.04PDDS MOLBIO93razlika SS T -SS R ; (SS M ); predstavljapoboljšanje u predviđanju zbogkorištenja regresijskog modelasuma kvadrata odstupanja odvrijednosti predviđeneregresijskim pravcem (SS R )-- ANALYSIS OF VARIANCE -------------------------------------Source DF Sum of Squares Mean SquareRegression 1 9.7037 9.7037Residual 31 1.5085 0.0487F-Ratio = 199.4107 P = 0.000SS T - suma kvadrata odstupanjaod aritmetičke sredineregresijski model značajnobolje predviđa zavisnuvarijablu od predviđanjaaritmetičkom sredinomPDDS MOLBIO94

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!