03.05.2013 Views

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

⎡q q q q ⎤<br />

yy y1 y2 yk<br />

⎢<br />

q1yq11 q12 q<br />

⎥<br />

⎢<br />

1k ⎥<br />

−1<br />

R = Q = ⎢q2y q21q22q ⎥ 2k<br />

⎢ ⎥<br />

⎢ ⎥<br />

⎢q q q q ⎥<br />

⎣ ky k1 k2 kk ⎦<br />

A többszörös korrelációs együttható (R) azt méri, hogy a magyarázó változók az eredményváltozóval<br />

együttesen milyen szoros kapcsolatban vannak.<br />

R 2 = a többszörös determinációs együttható (jele: R 2 ) kifejezi, hogy mekkora hányadban magyarázzák<br />

meg együttesen a magyarázó változók az eredményváltozó varianciáját (szórásnégyzetét). A kapcsolatok<br />

jellegének minősítésén túl fontos szerepet tölt be a többszörös determinációs együttható a regressziós<br />

modell megítélésében. A mutató nagyobb értéke egyben azt is jelenti, hogy jobban illeszkedik a modell.<br />

2 1<br />

R = 1− qyy<br />

R ~2 = a korrigált determinációs együttható: a többváltozós regressziós modellek esetében gyakran felléphet<br />

egy olyan jelenség, amely félreinformálhatja az elemzőt. Az R 2 ugyanis nagyobb magyarázó erővel<br />

bír, ha több magyarázó változó hatása szerepel benne, függetlenül attól, hogy valóban releváns hatást<br />

fejt-e ki mindegyik magyarázó változó. (Például megtévesztő lehet az R 2 alapján két modell összehasonlítása,<br />

ha az egyik három, a másik hét magyarázó változót tartalmaz.) A modellek összehasonlítása esetében<br />

a különböző számú magyarázó változóból eredő problémát próbálja feloldani az ún. korrigált vagy a<br />

szabadságfokokkal korrigált determinációs együttható (jele: R ~2 ):<br />

2 n 1<br />

2<br />

R −<br />

= 1− ( 1−R )<br />

n−k−1 Az s = a modell általános standard hibája, jelzi az illeszkedés jóságát, a modell annál pontosabban illeszkedik,<br />

minél kisebb az értéke. Meghatározására a regressziós paraméterek ismeretében kerülhet sor, amikor<br />

kiszámítva az y eredményváltozó becsült értékeit ( ˆy ) képezhetjük a reziduumokat ( e= y−ˆ y ) .<br />

∑ ∑<br />

( ) 2 2<br />

y−yˆ e<br />

s = =<br />

n−k−1 n−k−1 A regressziós modell egészének tesztelése, a globális F-próba<br />

A varianciaanalízis az Adat munkalapon jelenik meg. A varianciaanalízis összefoglalja az alábbi<br />

nullhipotézis ellenőrzésére vonatkozó eredményt. Nullhipotézisünk az, hogy a magyarázó változók regressziós<br />

együtthatói mind 0-k, az alternatív hipotézis szerint létezik legalább egy 0-tól eltérő együttható.<br />

H 0: β1= β2=...= βk=0<br />

H 1 : ∃βj≠ 0<br />

Az ellenhipotézis elfogadása esetén azt állíthatjuk, hogy van legalább egy olyan magyarázó változó,<br />

amely szignifikáns hatással rendelkezik, tehát létezik legalább egy nullától eltérő értékű paraméter. A<br />

nullhipotézis a lineáris regresszió fennállásának tagadását jelenti és amennyiben igaz, úgy az eredményváltozó<br />

kizárólag a véletlen hatására szóródik; az alternatív hipotézis fennállása esetén a regressziós modellt<br />

elfogadhatónak ítéljük. A nullhipotézis ellenőrzését az alábbi varianciaanalízis 4-1. tábla alapján<br />

végezhetjük el.<br />

151

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!