Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
⎡q q q q ⎤<br />
yy y1 y2 yk<br />
⎢<br />
q1yq11 q12 q<br />
⎥<br />
⎢<br />
1k ⎥<br />
−1<br />
R = Q = ⎢q2y q21q22q ⎥ 2k<br />
⎢ ⎥<br />
⎢ ⎥<br />
⎢q q q q ⎥<br />
⎣ ky k1 k2 kk ⎦<br />
A többszörös korrelációs együttható (R) azt méri, hogy a magyarázó változók az eredményváltozóval<br />
együttesen milyen szoros kapcsolatban vannak.<br />
R 2 = a többszörös determinációs együttható (jele: R 2 ) kifejezi, hogy mekkora hányadban magyarázzák<br />
meg együttesen a magyarázó változók az eredményváltozó varianciáját (szórásnégyzetét). A kapcsolatok<br />
jellegének minősítésén túl fontos szerepet tölt be a többszörös determinációs együttható a regressziós<br />
modell megítélésében. A mutató nagyobb értéke egyben azt is jelenti, hogy jobban illeszkedik a modell.<br />
2 1<br />
R = 1− qyy<br />
R ~2 = a korrigált determinációs együttható: a többváltozós regressziós modellek esetében gyakran felléphet<br />
egy olyan jelenség, amely félreinformálhatja az elemzőt. Az R 2 ugyanis nagyobb magyarázó erővel<br />
bír, ha több magyarázó változó hatása szerepel benne, függetlenül attól, hogy valóban releváns hatást<br />
fejt-e ki mindegyik magyarázó változó. (Például megtévesztő lehet az R 2 alapján két modell összehasonlítása,<br />
ha az egyik három, a másik hét magyarázó változót tartalmaz.) A modellek összehasonlítása esetében<br />
a különböző számú magyarázó változóból eredő problémát próbálja feloldani az ún. korrigált vagy a<br />
szabadságfokokkal korrigált determinációs együttható (jele: R ~2 ):<br />
2 n 1<br />
2<br />
R −<br />
= 1− ( 1−R )<br />
n−k−1 Az s = a modell általános standard hibája, jelzi az illeszkedés jóságát, a modell annál pontosabban illeszkedik,<br />
minél kisebb az értéke. Meghatározására a regressziós paraméterek ismeretében kerülhet sor, amikor<br />
kiszámítva az y eredményváltozó becsült értékeit ( ˆy ) képezhetjük a reziduumokat ( e= y−ˆ y ) .<br />
∑ ∑<br />
( ) 2 2<br />
y−yˆ e<br />
s = =<br />
n−k−1 n−k−1 A regressziós modell egészének tesztelése, a globális F-próba<br />
A varianciaanalízis az Adat munkalapon jelenik meg. A varianciaanalízis összefoglalja az alábbi<br />
nullhipotézis ellenőrzésére vonatkozó eredményt. Nullhipotézisünk az, hogy a magyarázó változók regressziós<br />
együtthatói mind 0-k, az alternatív hipotézis szerint létezik legalább egy 0-tól eltérő együttható.<br />
H 0: β1= β2=...= βk=0<br />
H 1 : ∃βj≠ 0<br />
Az ellenhipotézis elfogadása esetén azt állíthatjuk, hogy van legalább egy olyan magyarázó változó,<br />
amely szignifikáns hatással rendelkezik, tehát létezik legalább egy nullától eltérő értékű paraméter. A<br />
nullhipotézis a lineáris regresszió fennállásának tagadását jelenti és amennyiben igaz, úgy az eredményváltozó<br />
kizárólag a véletlen hatására szóródik; az alternatív hipotézis fennállása esetén a regressziós modellt<br />
elfogadhatónak ítéljük. A nullhipotézis ellenőrzését az alábbi varianciaanalízis 4-1. tábla alapján<br />
végezhetjük el.<br />
151