Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
szesen sorban szereplő) megoszlástól, akkor megállapítható a sztochasztikus kapcsolat megléte. Ha a tábla<br />
minden sorában (és így az összesen sorban is) ugyanolyan lenne a megoszlás, az a két ismérv függetlenségét<br />
jelezné. Ha a táblának csak egyik átlójában találnánk nullától különböző gyakoriságot, és így<br />
minden sorban csak egy, 1 értékű, illetve 100% -os megoszlási viszonyszámot, akkor a két ismérv függvényszerű<br />
kapcsolatban lenne. Természetesen ez csak olyan táblával reprezentált összefüggések esetén<br />
lehetséges, amikor a két ismérv változatainak a száma megegyezik, azaz kvadratikus a tábla (például 2×2es,<br />
3×3-as).<br />
Természetesen az elsőként bemutatott 4.4 tábla tábla logikájának megfelelve is elemezhetjük a sztochasztikus<br />
kapcsolat meglétét. A megoszlási viszonyszámok segítségével tulajdonképpen az alábbi azonosságokat<br />
vizsgáljuk:<br />
fab Sa<br />
=<br />
Obn illetve<br />
fab Ob<br />
=<br />
San Amennyiben a fenti összefüggések teljesülnek, a két ismérv függetlennek tekinthető. Ezzel eljutottunk tulajdonképpen<br />
az asszociációs kapcsolat mérésének alapgondolatához. A valószínűség-elméletből ismeretes<br />
az a megfogalmazás, amely szerint a függetlenség feltétele, hogy a feltételes valószínűség legyen<br />
egyenlő a feltétel nélküli valószínűséggel. Mindezt reprezentálják a fenti azonosságok. Az ismérvek függetlenségét<br />
megközelíthetjük abból a közismert valószínűségelméleti összefüggésből is, amely szerint két<br />
esemény független, ha együttes bekövetkezési valószínűségük megegyezik a két esemény valószínűségé-<br />
nek szorzatával:<br />
P( A∩ B) = P( A) P( B)<br />
Mindez empirikus <strong>statisztikai</strong> jelölésekkel is leírható:<br />
fab ObSa = ×<br />
n n n<br />
*<br />
A továbbiakban azt a gyakoriságot keressük, amely a fenti feltételeknek megfelel. Jelöljük fab -gal a függetlenség<br />
esetén feltételezett gyakoriságot. A fenti összefüggésből kiindulva az ismérvek függetlenségének<br />
esetére feltételezett gyakoriságokat számíthatjuk ki az alábbi módon:<br />
* ObSa (o) (s) ObSa fab = n⋅ ⋅ = nPbPa= n n n<br />
ahol:<br />
Ob (o) Sa<br />
(s)<br />
= Pb és = Pa<br />
n n<br />
a két ismérv szerint külön-külön számított (a tábla peremén szereplő) megoszlási viszonyszámok.<br />
A feltételezett gyakoriságok számítása tehát azt jelenti, hogy a sokaságot a peremeloszlások alapján osztjuk<br />
szét. Ha a táblát a feltételezett gyakoriságokkal töltjük ki, minden sor megoszlása ugyanolyan lesz,<br />
ami megfelel a két ismérv függetlenségének. A sztochasztikus kapcsolat létezését jelzi tehát az, ha a ténylegesen<br />
megfigyelt és a függetlenség esetére feltételezett gyakoriságok nem egyeznek meg. Összehasonlí-<br />
2<br />
tásukat a négyzetes kontingencia mutatójával az ún. χ -értékkel végezhetjük el.<br />
Képlete:<br />
( ) 2<br />
s o<br />
*<br />
f 2<br />
ab − fab<br />
χ =∑∑ *<br />
f<br />
a= 1 b= 1 ab<br />
Ha a tényleges és a feltételezett gyakoriságok megegyeznek, azaz az ismérvek függetlensége esetén,<br />
2<br />
χ = 0 .<br />
2<br />
A χ -értéket felhasználva a kapcsolat szorossága a Cramer-féle asszociációs együtthatóval mérhető.<br />
Képlete:<br />
C =<br />
2<br />
χ<br />
n× min s−1,o−1 [ ]<br />
216