Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
A legegyszerűbb <strong>statisztikai</strong> művelet a számlálás vagyis annak meghatározása, hogy az adott változó<br />
szempontjából hány megfigyeléssel rendelkezünk. A számlálás végeredményét általában n-nel jelöljük,<br />
így már szemléltetni tudjuk a teljes adathalmazt:<br />
x,x, … ,x<br />
1 2 n<br />
illetve az adathalmaz általános elemét: xi -t.<br />
Rangsornak nevezzük a változóértékek növekvő, vagy csökkenő sorrendben történő felsorolását. A <strong>statisztikai</strong><br />
módszertan rangsoron - főszabályként – emelkedő rangsort ért. A rangsorba rendezett értékeket,<br />
annak érdekében, hogy megkülönböztessük az egyszerű lajstromtól (felsorolástól) általában az indexértékek<br />
megkülönböztetésével jelöljük:<br />
x (1) ,x (2) , … ,x(n)<br />
A mindennapi életben, így a <strong>statisztikai</strong> <strong>elemzésekben</strong> is kitüntetett szerepe van a legkisebb, illetve a legnagyobb<br />
ismérvértéknek, ezeket – akárcsak a köznyelvben – minimumnak, illetve maximumnak hívjuk,<br />
és<br />
x = x<br />
x = x<br />
min (1)<br />
max (n)<br />
szimbólumokkal jelöljük.<br />
A rangsorba rendezés során az eredeti adathalmaz számértékeihez ún. rangszámokat rendelünk. Rangszámnak<br />
nevezzük azt a pozitív egész számot, amely megmutatja, hogy egy konkrét adat hányadik az<br />
adathalmaz emelkedő rangsorában, vagyis<br />
R k<br />
i = , ha xi = x(k)<br />
Könnyen belátható, hogy a minimális érték rangszáma 1; a maximálisé pedig n, a rangszámok pedig a<br />
természetes számokkal egyenlők 1-től n-ig.<br />
Ha egy-egy változóérték többször is előfordul a lajstromban, akkor valamennyi azonos értékhez azt az<br />
azonos rangszámot rendeljük, amely a sorban következik, de a következő (nagyobb) értékhez annyival<br />
nagyobb rangszámot adunk, ahányszor előtte előfordult az azonosság. A másik megoldás az, hogy az<br />
azonos értékekhez rendelt rangszám nem a sorban következő, hanem egy képzett szám, melyet úgy képezünk,<br />
hogy az azonos értékekhez rendelt rangszámok összege akkora legyen, mintha az értékek különböznének.<br />
(pl. ha a 2-ik és a 3-ik érték azonos, akkor 2,5 és 2,5 rangszámot kapnak)<br />
A legegyszerűbb <strong>statisztikai</strong> műveletek közé soroljuk az összegzés (szummázás) műveletét is. Összegzésnek<br />
nevezzük azt a folyamatot, mely során összeadjuk az adatbázisban szereplő változó értékeit, vagyis<br />
képezzük a változó értékösszegét:<br />
n<br />
2.2 Középértékek és kvantilisek<br />
x′ = ∑ x<br />
i= 1<br />
Középértéknek, az azonos fajta számszerű értékek tömegének közös jellemzőjét nevezzük. A középérték<br />
egyetlen értékkel tömören jellemzi a sokaságot a vizsgált mennyiségi ismérv szerint.<br />
A középértékekkel szemben támasztott két legfontosabb követelmény:<br />
egyértelműen számíthatók és könnyen értelmezhetők legyenek<br />
közepes és tipikus értékek legyenek<br />
A közepesség azt jelenti, hogy ne egy szélső mennyiségi ismérvérték legyen a közös jellemző, hanem valamilyen<br />
középen elhelyezkedő, míg a tipikusság olyan értéket jelent, ami a sokaságban sokszor fordul<br />
elő. Középértékként többféle <strong>statisztikai</strong> jellemző ismeretes, amelyek természetesen nem egyformán felelnek<br />
meg a fenti követelményeknek.<br />
A középértékek fajtái:<br />
Számított középértékek (átlagok), a számtani-, a harmonikus-, a mértani (geometriai)- és a négyzetes<br />
(kvadratikus) átlag<br />
Helyzeti középértékek, a módusz és a medián<br />
i<br />
25