03.05.2013 Views

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

Excel parancsfájlok felhasználása a statisztikai elemzésekben Írta ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

A legegyszerűbb <strong>statisztikai</strong> művelet a számlálás vagyis annak meghatározása, hogy az adott változó<br />

szempontjából hány megfigyeléssel rendelkezünk. A számlálás végeredményét általában n-nel jelöljük,<br />

így már szemléltetni tudjuk a teljes adathalmazt:<br />

x,x, … ,x<br />

1 2 n<br />

illetve az adathalmaz általános elemét: xi -t.<br />

Rangsornak nevezzük a változóértékek növekvő, vagy csökkenő sorrendben történő felsorolását. A <strong>statisztikai</strong><br />

módszertan rangsoron - főszabályként – emelkedő rangsort ért. A rangsorba rendezett értékeket,<br />

annak érdekében, hogy megkülönböztessük az egyszerű lajstromtól (felsorolástól) általában az indexértékek<br />

megkülönböztetésével jelöljük:<br />

x (1) ,x (2) , … ,x(n)<br />

A mindennapi életben, így a <strong>statisztikai</strong> <strong>elemzésekben</strong> is kitüntetett szerepe van a legkisebb, illetve a legnagyobb<br />

ismérvértéknek, ezeket – akárcsak a köznyelvben – minimumnak, illetve maximumnak hívjuk,<br />

és<br />

x = x<br />

x = x<br />

min (1)<br />

max (n)<br />

szimbólumokkal jelöljük.<br />

A rangsorba rendezés során az eredeti adathalmaz számértékeihez ún. rangszámokat rendelünk. Rangszámnak<br />

nevezzük azt a pozitív egész számot, amely megmutatja, hogy egy konkrét adat hányadik az<br />

adathalmaz emelkedő rangsorában, vagyis<br />

R k<br />

i = , ha xi = x(k)<br />

Könnyen belátható, hogy a minimális érték rangszáma 1; a maximálisé pedig n, a rangszámok pedig a<br />

természetes számokkal egyenlők 1-től n-ig.<br />

Ha egy-egy változóérték többször is előfordul a lajstromban, akkor valamennyi azonos értékhez azt az<br />

azonos rangszámot rendeljük, amely a sorban következik, de a következő (nagyobb) értékhez annyival<br />

nagyobb rangszámot adunk, ahányszor előtte előfordult az azonosság. A másik megoldás az, hogy az<br />

azonos értékekhez rendelt rangszám nem a sorban következő, hanem egy képzett szám, melyet úgy képezünk,<br />

hogy az azonos értékekhez rendelt rangszámok összege akkora legyen, mintha az értékek különböznének.<br />

(pl. ha a 2-ik és a 3-ik érték azonos, akkor 2,5 és 2,5 rangszámot kapnak)<br />

A legegyszerűbb <strong>statisztikai</strong> műveletek közé soroljuk az összegzés (szummázás) műveletét is. Összegzésnek<br />

nevezzük azt a folyamatot, mely során összeadjuk az adatbázisban szereplő változó értékeit, vagyis<br />

képezzük a változó értékösszegét:<br />

n<br />

2.2 Középértékek és kvantilisek<br />

x′ = ∑ x<br />

i= 1<br />

Középértéknek, az azonos fajta számszerű értékek tömegének közös jellemzőjét nevezzük. A középérték<br />

egyetlen értékkel tömören jellemzi a sokaságot a vizsgált mennyiségi ismérv szerint.<br />

A középértékekkel szemben támasztott két legfontosabb követelmény:<br />

egyértelműen számíthatók és könnyen értelmezhetők legyenek<br />

közepes és tipikus értékek legyenek<br />

A közepesség azt jelenti, hogy ne egy szélső mennyiségi ismérvérték legyen a közös jellemző, hanem valamilyen<br />

középen elhelyezkedő, míg a tipikusság olyan értéket jelent, ami a sokaságban sokszor fordul<br />

elő. Középértékként többféle <strong>statisztikai</strong> jellemző ismeretes, amelyek természetesen nem egyformán felelnek<br />

meg a fenti követelményeknek.<br />

A középértékek fajtái:<br />

Számított középértékek (átlagok), a számtani-, a harmonikus-, a mértani (geometriai)- és a négyzetes<br />

(kvadratikus) átlag<br />

Helyzeti középértékek, a módusz és a medián<br />

i<br />

25

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!