30.11.2014 Views

Statistika, vědecký výzkum, měření v pedagogickém ... - Lide na UHK

Statistika, vědecký výzkum, měření v pedagogickém ... - Lide na UHK

Statistika, vědecký výzkum, měření v pedagogickém ... - Lide na UHK

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1. STATISTIKA<br />

z latin. „Status“ (stav nebo stát)<br />

1562 Benátky<br />

17. stol. Německo<br />

Anglie 16.-17. st. tzv. „politická aritmetika“<br />

Ideální typ člověka - Adolphe QUETÉLET<br />

18. a 19. st. – pozorování a popis zákonitostí<br />

pozorovaných <strong>na</strong> tzv. hromadných jevech<br />

(bratři Bernoulliové, Langrange, Euler, de Moivre,<br />

Gauss, Laplacce, Bayes,…)<br />

až do poč. 20. st. tzv. vyčerpávající šetření<br />

20. a 30. léta 20. st. metody náhodného výběru a<br />

dílčích šetření<br />

rozvoj statistiky s rozvojem výpočetní techniky<br />

(Fischer, Yule, Pearson, Neyman,…)


<strong>Statistika</strong> v současnosti<br />

1. Vědní obor<br />

• deskriptivní<br />

• induktivní<br />

2. Metoda sběru, zpracování a<br />

vyhodnocování dat<br />

3. Informace


Předmětem zkoumání<br />

statistiky ve<br />

společenských vědách je


člověk


2. Vědecký výzkum v<br />

pedagogice<br />

vytvoření příslušné teorie<br />

prvky teorie vznikají <strong>na</strong> základě výzkumu<br />

různé pojetí výzkumu<br />

Gavora – „.... veškeré systematicky<br />

prováděné aktivity vedoucí ke získávání<br />

nových poz<strong>na</strong>tků ...“


Kerlinger (1972):<br />

„Vědecký výzkum je systematické,<br />

kontrolované, empirické a<br />

kritické zkoumání hypotetických<br />

výroků o předpokládaných<br />

vztazích mezi přirozenými jevy.“


Základní metody poznávání<br />

(Charles Pierce)<br />

Metoda tradice<br />

Metoda autority<br />

Metoda a priori<br />

Metoda vědy


Výzkumy<br />

Kvantitativní<br />

Kvalitativní<br />

Ex-post-facto<br />

Experimenty


Pedagogický výzkum a<br />

jeho fáze<br />

• Nápad, idea - stanovení<br />

problému<br />

• Formulace hypotéz<br />

• (Sběr dat)<br />

• Testování hypotéz<br />

• Závěry a jejich prezentace


2.1 Stanovení problému<br />

formulace problému<br />

• cíl šetření<br />

• výzkumná otázka –ústřední hypotéza<br />

vyjádřit cíle ve „zvládnutelné“ podobě<br />

• konkrétní<br />

• jednoz<strong>na</strong>čné<br />

• empiricky ověřitelné<br />

studium odborných pramenů<br />

formulace operacio<strong>na</strong>lizovaných definic,<br />

proměnných


2.2 Formulace hypotézy<br />

pokusné<br />

předběžné<br />

prozatímní odpovědi <strong>na</strong><br />

položené otázky (problémy)


Pravidla stanovení<br />

hypotézy (Gavora)<br />

H je tvrzení, v oz<strong>na</strong>movací větě<br />

(Výzkumný problém je <strong>na</strong>opak lepší<br />

vyjádřit tázací větou)<br />

H musí vyjadřuje vztah mezi dvěma<br />

proměnnými – vždy je to o rozdílech,<br />

vztazích nebo následcích<br />

H musí být možno empiricky ověřitelné,<br />

proměnné musí být měřitelné


H jsou vlastně predikcí o vztazích mezi<br />

proměnnými<br />

Málokdy je to důsledek jediného faktoru<br />

Chyby při formulacích H<br />

• Nesprávná, neurčitá formulace<br />

• Složité souvětí<br />

• Věcná hypotéza X statistická hypotéza


Proměnné - xi<br />

je to jev nebo vlastnost<br />

ve výzkumu se mění – věk, klasifikace, .<br />

dělíme je <strong>na</strong>:<br />

• Nezávisle proměnné = jev, vlastnost, která<br />

je příčinou nebo podmínkou vzniku jiné<br />

vlastnosti, jevu<br />

• Závisle p. = je vlastnost, jev, která je<br />

výsledkem působení nezávislé proměnné


2.3 Testování / verifikace<br />

hypotézy<br />

Prokazujeme pravdivost nebo nepravdivost<br />

hypotézy<br />

Rozhodujeme <strong>na</strong> základě:<br />

• třídění<br />

• zpracování<br />

• vyhodnocení shromážděných dat<br />

Data shromažďujeme od ……respondentů


Výzkumný vzorek<br />

základní soubor – populace<br />

výběrový soubor – výběr<br />

výběr prvků do výzkumných souborů<br />

volba jedinců – situací, jejich počtu,.. =<br />

výběr prvků do výzkumného souboru


Druhy výběrů<br />

Prostý náhodný výběr (náhodná čísla)<br />

• Výběr s vracením<br />

• Výběr bez vracení<br />

Skupinový výběr<br />

Stratifikovaný výběr<br />

Kontrolovaný výběr<br />

Vícenásobný výběr<br />

Záměrný výběr<br />

Mechanický výběr<br />

Spárované výběry


Rozsah (velikost) výběru<br />

Čím větší soubor pořídíme, tím více se<br />

blížíme skutečným vlastnostem<br />

základního souboru<br />

Odhady rozsahu výběru<br />

• u metrických dat : n = ( t²α . s²) / ²<br />

• u nominálních či ordinálních dat:<br />

n = [ t²α . p . (1 – p) ] / d²


3. Měření v<br />

pedagogickém výzkumu<br />

„Měření v nejširším slova smyslu je<br />

přiřazování čísel předmětům nebo<br />

jevům podle pravidel“<br />

(Stevens, 1951, s. 51)


3 postuláty<br />

Jestliže (a = b) (a ≠ b) ne však oboje<br />

Jestliže (a = b) (b = c) (a = c)<br />

Jestliže (a > b) (b > c) (a > c)<br />

Platí tyto postuláty při sledovaní jevů<br />

<strong>na</strong>př. u lidí?!


Úrovně měření<br />

Nominální (tj. oz<strong>na</strong>čkování)<br />

Ordinální (pořadové)<br />

Metrické<br />

•Intervalové<br />

•Poměrové


Vlastnosti dobrého<br />

měření:<br />

Validita<br />

Reliabilita<br />

Praktičnost – jednoduchost,<br />

hospodárnost, ....


2.4 Vyvozování závěrů a<br />

jejich prezentace<br />

Interpretujeme dosažené výsledky<br />

Srovnáváme je s jinými<br />

Zdůvodňujeme rozdíly<br />

Dedukujeme další podmíněné výroky<br />

Přijímáme nebo odmítáme H<br />

Vyslovujeme závěry výzkumu


4. Metody sběru dat<br />

Experiment<br />

Dotazovací techniky<br />

• Dotazník<br />

• Anketa<br />

• Interview<br />

• Focus group,..<br />

Pozorování<br />

Studium dokumentů<br />

Sociometrie


5. Metody uspořádání a<br />

zpracování dat<br />

Tzv. popisná statistika


5.1 Uspořádání a<br />

sestavování tabulek<br />

Čárkovací metoda<br />

Interval - jeho hloubka a střed<br />

Zásady tvorby tabulek<br />

Četnost – absolutní, relativní,<br />

kumulativní<br />

Využití MS Excell – s přenosem dat do<br />

NCSS, SPSS, ….


Četnostní tabulky<br />

Př. Bylo sledováno 92 rodin a zkoumal se počet<br />

členů domácnosti<br />

Základní pojmy<br />

Z<strong>na</strong>k – xi<br />

Četnost – ni<br />

Relativní četnost – ni/n<br />

Kumulativní četnost n1, n1+n2,….<br />

Kumulativní relativní četnost p1, p1+p2, …


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

kumul.<br />

četnost<br />

kumul. rel.<br />

četnost


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

1 10<br />

2 15<br />

3 23<br />

4 28<br />

5 9<br />

6 4<br />

7 2<br />

8 0<br />

9 1<br />

92<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

1 10 0,109<br />

2 15 0,163<br />

3 23<br />

4 28<br />

5 9<br />

6 4<br />

7 2<br />

8 0<br />

9 1<br />

92<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

1 10 0,109<br />

2 15 0,163<br />

3 23 0,250<br />

4 28 0,304<br />

5 9 0,098<br />

6 4 0,043<br />

7 2 0,022<br />

8 0 0,000<br />

9 1 0,011<br />

92 1,000<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …<br />

1 10 0,109 10<br />

2 15 0,163 25<br />

3 23 0,250<br />

4 28 0,304<br />

5 9 0,098<br />

6 4 0,043<br />

7 2 0,022<br />

8 0 0,000<br />

9 1 0,011<br />

92 1,000


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …<br />

1 10 0,109 10<br />

2 15 0,163 25<br />

3 23 0,250 48<br />

4 28 0,304 76<br />

5 9 0,098 85<br />

6 4 0,043 89<br />

7 2 0,022 91<br />

8 0 0,000 91<br />

9 1 0,011 92<br />

92 1,000


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …<br />

1 10 0,109 10 0,109<br />

2 15 0,163 25 0,272<br />

3 23 0,250 48<br />

4 28 0,304 76<br />

5 9 0,098 85<br />

6 4 0,043 89<br />

7 2 0,022 91<br />

8 0 0,000 91<br />

9 1 0,011 92<br />

92 1,000


počet členů<br />

domácnosti<br />

absolutní<br />

četnost<br />

relativní<br />

četnost<br />

xi ni ni/n<br />

kumul.<br />

četnost<br />

n1,<br />

n1+n2,…<br />

kumul. rel.<br />

četnost<br />

p1,<br />

p1+p2, …<br />

1 10 0,109 10 0,109<br />

2 15 0,163 25 0,272<br />

3 23 0,250 48 0,522<br />

4 28 0,304 76 0,826<br />

5 9 0,098 85 0,924<br />

6 4 0,043 89 0,967<br />

7 2 0,022 91 0,989<br />

8 0 0,000 91 0,989<br />

9 1 0,011 92 1,000<br />

92 1,000


Intervalové rozdělení<br />

četností<br />

Obor všech možných hodnot<br />

sledovaného z<strong>na</strong>ku rozdělíme do<br />

vzájemně se vylučujících intervalů – tříd<br />

Čím větší rozsah sledovaného souboru<br />

– tím větší počet intervalů (max. 15 –<br />

pro přehlednost)


Výpočet intervalu<br />

Diskrétní náhodná veliči<strong>na</strong> h = 0,08 × R<br />

R<br />

24<br />

<br />

h<br />

<br />

R<br />

12<br />

h – hloubka (šířka) intervalu<br />

R – variační šíře (max. – min.)<br />

Spojitá náhodná veliči<strong>na</strong> k = 1 + 3,3 log(n)<br />

k – počet dílčích intervalů<br />

n – počet různých hodnot z<strong>na</strong>ku


Příklad intervalového<br />

rozdělení četností<br />

Na ZŠ se měřila výška žáků v cm: 144, 149, 145,<br />

142, 146, 147, 141, 150, 143, 146, 150, 141,<br />

148, 148, 144, 141, 145, 148, 144, 143, 155,<br />

133, 158, 154, 151, 140, 136, 137, 153, 139,<br />

138.<br />

R = 158 – 133 = 25<br />

h = 0,08 * 25 = 2<br />

25<br />

25<br />

<br />

1,04<br />

h<br />

<br />

<br />

2,08<br />

24<br />

12


5.2 Grafické metody<br />

zobrazování dat<br />

100<br />

Histogramy četností<br />

(sloupcový graf)<br />

80<br />

60<br />

40<br />

20<br />

Východ<br />

Západ<br />

Sever<br />

Polygony četností<br />

(spojnicový graf)<br />

90<br />

80<br />

70<br />

60<br />

0<br />

1.<br />

čtvrt.<br />

3.<br />

čtvrt.<br />

Výsečové grafy<br />

50<br />

40<br />

30<br />

20<br />

Sever<br />

Východ<br />

Západ<br />

Sever<br />

Kartografy<br />

10<br />

0<br />

1. čtvrt.<br />

2. čtvrt.<br />

3. čtvrt.<br />

Západ<br />

Východ<br />

4. čtvrt.<br />

1. čtvrt.<br />

2. čtvrt.<br />

3. čtvrt.<br />

4. čtvrt.


Count<br />

Histogram<br />

Sloupcový graf<br />

Osa x – jednotlivé <strong>na</strong>měřené hodnoty<br />

Osa y – četnosti hodnot (absolutní či<br />

relativní)<br />

Histogram of CS_SUPKT<br />

140,0<br />

105,0<br />

70,0<br />

35,0<br />

0,0<br />

15,0 23,8 32,5 41,3 50,0<br />

CS_SUPKT


absolutní četnost<br />

Polygon<br />

Četnosti spojujeme úsečkami ve středu<br />

jednotlivých intervalů<br />

Polygon četností<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

1 2 3 4 5 6 7 8 9<br />

počet členů domácnosti


Stromový graf


Stromový graf - příklad<br />

Máme k dispozici výkony v určité sportovní disciplíně:<br />

784, 810, 806, 811, 815, 796, 811, 796, 819, 802,<br />

807, 803, 820, 815.<br />

78<br />

79<br />

80<br />

81<br />

82<br />

4<br />

66<br />

2367<br />

011559<br />

0


Krabicový graf<br />

Kvantil k<br />

• 25% kvantil = dolní kvartil<br />

• 50% kvantil = medián<br />

• 75% kvantil = horní kvartil<br />

• 10% kvantily = decily<br />

• 100% kvantily = percentily


Amount<br />

Krabicový graf<br />

50,00<br />

Box Plot<br />

horní kvartil<br />

41,25<br />

32,50<br />

23,75<br />

15,00<br />

CS_SUPKT<br />

Variables<br />

JZ_SUPKT<br />

dolní kvartil


6. Základní statistické<br />

charakteristiky<br />

(číselný popis dat)<br />

Střední hodnoty – charakteristiky polohy<br />

Míry rozptýlenosti - variability<br />

Míry koncentrace


6.1 Charakteristiky<br />

Modus (Mode)<br />

oz<strong>na</strong>čení<br />

polohy<br />

xˆ<br />

nejčastěji se vyskytující hodnota<br />

(nejčetnější)<br />

může odhalit nehomogenitu výběru<br />

neříká nic o extrémních hodnotách


Medián (Median)<br />

oz<strong>na</strong>čení<br />

x~<br />

prostřední hodnota v řadě hodnot<br />

uspořádaných podle velikosti<br />

používá se jako charakteristika polohy,<br />

chceme-li odstranit vliv extrémních<br />

hodnot


Aritmetický průměr (Mean)<br />

oz<strong>na</strong>čení<br />

x<br />

n<br />

x<br />

x<br />

x<br />

i …x n hodnoty z<strong>na</strong>ku<br />

n počet hodnot<br />

i<br />

<br />

i<br />

1 n<br />

má velký výz<strong>na</strong>m, nelze však přeceňovat<br />

citlivý <strong>na</strong> extrémní hodnoty


Další charakteristiky<br />

polohy<br />

V symetrickém rozdělení se modus,<br />

medián i aritmetický průměr shodují!<br />

Vážený průměr<br />

Useknutý průměr<br />

Harmonický průměr (Harmonic Mean)<br />

Geometrický průměr (Geometric Mean)


6.2 Míry variability<br />

Rozpětí (Range)<br />

oz<strong>na</strong>čení<br />

R<br />

výpočet max. hodnota – min. hodnota<br />

z<strong>na</strong>čně ovlivněno extrémními<br />

hodnotami


Mezikvartilové rozpětí (Interquartile<br />

Range)<br />

výpočet horní kvartil – dolní kvartil<br />

délka obdélníka v krabicovém grafu<br />

není ovlivněno extrémními hodnotami


Amount<br />

Krabicový graf<br />

50,00<br />

Box Plot<br />

horní kvartil<br />

41,25<br />

32,50<br />

23,75<br />

mezikvartilové<br />

rozpětí<br />

15,00<br />

CS_SUPKT<br />

Variables<br />

JZ_SUPKT<br />

dolní kvartil


Střední kvadratická odchylka, rozptyl<br />

doplňuje průměr<br />

rozdělení se stejným průměrem může být<br />

více – liší se rozptylem<br />

s<br />

2<br />

n<br />

<br />

( x x)<br />

2<br />

i<br />

<br />

i<br />

1 n<br />

. ni


Směrodatná odchylka (Standard<br />

Deviation)<br />

s <br />

s<br />

2<br />

spolu s rozptylem nejužívanější<br />

doplnění průměru<br />

kritérium věrohodnosti průměru


Variační koeficient (Coefficient of Variation)<br />

V<br />

s<br />

( c)<br />

100<br />

x<br />

bezrozměrný<br />

pro porovnání variability hodnot měřených v<br />

různých jednotkách<br />

orientačně sig<strong>na</strong>lizuje případnou hrubou<br />

nesourodost dat


Další míry variability<br />

Průměrná odchylka<br />

d<br />

n<br />

<br />

/ xi<br />

x /.<br />

ni<br />

i<br />

1 n<br />

Relativní průměrná<br />

odchylka<br />

rd<br />

x<br />

d<br />

100


6.3 Míry koncentrace<br />

Šikmost (angl. Skewness)<br />

oz<strong>na</strong>čení S m<br />

S m = 0 rozdělení symetrické


S m > 0 zešikmené zprava<br />

(kladné hodnoty šikmosti)<br />

S m < 0 zešikmené zleva<br />

(záporné hodnoty šikmosti)


Špičatost (angl. Kurtosis – někdy<br />

také Exces)<br />

oz<strong>na</strong>čení K m<br />

K m = 0 normované normální rozdělení


K m > 0 špičatost<br />

(větší četnosti<br />

prostředních hodnot)<br />

K m 0 plochost<br />

(přibližně stejně velké<br />

četnosti prostředních<br />

a ostatních hodnot)


Normální rozdělení


Pravděpodobnost<br />

výskytu hodnot<br />

V intervalu od – S do + S (kolem aritm. Ø)<br />

se <strong>na</strong>chází přibližně 2/3 (68,27%) všech<br />

hodnot<br />

V intervalu od – 2S do + 2S (kolem Ø) se<br />

<strong>na</strong>chází přibližně 19/20 (95,4%)<br />

V intervalu od – 3S do + 3S (kolem Ø) se<br />

<strong>na</strong>chází téměř všechny hodnoty (99,73%)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!