Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Primjer 1.8 Aritmetička sredina podataka iz primjera 1.3 je:<br />
¯x =<br />
8 · 0 + 12 · 1 + 28 · 2 + 19 · 3 + 7 · 4 + 4 · 5 + 1 · 6 + 1 · 7<br />
8 + 12 + 28 + 19 + 7 + 4 + 1 + 1<br />
= 186<br />
80 = 2.325.<br />
1.6.2 Medijan<br />
Neka je X numerička ili ordinalna varijabla. Tada je njene vrijednosti (1.1) moguće urediti:<br />
x (1) ≤ x (2) ≤ · · · ≤ x (n) . (1.5)<br />
Medijan skupa podataka (1.1) je vrijednost od X za koju vrijedi da je 50% svih podataka u<br />
skupu manje od ili jednako toj vrijednosti i 50% svih podataka je veće od nje ili jednako joj.<br />
Kada je broj podataka n u (1.1) (odn. (1.5)) neparan broj, n = 2k − 1, medijan m od (1.1)<br />
je jednak x (k) . U stvari, to je vrijednost koja se nalazi u sredini niza (1.5). Dakle, medijan<br />
se može odrediti za neparne skupove ordinalnih podataka. Uz takvu općenitost teško je<br />
odrediti medijan parnog skupa podataka. Zato pretpostavimo da su (1.1) numerički podaci.<br />
Tada je medijan skupa s parnim brojem podataka n = 2k jednak m = (x (k) + x (k+1) )/2, tj.<br />
aritmetičkoj sredini dva srednja broja u (1.5).<br />
Primjer 1.9 Medijan uzorka iz primjera 1.3 je<br />
m = x (40) + x (41)<br />
2<br />
= 2 + 2<br />
2<br />
= 2.<br />
1.6.3 Mod<br />
Mod je vrijednost obilježja X koja su u skupu podataka (1.1) pojavljuje najviše puta, dakle,<br />
ima najveću frekvenciju. Mod se može opisati i kao najtipičnija vrijednost promatrane<br />
varijable. Na primjer, osiguravajuće društvo može zanimati najtipičnija vrsta osiguranika<br />
po zanimanju. Jasno je da mod općenito ne mora postojati.<br />
Primjer 1.10 Mod uzorka iz primjera 1.3 je 2 jer ta vrijednost ima najveću frekvenciju<br />
(28). Dakle, najtipičnija obitelj (u uzorku) ima dvoje djece mlade od 16 godina.<br />
1.7 Mjere raspršenja<br />
Uz mjere lokacije, odnosno srednje vrijednosti skupa podataka, važno svojstvo distribucije<br />
tih podataka je i kako su podaci raspršeni, često u odnosu na neku srednju vrijednost.<br />
1.7.1 Standardna devijacija<br />
Najčešće korištena mjera raspršenja skupa numeričkih podataka je standardna devijacija.<br />
Standardna devijacija je srednje kvadratno odstupanje podataka od njihove aritmetičke<br />
sredine. Formulom,<br />
√<br />
s =<br />
√ 1<br />
n − 1<br />
n∑<br />
(x i − ¯x) 2 , (1.6)<br />
i=1<br />
13