02.11.2014 Views

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

Vjerojatnost i matematička statistika - Poslijediplomski specijalistički ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Primjer 1.8 Aritmetička sredina podataka iz primjera 1.3 je:<br />

¯x =<br />

8 · 0 + 12 · 1 + 28 · 2 + 19 · 3 + 7 · 4 + 4 · 5 + 1 · 6 + 1 · 7<br />

8 + 12 + 28 + 19 + 7 + 4 + 1 + 1<br />

= 186<br />

80 = 2.325.<br />

1.6.2 Medijan<br />

Neka je X numerička ili ordinalna varijabla. Tada je njene vrijednosti (1.1) moguće urediti:<br />

x (1) ≤ x (2) ≤ · · · ≤ x (n) . (1.5)<br />

Medijan skupa podataka (1.1) je vrijednost od X za koju vrijedi da je 50% svih podataka u<br />

skupu manje od ili jednako toj vrijednosti i 50% svih podataka je veće od nje ili jednako joj.<br />

Kada je broj podataka n u (1.1) (odn. (1.5)) neparan broj, n = 2k − 1, medijan m od (1.1)<br />

je jednak x (k) . U stvari, to je vrijednost koja se nalazi u sredini niza (1.5). Dakle, medijan<br />

se može odrediti za neparne skupove ordinalnih podataka. Uz takvu općenitost teško je<br />

odrediti medijan parnog skupa podataka. Zato pretpostavimo da su (1.1) numerički podaci.<br />

Tada je medijan skupa s parnim brojem podataka n = 2k jednak m = (x (k) + x (k+1) )/2, tj.<br />

aritmetičkoj sredini dva srednja broja u (1.5).<br />

Primjer 1.9 Medijan uzorka iz primjera 1.3 je<br />

m = x (40) + x (41)<br />

2<br />

= 2 + 2<br />

2<br />

= 2.<br />

1.6.3 Mod<br />

Mod je vrijednost obilježja X koja su u skupu podataka (1.1) pojavljuje najviše puta, dakle,<br />

ima najveću frekvenciju. Mod se može opisati i kao najtipičnija vrijednost promatrane<br />

varijable. Na primjer, osiguravajuće društvo može zanimati najtipičnija vrsta osiguranika<br />

po zanimanju. Jasno je da mod općenito ne mora postojati.<br />

Primjer 1.10 Mod uzorka iz primjera 1.3 je 2 jer ta vrijednost ima najveću frekvenciju<br />

(28). Dakle, najtipičnija obitelj (u uzorku) ima dvoje djece mlade od 16 godina.<br />

1.7 Mjere raspršenja<br />

Uz mjere lokacije, odnosno srednje vrijednosti skupa podataka, važno svojstvo distribucije<br />

tih podataka je i kako su podaci raspršeni, često u odnosu na neku srednju vrijednost.<br />

1.7.1 Standardna devijacija<br />

Najčešće korištena mjera raspršenja skupa numeričkih podataka je standardna devijacija.<br />

Standardna devijacija je srednje kvadratno odstupanje podataka od njihove aritmetičke<br />

sredine. Formulom,<br />

√<br />

s =<br />

√ 1<br />

n − 1<br />

n∑<br />

(x i − ¯x) 2 , (1.6)<br />

i=1<br />

13

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!