09.01.2015 Views

1. Analýza závislosti dvoch veličín

1. Analýza závislosti dvoch veličín

1. Analýza závislosti dvoch veličín

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>1.</strong> Analýza závislosti <strong>dvoch</strong> veličín<br />

Pri spracovaní dát sa veľmi často stretávame s úlohou zistiť, či dve náhodné veličiny sú<br />

stochasticky nezávislé. Napr. nás môže zajímať, či v sledovanej populácii je farba očí a farba<br />

vlasov nezávislá alebo či počet dní práceneschopnosti a vek pracovníka sú nezávislé.<br />

Vzťah jednej veličiny k druhej, resp.závistlosť jednej veličiny na druhej (regresia), je<br />

možné zo súčasne meraných, pozorovaných dát. Ak sa predpokladá, že medzi dvoma<br />

premennými existuje väzba ktorej silu vyjadruje spoločný rozptyl (kovariancia), týchto<br />

premenných, je možné pomocou tejto informácie aproximovať jednu premennú, pomocou<br />

druhej a vytvoriť regresný model (RM), regresnú závislosť premenných. Regresné modely<br />

umožňujú lepšie, hlbšie poznanie spoznanie skúmaných javov v súvislostiach, pomocou<br />

vzťahov medzi premennými. Vhodnosť typu regesného modelu sa hodnotí pomocou<br />

korelácie, t.j. číselného vyjadrenia tesnosti, pevnosti väzby medzi premennými. Korelácia sa<br />

hodnotí podľa vybraných kritérií, z ktorých najúčinnejšie je číselné vyjadrenie pomocou<br />

koeficientu korelácie.<br />

Voľba vhodného typu závislosti vychádza z bodového diagramu, t.j. na začiatku<br />

spracovania dvojrozmerného súboru dát je potrebné vyniesť do grafu dvojice hodnôt {x i , y i }<br />

a z neho odhadnúť možný priebeh závislosti. Pri skúmaní závilsoti sa riešia dve základné<br />

úlohy:<br />

<strong>1.</strong> určenie typu regresného modelu sa označuje ako regresná úloha,<br />

2. zisťovanie sily vzťahu medzi premennými, korelačná úloha korelačného počtu.<br />

Podľa toho, koľko nezávisle premenných sa berie pri riešení korelačného počtu do úvahy,<br />

sa hovorí o:<br />

• jednoduchej alebo párovej korelácii (korelácii <strong>dvoch</strong> premenných), ak sa uvažuje len<br />

s jednou nezávisle premennou,<br />

• viacnásobnej korelácii, ak je počet uvažovaných nezávisle premenných väčších ako<br />

jedna.<br />

<strong>1.</strong>1 Určenie typu regresného modelu (regresná úloha)<br />

<strong>1.</strong><strong>1.</strong>1 Jednoduchá lineárna regresia – lineárny regresný model<br />

Ak po vynesení hodnôt {x i , y i } má bodový diagram trend priamej závislosti (jednotlivé<br />

body ležia na priamke (Y´ = B 0 + B 1 X) alebo sa od nej nepatrne odchyľujú), bodovým<br />

odhadom tejto regresnej priamky je y´j = b 0 + b 1 x j a táto závislosť je najlepším odhadom<br />

lineárneho regresného modelu.<br />

Konštanta b 0 pri grafickom zobrazení regresnej priamky určuje bod, v ktorom priamka<br />

pretína os y. Koeficient b 0 posúva priamku v prietore, preto sa nazýva aj lokujúcou<br />

konštantou.<br />

Koeficient b 1 , je smernica regresnej priamky a udáva, o koľko merných jednotiek sa<br />

v priemere zmení závisle premenná, ak sa nezávisle premenná zmení o jednu mernú jednotku.<br />

Práve tento koeficient dáva informácie o priebehu závislosti a nazýva sa regresným<br />

koeficientom.


Koeficienty b 0 , b 1 sa určia metódou najmenších štvorcov a ich vyjadrenie je možné<br />

zapísať v tvare<br />

b<br />

1<br />

x<br />

x.<br />

y<br />

b0<br />

y b1<br />

x<br />

a bodový odhad priamky je možné vyjadriť v tvare y<br />

xy<br />

2<br />

x<br />

2<br />

j<br />

n<br />

1<br />

x<br />

j<br />

n<br />

j<br />

1<br />

x<br />

x<br />

j<br />

y<br />

x<br />

j<br />

2<br />

y<br />

,<br />

y<br />

b<br />

x<br />

x<br />

j 1 j<br />

.<br />

Uvedený popis lineárnej závislosti platí pre prípad že, Y je závisle a X nezávisle<br />

premennou. Medzi znakmi však môže byť závilosť aj X od Y. Túto závislosť chrakterizuje<br />

priamka X´ = A 0 + A 1 Y a jej odhadom je priamka x´j = a 0 + a 1 y j . Pri výpočte koeficientov a 0<br />

a a 1 sa postupuje analogicky ako pri výpočte koeficientov b 0 a b <strong>1.</strong> Ak existuje obojstranná<br />

závislosť priamky sa nazývajú združené regresné priamky (lineárne regresné modely oboch<br />

typov tvoria združené regresné modely) a ich regresné koeficienty združené regresné<br />

koeficienty. Lineárne regrsné priamky (modely) spolu vytvárajú tzv. korelačné nožnice. Čím<br />

sú viac otvorené závislosť je menšia, a naopak.<br />

<strong>1.</strong><strong>1.</strong>2 Nelineárna regresia – nelineárny regresný model<br />

Ak závislosť medzi premennými Y a X nie je lineárna, vyjadrí sa jej priebeh vhodnou<br />

nelineárnou regresnou funkciou, pričom sa môžu použiť nelineárne funkcie s dvomi alebo<br />

viacerými parametrami.


Koeficienty nelineárneho regresného modelu je možné určiť priamo pomocou metódy<br />

najmenších štvorcov, alebo nepriamo použitím transformácie na lineárnu funkciu.<br />

Najčastejšie používané nelineárne funkcie s dvoma parametrami je možné transformovať na<br />

funkciu, ktorej odhadom je regresná funkcia w´j = b 0 + b 1 z j ,<br />

kde w = g(y),<br />

z = g (x),<br />

w, z sú transformované funkcie g(y) a g(z).<br />

Na uvedený tvar w´j = b 0 + b 1 z j je možné transformovať napr.:<br />

b1<br />

• hyperbolu <strong>1.</strong> stupňa y<br />

j<br />

b0<br />

x<br />

transformácia:<br />

• hyperbolu<br />

y<br />

j<br />

z<br />

b<br />

0<br />

1<br />

x<br />

1<br />

b x<br />

1<br />

transformácia: y<br />

z<br />

• logaritmickú funkciu y<br />

transformácia: z = ln x<br />

• exponenciálne krivky:<br />

x<br />

a a<br />

j<br />

y<br />

j 0 1<br />

1<br />

j<br />

j<br />

b<br />

0<br />

j<br />

b ln x<br />

1<br />

j<br />

transformácia: w = log y, z = xj, po transformácii sa získa funkcia log y = log a 0 +<br />

z.log a 1 , b 0 = log a 0 , b 1 = log a 1<br />

b1<br />

y a<br />

j 0x j<br />

transformácia: w = log y, z = log x, funkcia: log y = log a 0 + b 1 .log x, b 0 = log a 0<br />

b1<br />

/ x<br />

y a e<br />

j<br />

j<br />

0<br />

transformácia: w = ln y, z =1/x, funkcia: ln y = ln a 0 + a 1 /x b 0 = ln a 0 ,<br />

b1<br />

. x<br />

y a e<br />

j<br />

j<br />

0<br />

transformácia: w = ln y, z =x, funkcia: ln y = ln a 0 + a <strong>1.</strong> x b 0 = ln a 0<br />

Ak sa uskutoční lineárna transformácia ďalší postup je ako pri lineárnej závislosti. Pri<br />

voľbe typu funkcie, je dôležité zvoliť funkciu, ktorá je najpriliehavejšia, t.j. najlepšie<br />

vystihuje priebeh závislosť premennej Y od premennej X. Od voľby správneho typu regesnej<br />

funkcie závisí, do akej miery vystihne vzťah medzi premennými, a teda rozhodnutiu aký typ<br />

funkcie sa zvolí, je potrebné venovať veľkú pozornosť.<br />

Pri voľbe typu regresnej funkcie (regesného modelu) sa musí spájať znalosť priebehu<br />

jednotlivých typov kriviek s informáciami o skúmanom jave a rozložení empirických údajov.<br />

Pritom zvyčajne pomáha zobrazenie bodového diagramu. Typ regresnej funkcie sa volí tak,<br />

aby čo najpresnejšie vyhovovala rozloženiu bodov v diagrame a logickým súvislostiam<br />

daných javov. Pre lepšiu orientáciu sú na nasledujúcich obrázkoch znázornené niektoré<br />

používané typy kriviek.<br />

Výber najvhodnejšieho typu regresnej funkcie (regesného modelu) nemusí byť vždy<br />

zrejmý od prvej chvíle, preto sa za najvhodnejší považuje ten:<br />

• ktorý je najlogickejší,


• pri ktorom sa rozdelenie reziduálnych odchýlok blíži najviac k normálnemu<br />

rozdeleniu,<br />

• ktorý zabezpečuje že rozdelenie reziduálnych odchýlok bude mať približne rovnakú<br />

variabilitu,<br />

• pri ktorom sô reziduálne odchýlky najmenšie,<br />

• ktorý vykazuje najväčšiu tesnosť závislostí,<br />

• ktorý je najjednoduchšou krivkou.<br />

<strong>1.</strong>2 Korelačná úloha<br />

<strong>1.</strong>2.1 Párová korelácia<br />

Rozpoznanie stupňa závislosti premennej Y od premennej X je dôležitá úloha. Čím je<br />

stupeň závislosti medzi premennými vyšší, tým je väčšia aj vypovedacia sila regresnej funkcie<br />

(regresného modelu). Stupeň závislosti medzi premennými charakterizujú miery tesnosti<br />

štatistickej závislosti. Tieto sa pohybujú v pevne stanovenom intervale a v rámci tohto<br />

intervalu rastú so stupňom závilsosti. Sú nezávislé od veľkosti hodnôt skúmaných znakov ani<br />

od používaných jednotiek. To umožňuje z ich veľkosti priamo usudzovať o stupni závislosti<br />

a porovávať miery tesnosti štatistickej závislosti za rôzne štatistické súbory.<br />

Korelačný pomer je odmocnina z podielu súčtu štvorcov odchýlok podmienených<br />

priemerov závisle premennej od jej celkového priemeru a celkového súčtu štvorcov odchýlok<br />

od tejto premennej. Nadobúda hodnoty od 0 do <strong>1.</strong> Čím je taký koeficient bližší 1, tým je<br />

závislosť medzi danými dvomi veličinami silnejšia a čím je bližší 0, tím je slabšia. Korelačný<br />

pomer je najvšeobecnejšou mierou tesnosti štatistickej závislosti, ktorú je možné počítať bez<br />

ohľadu na to, či sa už riešila regresná úloha.<br />

yx<br />

m<br />

2<br />

yi<br />

i 1<br />

m n<br />

i 1 i 1<br />

n<br />

y<br />

i<br />

2<br />

ij<br />

ny<br />

2<br />

ny<br />

2<br />

n<br />

m<br />

j 1<br />

i 1<br />

n<br />

m<br />

n<br />

n<br />

i 1 j 1<br />

i<br />

i<br />

n<br />

y<br />

i<br />

y<br />

ij<br />

2<br />

ij<br />

2<br />

m n<br />

i 1 j 1<br />

m n<br />

i 1 j 1<br />

i<br />

y<br />

y<br />

ij<br />

ij<br />

2<br />

2<br />

Index determinácie je podiel súčtu štvorcov odchýlok teoretických hodnôt od celkového<br />

priemeru závisle premennej k celkovému súčtu štvorcov jej odchýlok. Ako miera tesnosti<br />

štatistickej závislosti sa používa druhá odmocnina indexu determinácie a nazýva sa index<br />

korelácie.<br />

i<br />

yx<br />

m<br />

ni<br />

i 1<br />

m n<br />

i 1 j 1<br />

i<br />

y<br />

y<br />

i<br />

ij<br />

y<br />

y<br />

2<br />

2<br />

pre triedené údaje


i<br />

yx<br />

m<br />

n<br />

i<br />

i 1<br />

n<br />

j 1<br />

y<br />

y<br />

j<br />

i<br />

y<br />

y<br />

2<br />

2<br />

pre netriedené údaje<br />

Index korelácie charakterizuje stupeň závislosti premennej Y od X za predpokladu, že jej<br />

priebeh vystihuje regresná funkcia (regresný model). Hodnoty ktoré nadobúda a spôsob<br />

hodnotenia závislostí je analogický ako v prípade korelačného pomeru. Využíva sa vtedy, keď<br />

sa hodnotí vhodnosť nelineárnej regresnej funkcie (regresného modelu).<br />

Koeficient korelácie hodnotí mieru lineárnej štatistickej závislosti. Nadobúda hodnoty<br />

z intervalu (-1,1) a používa sa aj ako miera tesnosti závislosti transformovaných premenných.<br />

Výpočet sa realizuje z netriedených premenných. Na hodnotenie vhodnosti regesného modelu<br />

2<br />

sa využíva aj druhá mocnina koeficienta korelácie tzv. koeficient determinácie r<br />

xy<br />

.<br />

Koeficient korelácie je možné vypočítať viacerými spôsobmi:<br />

• ako súčin niektorého zo združených regresných koeficientov a podielu smerodajnej<br />

odchýlky nezávisle premennej ku smerodajnej odchýlke závisle premennej<br />

s s<br />

x y<br />

ryx<br />

b1<br />

a1<br />

s s<br />

y<br />

x<br />

• ako podiel kovariancie premenných X aY a ich smerodajných odchýlok<br />

cov xy xy x.<br />

y<br />

ryx<br />

s s s s<br />

x<br />

y<br />

x<br />

y<br />

• koeficient korelácie je geometrickým priemerom zo združených regresných<br />

koeficientov.<br />

r yx<br />

a 1<br />

b 1<br />

Koeficient korelácie má nasledovné vlastnosti:<br />

• meria tesnosť závislosti medzi X a Y obojstranne, t.j. Y od X, ale súčasne X od Y,<br />

• môže byť kladný ale aj záporný, pričom jeho znamienko vyjadruje charakter<br />

závislosti: ak je závilsosť priama, má koeficient korelácie kladné znamienko, pri<br />

nepriamej závislosti je záporný.


<strong>1.</strong>3 Testovanie hypotézy o nezávislosti<br />

Testujeme H 0 : ρ = 0 proti obojstrannej alternatíve H 1 : ρ ≠ 0 (resp. proti ľavostrannej<br />

alternatíve H 1 : ρ < 0 resp. proti pravostranné alternatíve H 1 : ρ > 0). Testovacie kritérium má<br />

R12<br />

n 2<br />

tvar: T . Ak platí nulová hypotéza, potom T ~ t(n-2). Kritický obor pre test H 0<br />

2<br />

1 R<br />

12<br />

proti obojstrannej alternatíve: W , t1 / 2 n 2 t1<br />

/ 2 n 2 , , proti<br />

ľavostrannej alternatíve: W , t1 n 2 a proti pravostrannej alternatíve:<br />

W t 1 n 2 , . H 0 zamietame na hladine významnosti α, keď T W .<br />

Príklad 7.1: Máme k dispozícii výsledky testov z <strong>dvoch</strong> predmetov zistených u ôsmich<br />

náhodne vybraných študentov určitého odboru.<br />

Číslo študenta 1 2 3 4 5 6 7 8<br />

Počet bodov v <strong>1.</strong> teste 80 50 36 58 42 60 56 68<br />

Počet bodov v 2. teste 65 60 35 39 48 44 48 61<br />

Na hladine významnosti 0,05 testujte hypotézu, že výsledky oboch testov nie sú kladne<br />

korelované.<br />

Riešenie: Najprv sa musíme presvedčiť, že uvedené výsledky je možné považovať za<br />

realizácie náhodného výberu z dvojrozmerného normálneho rozdelenia. Je možné tak učiniť<br />

orientačne pomocou dvojrozmerného bodového diagramu. Body by mali vytvoriť elipsovitý<br />

obrazec.<br />

100<br />

80<br />

60<br />

Y<br />

40<br />

20<br />

0<br />

0 20 40 60 80 100 120<br />

X<br />

Obrázok svedčí o tom, že predpoklad dvojrozmernej normality je oprávnený a že medzi<br />

počtami bodov z <strong>1.</strong> a 2. testu bude existovať určitý stupeň priamej lineárnej závislosti.<br />

Testovaná je H 0 : ρ = 0 proti pravostrannej alternatíve H 1 : ρ > 0.<br />

Výpočtom sa zistí: R 12 = 0,6668, T = 2,1917. V tabuľkách sa nájde t 0,95 (6) = 1,9432.<br />

Kritický obor: W 1,9432 ; . Pretože T W , hypotézu o neexistenci kladnej korelácie<br />

výsledkov z <strong>1.</strong> a 2. testu zamietame na hladine významnosti 0,05.


<strong>1.</strong>3.1 Porovnanie koeficientu korelácie s danou konštantou<br />

Ak c je reálna konštanta. Testuje sa H 0 : ρ = c proti H 1 : ρ ≠ c. (Tento test sa vykonáva<br />

napr. vtedy, ak experimentátor porovnáva vlastnosti svojich dát s vlastnosťami uvádzanými<br />

1 1 c c<br />

v literatúre.) Test je založený na testovacom kritériu U Z ln<br />

n 3 ,<br />

2 1 c 2 n 1<br />

ktorá má za platnosti H 0 pre n ≥ 10 asymptoticky rozdelenie N(0,1), pričom Z<br />

1 1 R12<br />

ln<br />

2 1 R12<br />

je tzv. Fisherova Z-transformácia. Kritický obor pre test H 0 proti obojstrannej alternatíve teda<br />

je W , u1 / 2 u1<br />

/ 2,<br />

. H 0 sa zamieta na asymptotickej hladine významnosti α,<br />

keď U W .<br />

Príklad 7.2: V 600 vzorkách rudy bol stanovený obsah železa dvoma analytickými<br />

metódami s výberovým koeficientom korelácie 0,85. V literatúre sa uvádza, že koeficient<br />

korelácie týchto <strong>dvoch</strong> metód má byť 0,9. Na asymptotickej hladine významnosti 0,05 testujte<br />

hypotézu<br />

H 0 : ρ = 0,9 proti H 1 : ρ ≠ 0,9.<br />

1 1 0,85<br />

Riešenie: Z ln 1, 2562,<br />

2 1 0,85<br />

1 1 0,9 0,9<br />

U 1,2562 ln<br />

600 3 5,2976 , u 0,975 = 1,96,<br />

2 1 0,9 2 600 1<br />

W , 1,96 1,96, . Pretože U W , H 0 zamietame na asymptotickej hladine<br />

významnosti 0,05.<br />

<strong>1.</strong>3.2 Porovnanie <strong>dvoch</strong> korelačných koeficientov<br />

Ak sú dané dva nezávislé náhodné výbery o rozsahoch n a n * z dvojrozmerných<br />

normálnych rozdelení s korelačnými koeficientmi ρ a ρ * . Testuje sa H 0 : ρ = ρ * proti H 1 : ρ ≠<br />

ρ * . Označí sa R 12 výberový korelačný koeficient <strong>1.</strong> výberu a R *<br />

12 výberový korelační<br />

koeficient<br />

*<br />

1 1 R12<br />

* 1 1 R12<br />

2. výberu. Položí sa Z ln a Z ln . Ak platí H<br />

*<br />

0 , potom testovacie<br />

2 1 R 2 1 R<br />

kritérium<br />

1<br />

n 3<br />

*<br />

1<br />

*<br />

n 3<br />

12<br />

Z Z<br />

U má asymptoticky rozdelenie N(0,1). Kritický obor pre test H 0 proti<br />

obojstrannej alternatíve je W , u1 / 2 u1<br />

/ 2,<br />

. H 0 sa zamieta na asymptotickej<br />

hladine významnosti α, ak U W .<br />

Príklad 7.3: Lekársky výskum sa zaoberal sledovaním koncentrácii látok A a B v moči<br />

pacientov trpiacich určitou obličkovou chorobou. Pri 100 zdravých jedincoch bol výberový<br />

korelačný koeficient medzi koncentráciami oboch látok 0,65 a v prípade 142 osôb trpiacich<br />

zmienenou chorobou bol 0,37. Na asymptotickej hladine významnosti 0,05 testujte hypotézu,<br />

že korelačné koeficienty v oboch skupinách sa nelíšia.<br />

12


Riešenie:<br />

1 1 0,65<br />

* 1 1 0,37<br />

Z ln 0,7753, Z ln 0,3884 ,<br />

2 1 0,65<br />

2 1 0,37<br />

0,7753 0,3884<br />

U<br />

2,9242 , u 0,975 = 1,96, W , 1,96 1,96,<br />

.<br />

Pretože<br />

1<br />

100<br />

3<br />

1<br />

142<br />

3<br />

U W , H 0 sa zamieta na asymptotickej hladine významnosti 0,05.<br />

<strong>1.</strong>3.3 Interval spoľahlivosti pre korelačný koeficient<br />

V prípade že, dvojrozmerný náhodný výber rozsahu n pochádza z dvojrozmerného<br />

normálneho rozdelenia, ktorého korelačný koeficient sa príliš nelíši od nuly (│ρ│ < 0,5) a<br />

rozsah výberu je dostatočne veľký (n ≥ 100), 100(1-α)% interval spoľahlivosti pre ρ má<br />

2<br />

1 R12<br />

medze R12 u1<br />

/ 2 .<br />

n 3<br />

Ak nie sú uvedené podmienky splnené, potom nie je možné tento vzorec použiť, pretože<br />

rozdelenie výberového korelačného koeficientu je príliš zošikmené. V takom prípade sa<br />

využije to, že náhodná veličina Z<br />

1 1 R12<br />

ln má i pri malom rozsahu výberu približne<br />

2 1 R12<br />

normálne rozdelenie so strednou hodnotou E Z<br />

1 1<br />

ln<br />

(2. sčítanec je možné<br />

2 1 2 n 1<br />

pri väčšom n zanedbať) a rozptylom D Z<br />

1<br />

. Štandardizáciou veličiny Z sa získa<br />

n 3<br />

veličina U<br />

Z E(Z)<br />

, ktorá má asymptoticky rozdelenie N(0,1). Teda 100(1-α)%<br />

D(Z)<br />

1 1<br />

asymptotický interval spoľahlivosti pre ln bude mať medze<br />

2 1<br />

spoľahlivosti pre ρ potom sa získa spätnou transformáciou.<br />

Z<br />

u<br />

1<br />

n<br />

/ 2<br />

. Interval<br />

3<br />

Vzhľadom na to, že Z = arctgh R 12 , dostaneme R 12 = tgh Z a medze intervalu<br />

x x<br />

u1<br />

/ 2<br />

e e<br />

spoľahlivosti pre ρ je možné napísať v tvare tgh Z , pričom tgh x .<br />

x x<br />

n 3<br />

e e<br />

Príklad 7.4: Pracovník personálneho oddelenia určitej firmy skúma, či existuje vzťah<br />

medzi počtom dní absencie za rok (veličina Y) a vekom pracovníka (veličina X). Preto<br />

náhodne vybral údaje o 10 pracovníkoch.<br />

Č. prac. 1 2 3 4 5 6 7 8 9 10<br />

X 27 61 37 23 46 58 29 36 64 40<br />

Y 15 6 10 18 9 7 14 11 5 8<br />

Za predpokladu, že uvedené údaje tvoria číselné realizácie náhodného výberu rozsahu 10<br />

z dvojrozmerného normálneho rozdelenia, vypočítajte výberový korelačný koeficient a na<br />

hladine významnosti 0,05 testujte hypotézu, že X a Y sú nezávislé náhodné veličiny. Zostrojte<br />

95% asymptotický interval spoľahlivosti pre skutočný korelačný koeficient ρ.


Riešenie: Predpoklad o dvojrozmernej normalite dát overíme orientačne pomocou<br />

dvojrozmerného bodového diagramu.<br />

30<br />

25<br />

20<br />

15<br />

Y<br />

10<br />

5<br />

0<br />

-5<br />

-10<br />

-20 0 20 40 60 80 100<br />

X<br />

Vzhľad diagramu svedčí o tom, že predpoklad je oprávnený.<br />

Testujeme H 0 : ρ = 0 proti H 1 : ρ ≠ 0. Vypočítame R 12 = -0,9325, teda medzi vekom<br />

pracovníka a počtom dní pracovnej neschopnosti existuje silná nepriama lineárna závislosť.<br />

Testovacie kritérium: T = -7,3053, kvantil t 0,975 (8) = 2,306, kritický obor<br />

W , 2,306 2,306, . Vzhľadom k tomu, že T W , zamietame na hladine<br />

významnosti 0,05 hypotézu o nezávislosti veličín X a Y.<br />

1 1 R12 1 1 0,9325<br />

Vypočítame Z ln ln<br />

1, 6772 . Medze 95% asymptotického<br />

2 1 R 2 1 0,9325<br />

12<br />

intervalu spoľahlivosti pre ρ sú tgh 1,6772<br />

1,96<br />

7<br />

, teda -0,9842 < ρ < -0,7336<br />

s pravdepodobnosťou približne 0,95.<br />

Testovanie hypotézy o nezávislosti sa vykonáva rôznymi spôsobmi podľa toho, akého<br />

typu sú dané náhodné veličiny – či sú nominálne, ordinálne, intervalové alebo pomerové.<br />

Koeficientom korelácie sa hodnotí miera štatistickej závislosti intervalových, pomerových<br />

veličín. Nasledovne budú uvedené hodnotenia miery štatistickej závislosti a testy nezávislosti<br />

nominálnych a ordinálnych veličín.<br />

<strong>1.</strong>3.4 Testovanie nezávislosti nominálnych veličín<br />

Ak X,Y sú dve nominálne náhodné veličiny (tj. obsahová interpretácia je možná len pri<br />

relácii rovnosti). Ak X nadobúda hodnoty x [1] , ..., x [r] a Y nadobúda hodnoty y [1] , ..., y [s] .<br />

Získame dvojrozmerný náhodný výber rozsahu n z rozdelenia, ktorým sa riadi dvojrozmerný<br />

diskrétny náhodný vektor (X, Y). Zistené absolútne početnosti n jk dvojice hodnôt (x [j] , y [k] )<br />

usporiadame do kontingenčnej tabuľky:<br />

y y [1] ... y [s] n j.<br />

x n jk<br />

x [1] n 11 ... n 1s n <strong>1.</strong><br />

... ... ... ...


x [r] n r1 ... n rs n r.<br />

n .k n .1 ... n .s n<br />

Testuje sa hypotéza H 0 : X, Y sú stochasticky nezávislé náhodné veličiny proti<br />

H 1 : X, Y nie sú stochasticky nezávislé náhodné veličiny. Testovacie kritérium TK má tvar:<br />

K<br />

1)(s-1)).<br />

r<br />

s<br />

j 1 k 1<br />

n<br />

jk<br />

j.<br />

n<br />

n<br />

j.<br />

n<br />

n<br />

n n<br />

. k<br />

.k<br />

2<br />

. Ak platí H 0 , potom K sa asymptoticky riadi rozdelením χ 2 ((r-<br />

Hypotézu o nezávislosti veličín X, Y teda zamietame na asymptotickej hladine<br />

významnosti α, ak TK (K) ≥ KH (χ 2 1-α((r-1)(s-1))).<br />

Podmienky dobrej aproximácie<br />

n<br />

j.<br />

n.<br />

k<br />

Výraz sa nazýva teoretická početnosť. Rozdelenie testovacieho kritéria K je<br />

n<br />

možné aproximovať rozdelením χ 2 ((r-1)(s-1)), pokiaľ teoretické početnosti aspoň v 80%<br />

prípadoch nadobúdajú hodnoty väčšie alebo rovné 5 a v ostatných 20% neklesnú pod 2. Ak<br />

nie je splnená podmienka dobrej aproximácie, odporúča sa zlučovanie niektorých hodnôt.<br />

Meranie sily závislosti<br />

K<br />

Cramérov koeficient: V<br />

, kde m = min{r,s}. Tento koeficient nadobúda<br />

n(m 1)<br />

hodnoty medzi 0 a <strong>1.</strong> Čím bližšie je k 1, tým je tesnejšia závislosť medzi X a Y, čím bližšie je<br />

k 0, tým je táto závislosť volnejšia.<br />

Príklad 7.5:<br />

V sociologickom prieskume bol z uchádzačov o štúdium na vysokých školách získaný<br />

náhodný výber rozsahu 360. Mimo iných sa zisťovala sociálna skupina, z ktorej uchádzač<br />

pochádza a typ školy, na ktorú sa hlási. Výsledky sú zaznamenané v kontingenčnej tabuľke:<br />

Typ školy Sociálna skupina n j.<br />

I II III IV<br />

univerzitný 50 30 10 50 140<br />

technický 30 50 20 10 110<br />

ekonomický 10 20 30 50 110<br />

n .k 90 100 60 110 360<br />

Na asymptotickej hladine významnosti 0,05 testujte hypotézu o nezávislosti typu školy a<br />

sociálnej skupiny. Vypočítajte Cramérov koeficient.<br />

Riešenie:<br />

Výpočet TK:


n 140 <strong>1.</strong><br />

n.1<br />

90 n<strong>1.</strong><br />

n.2<br />

140 100 n<strong>1.</strong><br />

n.3<br />

140 60 n<strong>1.</strong><br />

n.<br />

35,<br />

38,9,<br />

23,3,<br />

n 360 n 360<br />

n 360 n<br />

n2.<br />

n.1<br />

110 90 n2.<br />

n.2<br />

110 100 n2.<br />

n.3<br />

110 60 n2.<br />

n.<br />

4<br />

27,5,<br />

30,6,<br />

18,3,<br />

n 360 n 360<br />

n 360 n<br />

n2.<br />

n.1<br />

110 90 n2.<br />

n.2<br />

110 100 n2.<br />

n.3<br />

110 60 n2.<br />

n.<br />

4<br />

27,5,<br />

30,6,<br />

18,3,<br />

n 360 n 360<br />

n 360 n<br />

K<br />

2<br />

2<br />

2<br />

50 35 30 38,9 50 33,6<br />

<br />

35 38,9<br />

33,6<br />

76,84 ,<br />

Stanovenie KH:<br />

r = 3, s = 4, χ 2 0,95(6) = 12,6.<br />

140 110<br />

360<br />

110 110<br />

360<br />

110 110<br />

360<br />

42,8,<br />

33,6,<br />

33,6,<br />

Rozhodnutie. Pretože TK ≥ KH hypotézu o nezávislosti typu školy a sociálnej skupiny<br />

zamietame na asymptotickej hladine významnosti 0,05.<br />

76,4<br />

Cramérov koeficient: V 0, 3267 .<br />

360 2<br />

Štvorpolné tabuľky<br />

Ak r = s = 2. Potom sa hovorí o štvorpolnej kontingenčnej tabuľke a používa sa<br />

označenie: n 11 = a, n 12 = b, n 21 = c, n 22 = d.<br />

X Y n j.<br />

y [1] y [2]<br />

x [1] a b a+b<br />

x [2] c d c+d<br />

n .k a+c b+d n<br />

Pre túto tabuľku navrhol R. A. Fisher presný (exaktný) test nezávislosti známy ako<br />

Fisherov faktoriálový test. STATISTICA poskytuje p-hodnotu pre tento test. Ak je výsledok p<br />

≤ α, potom hypotézu o nezávislosti zamietame na hladine významnosti α.<br />

ad<br />

V štvorpolných tabuľkách sa používa charakteristika OR , ktorá sa nazýva podiel<br />

bc<br />

šancí (odds ratio). Je možné si predstaviť, že pokus sa vykonáva za nerovnakých okolností a<br />

môže skončiť buď úspechom alebo neúspechom.<br />

Výsledok okolnosti n j.<br />

pokusu I<br />

II<br />

úspech a b a+b<br />

neúspech c d c+d<br />

n .k a+c b+d n<br />

Pomer počtu úspechov k počtu neúspechov (tzv. šance) za <strong>1.</strong> okolností je c<br />

a , za druhých<br />

b ad<br />

okolností je . Podiel šancí je OR . Pomocou 100(1-α)% asymptotického intervalu<br />

d bc<br />

spoľahlivosti pre podiel šancí je možné na asymptotickej hladine významnosti α testovať


hypotézu o nezávislosti nominálnych veličín X a Y. Asymptotický 100(1-α)% interval<br />

spoľahlivosti pre prirodzený logaritmus skutočného podielu šancí má medze:<br />

1 1 1 1<br />

ln OR<br />

u 1 / 2 . Ak po odlogaritmovaní nezahrnie interval spoľahlivosti 1,<br />

a b c d<br />

potom hypotézu o nezávislosti zamietneme na asymptotickej hladine významnosti α.<br />

Príklad 7.6:<br />

V prípade 135 uchádzačov o štúdium na istú fakultu bol hodnotený dojem, akým<br />

zapôsobili na komisiu na ústnej prijímacej skúške. Na asymptotickej hladine významnosti<br />

0,05 testujte hypotézu, že prijatie na fakultu nezávisí od zanechaného dojmu na prijímacej<br />

skúške.<br />

prijatí dojem n j.<br />

dobrý zlý<br />

áno 17 11 28<br />

nie 39 58 97<br />

n .k 56 69 125<br />

Riešenie:<br />

ad 17 58<br />

1 1 1 1 1 1 1 1<br />

OR 2,298, ln OR 0,832,<br />

0,439, u 0,975<br />

bc 11 39<br />

a b c d 17 11 39 58<br />

ln d 0,832 0,439 1,96 0,028, ln h 0,832 0,439 1,96 1,692<br />

0,028<br />

1,692<br />

d e 0,972, h e 5,433<br />

Pretože interval (0,972; 5,433) obsahuje číslo 1, na asymptotickej hladine významnosti<br />

0,05 nezamietame hypotézu o nezávislosti dojmu na prijímacej skúške a prijatie na fakultu.<br />

1,96<br />

<strong>1.</strong>3.5 Testovanie nezávislosti ordinálnych veličín<br />

Ak X,Y sú dve ordinálne náhodné veličiny (tj. obsahová interpretácia je možná len<br />

v prípade relácie rovnosti a relácie usporiadania). Získame dvojrozmerný náhodný výber<br />

(X 1 , Y 1 ), ..., (X n , Y n ) z rozdelenia, ktorým sa riadi náhodný vektor (X, Y). Označíme R i<br />

poradie náhodnej veličiny X i a Q i poradie náhodnej veličiny Y i , i = 1, ..., n. Testujeme<br />

hypotézu H 0 : X, Y sú poradovo nezávislé náhodné veličiny proti obojstrannej alternatíve H 1 :<br />

X, Y sú poradovo závislé náhodné veličiny (resp. proti ľavostrannej alternatíve H 1 : medzi X a<br />

Y existuje nepriama poradová závislosť resp. proti pravostrannej alternatíve H 1 : medzi X a Y<br />

existuje priama poradová závislosť).<br />

Testovacie kritérium sa nazýva Spearmanov koeficient poradovej korelácie a má tvar:<br />

n<br />

6<br />

2<br />

r S 1<br />

R<br />

2<br />

i Qi<br />

.<br />

n n 1<br />

i 1<br />

H 0 sa zamieta na hladine významnosti α<br />

a) v prospech obojstrannej alternatívy, ak │r S │≥ r S,1-α (n)<br />

b) v prospech ľavostrannej alternatívy, ak r S ≤ - r S,1-α (n)<br />

c) v prospech pravostrannej alternatívy, ak r S ≥ r S,1-α (n), kde r S,1-α (n) je kritická hodnota,<br />

ktorá sa pre α = 0,05 alebo 0,01 a n ≤ 30 nájde v tabuľkách. Pre n > 30 H 0 sa zamieta na


asymptotickej hladine významnosti α v prospech obojstrannej alternatívy, ak<br />

(analogicky pre jednostranné alternatívy).<br />

r<br />

S<br />

u<br />

1<br />

n<br />

1<br />

Spearmanov koeficient r S súčasne meria silu poradovej závislosti náhodných veličín X,<br />

Y. Nadobúda hodnoty z intervalu 1 , 1 . Čím je jeho hodnota bližšia -1 (resp.1), tým je<br />

silnejšia nepriama (resp. priama) poradová závislosť veličín X, Y. Čím je jeho hodnota bližšia<br />

0, tým je slabšia poradová závislosť veličín X, Y.<br />

Príklad 7.7:<br />

Dva lekári hodnotili stav siedmich pacientov po rovnakom chirurgickom zákroku.<br />

Postupovali tak, že najvyššie poradie dostal najťažší prípad.<br />

Číslo pacienta 1 2 3 4 5 6 7<br />

Hodnotenie <strong>1.</strong> lekára 4 1 6 5 3 2 7<br />

Hodnotenie 2. lekára 4 2 5 6 1 3 7<br />

Vypočítajte Spearmanov koeficient r S a na hladine významnosti 0,05 testujte hypotézu, že<br />

hodnotenie oboch lekárov sú poradovo nezávislé.<br />

r<br />

Riešenie:<br />

Výpočet TK:<br />

6<br />

2<br />

2<br />

1 4 4 1 2 6<br />

2<br />

7 7 1<br />

Stanovenie KH:<br />

Kritická hodnota: r S,0,95 (7) = 0,745.<br />

2<br />

2<br />

2<br />

2<br />

2<br />

S 5 5 6 3 1 2 3 7 7 0,857 .<br />

Rozhodnutie:<br />

Pretože TK (0,857) ≥ KH (0,745), nulovú hypotézu zamietame na hladine významnosti<br />

0,05.


2. Úvod do indexnej analýzy<br />

Tato kapitola sa zaoberá porovnávaním ukazovateľov v dátových súboroch, ktoré sa líšia<br />

buď časovo alebo priestorovo alebo vecne. Najdôležitejšie je porovnávanie ukazovateľov<br />

z časového hľadiska. Pod pojmom ukazovateľ sa rozumie veličina, ktorá vypovedá o akejsi<br />

sociálne ekonomickej hromadnej skutočnosti. K uvedenému porovnávaniu veľmi často slúžia<br />

rôzne indexy. Budeme sa venovať konštruovaniu a interpretácii týchto indexov.<br />

Ukazovateľ a jeho druhy<br />

Ukazovateľ je veličina, ktorá charakterizuje sociálne ekonomický jav v určitom priestore<br />

a v určitom čase (okamih či interval).<br />

Príklady ukazovateľov: počet obyvateľov SR ku dňu 3<strong>1.</strong>12.2005, veľkosť HDP v SR v r.<br />

2005, počet sobášov v SR v r. 2005 atd.<br />

Rozlíšenie ukazovateľov z vecného hľadiska<br />

Extenzitný ukazovateľ: charakterizuje extenzitu skúmaného javu (napr. objem, veľkosť,<br />

množstvo). Je vyjadrený číslom v určitej mernej jednotke. Spravidla sa označuje q alebo Q<br />

(od slova quantum – množstvo).<br />

Príklady extenzitných ukazovateľov: rozloha poľnohospodárskej pôdy v SR v r. 2002,<br />

počet narodených detí v SR v r. 2005 atď.<br />

Intenzitní ukazovateľ: charakterizuje intenzitu sledovaného javu. Vzniká ako pomer<br />

<strong>dvoch</strong> extenzitných ukazovateľov, medzi ktorými existuje logický vzťah. Spravidla sa<br />

označuje p (od slova price – cena).<br />

Príklady intenzitných ukazovateľov: priemerná obytná plocha bytu pripadajúca na<br />

jedného obyvateľa SR v r. 2005, hektárový výnos pšenice v SR v r. 2002 atď.<br />

Samostatnú skupinu tvoria ukazovatele štruktúrne. Štruktúrny ukazovateľ je podielom<br />

jedného dielčieho ukazovateľa k celkovému ukazovateľu, ktorý je súčtom dielčích<br />

ukazovateľov. Je to bezrozmerné číslo, ktoré udáva, ako sa dielčí (logicky podriadený<br />

ukazovateľ) podieľa na celkovom ukazovateli (logicky nadriadenom). Nadobúda hodnoty<br />

medzi 0 a <strong>1.</strong><br />

Príklady štruktúrnych ukazovateľov: podiel mládeže do 18 rokov na celkovom počtu<br />

obyvateľov SR v r. 2005, podiel priemyslovej výroby v SR v r. 2002 na hrubom domácom<br />

produkte atď.<br />

Rozdelenie ukazovateľov z hľadiska rovnorodosti<br />

Rovnorodý ukazovateľ Extenzitný: jeho hodnoty je možné stanoviť súčtom. Napr. je<br />

možné spočítať tržby v maloobchode za jednotlivé mesiace, počty pracovníkov v jednotlivých<br />

závodoch podniku atď.<br />

Rovnorodý ukazovateľ intenzitný: vzniká ako podiel <strong>dvoch</strong> rovnorodých ukazovateľov<br />

extenzitných, napr. hektárový výnos určitej plodiny.<br />

Nerovnorodý ukazovateľ: nemá v jednotlivých častiach (priestorových, časových alebo<br />

vecných) rovnakú naturálnu podobu ako v celku. Zhrňovanie súčtom nemá logický zmysel.<br />

Napr. nerovnorodým extenzitným ukazovateľom je ukazovateľ objemu priemyslové<br />

produkcie Sr (automobily, uhlie, nábytok atď.)


Indexy, diferencie a ich typy<br />

2.3.<strong>1.</strong> Typy porovnávania hodnôt ukazovateľov<br />

Absolútne porovnávanie: pomocou diferencií. Diferencia je rozdiel <strong>dvoch</strong> hodnôt<br />

ukazovateľa.<br />

Relatívne porovnávanie: pomocou indexov. Index je podiel <strong>dvoch</strong> hodnôt ukazovateľa.<br />

2.3.2. Druhy porovnávania hodnôt ukazovateľov<br />

Časové porovnávanie: výsledkom sú časové indexy a diferencie (najdôležitejší druh<br />

porovnávania). Napr.: priemerná mesačná mzda pracovníkov v priemysle v % SR v r. 2005 a<br />

2004.<br />

Priestorové porovnávanie: výsledkom sú priestorové indexy a diferencie. Napr.:<br />

priemerná mesačná mzda pracovníkov v priemysle v r. 2005 v ČR a SR.<br />

Vecné porovnávanie: výsledkom sú vecné indexy a diferencie. Napi: priemerná mesačná<br />

mzda pracovníkov v priemysle a v poľnohospodárstve v SR v r. 2005.<br />

Indexy<br />

množstva<br />

úrovne<br />

súhrné<br />

individuálne<br />

súhrné<br />

individuálne<br />

jednoduché<br />

zložené<br />

jednoduché<br />

zložené<br />

Obr.: Schéma druhov indexov<br />

2.3.3. Rozdelenie indexov z hľadiska vecného obsahu<br />

Index množstva: porovnáva hodnoty extenzitného ukazovateľa v <strong>dvoch</strong> situáciách.<br />

Index úrovne: porovnáva hodnoty intenzitného ukazovateľa v <strong>dvoch</strong> situáciách.<br />

2.3.4. Rozdelenie indexov z hľadiska rovnorodosti<br />

Individuálny index: porovnáva hodnoty rovnorodého ukazovateľa v <strong>dvoch</strong> situáciách.<br />

Súhrnný index: hodnoty nerovnorodého ukazovateľa v <strong>dvoch</strong> situáciách.<br />

2.3.5. Rozdelenie indexov z hľadiska priestorového vymedzenia<br />

Jednoduchý index: porovnáva dve hodnoty rovnorodého ukazovateľa v jednom priestore.<br />

Zložený index: porovnáva dve hodnoty rovnorodého ukazovateľa vo viacerých<br />

priestoroch, v ktorých sa údaje pred vlastným porovnávaním musia zhrnúť.


2.4. Individuálne indexy a diferencie<br />

2.4.<strong>1.</strong> Jednoduché individuálne indexy a diferencie<br />

Ak q 1 je hodnota extenzitného ukazovateľa v bežnom období a q 0 v základnom období.<br />

q1<br />

Jednoduchý individuálny index množstva: I (q) (diferencia: Δ(q) = q 1 – q 0 ).<br />

q0<br />

Ak p 1 je hodnota intenzitného ukazovateľa v bežnom období a p 0 v základnom období.<br />

p1<br />

Jednoduchý individuálny index úrovne: I (p) (diferencia: Δ(p) = p 1 – p 0 ).<br />

p<br />

Príklad 8.1: Zaujíma nás vývoj ceny, predaného množstva a tržby za predaj masla<br />

v jednej predajni v mesiacoch september a október roku 1999. Údaje sú v tabuľke.<br />

Cena (Sk/kg) Predaj (kg) Tržba (Sk)<br />

september október september október september október<br />

88 94 142 128 12496 12032<br />

Riešenie: p 0 = 88, p 1 =94, I(p) = 94/88 = 1,068, tzn., že cena v októbri vzrástla oproti<br />

september o 6,8%, tj. o Δ(p) = 94 – 88 = 6 Sk za 1 kg.<br />

q 0 = 142, q 1 = 128, I(q) = 128/142 = 0,901, tzn., že predaj v októbri poklesol oproti<br />

septembru o 9,9%, tj. o Δ(q) = 128 – 142 = -14 kg<br />

Q 0 = 12496, Q 1 = 12032, I(Q) = 12032/12496 = 0,963, tzn., že tržba v októbri poklesla<br />

oproti septembru o 3,7%, tj. o Δ(Q) = 12032 – 12496 = -464 Sk.<br />

2.4.2. Bázické a reťazové indexy<br />

Ak existujú k dispozícii hodnoty ukazovateľa (napr. extenzitného) za n obdobie q 1 , q 2 , ...,<br />

q n , potom vývoj ukazovateľa je možné popísať radou za sebou idúcich individuálnych<br />

indexov, a to buď bázických nebo reťazových.<br />

Bázické indexy: jedno obdobie sa zvolí ako základné (najčastejšie prvé, tj, q B = q 1 ) a<br />

q 2 q3<br />

q n<br />

ostatné obdobia sa s ním porovnávajú: I2/<br />

B(q)<br />

,I3/<br />

B(q)<br />

, ,In / B(q)<br />

.<br />

q B q B<br />

q B<br />

Reťazové indexy: vznikajú porovnaním <strong>dvoch</strong> po sebe nasledujúcich členov rady:<br />

q 2 q3<br />

q n<br />

I2 /1(q)<br />

,I3/<br />

2 (q) , ,In<br />

1/ n (q) .<br />

q1<br />

q 2<br />

q n 1<br />

Vzťah medzi bázickými a reťazovými indexmi:<br />

I (q)<br />

I<br />

k / k<br />

1<br />

(q)<br />

I<br />

k / B<br />

k<br />

1/ B<br />

, k = 2, 3, ..., n<br />

(q)<br />

I 1<br />

k / B(q)<br />

IB<br />

1/ B(q)<br />

IB<br />

2 / B 1(q)<br />

Ik / k (q) , k = 2, 3, ..., n<br />

Príklad 8.2: V tabuľke sú uvedené údaje o spotrebe mäsa (v kg) na jedného obyvateľa<br />

SR v rokoch 1985 až 1990.<br />

rok 1985 1986 1987 1988 1989 1990<br />

spotreba 89,3 91,6 93,5 96,1 97,4 96,5<br />

Charakterizujte vývoj spotreby mäsa pomocou bázických a reťazových indexov.<br />

0


Riešenie:<br />

rok 1985 1986 1987 1988 1989 1990<br />

Bázické 1 1,026 1,047 1,076 1,091 1,081<br />

indexy<br />

Reťazové x 1,026 1,021 1,028 1,014 0,991<br />

indexy<br />

Interpretácia: Napr. v r. 1987 stúpla spotreba mäsa o 4,7% oproti roku 1985, ale len o<br />

2,1% oproti roku 1986.<br />

2.4.3. Zložené individuálne indexy a diferencie<br />

Máme dva extenzitné ukazovatele q, Q a jeden intenzitný ukazovateľ p = Q/q. Hodnoty<br />

ukazovateľov v základnom období sa označia q 0 , Q 0 , p 0 a v bežnom období q 1 , Q 1 , p 1 .<br />

Najčastejšie sa vykonáva časové porovnanie. Predpokladá sa, že údaje sú z priestorového<br />

alebo vecného hľadiska členené do n sfér. Pri výpočte zložených individuálnych indexov a<br />

diferencií sa vychádza z nasledujúcej tabuľky.<br />

Číslo<br />

sféry<br />

Ext. ukazovateľ q v<br />

období<br />

Ext. ukazovateľ Q v<br />

období<br />

Int. ukazovateľ p v<br />

období<br />

základnom bežnom základnom bežnom základnom bežnom<br />

1 q 0,1 q 1,1 Q 0,1 Q 1,1 p 0,1 p 1,1<br />

2 q 0,2 q 1,2 Q 0,2 Q 1,2 p 0,2 p 1,2<br />

... ... ... ... ... ... ...<br />

n q 0,n q 1,n Q 0,n Q 1,n p 0,n p 1,n<br />

I (<br />

Zložený individuálny index množstva:<br />

Q)<br />

n<br />

i 1<br />

n<br />

i 1<br />

Q<br />

Q<br />

1,i<br />

0,i<br />

Q<br />

Q<br />

1<br />

0<br />

n<br />

q1,i<br />

q<br />

i 1<br />

1<br />

I ( q)<br />

resp.<br />

n<br />

q0<br />

q<br />

Tieto indexy porovnávajú množstvo v bežnom období oproti množstvu v základnom<br />

období, a to cez všetky sféry.<br />

Odpovedajúce diferencie: q q1 q<br />

0,<br />

Q Q1<br />

Q0,<br />

Zložený individuálny index úrovne:<br />

I p<br />

n<br />

i 1<br />

n<br />

i 1<br />

Q<br />

Q<br />

1,i<br />

0,i<br />

n<br />

i 1<br />

n<br />

i 1<br />

q<br />

q<br />

1,i<br />

0,i<br />

n<br />

n<br />

i 1<br />

i 1<br />

p<br />

p<br />

1,i<br />

0,i<br />

q<br />

q<br />

1,i<br />

0,i<br />

n<br />

i 1<br />

n<br />

i 1<br />

q<br />

q<br />

1,i<br />

0,i<br />

V čitateli je celkový výnos zo všetkých sfér predelený množstvom zo všetkých sfér pre<br />

bežné obdobie. V menovateli sú tie isté veličiny, ale pre základné obdobie.<br />

p q<br />

p<br />

1<br />

0<br />

q<br />

1<br />

0<br />

q<br />

q<br />

1<br />

0<br />

i 1<br />

0,i


Odpovedajúce diferencie:<br />

p q<br />

1 1<br />

0 0<br />

p .<br />

q1<br />

q<br />

0<br />

p<br />

q<br />

Príklad 8.3: V tabuľke sú údaje o cenách, predaji a tržbách za čerstvé a stolové maslo<br />

v jednej predajni v septembri a októbri roku 1999.<br />

Druh<br />

Cena (Sk/kg) Predaj (kg) Tržba (Sk)<br />

masla september október september október september október<br />

čerstvé 88 94 142 128 12496 12032<br />

stolové 82 85 125 132 10250 11220<br />

celkom x x 267 260 22746 23252<br />

Pomocou zložených individuálnych indexov množstva a úrovne popíšte vývoj cien,<br />

predaja a tržby čerstvého a stolového masla celkom.<br />

Riešenie: Pre množstvo predaného masla: I(Σq) = 260/267 = 0,974, tzn., že množstvo<br />

predaného masla v októbri pokleslo oproti septembru o 2,6%, tj. o Δ(Σq) = 260 – 267 = -7 kg.<br />

Pre tržbu za predané maslo: I(ΣQ) = 23252/22746 = 1,022, tzn., že tržba v októbri vzrástla<br />

oproti septembru o 2,2%, tj. o Δ(ΣQ) = 23252 – 22746 = 506 Sk.<br />

23252<br />

Pre cenu: I p<br />

260<br />

1, 05, tzn., že priemerná cena masla vzrástla v októbri oproti<br />

22746<br />

267<br />

23252 22746<br />

septembru o 5%, tj. o p 4, 24 Sk.<br />

260 267<br />

2.1 Súhrnné indexy a diferencie<br />

Slúžia k relatívnemu resp. absolútnemu porovnaniu nerovnorodých extenzitných<br />

ukazovateľov. Pri ich výpočte sa vychádza z nasledujúcej tabuľky:<br />

Druh výrobku Množstvo výrobku (q) Cena (p) za jednotku<br />

Zákl. obdobie Bež. obdobie Zákl. obdobie Bež. obdobie<br />

1 q 0,1 q 1,1 p 0,1 p 1,1<br />

2 q 0,2 q 1,2 p 0,2 p 1,2<br />

... ... ... ... ...<br />

n q 0,n q 1,n p 0,n p 1,n<br />

2.5.<strong>1.</strong> Súhrnné indexy množstva<br />

Paascheho index množstva:<br />

I<br />

(P)<br />

(q)<br />

n<br />

i 1<br />

n<br />

i 1<br />

p<br />

p<br />

1,i<br />

1,i<br />

q<br />

q<br />

1,i<br />

0,i<br />

p q<br />

1<br />

p q<br />

1<br />

1<br />

0<br />

. Vyjadruje relatívnu zmenu<br />

objemu produkcie pri cenovej hladine odpovedajúcej bežnému obdobiu. Odpovedajúca<br />

P<br />

diferencia: q p1q1<br />

p1q<br />

0


Laspeyresov index množstva:<br />

I<br />

(L)<br />

(q)<br />

n<br />

i 1<br />

n<br />

i 1<br />

p<br />

p<br />

0,i<br />

0,i<br />

q<br />

q<br />

1,i<br />

0,i<br />

p<br />

p<br />

0<br />

0<br />

q<br />

q<br />

1<br />

0<br />

. Vyjadruje relatívnu zmenu<br />

objemu produkcie pri cenovej hladine odpovedajúcej základnému obdobiu. Odpovedajúca<br />

L<br />

diferencia: q p0q1<br />

p0q<br />

0<br />

2.5.2. Súhrnné indexy úrovne (ceny)<br />

Paascheho cenový index:<br />

I<br />

(P)<br />

(p)<br />

n<br />

i 1<br />

n<br />

i 1<br />

p<br />

p<br />

1,i<br />

0,i<br />

q<br />

q<br />

1,i<br />

1,i<br />

p q<br />

p<br />

1<br />

0<br />

q<br />

1<br />

1<br />

. Vyjadruje relatívnu zmenu ceny pri<br />

objeme produkcie odpovedajúcej bežnému obdobiu. Odpovedajúca diferencia:<br />

P<br />

p p q p q<br />

Laspeyresov cenový index:<br />

1<br />

1<br />

0<br />

1<br />

I<br />

(L)<br />

(p)<br />

n<br />

i 1<br />

n<br />

i 1<br />

p<br />

p<br />

1,i<br />

0,i<br />

q<br />

q<br />

0,i<br />

0,i<br />

p q<br />

p<br />

1<br />

0<br />

q<br />

0<br />

0<br />

. Vyjadruje relatívnu zmenu ceny<br />

pri objeme produkcie odpovedajúci základnému obdobiu. Odpovedajúca diferencia:<br />

L<br />

p p q p q<br />

1<br />

0<br />

0<br />

0<br />

Príklad 8.4: Máme k dispozícii údaje o veľkoobchodných cenách a produkcii jedného<br />

textilného podniku v rokoch 1990 a 199<strong>1.</strong><br />

výrobok Cena (Sk/m) Produkcia (v 1000 m) Tržba (Sk)<br />

1990 1991 1990 1991 1990 1991<br />

zamat 65 70 20 30 1300000 2100000<br />

menčester 32 30 11 14 352000 420000<br />

flanel 120 140 30 28 3600000 3920000<br />

celkom x x 61 72 5252000 6940000<br />

Posúďte pomocou súhrnných indexov množstva, ako sa zmenila tržba podniku v r. 1991<br />

oproti roku 1990.Posúďte pomocou súhrnných cenových indexov, ako sa zmenila cena tovaru<br />

v r. 1991 oproti roku 1990.<br />

Riešenie:<br />

p q<br />

(P)<br />

1 1 70 30 30 14 140 28 6440<br />

ad a) I (q)<br />

1, 086 , tzn., že celková<br />

p q 70 20 30 11 140 30 5930<br />

1<br />

0<br />

produkcia podniku v r. 1991 meraná cenami roku 1991 vzrástla o 8,6%.<br />

p q<br />

(L)<br />

0 1 65 30 32 14 120 28 5758<br />

I (q)<br />

1,096 , tzn., že celková<br />

p q 65 20 32 11 120 30 5252<br />

0<br />

0<br />

produkcia podniku v r. 1991 meraná cenami roku 1990 vzrástla o 9,6%.


p q<br />

(P)<br />

1 1 6440<br />

ad b) I (p)<br />

1, 118 , tzn., že pri produkcii textilu na úrovni roku 1991<br />

p q 5758<br />

ceny vzrástli o 11,8%.<br />

I<br />

(L)<br />

(p)<br />

ceny vzrástla o 12,9%.<br />

p<br />

0<br />

1<br />

p q<br />

1<br />

0<br />

q<br />

0<br />

0<br />

5930<br />

5252<br />

1,129 , tzn., že pri produkcii textilu na úrovni roku 1990


3. Časové rady<br />

K porovnaniu hodnôt ukazovateľov v <strong>dvoch</strong> obdobiach slúžia metódy indexnej analýzy.<br />

Ak je však potrebné poznať určité zákonitosti vo vývoji daného ukazovateľa, je nutné mať<br />

k dispozícii jeho hodnoty za viacero období vo forme časového rady. Časové rady vznikajú<br />

v prírodných vedách alebo technike (napr. seizmický záznam v geofyzike, údaje o<br />

priemerných ročných teplotách v klimatológii), v biologických vedách (početnosti výskytu<br />

určitého škodca v niekoľkých po sebe nasledujúcich rokoch), v sociológii (vývoj<br />

rozvodovosti), v ekonómii (objem poľnohospodárskej produkcie v niekoľkých po sebe<br />

nasledujúcich rokoch, vývoj výmenného kurzu) atď.<br />

Časovým radom sa rozumie rad hodnôt<br />

y , , y určitého ukazovateľa usporiadaný<br />

t<br />

1 t n<br />

podľa prirodzenej časovej postupnosti t 1 < ... < t n . Pritom je nutné dbať na to, aby vecná náplň<br />

ukazovateľa i jeho priestorové vymedzenie boli zhodné v celom sledovanom časovom období.<br />

Ak sú časové intervaly (t 1 , t 2 ), ..., (t n-1 , t n ) rovnako dlhé (ekvidistantné), zjednodušene sa<br />

zapisuje časový radu ako y 1 , ..., y n .<br />

3.1 Druhy časových radov<br />

a) Časový rad okamihový: príslušný ukazovateľ udáva, koľko javov existuje v danom<br />

časovom okamihu (napr. počet obyvateľstva k určitému dňu).<br />

b) Časový rad intervalový: príslušný ukazovateľ udáva, koľko javov vzniklo či zaniklo<br />

v určitom časovom intervale (napr. počet sobášov počas roka). Ak nie sú jednotlivé časové<br />

intervaly ekvidistantne, je nutné vykonať očistenie časovej rady od dôsledkov kalendárnych<br />

variácii.<br />

Príklad 9.1: Máme k dispozícii údaje o tržbe obchodnej organizácie (v tis. Sk)<br />

v jednotlivých mesiacoch roku 1995: 2400, 2134, 2407, 2445, 2894, 3354, 3515, 3515, 3225,<br />

3063, 2694, 2600. Vypočítajte očistené údaje.<br />

Riešenie: Priemerná dĺžka mesiaca je 365/12 dňa. Očistená hodnota pre január je teda<br />

365<br />

y ( o)<br />

2400 2354,84<br />

1<br />

12 31<br />

, pre február 365<br />

y ( o)<br />

2134 2318,<br />

12 28<br />

18<br />

2<br />

. Pre ostatné<br />

mesiace analogicky dostaneme 2361,71; 2478,96; 2839,54; 3400,58, 3448,86; 3448,86;<br />

3269,79; 3005,36; 2731,42; 2551,08.<br />

3.2 Grafické znázornenie časového radu<br />

a) Okamihový časový rad sa graficky znázorňuje pomocou spojnicového diagramu. Na<br />

vodorovnú os sa vynášajú časové okamihy t 1 , ..., t n , na zvislú os odpovedajúce hodnoty y 1 , ...,<br />

y n . Dvojice bodov (t i , y i ), i = 1, ..., n sa spoja úsečkami.<br />

Príklad 9.2: Časový rad obsahuje údaje o počte zamestnancov určitej akciovej<br />

spoločnosti v rokoch 1989 – 1996 vždy k 3<strong>1.</strong>12.<br />

1989 1990 1991 1992 1993 1994 1995 1996<br />

622 627 631 635 641 641 632 625<br />

Znázornite tento časový rad graficky.


Riešenie:<br />

642<br />

640<br />

638<br />

636<br />

634<br />

pocet<br />

632<br />

630<br />

628<br />

626<br />

624<br />

622<br />

620<br />

1988 1989 1990 1991 1992 1993 1994 1995 1996 1997<br />

rok<br />

b) Intervalový časový rada sa najčastejšie znázorňuje stĺpcovým diagramom. Je to sústava<br />

obdĺžnikov, kde šírka obdĺžníka je rovná dĺžke intervalu a výška odpovedá hodnote<br />

ukazovateľa v danom intervale. K znázorneniu intervalového časového radu je možné použiť i<br />

spojnicový diagram, pričom na vodorovnú os sa vynášajú stredy príslušných intervalov.<br />

Príklad 9.3: Máme k dispozícii údaje o produkcii určitého podniku (v tisícoch výrobkov)<br />

v rokoch 1991-1996.<br />

1991 1992 1993 1994 1995 1996<br />

114 106 107 102 116 137<br />

Znázornite tento časový rad graficky.<br />

Riešenie:<br />

140<br />

135<br />

130<br />

125<br />

produkce<br />

120<br />

115<br />

110<br />

105<br />

100<br />

1990 1991 1992 1993 1994 1995 1996 1997<br />

rok<br />

3.3 Popisné charakteristiky časových radov<br />

3.3.1 Priemer okamihového časového radu<br />

Ako prvé sa vypočítajú priemery pre jednotlivé dielčie intervaly (t 1 , t 2 ), (t 2 , t 3 ), ..., (t n-1 ,<br />

y1<br />

y<br />

2<br />

y<br />

2<br />

y3<br />

y<br />

n 1<br />

y<br />

n<br />

t n ): , , , . Ak sú všetky tieto intervaly rovnako dlhé, vypočíta sa<br />

2 2 2<br />

jednoduchý chronologický priemer okamihového časového radu:<br />

n<br />

n 1<br />

y 1 yi<br />

1 yi<br />

1 y1<br />

yn<br />

yi<br />

n 1 2 n 1 2 2<br />

.<br />

i<br />

2<br />

i<br />

2<br />

Ak nemajú intervaly rovnakú dĺžku, vypočíta sa d i = t i – t i-1 , i = 2, ..., n a použije sa<br />

vážený chronologický priemer okamihového časového radu:<br />

n<br />

1 yi<br />

1<br />

yi<br />

y d<br />

n<br />

i<br />

.<br />

i 2 2<br />

d<br />

i<br />

2<br />

i


Príklad 9.4: Časový rad vyjadruje počet obyvateľstva ČSSR (v tisícoch) v rokoch 1965<br />

až 1974 vždy ku 3<strong>1.</strong>12.<br />

Rok 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974<br />

počet 14194 14271 14333 14387 14443 14345 14419 14576 14631 14738<br />

Charakterizujte túto časovú radu chronologickým priemerom.<br />

1 14194<br />

14738<br />

Riešenie: y 14271 14631 14430 .<br />

9 2<br />

2<br />

3.3.2. Priemer intervalovej časovej rady<br />

n<br />

1<br />

y y i .<br />

n<br />

i 1<br />

Príklad 9.5: Vypočítajte priemernú hodnotu ročnej časovej rady HDP ČR (v miliardách<br />

Kč) v rokoch 1994 až 2000.<br />

1994 1995 1996 1997 1998 1999 2000<br />

1303, 1381, 1447, 1432, 1401, 1390, 1433,<br />

6 1 7 8 3 6 8<br />

1<br />

Riešenie: y 1303,6 1433,8 1398, 7 .<br />

7<br />

3.3.2 Dynamické charakteristiky časových radov<br />

3.3.2.1 Absolútne prírastky<br />

<strong>1.</strong> diferencia: y y ,i 2, , n<br />

yi i i 1 <br />

2<br />

yi<br />

yi<br />

yi<br />

1 yi<br />

2yi<br />

1 yi<br />

2<br />

2. diferencia: ,i 3, , n<br />

atď.<br />

(Diferencovanie má veľký význam pri odhade trendu časovej rady regresnými<br />

metódami.)<br />

Priemerný absolútny prírastok:<br />

i<br />

n<br />

2<br />

n<br />

y<br />

1<br />

i<br />

3.3.2.2 Relatívny prírastok<br />

yi<br />

i ,i 2, ,n<br />

yi<br />

1<br />

(Relatívny prírastok po vynásobení 100 udáva, o koľko percent sa zmenila hodnota v čase<br />

t i oproti času t i-1 .)<br />

yn<br />

n<br />

y<br />

1<br />

1


3.3.2.3 Koeficient rastu (tempo rastu)<br />

yi<br />

ki ,i 2, ,n<br />

yi<br />

1<br />

(Koeficient rastu po vynásobení 100 udáva, na koľko percent hodnoty v čase t i-1 vzrástla<br />

či poklesla hodnota v čase t i .)<br />

Priemerný koeficient rastu<br />

k n 1 k 2 k 3 <br />

k<br />

n<br />

n<br />

1<br />

y<br />

y<br />

Priemerný relatívny prírastok<br />

k 1<br />

n<br />

1<br />

Príklad 9.6: Pre časovú radu HDP ČR v rokoch 1994 až 2000 (v miliardách Kč)<br />

vypočítajte základné charakteristiky dynamiky a graficky znázornite <strong>1.</strong> diferencie a<br />

koeficienty rastu.<br />

Riešenie:<br />

rok HDP Δy i k i δ i<br />

1994 1303,6 x x x<br />

1995 1381,1 77,5 1,059 0,059<br />

1996 1447,7 66,6 1,048 0,048<br />

1997 1432,8 -14,7 0,990 -0,010<br />

1998 1401,3 -31,5 0,978 -0,022<br />

1999 1390,6 -10,7 0,992 -0,008<br />

2000 1433,8 43,2 1,031 0,031<br />

Priemerný absolútny prírastok:<br />

1433,8 1303,6<br />

6<br />

21, 7, tzn., že v období 1994 – 2000<br />

rástol HDP priemerne o 21,7 miliárd Kč ročne.<br />

Priemerný koeficient rastu: k<br />

1433,8<br />

6<br />

1303,6<br />

1, 016 , tzn., že v období 1994 – 2000 rástol<br />

HDP priemerne o 1,6% ročne.<br />

Graf <strong>1.</strong> diferencií:<br />

100<br />

<strong>1.</strong>07<br />

Graf koeficientov rastu:<br />

80<br />

60<br />

<strong>1.</strong>06<br />

<strong>1.</strong>05<br />

<strong>1.</strong>04<br />

<strong>1.</strong> diference<br />

40<br />

20<br />

koeficienty růstu<br />

<strong>1.</strong>03<br />

<strong>1.</strong>02<br />

<strong>1.</strong>01<br />

0<br />

<strong>1.</strong>00<br />

0.99<br />

-20<br />

0.98<br />

-40<br />

1994 1995 1996 1997 1998 1999 2000 2001<br />

0.97<br />

1994 1995 1996 1997 1998 1999 2000 2001<br />

rok<br />

rok<br />

3.4 Rozbor jednotlivých zložiek časového radu<br />

Časové rady vznikajú ako dôsledok pôsobenia podstatných aj nepodstatných činiteľov na<br />

skúmaný sociálno ekonomický jav. Tieto činitele môžeme rozdeliť na:<br />

• trendové - vývojové, ktoré pôsobia neustále a určujú hlavný smer vývoja, t.j. trend v<br />

ČR (Tt )


• periodické, ktoré spôsobujú pravidelné kolísanie hodnôt ČR okolo trendu, môžeme ich<br />

rozdeliť na<br />

cyklické (C t )- v dlhodobých ČR (hospodárske cykly)<br />

sezónne (S t )- krátkodobých ČR (sezónne kolísanie cien, sezónny dopyt…..),<br />

sezónou obvykle je rok<br />

• náhodné činitele (E t ) - pôsobia náhodne, nepravidelne. Tieto činitele pôsobia na<br />

vývoj každého skúmaného ukazovateľa v štatistike<br />

Na základe tohto rozčlenenia môžme dekomponovať - rozložiť ČR na tri zložky:<br />

• trendovú (Tt )<br />

• periodickú (C t ), resp. (S t )<br />

• náhodnú (E t )<br />

Medzi zložkami môže byť :<br />

• aditívny vzťah :<br />

• multiplikatívny vzťah:<br />

Yt = T t + St + E t , alebo<br />

Yt = T t . St . Et<br />

3.4.1 Analýza trendu v časovom rade<br />

Pri dekompozičnom prístupe je analýza trendu založená:<br />

• na analytickom vyrovnaní vývoja hodnôt skúmaného ukazovateľa vhodnou trendovou<br />

funkciou<br />

• ide o analógiu jednoduchej regresnej analýzy, pričom odhadované hodnoty sú<br />

funkciou časovej premennej t, y t , = f (t)<br />

• trendová funkcia je potom použitá nielen ku hodnoteniu kvality prognózy “ex-post”,<br />

ale aj na prognózy “ex-ante”<br />

Predpokladá sa, že pre časovú radu y 1 , ..., y n platí model y t = f(t) + ε t , t = 1, ..., n, kde f(t)<br />

je neznáma trendová funkcia (trend), ktorá sa považuje za systematickú (deterministickú)<br />

zložku časovej rady (popisuje hlavnú tendenciu dlhodobého vývoja časovej rady) a ε t je<br />

náhodná zložka časovej rady zahŕňajúca odchýlky od trendu. Náhodná zložka spĺňa<br />

predpoklady E(ε t ) = 0, D(ε t ) = σ 2 , C(ε t , ε t+h ) = 0, ε t ~ N(0, σ 2 ) (hovorí sa, že ε t je biely šum).<br />

Regresná analýza trendu má objasniť vzťah medzi závisle premennou veličinou y t a<br />

časom t. Predpokladá sa, že trend f(t) závisí (lineárne či nelineárne) na neznámych<br />

parametroch β 0 , β 1 , ..., β k a známych funkciách φ 0 (t), φ 1 (t), ...., φ k (t), ktoré už neobsahujú<br />

žiadne neznáme parametre, tj. f(t) = g(β 0 , β 1 , ..., β k ; φ 0 (t), φ 1 (t), ...., φ k (t)). Odhady b 0 , b 1 , ..., b k<br />

neznámych parametrov β 0 , β 1 , ..., β k je možné získať napr. metódou najmenších štvorcov a<br />

potom vyjadriť odhad f <br />

(t)<br />

funkcií φ 0 (t), φ 1 (t), ...., φ k (t), tj. f <br />

(t)<br />

neznámeho trendu v bode t pomocou odhadov b 0 , b 1 , ..., b k a<br />

= g(b 0 , b 1 , ..., b k ; φ 0 (t), φ 1 (t), ...., φ k (t)).<br />

3.5.3. Najdôležitejšie typy trendových funkcií<br />

Voľba typu trendovej funkcie sa vykonáva<br />

- na základe teoretických znalostí a skúseností zo skúmanou veličinou y t<br />

- pomocou grafu časovej rady<br />

- pomocou informatívnych testov založených na jednoduchých charakteristikách časovej<br />

rady<br />

a) Lineárny trend


Analytické vyjadrenie: f (t)<br />

0 1<br />

t<br />

Informatívny test: <strong>1.</strong> diferencie sú približne konštantné<br />

b) Kvadratický trend<br />

Analytické vyjadrenie:<br />

f (t)<br />

2<br />

0 1t<br />

2t<br />

Informatívny test: <strong>1.</strong> diferencie majú približne lineárny trend, 2. diferencie sú približne<br />

konštantné.<br />

1 y<br />

t<br />

1 y<br />

c) Exponenciálny trend<br />

Analytické vyjadrenie:<br />

0<br />

t<br />

1<br />

f (t) .<br />

Model je možné linearizovať logaritmickou transformáciou: ln f (t) ln<br />

0<br />

tln<br />

1<br />

Informatívny test: koeficienty rastu sú približne konštantné.<br />

d) Modifikovaný exponenciálny trend<br />

t<br />

Analytické vyjadrenie: f (t) 0 1 .<br />

Informatívny test: rada podielov susedných <strong>1.</strong> diferencií je približne konštantná.<br />

e) Logistický trend<br />

t<br />

2<br />

Analytické vyjadrenie: f (t)<br />

t<br />

1 0 1<br />

Informatívny test: priebeh <strong>1.</strong> diferencií je podobný Gaussovej krivke a podiely<br />

1 y t 1<br />

sú približne konštantné.<br />

1 y<br />

1<br />

t<br />

f) Gompertzova krivka<br />

Analytické vyjadrenie:<br />

f (t)<br />

Informatívny test: podiely<br />

ln y<br />

t<br />

ln y<br />

t<br />

2<br />

0<br />

1<br />

t<br />

1<br />

ln y<br />

t<br />

ln y<br />

t<br />

1<br />

sú približne konštantné.<br />

Modely (a), (b), (c) sú lineárne alebo je ich možné linearizovať a odhady parametrov sa<br />

získajú metódou najmenších štvorcov. Modely (d), (e), (f) sú nelineárne a odhady parametrov<br />

sa získavajú špeciálnymi numerickými metódami.<br />

3.4.<strong>1.</strong>1 Štatistické posúdenie vhodnosti trendovej funkcie<br />

Posúdenie vhodnosti trendovej funkcie sa vykonáva pomocou:<br />

• Indexu korelácie,<br />

• Indexu determinácie (tj. podiel vysvetlenej a celkovej variability závisle premennej<br />

veličiny) by mal byť blízky 1,<br />

ktoré vyjadrujú kvalitu prognózy “ex-post”<br />

• Prioritné je však vecné posúdenie vhodnosti trendovej funkcie, pretože je potrebné<br />

zvažovať ako sa “asi” môže skúmaný ukazovateľ v budúcich obdobiach vyvíjať<br />

3.4.2 Analýza sezónnej zložky v časovom rade<br />

Dekompozičný prístup predpokladá:<br />

• multiplikatívny model ČR: Yt = Tt . St . Et


• analýzu trendu v ČR (ak je prítomný) vhodnou trendovou funkciou: Tt = yt, = f(t)<br />

• analýzu sezónnej zložky potom pomocou sezónnych indexov:<br />

y<br />

y<br />

t<br />

S<br />

t ,<br />

t<br />

,<br />

kde y t , sú hodnoty získané vyrovnaním časového radu vhodnou trendovou funkciou<br />

pre t = 1,2…T<br />

Analýza sezónnej zložky se často vykonáva až po očistení dát od trendovej zložky. V<br />

podstate pri nej ide o určenie časového úseku, po ktorého uplynutí majú dáta zas rovnakú<br />

hodnotu, príp. ovplyvnenú trendovou a náhodnou zložkou.<br />

Pre štúdium sezónnej zložky se používá niekoľko typov modelov. V ekonomických<br />

modeloch býva spravidla zrejmá veľkosť periódy (štvrťrok, mesiac), v iných prípadech je<br />

nutné i túto dĺžku odhadovať (v hydrogeologii napr. výšku hladiny spodných vôd). Používa sa<br />

tu i harmonicka analýza, ktorá modeluje priebeh dát pomocou niekoľkých členov<br />

Fourierového radu. Parametre se určujú použitím numerických metód.<br />

Príklad 9.7: Časový rad 112, 149, 238, 354, 580, 867 udáva zisk (v tisícoch dolárov) istej<br />

spoločnosti v prvých šiestich rokoch jej existencie.<br />

a) Graficky znázornite priebeh tohto časového radu.<br />

b) Vypočítajte koeficienty rastu<br />

c) Z grafu časovej rady a vyjadrenia koeficientov rastu je možné usúdiť, že časový rad má<br />

t<br />

1<br />

exponenciálny trend f (t) 0 . Odhadnite jeho parametre.<br />

d) Nájdite odhad zisku spoločnosti v 7. a 8. roku jej existencie.<br />

<br />

e) Zistite index determinácie a zostrojte graf f (t),f (t)<br />

, t = 1, ..., 6.<br />

Riešenie:<br />

ad a)<br />

900<br />

800<br />

700<br />

600<br />

500<br />

400<br />

300<br />

200<br />

100<br />

0<br />

0 1 2 3 4 5 6 7<br />

ad b) Koeficienty rastu: 149/112 = 1,33, 238/149 = 1,597, 354/238 = 1,487, 580/354 =<br />

1,628, 867/580 = 1,495. Vidíme, že koeficienty rastu sú približne konštantné.<br />

t<br />

ad c) Model f (t) 0 1 linearizujeme a metódou najmenších štvorcov získame odhady<br />

ln b 0 = 4, 227983, ln b 1 = 0,420199. Odlogaritmováním dostaneme b 0 = 68,57875, b 1 =<br />

1,522265.<br />

<br />

7 <br />

8<br />

ad d) y 68,57875 1,522265 1299, y 68,57875 1,522265 1977<br />

7<br />

8


ad e) ID 2 = 0,996<br />

900<br />

800<br />

700<br />

600<br />

500<br />

400<br />

300<br />

200<br />

100<br />

0<br />

0 100 200 300 400 500 600 700 800 900<br />

Ako index determinácie, tak aj graf<br />

<br />

f (t),f (t)<br />

správne.<br />

svedčia o tom, že model bol zvolený<br />

3.4.3 Odhad trendu časového radu pomocou kĺzavých priemerov<br />

Predpokladá sa, že časový rad sa riadi aditívnym modelom popísaným v 3.5.<strong>1.</strong> Odhad<br />

trendu v bode t získame určitým spriemerovaním pôvodných pozorovaní z istého okolia<br />

uvažovaného časového okamihu t. Môžeme si predstaviť, že pozdĺž danej časovej rady kĺže<br />

okienko, v ktorého rámci sa priemeruje. Nech toto okienko zahŕňa d členov naľavo od bodu t<br />

a d členov napravo od bodu t. Hovoríme potom o vyhladzovacom okienku šírky h = 2d + <strong>1.</strong><br />

Prvých a posledných d hodnôt trendu neodhadujeme, pretože pre<br />

t 1, ,d n d 1, ,n<br />

nie je vyhladzovacie okienko symetrické. Odhad trendu v<br />

strede vyhladzovacieho okienka je daný vzťahom:<br />

2d<br />

1<br />

1<br />

fˆ (t) y t d y t d 1 y t d<br />

y t d k , t = d+1, ..., n-d.<br />

2d 1<br />

2d 1 k 0<br />

Veľmi dôležitou otázkou je stanovenie šírky vyhladzovacieho okienka. Ak je okienko<br />

príliš široké, bude sa odhad trendu blížiť priamke (hovorí sa, že je prehladený) a zároveň sa<br />

stratí veľký počet členov na začiatku a na konci časovej rady. Ak je okienko úzke, bude sa<br />

odhad trendu blížiť pôvodným hodnotám (hovorí sa, že odhad je podhladený). Najčastejšie sa<br />

volí šírka okienka h = 3, 5, 7.<br />

Príklad 8.: Časový rad 215, 219, 222, 235, 202, 207, 187, 204, 174, 172, 201, 272 udáva<br />

ročné objemy vývozu piva (v miliónoch litrov) z Československa v rokoch 1980 až 199<strong>1.</strong><br />

Odhadnite trend tejto časovej rady pomocou kĺzavých priemerov s vyhladzovacím<br />

okienkom šírky 3 a potom 5.<br />

Graficky znázornite priebeh časovej rady s odhadnutým trendom.<br />

Riešenie:<br />

rok vývoz kp3 kp5<br />

1980 215 x x<br />

1981 219 218,667 x<br />

1982 222 225,333 218,6<br />

1983 235 219,667 217<br />

1984 202 214,667 210,6<br />

1985 207 198,667 207<br />

1986 187 199,333 194,8<br />

1987 204 188,333 188,8<br />

1988 174 183,333 187,6<br />

1989 172 182,333 204,6


1990 201 215 x<br />

1991 272 x x<br />

Grafické znázornenie časového radu s odhadnutým trendom<br />

h = 3 h = 5<br />

280<br />

280<br />

260<br />

260<br />

240<br />

240<br />

220<br />

220<br />

200<br />

200<br />

180<br />

180<br />

160<br />

1978 1980 1982 1984 1986 1988 1990 1992<br />

rok<br />

160<br />

1978 1980 1982 1984 1986 1988 1990 1992<br />

rok

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!