1. Analýza závislosti dvoch veliÄÃn
1. Analýza závislosti dvoch veliÄÃn
1. Analýza závislosti dvoch veliÄÃn
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>1.</strong> Analýza závislosti <strong>dvoch</strong> veličín<br />
Pri spracovaní dát sa veľmi často stretávame s úlohou zistiť, či dve náhodné veličiny sú<br />
stochasticky nezávislé. Napr. nás môže zajímať, či v sledovanej populácii je farba očí a farba<br />
vlasov nezávislá alebo či počet dní práceneschopnosti a vek pracovníka sú nezávislé.<br />
Vzťah jednej veličiny k druhej, resp.závistlosť jednej veličiny na druhej (regresia), je<br />
možné zo súčasne meraných, pozorovaných dát. Ak sa predpokladá, že medzi dvoma<br />
premennými existuje väzba ktorej silu vyjadruje spoločný rozptyl (kovariancia), týchto<br />
premenných, je možné pomocou tejto informácie aproximovať jednu premennú, pomocou<br />
druhej a vytvoriť regresný model (RM), regresnú závislosť premenných. Regresné modely<br />
umožňujú lepšie, hlbšie poznanie spoznanie skúmaných javov v súvislostiach, pomocou<br />
vzťahov medzi premennými. Vhodnosť typu regesného modelu sa hodnotí pomocou<br />
korelácie, t.j. číselného vyjadrenia tesnosti, pevnosti väzby medzi premennými. Korelácia sa<br />
hodnotí podľa vybraných kritérií, z ktorých najúčinnejšie je číselné vyjadrenie pomocou<br />
koeficientu korelácie.<br />
Voľba vhodného typu závislosti vychádza z bodového diagramu, t.j. na začiatku<br />
spracovania dvojrozmerného súboru dát je potrebné vyniesť do grafu dvojice hodnôt {x i , y i }<br />
a z neho odhadnúť možný priebeh závislosti. Pri skúmaní závilsoti sa riešia dve základné<br />
úlohy:<br />
<strong>1.</strong> určenie typu regresného modelu sa označuje ako regresná úloha,<br />
2. zisťovanie sily vzťahu medzi premennými, korelačná úloha korelačného počtu.<br />
Podľa toho, koľko nezávisle premenných sa berie pri riešení korelačného počtu do úvahy,<br />
sa hovorí o:<br />
• jednoduchej alebo párovej korelácii (korelácii <strong>dvoch</strong> premenných), ak sa uvažuje len<br />
s jednou nezávisle premennou,<br />
• viacnásobnej korelácii, ak je počet uvažovaných nezávisle premenných väčších ako<br />
jedna.<br />
<strong>1.</strong>1 Určenie typu regresného modelu (regresná úloha)<br />
<strong>1.</strong><strong>1.</strong>1 Jednoduchá lineárna regresia – lineárny regresný model<br />
Ak po vynesení hodnôt {x i , y i } má bodový diagram trend priamej závislosti (jednotlivé<br />
body ležia na priamke (Y´ = B 0 + B 1 X) alebo sa od nej nepatrne odchyľujú), bodovým<br />
odhadom tejto regresnej priamky je y´j = b 0 + b 1 x j a táto závislosť je najlepším odhadom<br />
lineárneho regresného modelu.<br />
Konštanta b 0 pri grafickom zobrazení regresnej priamky určuje bod, v ktorom priamka<br />
pretína os y. Koeficient b 0 posúva priamku v prietore, preto sa nazýva aj lokujúcou<br />
konštantou.<br />
Koeficient b 1 , je smernica regresnej priamky a udáva, o koľko merných jednotiek sa<br />
v priemere zmení závisle premenná, ak sa nezávisle premenná zmení o jednu mernú jednotku.<br />
Práve tento koeficient dáva informácie o priebehu závislosti a nazýva sa regresným<br />
koeficientom.
Koeficienty b 0 , b 1 sa určia metódou najmenších štvorcov a ich vyjadrenie je možné<br />
zapísať v tvare<br />
b<br />
1<br />
x<br />
x.<br />
y<br />
b0<br />
y b1<br />
x<br />
a bodový odhad priamky je možné vyjadriť v tvare y<br />
xy<br />
2<br />
x<br />
2<br />
j<br />
n<br />
1<br />
x<br />
j<br />
n<br />
j<br />
1<br />
x<br />
x<br />
j<br />
y<br />
x<br />
j<br />
2<br />
y<br />
,<br />
y<br />
b<br />
x<br />
x<br />
j 1 j<br />
.<br />
Uvedený popis lineárnej závislosti platí pre prípad že, Y je závisle a X nezávisle<br />
premennou. Medzi znakmi však môže byť závilosť aj X od Y. Túto závislosť chrakterizuje<br />
priamka X´ = A 0 + A 1 Y a jej odhadom je priamka x´j = a 0 + a 1 y j . Pri výpočte koeficientov a 0<br />
a a 1 sa postupuje analogicky ako pri výpočte koeficientov b 0 a b <strong>1.</strong> Ak existuje obojstranná<br />
závislosť priamky sa nazývajú združené regresné priamky (lineárne regresné modely oboch<br />
typov tvoria združené regresné modely) a ich regresné koeficienty združené regresné<br />
koeficienty. Lineárne regrsné priamky (modely) spolu vytvárajú tzv. korelačné nožnice. Čím<br />
sú viac otvorené závislosť je menšia, a naopak.<br />
<strong>1.</strong><strong>1.</strong>2 Nelineárna regresia – nelineárny regresný model<br />
Ak závislosť medzi premennými Y a X nie je lineárna, vyjadrí sa jej priebeh vhodnou<br />
nelineárnou regresnou funkciou, pričom sa môžu použiť nelineárne funkcie s dvomi alebo<br />
viacerými parametrami.
Koeficienty nelineárneho regresného modelu je možné určiť priamo pomocou metódy<br />
najmenších štvorcov, alebo nepriamo použitím transformácie na lineárnu funkciu.<br />
Najčastejšie používané nelineárne funkcie s dvoma parametrami je možné transformovať na<br />
funkciu, ktorej odhadom je regresná funkcia w´j = b 0 + b 1 z j ,<br />
kde w = g(y),<br />
z = g (x),<br />
w, z sú transformované funkcie g(y) a g(z).<br />
Na uvedený tvar w´j = b 0 + b 1 z j je možné transformovať napr.:<br />
b1<br />
• hyperbolu <strong>1.</strong> stupňa y<br />
j<br />
b0<br />
x<br />
transformácia:<br />
• hyperbolu<br />
y<br />
j<br />
z<br />
b<br />
0<br />
1<br />
x<br />
1<br />
b x<br />
1<br />
transformácia: y<br />
z<br />
• logaritmickú funkciu y<br />
transformácia: z = ln x<br />
• exponenciálne krivky:<br />
x<br />
a a<br />
j<br />
y<br />
j 0 1<br />
1<br />
j<br />
j<br />
b<br />
0<br />
j<br />
b ln x<br />
1<br />
j<br />
transformácia: w = log y, z = xj, po transformácii sa získa funkcia log y = log a 0 +<br />
z.log a 1 , b 0 = log a 0 , b 1 = log a 1<br />
b1<br />
y a<br />
j 0x j<br />
transformácia: w = log y, z = log x, funkcia: log y = log a 0 + b 1 .log x, b 0 = log a 0<br />
b1<br />
/ x<br />
y a e<br />
j<br />
j<br />
0<br />
transformácia: w = ln y, z =1/x, funkcia: ln y = ln a 0 + a 1 /x b 0 = ln a 0 ,<br />
b1<br />
. x<br />
y a e<br />
j<br />
j<br />
0<br />
transformácia: w = ln y, z =x, funkcia: ln y = ln a 0 + a <strong>1.</strong> x b 0 = ln a 0<br />
Ak sa uskutoční lineárna transformácia ďalší postup je ako pri lineárnej závislosti. Pri<br />
voľbe typu funkcie, je dôležité zvoliť funkciu, ktorá je najpriliehavejšia, t.j. najlepšie<br />
vystihuje priebeh závislosť premennej Y od premennej X. Od voľby správneho typu regesnej<br />
funkcie závisí, do akej miery vystihne vzťah medzi premennými, a teda rozhodnutiu aký typ<br />
funkcie sa zvolí, je potrebné venovať veľkú pozornosť.<br />
Pri voľbe typu regresnej funkcie (regesného modelu) sa musí spájať znalosť priebehu<br />
jednotlivých typov kriviek s informáciami o skúmanom jave a rozložení empirických údajov.<br />
Pritom zvyčajne pomáha zobrazenie bodového diagramu. Typ regresnej funkcie sa volí tak,<br />
aby čo najpresnejšie vyhovovala rozloženiu bodov v diagrame a logickým súvislostiam<br />
daných javov. Pre lepšiu orientáciu sú na nasledujúcich obrázkoch znázornené niektoré<br />
používané typy kriviek.<br />
Výber najvhodnejšieho typu regresnej funkcie (regesného modelu) nemusí byť vždy<br />
zrejmý od prvej chvíle, preto sa za najvhodnejší považuje ten:<br />
• ktorý je najlogickejší,
• pri ktorom sa rozdelenie reziduálnych odchýlok blíži najviac k normálnemu<br />
rozdeleniu,<br />
• ktorý zabezpečuje že rozdelenie reziduálnych odchýlok bude mať približne rovnakú<br />
variabilitu,<br />
• pri ktorom sô reziduálne odchýlky najmenšie,<br />
• ktorý vykazuje najväčšiu tesnosť závislostí,<br />
• ktorý je najjednoduchšou krivkou.<br />
<strong>1.</strong>2 Korelačná úloha<br />
<strong>1.</strong>2.1 Párová korelácia<br />
Rozpoznanie stupňa závislosti premennej Y od premennej X je dôležitá úloha. Čím je<br />
stupeň závislosti medzi premennými vyšší, tým je väčšia aj vypovedacia sila regresnej funkcie<br />
(regresného modelu). Stupeň závislosti medzi premennými charakterizujú miery tesnosti<br />
štatistickej závislosti. Tieto sa pohybujú v pevne stanovenom intervale a v rámci tohto<br />
intervalu rastú so stupňom závilsosti. Sú nezávislé od veľkosti hodnôt skúmaných znakov ani<br />
od používaných jednotiek. To umožňuje z ich veľkosti priamo usudzovať o stupni závislosti<br />
a porovávať miery tesnosti štatistickej závislosti za rôzne štatistické súbory.<br />
Korelačný pomer je odmocnina z podielu súčtu štvorcov odchýlok podmienených<br />
priemerov závisle premennej od jej celkového priemeru a celkového súčtu štvorcov odchýlok<br />
od tejto premennej. Nadobúda hodnoty od 0 do <strong>1.</strong> Čím je taký koeficient bližší 1, tým je<br />
závislosť medzi danými dvomi veličinami silnejšia a čím je bližší 0, tím je slabšia. Korelačný<br />
pomer je najvšeobecnejšou mierou tesnosti štatistickej závislosti, ktorú je možné počítať bez<br />
ohľadu na to, či sa už riešila regresná úloha.<br />
yx<br />
m<br />
2<br />
yi<br />
i 1<br />
m n<br />
i 1 i 1<br />
n<br />
y<br />
i<br />
2<br />
ij<br />
ny<br />
2<br />
ny<br />
2<br />
n<br />
m<br />
j 1<br />
i 1<br />
n<br />
m<br />
n<br />
n<br />
i 1 j 1<br />
i<br />
i<br />
n<br />
y<br />
i<br />
y<br />
ij<br />
2<br />
ij<br />
2<br />
m n<br />
i 1 j 1<br />
m n<br />
i 1 j 1<br />
i<br />
y<br />
y<br />
ij<br />
ij<br />
2<br />
2<br />
Index determinácie je podiel súčtu štvorcov odchýlok teoretických hodnôt od celkového<br />
priemeru závisle premennej k celkovému súčtu štvorcov jej odchýlok. Ako miera tesnosti<br />
štatistickej závislosti sa používa druhá odmocnina indexu determinácie a nazýva sa index<br />
korelácie.<br />
i<br />
yx<br />
m<br />
ni<br />
i 1<br />
m n<br />
i 1 j 1<br />
i<br />
y<br />
y<br />
i<br />
ij<br />
y<br />
y<br />
2<br />
2<br />
pre triedené údaje
i<br />
yx<br />
m<br />
n<br />
i<br />
i 1<br />
n<br />
j 1<br />
y<br />
y<br />
j<br />
i<br />
y<br />
y<br />
2<br />
2<br />
pre netriedené údaje<br />
Index korelácie charakterizuje stupeň závislosti premennej Y od X za predpokladu, že jej<br />
priebeh vystihuje regresná funkcia (regresný model). Hodnoty ktoré nadobúda a spôsob<br />
hodnotenia závislostí je analogický ako v prípade korelačného pomeru. Využíva sa vtedy, keď<br />
sa hodnotí vhodnosť nelineárnej regresnej funkcie (regresného modelu).<br />
Koeficient korelácie hodnotí mieru lineárnej štatistickej závislosti. Nadobúda hodnoty<br />
z intervalu (-1,1) a používa sa aj ako miera tesnosti závislosti transformovaných premenných.<br />
Výpočet sa realizuje z netriedených premenných. Na hodnotenie vhodnosti regesného modelu<br />
2<br />
sa využíva aj druhá mocnina koeficienta korelácie tzv. koeficient determinácie r<br />
xy<br />
.<br />
Koeficient korelácie je možné vypočítať viacerými spôsobmi:<br />
• ako súčin niektorého zo združených regresných koeficientov a podielu smerodajnej<br />
odchýlky nezávisle premennej ku smerodajnej odchýlke závisle premennej<br />
s s<br />
x y<br />
ryx<br />
b1<br />
a1<br />
s s<br />
y<br />
x<br />
• ako podiel kovariancie premenných X aY a ich smerodajných odchýlok<br />
cov xy xy x.<br />
y<br />
ryx<br />
s s s s<br />
x<br />
y<br />
x<br />
y<br />
• koeficient korelácie je geometrickým priemerom zo združených regresných<br />
koeficientov.<br />
r yx<br />
a 1<br />
b 1<br />
Koeficient korelácie má nasledovné vlastnosti:<br />
• meria tesnosť závislosti medzi X a Y obojstranne, t.j. Y od X, ale súčasne X od Y,<br />
• môže byť kladný ale aj záporný, pričom jeho znamienko vyjadruje charakter<br />
závislosti: ak je závilsosť priama, má koeficient korelácie kladné znamienko, pri<br />
nepriamej závislosti je záporný.
<strong>1.</strong>3 Testovanie hypotézy o nezávislosti<br />
Testujeme H 0 : ρ = 0 proti obojstrannej alternatíve H 1 : ρ ≠ 0 (resp. proti ľavostrannej<br />
alternatíve H 1 : ρ < 0 resp. proti pravostranné alternatíve H 1 : ρ > 0). Testovacie kritérium má<br />
R12<br />
n 2<br />
tvar: T . Ak platí nulová hypotéza, potom T ~ t(n-2). Kritický obor pre test H 0<br />
2<br />
1 R<br />
12<br />
proti obojstrannej alternatíve: W , t1 / 2 n 2 t1<br />
/ 2 n 2 , , proti<br />
ľavostrannej alternatíve: W , t1 n 2 a proti pravostrannej alternatíve:<br />
W t 1 n 2 , . H 0 zamietame na hladine významnosti α, keď T W .<br />
Príklad 7.1: Máme k dispozícii výsledky testov z <strong>dvoch</strong> predmetov zistených u ôsmich<br />
náhodne vybraných študentov určitého odboru.<br />
Číslo študenta 1 2 3 4 5 6 7 8<br />
Počet bodov v <strong>1.</strong> teste 80 50 36 58 42 60 56 68<br />
Počet bodov v 2. teste 65 60 35 39 48 44 48 61<br />
Na hladine významnosti 0,05 testujte hypotézu, že výsledky oboch testov nie sú kladne<br />
korelované.<br />
Riešenie: Najprv sa musíme presvedčiť, že uvedené výsledky je možné považovať za<br />
realizácie náhodného výberu z dvojrozmerného normálneho rozdelenia. Je možné tak učiniť<br />
orientačne pomocou dvojrozmerného bodového diagramu. Body by mali vytvoriť elipsovitý<br />
obrazec.<br />
100<br />
80<br />
60<br />
Y<br />
40<br />
20<br />
0<br />
0 20 40 60 80 100 120<br />
X<br />
Obrázok svedčí o tom, že predpoklad dvojrozmernej normality je oprávnený a že medzi<br />
počtami bodov z <strong>1.</strong> a 2. testu bude existovať určitý stupeň priamej lineárnej závislosti.<br />
Testovaná je H 0 : ρ = 0 proti pravostrannej alternatíve H 1 : ρ > 0.<br />
Výpočtom sa zistí: R 12 = 0,6668, T = 2,1917. V tabuľkách sa nájde t 0,95 (6) = 1,9432.<br />
Kritický obor: W 1,9432 ; . Pretože T W , hypotézu o neexistenci kladnej korelácie<br />
výsledkov z <strong>1.</strong> a 2. testu zamietame na hladine významnosti 0,05.
<strong>1.</strong>3.1 Porovnanie koeficientu korelácie s danou konštantou<br />
Ak c je reálna konštanta. Testuje sa H 0 : ρ = c proti H 1 : ρ ≠ c. (Tento test sa vykonáva<br />
napr. vtedy, ak experimentátor porovnáva vlastnosti svojich dát s vlastnosťami uvádzanými<br />
1 1 c c<br />
v literatúre.) Test je založený na testovacom kritériu U Z ln<br />
n 3 ,<br />
2 1 c 2 n 1<br />
ktorá má za platnosti H 0 pre n ≥ 10 asymptoticky rozdelenie N(0,1), pričom Z<br />
1 1 R12<br />
ln<br />
2 1 R12<br />
je tzv. Fisherova Z-transformácia. Kritický obor pre test H 0 proti obojstrannej alternatíve teda<br />
je W , u1 / 2 u1<br />
/ 2,<br />
. H 0 sa zamieta na asymptotickej hladine významnosti α,<br />
keď U W .<br />
Príklad 7.2: V 600 vzorkách rudy bol stanovený obsah železa dvoma analytickými<br />
metódami s výberovým koeficientom korelácie 0,85. V literatúre sa uvádza, že koeficient<br />
korelácie týchto <strong>dvoch</strong> metód má byť 0,9. Na asymptotickej hladine významnosti 0,05 testujte<br />
hypotézu<br />
H 0 : ρ = 0,9 proti H 1 : ρ ≠ 0,9.<br />
1 1 0,85<br />
Riešenie: Z ln 1, 2562,<br />
2 1 0,85<br />
1 1 0,9 0,9<br />
U 1,2562 ln<br />
600 3 5,2976 , u 0,975 = 1,96,<br />
2 1 0,9 2 600 1<br />
W , 1,96 1,96, . Pretože U W , H 0 zamietame na asymptotickej hladine<br />
významnosti 0,05.<br />
<strong>1.</strong>3.2 Porovnanie <strong>dvoch</strong> korelačných koeficientov<br />
Ak sú dané dva nezávislé náhodné výbery o rozsahoch n a n * z dvojrozmerných<br />
normálnych rozdelení s korelačnými koeficientmi ρ a ρ * . Testuje sa H 0 : ρ = ρ * proti H 1 : ρ ≠<br />
ρ * . Označí sa R 12 výberový korelačný koeficient <strong>1.</strong> výberu a R *<br />
12 výberový korelační<br />
koeficient<br />
*<br />
1 1 R12<br />
* 1 1 R12<br />
2. výberu. Položí sa Z ln a Z ln . Ak platí H<br />
*<br />
0 , potom testovacie<br />
2 1 R 2 1 R<br />
kritérium<br />
1<br />
n 3<br />
*<br />
1<br />
*<br />
n 3<br />
12<br />
Z Z<br />
U má asymptoticky rozdelenie N(0,1). Kritický obor pre test H 0 proti<br />
obojstrannej alternatíve je W , u1 / 2 u1<br />
/ 2,<br />
. H 0 sa zamieta na asymptotickej<br />
hladine významnosti α, ak U W .<br />
Príklad 7.3: Lekársky výskum sa zaoberal sledovaním koncentrácii látok A a B v moči<br />
pacientov trpiacich určitou obličkovou chorobou. Pri 100 zdravých jedincoch bol výberový<br />
korelačný koeficient medzi koncentráciami oboch látok 0,65 a v prípade 142 osôb trpiacich<br />
zmienenou chorobou bol 0,37. Na asymptotickej hladine významnosti 0,05 testujte hypotézu,<br />
že korelačné koeficienty v oboch skupinách sa nelíšia.<br />
12
Riešenie:<br />
1 1 0,65<br />
* 1 1 0,37<br />
Z ln 0,7753, Z ln 0,3884 ,<br />
2 1 0,65<br />
2 1 0,37<br />
0,7753 0,3884<br />
U<br />
2,9242 , u 0,975 = 1,96, W , 1,96 1,96,<br />
.<br />
Pretože<br />
1<br />
100<br />
3<br />
1<br />
142<br />
3<br />
U W , H 0 sa zamieta na asymptotickej hladine významnosti 0,05.<br />
<strong>1.</strong>3.3 Interval spoľahlivosti pre korelačný koeficient<br />
V prípade že, dvojrozmerný náhodný výber rozsahu n pochádza z dvojrozmerného<br />
normálneho rozdelenia, ktorého korelačný koeficient sa príliš nelíši od nuly (│ρ│ < 0,5) a<br />
rozsah výberu je dostatočne veľký (n ≥ 100), 100(1-α)% interval spoľahlivosti pre ρ má<br />
2<br />
1 R12<br />
medze R12 u1<br />
/ 2 .<br />
n 3<br />
Ak nie sú uvedené podmienky splnené, potom nie je možné tento vzorec použiť, pretože<br />
rozdelenie výberového korelačného koeficientu je príliš zošikmené. V takom prípade sa<br />
využije to, že náhodná veličina Z<br />
1 1 R12<br />
ln má i pri malom rozsahu výberu približne<br />
2 1 R12<br />
normálne rozdelenie so strednou hodnotou E Z<br />
1 1<br />
ln<br />
(2. sčítanec je možné<br />
2 1 2 n 1<br />
pri väčšom n zanedbať) a rozptylom D Z<br />
1<br />
. Štandardizáciou veličiny Z sa získa<br />
n 3<br />
veličina U<br />
Z E(Z)<br />
, ktorá má asymptoticky rozdelenie N(0,1). Teda 100(1-α)%<br />
D(Z)<br />
1 1<br />
asymptotický interval spoľahlivosti pre ln bude mať medze<br />
2 1<br />
spoľahlivosti pre ρ potom sa získa spätnou transformáciou.<br />
Z<br />
u<br />
1<br />
n<br />
/ 2<br />
. Interval<br />
3<br />
Vzhľadom na to, že Z = arctgh R 12 , dostaneme R 12 = tgh Z a medze intervalu<br />
x x<br />
u1<br />
/ 2<br />
e e<br />
spoľahlivosti pre ρ je možné napísať v tvare tgh Z , pričom tgh x .<br />
x x<br />
n 3<br />
e e<br />
Príklad 7.4: Pracovník personálneho oddelenia určitej firmy skúma, či existuje vzťah<br />
medzi počtom dní absencie za rok (veličina Y) a vekom pracovníka (veličina X). Preto<br />
náhodne vybral údaje o 10 pracovníkoch.<br />
Č. prac. 1 2 3 4 5 6 7 8 9 10<br />
X 27 61 37 23 46 58 29 36 64 40<br />
Y 15 6 10 18 9 7 14 11 5 8<br />
Za predpokladu, že uvedené údaje tvoria číselné realizácie náhodného výberu rozsahu 10<br />
z dvojrozmerného normálneho rozdelenia, vypočítajte výberový korelačný koeficient a na<br />
hladine významnosti 0,05 testujte hypotézu, že X a Y sú nezávislé náhodné veličiny. Zostrojte<br />
95% asymptotický interval spoľahlivosti pre skutočný korelačný koeficient ρ.
Riešenie: Predpoklad o dvojrozmernej normalite dát overíme orientačne pomocou<br />
dvojrozmerného bodového diagramu.<br />
30<br />
25<br />
20<br />
15<br />
Y<br />
10<br />
5<br />
0<br />
-5<br />
-10<br />
-20 0 20 40 60 80 100<br />
X<br />
Vzhľad diagramu svedčí o tom, že predpoklad je oprávnený.<br />
Testujeme H 0 : ρ = 0 proti H 1 : ρ ≠ 0. Vypočítame R 12 = -0,9325, teda medzi vekom<br />
pracovníka a počtom dní pracovnej neschopnosti existuje silná nepriama lineárna závislosť.<br />
Testovacie kritérium: T = -7,3053, kvantil t 0,975 (8) = 2,306, kritický obor<br />
W , 2,306 2,306, . Vzhľadom k tomu, že T W , zamietame na hladine<br />
významnosti 0,05 hypotézu o nezávislosti veličín X a Y.<br />
1 1 R12 1 1 0,9325<br />
Vypočítame Z ln ln<br />
1, 6772 . Medze 95% asymptotického<br />
2 1 R 2 1 0,9325<br />
12<br />
intervalu spoľahlivosti pre ρ sú tgh 1,6772<br />
1,96<br />
7<br />
, teda -0,9842 < ρ < -0,7336<br />
s pravdepodobnosťou približne 0,95.<br />
Testovanie hypotézy o nezávislosti sa vykonáva rôznymi spôsobmi podľa toho, akého<br />
typu sú dané náhodné veličiny – či sú nominálne, ordinálne, intervalové alebo pomerové.<br />
Koeficientom korelácie sa hodnotí miera štatistickej závislosti intervalových, pomerových<br />
veličín. Nasledovne budú uvedené hodnotenia miery štatistickej závislosti a testy nezávislosti<br />
nominálnych a ordinálnych veličín.<br />
<strong>1.</strong>3.4 Testovanie nezávislosti nominálnych veličín<br />
Ak X,Y sú dve nominálne náhodné veličiny (tj. obsahová interpretácia je možná len pri<br />
relácii rovnosti). Ak X nadobúda hodnoty x [1] , ..., x [r] a Y nadobúda hodnoty y [1] , ..., y [s] .<br />
Získame dvojrozmerný náhodný výber rozsahu n z rozdelenia, ktorým sa riadi dvojrozmerný<br />
diskrétny náhodný vektor (X, Y). Zistené absolútne početnosti n jk dvojice hodnôt (x [j] , y [k] )<br />
usporiadame do kontingenčnej tabuľky:<br />
y y [1] ... y [s] n j.<br />
x n jk<br />
x [1] n 11 ... n 1s n <strong>1.</strong><br />
... ... ... ...
x [r] n r1 ... n rs n r.<br />
n .k n .1 ... n .s n<br />
Testuje sa hypotéza H 0 : X, Y sú stochasticky nezávislé náhodné veličiny proti<br />
H 1 : X, Y nie sú stochasticky nezávislé náhodné veličiny. Testovacie kritérium TK má tvar:<br />
K<br />
1)(s-1)).<br />
r<br />
s<br />
j 1 k 1<br />
n<br />
jk<br />
j.<br />
n<br />
n<br />
j.<br />
n<br />
n<br />
n n<br />
. k<br />
.k<br />
2<br />
. Ak platí H 0 , potom K sa asymptoticky riadi rozdelením χ 2 ((r-<br />
Hypotézu o nezávislosti veličín X, Y teda zamietame na asymptotickej hladine<br />
významnosti α, ak TK (K) ≥ KH (χ 2 1-α((r-1)(s-1))).<br />
Podmienky dobrej aproximácie<br />
n<br />
j.<br />
n.<br />
k<br />
Výraz sa nazýva teoretická početnosť. Rozdelenie testovacieho kritéria K je<br />
n<br />
možné aproximovať rozdelením χ 2 ((r-1)(s-1)), pokiaľ teoretické početnosti aspoň v 80%<br />
prípadoch nadobúdajú hodnoty väčšie alebo rovné 5 a v ostatných 20% neklesnú pod 2. Ak<br />
nie je splnená podmienka dobrej aproximácie, odporúča sa zlučovanie niektorých hodnôt.<br />
Meranie sily závislosti<br />
K<br />
Cramérov koeficient: V<br />
, kde m = min{r,s}. Tento koeficient nadobúda<br />
n(m 1)<br />
hodnoty medzi 0 a <strong>1.</strong> Čím bližšie je k 1, tým je tesnejšia závislosť medzi X a Y, čím bližšie je<br />
k 0, tým je táto závislosť volnejšia.<br />
Príklad 7.5:<br />
V sociologickom prieskume bol z uchádzačov o štúdium na vysokých školách získaný<br />
náhodný výber rozsahu 360. Mimo iných sa zisťovala sociálna skupina, z ktorej uchádzač<br />
pochádza a typ školy, na ktorú sa hlási. Výsledky sú zaznamenané v kontingenčnej tabuľke:<br />
Typ školy Sociálna skupina n j.<br />
I II III IV<br />
univerzitný 50 30 10 50 140<br />
technický 30 50 20 10 110<br />
ekonomický 10 20 30 50 110<br />
n .k 90 100 60 110 360<br />
Na asymptotickej hladine významnosti 0,05 testujte hypotézu o nezávislosti typu školy a<br />
sociálnej skupiny. Vypočítajte Cramérov koeficient.<br />
Riešenie:<br />
Výpočet TK:
n 140 <strong>1.</strong><br />
n.1<br />
90 n<strong>1.</strong><br />
n.2<br />
140 100 n<strong>1.</strong><br />
n.3<br />
140 60 n<strong>1.</strong><br />
n.<br />
35,<br />
38,9,<br />
23,3,<br />
n 360 n 360<br />
n 360 n<br />
n2.<br />
n.1<br />
110 90 n2.<br />
n.2<br />
110 100 n2.<br />
n.3<br />
110 60 n2.<br />
n.<br />
4<br />
27,5,<br />
30,6,<br />
18,3,<br />
n 360 n 360<br />
n 360 n<br />
n2.<br />
n.1<br />
110 90 n2.<br />
n.2<br />
110 100 n2.<br />
n.3<br />
110 60 n2.<br />
n.<br />
4<br />
27,5,<br />
30,6,<br />
18,3,<br />
n 360 n 360<br />
n 360 n<br />
K<br />
2<br />
2<br />
2<br />
50 35 30 38,9 50 33,6<br />
<br />
35 38,9<br />
33,6<br />
76,84 ,<br />
Stanovenie KH:<br />
r = 3, s = 4, χ 2 0,95(6) = 12,6.<br />
140 110<br />
360<br />
110 110<br />
360<br />
110 110<br />
360<br />
42,8,<br />
33,6,<br />
33,6,<br />
Rozhodnutie. Pretože TK ≥ KH hypotézu o nezávislosti typu školy a sociálnej skupiny<br />
zamietame na asymptotickej hladine významnosti 0,05.<br />
76,4<br />
Cramérov koeficient: V 0, 3267 .<br />
360 2<br />
Štvorpolné tabuľky<br />
Ak r = s = 2. Potom sa hovorí o štvorpolnej kontingenčnej tabuľke a používa sa<br />
označenie: n 11 = a, n 12 = b, n 21 = c, n 22 = d.<br />
X Y n j.<br />
y [1] y [2]<br />
x [1] a b a+b<br />
x [2] c d c+d<br />
n .k a+c b+d n<br />
Pre túto tabuľku navrhol R. A. Fisher presný (exaktný) test nezávislosti známy ako<br />
Fisherov faktoriálový test. STATISTICA poskytuje p-hodnotu pre tento test. Ak je výsledok p<br />
≤ α, potom hypotézu o nezávislosti zamietame na hladine významnosti α.<br />
ad<br />
V štvorpolných tabuľkách sa používa charakteristika OR , ktorá sa nazýva podiel<br />
bc<br />
šancí (odds ratio). Je možné si predstaviť, že pokus sa vykonáva za nerovnakých okolností a<br />
môže skončiť buď úspechom alebo neúspechom.<br />
Výsledok okolnosti n j.<br />
pokusu I<br />
II<br />
úspech a b a+b<br />
neúspech c d c+d<br />
n .k a+c b+d n<br />
Pomer počtu úspechov k počtu neúspechov (tzv. šance) za <strong>1.</strong> okolností je c<br />
a , za druhých<br />
b ad<br />
okolností je . Podiel šancí je OR . Pomocou 100(1-α)% asymptotického intervalu<br />
d bc<br />
spoľahlivosti pre podiel šancí je možné na asymptotickej hladine významnosti α testovať
hypotézu o nezávislosti nominálnych veličín X a Y. Asymptotický 100(1-α)% interval<br />
spoľahlivosti pre prirodzený logaritmus skutočného podielu šancí má medze:<br />
1 1 1 1<br />
ln OR<br />
u 1 / 2 . Ak po odlogaritmovaní nezahrnie interval spoľahlivosti 1,<br />
a b c d<br />
potom hypotézu o nezávislosti zamietneme na asymptotickej hladine významnosti α.<br />
Príklad 7.6:<br />
V prípade 135 uchádzačov o štúdium na istú fakultu bol hodnotený dojem, akým<br />
zapôsobili na komisiu na ústnej prijímacej skúške. Na asymptotickej hladine významnosti<br />
0,05 testujte hypotézu, že prijatie na fakultu nezávisí od zanechaného dojmu na prijímacej<br />
skúške.<br />
prijatí dojem n j.<br />
dobrý zlý<br />
áno 17 11 28<br />
nie 39 58 97<br />
n .k 56 69 125<br />
Riešenie:<br />
ad 17 58<br />
1 1 1 1 1 1 1 1<br />
OR 2,298, ln OR 0,832,<br />
0,439, u 0,975<br />
bc 11 39<br />
a b c d 17 11 39 58<br />
ln d 0,832 0,439 1,96 0,028, ln h 0,832 0,439 1,96 1,692<br />
0,028<br />
1,692<br />
d e 0,972, h e 5,433<br />
Pretože interval (0,972; 5,433) obsahuje číslo 1, na asymptotickej hladine významnosti<br />
0,05 nezamietame hypotézu o nezávislosti dojmu na prijímacej skúške a prijatie na fakultu.<br />
1,96<br />
<strong>1.</strong>3.5 Testovanie nezávislosti ordinálnych veličín<br />
Ak X,Y sú dve ordinálne náhodné veličiny (tj. obsahová interpretácia je možná len<br />
v prípade relácie rovnosti a relácie usporiadania). Získame dvojrozmerný náhodný výber<br />
(X 1 , Y 1 ), ..., (X n , Y n ) z rozdelenia, ktorým sa riadi náhodný vektor (X, Y). Označíme R i<br />
poradie náhodnej veličiny X i a Q i poradie náhodnej veličiny Y i , i = 1, ..., n. Testujeme<br />
hypotézu H 0 : X, Y sú poradovo nezávislé náhodné veličiny proti obojstrannej alternatíve H 1 :<br />
X, Y sú poradovo závislé náhodné veličiny (resp. proti ľavostrannej alternatíve H 1 : medzi X a<br />
Y existuje nepriama poradová závislosť resp. proti pravostrannej alternatíve H 1 : medzi X a Y<br />
existuje priama poradová závislosť).<br />
Testovacie kritérium sa nazýva Spearmanov koeficient poradovej korelácie a má tvar:<br />
n<br />
6<br />
2<br />
r S 1<br />
R<br />
2<br />
i Qi<br />
.<br />
n n 1<br />
i 1<br />
H 0 sa zamieta na hladine významnosti α<br />
a) v prospech obojstrannej alternatívy, ak │r S │≥ r S,1-α (n)<br />
b) v prospech ľavostrannej alternatívy, ak r S ≤ - r S,1-α (n)<br />
c) v prospech pravostrannej alternatívy, ak r S ≥ r S,1-α (n), kde r S,1-α (n) je kritická hodnota,<br />
ktorá sa pre α = 0,05 alebo 0,01 a n ≤ 30 nájde v tabuľkách. Pre n > 30 H 0 sa zamieta na
asymptotickej hladine významnosti α v prospech obojstrannej alternatívy, ak<br />
(analogicky pre jednostranné alternatívy).<br />
r<br />
S<br />
u<br />
1<br />
n<br />
1<br />
Spearmanov koeficient r S súčasne meria silu poradovej závislosti náhodných veličín X,<br />
Y. Nadobúda hodnoty z intervalu 1 , 1 . Čím je jeho hodnota bližšia -1 (resp.1), tým je<br />
silnejšia nepriama (resp. priama) poradová závislosť veličín X, Y. Čím je jeho hodnota bližšia<br />
0, tým je slabšia poradová závislosť veličín X, Y.<br />
Príklad 7.7:<br />
Dva lekári hodnotili stav siedmich pacientov po rovnakom chirurgickom zákroku.<br />
Postupovali tak, že najvyššie poradie dostal najťažší prípad.<br />
Číslo pacienta 1 2 3 4 5 6 7<br />
Hodnotenie <strong>1.</strong> lekára 4 1 6 5 3 2 7<br />
Hodnotenie 2. lekára 4 2 5 6 1 3 7<br />
Vypočítajte Spearmanov koeficient r S a na hladine významnosti 0,05 testujte hypotézu, že<br />
hodnotenie oboch lekárov sú poradovo nezávislé.<br />
r<br />
Riešenie:<br />
Výpočet TK:<br />
6<br />
2<br />
2<br />
1 4 4 1 2 6<br />
2<br />
7 7 1<br />
Stanovenie KH:<br />
Kritická hodnota: r S,0,95 (7) = 0,745.<br />
2<br />
2<br />
2<br />
2<br />
2<br />
S 5 5 6 3 1 2 3 7 7 0,857 .<br />
Rozhodnutie:<br />
Pretože TK (0,857) ≥ KH (0,745), nulovú hypotézu zamietame na hladine významnosti<br />
0,05.
2. Úvod do indexnej analýzy<br />
Tato kapitola sa zaoberá porovnávaním ukazovateľov v dátových súboroch, ktoré sa líšia<br />
buď časovo alebo priestorovo alebo vecne. Najdôležitejšie je porovnávanie ukazovateľov<br />
z časového hľadiska. Pod pojmom ukazovateľ sa rozumie veličina, ktorá vypovedá o akejsi<br />
sociálne ekonomickej hromadnej skutočnosti. K uvedenému porovnávaniu veľmi často slúžia<br />
rôzne indexy. Budeme sa venovať konštruovaniu a interpretácii týchto indexov.<br />
Ukazovateľ a jeho druhy<br />
Ukazovateľ je veličina, ktorá charakterizuje sociálne ekonomický jav v určitom priestore<br />
a v určitom čase (okamih či interval).<br />
Príklady ukazovateľov: počet obyvateľov SR ku dňu 3<strong>1.</strong>12.2005, veľkosť HDP v SR v r.<br />
2005, počet sobášov v SR v r. 2005 atd.<br />
Rozlíšenie ukazovateľov z vecného hľadiska<br />
Extenzitný ukazovateľ: charakterizuje extenzitu skúmaného javu (napr. objem, veľkosť,<br />
množstvo). Je vyjadrený číslom v určitej mernej jednotke. Spravidla sa označuje q alebo Q<br />
(od slova quantum – množstvo).<br />
Príklady extenzitných ukazovateľov: rozloha poľnohospodárskej pôdy v SR v r. 2002,<br />
počet narodených detí v SR v r. 2005 atď.<br />
Intenzitní ukazovateľ: charakterizuje intenzitu sledovaného javu. Vzniká ako pomer<br />
<strong>dvoch</strong> extenzitných ukazovateľov, medzi ktorými existuje logický vzťah. Spravidla sa<br />
označuje p (od slova price – cena).<br />
Príklady intenzitných ukazovateľov: priemerná obytná plocha bytu pripadajúca na<br />
jedného obyvateľa SR v r. 2005, hektárový výnos pšenice v SR v r. 2002 atď.<br />
Samostatnú skupinu tvoria ukazovatele štruktúrne. Štruktúrny ukazovateľ je podielom<br />
jedného dielčieho ukazovateľa k celkovému ukazovateľu, ktorý je súčtom dielčích<br />
ukazovateľov. Je to bezrozmerné číslo, ktoré udáva, ako sa dielčí (logicky podriadený<br />
ukazovateľ) podieľa na celkovom ukazovateli (logicky nadriadenom). Nadobúda hodnoty<br />
medzi 0 a <strong>1.</strong><br />
Príklady štruktúrnych ukazovateľov: podiel mládeže do 18 rokov na celkovom počtu<br />
obyvateľov SR v r. 2005, podiel priemyslovej výroby v SR v r. 2002 na hrubom domácom<br />
produkte atď.<br />
Rozdelenie ukazovateľov z hľadiska rovnorodosti<br />
Rovnorodý ukazovateľ Extenzitný: jeho hodnoty je možné stanoviť súčtom. Napr. je<br />
možné spočítať tržby v maloobchode za jednotlivé mesiace, počty pracovníkov v jednotlivých<br />
závodoch podniku atď.<br />
Rovnorodý ukazovateľ intenzitný: vzniká ako podiel <strong>dvoch</strong> rovnorodých ukazovateľov<br />
extenzitných, napr. hektárový výnos určitej plodiny.<br />
Nerovnorodý ukazovateľ: nemá v jednotlivých častiach (priestorových, časových alebo<br />
vecných) rovnakú naturálnu podobu ako v celku. Zhrňovanie súčtom nemá logický zmysel.<br />
Napr. nerovnorodým extenzitným ukazovateľom je ukazovateľ objemu priemyslové<br />
produkcie Sr (automobily, uhlie, nábytok atď.)
Indexy, diferencie a ich typy<br />
2.3.<strong>1.</strong> Typy porovnávania hodnôt ukazovateľov<br />
Absolútne porovnávanie: pomocou diferencií. Diferencia je rozdiel <strong>dvoch</strong> hodnôt<br />
ukazovateľa.<br />
Relatívne porovnávanie: pomocou indexov. Index je podiel <strong>dvoch</strong> hodnôt ukazovateľa.<br />
2.3.2. Druhy porovnávania hodnôt ukazovateľov<br />
Časové porovnávanie: výsledkom sú časové indexy a diferencie (najdôležitejší druh<br />
porovnávania). Napr.: priemerná mesačná mzda pracovníkov v priemysle v % SR v r. 2005 a<br />
2004.<br />
Priestorové porovnávanie: výsledkom sú priestorové indexy a diferencie. Napr.:<br />
priemerná mesačná mzda pracovníkov v priemysle v r. 2005 v ČR a SR.<br />
Vecné porovnávanie: výsledkom sú vecné indexy a diferencie. Napi: priemerná mesačná<br />
mzda pracovníkov v priemysle a v poľnohospodárstve v SR v r. 2005.<br />
Indexy<br />
množstva<br />
úrovne<br />
súhrné<br />
individuálne<br />
súhrné<br />
individuálne<br />
jednoduché<br />
zložené<br />
jednoduché<br />
zložené<br />
Obr.: Schéma druhov indexov<br />
2.3.3. Rozdelenie indexov z hľadiska vecného obsahu<br />
Index množstva: porovnáva hodnoty extenzitného ukazovateľa v <strong>dvoch</strong> situáciách.<br />
Index úrovne: porovnáva hodnoty intenzitného ukazovateľa v <strong>dvoch</strong> situáciách.<br />
2.3.4. Rozdelenie indexov z hľadiska rovnorodosti<br />
Individuálny index: porovnáva hodnoty rovnorodého ukazovateľa v <strong>dvoch</strong> situáciách.<br />
Súhrnný index: hodnoty nerovnorodého ukazovateľa v <strong>dvoch</strong> situáciách.<br />
2.3.5. Rozdelenie indexov z hľadiska priestorového vymedzenia<br />
Jednoduchý index: porovnáva dve hodnoty rovnorodého ukazovateľa v jednom priestore.<br />
Zložený index: porovnáva dve hodnoty rovnorodého ukazovateľa vo viacerých<br />
priestoroch, v ktorých sa údaje pred vlastným porovnávaním musia zhrnúť.
2.4. Individuálne indexy a diferencie<br />
2.4.<strong>1.</strong> Jednoduché individuálne indexy a diferencie<br />
Ak q 1 je hodnota extenzitného ukazovateľa v bežnom období a q 0 v základnom období.<br />
q1<br />
Jednoduchý individuálny index množstva: I (q) (diferencia: Δ(q) = q 1 – q 0 ).<br />
q0<br />
Ak p 1 je hodnota intenzitného ukazovateľa v bežnom období a p 0 v základnom období.<br />
p1<br />
Jednoduchý individuálny index úrovne: I (p) (diferencia: Δ(p) = p 1 – p 0 ).<br />
p<br />
Príklad 8.1: Zaujíma nás vývoj ceny, predaného množstva a tržby za predaj masla<br />
v jednej predajni v mesiacoch september a október roku 1999. Údaje sú v tabuľke.<br />
Cena (Sk/kg) Predaj (kg) Tržba (Sk)<br />
september október september október september október<br />
88 94 142 128 12496 12032<br />
Riešenie: p 0 = 88, p 1 =94, I(p) = 94/88 = 1,068, tzn., že cena v októbri vzrástla oproti<br />
september o 6,8%, tj. o Δ(p) = 94 – 88 = 6 Sk za 1 kg.<br />
q 0 = 142, q 1 = 128, I(q) = 128/142 = 0,901, tzn., že predaj v októbri poklesol oproti<br />
septembru o 9,9%, tj. o Δ(q) = 128 – 142 = -14 kg<br />
Q 0 = 12496, Q 1 = 12032, I(Q) = 12032/12496 = 0,963, tzn., že tržba v októbri poklesla<br />
oproti septembru o 3,7%, tj. o Δ(Q) = 12032 – 12496 = -464 Sk.<br />
2.4.2. Bázické a reťazové indexy<br />
Ak existujú k dispozícii hodnoty ukazovateľa (napr. extenzitného) za n obdobie q 1 , q 2 , ...,<br />
q n , potom vývoj ukazovateľa je možné popísať radou za sebou idúcich individuálnych<br />
indexov, a to buď bázických nebo reťazových.<br />
Bázické indexy: jedno obdobie sa zvolí ako základné (najčastejšie prvé, tj, q B = q 1 ) a<br />
q 2 q3<br />
q n<br />
ostatné obdobia sa s ním porovnávajú: I2/<br />
B(q)<br />
,I3/<br />
B(q)<br />
, ,In / B(q)<br />
.<br />
q B q B<br />
q B<br />
Reťazové indexy: vznikajú porovnaním <strong>dvoch</strong> po sebe nasledujúcich členov rady:<br />
q 2 q3<br />
q n<br />
I2 /1(q)<br />
,I3/<br />
2 (q) , ,In<br />
1/ n (q) .<br />
q1<br />
q 2<br />
q n 1<br />
Vzťah medzi bázickými a reťazovými indexmi:<br />
I (q)<br />
I<br />
k / k<br />
1<br />
(q)<br />
I<br />
k / B<br />
k<br />
1/ B<br />
, k = 2, 3, ..., n<br />
(q)<br />
I 1<br />
k / B(q)<br />
IB<br />
1/ B(q)<br />
IB<br />
2 / B 1(q)<br />
Ik / k (q) , k = 2, 3, ..., n<br />
Príklad 8.2: V tabuľke sú uvedené údaje o spotrebe mäsa (v kg) na jedného obyvateľa<br />
SR v rokoch 1985 až 1990.<br />
rok 1985 1986 1987 1988 1989 1990<br />
spotreba 89,3 91,6 93,5 96,1 97,4 96,5<br />
Charakterizujte vývoj spotreby mäsa pomocou bázických a reťazových indexov.<br />
0
Riešenie:<br />
rok 1985 1986 1987 1988 1989 1990<br />
Bázické 1 1,026 1,047 1,076 1,091 1,081<br />
indexy<br />
Reťazové x 1,026 1,021 1,028 1,014 0,991<br />
indexy<br />
Interpretácia: Napr. v r. 1987 stúpla spotreba mäsa o 4,7% oproti roku 1985, ale len o<br />
2,1% oproti roku 1986.<br />
2.4.3. Zložené individuálne indexy a diferencie<br />
Máme dva extenzitné ukazovatele q, Q a jeden intenzitný ukazovateľ p = Q/q. Hodnoty<br />
ukazovateľov v základnom období sa označia q 0 , Q 0 , p 0 a v bežnom období q 1 , Q 1 , p 1 .<br />
Najčastejšie sa vykonáva časové porovnanie. Predpokladá sa, že údaje sú z priestorového<br />
alebo vecného hľadiska členené do n sfér. Pri výpočte zložených individuálnych indexov a<br />
diferencií sa vychádza z nasledujúcej tabuľky.<br />
Číslo<br />
sféry<br />
Ext. ukazovateľ q v<br />
období<br />
Ext. ukazovateľ Q v<br />
období<br />
Int. ukazovateľ p v<br />
období<br />
základnom bežnom základnom bežnom základnom bežnom<br />
1 q 0,1 q 1,1 Q 0,1 Q 1,1 p 0,1 p 1,1<br />
2 q 0,2 q 1,2 Q 0,2 Q 1,2 p 0,2 p 1,2<br />
... ... ... ... ... ... ...<br />
n q 0,n q 1,n Q 0,n Q 1,n p 0,n p 1,n<br />
I (<br />
Zložený individuálny index množstva:<br />
Q)<br />
n<br />
i 1<br />
n<br />
i 1<br />
Q<br />
Q<br />
1,i<br />
0,i<br />
Q<br />
Q<br />
1<br />
0<br />
n<br />
q1,i<br />
q<br />
i 1<br />
1<br />
I ( q)<br />
resp.<br />
n<br />
q0<br />
q<br />
Tieto indexy porovnávajú množstvo v bežnom období oproti množstvu v základnom<br />
období, a to cez všetky sféry.<br />
Odpovedajúce diferencie: q q1 q<br />
0,<br />
Q Q1<br />
Q0,<br />
Zložený individuálny index úrovne:<br />
I p<br />
n<br />
i 1<br />
n<br />
i 1<br />
Q<br />
Q<br />
1,i<br />
0,i<br />
n<br />
i 1<br />
n<br />
i 1<br />
q<br />
q<br />
1,i<br />
0,i<br />
n<br />
n<br />
i 1<br />
i 1<br />
p<br />
p<br />
1,i<br />
0,i<br />
q<br />
q<br />
1,i<br />
0,i<br />
n<br />
i 1<br />
n<br />
i 1<br />
q<br />
q<br />
1,i<br />
0,i<br />
V čitateli je celkový výnos zo všetkých sfér predelený množstvom zo všetkých sfér pre<br />
bežné obdobie. V menovateli sú tie isté veličiny, ale pre základné obdobie.<br />
p q<br />
p<br />
1<br />
0<br />
q<br />
1<br />
0<br />
q<br />
q<br />
1<br />
0<br />
i 1<br />
0,i
Odpovedajúce diferencie:<br />
p q<br />
1 1<br />
0 0<br />
p .<br />
q1<br />
q<br />
0<br />
p<br />
q<br />
Príklad 8.3: V tabuľke sú údaje o cenách, predaji a tržbách za čerstvé a stolové maslo<br />
v jednej predajni v septembri a októbri roku 1999.<br />
Druh<br />
Cena (Sk/kg) Predaj (kg) Tržba (Sk)<br />
masla september október september október september október<br />
čerstvé 88 94 142 128 12496 12032<br />
stolové 82 85 125 132 10250 11220<br />
celkom x x 267 260 22746 23252<br />
Pomocou zložených individuálnych indexov množstva a úrovne popíšte vývoj cien,<br />
predaja a tržby čerstvého a stolového masla celkom.<br />
Riešenie: Pre množstvo predaného masla: I(Σq) = 260/267 = 0,974, tzn., že množstvo<br />
predaného masla v októbri pokleslo oproti septembru o 2,6%, tj. o Δ(Σq) = 260 – 267 = -7 kg.<br />
Pre tržbu za predané maslo: I(ΣQ) = 23252/22746 = 1,022, tzn., že tržba v októbri vzrástla<br />
oproti septembru o 2,2%, tj. o Δ(ΣQ) = 23252 – 22746 = 506 Sk.<br />
23252<br />
Pre cenu: I p<br />
260<br />
1, 05, tzn., že priemerná cena masla vzrástla v októbri oproti<br />
22746<br />
267<br />
23252 22746<br />
septembru o 5%, tj. o p 4, 24 Sk.<br />
260 267<br />
2.1 Súhrnné indexy a diferencie<br />
Slúžia k relatívnemu resp. absolútnemu porovnaniu nerovnorodých extenzitných<br />
ukazovateľov. Pri ich výpočte sa vychádza z nasledujúcej tabuľky:<br />
Druh výrobku Množstvo výrobku (q) Cena (p) za jednotku<br />
Zákl. obdobie Bež. obdobie Zákl. obdobie Bež. obdobie<br />
1 q 0,1 q 1,1 p 0,1 p 1,1<br />
2 q 0,2 q 1,2 p 0,2 p 1,2<br />
... ... ... ... ...<br />
n q 0,n q 1,n p 0,n p 1,n<br />
2.5.<strong>1.</strong> Súhrnné indexy množstva<br />
Paascheho index množstva:<br />
I<br />
(P)<br />
(q)<br />
n<br />
i 1<br />
n<br />
i 1<br />
p<br />
p<br />
1,i<br />
1,i<br />
q<br />
q<br />
1,i<br />
0,i<br />
p q<br />
1<br />
p q<br />
1<br />
1<br />
0<br />
. Vyjadruje relatívnu zmenu<br />
objemu produkcie pri cenovej hladine odpovedajúcej bežnému obdobiu. Odpovedajúca<br />
P<br />
diferencia: q p1q1<br />
p1q<br />
0
Laspeyresov index množstva:<br />
I<br />
(L)<br />
(q)<br />
n<br />
i 1<br />
n<br />
i 1<br />
p<br />
p<br />
0,i<br />
0,i<br />
q<br />
q<br />
1,i<br />
0,i<br />
p<br />
p<br />
0<br />
0<br />
q<br />
q<br />
1<br />
0<br />
. Vyjadruje relatívnu zmenu<br />
objemu produkcie pri cenovej hladine odpovedajúcej základnému obdobiu. Odpovedajúca<br />
L<br />
diferencia: q p0q1<br />
p0q<br />
0<br />
2.5.2. Súhrnné indexy úrovne (ceny)<br />
Paascheho cenový index:<br />
I<br />
(P)<br />
(p)<br />
n<br />
i 1<br />
n<br />
i 1<br />
p<br />
p<br />
1,i<br />
0,i<br />
q<br />
q<br />
1,i<br />
1,i<br />
p q<br />
p<br />
1<br />
0<br />
q<br />
1<br />
1<br />
. Vyjadruje relatívnu zmenu ceny pri<br />
objeme produkcie odpovedajúcej bežnému obdobiu. Odpovedajúca diferencia:<br />
P<br />
p p q p q<br />
Laspeyresov cenový index:<br />
1<br />
1<br />
0<br />
1<br />
I<br />
(L)<br />
(p)<br />
n<br />
i 1<br />
n<br />
i 1<br />
p<br />
p<br />
1,i<br />
0,i<br />
q<br />
q<br />
0,i<br />
0,i<br />
p q<br />
p<br />
1<br />
0<br />
q<br />
0<br />
0<br />
. Vyjadruje relatívnu zmenu ceny<br />
pri objeme produkcie odpovedajúci základnému obdobiu. Odpovedajúca diferencia:<br />
L<br />
p p q p q<br />
1<br />
0<br />
0<br />
0<br />
Príklad 8.4: Máme k dispozícii údaje o veľkoobchodných cenách a produkcii jedného<br />
textilného podniku v rokoch 1990 a 199<strong>1.</strong><br />
výrobok Cena (Sk/m) Produkcia (v 1000 m) Tržba (Sk)<br />
1990 1991 1990 1991 1990 1991<br />
zamat 65 70 20 30 1300000 2100000<br />
menčester 32 30 11 14 352000 420000<br />
flanel 120 140 30 28 3600000 3920000<br />
celkom x x 61 72 5252000 6940000<br />
Posúďte pomocou súhrnných indexov množstva, ako sa zmenila tržba podniku v r. 1991<br />
oproti roku 1990.Posúďte pomocou súhrnných cenových indexov, ako sa zmenila cena tovaru<br />
v r. 1991 oproti roku 1990.<br />
Riešenie:<br />
p q<br />
(P)<br />
1 1 70 30 30 14 140 28 6440<br />
ad a) I (q)<br />
1, 086 , tzn., že celková<br />
p q 70 20 30 11 140 30 5930<br />
1<br />
0<br />
produkcia podniku v r. 1991 meraná cenami roku 1991 vzrástla o 8,6%.<br />
p q<br />
(L)<br />
0 1 65 30 32 14 120 28 5758<br />
I (q)<br />
1,096 , tzn., že celková<br />
p q 65 20 32 11 120 30 5252<br />
0<br />
0<br />
produkcia podniku v r. 1991 meraná cenami roku 1990 vzrástla o 9,6%.
p q<br />
(P)<br />
1 1 6440<br />
ad b) I (p)<br />
1, 118 , tzn., že pri produkcii textilu na úrovni roku 1991<br />
p q 5758<br />
ceny vzrástli o 11,8%.<br />
I<br />
(L)<br />
(p)<br />
ceny vzrástla o 12,9%.<br />
p<br />
0<br />
1<br />
p q<br />
1<br />
0<br />
q<br />
0<br />
0<br />
5930<br />
5252<br />
1,129 , tzn., že pri produkcii textilu na úrovni roku 1990
3. Časové rady<br />
K porovnaniu hodnôt ukazovateľov v <strong>dvoch</strong> obdobiach slúžia metódy indexnej analýzy.<br />
Ak je však potrebné poznať určité zákonitosti vo vývoji daného ukazovateľa, je nutné mať<br />
k dispozícii jeho hodnoty za viacero období vo forme časového rady. Časové rady vznikajú<br />
v prírodných vedách alebo technike (napr. seizmický záznam v geofyzike, údaje o<br />
priemerných ročných teplotách v klimatológii), v biologických vedách (početnosti výskytu<br />
určitého škodca v niekoľkých po sebe nasledujúcich rokoch), v sociológii (vývoj<br />
rozvodovosti), v ekonómii (objem poľnohospodárskej produkcie v niekoľkých po sebe<br />
nasledujúcich rokoch, vývoj výmenného kurzu) atď.<br />
Časovým radom sa rozumie rad hodnôt<br />
y , , y určitého ukazovateľa usporiadaný<br />
t<br />
1 t n<br />
podľa prirodzenej časovej postupnosti t 1 < ... < t n . Pritom je nutné dbať na to, aby vecná náplň<br />
ukazovateľa i jeho priestorové vymedzenie boli zhodné v celom sledovanom časovom období.<br />
Ak sú časové intervaly (t 1 , t 2 ), ..., (t n-1 , t n ) rovnako dlhé (ekvidistantné), zjednodušene sa<br />
zapisuje časový radu ako y 1 , ..., y n .<br />
3.1 Druhy časových radov<br />
a) Časový rad okamihový: príslušný ukazovateľ udáva, koľko javov existuje v danom<br />
časovom okamihu (napr. počet obyvateľstva k určitému dňu).<br />
b) Časový rad intervalový: príslušný ukazovateľ udáva, koľko javov vzniklo či zaniklo<br />
v určitom časovom intervale (napr. počet sobášov počas roka). Ak nie sú jednotlivé časové<br />
intervaly ekvidistantne, je nutné vykonať očistenie časovej rady od dôsledkov kalendárnych<br />
variácii.<br />
Príklad 9.1: Máme k dispozícii údaje o tržbe obchodnej organizácie (v tis. Sk)<br />
v jednotlivých mesiacoch roku 1995: 2400, 2134, 2407, 2445, 2894, 3354, 3515, 3515, 3225,<br />
3063, 2694, 2600. Vypočítajte očistené údaje.<br />
Riešenie: Priemerná dĺžka mesiaca je 365/12 dňa. Očistená hodnota pre január je teda<br />
365<br />
y ( o)<br />
2400 2354,84<br />
1<br />
12 31<br />
, pre február 365<br />
y ( o)<br />
2134 2318,<br />
12 28<br />
18<br />
2<br />
. Pre ostatné<br />
mesiace analogicky dostaneme 2361,71; 2478,96; 2839,54; 3400,58, 3448,86; 3448,86;<br />
3269,79; 3005,36; 2731,42; 2551,08.<br />
3.2 Grafické znázornenie časového radu<br />
a) Okamihový časový rad sa graficky znázorňuje pomocou spojnicového diagramu. Na<br />
vodorovnú os sa vynášajú časové okamihy t 1 , ..., t n , na zvislú os odpovedajúce hodnoty y 1 , ...,<br />
y n . Dvojice bodov (t i , y i ), i = 1, ..., n sa spoja úsečkami.<br />
Príklad 9.2: Časový rad obsahuje údaje o počte zamestnancov určitej akciovej<br />
spoločnosti v rokoch 1989 – 1996 vždy k 3<strong>1.</strong>12.<br />
1989 1990 1991 1992 1993 1994 1995 1996<br />
622 627 631 635 641 641 632 625<br />
Znázornite tento časový rad graficky.
Riešenie:<br />
642<br />
640<br />
638<br />
636<br />
634<br />
pocet<br />
632<br />
630<br />
628<br />
626<br />
624<br />
622<br />
620<br />
1988 1989 1990 1991 1992 1993 1994 1995 1996 1997<br />
rok<br />
b) Intervalový časový rada sa najčastejšie znázorňuje stĺpcovým diagramom. Je to sústava<br />
obdĺžnikov, kde šírka obdĺžníka je rovná dĺžke intervalu a výška odpovedá hodnote<br />
ukazovateľa v danom intervale. K znázorneniu intervalového časového radu je možné použiť i<br />
spojnicový diagram, pričom na vodorovnú os sa vynášajú stredy príslušných intervalov.<br />
Príklad 9.3: Máme k dispozícii údaje o produkcii určitého podniku (v tisícoch výrobkov)<br />
v rokoch 1991-1996.<br />
1991 1992 1993 1994 1995 1996<br />
114 106 107 102 116 137<br />
Znázornite tento časový rad graficky.<br />
Riešenie:<br />
140<br />
135<br />
130<br />
125<br />
produkce<br />
120<br />
115<br />
110<br />
105<br />
100<br />
1990 1991 1992 1993 1994 1995 1996 1997<br />
rok<br />
3.3 Popisné charakteristiky časových radov<br />
3.3.1 Priemer okamihového časového radu<br />
Ako prvé sa vypočítajú priemery pre jednotlivé dielčie intervaly (t 1 , t 2 ), (t 2 , t 3 ), ..., (t n-1 ,<br />
y1<br />
y<br />
2<br />
y<br />
2<br />
y3<br />
y<br />
n 1<br />
y<br />
n<br />
t n ): , , , . Ak sú všetky tieto intervaly rovnako dlhé, vypočíta sa<br />
2 2 2<br />
jednoduchý chronologický priemer okamihového časového radu:<br />
n<br />
n 1<br />
y 1 yi<br />
1 yi<br />
1 y1<br />
yn<br />
yi<br />
n 1 2 n 1 2 2<br />
.<br />
i<br />
2<br />
i<br />
2<br />
Ak nemajú intervaly rovnakú dĺžku, vypočíta sa d i = t i – t i-1 , i = 2, ..., n a použije sa<br />
vážený chronologický priemer okamihového časového radu:<br />
n<br />
1 yi<br />
1<br />
yi<br />
y d<br />
n<br />
i<br />
.<br />
i 2 2<br />
d<br />
i<br />
2<br />
i
Príklad 9.4: Časový rad vyjadruje počet obyvateľstva ČSSR (v tisícoch) v rokoch 1965<br />
až 1974 vždy ku 3<strong>1.</strong>12.<br />
Rok 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974<br />
počet 14194 14271 14333 14387 14443 14345 14419 14576 14631 14738<br />
Charakterizujte túto časovú radu chronologickým priemerom.<br />
1 14194<br />
14738<br />
Riešenie: y 14271 14631 14430 .<br />
9 2<br />
2<br />
3.3.2. Priemer intervalovej časovej rady<br />
n<br />
1<br />
y y i .<br />
n<br />
i 1<br />
Príklad 9.5: Vypočítajte priemernú hodnotu ročnej časovej rady HDP ČR (v miliardách<br />
Kč) v rokoch 1994 až 2000.<br />
1994 1995 1996 1997 1998 1999 2000<br />
1303, 1381, 1447, 1432, 1401, 1390, 1433,<br />
6 1 7 8 3 6 8<br />
1<br />
Riešenie: y 1303,6 1433,8 1398, 7 .<br />
7<br />
3.3.2 Dynamické charakteristiky časových radov<br />
3.3.2.1 Absolútne prírastky<br />
<strong>1.</strong> diferencia: y y ,i 2, , n<br />
yi i i 1 <br />
2<br />
yi<br />
yi<br />
yi<br />
1 yi<br />
2yi<br />
1 yi<br />
2<br />
2. diferencia: ,i 3, , n<br />
atď.<br />
(Diferencovanie má veľký význam pri odhade trendu časovej rady regresnými<br />
metódami.)<br />
Priemerný absolútny prírastok:<br />
i<br />
n<br />
2<br />
n<br />
y<br />
1<br />
i<br />
3.3.2.2 Relatívny prírastok<br />
yi<br />
i ,i 2, ,n<br />
yi<br />
1<br />
(Relatívny prírastok po vynásobení 100 udáva, o koľko percent sa zmenila hodnota v čase<br />
t i oproti času t i-1 .)<br />
yn<br />
n<br />
y<br />
1<br />
1
3.3.2.3 Koeficient rastu (tempo rastu)<br />
yi<br />
ki ,i 2, ,n<br />
yi<br />
1<br />
(Koeficient rastu po vynásobení 100 udáva, na koľko percent hodnoty v čase t i-1 vzrástla<br />
či poklesla hodnota v čase t i .)<br />
Priemerný koeficient rastu<br />
k n 1 k 2 k 3 <br />
k<br />
n<br />
n<br />
1<br />
y<br />
y<br />
Priemerný relatívny prírastok<br />
k 1<br />
n<br />
1<br />
Príklad 9.6: Pre časovú radu HDP ČR v rokoch 1994 až 2000 (v miliardách Kč)<br />
vypočítajte základné charakteristiky dynamiky a graficky znázornite <strong>1.</strong> diferencie a<br />
koeficienty rastu.<br />
Riešenie:<br />
rok HDP Δy i k i δ i<br />
1994 1303,6 x x x<br />
1995 1381,1 77,5 1,059 0,059<br />
1996 1447,7 66,6 1,048 0,048<br />
1997 1432,8 -14,7 0,990 -0,010<br />
1998 1401,3 -31,5 0,978 -0,022<br />
1999 1390,6 -10,7 0,992 -0,008<br />
2000 1433,8 43,2 1,031 0,031<br />
Priemerný absolútny prírastok:<br />
1433,8 1303,6<br />
6<br />
21, 7, tzn., že v období 1994 – 2000<br />
rástol HDP priemerne o 21,7 miliárd Kč ročne.<br />
Priemerný koeficient rastu: k<br />
1433,8<br />
6<br />
1303,6<br />
1, 016 , tzn., že v období 1994 – 2000 rástol<br />
HDP priemerne o 1,6% ročne.<br />
Graf <strong>1.</strong> diferencií:<br />
100<br />
<strong>1.</strong>07<br />
Graf koeficientov rastu:<br />
80<br />
60<br />
<strong>1.</strong>06<br />
<strong>1.</strong>05<br />
<strong>1.</strong>04<br />
<strong>1.</strong> diference<br />
40<br />
20<br />
koeficienty růstu<br />
<strong>1.</strong>03<br />
<strong>1.</strong>02<br />
<strong>1.</strong>01<br />
0<br />
<strong>1.</strong>00<br />
0.99<br />
-20<br />
0.98<br />
-40<br />
1994 1995 1996 1997 1998 1999 2000 2001<br />
0.97<br />
1994 1995 1996 1997 1998 1999 2000 2001<br />
rok<br />
rok<br />
3.4 Rozbor jednotlivých zložiek časového radu<br />
Časové rady vznikajú ako dôsledok pôsobenia podstatných aj nepodstatných činiteľov na<br />
skúmaný sociálno ekonomický jav. Tieto činitele môžeme rozdeliť na:<br />
• trendové - vývojové, ktoré pôsobia neustále a určujú hlavný smer vývoja, t.j. trend v<br />
ČR (Tt )
• periodické, ktoré spôsobujú pravidelné kolísanie hodnôt ČR okolo trendu, môžeme ich<br />
rozdeliť na<br />
cyklické (C t )- v dlhodobých ČR (hospodárske cykly)<br />
sezónne (S t )- krátkodobých ČR (sezónne kolísanie cien, sezónny dopyt…..),<br />
sezónou obvykle je rok<br />
• náhodné činitele (E t ) - pôsobia náhodne, nepravidelne. Tieto činitele pôsobia na<br />
vývoj každého skúmaného ukazovateľa v štatistike<br />
Na základe tohto rozčlenenia môžme dekomponovať - rozložiť ČR na tri zložky:<br />
• trendovú (Tt )<br />
• periodickú (C t ), resp. (S t )<br />
• náhodnú (E t )<br />
Medzi zložkami môže byť :<br />
• aditívny vzťah :<br />
• multiplikatívny vzťah:<br />
Yt = T t + St + E t , alebo<br />
Yt = T t . St . Et<br />
3.4.1 Analýza trendu v časovom rade<br />
Pri dekompozičnom prístupe je analýza trendu založená:<br />
• na analytickom vyrovnaní vývoja hodnôt skúmaného ukazovateľa vhodnou trendovou<br />
funkciou<br />
• ide o analógiu jednoduchej regresnej analýzy, pričom odhadované hodnoty sú<br />
funkciou časovej premennej t, y t , = f (t)<br />
• trendová funkcia je potom použitá nielen ku hodnoteniu kvality prognózy “ex-post”,<br />
ale aj na prognózy “ex-ante”<br />
Predpokladá sa, že pre časovú radu y 1 , ..., y n platí model y t = f(t) + ε t , t = 1, ..., n, kde f(t)<br />
je neznáma trendová funkcia (trend), ktorá sa považuje za systematickú (deterministickú)<br />
zložku časovej rady (popisuje hlavnú tendenciu dlhodobého vývoja časovej rady) a ε t je<br />
náhodná zložka časovej rady zahŕňajúca odchýlky od trendu. Náhodná zložka spĺňa<br />
predpoklady E(ε t ) = 0, D(ε t ) = σ 2 , C(ε t , ε t+h ) = 0, ε t ~ N(0, σ 2 ) (hovorí sa, že ε t je biely šum).<br />
Regresná analýza trendu má objasniť vzťah medzi závisle premennou veličinou y t a<br />
časom t. Predpokladá sa, že trend f(t) závisí (lineárne či nelineárne) na neznámych<br />
parametroch β 0 , β 1 , ..., β k a známych funkciách φ 0 (t), φ 1 (t), ...., φ k (t), ktoré už neobsahujú<br />
žiadne neznáme parametre, tj. f(t) = g(β 0 , β 1 , ..., β k ; φ 0 (t), φ 1 (t), ...., φ k (t)). Odhady b 0 , b 1 , ..., b k<br />
neznámych parametrov β 0 , β 1 , ..., β k je možné získať napr. metódou najmenších štvorcov a<br />
potom vyjadriť odhad f <br />
(t)<br />
funkcií φ 0 (t), φ 1 (t), ...., φ k (t), tj. f <br />
(t)<br />
neznámeho trendu v bode t pomocou odhadov b 0 , b 1 , ..., b k a<br />
= g(b 0 , b 1 , ..., b k ; φ 0 (t), φ 1 (t), ...., φ k (t)).<br />
3.5.3. Najdôležitejšie typy trendových funkcií<br />
Voľba typu trendovej funkcie sa vykonáva<br />
- na základe teoretických znalostí a skúseností zo skúmanou veličinou y t<br />
- pomocou grafu časovej rady<br />
- pomocou informatívnych testov založených na jednoduchých charakteristikách časovej<br />
rady<br />
a) Lineárny trend
Analytické vyjadrenie: f (t)<br />
0 1<br />
t<br />
Informatívny test: <strong>1.</strong> diferencie sú približne konštantné<br />
b) Kvadratický trend<br />
Analytické vyjadrenie:<br />
f (t)<br />
2<br />
0 1t<br />
2t<br />
Informatívny test: <strong>1.</strong> diferencie majú približne lineárny trend, 2. diferencie sú približne<br />
konštantné.<br />
1 y<br />
t<br />
1 y<br />
c) Exponenciálny trend<br />
Analytické vyjadrenie:<br />
0<br />
t<br />
1<br />
f (t) .<br />
Model je možné linearizovať logaritmickou transformáciou: ln f (t) ln<br />
0<br />
tln<br />
1<br />
Informatívny test: koeficienty rastu sú približne konštantné.<br />
d) Modifikovaný exponenciálny trend<br />
t<br />
Analytické vyjadrenie: f (t) 0 1 .<br />
Informatívny test: rada podielov susedných <strong>1.</strong> diferencií je približne konštantná.<br />
e) Logistický trend<br />
t<br />
2<br />
Analytické vyjadrenie: f (t)<br />
t<br />
1 0 1<br />
Informatívny test: priebeh <strong>1.</strong> diferencií je podobný Gaussovej krivke a podiely<br />
1 y t 1<br />
sú približne konštantné.<br />
1 y<br />
1<br />
t<br />
f) Gompertzova krivka<br />
Analytické vyjadrenie:<br />
f (t)<br />
Informatívny test: podiely<br />
ln y<br />
t<br />
ln y<br />
t<br />
2<br />
0<br />
1<br />
t<br />
1<br />
ln y<br />
t<br />
ln y<br />
t<br />
1<br />
sú približne konštantné.<br />
Modely (a), (b), (c) sú lineárne alebo je ich možné linearizovať a odhady parametrov sa<br />
získajú metódou najmenších štvorcov. Modely (d), (e), (f) sú nelineárne a odhady parametrov<br />
sa získavajú špeciálnymi numerickými metódami.<br />
3.4.<strong>1.</strong>1 Štatistické posúdenie vhodnosti trendovej funkcie<br />
Posúdenie vhodnosti trendovej funkcie sa vykonáva pomocou:<br />
• Indexu korelácie,<br />
• Indexu determinácie (tj. podiel vysvetlenej a celkovej variability závisle premennej<br />
veličiny) by mal byť blízky 1,<br />
ktoré vyjadrujú kvalitu prognózy “ex-post”<br />
• Prioritné je však vecné posúdenie vhodnosti trendovej funkcie, pretože je potrebné<br />
zvažovať ako sa “asi” môže skúmaný ukazovateľ v budúcich obdobiach vyvíjať<br />
3.4.2 Analýza sezónnej zložky v časovom rade<br />
Dekompozičný prístup predpokladá:<br />
• multiplikatívny model ČR: Yt = Tt . St . Et
• analýzu trendu v ČR (ak je prítomný) vhodnou trendovou funkciou: Tt = yt, = f(t)<br />
• analýzu sezónnej zložky potom pomocou sezónnych indexov:<br />
y<br />
y<br />
t<br />
S<br />
t ,<br />
t<br />
,<br />
kde y t , sú hodnoty získané vyrovnaním časového radu vhodnou trendovou funkciou<br />
pre t = 1,2…T<br />
Analýza sezónnej zložky se často vykonáva až po očistení dát od trendovej zložky. V<br />
podstate pri nej ide o určenie časového úseku, po ktorého uplynutí majú dáta zas rovnakú<br />
hodnotu, príp. ovplyvnenú trendovou a náhodnou zložkou.<br />
Pre štúdium sezónnej zložky se používá niekoľko typov modelov. V ekonomických<br />
modeloch býva spravidla zrejmá veľkosť periódy (štvrťrok, mesiac), v iných prípadech je<br />
nutné i túto dĺžku odhadovať (v hydrogeologii napr. výšku hladiny spodných vôd). Používa sa<br />
tu i harmonicka analýza, ktorá modeluje priebeh dát pomocou niekoľkých členov<br />
Fourierového radu. Parametre se určujú použitím numerických metód.<br />
Príklad 9.7: Časový rad 112, 149, 238, 354, 580, 867 udáva zisk (v tisícoch dolárov) istej<br />
spoločnosti v prvých šiestich rokoch jej existencie.<br />
a) Graficky znázornite priebeh tohto časového radu.<br />
b) Vypočítajte koeficienty rastu<br />
c) Z grafu časovej rady a vyjadrenia koeficientov rastu je možné usúdiť, že časový rad má<br />
t<br />
1<br />
exponenciálny trend f (t) 0 . Odhadnite jeho parametre.<br />
d) Nájdite odhad zisku spoločnosti v 7. a 8. roku jej existencie.<br />
<br />
e) Zistite index determinácie a zostrojte graf f (t),f (t)<br />
, t = 1, ..., 6.<br />
Riešenie:<br />
ad a)<br />
900<br />
800<br />
700<br />
600<br />
500<br />
400<br />
300<br />
200<br />
100<br />
0<br />
0 1 2 3 4 5 6 7<br />
ad b) Koeficienty rastu: 149/112 = 1,33, 238/149 = 1,597, 354/238 = 1,487, 580/354 =<br />
1,628, 867/580 = 1,495. Vidíme, že koeficienty rastu sú približne konštantné.<br />
t<br />
ad c) Model f (t) 0 1 linearizujeme a metódou najmenších štvorcov získame odhady<br />
ln b 0 = 4, 227983, ln b 1 = 0,420199. Odlogaritmováním dostaneme b 0 = 68,57875, b 1 =<br />
1,522265.<br />
<br />
7 <br />
8<br />
ad d) y 68,57875 1,522265 1299, y 68,57875 1,522265 1977<br />
7<br />
8
ad e) ID 2 = 0,996<br />
900<br />
800<br />
700<br />
600<br />
500<br />
400<br />
300<br />
200<br />
100<br />
0<br />
0 100 200 300 400 500 600 700 800 900<br />
Ako index determinácie, tak aj graf<br />
<br />
f (t),f (t)<br />
správne.<br />
svedčia o tom, že model bol zvolený<br />
3.4.3 Odhad trendu časového radu pomocou kĺzavých priemerov<br />
Predpokladá sa, že časový rad sa riadi aditívnym modelom popísaným v 3.5.<strong>1.</strong> Odhad<br />
trendu v bode t získame určitým spriemerovaním pôvodných pozorovaní z istého okolia<br />
uvažovaného časového okamihu t. Môžeme si predstaviť, že pozdĺž danej časovej rady kĺže<br />
okienko, v ktorého rámci sa priemeruje. Nech toto okienko zahŕňa d členov naľavo od bodu t<br />
a d členov napravo od bodu t. Hovoríme potom o vyhladzovacom okienku šírky h = 2d + <strong>1.</strong><br />
Prvých a posledných d hodnôt trendu neodhadujeme, pretože pre<br />
t 1, ,d n d 1, ,n<br />
nie je vyhladzovacie okienko symetrické. Odhad trendu v<br />
strede vyhladzovacieho okienka je daný vzťahom:<br />
2d<br />
1<br />
1<br />
fˆ (t) y t d y t d 1 y t d<br />
y t d k , t = d+1, ..., n-d.<br />
2d 1<br />
2d 1 k 0<br />
Veľmi dôležitou otázkou je stanovenie šírky vyhladzovacieho okienka. Ak je okienko<br />
príliš široké, bude sa odhad trendu blížiť priamke (hovorí sa, že je prehladený) a zároveň sa<br />
stratí veľký počet členov na začiatku a na konci časovej rady. Ak je okienko úzke, bude sa<br />
odhad trendu blížiť pôvodným hodnotám (hovorí sa, že odhad je podhladený). Najčastejšie sa<br />
volí šírka okienka h = 3, 5, 7.<br />
Príklad 8.: Časový rad 215, 219, 222, 235, 202, 207, 187, 204, 174, 172, 201, 272 udáva<br />
ročné objemy vývozu piva (v miliónoch litrov) z Československa v rokoch 1980 až 199<strong>1.</strong><br />
Odhadnite trend tejto časovej rady pomocou kĺzavých priemerov s vyhladzovacím<br />
okienkom šírky 3 a potom 5.<br />
Graficky znázornite priebeh časovej rady s odhadnutým trendom.<br />
Riešenie:<br />
rok vývoz kp3 kp5<br />
1980 215 x x<br />
1981 219 218,667 x<br />
1982 222 225,333 218,6<br />
1983 235 219,667 217<br />
1984 202 214,667 210,6<br />
1985 207 198,667 207<br />
1986 187 199,333 194,8<br />
1987 204 188,333 188,8<br />
1988 174 183,333 187,6<br />
1989 172 182,333 204,6
1990 201 215 x<br />
1991 272 x x<br />
Grafické znázornenie časového radu s odhadnutým trendom<br />
h = 3 h = 5<br />
280<br />
280<br />
260<br />
260<br />
240<br />
240<br />
220<br />
220<br />
200<br />
200<br />
180<br />
180<br />
160<br />
1978 1980 1982 1984 1986 1988 1990 1992<br />
rok<br />
160<br />
1978 1980 1982 1984 1986 1988 1990 1992<br />
rok