29.06.2013 Views

capitolul 4 - Analiza matematica. MPT

capitolul 4 - Analiza matematica. MPT

capitolul 4 - Analiza matematica. MPT

SHOW MORE
SHOW LESS

Transform your PDFs into Flipbooks and boost your revenue!

Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.

CAPITOLUL 4<br />

CAPITOLUL 4<br />

CERCETAREA STATISTICĂ PRIN SONDAJ<br />

Consideraţii preliminare<br />

În capitolele precedente am discutat despre posibilităţile de culegere a<br />

datelor pe baza metodelor de observare totală sau parţială, ca şi despre<br />

modalităţile de descriere a datelor prin indicatori statistici, uzual obţinuţi pe<br />

baza colectivităţilor parţiale. Am văzut, de asemenea, că inferenţa statistică<br />

reprezintă procesul prin care obţinem informaţii şi tragem concluzii<br />

referitoare la colectivităţi generale, pe baza eşantioanelor. Există două<br />

tehnici generale pentru realizarea inferenţei statistice: procesul de estimare<br />

şi cel de testare a ipotezelor statistice.<br />

În <strong>capitolul</strong> acesta vom urmări să cunoaştem fundamentele procesului de<br />

estimaţie şi ale celui de testare a ipotezelor statistice, vitale pentru<br />

desfăurarea unor cercetări statistice.<br />

Termeni cheie<br />

criteriu de semnificaţie. parametru<br />

distribuţie de eşantionare probabilitatea unei erori de genul I<br />

eroare de estimaţie probabilitatea unei erori de genul II<br />

eroare de genul I selecţie statică<br />

eroare de genul II sondaj aleator simplu<br />

eroare limită admisibilă sondaj aleator tipic<br />

eroare medie de reprezentativitate sondaj cu revenire<br />

eşantion sondaj fără revenire<br />

estimaţie sondaj în cuiburi<br />

estimator test statistic<br />

interval de încredere volum al eşantionului<br />

ipoteză statistică


STATISTICĂ ECONOMICĂ<br />

Noţiuni teoretice<br />

4.1. INTRODUCERE<br />

Cercetarea statistică urmăreşte obţinerea informaţiilor ce permit caracterizarea,<br />

din punct de vedere cantitativ, a fenomenelor de masă. Există două<br />

modalităţi de obţinere a acestor informaţii şi anume: se pot culege date<br />

despre toate unităţile ce alcătuiesc colectivitatea cercetată sau se poate selecta<br />

o subcolectivitate pe care să o analizăm şi pe baza informaţiilor obţinute<br />

să tragem concluzii, să generalizăm rezultatele pentru colectivitatea de<br />

ansamblu. Prima cale prezentată este cea a unei cercetări statistice totale,<br />

iar cea de-a doua a cercetării statistice prin sondaj. În condiţiile economico-sociale<br />

de astăzi, când este nevoie de informaţii rapide, multiple şi<br />

complexe, metoda principală de obţinere a informaţiilor statistice tinde să<br />

devină, practic, aceea a sondajului statistic, prin care se obţin date empirice<br />

şi, printr-o interpretare probabilistică, se estimează indicatori pentru populaţia<br />

totală.<br />

Metoda sondajului poate aşadar să salveze timp şi bani oferind informaţii<br />

despre seturi largi de date fără ca să fie necesară observarea şi cercetarea<br />

tuturor elementelor ce alcătuiesc colectivitatea. Procesul va cuprinde atunci<br />

două etape:<br />

— etapa descriptivă, în care se culeg date şi se calculează indicatorii ce<br />

caracterizează subcolectivitatea analizată<br />

— etapa inferenţială, în care rezultatele obţinute pentru această subcolectivitate<br />

se extind, în termeni probabilistici, la colectivitatea generală.<br />

Este de menţionat faptul că, dacă metodele statistice descriptive pot fi<br />

aplicate atât unei colectivităţi totale cât şi uneia parţiale, în schimb etapa de<br />

inferenţă statistică este specifică cercetării prin sondaj.<br />

4.2. NOŢIUNI SPECIFICE<br />

DEFINIŢIE: Selecţia statistică reprezintă operaţia de extragere a unei<br />

părţi dintr-o colectivitate statistică, a unei subcolectivităţi numită şi<br />

eşantion, mostră, colectivitate parţială sau colectivitate de selecţie.


CAPITOLUL 4<br />

Vom nota volumul colectivităţii generale cu N şi volumul colectivităţii<br />

de selecţie cu n, 1 ≤ n ≤ N-1. În cazul în care datele au fost sistematizate în r<br />

grupe după variaţia unei caracteristici de grupare, vom avea:<br />

r<br />

=<br />

i=<br />

1<br />

N N<br />

(4.1)<br />

r<br />

=<br />

i=<br />

1<br />

i<br />

n n<br />

(4.2)<br />

i<br />

Media aritmetică, principalul indicator al tendinţei centrale, va fi notat<br />

cu µ în cazul în care este parametrul colectivităţii totale şi cu x în cazul în<br />

care este un indicator obţinut printr-o cercetare statistică prin sondaj.<br />

Parametrul colectivităţii generale se calculează:<br />

N<br />

x i<br />

i 1<br />

=<br />

N<br />

= µ (4.3)<br />

sau dacă datele au fost sistematizate în r grupe obţinându-se o serie de distribuţie<br />

de frecvenţe:<br />

r<br />

x iN<br />

i<br />

i−1<br />

µ =<br />

i = 1,<br />

r<br />

(4.4)<br />

r<br />

N<br />

i=<br />

1<br />

i<br />

Indicatorul statistic obţinut pentru eşantion – media – estimatorul parametrului,<br />

este:<br />

x<br />

n<br />

x<br />

i 1<br />

= =<br />

n<br />

i<br />

sau în cazul unei serii de distribuţii de frecvenţe:<br />

(4.5)


STATISTICĂ ECONOMICĂ<br />

x in<br />

i<br />

i=<br />

1<br />

x =<br />

(4.6)<br />

r<br />

n<br />

i=<br />

1<br />

i<br />

Un alt indicator important, dispersia, se va nota cu σ 2 dacă este parametru<br />

obţinut în colectivitatea generală şi cu s 2 dacă este estimatorul parametrului,<br />

obţinut pe un eşantion.<br />

Astfel, parametrul colectivităţii generale este:<br />

N<br />

<br />

=<br />

2<br />

( xi<br />

− µ )<br />

2<br />

σ<br />

i 1<br />

x =<br />

(4.7)<br />

N<br />

respectiv în cazul datelor grupate:<br />

r 2<br />

( xi<br />

− µ ) Ni<br />

2<br />

σ =<br />

i=<br />

1<br />

x (4.8)<br />

r<br />

Ni<br />

i=<br />

1<br />

iar estimatorul dispersiei din colectivitatea generală, anume dispersia eşantionului:<br />

s<br />

2<br />

x<br />

n<br />

( xi<br />

− x)<br />

=<br />

i=<br />

1<br />

n −1<br />

2<br />

=<br />

n<br />

x<br />

i=<br />

1<br />

sau în cazul distribuţiei de frecvenţe:<br />

2<br />

i<br />

n<br />

2<br />

<br />

xi<br />

<br />

i 1 <br />

−<br />

=<br />

<br />

n<br />

<br />

<br />

<br />

<br />

n −1<br />

(4.9)


s<br />

CAPITOLUL 4<br />

⎛ r<br />

2<br />

⎞<br />

⎜ ∑ x ⎟<br />

r<br />

in<br />

i<br />

2 ⎜ = ⎟<br />

∑ x n −<br />

i 1<br />

r<br />

i<br />

i ⎜ r ⎟<br />

2 i=<br />

1<br />

∑ ( x −<br />

⎜ ∑ ⎟<br />

i x)<br />

ni<br />

⎜<br />

ni<br />

⎟<br />

2 =<br />

⎝ i=<br />

1<br />

=<br />

i 1<br />

=<br />

⎠<br />

x (4.10)<br />

r<br />

r<br />

∑ ni<br />

−1<br />

∑ ni<br />

−1<br />

i=<br />

1<br />

i=<br />

1<br />

Atunci când eşantioanele sunt de volum mare (n>30), se poate renunţa la<br />

scăderea lui 1 din numitorul dispersiei.<br />

În cazul caracteristicilor binare (de tip alternativ), simbolurile perechi<br />

utilizate pentru parametrii din populaţia generală şi pentru estimatorii obţinuţi<br />

în eşantion vor fi: pentru media aritmetică:<br />

— parametrul colectivităţii generale:<br />

M<br />

p = (4.11)<br />

N<br />

— estimatorul obţinut în eşantion:<br />

m<br />

f = (4.12)<br />

n<br />

Dispersia caracteristicii alternative se va nota în populaţia generală cu:<br />

2<br />

σ = p(<br />

1−<br />

p)<br />

(4.13)<br />

iar în eşantion (estimatorul dispersiei din colectivitatea generală):<br />

s 2<br />

( 1−<br />

f )<br />

= f<br />

(4.14)


STATISTICĂ ECONOMICĂ<br />

<br />

• x<br />

Populaþie (colectivitate generalã)<br />

eºantion<br />

Fig. 4.1 - Procesul inferenţei statistice<br />

4.3. TIPURI DE SONDAJ<br />

În selecţia aleatoare se disting următoarele tipuri de sondaj:<br />

— sondajul simplu aleator;<br />

— sondajul tipic (stratificat);<br />

— sondajul de serii (cuiburi);<br />

— sondajul în mai multe trepte;<br />

— sondaj secvenţial.<br />

4.4. DISTRIBUŢII DE EŞANTIONARE. PROPRIETĂŢI ALE<br />

DISTRIBUŢIILOR DE EŞANTIONARE<br />

Deoarece datele din eşantioane sunt valori observate ale variabilelor aleatoare,<br />

indicatorii statistici calculaţi pentru un eşantion vor varia într-un mod<br />

aleator de la eşantion la eşantion.<br />

Populaţia statistică<br />

(colectivitatea)<br />

Eşantion Eşantion Eşantion<br />

Indicator Indicator Indicator


CAPITOLUL 4<br />

În privinţa mediei de selecţie, indicator statistic obţinut pe eşantion,<br />

trebuie arătat că, indiferent de forma distribuţiei de frecvenţe din colectivitatea<br />

generală, media distribuţiei de eşantionare a mediei de selecţie ( x ) este<br />

egală cu µ, media colectivităţii generale (pentru eşantioane mari).<br />

µ ( x)<br />

= µ<br />

Un alt parametru al distribuţiei de eşantionare, dispersia medie de<br />

sondaj se calculează ca:<br />

2<br />

2 σ<br />

σ = (4.15)<br />

x n<br />

Eroarea standard a mediei de sondaj este σ , adică abaterea medie<br />

x<br />

pătratică a mediei de selecţie x de la parametrul µ:<br />

2<br />

σ x σ<br />

σ = =<br />

x<br />

(4.16)<br />

x n n<br />

Evident, cum σx 2 (dispersia colectivităţii generale) şi σ (abaterea medie<br />

pătratică din colectivitatea generală) sunt necunoscute, ele se estimează prin<br />

s 2 (dispersia de sondaj) şi s (abaterea mediei pătratice de sondaj). Se obţine,<br />

astfel, estimatorul dispersiei mediei de sondaj ( 2<br />

s ): x<br />

2<br />

s<br />

2 x<br />

s =<br />

x n<br />

(4.17)<br />

şi estimatorul erorii medii a mediei de sondaj (adică eroarea medie de<br />

reprezentativitate):


STATISTICĂ ECONOMICĂ<br />

s<br />

s<br />

x<br />

x<br />

= (4.18)<br />

n<br />

În privinţa distribuţiei de eşantionare a mediei de selecţie, să mai notăm<br />

că în cazul populaţiilor normal distribuite (cu distribuţii de probabilitate<br />

normală), distribuţia de eşantionare a mediei de selecţie este normală,<br />

indiferent de numărul elementelor din eşantion (de volumul eşantionului).<br />

4.5. SONDAJUL ALEATOR SIMPLU REPETAT<br />

4.5.1. Determinarea erorii medii de reprezentativitate<br />

În cazul unei variabile cantitative, de tip nealternativ, pentru estimarea<br />

parametrului media colectivităţii generale (µ) este necesar să calculăm media<br />

de sondaj ( x ) (formulele 4.5 sau 4.6).<br />

Dispersia mediilor de selecţie este:<br />

s<br />

2<br />

x<br />

2<br />

s x<br />

= (4.19)<br />

n<br />

Eroarea medie de reprezentativitate (abaterea medie pătratică a mediei<br />

de sondaj) se determnină pe baza datelor din eşantion ca:<br />

s<br />

x<br />

2<br />

s x s<br />

= = x<br />

(4.20)<br />

n n<br />

4.5.2. Determinarea erorii limită<br />

Pentru a construi acest interval de încredere vom determina, întâi, eroarea<br />

limită maximă admisibilă. Cum media de sondaj ( x ) este variabilă<br />

aleatoare normal distribuită, de medie µ şi abaterea medie pătratică σ =σx / n,<br />

x<br />

înseamnă că variabila normală normată (redusă) corespunzătoare este:


x<br />

CAPITOLUL 4<br />

x − µ<br />

z = (4.21)<br />

σ<br />

x − µ<br />

z = (4.22)<br />

s<br />

x<br />

Pentru probabilitatea cu care garantăm rezultatele 100(1-α)%, eroarea<br />

limită (maximă) admisibilă este:<br />

sx<br />

∆<br />

x<br />

= zα<br />

/ 2s<br />

x<br />

= zα<br />

/ 2<br />

(4.23)<br />

n<br />

4.5.3. Determinarea intervalului de încredere pentru media µ<br />

Intervalul de încredere calculat pe baza erorii limită maximă admisibilă<br />

este:<br />

s<br />

x ± zα<br />

/ 2<br />

n<br />

Pentru un eşantion de volum normal sau mare, mărimea relativă a<br />

intervalului de încredere poate să fie prezentată schematic astfel (Fig. 4.3)<br />

s x<br />

s x<br />

x<br />

Media eşantionului<br />

Interval de încredere pentru 1-α=0.999<br />

Interval de încredere pentru 1-α=0.99<br />

Interval de încredere pentru 1-α=0.95<br />

Interval de încredere pentru 1-α=0.90<br />

Fig. 4.3 - Mărimea relativă a intervalului de încredere<br />

pentru un eşantion de volum mare


x<br />

STATISTICĂ ECONOMICĂ<br />

x − ∆ < µ < x + ∆<br />

(4.24)<br />

x<br />

Intervalul de încredere ( x ± ∆ ) este garantat cu nivelul de încredere<br />

x<br />

ales, ceea ce face ca această estimare să fie preferabilă estimării punctuale.<br />

Intervalul de încredere pentru nivelul total al caracteristicii este:<br />

N(<br />

x<br />

− ∆<br />

x<br />

N<br />

) < x<br />

i=<br />

1<br />

i<br />

<<br />

N(<br />

x<br />

+ ∆<br />

x<br />

)<br />

(4.25)<br />

EXEMPLUL 4.1: Să se determine intervalul de încredere, garantat cu o<br />

probabilitate de 99%, pentru media şi nivelul total al unei caracteristici<br />

numerice X, dacă eşantionul selectat aleator repetat de 36 de unităţi, adică<br />

5% din colectivitatea generală este de medie 800 şi abatere medie pătratică<br />

60.<br />

Rezolvare: Eroarea medie de reprezentativitate va fi:<br />

s =<br />

x<br />

2<br />

sx<br />

n<br />

Eroarea limită maximă admisibilă:<br />

∆ x α<br />

= z / 2s<br />

= 2.<br />

58 ⋅10<br />

= 25.<br />

8<br />

x<br />

s 60<br />

=<br />

x<br />

= = 10<br />

n 6<br />

Intervalul de încredere pentru parametrul colectivităţii generale este dat<br />

de:<br />

x − ∆ < µ < x + ∆<br />

x<br />

x<br />

800-25.8 < m < 800+25.8<br />

774.2 < m < 825.8<br />

iar pentru nivelul total al caracteristicii studiate:<br />

N( x − ∆ ) < x i < N(<br />

x + ∆ )<br />

x <br />

x<br />

557424 < x i < 594576<br />

Acest intervale de încredere sunt garantate cu o probabilitate de 99%.


sau<br />

sau<br />

CAPITOLUL 4<br />

4.5.4. Determinarea volumului eşantionului<br />

s<br />

z<br />

x<br />

/ 2 ⋅ = ∆<br />

x<br />

n<br />

α (4.26)<br />

sx<br />

L<br />

zα<br />

/ 2 ⋅ =<br />

(4.27)<br />

n 2<br />

Soluţia poate fi scrisă ca:<br />

2 2<br />

( zα<br />

/ 2 ) ⋅s<br />

x<br />

n =<br />

2<br />

∆<br />

x<br />

n =<br />

4(<br />

z<br />

2<br />

α / 2 )<br />

2<br />

L<br />

⋅s<br />

2 x<br />

(4.28)<br />

(4.29)<br />

Desigur, şi aici sx 2 se foloseşte ca o estimaţie a lui 2 σ x , în general necunoscută.<br />

Valoarea aproximativă a lui sx 2 poate fi cunoscută dintr-o cercetare<br />

prin sondaj anterioară. Ca o alternativă, putem aproxima amplitudinea împrăştierii<br />

Ax a observaţiilor şi apoi, sub presupunerea tendinţei de normalitate<br />

a distribuţiei, putem calcula:<br />

sx ≅ A x / 6<br />

(4.30)<br />

EXEMPLUL 4.2: Să se determine volumul eşantionului necesar pentru a<br />

estima media unei colectivităţi (µ) cu o eroare limită de 0.2 şi o probabilitate<br />

de garantare a rezultatelor de 95%, ştiind dintr-o cercetare anterioară că<br />

dispersia sx 2 este aproximativ egală cu 6.1. Aceaşi cerinţă pentru lungimea<br />

intervalului de încredere de 0.2.<br />

Rezolvare: Pentru:<br />

0.<br />

2 ∆<br />

x =<br />

100(1-α)% = 95% => zα/2 = z0.025 = 1.96


STATISTICĂ ECONOMICĂ<br />

sx 2 = 6.1<br />

rezultă:<br />

2 2<br />

z s<br />

2<br />

/ 2 ⋅ x ( 1.<br />

96)<br />

⋅ 6.<br />

1<br />

n = =<br />

= 585.<br />

84 ≅ 586<br />

2<br />

2<br />

∆ ( 0.<br />

2)<br />

x<br />

α<br />

unităţi statistice<br />

În cazul în care întreaga lungime a intervalului de încredere este de 0.2<br />

(evident o precizie crescută), vom avea:<br />

2 2<br />

4⋅<br />

z s<br />

2<br />

α/<br />

2<br />

⋅ x 4⋅<br />

( 1.<br />

96)<br />

⋅ 6.<br />

1<br />

n =<br />

=<br />

= 2343.<br />

36 ≅ 2344 unităţi statistice<br />

2<br />

2<br />

L ( 0.<br />

2)<br />

4.5.5. Determinarea probabilităţii de garantare a rezultatelor 100(1-α)%<br />

Coeficientul de încredere este 1-α, pentru care P(-zα/2 < Z < zα/2)=1-α.<br />

Atunci, din formula erorii limită (maximă) admisibilă rezultă:<br />

∆<br />

x<br />

n<br />

zα<br />

/ 2 =<br />

(4.31)<br />

s<br />

x<br />

Din tabelele privind distribuţia normală normată se poate determina apoi<br />

probabilitatea 100(1-α)% de garantare a rezultatelor.<br />

EXEMPLUL 4.3: Să se determine nivelul de încredere pentru estimaţia<br />

privind media colectivităţii generale (µ), dacă volumul eşantionului este<br />

n=100 unităţi statistice, media eşantionului x =258600, abaterea medie<br />

pătratică s=8000, iar intervalul de încredere dorit este de 4000.<br />

Rezolvare:<br />

şi<br />

z<br />

α / 2<br />

∆<br />

=<br />

x<br />

s<br />

n<br />

=<br />

2000 100<br />

8000<br />

= 2.<br />

5<br />

1-α=P(-2.5


CAPITOLUL 4<br />

4.5.6. Particularităţi ale sondajului de volum redus<br />

Dacă eşantionul este de volum redus (n


STATISTICĂ ECONOMICĂ<br />

4.6. SONDAJUL ALEATOR SIMPLU NEREPETAT<br />

4.6.1. Determinarea erorii medii de reprezentativitate<br />

Dispersia mediei de selecţie este dată de relaţia:<br />

2<br />

σ<br />

2 x N − n<br />

σ = ⋅<br />

(4.33)<br />

x n N −1<br />

şi estimată (în cazul σ 2 necunoscută) prin:<br />

s<br />

2<br />

x<br />

2<br />

s x N − n<br />

= ⋅<br />

(4.34)<br />

n N −1<br />

Abaterea medie pătratică a mediei de selecţie (măsurător al erorii medii<br />

de reprezentativitate) este:<br />

estimată prin:<br />

σx<br />

N − n<br />

σ = ⋅<br />

(4.35)<br />

x<br />

n N −1<br />

s<br />

x<br />

sx<br />

N − n s n<br />

= ⋅ ≅ x ⋅ 1−<br />

(4.36)<br />

n N −1<br />

n N<br />

N − n n<br />

Termenul ≅ 1−<br />

se numeşte coeficient de corecţie în populaţie<br />

N −1<br />

N<br />

finită sau factor de exhaustivitate, iar raportul n/N reprezintă fracţia de<br />

sondaj.<br />

4.6.2. Determinarea erorii limită<br />

Determinarea erorii limită maximă admisibilă se face, în cazul sondajului<br />

fără revenire, ţinând seama de eroarea medie de reprezentativitate:


CAPITOLUL 4<br />

s<br />

x<br />

∆<br />

x<br />

= zα<br />

/ 2 ( s<br />

x<br />

) = zα<br />

/ 2<br />

⋅<br />

n<br />

1−<br />

4.6.3. Determinarea intervalului de încredere pentru media µ<br />

n<br />

N<br />

<br />

<br />

<br />

<br />

(4.37)<br />

Intervalul de încredere pentru media µ din colectivitatea generală,<br />

corespunzător probabilităţii 100(1-α)% de garantare a rezultatelor este:<br />

x − ∆ < µ < x + ∆<br />

(4.38)<br />

x<br />

x<br />

s n<br />

s n<br />

zα<br />

/ 2 1−<br />

< µ < x + z / 1−<br />

(4.39)<br />

n N<br />

n N<br />

x − α 2<br />

s n N s n <br />

<br />

< < <br />

<br />

<br />

x − zα<br />

/ 2 1−<br />

<br />

xi<br />

N<br />

<br />

x + zα<br />

/ 1−<br />

<br />

(4.40)<br />

n N i=<br />

1 n N <br />

N 2<br />

EXEMPLUL 4.5: Un eşantion aleator de 80 de observaţii a fost selectat<br />

nerepetat dintr-o populaţie normal distribuită de volum N=800 de unităţi. În<br />

urma calculelor a rezultat valoarea medie a caracteristicii în eşantion<br />

x =14.1 şi abaterea medie pătratică sx=2.6. Să se determine intervalul de<br />

încredere, garantat cu o probabilitate de 95%, pentru media colectivităţii<br />

generale (µ) şi pentru valoarea agregată a caracteristicii<br />

N <br />

= x i .<br />

i 1 <br />

Rezolvare:<br />

s<br />

x<br />

=<br />

s<br />

x<br />

n<br />

∆x α<br />

1−<br />

n<br />

N<br />

=<br />

2.<br />

6<br />

80<br />

= z / 2 ⋅ s = z0.<br />

025 ⋅s<br />

=<br />

x<br />

x<br />

14.1-0.54< µ


10848 N<br />

i 1<br />

< =<br />

x <br />

i <<br />

11712<br />

STATISTICĂ ECONOMICĂ<br />

4.6.4. Determinarea volumului eşantionului<br />

2<br />

2 x<br />

2<br />

z s N z s<br />

α / 2<br />

α / 2<br />

n = =<br />

(4.41)<br />

2 2 2<br />

2 2<br />

z sx<br />

+ ∆ N z s<br />

α / 2 x 2 α / 2<br />

∆ +<br />

x N<br />

4.7. ESTIMAREA PROPOR ŢIEI ÎN CAZUL SONDAJULUI<br />

ALEATOR SIMPLU<br />

Utilizarea lui f pentru a estima populaţia p este similară cu utilizarea lui<br />

x pentru estimarea parametrului µ.<br />

4.7.1. Determinarea erorii medii de reprezentativitate<br />

Dispersia mediilor de selecţie (adică dispersia proporţiilor eşantioanelor)<br />

va fi atunci:<br />

2 p(<br />

1−<br />

p)<br />

σ f =<br />

(4.42)<br />

n<br />

estimată (pentru că, de obicei, proporţia p din colectivitatea generală este<br />

necunoscută), prin:<br />

f ( 1 f )<br />

s<br />

n<br />

2 −<br />

f = (4.43)<br />

Atunci, abaterea medie pătratică a proporţiilor din eşantioane, ce reprezintă<br />

eroarea medie de reprezentativitate este calculată, pe baza datelor<br />

din eşantion:<br />

f ( 1−<br />

f )<br />

sf = pentru selecţie repetată (4.44)<br />

n<br />

şi<br />

2


CAPITOLUL 4<br />

f ( 1−<br />

f ) ⎛ n ⎞<br />

sf = ⋅ ⎜1−<br />

⎟ pentru selecţie nerepetată (4.45)<br />

n ⎝ N ⎠<br />

4.7.2. Determinarea erorii limită<br />

Înlocuind eroarea medie de reprezentativitate calculată anterior obţinem<br />

eroarea limită (maximă admisibilă):<br />

şi<br />

f ( 1−<br />

f )<br />

α / 2s<br />

f = z / pentru selecţie repetată (4.46)<br />

n<br />

∆f = z α 2<br />

∆<br />

f(<br />

1−<br />

f)<br />

n <br />

α / 2sf<br />

= z / ⋅1<br />

− pentru selecţie nerepetată (4.47)<br />

n N<br />

f = z α 2<br />

4.7.3. Determinarea intervalului de încredere pentru proporţia p<br />

Intervalul de încredere pentru proporţia p din colectivitatea generală<br />

este dat de:<br />

adică:<br />

f-∆f < p < f+∆f (4.48)<br />

f ( 1−<br />

f )<br />

f − zα<br />

/ 2 < p<<br />

f + zα<br />

/ 2<br />

n<br />

şi<br />

f ( 1−<br />

f )<br />

n<br />

pentru selecţie repetată (4.49)<br />

f −zα<br />

/ 2<br />

f(<br />

1−f)<br />

n <br />

⋅1−<br />

< p<<br />

f + zα<br />

/ 2<br />

n N<br />

f(<br />

1−f)<br />

n <br />

⋅1−<br />

<br />

n N<br />

(4.50)<br />

pentru selecţie nerepetată, garantat cu o probabilitate 100(1-α)%.<br />

Pentru estimarea numărului de răspunsuri afirmative, intervalul de<br />

încredere este dat de:<br />

( f − ∆ ) < M < N(<br />

f + ∆ )<br />

(4.51)<br />

N f<br />

f


STATISTICĂ ECONOMICĂ<br />

EXEMPLUL 4.6: Presupunem că din 100 de persoane selectate aleator şi<br />

anchetate, 30 au o opinie favorabilă despre un produs nou. Să se estimeze cu<br />

o probabilitate de 90%, intervalul de încredere pentru proporţia opiniilor<br />

favorabile din colectivitatea generală (locuitorii unui oraş).<br />

Rezolvare:<br />

s f<br />

=<br />

∆ f α<br />

f ( 1−<br />

f )<br />

=<br />

n<br />

0.<br />

21<br />

=<br />

100<br />

= z / 2s<br />

f = z 0.<br />

05s<br />

f =<br />

0.<br />

046<br />

1.<br />

64<br />

0.3-0.075 < p < 0.3+0.075<br />

0.225 < p < 0.375<br />

⋅<br />

0.<br />

046<br />

4.7.4. Determinarea volumului eşantionului<br />

=<br />

0.<br />

075 ( 7.<br />

5%)<br />

Pentru selecţia aleatoare repetată volumul eşantionului este dată de<br />

relaţia:<br />

2<br />

z f ( 1−<br />

f )<br />

n = (4.52)<br />

∆<br />

2<br />

f<br />

iar pentru selecţia fără revenire este dată de relaţia:<br />

2<br />

2<br />

z f ( 1−<br />

f ) N z f ( 1−<br />

f )<br />

n = =<br />

(4.53)<br />

2 2<br />

2<br />

∆f<br />

N + z f ( 1−<br />

f ) 2 z f ( 1−<br />

f )<br />

∆f<br />

+<br />

N<br />

4.7.5. Determinarea probabilităţii de garantare a rezultatelor 100(1-α)%<br />

Pentru a obţine nivelul de încredere sau probabilitatea de garantare a rezultatelor,<br />

atunci când folosim proporţia f din eşantion pentru a estima proporţia<br />

p din colectivitatea generală, vom rezolva ecuaţia:<br />

∆f<br />

n<br />

zα<br />

/ 2 =<br />

(4.54)<br />

f ( 1−<br />

f )


şi apoi vom determina:<br />

P(-zα/2 < Z < zα/2) = 1-α<br />

CAPITOLUL 4<br />

4.8. SONDAJUL ALEATOR TIPIC (STRATIFICAT)<br />

Variaţia între straturi nu influenţează, în cazul selecţiei stratificate, eroarea<br />

medie de reprezentativitate, deoarece aeastă variaţie este precis reflectată<br />

în eşantion. Cu alte cuvinte, vom fi siguri că – cel puţin din punctul de vedere<br />

al factorului de stratificare – populaţia este corect reprezentată în<br />

eşantion şi criteriul ales nu mai constituie sursă pentru eroarea medie de reprezentativitate.<br />

Considerând distribuţia unei colectivităţi după variabila X, putem<br />

reprezenta grafic eficacitatea unei stratificări în cadrul sondajului ca în Fig.<br />

4.4.<br />

x<br />

0 0<br />

a) b)<br />

Fig. 4.4 - Sondaj stratificat: a. sondaj ineficient; b. sondaj eficient<br />

4.8.1. Calcului indicatorilor pentru o variabilă cantitativă<br />

Pentru a calcula un estimator nedeplasat al mediei colectivităţii generale,<br />

vom determina media aritmetică ponderată a mediilor straturilor. Astfel,<br />

în colectivitatea generală, vom introduce notaţiile:<br />

x


Ni<br />

x ij<br />

j 1<br />

i =<br />

Ni<br />

=<br />

STATISTICĂ ECONOMICĂ<br />

µ media stratului i (4.55)<br />

h<br />

µ iN<br />

µ =<br />

i=<br />

1<br />

h<br />

N<br />

i=<br />

1<br />

Pentru eşantion vom nota:<br />

x<br />

ni<br />

xij<br />

j 1<br />

i =<br />

ni<br />

=<br />

h<br />

i<br />

i<br />

media generală (4.56)<br />

media stratului i (4.57)<br />

xi<br />

ni<br />

i=<br />

1<br />

x = media eşantionului (4.58)<br />

h<br />

n<br />

i=<br />

1<br />

i<br />

Putem scrie eroarea medie de reprezentativitate:<br />

2 x<br />

σ<br />

σ =<br />

(4.59)<br />

xst n<br />

sau, pe baza datelor din eşantion (pentru că<br />

cut):<br />

s<br />

x st<br />

2 x<br />

2<br />

σ , în general, este necunos-<br />

s<br />

= (4.60)<br />

n<br />

Atunci, eroarea limită (maximă admisibilă) este:<br />

∆ = zα s<br />

(4.61)<br />

xst<br />

/ 2 xst<br />

pentru probabilitatea 100(1-α)% de garantare a rezultatelor.


CAPITOLUL 4<br />

Intervalul de încredere pentru media colectivităţii generale este dat<br />

de:<br />

x − ∆ < µ < x + ∆<br />

(4.62)<br />

st<br />

xst<br />

st<br />

xst<br />

Determinarea volumului eşantionului se va efectua şi aici pornind de<br />

la formula erorii limită:<br />

∆<br />

x st<br />

= z<br />

α / 2<br />

⋅ s<br />

xst<br />

= z<br />

care prin prelucrare conduce la:<br />

2<br />

z / 2s<br />

x<br />

n =<br />

2<br />

∆<br />

x st<br />

α<br />

α / 2<br />

2 x<br />

s<br />

n<br />

(4.63)<br />

În cazul selecţiei aleatoare stratificate fără revenire, se va ţine seama<br />

de coeficientul corecţiei finite în populaţie şi vom avea:<br />

— eroarea medie de reprezentativitate:<br />

s<br />

xst<br />

=<br />

2 x<br />

s n <br />

1−<br />

=<br />

n N <br />

2<br />

1 nis<br />

xi n <br />

1−<br />

<br />

n n N <br />

— eroarea limită admisibilă la un coeficient de încredere (1-α):<br />

∆ = zα<br />

/ 2<br />

xst<br />

— volumul eşantionului:<br />

2<br />

sx<br />

<br />

1<br />

−<br />

n <br />

n <br />

<br />

N <br />

(4.64)<br />

(4.65)


STATISTICĂ ECONOMICĂ<br />

2 2<br />

z<br />

α / 2<br />

sx<br />

n = (4.66)<br />

2 2<br />

2 z<br />

α / 2<br />

sx<br />

∆ +<br />

x st N<br />

EXEMPLUL 4.7: Un cercetător este interesat în determinarea salarului mediu<br />

pentru angajaţii unei firme. În firmă lucrează 850 de persoane, din care<br />

500 angajaţi permanent şi 350 colaboratori. Se selectează aleator stratificat<br />

proporţional 10% din efectiv: 50 de angajaţi permanent şi 35 colaboratori şi<br />

se doreşte garantarea estimaţiei cu o probabilitate de 95%. În urma prelucrării<br />

datelor, se obţin următoarele rezultate:<br />

Angajaţi permanent Colaboratori<br />

x 1 = 1620 mii lei x 2 = 2100 mii lei<br />

sx1= 235 mii lei sx2= 410 mii lei<br />

n1= 50 n2= 35<br />

Rezolvare:<br />

x<br />

st<br />

xi<br />

Ni<br />

xi<br />

ni<br />

= = = 1817.<br />

65 mii lei<br />

N n<br />

2<br />

2 s ni<br />

s<br />

xi<br />

x = =<br />

ni<br />

i<br />

i<br />

101702.<br />

94<br />

Eroarea medie de reprezentativitate (se presupune selecţie nerepetată)<br />

este:<br />

s<br />

x st<br />

2<br />

sx<br />

n 101702.<br />

94<br />

= 1−<br />

=<br />

⋅ 0.<br />

9 = 32.<br />

82 mii lei<br />

n N 85<br />

Eroarea limită pentru α=0.05 este:<br />

∆ = zα<br />

s = z s = 1.<br />

96 ⋅ 32.<br />

82 = 64.<br />

33 mii lei<br />

x st<br />

/ 2 xst<br />

0.<br />

025 xst


CAPITOLUL 4<br />

Intervalul de încredere pentru salariul mediu din colectivitatea generală:<br />

1817.65 – 64.33 < µ < 1817.65 + 64.33 mii lei<br />

1753.32 < µ < 1881.99 mii lei<br />

garantat cu o probabilitate de 95%.<br />

4.8.2. Alegerea numărului de straturi şi repartizarea volumului eşantionului<br />

pe straturi<br />

Alegerea numărului de straturi impune două remarci. Prima este de<br />

ordin teoretic: ideală este stratificarea la maximum, adică alegerea unui număr<br />

cât mai mare de grupe. Cea de-a doua este de ordin practic: rareori se<br />

pot depăşi 10 straturi şi, de obicei, limitele straturilor sunt impuse de informaţiile<br />

disponibile din baza de sondaj.<br />

Determinarea volumului eşantionului în cazul selecţiei aleatoare stratificate<br />

impune şi alocarea acestuia pe straturi. Există două posibilităţi de repartizare<br />

a volumului eşantionului (n) pe straturi: o repartiţie proporţională<br />

şi o repartiţie optimă.<br />

Dacă dispersiile din interiorul straturilor sunt egale, pentru un număr dat<br />

de unităţi statistice eşantionate (n), dispersia pe ansamblu este minimă când<br />

fracţiile de sondaj sunt identice (selecţie tipică proporţională). Proporţiile<br />

sunt determinate de ponderile straturilor, adică:<br />

n<br />

i<br />

N<br />

=<br />

i<br />

n<br />

(4.67)<br />

N<br />

Cea de-a doua posibilitate de repartizare (selecţie tipică optimă) presupune<br />

o fracţie de sondaj variabilă de la un strat la altul.<br />

Pentru o selecţie tipică optimă, fracţiile de sondaj vor fi proporţionale cu<br />

abaterile medii pătratice.Atunci, pentru stratul i volumul subeşantionului<br />

este dat de:<br />

n<br />

i<br />

h<br />

i 1<br />

=<br />

N s<br />

=<br />

i xi<br />

n<br />

(4.68)<br />

h<br />

N s<br />

<br />

i=<br />

1<br />

şi evident n n .<br />

i =<br />

i<br />

xi


STATISTICĂ ECONOMICĂ<br />

4.8.3. Estimarea proporţiei pentru o variabilă alternativă<br />

Eroarea medie de reprezentativitate, calculată pe baza datelor din<br />

eşantion este dată de:<br />

— pentru selecţie stratificată repetată:<br />

s fst<br />

f ( 1−<br />

f )<br />

= (4.69)<br />

n<br />

— pentru selecţie stratificată nerepetată:<br />

f ( 1−<br />

f ) n <br />

sfst = 1−<br />

<br />

(4.70)<br />

n N <br />

Eroarea limită (maximă admisibilă), la un prag de semnificaţie α, se<br />

calculează ca:<br />

∆ = zα ⋅s<br />

(4.71)<br />

fst<br />

/ 2<br />

fst<br />

iar intervalul de încredere pentru proporţia p din colectivitatea generală:<br />

f − ∆ p<<br />

f + ∆<br />

(4.72)<br />

fst<br />

fst<br />

De asemenea, se adaptează corespunzător formulele pentru determinarea<br />

volumului eşantionului şi repartizarea acestuia pe straturi.<br />

4.9. SONDAJUL DE SERII (CUIBURI)<br />

În sondajul în cuiburi, populaţia, mai mult sau mai puţin împrăştiată,<br />

este subdivizată în cuiburi. Pentru fiecare astfel de cuib se poate calcula o<br />

madie i<br />

x . În fiecare din cuiburile extrase toţi indivizii sunt observaţi şi<br />

atunci media xi , este cunoscută fără eroare (de sondaj, neeliminându-se<br />

posibilitatea erorilor de observaţie).


CAPITOLUL 4<br />

Hazardul poate alege un cuib asemănător cu altul, deci în care cele două<br />

medii de cuib să fie egale. De aceea fluctuaţia de eşantionaj depinde de ine-<br />

galitatea mediilor de grup. Dispersia totală σ 2 x<br />

este egală cu suma dis-<br />

persiilor între cuiburi (grupuri) σ 2 c şi intracuiburi. Cum σ 2 x este fixă, precizia<br />

unui sondaj în cuiburi este cu atât mai bună cu cât σ 2 c este mai mică şi<br />

cu cat varianţa în interiorul cuiburilor este mai mare. (Fig. 4.5).<br />

x<br />

0 0<br />

a. b.<br />

Fig. 4.5 - Eficacitatea unui sondaj în cuiburi: a. cuiburi eficiente: mediile de grup<br />

marcate prin puncte sunt puţin dispersate; b. cuiburi ineficiente: mediile cuiburilor<br />

sunt la fel de dispersate ca şi valorile individuale<br />

Dispersia (varianţa) totală este alcătuită din doi termeni: dispersia intercuiburi<br />

şi dispersia intracuiburi:<br />

2 Ni<br />

2 Ni<br />

2 2 Ni<br />

2<br />

σ = ( Xi<br />

−X)<br />

+ σi<br />

= σc<br />

+ σi<br />

, (4.73)<br />

N N N<br />

Dispersia intergrupuri exprimă inegalitatea diverselor medii de grupă<br />

între ele.<br />

4.10. TESTAREA IPOTEZELOR STATISTICE ÎN FUNDAMENTAREA<br />

DECIZIILOR<br />

x


STATISTICĂ ECONOMICĂ<br />

Deseori, managerii trebuie să fie pregătiţi să ia decizii privind acţiunile<br />

viitoare pe baza informaţiilor disponibile. În procesul de luare a deciziilor,<br />

ei emit ipoteze pe care le pot testa ştiinţific utilizând metodele şi tehnicile<br />

statistice.<br />

DEFINIŢIE: Ipoteza statistică este ipoteza care se face cu privire la parametrul<br />

unei repartiţii sau la legea de repartiţie pe care o urmează anumite<br />

variabile aleatoare.<br />

4.10.1. Concepte şi erori în testarea ipotezelor statistice<br />

În statistică, ipotezele apar întotdeauna în perechi: ipoteza nulă şi ipoteza<br />

alternativă. Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă<br />

şi este notată, uzual, H0. Ea constă întotdeauna în admiterea caracterului<br />

întâmplător al deosebirilor, adică în presupunerea că nu există deosebiri<br />

esenţiale. Respingerea ipotezei nule care este testată implică acceptarea unei<br />

alte ipoteze. Această altă ipoteză este numită ipoteză alternativă, notată H1.<br />

Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu<br />

de semnificaţie. O secvenţă generală de paşi se aplică la toate situaţiile<br />

de testare a ipotezelor statistice.<br />

1) Se identifică ipoteza statistică specială despre parametrul<br />

populaţiei sau legea de repartiţie (H0).<br />

2) Întotdeauna ipoteza nulă este însoţită de ipoteza alternativă (de cercetat),<br />

H1, ce reprezintă o teorie care contrazice ipoteza nulă. Ea va fi acceptată<br />

doar când există suficiente dovezi, evidenţe, pentru a se stabili că<br />

este adevărată.<br />

3) Se calculează indicatorii statistici în eşantion, utilizaţi pentru a accepta<br />

sau a respinge ipoteza nulă şi se stabileşte testul statistic ce va fi utilizat<br />

drept criteriu de acceptare sau de respingere a ipotezei nule.<br />

4) Se stabileşte regiunea critică, Rc<br />

Regiunea critică este delimitată de valoarea critică, C – punctul de<br />

tăietură în stabilirea acesteia.


CAPITOLUL 4<br />

În baza legii numerelor mari, numai într-un număr foarte mic de cazuri<br />

punctul rezultat din sondaj va cădea în Rc, majoritatea vor cădea în afara<br />

regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în regiunea<br />

critică, cu toate că ipoteza nulă despre parametrul populaţiei este adevărată.<br />

Eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată, se<br />

numeşte eroare de genul întâi. Probabilitatea comiterii unei astfel de erori<br />

reprezintă riscul de genul întâi (α) şi se numeşte nivel sau prag de semnificaţie.<br />

Nivelul de încredere al unui test statistic este (1-α) iar în expresie<br />

procentuală, (1-α)100 reprezintă probabilitatea de garantare a rezultatelor.<br />

Eroarea pe cere o facem acceptând o ipoteză nulă, deşi este falsă, se numeşte<br />

eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei<br />

astfel de erori se notează cu β. Puterea testului statistic este (1-β).<br />

f( x)<br />

β<br />

H 0<br />

µ 0<br />

C<br />

α<br />

H 1<br />

Fig. 4.6 - Legătura dintre probabilităţile α şi β<br />

s<br />

Cum s = x , o dată cu creşterea volumului n al eşantionului, aba-<br />

x n<br />

terile medii pătratice ale distribuţiilor pentru H0 şi H1 devin mai mici şi,<br />

evident, atât α, cât şi β descresc (Fig. 4.7).<br />

µ 1<br />

x


f( x)<br />

STATISTICĂ ECONOMICĂ<br />

β<br />

H 0<br />

µ 0<br />

C<br />

H 1<br />

Fig. 4.7 - α şi β când volumul eşantionului n' > n<br />

5) După ce am stabilit pragul de semnificaţie şi regiunea critică, trecem la<br />

pasul următor, în care vom face principalele presupuneri despre populaţia<br />

sau populaţiile ce sunt eşantionate (normalitate etc.).<br />

6) Se calculează apoi testul statistic şi se determină valoarea sa numerică,<br />

pe baza datelor din eşantion.<br />

7) La ultimul pas, se desprind concluziile: ipoteza nulă este fie acceptată,<br />

fie respinsă, astfel:<br />

a) dacă valoarea numerică a testului statistic cade în regiunea<br />

critică (Rc), respingem ipoteza nulă şi concluzionăm că<br />

ipoteza alternativă este adevărată. Vom şti că această decizie<br />

este incorectă doar în 100 α % din cazuri;<br />

b) dacă valoarea numerică a testului nu cade în regiunea<br />

critică (Rc), se acceptă ipoteza nulă H0.<br />

Ipoteza alternativă poate avea una din trei forme (pe care le vom exemplifica<br />

pentru testarea egalităţii parametrului „media colectivităţii generale“,<br />

µ cu valoarea µ0):<br />

i) H0: µ = µ0<br />

H1: µ ≠ µ0 (µ < µ0 sau µ > µ0);<br />

şi acest test este un test bilateral;<br />

ii) H0: µ = µ0<br />

α<br />

µ 1<br />

x


CAPITOLUL 4<br />

H1: µ > µ0<br />

care este un test unilateral dreapta;<br />

iii) H0: µ = µ0<br />

H1: µ < µ0<br />

care este un test unilateral stânga.<br />

α/2 α/2<br />

α α<br />

µ µ µ<br />

a) b) c)<br />

Fig. 4.8 - Regiunea critică pentru: a) test bilateral; b) test unilateral stânga; c) test<br />

unilateral dreapta<br />

4.10.2. Testarea ipotezei privind media populaţiei generale (µ)<br />

pentru eşantioane de volum mare<br />

i) în cazul testului bilateral, ipotezele sunt:<br />

H0: µ = µ0 (µ - µ0=0)<br />

H1: µ ≠ µ0 (µ - µ0≠0) (adică µ < µ0 sau µ > µ0);<br />

x − µ 0 x − µ 0 x − µ 0<br />

z = = ≈<br />

(4.74)<br />

σ σ n s n<br />

x<br />

Regiunea critică Rc este dată de:<br />

Rc: z< - z α/2 sau z> z α/2<br />

x<br />

x − µ 0<br />

Respingem H0 dacă < −zα<br />

/ 2<br />

σ n<br />

x −<br />

µ<br />

0<br />

sau > zα<br />

/ 2<br />

σ x n<br />

x<br />

x


STATISTICĂ ECONOMICĂ<br />

ii) pentru testul unilateral dreapta, ipotezele sunt:<br />

H0: µ = µ0 (µ - µ0=0)<br />

H1: µ > µ0 (µ - µ0>0);<br />

x − µ 0<br />

> z<br />

σ n<br />

Respingem ipoteza H0 dacă α<br />

iii) Pentru testul unilateral stânga, ipotezele sunt:<br />

H0: µ = µ0 (µ - µ0=0)<br />

H1: µ < µ0 (µ - µ0


CAPITOLUL 4<br />

H0: (µ1- µ2) = D<br />

H1: (µ1- µ2) ≠ D [(µ1- µ2)>D sau (µ1- µ2) D<br />

iii) test unilateral stânga<br />

H0: (µ1- µ2) = D<br />

H1: (µ1- µ2) < D<br />

Testul statistic utilizat are forma:<br />

z =<br />

( x − x 2 )<br />

1<br />

σ ( x −x<br />

2 )<br />

1<br />

− D<br />

Regiunea critică este dată de:<br />

i) z< - z α/2 sau z> z α/2<br />

ii) z> z α<br />

iii) z< - z α<br />

4.10.4. Testarea ipotezei privind media populaţiei generale (µ)<br />

pentru eşantioane de volum redus<br />

În locul statisticii z care necesită cunoaşterea (sau o bună aproximare) a<br />

σ , vom folosi statistica:<br />

lui x<br />

x − µ 0 x − µ 0<br />

t = =<br />

(4.77)<br />

s s n<br />

x<br />

x<br />

2<br />

( x x)<br />

unde: s<br />

i −<br />

= <br />

2 x<br />

n −1<br />

i) test bilateral


STATISTICĂ ECONOMICĂ<br />

H0: µ = µ0<br />

H1: µ ≠ µ0 (µ < µ0 sau µ > µ0);<br />

ii) test unilateral dreapta<br />

H0: µ = µ0<br />

H1: µ > µ0<br />

iii) test unilateral stânga<br />

H0: µ = µ0<br />

H1: µ < µ0<br />

Testul statistic utilizat:<br />

x − µ 0 x − µ 0<br />

t = =<br />

s s n<br />

x<br />

x<br />

Presupunerea specială ce trebuie făcută este aceea că populaţia generală<br />

este normal sau aproximativ normal distribuită.<br />

Regiunea critică este dată de:<br />

i) t > t α/2,n-1 sau t < - t α/2,n-1<br />

ii) t > t α,n-1<br />

iii) t < - t α,n-1<br />

4.10.5. Testarea ipotezei privind diferenţa dintre două medii pentru<br />

eşantioane de volum redus<br />

În condiţiile în care presupunem că cele două colectivităţi generale au<br />

2 2<br />

dispersii egale ( 2 σ x1<br />

= σ x = 2 σ x ), un estimator al dispersiei (variabilităţii)<br />

totale din cele două populaţii combinate este:<br />

n1<br />

2 n2<br />

( x x1)<br />

+ ( x − x 2 )<br />

i −<br />

i<br />

2 i=<br />

1<br />

i=<br />

1<br />

sc<br />

=<br />

(4.78)<br />

n + n − 2<br />

1<br />

2<br />

2


sau<br />

t =<br />

s<br />

2<br />

c<br />

2 ( n1<br />

−1)<br />

sx1<br />

+ ( n 2 −1)<br />

( n −1)<br />

+ ( n −1)<br />

CAPITOLUL 4<br />

( n −1)<br />

s + ( n −1)<br />

s<br />

s<br />

=<br />

x<br />

=<br />

1 x 2 x<br />

(4.79)<br />

n + n − 2<br />

1<br />

2<br />

2 2<br />

Ipotezele statistice vor fi, în aceste condiţii:<br />

i) test bilateral<br />

H0: µ1 = µ2 (µ1- µ2 = D)<br />

H1: µ1 ≠ µ2 (µ1- µ2 ≠ D)<br />

ii) test unilateral dreapta<br />

H0: µ1 = µ2 (µ1- µ2 = D)<br />

H1: µ1 > µ2 (µ1- µ2 > D)<br />

iii) test unilateral stânga<br />

H0: µ1 = µ2 (µ1- µ2 = D)<br />

H1: µ1 < µ2 (µ1- µ2 < D)<br />

Testul statistic t va avea forma:<br />

( x − x 2 ) − D ( x − x 2 )<br />

1<br />

=<br />

2<br />

1 1 <br />

sc<br />

<br />

+<br />

n1<br />

n <br />

<br />

2 <br />

2<br />

sx1<br />

Regiunea critică este dată de:<br />

i) t< - t / 2,<br />

n1+<br />

n2<br />

−2<br />

ii) t> t α , n1+<br />

n2<br />

−2<br />

iii) t< – t n + n −2<br />

1<br />

2 1<br />

( n −1)<br />

+ s ( n −1)<br />

1<br />

1<br />

− D<br />

2<br />

x2<br />

sau t> t α α / 2,<br />

n1+<br />

n 2 −2<br />

α<br />

, 1 2<br />

2<br />

2<br />

⋅<br />

2 2<br />

( n + n − 2)<br />

n1n<br />

2 1 2<br />

n1<br />

+ n 2


STATISTICĂ ECONOMICĂ<br />

Întrebări recapitulative<br />

1. Definiţi conceptul de selecţie statistică.<br />

2. Arătaţi avantajele utilizării selecţiei statistice.<br />

3. Ce este eşantionul?<br />

4. Ce reprezintă noţiunea de „eroare de estimaţie“?<br />

5. Arătaţi principalele noţiuni perechi specifice selecţiei statistice.<br />

6. Care sunt principalele etape ale realizării unui sondaj statistic?<br />

7. Prin ce se caracterizează o distribuţie de eşantionare?<br />

8. Sondajul aleator simplu repetat: caracteristici, eroare de reprezentativitate,<br />

eroare limită admisibilă, interval de încredere.<br />

9. Cum se determină volumul eşantionului în cazul sondajului aleator<br />

simplu repetat şi nerepetat. De ce factori depinde?<br />

10. Determinarea erorii de reprezentativitate, a erorii maxim admisibile şi<br />

a intervalului de încredere în cazul utilizării sondajului simplu aleator nerepetat.<br />

11. Cum se determină probabilitatea de garantare a rezultatelor în cazul<br />

sondajului aleator simplu repetat şi nerepetat?<br />

12. Determinarea intervalului de încredere în cazul sondajului aleator<br />

simplu de volum redus.<br />

13. Determinaţi indicatorii de sondaj, erorile şi intervalul de încredere<br />

pentru caracteristica alternativă în cazul sondajului simplu aleator.<br />

14. Volumul eşantionului şi probabilitatea de garantare a rezultatelor<br />

pentru caracteristica alternativă — sondaj simplu aleator.<br />

15. Ce particularităţi prezintă sondajul stratificat?<br />

16. În ce condiţii se foloseşte şi care sunt avantajele utilizării sondajului<br />

tipic în cercetarea statistică?<br />

17. Calculul indicatorilor de sondaj pentru o caracteristică cantitativă, în<br />

cazul sondajului tipic.<br />

18. Cum se alege numărul de straturi şi cum se repartizează volumul<br />

eşantionului pe straturi?<br />

19. Calculul indicatorilor de sondaj pentru o caracteristică alternativă în<br />

cazul sondajului stratificat.<br />

20. Sondajul de serii — concept, utilizare, particularităţi, avantaje.<br />

21. Ce reprezintă ipoteza nulă într-un proces de testare de ipoteze statistice?<br />

22. Ce reprezintă ipoteza alternativă într-un proces de testare de ipoteze<br />

statistice?


CAPITOLUL 4<br />

23. Ce reprezintă testul sau criteriul de semnificaţie?<br />

24. Ce reprezintă regiunea critică?<br />

25. Când comitem o eroare de genul întâi?<br />

26. Când comitem o eroare de genul al doilea?<br />

27. Ce reprezintă α şi β?<br />

28. Care sunt paşii în construirea unui test statistic?<br />

29. Cum se testează ipoteza privind media unei colectivităţi generale în<br />

cazul eşantioanelor mari?<br />

30. Cum se testează ipoteza privind media unei colectivităţi generale în<br />

cazul eşantioanelor de volum redus?<br />

31. Cum se testează ipoteza privind diferenţa dintre mediile a două colectivităţi<br />

generale, în cazul eşantioanelor mari?<br />

32. Cum se testează ipoteza privind diferenţa dintre mediile a două colectivităţi<br />

generale, în cazul eşantioanelor de volum redus?

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!