capitolul 4 - Analiza matematica. MPT
capitolul 4 - Analiza matematica. MPT
capitolul 4 - Analiza matematica. MPT
Transform your PDFs into Flipbooks and boost your revenue!
Leverage SEO-optimized Flipbooks, powerful backlinks, and multimedia content to professionally showcase your products and significantly increase your reach.
CAPITOLUL 4<br />
CAPITOLUL 4<br />
CERCETAREA STATISTICĂ PRIN SONDAJ<br />
Consideraţii preliminare<br />
În capitolele precedente am discutat despre posibilităţile de culegere a<br />
datelor pe baza metodelor de observare totală sau parţială, ca şi despre<br />
modalităţile de descriere a datelor prin indicatori statistici, uzual obţinuţi pe<br />
baza colectivităţilor parţiale. Am văzut, de asemenea, că inferenţa statistică<br />
reprezintă procesul prin care obţinem informaţii şi tragem concluzii<br />
referitoare la colectivităţi generale, pe baza eşantioanelor. Există două<br />
tehnici generale pentru realizarea inferenţei statistice: procesul de estimare<br />
şi cel de testare a ipotezelor statistice.<br />
În <strong>capitolul</strong> acesta vom urmări să cunoaştem fundamentele procesului de<br />
estimaţie şi ale celui de testare a ipotezelor statistice, vitale pentru<br />
desfăurarea unor cercetări statistice.<br />
Termeni cheie<br />
criteriu de semnificaţie. parametru<br />
distribuţie de eşantionare probabilitatea unei erori de genul I<br />
eroare de estimaţie probabilitatea unei erori de genul II<br />
eroare de genul I selecţie statică<br />
eroare de genul II sondaj aleator simplu<br />
eroare limită admisibilă sondaj aleator tipic<br />
eroare medie de reprezentativitate sondaj cu revenire<br />
eşantion sondaj fără revenire<br />
estimaţie sondaj în cuiburi<br />
estimator test statistic<br />
interval de încredere volum al eşantionului<br />
ipoteză statistică
STATISTICĂ ECONOMICĂ<br />
Noţiuni teoretice<br />
4.1. INTRODUCERE<br />
Cercetarea statistică urmăreşte obţinerea informaţiilor ce permit caracterizarea,<br />
din punct de vedere cantitativ, a fenomenelor de masă. Există două<br />
modalităţi de obţinere a acestor informaţii şi anume: se pot culege date<br />
despre toate unităţile ce alcătuiesc colectivitatea cercetată sau se poate selecta<br />
o subcolectivitate pe care să o analizăm şi pe baza informaţiilor obţinute<br />
să tragem concluzii, să generalizăm rezultatele pentru colectivitatea de<br />
ansamblu. Prima cale prezentată este cea a unei cercetări statistice totale,<br />
iar cea de-a doua a cercetării statistice prin sondaj. În condiţiile economico-sociale<br />
de astăzi, când este nevoie de informaţii rapide, multiple şi<br />
complexe, metoda principală de obţinere a informaţiilor statistice tinde să<br />
devină, practic, aceea a sondajului statistic, prin care se obţin date empirice<br />
şi, printr-o interpretare probabilistică, se estimează indicatori pentru populaţia<br />
totală.<br />
Metoda sondajului poate aşadar să salveze timp şi bani oferind informaţii<br />
despre seturi largi de date fără ca să fie necesară observarea şi cercetarea<br />
tuturor elementelor ce alcătuiesc colectivitatea. Procesul va cuprinde atunci<br />
două etape:<br />
— etapa descriptivă, în care se culeg date şi se calculează indicatorii ce<br />
caracterizează subcolectivitatea analizată<br />
— etapa inferenţială, în care rezultatele obţinute pentru această subcolectivitate<br />
se extind, în termeni probabilistici, la colectivitatea generală.<br />
Este de menţionat faptul că, dacă metodele statistice descriptive pot fi<br />
aplicate atât unei colectivităţi totale cât şi uneia parţiale, în schimb etapa de<br />
inferenţă statistică este specifică cercetării prin sondaj.<br />
4.2. NOŢIUNI SPECIFICE<br />
DEFINIŢIE: Selecţia statistică reprezintă operaţia de extragere a unei<br />
părţi dintr-o colectivitate statistică, a unei subcolectivităţi numită şi<br />
eşantion, mostră, colectivitate parţială sau colectivitate de selecţie.
CAPITOLUL 4<br />
Vom nota volumul colectivităţii generale cu N şi volumul colectivităţii<br />
de selecţie cu n, 1 ≤ n ≤ N-1. În cazul în care datele au fost sistematizate în r<br />
grupe după variaţia unei caracteristici de grupare, vom avea:<br />
r<br />
=<br />
i=<br />
1<br />
N N<br />
(4.1)<br />
r<br />
=<br />
i=<br />
1<br />
i<br />
n n<br />
(4.2)<br />
i<br />
Media aritmetică, principalul indicator al tendinţei centrale, va fi notat<br />
cu µ în cazul în care este parametrul colectivităţii totale şi cu x în cazul în<br />
care este un indicator obţinut printr-o cercetare statistică prin sondaj.<br />
Parametrul colectivităţii generale se calculează:<br />
N<br />
x i<br />
i 1<br />
=<br />
N<br />
= µ (4.3)<br />
sau dacă datele au fost sistematizate în r grupe obţinându-se o serie de distribuţie<br />
de frecvenţe:<br />
r<br />
x iN<br />
i<br />
i−1<br />
µ =<br />
i = 1,<br />
r<br />
(4.4)<br />
r<br />
N<br />
i=<br />
1<br />
i<br />
Indicatorul statistic obţinut pentru eşantion – media – estimatorul parametrului,<br />
este:<br />
x<br />
n<br />
x<br />
i 1<br />
= =<br />
n<br />
i<br />
sau în cazul unei serii de distribuţii de frecvenţe:<br />
(4.5)
STATISTICĂ ECONOMICĂ<br />
x in<br />
i<br />
i=<br />
1<br />
x =<br />
(4.6)<br />
r<br />
n<br />
i=<br />
1<br />
i<br />
Un alt indicator important, dispersia, se va nota cu σ 2 dacă este parametru<br />
obţinut în colectivitatea generală şi cu s 2 dacă este estimatorul parametrului,<br />
obţinut pe un eşantion.<br />
Astfel, parametrul colectivităţii generale este:<br />
N<br />
<br />
=<br />
2<br />
( xi<br />
− µ )<br />
2<br />
σ<br />
i 1<br />
x =<br />
(4.7)<br />
N<br />
respectiv în cazul datelor grupate:<br />
r 2<br />
( xi<br />
− µ ) Ni<br />
2<br />
σ =<br />
i=<br />
1<br />
x (4.8)<br />
r<br />
Ni<br />
i=<br />
1<br />
iar estimatorul dispersiei din colectivitatea generală, anume dispersia eşantionului:<br />
s<br />
2<br />
x<br />
n<br />
( xi<br />
− x)<br />
=<br />
i=<br />
1<br />
n −1<br />
2<br />
=<br />
n<br />
x<br />
i=<br />
1<br />
sau în cazul distribuţiei de frecvenţe:<br />
2<br />
i<br />
n<br />
2<br />
<br />
xi<br />
<br />
i 1 <br />
−<br />
=<br />
<br />
n<br />
<br />
<br />
<br />
<br />
n −1<br />
(4.9)
s<br />
CAPITOLUL 4<br />
⎛ r<br />
2<br />
⎞<br />
⎜ ∑ x ⎟<br />
r<br />
in<br />
i<br />
2 ⎜ = ⎟<br />
∑ x n −<br />
i 1<br />
r<br />
i<br />
i ⎜ r ⎟<br />
2 i=<br />
1<br />
∑ ( x −<br />
⎜ ∑ ⎟<br />
i x)<br />
ni<br />
⎜<br />
ni<br />
⎟<br />
2 =<br />
⎝ i=<br />
1<br />
=<br />
i 1<br />
=<br />
⎠<br />
x (4.10)<br />
r<br />
r<br />
∑ ni<br />
−1<br />
∑ ni<br />
−1<br />
i=<br />
1<br />
i=<br />
1<br />
Atunci când eşantioanele sunt de volum mare (n>30), se poate renunţa la<br />
scăderea lui 1 din numitorul dispersiei.<br />
În cazul caracteristicilor binare (de tip alternativ), simbolurile perechi<br />
utilizate pentru parametrii din populaţia generală şi pentru estimatorii obţinuţi<br />
în eşantion vor fi: pentru media aritmetică:<br />
— parametrul colectivităţii generale:<br />
M<br />
p = (4.11)<br />
N<br />
— estimatorul obţinut în eşantion:<br />
m<br />
f = (4.12)<br />
n<br />
Dispersia caracteristicii alternative se va nota în populaţia generală cu:<br />
2<br />
σ = p(<br />
1−<br />
p)<br />
(4.13)<br />
iar în eşantion (estimatorul dispersiei din colectivitatea generală):<br />
s 2<br />
( 1−<br />
f )<br />
= f<br />
(4.14)
STATISTICĂ ECONOMICĂ<br />
<br />
• x<br />
Populaþie (colectivitate generalã)<br />
eºantion<br />
Fig. 4.1 - Procesul inferenţei statistice<br />
4.3. TIPURI DE SONDAJ<br />
În selecţia aleatoare se disting următoarele tipuri de sondaj:<br />
— sondajul simplu aleator;<br />
— sondajul tipic (stratificat);<br />
— sondajul de serii (cuiburi);<br />
— sondajul în mai multe trepte;<br />
— sondaj secvenţial.<br />
4.4. DISTRIBUŢII DE EŞANTIONARE. PROPRIETĂŢI ALE<br />
DISTRIBUŢIILOR DE EŞANTIONARE<br />
Deoarece datele din eşantioane sunt valori observate ale variabilelor aleatoare,<br />
indicatorii statistici calculaţi pentru un eşantion vor varia într-un mod<br />
aleator de la eşantion la eşantion.<br />
Populaţia statistică<br />
(colectivitatea)<br />
Eşantion Eşantion Eşantion<br />
Indicator Indicator Indicator
CAPITOLUL 4<br />
În privinţa mediei de selecţie, indicator statistic obţinut pe eşantion,<br />
trebuie arătat că, indiferent de forma distribuţiei de frecvenţe din colectivitatea<br />
generală, media distribuţiei de eşantionare a mediei de selecţie ( x ) este<br />
egală cu µ, media colectivităţii generale (pentru eşantioane mari).<br />
µ ( x)<br />
= µ<br />
Un alt parametru al distribuţiei de eşantionare, dispersia medie de<br />
sondaj se calculează ca:<br />
2<br />
2 σ<br />
σ = (4.15)<br />
x n<br />
Eroarea standard a mediei de sondaj este σ , adică abaterea medie<br />
x<br />
pătratică a mediei de selecţie x de la parametrul µ:<br />
2<br />
σ x σ<br />
σ = =<br />
x<br />
(4.16)<br />
x n n<br />
Evident, cum σx 2 (dispersia colectivităţii generale) şi σ (abaterea medie<br />
pătratică din colectivitatea generală) sunt necunoscute, ele se estimează prin<br />
s 2 (dispersia de sondaj) şi s (abaterea mediei pătratice de sondaj). Se obţine,<br />
astfel, estimatorul dispersiei mediei de sondaj ( 2<br />
s ): x<br />
2<br />
s<br />
2 x<br />
s =<br />
x n<br />
(4.17)<br />
şi estimatorul erorii medii a mediei de sondaj (adică eroarea medie de<br />
reprezentativitate):
STATISTICĂ ECONOMICĂ<br />
s<br />
s<br />
x<br />
x<br />
= (4.18)<br />
n<br />
În privinţa distribuţiei de eşantionare a mediei de selecţie, să mai notăm<br />
că în cazul populaţiilor normal distribuite (cu distribuţii de probabilitate<br />
normală), distribuţia de eşantionare a mediei de selecţie este normală,<br />
indiferent de numărul elementelor din eşantion (de volumul eşantionului).<br />
4.5. SONDAJUL ALEATOR SIMPLU REPETAT<br />
4.5.1. Determinarea erorii medii de reprezentativitate<br />
În cazul unei variabile cantitative, de tip nealternativ, pentru estimarea<br />
parametrului media colectivităţii generale (µ) este necesar să calculăm media<br />
de sondaj ( x ) (formulele 4.5 sau 4.6).<br />
Dispersia mediilor de selecţie este:<br />
s<br />
2<br />
x<br />
2<br />
s x<br />
= (4.19)<br />
n<br />
Eroarea medie de reprezentativitate (abaterea medie pătratică a mediei<br />
de sondaj) se determnină pe baza datelor din eşantion ca:<br />
s<br />
x<br />
2<br />
s x s<br />
= = x<br />
(4.20)<br />
n n<br />
4.5.2. Determinarea erorii limită<br />
Pentru a construi acest interval de încredere vom determina, întâi, eroarea<br />
limită maximă admisibilă. Cum media de sondaj ( x ) este variabilă<br />
aleatoare normal distribuită, de medie µ şi abaterea medie pătratică σ =σx / n,<br />
x<br />
înseamnă că variabila normală normată (redusă) corespunzătoare este:
x<br />
CAPITOLUL 4<br />
x − µ<br />
z = (4.21)<br />
σ<br />
x − µ<br />
z = (4.22)<br />
s<br />
x<br />
Pentru probabilitatea cu care garantăm rezultatele 100(1-α)%, eroarea<br />
limită (maximă) admisibilă este:<br />
sx<br />
∆<br />
x<br />
= zα<br />
/ 2s<br />
x<br />
= zα<br />
/ 2<br />
(4.23)<br />
n<br />
4.5.3. Determinarea intervalului de încredere pentru media µ<br />
Intervalul de încredere calculat pe baza erorii limită maximă admisibilă<br />
este:<br />
s<br />
x ± zα<br />
/ 2<br />
n<br />
Pentru un eşantion de volum normal sau mare, mărimea relativă a<br />
intervalului de încredere poate să fie prezentată schematic astfel (Fig. 4.3)<br />
s x<br />
s x<br />
x<br />
Media eşantionului<br />
Interval de încredere pentru 1-α=0.999<br />
Interval de încredere pentru 1-α=0.99<br />
Interval de încredere pentru 1-α=0.95<br />
Interval de încredere pentru 1-α=0.90<br />
Fig. 4.3 - Mărimea relativă a intervalului de încredere<br />
pentru un eşantion de volum mare
x<br />
STATISTICĂ ECONOMICĂ<br />
x − ∆ < µ < x + ∆<br />
(4.24)<br />
x<br />
Intervalul de încredere ( x ± ∆ ) este garantat cu nivelul de încredere<br />
x<br />
ales, ceea ce face ca această estimare să fie preferabilă estimării punctuale.<br />
Intervalul de încredere pentru nivelul total al caracteristicii este:<br />
N(<br />
x<br />
− ∆<br />
x<br />
N<br />
) < x<br />
i=<br />
1<br />
i<br />
<<br />
N(<br />
x<br />
+ ∆<br />
x<br />
)<br />
(4.25)<br />
EXEMPLUL 4.1: Să se determine intervalul de încredere, garantat cu o<br />
probabilitate de 99%, pentru media şi nivelul total al unei caracteristici<br />
numerice X, dacă eşantionul selectat aleator repetat de 36 de unităţi, adică<br />
5% din colectivitatea generală este de medie 800 şi abatere medie pătratică<br />
60.<br />
Rezolvare: Eroarea medie de reprezentativitate va fi:<br />
s =<br />
x<br />
2<br />
sx<br />
n<br />
Eroarea limită maximă admisibilă:<br />
∆ x α<br />
= z / 2s<br />
= 2.<br />
58 ⋅10<br />
= 25.<br />
8<br />
x<br />
s 60<br />
=<br />
x<br />
= = 10<br />
n 6<br />
Intervalul de încredere pentru parametrul colectivităţii generale este dat<br />
de:<br />
x − ∆ < µ < x + ∆<br />
x<br />
x<br />
800-25.8 < m < 800+25.8<br />
774.2 < m < 825.8<br />
iar pentru nivelul total al caracteristicii studiate:<br />
N( x − ∆ ) < x i < N(<br />
x + ∆ )<br />
x <br />
x<br />
557424 < x i < 594576<br />
Acest intervale de încredere sunt garantate cu o probabilitate de 99%.
sau<br />
sau<br />
CAPITOLUL 4<br />
4.5.4. Determinarea volumului eşantionului<br />
s<br />
z<br />
x<br />
/ 2 ⋅ = ∆<br />
x<br />
n<br />
α (4.26)<br />
sx<br />
L<br />
zα<br />
/ 2 ⋅ =<br />
(4.27)<br />
n 2<br />
Soluţia poate fi scrisă ca:<br />
2 2<br />
( zα<br />
/ 2 ) ⋅s<br />
x<br />
n =<br />
2<br />
∆<br />
x<br />
n =<br />
4(<br />
z<br />
2<br />
α / 2 )<br />
2<br />
L<br />
⋅s<br />
2 x<br />
(4.28)<br />
(4.29)<br />
Desigur, şi aici sx 2 se foloseşte ca o estimaţie a lui 2 σ x , în general necunoscută.<br />
Valoarea aproximativă a lui sx 2 poate fi cunoscută dintr-o cercetare<br />
prin sondaj anterioară. Ca o alternativă, putem aproxima amplitudinea împrăştierii<br />
Ax a observaţiilor şi apoi, sub presupunerea tendinţei de normalitate<br />
a distribuţiei, putem calcula:<br />
sx ≅ A x / 6<br />
(4.30)<br />
EXEMPLUL 4.2: Să se determine volumul eşantionului necesar pentru a<br />
estima media unei colectivităţi (µ) cu o eroare limită de 0.2 şi o probabilitate<br />
de garantare a rezultatelor de 95%, ştiind dintr-o cercetare anterioară că<br />
dispersia sx 2 este aproximativ egală cu 6.1. Aceaşi cerinţă pentru lungimea<br />
intervalului de încredere de 0.2.<br />
Rezolvare: Pentru:<br />
0.<br />
2 ∆<br />
x =<br />
100(1-α)% = 95% => zα/2 = z0.025 = 1.96
STATISTICĂ ECONOMICĂ<br />
sx 2 = 6.1<br />
rezultă:<br />
2 2<br />
z s<br />
2<br />
/ 2 ⋅ x ( 1.<br />
96)<br />
⋅ 6.<br />
1<br />
n = =<br />
= 585.<br />
84 ≅ 586<br />
2<br />
2<br />
∆ ( 0.<br />
2)<br />
x<br />
α<br />
unităţi statistice<br />
În cazul în care întreaga lungime a intervalului de încredere este de 0.2<br />
(evident o precizie crescută), vom avea:<br />
2 2<br />
4⋅<br />
z s<br />
2<br />
α/<br />
2<br />
⋅ x 4⋅<br />
( 1.<br />
96)<br />
⋅ 6.<br />
1<br />
n =<br />
=<br />
= 2343.<br />
36 ≅ 2344 unităţi statistice<br />
2<br />
2<br />
L ( 0.<br />
2)<br />
4.5.5. Determinarea probabilităţii de garantare a rezultatelor 100(1-α)%<br />
Coeficientul de încredere este 1-α, pentru care P(-zα/2 < Z < zα/2)=1-α.<br />
Atunci, din formula erorii limită (maximă) admisibilă rezultă:<br />
∆<br />
x<br />
n<br />
zα<br />
/ 2 =<br />
(4.31)<br />
s<br />
x<br />
Din tabelele privind distribuţia normală normată se poate determina apoi<br />
probabilitatea 100(1-α)% de garantare a rezultatelor.<br />
EXEMPLUL 4.3: Să se determine nivelul de încredere pentru estimaţia<br />
privind media colectivităţii generale (µ), dacă volumul eşantionului este<br />
n=100 unităţi statistice, media eşantionului x =258600, abaterea medie<br />
pătratică s=8000, iar intervalul de încredere dorit este de 4000.<br />
Rezolvare:<br />
şi<br />
z<br />
α / 2<br />
∆<br />
=<br />
x<br />
s<br />
n<br />
=<br />
2000 100<br />
8000<br />
= 2.<br />
5<br />
1-α=P(-2.5
CAPITOLUL 4<br />
4.5.6. Particularităţi ale sondajului de volum redus<br />
Dacă eşantionul este de volum redus (n
STATISTICĂ ECONOMICĂ<br />
4.6. SONDAJUL ALEATOR SIMPLU NEREPETAT<br />
4.6.1. Determinarea erorii medii de reprezentativitate<br />
Dispersia mediei de selecţie este dată de relaţia:<br />
2<br />
σ<br />
2 x N − n<br />
σ = ⋅<br />
(4.33)<br />
x n N −1<br />
şi estimată (în cazul σ 2 necunoscută) prin:<br />
s<br />
2<br />
x<br />
2<br />
s x N − n<br />
= ⋅<br />
(4.34)<br />
n N −1<br />
Abaterea medie pătratică a mediei de selecţie (măsurător al erorii medii<br />
de reprezentativitate) este:<br />
estimată prin:<br />
σx<br />
N − n<br />
σ = ⋅<br />
(4.35)<br />
x<br />
n N −1<br />
s<br />
x<br />
sx<br />
N − n s n<br />
= ⋅ ≅ x ⋅ 1−<br />
(4.36)<br />
n N −1<br />
n N<br />
N − n n<br />
Termenul ≅ 1−<br />
se numeşte coeficient de corecţie în populaţie<br />
N −1<br />
N<br />
finită sau factor de exhaustivitate, iar raportul n/N reprezintă fracţia de<br />
sondaj.<br />
4.6.2. Determinarea erorii limită<br />
Determinarea erorii limită maximă admisibilă se face, în cazul sondajului<br />
fără revenire, ţinând seama de eroarea medie de reprezentativitate:
CAPITOLUL 4<br />
s<br />
x<br />
∆<br />
x<br />
= zα<br />
/ 2 ( s<br />
x<br />
) = zα<br />
/ 2<br />
⋅<br />
n<br />
1−<br />
4.6.3. Determinarea intervalului de încredere pentru media µ<br />
n<br />
N<br />
<br />
<br />
<br />
<br />
(4.37)<br />
Intervalul de încredere pentru media µ din colectivitatea generală,<br />
corespunzător probabilităţii 100(1-α)% de garantare a rezultatelor este:<br />
x − ∆ < µ < x + ∆<br />
(4.38)<br />
x<br />
x<br />
s n<br />
s n<br />
zα<br />
/ 2 1−<br />
< µ < x + z / 1−<br />
(4.39)<br />
n N<br />
n N<br />
x − α 2<br />
s n N s n <br />
<br />
< < <br />
<br />
<br />
x − zα<br />
/ 2 1−<br />
<br />
xi<br />
N<br />
<br />
x + zα<br />
/ 1−<br />
<br />
(4.40)<br />
n N i=<br />
1 n N <br />
N 2<br />
EXEMPLUL 4.5: Un eşantion aleator de 80 de observaţii a fost selectat<br />
nerepetat dintr-o populaţie normal distribuită de volum N=800 de unităţi. În<br />
urma calculelor a rezultat valoarea medie a caracteristicii în eşantion<br />
x =14.1 şi abaterea medie pătratică sx=2.6. Să se determine intervalul de<br />
încredere, garantat cu o probabilitate de 95%, pentru media colectivităţii<br />
generale (µ) şi pentru valoarea agregată a caracteristicii<br />
N <br />
= x i .<br />
i 1 <br />
Rezolvare:<br />
s<br />
x<br />
=<br />
s<br />
x<br />
n<br />
∆x α<br />
1−<br />
n<br />
N<br />
=<br />
2.<br />
6<br />
80<br />
= z / 2 ⋅ s = z0.<br />
025 ⋅s<br />
=<br />
x<br />
x<br />
14.1-0.54< µ
10848 N<br />
i 1<br />
< =<br />
x <br />
i <<br />
11712<br />
STATISTICĂ ECONOMICĂ<br />
4.6.4. Determinarea volumului eşantionului<br />
2<br />
2 x<br />
2<br />
z s N z s<br />
α / 2<br />
α / 2<br />
n = =<br />
(4.41)<br />
2 2 2<br />
2 2<br />
z sx<br />
+ ∆ N z s<br />
α / 2 x 2 α / 2<br />
∆ +<br />
x N<br />
4.7. ESTIMAREA PROPOR ŢIEI ÎN CAZUL SONDAJULUI<br />
ALEATOR SIMPLU<br />
Utilizarea lui f pentru a estima populaţia p este similară cu utilizarea lui<br />
x pentru estimarea parametrului µ.<br />
4.7.1. Determinarea erorii medii de reprezentativitate<br />
Dispersia mediilor de selecţie (adică dispersia proporţiilor eşantioanelor)<br />
va fi atunci:<br />
2 p(<br />
1−<br />
p)<br />
σ f =<br />
(4.42)<br />
n<br />
estimată (pentru că, de obicei, proporţia p din colectivitatea generală este<br />
necunoscută), prin:<br />
f ( 1 f )<br />
s<br />
n<br />
2 −<br />
f = (4.43)<br />
Atunci, abaterea medie pătratică a proporţiilor din eşantioane, ce reprezintă<br />
eroarea medie de reprezentativitate este calculată, pe baza datelor<br />
din eşantion:<br />
f ( 1−<br />
f )<br />
sf = pentru selecţie repetată (4.44)<br />
n<br />
şi<br />
2
CAPITOLUL 4<br />
f ( 1−<br />
f ) ⎛ n ⎞<br />
sf = ⋅ ⎜1−<br />
⎟ pentru selecţie nerepetată (4.45)<br />
n ⎝ N ⎠<br />
4.7.2. Determinarea erorii limită<br />
Înlocuind eroarea medie de reprezentativitate calculată anterior obţinem<br />
eroarea limită (maximă admisibilă):<br />
şi<br />
f ( 1−<br />
f )<br />
α / 2s<br />
f = z / pentru selecţie repetată (4.46)<br />
n<br />
∆f = z α 2<br />
∆<br />
f(<br />
1−<br />
f)<br />
n <br />
α / 2sf<br />
= z / ⋅1<br />
− pentru selecţie nerepetată (4.47)<br />
n N<br />
f = z α 2<br />
4.7.3. Determinarea intervalului de încredere pentru proporţia p<br />
Intervalul de încredere pentru proporţia p din colectivitatea generală<br />
este dat de:<br />
adică:<br />
f-∆f < p < f+∆f (4.48)<br />
f ( 1−<br />
f )<br />
f − zα<br />
/ 2 < p<<br />
f + zα<br />
/ 2<br />
n<br />
şi<br />
f ( 1−<br />
f )<br />
n<br />
pentru selecţie repetată (4.49)<br />
f −zα<br />
/ 2<br />
f(<br />
1−f)<br />
n <br />
⋅1−<br />
< p<<br />
f + zα<br />
/ 2<br />
n N<br />
f(<br />
1−f)<br />
n <br />
⋅1−<br />
<br />
n N<br />
(4.50)<br />
pentru selecţie nerepetată, garantat cu o probabilitate 100(1-α)%.<br />
Pentru estimarea numărului de răspunsuri afirmative, intervalul de<br />
încredere este dat de:<br />
( f − ∆ ) < M < N(<br />
f + ∆ )<br />
(4.51)<br />
N f<br />
f
STATISTICĂ ECONOMICĂ<br />
EXEMPLUL 4.6: Presupunem că din 100 de persoane selectate aleator şi<br />
anchetate, 30 au o opinie favorabilă despre un produs nou. Să se estimeze cu<br />
o probabilitate de 90%, intervalul de încredere pentru proporţia opiniilor<br />
favorabile din colectivitatea generală (locuitorii unui oraş).<br />
Rezolvare:<br />
s f<br />
=<br />
∆ f α<br />
f ( 1−<br />
f )<br />
=<br />
n<br />
0.<br />
21<br />
=<br />
100<br />
= z / 2s<br />
f = z 0.<br />
05s<br />
f =<br />
0.<br />
046<br />
1.<br />
64<br />
0.3-0.075 < p < 0.3+0.075<br />
0.225 < p < 0.375<br />
⋅<br />
0.<br />
046<br />
4.7.4. Determinarea volumului eşantionului<br />
=<br />
0.<br />
075 ( 7.<br />
5%)<br />
Pentru selecţia aleatoare repetată volumul eşantionului este dată de<br />
relaţia:<br />
2<br />
z f ( 1−<br />
f )<br />
n = (4.52)<br />
∆<br />
2<br />
f<br />
iar pentru selecţia fără revenire este dată de relaţia:<br />
2<br />
2<br />
z f ( 1−<br />
f ) N z f ( 1−<br />
f )<br />
n = =<br />
(4.53)<br />
2 2<br />
2<br />
∆f<br />
N + z f ( 1−<br />
f ) 2 z f ( 1−<br />
f )<br />
∆f<br />
+<br />
N<br />
4.7.5. Determinarea probabilităţii de garantare a rezultatelor 100(1-α)%<br />
Pentru a obţine nivelul de încredere sau probabilitatea de garantare a rezultatelor,<br />
atunci când folosim proporţia f din eşantion pentru a estima proporţia<br />
p din colectivitatea generală, vom rezolva ecuaţia:<br />
∆f<br />
n<br />
zα<br />
/ 2 =<br />
(4.54)<br />
f ( 1−<br />
f )
şi apoi vom determina:<br />
P(-zα/2 < Z < zα/2) = 1-α<br />
CAPITOLUL 4<br />
4.8. SONDAJUL ALEATOR TIPIC (STRATIFICAT)<br />
Variaţia între straturi nu influenţează, în cazul selecţiei stratificate, eroarea<br />
medie de reprezentativitate, deoarece aeastă variaţie este precis reflectată<br />
în eşantion. Cu alte cuvinte, vom fi siguri că – cel puţin din punctul de vedere<br />
al factorului de stratificare – populaţia este corect reprezentată în<br />
eşantion şi criteriul ales nu mai constituie sursă pentru eroarea medie de reprezentativitate.<br />
Considerând distribuţia unei colectivităţi după variabila X, putem<br />
reprezenta grafic eficacitatea unei stratificări în cadrul sondajului ca în Fig.<br />
4.4.<br />
x<br />
0 0<br />
a) b)<br />
Fig. 4.4 - Sondaj stratificat: a. sondaj ineficient; b. sondaj eficient<br />
4.8.1. Calcului indicatorilor pentru o variabilă cantitativă<br />
Pentru a calcula un estimator nedeplasat al mediei colectivităţii generale,<br />
vom determina media aritmetică ponderată a mediilor straturilor. Astfel,<br />
în colectivitatea generală, vom introduce notaţiile:<br />
x
Ni<br />
x ij<br />
j 1<br />
i =<br />
Ni<br />
=<br />
STATISTICĂ ECONOMICĂ<br />
µ media stratului i (4.55)<br />
h<br />
µ iN<br />
µ =<br />
i=<br />
1<br />
h<br />
N<br />
i=<br />
1<br />
Pentru eşantion vom nota:<br />
x<br />
ni<br />
xij<br />
j 1<br />
i =<br />
ni<br />
=<br />
h<br />
i<br />
i<br />
media generală (4.56)<br />
media stratului i (4.57)<br />
xi<br />
ni<br />
i=<br />
1<br />
x = media eşantionului (4.58)<br />
h<br />
n<br />
i=<br />
1<br />
i<br />
Putem scrie eroarea medie de reprezentativitate:<br />
2 x<br />
σ<br />
σ =<br />
(4.59)<br />
xst n<br />
sau, pe baza datelor din eşantion (pentru că<br />
cut):<br />
s<br />
x st<br />
2 x<br />
2<br />
σ , în general, este necunos-<br />
s<br />
= (4.60)<br />
n<br />
Atunci, eroarea limită (maximă admisibilă) este:<br />
∆ = zα s<br />
(4.61)<br />
xst<br />
/ 2 xst<br />
pentru probabilitatea 100(1-α)% de garantare a rezultatelor.
CAPITOLUL 4<br />
Intervalul de încredere pentru media colectivităţii generale este dat<br />
de:<br />
x − ∆ < µ < x + ∆<br />
(4.62)<br />
st<br />
xst<br />
st<br />
xst<br />
Determinarea volumului eşantionului se va efectua şi aici pornind de<br />
la formula erorii limită:<br />
∆<br />
x st<br />
= z<br />
α / 2<br />
⋅ s<br />
xst<br />
= z<br />
care prin prelucrare conduce la:<br />
2<br />
z / 2s<br />
x<br />
n =<br />
2<br />
∆<br />
x st<br />
α<br />
α / 2<br />
2 x<br />
s<br />
n<br />
(4.63)<br />
În cazul selecţiei aleatoare stratificate fără revenire, se va ţine seama<br />
de coeficientul corecţiei finite în populaţie şi vom avea:<br />
— eroarea medie de reprezentativitate:<br />
s<br />
xst<br />
=<br />
2 x<br />
s n <br />
1−<br />
=<br />
n N <br />
2<br />
1 nis<br />
xi n <br />
1−<br />
<br />
n n N <br />
— eroarea limită admisibilă la un coeficient de încredere (1-α):<br />
∆ = zα<br />
/ 2<br />
xst<br />
— volumul eşantionului:<br />
2<br />
sx<br />
<br />
1<br />
−<br />
n <br />
n <br />
<br />
N <br />
(4.64)<br />
(4.65)
STATISTICĂ ECONOMICĂ<br />
2 2<br />
z<br />
α / 2<br />
sx<br />
n = (4.66)<br />
2 2<br />
2 z<br />
α / 2<br />
sx<br />
∆ +<br />
x st N<br />
EXEMPLUL 4.7: Un cercetător este interesat în determinarea salarului mediu<br />
pentru angajaţii unei firme. În firmă lucrează 850 de persoane, din care<br />
500 angajaţi permanent şi 350 colaboratori. Se selectează aleator stratificat<br />
proporţional 10% din efectiv: 50 de angajaţi permanent şi 35 colaboratori şi<br />
se doreşte garantarea estimaţiei cu o probabilitate de 95%. În urma prelucrării<br />
datelor, se obţin următoarele rezultate:<br />
Angajaţi permanent Colaboratori<br />
x 1 = 1620 mii lei x 2 = 2100 mii lei<br />
sx1= 235 mii lei sx2= 410 mii lei<br />
n1= 50 n2= 35<br />
Rezolvare:<br />
x<br />
st<br />
xi<br />
Ni<br />
xi<br />
ni<br />
= = = 1817.<br />
65 mii lei<br />
N n<br />
2<br />
2 s ni<br />
s<br />
xi<br />
x = =<br />
ni<br />
i<br />
i<br />
101702.<br />
94<br />
Eroarea medie de reprezentativitate (se presupune selecţie nerepetată)<br />
este:<br />
s<br />
x st<br />
2<br />
sx<br />
n 101702.<br />
94<br />
= 1−<br />
=<br />
⋅ 0.<br />
9 = 32.<br />
82 mii lei<br />
n N 85<br />
Eroarea limită pentru α=0.05 este:<br />
∆ = zα<br />
s = z s = 1.<br />
96 ⋅ 32.<br />
82 = 64.<br />
33 mii lei<br />
x st<br />
/ 2 xst<br />
0.<br />
025 xst
CAPITOLUL 4<br />
Intervalul de încredere pentru salariul mediu din colectivitatea generală:<br />
1817.65 – 64.33 < µ < 1817.65 + 64.33 mii lei<br />
1753.32 < µ < 1881.99 mii lei<br />
garantat cu o probabilitate de 95%.<br />
4.8.2. Alegerea numărului de straturi şi repartizarea volumului eşantionului<br />
pe straturi<br />
Alegerea numărului de straturi impune două remarci. Prima este de<br />
ordin teoretic: ideală este stratificarea la maximum, adică alegerea unui număr<br />
cât mai mare de grupe. Cea de-a doua este de ordin practic: rareori se<br />
pot depăşi 10 straturi şi, de obicei, limitele straturilor sunt impuse de informaţiile<br />
disponibile din baza de sondaj.<br />
Determinarea volumului eşantionului în cazul selecţiei aleatoare stratificate<br />
impune şi alocarea acestuia pe straturi. Există două posibilităţi de repartizare<br />
a volumului eşantionului (n) pe straturi: o repartiţie proporţională<br />
şi o repartiţie optimă.<br />
Dacă dispersiile din interiorul straturilor sunt egale, pentru un număr dat<br />
de unităţi statistice eşantionate (n), dispersia pe ansamblu este minimă când<br />
fracţiile de sondaj sunt identice (selecţie tipică proporţională). Proporţiile<br />
sunt determinate de ponderile straturilor, adică:<br />
n<br />
i<br />
N<br />
=<br />
i<br />
n<br />
(4.67)<br />
N<br />
Cea de-a doua posibilitate de repartizare (selecţie tipică optimă) presupune<br />
o fracţie de sondaj variabilă de la un strat la altul.<br />
Pentru o selecţie tipică optimă, fracţiile de sondaj vor fi proporţionale cu<br />
abaterile medii pătratice.Atunci, pentru stratul i volumul subeşantionului<br />
este dat de:<br />
n<br />
i<br />
h<br />
i 1<br />
=<br />
N s<br />
=<br />
i xi<br />
n<br />
(4.68)<br />
h<br />
N s<br />
<br />
i=<br />
1<br />
şi evident n n .<br />
i =<br />
i<br />
xi
STATISTICĂ ECONOMICĂ<br />
4.8.3. Estimarea proporţiei pentru o variabilă alternativă<br />
Eroarea medie de reprezentativitate, calculată pe baza datelor din<br />
eşantion este dată de:<br />
— pentru selecţie stratificată repetată:<br />
s fst<br />
f ( 1−<br />
f )<br />
= (4.69)<br />
n<br />
— pentru selecţie stratificată nerepetată:<br />
f ( 1−<br />
f ) n <br />
sfst = 1−<br />
<br />
(4.70)<br />
n N <br />
Eroarea limită (maximă admisibilă), la un prag de semnificaţie α, se<br />
calculează ca:<br />
∆ = zα ⋅s<br />
(4.71)<br />
fst<br />
/ 2<br />
fst<br />
iar intervalul de încredere pentru proporţia p din colectivitatea generală:<br />
f − ∆ p<<br />
f + ∆<br />
(4.72)<br />
fst<br />
fst<br />
De asemenea, se adaptează corespunzător formulele pentru determinarea<br />
volumului eşantionului şi repartizarea acestuia pe straturi.<br />
4.9. SONDAJUL DE SERII (CUIBURI)<br />
În sondajul în cuiburi, populaţia, mai mult sau mai puţin împrăştiată,<br />
este subdivizată în cuiburi. Pentru fiecare astfel de cuib se poate calcula o<br />
madie i<br />
x . În fiecare din cuiburile extrase toţi indivizii sunt observaţi şi<br />
atunci media xi , este cunoscută fără eroare (de sondaj, neeliminându-se<br />
posibilitatea erorilor de observaţie).
CAPITOLUL 4<br />
Hazardul poate alege un cuib asemănător cu altul, deci în care cele două<br />
medii de cuib să fie egale. De aceea fluctuaţia de eşantionaj depinde de ine-<br />
galitatea mediilor de grup. Dispersia totală σ 2 x<br />
este egală cu suma dis-<br />
persiilor între cuiburi (grupuri) σ 2 c şi intracuiburi. Cum σ 2 x este fixă, precizia<br />
unui sondaj în cuiburi este cu atât mai bună cu cât σ 2 c este mai mică şi<br />
cu cat varianţa în interiorul cuiburilor este mai mare. (Fig. 4.5).<br />
x<br />
0 0<br />
a. b.<br />
Fig. 4.5 - Eficacitatea unui sondaj în cuiburi: a. cuiburi eficiente: mediile de grup<br />
marcate prin puncte sunt puţin dispersate; b. cuiburi ineficiente: mediile cuiburilor<br />
sunt la fel de dispersate ca şi valorile individuale<br />
Dispersia (varianţa) totală este alcătuită din doi termeni: dispersia intercuiburi<br />
şi dispersia intracuiburi:<br />
2 Ni<br />
2 Ni<br />
2 2 Ni<br />
2<br />
σ = ( Xi<br />
−X)<br />
+ σi<br />
= σc<br />
+ σi<br />
, (4.73)<br />
N N N<br />
Dispersia intergrupuri exprimă inegalitatea diverselor medii de grupă<br />
între ele.<br />
4.10. TESTAREA IPOTEZELOR STATISTICE ÎN FUNDAMENTAREA<br />
DECIZIILOR<br />
x
STATISTICĂ ECONOMICĂ<br />
Deseori, managerii trebuie să fie pregătiţi să ia decizii privind acţiunile<br />
viitoare pe baza informaţiilor disponibile. În procesul de luare a deciziilor,<br />
ei emit ipoteze pe care le pot testa ştiinţific utilizând metodele şi tehnicile<br />
statistice.<br />
DEFINIŢIE: Ipoteza statistică este ipoteza care se face cu privire la parametrul<br />
unei repartiţii sau la legea de repartiţie pe care o urmează anumite<br />
variabile aleatoare.<br />
4.10.1. Concepte şi erori în testarea ipotezelor statistice<br />
În statistică, ipotezele apar întotdeauna în perechi: ipoteza nulă şi ipoteza<br />
alternativă. Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă<br />
şi este notată, uzual, H0. Ea constă întotdeauna în admiterea caracterului<br />
întâmplător al deosebirilor, adică în presupunerea că nu există deosebiri<br />
esenţiale. Respingerea ipotezei nule care este testată implică acceptarea unei<br />
alte ipoteze. Această altă ipoteză este numită ipoteză alternativă, notată H1.<br />
Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu<br />
de semnificaţie. O secvenţă generală de paşi se aplică la toate situaţiile<br />
de testare a ipotezelor statistice.<br />
1) Se identifică ipoteza statistică specială despre parametrul<br />
populaţiei sau legea de repartiţie (H0).<br />
2) Întotdeauna ipoteza nulă este însoţită de ipoteza alternativă (de cercetat),<br />
H1, ce reprezintă o teorie care contrazice ipoteza nulă. Ea va fi acceptată<br />
doar când există suficiente dovezi, evidenţe, pentru a se stabili că<br />
este adevărată.<br />
3) Se calculează indicatorii statistici în eşantion, utilizaţi pentru a accepta<br />
sau a respinge ipoteza nulă şi se stabileşte testul statistic ce va fi utilizat<br />
drept criteriu de acceptare sau de respingere a ipotezei nule.<br />
4) Se stabileşte regiunea critică, Rc<br />
Regiunea critică este delimitată de valoarea critică, C – punctul de<br />
tăietură în stabilirea acesteia.
CAPITOLUL 4<br />
În baza legii numerelor mari, numai într-un număr foarte mic de cazuri<br />
punctul rezultat din sondaj va cădea în Rc, majoritatea vor cădea în afara<br />
regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în regiunea<br />
critică, cu toate că ipoteza nulă despre parametrul populaţiei este adevărată.<br />
Eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată, se<br />
numeşte eroare de genul întâi. Probabilitatea comiterii unei astfel de erori<br />
reprezintă riscul de genul întâi (α) şi se numeşte nivel sau prag de semnificaţie.<br />
Nivelul de încredere al unui test statistic este (1-α) iar în expresie<br />
procentuală, (1-α)100 reprezintă probabilitatea de garantare a rezultatelor.<br />
Eroarea pe cere o facem acceptând o ipoteză nulă, deşi este falsă, se numeşte<br />
eroare de genul al doilea, iar probabilitatea (riscul) comiterii unei<br />
astfel de erori se notează cu β. Puterea testului statistic este (1-β).<br />
f( x)<br />
β<br />
H 0<br />
µ 0<br />
C<br />
α<br />
H 1<br />
Fig. 4.6 - Legătura dintre probabilităţile α şi β<br />
s<br />
Cum s = x , o dată cu creşterea volumului n al eşantionului, aba-<br />
x n<br />
terile medii pătratice ale distribuţiilor pentru H0 şi H1 devin mai mici şi,<br />
evident, atât α, cât şi β descresc (Fig. 4.7).<br />
µ 1<br />
x
f( x)<br />
STATISTICĂ ECONOMICĂ<br />
β<br />
H 0<br />
µ 0<br />
C<br />
H 1<br />
Fig. 4.7 - α şi β când volumul eşantionului n' > n<br />
5) După ce am stabilit pragul de semnificaţie şi regiunea critică, trecem la<br />
pasul următor, în care vom face principalele presupuneri despre populaţia<br />
sau populaţiile ce sunt eşantionate (normalitate etc.).<br />
6) Se calculează apoi testul statistic şi se determină valoarea sa numerică,<br />
pe baza datelor din eşantion.<br />
7) La ultimul pas, se desprind concluziile: ipoteza nulă este fie acceptată,<br />
fie respinsă, astfel:<br />
a) dacă valoarea numerică a testului statistic cade în regiunea<br />
critică (Rc), respingem ipoteza nulă şi concluzionăm că<br />
ipoteza alternativă este adevărată. Vom şti că această decizie<br />
este incorectă doar în 100 α % din cazuri;<br />
b) dacă valoarea numerică a testului nu cade în regiunea<br />
critică (Rc), se acceptă ipoteza nulă H0.<br />
Ipoteza alternativă poate avea una din trei forme (pe care le vom exemplifica<br />
pentru testarea egalităţii parametrului „media colectivităţii generale“,<br />
µ cu valoarea µ0):<br />
i) H0: µ = µ0<br />
H1: µ ≠ µ0 (µ < µ0 sau µ > µ0);<br />
şi acest test este un test bilateral;<br />
ii) H0: µ = µ0<br />
α<br />
µ 1<br />
x
CAPITOLUL 4<br />
H1: µ > µ0<br />
care este un test unilateral dreapta;<br />
iii) H0: µ = µ0<br />
H1: µ < µ0<br />
care este un test unilateral stânga.<br />
α/2 α/2<br />
α α<br />
µ µ µ<br />
a) b) c)<br />
Fig. 4.8 - Regiunea critică pentru: a) test bilateral; b) test unilateral stânga; c) test<br />
unilateral dreapta<br />
4.10.2. Testarea ipotezei privind media populaţiei generale (µ)<br />
pentru eşantioane de volum mare<br />
i) în cazul testului bilateral, ipotezele sunt:<br />
H0: µ = µ0 (µ - µ0=0)<br />
H1: µ ≠ µ0 (µ - µ0≠0) (adică µ < µ0 sau µ > µ0);<br />
x − µ 0 x − µ 0 x − µ 0<br />
z = = ≈<br />
(4.74)<br />
σ σ n s n<br />
x<br />
Regiunea critică Rc este dată de:<br />
Rc: z< - z α/2 sau z> z α/2<br />
x<br />
x − µ 0<br />
Respingem H0 dacă < −zα<br />
/ 2<br />
σ n<br />
x −<br />
µ<br />
0<br />
sau > zα<br />
/ 2<br />
σ x n<br />
x<br />
x
STATISTICĂ ECONOMICĂ<br />
ii) pentru testul unilateral dreapta, ipotezele sunt:<br />
H0: µ = µ0 (µ - µ0=0)<br />
H1: µ > µ0 (µ - µ0>0);<br />
x − µ 0<br />
> z<br />
σ n<br />
Respingem ipoteza H0 dacă α<br />
iii) Pentru testul unilateral stânga, ipotezele sunt:<br />
H0: µ = µ0 (µ - µ0=0)<br />
H1: µ < µ0 (µ - µ0
CAPITOLUL 4<br />
H0: (µ1- µ2) = D<br />
H1: (µ1- µ2) ≠ D [(µ1- µ2)>D sau (µ1- µ2) D<br />
iii) test unilateral stânga<br />
H0: (µ1- µ2) = D<br />
H1: (µ1- µ2) < D<br />
Testul statistic utilizat are forma:<br />
z =<br />
( x − x 2 )<br />
1<br />
σ ( x −x<br />
2 )<br />
1<br />
− D<br />
Regiunea critică este dată de:<br />
i) z< - z α/2 sau z> z α/2<br />
ii) z> z α<br />
iii) z< - z α<br />
4.10.4. Testarea ipotezei privind media populaţiei generale (µ)<br />
pentru eşantioane de volum redus<br />
În locul statisticii z care necesită cunoaşterea (sau o bună aproximare) a<br />
σ , vom folosi statistica:<br />
lui x<br />
x − µ 0 x − µ 0<br />
t = =<br />
(4.77)<br />
s s n<br />
x<br />
x<br />
2<br />
( x x)<br />
unde: s<br />
i −<br />
= <br />
2 x<br />
n −1<br />
i) test bilateral
STATISTICĂ ECONOMICĂ<br />
H0: µ = µ0<br />
H1: µ ≠ µ0 (µ < µ0 sau µ > µ0);<br />
ii) test unilateral dreapta<br />
H0: µ = µ0<br />
H1: µ > µ0<br />
iii) test unilateral stânga<br />
H0: µ = µ0<br />
H1: µ < µ0<br />
Testul statistic utilizat:<br />
x − µ 0 x − µ 0<br />
t = =<br />
s s n<br />
x<br />
x<br />
Presupunerea specială ce trebuie făcută este aceea că populaţia generală<br />
este normal sau aproximativ normal distribuită.<br />
Regiunea critică este dată de:<br />
i) t > t α/2,n-1 sau t < - t α/2,n-1<br />
ii) t > t α,n-1<br />
iii) t < - t α,n-1<br />
4.10.5. Testarea ipotezei privind diferenţa dintre două medii pentru<br />
eşantioane de volum redus<br />
În condiţiile în care presupunem că cele două colectivităţi generale au<br />
2 2<br />
dispersii egale ( 2 σ x1<br />
= σ x = 2 σ x ), un estimator al dispersiei (variabilităţii)<br />
totale din cele două populaţii combinate este:<br />
n1<br />
2 n2<br />
( x x1)<br />
+ ( x − x 2 )<br />
i −<br />
i<br />
2 i=<br />
1<br />
i=<br />
1<br />
sc<br />
=<br />
(4.78)<br />
n + n − 2<br />
1<br />
2<br />
2
sau<br />
t =<br />
s<br />
2<br />
c<br />
2 ( n1<br />
−1)<br />
sx1<br />
+ ( n 2 −1)<br />
( n −1)<br />
+ ( n −1)<br />
CAPITOLUL 4<br />
( n −1)<br />
s + ( n −1)<br />
s<br />
s<br />
=<br />
x<br />
=<br />
1 x 2 x<br />
(4.79)<br />
n + n − 2<br />
1<br />
2<br />
2 2<br />
Ipotezele statistice vor fi, în aceste condiţii:<br />
i) test bilateral<br />
H0: µ1 = µ2 (µ1- µ2 = D)<br />
H1: µ1 ≠ µ2 (µ1- µ2 ≠ D)<br />
ii) test unilateral dreapta<br />
H0: µ1 = µ2 (µ1- µ2 = D)<br />
H1: µ1 > µ2 (µ1- µ2 > D)<br />
iii) test unilateral stânga<br />
H0: µ1 = µ2 (µ1- µ2 = D)<br />
H1: µ1 < µ2 (µ1- µ2 < D)<br />
Testul statistic t va avea forma:<br />
( x − x 2 ) − D ( x − x 2 )<br />
1<br />
=<br />
2<br />
1 1 <br />
sc<br />
<br />
+<br />
n1<br />
n <br />
<br />
2 <br />
2<br />
sx1<br />
Regiunea critică este dată de:<br />
i) t< - t / 2,<br />
n1+<br />
n2<br />
−2<br />
ii) t> t α , n1+<br />
n2<br />
−2<br />
iii) t< – t n + n −2<br />
1<br />
2 1<br />
( n −1)<br />
+ s ( n −1)<br />
1<br />
1<br />
− D<br />
2<br />
x2<br />
sau t> t α α / 2,<br />
n1+<br />
n 2 −2<br />
α<br />
, 1 2<br />
2<br />
2<br />
⋅<br />
2 2<br />
( n + n − 2)<br />
n1n<br />
2 1 2<br />
n1<br />
+ n 2
STATISTICĂ ECONOMICĂ<br />
Întrebări recapitulative<br />
1. Definiţi conceptul de selecţie statistică.<br />
2. Arătaţi avantajele utilizării selecţiei statistice.<br />
3. Ce este eşantionul?<br />
4. Ce reprezintă noţiunea de „eroare de estimaţie“?<br />
5. Arătaţi principalele noţiuni perechi specifice selecţiei statistice.<br />
6. Care sunt principalele etape ale realizării unui sondaj statistic?<br />
7. Prin ce se caracterizează o distribuţie de eşantionare?<br />
8. Sondajul aleator simplu repetat: caracteristici, eroare de reprezentativitate,<br />
eroare limită admisibilă, interval de încredere.<br />
9. Cum se determină volumul eşantionului în cazul sondajului aleator<br />
simplu repetat şi nerepetat. De ce factori depinde?<br />
10. Determinarea erorii de reprezentativitate, a erorii maxim admisibile şi<br />
a intervalului de încredere în cazul utilizării sondajului simplu aleator nerepetat.<br />
11. Cum se determină probabilitatea de garantare a rezultatelor în cazul<br />
sondajului aleator simplu repetat şi nerepetat?<br />
12. Determinarea intervalului de încredere în cazul sondajului aleator<br />
simplu de volum redus.<br />
13. Determinaţi indicatorii de sondaj, erorile şi intervalul de încredere<br />
pentru caracteristica alternativă în cazul sondajului simplu aleator.<br />
14. Volumul eşantionului şi probabilitatea de garantare a rezultatelor<br />
pentru caracteristica alternativă — sondaj simplu aleator.<br />
15. Ce particularităţi prezintă sondajul stratificat?<br />
16. În ce condiţii se foloseşte şi care sunt avantajele utilizării sondajului<br />
tipic în cercetarea statistică?<br />
17. Calculul indicatorilor de sondaj pentru o caracteristică cantitativă, în<br />
cazul sondajului tipic.<br />
18. Cum se alege numărul de straturi şi cum se repartizează volumul<br />
eşantionului pe straturi?<br />
19. Calculul indicatorilor de sondaj pentru o caracteristică alternativă în<br />
cazul sondajului stratificat.<br />
20. Sondajul de serii — concept, utilizare, particularităţi, avantaje.<br />
21. Ce reprezintă ipoteza nulă într-un proces de testare de ipoteze statistice?<br />
22. Ce reprezintă ipoteza alternativă într-un proces de testare de ipoteze<br />
statistice?
CAPITOLUL 4<br />
23. Ce reprezintă testul sau criteriul de semnificaţie?<br />
24. Ce reprezintă regiunea critică?<br />
25. Când comitem o eroare de genul întâi?<br />
26. Când comitem o eroare de genul al doilea?<br />
27. Ce reprezintă α şi β?<br />
28. Care sunt paşii în construirea unui test statistic?<br />
29. Cum se testează ipoteza privind media unei colectivităţi generale în<br />
cazul eşantioanelor mari?<br />
30. Cum se testează ipoteza privind media unei colectivităţi generale în<br />
cazul eşantioanelor de volum redus?<br />
31. Cum se testează ipoteza privind diferenţa dintre mediile a două colectivităţi<br />
generale, în cazul eşantioanelor mari?<br />
32. Cum se testează ipoteza privind diferenţa dintre mediile a două colectivităţi<br />
generale, în cazul eşantioanelor de volum redus?