25.04.2013 Views

Exercicis i problemes d'estadística

Exercicis i problemes d'estadística

Exercicis i problemes d'estadística

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

© Universitat Oberta de Catalunya • W1/00702.06. 1<br />

Estadística<br />

Annexos<br />

Annex 1<br />

<strong>Exercicis</strong> i <strong>problemes</strong> d’estadística<br />

Introducció<br />

Aquests exercicis tenen com a objectiu complementar el material didàctic en suport paper<br />

de l’assignatura Estadística, de tal manera que pugueu desenvolupar pràcticament els conceptes<br />

apresos i ampliar-ne alguns d’altres que us poden resultar útils com a futurs Enginyers.<br />

Els exercicis i els <strong>problemes</strong> es troben estructurats en 6 apartats i tenen a veure amb blocs<br />

de capítols del mòdul d’Estadística. Així tenim:<br />

– Estadística descriptiva capítols 1 a 6<br />

– Probabilitat, variables aleatòries capítols 7 a 10<br />

– Distribucions de probabilitat capítols 11 a 13<br />

– Distribucions mostrals capítols 14 a 16<br />

– Intervals de confiança capítols 17 i 18<br />

– Relacions entre variables capítols 19 a 21<br />

Dins de cadascun d’aquests 6 apartats es presenten, en primer lloc, els enunciats d’un conjunt<br />

d’exercicis i <strong>problemes</strong> i, posteriorment, es troba en uns casos la resolució detallada i<br />

en d’altres la solució només indicada.<br />

Hem optat per separar els enunciats de les solucions per tal que, en primera instància, tracteu<br />

de realitzar l’exercici o problema sense consultar la solució i que aquesta sigui únicament<br />

una confirmació del que s’ha fet i, en darrera instància, tingueu una guia per a resoldre<br />

el problema quan aquest ja ha estat treballat a bastament.<br />

Finalment, indiquem que en la presentació dels enunciats hem anat incorporant unes petites<br />

notes, les quals, en uns casos, han estat merament recordatòries del que es pot trobar en<br />

el mòdul didàctic de l’assignatura i, en altres casos, pretenen introduir algun concepte nou<br />

que complementaria els del mòdul didàctic. En qualsevol cas, sempre tenen un caràcter<br />

eminentment pràctic.


© Universitat Oberta de Catalunya • W1/00702.06. 3<br />

Estadística<br />

Estadística descriptiva<br />

Part 1<br />

1. Suposeu que el preu mitjà de tots els peatges d’una autopista és de 615 ptes. i la variància, de<br />

12.420 ptes 2 . Com es veurien alterades aquestes mesures en cadascun dels supòsits següents?:<br />

a) Un increment fix en el preu de tots els peatges de 22 ptes.<br />

b) Un augment proporcional del 10% del preu de tots els peatges.<br />

2. La nota mitjana d’un examen ha estat de 5,8 punts, 5,5 per als nois i 6 per a les noies. Determineu<br />

la proporció de nois i noies que s’han examinat.<br />

3. A la taula I es mostren les calories per 100 grams detectades en una mostra A de 20 hamburgueses<br />

fetes amb carn de boví i les presents en una mostra B de 17 hamburgueses fetes amb<br />

carn de pollastre.<br />

a) Calculeu els cinc nombres resum de la distribució de dades de la mostra A.<br />

b) Feu el mateix amb la distribució de dades de la mostra B.<br />

c) Feu un croquis dels respectius diagrames de caixa.<br />

d) Utilitzeu aquests diagrames per comparar les dues distribucions de dades i explicar-ne<br />

les diferències més notables.<br />

e) Calculeu la mitjana i la desviació estàndard de la distribució de dades de la mostra A.<br />

f) Feu el mateix amb la distribució de dades de la mostra B.<br />

g) Compareu les dues distribucions a partir de la informació que aporten aquests dos estadístics<br />

(mitjana i desviació estàndard).<br />

Calories en hamburgueses de boví<br />

186 181 176 149 184 190<br />

158 139 175 148 152 111<br />

141 153 190 157 131 149<br />

135 132<br />

Calories en hamburgueses de pollastre<br />

129 132 102 106 94 102<br />

87 99 170 113 135 142<br />

86 143 152 146 144<br />

4. La distribució de la superfície de les 90 botigues que integraran un nou complex comercial és:<br />

superfície (m 2 ) botigues<br />

de 40 a 60 16<br />

de 60 a 80 42<br />

de 80 a 120 13<br />

de 120 a 200 11<br />

de 200 a 400 8<br />

Ens plantegem el càlcul de:<br />

a) La superfície aproximada de tot el complex tenint en compte que la zona no destinada a<br />

botigues (passadissos, àrea de descans, etc.) ocupa una superfície idèntica a la de les botigues.<br />

b) Recorregut que separa el primer i el tercer quartils.<br />

c) La dimensió que hauria de tenir una botiga per a poder ser considerada del grup de les<br />

15 més grans.<br />

5. La distribució per intervals dels ingressos mensuals dels diplomats en Ciències Empresarials<br />

amb més d’un any d’experiència és:<br />

milers de pessetes % diplomats<br />

menys de 120 6,30<br />

de 120 a 168 9,83<br />

de 168 a 240 20,87<br />

de 240 a 360 27,63<br />

de 360 a 480 15,00<br />

de 480 a 960 18,27<br />

de 960 a 1400 1,65<br />

més de 1400 0,45<br />

Ho sabíeu...?<br />

Donat un conjunt de dades<br />

x1,x2,...,xn amb una mitjana<br />

mx, una variància sx 2 i una<br />

desviació estàndard sx,<br />

apliquem una transformació<br />

lineal y = ax +<br />

+ b (a > 0, o bé a < 0) de<br />

manera que les dades<br />

transformades y1, y2, ....., yn<br />

tenen una mitjana my,una<br />

variància sy 2 i una<br />

desviació estàndard sy.<br />

Aleshores:<br />

my = a * mx + b<br />

sy 2 = a2 * sx 2<br />

sy = /a/ * sx<br />

Ho sabíeu...?<br />

Quan no disposem de les<br />

dades en brut sinó tan sols<br />

d’una distribució per a dades<br />

agrupades, farem el supòsit<br />

que el punt mitjà de l’interval,<br />

que s’anomena marca de<br />

classe, representa de forma<br />

adient tots els valors inclosos<br />

dins l’interval.<br />

La marca de classe es<br />

calcula com la semisuma dels<br />

límits de l’interval<br />

corresponent.


© Universitat Oberta de Catalunya • W1/00702.06. 4<br />

Estadística<br />

Si volem dividir la població en quatre categories d’igual nombre de diplomats (ingressos baixos,<br />

ingressos mitjans-baixos, ingressos mitjans-alts i ingressos alts), quins nivells de renda<br />

separen cada un d’aquests estrats?<br />

6. Els salaris d’una empresa representen una mitjana de 162.345 ptes. per treballador i<br />

mes, una mediana de 147.600 ptes. i una desviació estàndard de 27.225 ptes. Si després<br />

del nou conveni laboral s’acorda un increment proporcional del 8% i un altre de lineal de<br />

10.600 ptes., quins són els paràmetres de la nova distribució salarial?<br />

7. Durant el mes d’agost les temperatures diürnes d’una zona d’estiueig presenten les característiques<br />

següents:<br />

mínima 24<br />

màxima 41<br />

mitjana 34<br />

moda 36<br />

variància 16<br />

Estem interessats a proporcionar aquesta informació a una agència de viatges britànica, qüestió<br />

per la qual ens plantegem presentar aquelles mesures que venien donades en graus centígrads<br />

en escala Fahrenheit (°F = 32 + 1,8 °C).<br />

8. Dades relatives a una enquesta de consum revelaven una mitjana de 4,5 litres per persona i<br />

mes. Si una revisió posterior ha permès determinar que un 20% dels enquestats havien declarat<br />

1 litre més del que realment havien consumit, quina és la veritable mitjana de consum de llet?<br />

9. Per a diferents franges horàries hem triat mostres relatives als cotxes que sortien de l’autopista<br />

del peatge de Montblanc i hem enregistrat el nombre de vehicles per minut que passaven:<br />

observ. de 5 a 7 de 7 a 9 de 9 a 11 d’11 a 13 de 13 a 15<br />

1 0 5 32<br />

2 1 4 2 4 2<br />

3 0 3 4 2 1<br />

4 0 1 2 3 1<br />

5 0 2 2 0 1<br />

6 2 2 1 3 3<br />

7 0 6 3 2 2<br />

8 1 3 0 2 4<br />

9 1 4 0 4 1<br />

10 0 4 2 1 2<br />

11 0 7 3 1 1<br />

12 0 5 1 2 1<br />

13 1 3 6 3<br />

14 1 5 6<br />

15 0 4<br />

Volem determinar en quin interval de temps hi ha major desigualtat en el nombre de cotxes<br />

que passen el peatge per minut, utilitzant el coeficient de variació de Pearson.<br />

10. Disposem de 4 variables:<br />

X = “Edat de les persones mortes a Catalunya en els últims 5 anys”<br />

Y = “Números que han sortit en les 200 últimes loteries de la Lotto 6/49”<br />

Z = “Salaris mensuals de tot el personal (incloent-hi el directiu) d’una gran empresa”<br />

T = “Alçades dels alumnes de sexe femení d’una universitat”<br />

Disposem també de 4 diagrames de caixa:<br />

Diagrama 1: ————————| | |—––<br />

Diagrama 2: —————| | |—————<br />

Diagrama 3: ———––| | |———–—<br />

Diagrama 4: ——| | |————————<br />

Associeu raonadament cada variable amb el diagrama de caixa que més li escaigui.<br />

11. Si una distribució de dades té un biaix (cua extremadament llarga) cap a la dreta, llavors<br />

(només una afirmació és correcta):<br />

a) La mediana és major que la mitjana.<br />

b) La mitjana és major que la mediana.<br />

c) La mediana i la mitjana són iguals.<br />

d) No es pot afirmar res amb relació a la mitjana i a la mediana.<br />

Ho sabíeu...?<br />

Quan no disposem de les<br />

dades en brut sinó tan sols<br />

d’una distribució amb dades<br />

agrupades, el càlcul de la<br />

mediana, els quartils i els<br />

percentils es realitza d’una<br />

manera aproximada a partir<br />

de les expressions:<br />

N – Ni–1<br />

2<br />

Me = Li –1 +<br />

⋅ Ci<br />

essent:<br />

Li–1 el límit inferior de l’interval<br />

que conté la mediana, N el<br />

nombre total d’observacions,<br />

Ni–1 el nombre total<br />

d’observacions acumulades<br />

fins a l’interval<br />

immediatament anterior a<br />

aquell que conté la mediana,<br />

ni el nombre d’observacions<br />

incloses en l’interval que conté<br />

la mediana, i ci l’amplada de<br />

l’interval que conté la<br />

mediana. Per al primer i el<br />

tercer quartils els càlculs són<br />

equivalents i només cal<br />

substituir N/2 en l’expressió<br />

anterior per N/4 i 3N/4,<br />

respectivament.<br />

Ho sabíeu...?<br />

El coeficient de variació (CV)<br />

és una mesura de dispersió<br />

relativa adimensional que es<br />

defineix com:<br />

CV =<br />

Nota:<br />

ni<br />

desviació estàndard<br />

mitjana<br />

Els 4 diagrames de caixa no<br />

estan dibuixats a la mateixa<br />

escala. Les 3 línies verticals |<br />

mostren els 3 quartils.<br />

⋅ 100


© Universitat Oberta de Catalunya • W1/00702.06. 5<br />

Estadística<br />

12. L’any 1975 a l’illa de Menorca i durant el mes d’agost el lloguer d’apartaments presentava<br />

les xifres següents:<br />

lloguer (ptes. mes) % lloguer % apartaments<br />

menys de 30.000 22,15 46,05<br />

de 30.000 a 60.000 34,85 38,47<br />

de 60.000 a 90.000 12,16 8,67<br />

de 90.000 a 120.000 6,05 2,96<br />

més de 120.000 24,79 3,85<br />

Calculeu el percentatge de la suma total de lloguers pagats pel damunt de la mediana.<br />

13. La distribució següent correspon al temps de demora en el subministrament de pizzes a<br />

domicili sobre una mostra de 275 serveis realitzats per una empresa de catering.<br />

minuts de demora serveis<br />

menys de 10 11<br />

entre 10 i 15 52<br />

entre 15 i 20 64<br />

entre 20 i 25 80<br />

entre 25 i 30 45<br />

entre 30 i 40 14<br />

més de 40 9<br />

Donada la mostra representativa del moviment habitual d’aquesta empresa, heu de calcular:<br />

a) El rang interquartílic.<br />

b) Si volguéssim regalar un bo descompte al 10% dels clients que han sofert un major retard<br />

en el servei, a partir de quina demora s’és mereixedor de l’obsequi?<br />

14. Disposem d’una taula que conté una ordenació decreixent i acumulada de les edats dels<br />

homes d’una zona mercadològica:<br />

més de % homes<br />

75 anys 0,03<br />

65 anys 5,41<br />

55 anys 12,42<br />

45 anys 21,86<br />

35 anys 33,49<br />

25 anys 48,53<br />

15 anys 67,10<br />

10 anys 77,13<br />

5 anys 88,57<br />

Una empresa vol treure una nova línia de productes de cosmètica masculina i situa el mercat<br />

potencial entre els 15 i els 55 anys. Obteniu la distribució percentual no acumulada d’aquells<br />

intervals d’edat.<br />

15. Calculeu les qüestions següents utilitzant criteris algebraics i comproveu com el resultat<br />

no coincideix amb la mitjana aritmètica:<br />

a) Un cotxe realitza un trajecte a velocitat uniforme de 60 km/h i torna a velocitat<br />

uniforme de 40 km/h. Quina és la velocitat mitjana d’anada i tornada?<br />

b) Hem dividit un país en quatre zones d’igual població: a la primera hi ha 4,5 habitants<br />

per telèfon, a la segona 5, a la tercera 6 i a la quarta 4,5. Quina és la mitjana d’habitants<br />

per telèfon que hi ha en tot el país?<br />

16. Una alternativa a la variància o desviació estàndard com a mesures de dispersió és la<br />

desviació absoluta respecte a la mediana (DAMe), entesa com una mitjana de les desviacions<br />

absolutes de tots els valors d’una variable respecte a la mediana:<br />

DAMe =<br />

| Xi – Me |<br />

n<br />

Ho sabíeu...?<br />

Per a calcular el valor mitjà<br />

de ratios en què els<br />

numeradors són iguals<br />

(o proporcionals):<br />

x1 = k/w1, x2 = k/w2,...,<br />

xn = k/wn<br />

la mitjana harmònica: Mh<br />

Mh =<br />

n<br />

1/xi<br />

resulta més adequada que la<br />

mitjana aritmètica X.


© Universitat Oberta de Catalunya • W1/00702.06. 6<br />

Estadística<br />

Obteniu aquesta mesura de dispersió per al llistat següent de dades, que correspon als gruixos<br />

de neu observats el mes de gener en 33 punts de la vall de Núria:<br />

2,21629 1,11432 1,40542 0,09886 2,24539 1,89300 1,14768 2,14951 1,16489<br />

1,26485 0,63494 0,83456 1,52173 1,87478 2,37129 1,07849 1,96909 0,76536<br />

1,69359 0,97161 1,89988 1,75075 0,12324 1,15324 1,15346 0,46159 0,78331<br />

1,51436 0,96749 2,29511 1,42806 2,32879 1,09676


© Universitat Oberta de Catalunya • W1/00702.06. 7<br />

Estadística<br />

Solucionari<br />

Part 1<br />

1.<br />

a) Un canvi d’origen en la variable altera la mitjana en el mateix sentit, però la variància<br />

es manté constant. Així doncs, les noves mesures són:<br />

mitjana = 615 + 22 = 637<br />

variància = 12420<br />

b) En multiplicar una variable per una constant, la mitjana també queda multiplicada<br />

per la constant i la variància es veu afectada per la constant al quadrat. En conseqüència<br />

tenim que:<br />

mitjana = 615 + 615 * 0,10 = 615 * 1,10 = 676,5<br />

desv. est. = 111,45 + 111,45 * 0,1 = 111,45 * 1,10 = 122,59<br />

variància = 122,592 = 12.420 * 1,102 = 15.028,2<br />

2. La mitjana d’una població es pot presentar com a valor mitjà ponderat de les mitjanes de<br />

les subpoblacions. Així sabem per l’enunciat que:<br />

5,8 = 5,5 freq(nois) + 6 freq(noies)<br />

mentre que s’ha de complir que:<br />

freq(nois) + freq(noies) = 1<br />

Per tant, fent operacions obtenim:<br />

freq(nois) = 0,4 (40% de nois)<br />

freq(noies) = 0,6 (60% de noies)<br />

3.<br />

a) Els cinc nombres resum de la mostra A són:<br />

mínA = x(1) = 111<br />

màxA = x(20) = 190<br />

Q1A = [x(5)+x(6)] / 2 = (139+141) / 2 = 140<br />

MedA = [x(10)+x(11)] / 2 = (152+153) / 2 = 152,5<br />

Q3A = [x(15)+x(16)] / 2 = (176+181) / 2 = 178,5<br />

b) Els cinc nombres resum de la mostra B són:<br />

mínB = x(1) = 86<br />

màxB = x(17) = 170<br />

Q1B = [x(4)+x(5)] / 2 = (99+102) / 2 = 100,5<br />

MedB = x(9) = 129<br />

Q3B = [x(13)+x(14)] / 2 = (143+144) / 2 = 143,5<br />

c) Els diagrames de caixa corresponents serien:<br />

80 90 100 110 120 130 140 150 160 170 180 190<br />

Escala +——–+——–+——–+——–+——–+——–+——–+——–+——–+——–+——–<br />

A... ——————————| | |———<br />

B... ——————| | |———————<br />

d) Els dos diagrames de caixa posen en evidència una falta de simetria de les dues distribucions<br />

de dades. Tot i això, la falta de simetria de la distribució de dades del conjunt A<br />

no és de la mateixa naturalesa que la del conjunt B. Globalment i d’una manera genèrica,<br />

podríem dir que les hamburgueses de boví (A) tenen més calories que les hamburgueses<br />

de pollastre (B).<br />

e) mA = 156,85 sA = 22,64<br />

f) mB = 122,47 sB = 25,48<br />

g) Ambdues distribucions tenen una gran variabilitat atès que tant sA com sB tenen valors<br />

molt grans en comparació de les mitjanes (sA representa un 14% del valor de mA; sB<br />

representa un 21% del valor de mB). Malgrat que sB és major que sA, la diferència no sembla<br />

prou gran per a afirmar categòricament que la variabilitat del nombre de calories de<br />

les hamburgueses de pollastre és major que la variabilitat del nombre de calories de les<br />

hamburgueses de boví.<br />

En canvi, sembla clar que la mitjana de les calories de les hamburgueses de boví és significativament<br />

més gran que la mitjana de les calories de les hamburgueses de pollastre.


© Universitat Oberta de Catalunya • W1/00702.06. 8<br />

Estadística<br />

4. Construirem en primer lloc una taula de freqüències que ens ajudarà en la resolució de<br />

l’exercici. En aquesta taula indicarem cadascuna de les marques de classe dels intervals donats,<br />

les freqüències absolutes (ni), les freqüències relatives (fi), i les corresponents acumulades<br />

(Ni i Fi).<br />

a) Per tal d’obtenir la superfície total aproximada considerem la marca de classe com a<br />

valor representatiu de totes les observacions incloses en l’interval. Així, en el primer interval<br />

tenim 16 botigues amb 50 m2 , la qual cosa dóna una superfície de 800 metres quadrats.<br />

Sumant la corresponent als cinc intervals, tenim una superfície de les botigues de<br />

9.200 m2 i, tenint en compte que l’àrea comercial té una superfície de dues vegades la de<br />

les botigues, arribem a la conclusió que 18.400 m2 és la superfície total aproximada.<br />

b) Per tal de calcular el recorregut interquartílic hem de calcular en primera instància els<br />

quartils primer i tercer. Atès que només disposem de les dades agrupades ens veiem obligats<br />

a aproximar els valors dels quartils mitjançant les expressions:<br />

Tenint en compte que els intervals que contenen els quartils són el 60-80 i el 80-120,<br />

resultarà d’aplicar l’anterior que:<br />

Q1 =60+<br />

Q1 =Li–1 +<br />

22,5 – 16<br />

42<br />

N<br />

4 –Ni–1<br />

⋅ 20 = 63,1<br />

i, per tant, el recorregut interquartílic és Q3 – Q1 = 46,135 m 2 .<br />

c) Amb la mateixa idea que la utilitzada per aproximar el càlcul dels quartils primer i tercer<br />

i per aproximar la mediana quan disposem de dades agrupades, també podem ara calcular<br />

quina hauria de ser la dimensió mínima necessària per estar entre les 15 botigues<br />

més grans. Ara, doncs, farem:<br />

P75/90 = 120 +<br />

on la dimensió mínima és de 149 m 2 .<br />

75 – 71<br />

11<br />

Q3 = 80 +<br />

67,5 – 58<br />

13<br />

⋅ 80 = 149,1<br />

5. La resposta és que els nivells d’ingressos que permeten segmentar la població dels diplomats<br />

en Ciències Empresarials en quatre grups coincidiran amb els dos quartils i la mediana<br />

de la distribució:<br />

menys de 198,6 milers de ptes. : Ingressos baixos<br />

entre 198,6 i 296,46 milers de ptes. : Ingressos mitjans-baixos<br />

entre 296,46 i 442,96 milers de ptes. : Ingressos mitjans-alts<br />

més de 442,96 milers de ptes. : Ingressos alts<br />

6. Un cop efectuats els corresponents augments, les noves mesures descriptives són:<br />

mitjana 185.932,6<br />

mediana 170.008,0<br />

desv. estàndard 29.403,0<br />

7. Les mesures descriptives expressades en graus Fahrenheit són:<br />

mínima 75,2<br />

màxima 105,8<br />

mitjana 93,2<br />

moda 96,8<br />

variància 51,84<br />

ni<br />

Marca<br />

Interval Classe ni fi Ni Fi<br />

40-60 50 16 17,78 16 17,78<br />

60-80 70 42 46,67 58 64,45<br />

80-120 100 13 14,44 71 78,89<br />

120-200 160 11 12,22 82 91,11<br />

200-400 300 8 8,89 90 100,89<br />

3<br />

⋅ Ci Q3 =Li–1 +<br />

N<br />

4 –Ni–1<br />

⋅ Ci<br />

ni<br />

⋅ 40 = 109,23


© Universitat Oberta de Catalunya • W1/00702.06. 9<br />

Estadística<br />

8. La mitjana de consum de llet és de 4,3 litres per persona i mes.<br />

9. Els coeficients de variació per a cadascuna de les franges horàries són els següents:<br />

ordenació<br />

franja observac. mitjana desv. est. c. variac. desigualtat<br />

de 5 a 7 15 0,467 0,640 137,04 5è<br />

de 7 a 9 15 3,867 1,598 41,32 1r<br />

de 9 a 11 14 2,500 1,871 74,84 4t<br />

d’11 a 13 13 2,231 1,166 52,26 2n<br />

de 13 a 15 12 1,750 0,965 55,14 3r<br />

10.<br />

Variable X ⇒ Diagrama 1.<br />

Sortosament la majoria de persones mor a una edat avançada. Això fa que la mediana,<br />

el quartil superior Q3 i xmàx tinguin, relativament, valors molt més propers<br />

entre ells que no els valors xmín, Q1 i la mediana.<br />

Variable Y ⇒ Diagrama 3.<br />

Els valors d’un sorteig es reparteixen per igual entre el valor mínim i el valor màxim.<br />

Per aquest motiu, els valors Q1, la mediana i Q2 han d’estar, aproximadament, repartits<br />

per igual entre el valor xmín = 1 i el valor xmàx = 49.<br />

Variable Z ⇒ Diagrama 4.<br />

En una gran empresa, la majoria del personal sol cobrar els salaris més baixos; a mesura<br />

que el salari creix, decreix el nombre de persones que el cobra. Per aquest motiu,<br />

la majoria de salaris estaran situats a la banda baixa de la distribució de dades. Això fa<br />

que, comparativament, els valors zmín, Q1 i la mediana estiguin més propers entre<br />

ells que no ho estan la mediana, Q3 i zmàx.<br />

Variable T ⇒ Diagrama 2.<br />

Les alçades d’un conjunt ”homogeni” de persones (com és el cas de les alumnes<br />

d’una universitat) estan majoritàriament concentrades a la zona central de la distribució<br />

de dades: la majoria de les persones no són ni altes ni baixes (tenen una alçada<br />

”normal”). Per aquest motiu, els valors Q1, la mediana i Q3 estaran, relativament,<br />

més propers entre ells que no ho estan els valors tmín i Q1 o Q3 i tmàx.<br />

11. La resposta correcta és la b). La mitjana es veu fortament afectada per la presència de dades<br />

allunyades, ja que aquestes ”l’estiren” cap a la seva posició.<br />

12. Els lloguers pagats pel damunt de la mediana representen el 74,272% del total.<br />

13.<br />

a) El recorregut entre el primer i el tercer quartils és de 9,5 minuts.<br />

b) Amb un retard de 29,9 minuts o més hauríem de regalar el bo descompte.<br />

14. Els nous percentatges són:<br />

15.<br />

a) La velocitat mitjana és de 48 km/h.<br />

b) Hi ha 4,9315 habitants per telèfon.<br />

edats % homes<br />

de 15 a 25 33,96<br />

de 25 a 35 27,51<br />

de 35 a 45 21,27<br />

de 45 a 55 17,26<br />

16. La mediana de les 33 observacions us ha de donar 1,265 i la DAMe, 0,5154.


© Universitat Oberta de Catalunya • W1/00702.06. 10<br />

Estadística<br />

Part 2<br />

1. Una empresa multinacional de la informàtica vol tirar endavant una sèrie de mesures que<br />

afectaran per igual la totalitat de la plantilla de totes les seus de l’empresa. Abans, però, vol<br />

realitzar una enquesta a una mostra de 1.000 persones “representativa” de la plantilla de tota<br />

l’empresa. Expliqueu el procediment que seguiríeu per obtenir la mostra. (Heu de tenir<br />

en compte que l’empresa consta de diverses seus; que el personal té diferents qualificacions<br />

professionals; que el nombre de treballadors de cada seu i de cada categoria són molt diferents;<br />

etc.)<br />

2. Indiqueu quin mètode de mostratge s’ha utilitzat en cadascun dels casos següents:<br />

a) Prenem una mostra a l’atzar de 50 socis de cada un dels clubs de la Primera Divisió de<br />

futbol per fer un estudi de comportament de masses.<br />

b) Per analitzar el grau de satisfacció en el servei que reben els usuaris de turisme rural<br />

ens adrecem a tots els que han llogat una masia del terme municipal de vuit dels pobles<br />

que ofereixen aquest servei.<br />

c) De les 80 pàgines que hi ha a la guia telefònica de la ciutat de Tortosa, n’hem escollit<br />

un número a l’atzar (el penúltim de la primera fila). Els 80 abonats que ocupen aquesta<br />

posició en totes les pàgines de la guia formaran la mostra.<br />

d) Hem dividit la Cerdanya en tres zones (Lleida, Girona i Nord) i triem submostres de<br />

cerdans en proporció a la distribució de la població en aquestes tres zones.<br />

e) En una universitat presencial decidim enquestar tots els alumnes que en un moment<br />

donat estan a la biblioteca, al bar, a l’aula de quart A i al passadís del segon pis.<br />

f) Per fer un estudi dels comerços que hi ha a l’Eixample de Barcelona, en una primera<br />

fase hem elegit aleatòriament districtes, a continuació illes de cases d’aquests districtes i<br />

posteriorment una orientació (Besòs, Llobregat, mar, muntanya) del carrer d’aquestes<br />

illes. Finalment, han estat visitats tots el comerços que havien sortit.<br />

g) Un professor ha llançat a l’aire les fitxes dels seus alumnes i n’ha agafat 12.<br />

h) Un auditori té 50 files de 25 butaques. Per estudiar els desperfectes del mobiliari es<br />

pren una mostra pilot de 50 butaques i s’elegeix un número a l’atzar d’1 a 25 (per exemple<br />

el 4) i automàticament es revisen les butaques de cada filera amb aquest número.<br />

3. Poseu un parell d’exemples que justifiquin la validesa de les proposicions següents:<br />

a) L’anàlisi exhaustiva de tota la població implicaria la seva destrucció.<br />

b) Resulta materialment impossible abraçar tota la població.<br />

c) Raons ètiques i legals impedeixen treure resultats vinculants a partir de mostres.<br />

4. La taula següent conté les despeses de funcionament (en milers de pessetes) d’una empresa<br />

durant l’últim exercici comptable agrupades per intervals de manera decreixent:<br />

import de la despesa nombre de despeses import de l’interval<br />

més de 500 51 5.394<br />

de 100 a 500 144 43.488<br />

de 25 a 100 297 18.117<br />

menys de 25 482 9.408<br />

Per donar el vist-i-plau a aquest compte puntejarem una mostra de 76 registres obtinguts<br />

amb mostratge estratificat en quatre intervals. Quants apunts hem de prendre de cada estrat<br />

utilitzant:<br />

a) assignació mostral igual en cada estrat (assignació fixa)?<br />

b) assignació mostral en proporció al nombre de despeses comptabilitzades en cada estrat<br />

(assignació proporcional)?<br />

c) assignació mostral en proporció a la suma de despeses de cada estrat (assignació valoral)?<br />

5. La plantilla d’una empresa presenta per a les tres categories professionals les característiques<br />

següents:<br />

categoria treballadors salari mitjà/hora<br />

peons 448 392<br />

oficials 296 611<br />

tècnics 83 724<br />

Recordeu...!<br />

El mostratge estadístic<br />

distingeix segons la manera<br />

d’extracció dels elements<br />

mostrals:<br />

Mostratge aleatori pur:<br />

tria dels elements amb<br />

reemplaçament.<br />

Mostratge irrestricte:<br />

tria dels elements sense<br />

reemplaçament.<br />

Ho sabíeu...?<br />

Hi ha molts altres mètodes de<br />

selecció de mostres a part<br />

dels ja estudiats, entre<br />

d’altres:<br />

El mostratge aleatori<br />

sistemàtic consisteix a elegir<br />

a l’atzar un sol element de la<br />

població i a aconseguir la<br />

resta de la mostra a intervals<br />

regulars de dades.<br />

El mostratge per<br />

conglomerats consisteix a<br />

elegir a l’atzar no pas<br />

elements sinó grups o blocs<br />

representatius de tota la<br />

població per analitzar-ne<br />

tots els elements que<br />

contenen.<br />

Ho sabíeu...?<br />

A més a més de l’afixació<br />

proporcional, el mostratge<br />

estratificat comprèn altres<br />

maneres d’assignació de<br />

mostres en funció del criteri<br />

utilitzat per mesurar la<br />

importància de cada estrat.<br />

Distingim, entre d’altres:<br />

Afixació simple: igual<br />

submostra en cada estrat.<br />

Afixació proporcional:<br />

submostres en proporció al<br />

nombre d’elements que hi ha<br />

en cada estrat.<br />

Afixació valoral: submostres<br />

en proporció a la massa de<br />

variable inclosa en cada<br />

estrat.


© Universitat Oberta de Catalunya • W1/00702.06. 11<br />

Estadística<br />

Volem fer una enquesta a 62 dels 827 treballadors i ens plantegem la mostra que hem de<br />

prendre de cada categoria d’acord amb els criteris següents:<br />

a) En proporció al nombre de treballadors que integra cada estrat (assignació proporcional).<br />

b) En proporció a la massa salarial absorbida per cada estrat (assignació valoral).<br />

6. De vegades el mostratge estadístic no és el millor sistema per estudiar col·lectius de dades.<br />

Així, per exemple, les inspeccions bancàries no sempre es poden basar en mostres elegides a<br />

l’atzar i arriscar-se a no incorporar-hi elements clau per a un correcte diagnòstic financer. Argumenteu<br />

amb algun exemple aplicat a l’auditoria bancària la improcedència del mostratge<br />

estadístic i la conveniència d’utilitzar mostratge opinàtic o dirigit.


© Universitat Oberta de Catalunya • W1/00702.06. 12<br />

Estadística<br />

Solucionari:<br />

Part 2<br />

1. Si la mostra ha de ser representativa del personal de l’empresa, aquella haurà de guardar<br />

proporcionalitat amb aquells atributs (variables) que nosaltres considerem que distingeixen<br />

els treballadors d’aquesta empresa amb relació a la temàtica de què tracta l’enquesta. Certament<br />

d’atributs, n’hi poden haver de molts tipus:<br />

– categoria professional del treballador;<br />

– ubicació de la sucursal on treballa el treballador;<br />

– sexe del treballador;<br />

– edat del treballador;<br />

– etc.<br />

El primer que caldria destriar és quins són els atributs que volem que quedin representats<br />

proporcionalment en la mostra: caldria triar aquells que, a priori, creiem que poden tenir influència<br />

amb relació al tema de l’enquesta. Tot seguit, a partir de la informació que tinguem<br />

sobre el repartiment percentual de les diferents combinacions de les categories que adquireixen<br />

els atributs, haurem de procurar que la mostra de 1.000 persones contingui aquest mateix<br />

tant per cent. És a dir, s’ha de fer una mostra estratificada.<br />

Així, per exemple, si els atributs que interessen són només sexe (H-D) i ubicació del personal<br />

(U1, U2, U3, U4), i resulta que el personal de l’empresa està repartit de manera que:<br />

a la mostra, s’hi hauran de guardar aproximadament els mateixos percentatges. Per tant, haurem<br />

d’escollir 120 homes d’U1 i 150 dones d’U1; 110 homes d’U2 i 140 dones d’U2; etc. Com<br />

es pot suposar, si s’han de tenir en compte més atributs, el quadre anterior es complicarà tot i<br />

que el procediment haurà de ser en el fons el mateix.<br />

Una vegada conegut el nombre de persones de cada tipus que hi ha d’haver a la mostra, la selecció<br />

es pot fer aleatòriament i, si això no és possible, es pot procedir a fer-ho per quotes.<br />

2.<br />

3.<br />

4.<br />

a) Mostratge estratificat amb assignació simple.<br />

b) Mostratge per conglomerats, blocs o àrees.<br />

c) Mostratge sistemàtic.<br />

d) Mostratge estratificat amb assignació proporcional.<br />

e) Mostratge per conglomerats, blocs o àrees.<br />

f) Mostratge polietàpic o polifàsic.<br />

g) Mostratge sense retorn o irrestrictament aleatori.<br />

h) Mostratge sistemàtic.<br />

a) Sagnar un pacient fins l’última gota per saber quants glòbuls blancs té.<br />

Esbrinar el suc de llimona que es pot extreure de les plantacions del Baix Ebre.<br />

Determinar la resistència a la sequera dels avets que hi ha al Pirineu.<br />

La pressió màxima que és capaç d’aguantar cada un dels pneumàtics que fabriquem.<br />

b) Les despeses en esbarjo de tots els forasters que arriben a la Costa Brava.<br />

Índex de salinitat de l’oceà Atlàntic.<br />

Granets de sorra que hi ha a la platja de Gavà.<br />

Hores/dia que els universitaris dediquen a l’estudi.<br />

c) Eleccions municipals.<br />

Qualificació d’un examen tipus test amb moltes preguntes.<br />

Referèndum per decidir la sortida de l’OTAN.<br />

Emetre veredicte a partir de l’opinió del jurat popular.<br />

a) 19 apunts de cada un dels intervals.<br />

b) 4, 11, 23 i 38 apunts, respectivament.<br />

c) 6, 43, 18 i 9 apunts, respectivament.<br />

U1 U2 U3 U4<br />

H 12% 11% 10% 10% 43%<br />

D 15% 14% 12% 16% 57%<br />

27% 25% 22% 26% 100%


© Universitat Oberta de Catalunya • W1/00702.06. 13<br />

Estadística<br />

5. El quadre de treball següent recull els càlculs necessaris per realitzar les assignacions proporcionals:<br />

categoria Ni Xi Ni Xi<br />

peons 448 392 175.616<br />

oficials 296 611 180.656<br />

tècnics 83 724 60.092<br />

827 416.564<br />

El repartiment de la mostra de 62 treballadors per categories en funció de Ni i de Ni Xi dóna<br />

aproximadament les submostres següents:<br />

a) 34, 22 i 6 treballadors, respectivament.<br />

b) 26, 27 i 9 treballadors, respectivament.<br />

6. En alguns càrrecs o abonaments concrets es presenten certs tipus d’anomalies que cal<br />

anar a buscar.<br />

Hi ha descoberts de clients que són estacionals.<br />

En algunes agències es presenten sistemàticament determinades irregularitats que és precís<br />

que estiguin a la mostra.<br />

Per estudiar la viabilitat d’un sistema de crèdits s’acostuma a fer un seguiment d’alguna línia<br />

de préstec que abraci tots els controls i no solament uns quants.


© Universitat Oberta de Catalunya • W1/00702.06. 15<br />

Estadística<br />

Probabilitat, variables aleatòries<br />

1. Si teniu instal·lades les macros d’Excel per a anàlisi de dades, podreu accedir a Análisis de<br />

Datos amb el menú Herramientas i obtindreu un quadre amb la llista de macros possibles.<br />

a) Trieu Generación de datos aleatorios i genereu 100 dades aleatòries que segueixin una llei<br />

binomial amb paràmetres n = 5 i p = 0.25.<br />

b) Compteu les freqüències absolutes de cada un dels resultats possibles.<br />

c) Feu una taula amb l’Excel que mostri les freqüències relatives de la vostra simulació<br />

comparades amb les que dóna la fórmula d’Excel per a les probabilitats d’una binomial<br />

amb n = 5 i p = 0.25.<br />

2. En una bossa tenim set boles blanques i set boles negres, i cada col·lecció està numerada de<br />

l’u al set. Traiem tres boles a l’atzar i les col·loquem sobre la taula de dreta a esquerra en l’ordre<br />

en què les anem traient.<br />

a) Quants resultats diferents podem obtenir? (Us pot ajudar la regla de multiplicar possibilitats.)<br />

b) Quants dels trios possibles tenen alguna bola blanca? (Recordeu que sempre cal pensar:<br />

què és més fàcil de comptar, el que vull o el contrari?)<br />

c) Quants dels trios tenen exactament una bola blanca? Quants tenen exactament dues<br />

boles blanques?<br />

d) Quants d’aquests resultats contenen alguna bola amb el nombre 1? Quina diríeu que<br />

és la probabilitat d’obtenir alguna bola amb el nombre 1?<br />

3. Tenim contractades dues companyies de subministrament elèctric, HELSA i JOCSA, de manera<br />

que quan en falla una automàticament saltem a l’altra. La probabilitat que HELSA falli<br />

és del 7%, JOCSA falla el 5% de les vegades que ens hi connectem i sabem que la probabilitat<br />

que JOCSA falli quan ha fallat HELSA puja fins al 30%. Suposeu que la nostra estratègia és<br />

connectar amb HELSA i, si falla, saltar a JOCSA. Si aquesta també falla, recorrerem al nostre<br />

generador de gasoil.<br />

a) Tenint en compte la definició de probabilitat condicional, calculeu la probabilitat que<br />

fallin totes dues companyies alhora.<br />

b) Dibuixeu un diagrama tipus Venn amb els esdeveniments A = “HELSA falla”, B =<br />

“JOCSA falla”.<br />

c) Dibuixeu també un arbre de probabilitats seguint els criteris que s’han establert en el<br />

mòdul.<br />

d) Són independents els successos A i B? Quin és el succés A?<br />

e) Quina és la probabilitat que falli HELSA si ha fallat JOCSA? Si canviéssim l’estratègia<br />

prenent JOCSA com a primer proveïdor, hi sortiríem guanyant? Dibuixeu l’arbre corresponent.<br />

4. En un sistema automàtic, la primera fase la pot fer una de les tres màquines M1, M2, M3<br />

amb probabilitats de 0.2, 0.3 i 0.5 respectivament. El temps que tarden les maquines és,<br />

també respectivament, 1, 1.5 i 2 hores. La segona fase del procés és independent de la primera<br />

i es realitza a dins de l’empresa, amb probabilitat 0.75 i en dues hores, o a fora de l’empresa,<br />

en què tarden dues hores i mitja.<br />

a) Descriviu l’espai mostral associat a aquesta situació aleatòria i calculeu la probabilitat<br />

de cada un dels sis resultats possibles.<br />

b) Considereu la variable aleatòria X = “temps que ha trigat el procés complet”. Digueu<br />

quins són els valors possibles de la variable i quina és la probabilitat de cada un dels valors.<br />

Representeu gràficament la funció de probabilitat de X.<br />

c) Calculeu l’esperança de X.<br />

d) Com explicaríeu en termes de probabilitats el fet que la primera fase i la segona són independents?<br />

5. Tornem a la situació de l’exercici anterior, en què teníem una variable aleatòria X que ens<br />

dóna el temps necessari per a realitzar un procés que té dues fases.<br />

a) Si X1 és la variable “temps de la primera fase” i X2 = “temps de la segona fase”, calculeu<br />

els valors esperats i comproveu que l’esperança de la suma és la suma de les esperances.<br />

b) Calculeu les variàncies de les variables X, X1i X2. Es compleix aquí que la variància de<br />

la suma és la suma de variàncies? Per què?<br />

c) Si en lloc de mesurar els temps en hores ho fem en minuts, quin seria el valor esperat<br />

del temps total? I la variància?


© Universitat Oberta de Catalunya • W1/00702.06. 16<br />

Estadística<br />

Solucionari: Probabilitat, variables aleatòries<br />

1. Trieu l’opció Análisis de datos del menú Herramientas.<br />

a) Trieu l’opció Generación de números aleatorios de la llista de macros. Indiqueu que voleu<br />

una sola variable (una sola columna), i cent nombres aleatoris. Trieu l’opció Binomial de<br />

la llista Distribuciones.<br />

b) Indiqueu que voleu una probablitat d’èxit 0,25 i un nombre d’experiments 5. També<br />

heu d’indicar on voleu que vagin els nombres generats, en aquest cas hem posat $A$19.<br />

Feu clic en el botó Aceptar i obtindreu els cent nombres a les caselles $A$19:$A$118. Per a<br />

facilitar la feina posterior, desplegueu el menú Insertar, seleccioneu l’opció Nombre, a<br />

continuació l’opció Definir i escriviu ”dades” per a donar nom a aquestes caselles<br />

$A$19:$A:$118.<br />

c) Feu una llista dels valors possibles per fer la taula de freqüències.<br />

Les freqüències absolutes les podeu comptar manualment, però és més agradable que ho<br />

faci l’Excel. Una possibilitat és ordenar les dades per a facilitar-ne el recompte:<br />

Seleccioneu primer tot el tros que ocupen les dades i trieu l’opció Ordenar del menú Datos.<br />

Per tal que el recompte el faci l’Excel tot sol:<br />

Seleccioneu les caselles D39:D44 on han d’anar les freqüències absolutes. Trieu l’opció<br />

Función del menú Insertar. Busqueu la funció Frecuencia a la categoria Estadísticas. Feu<br />

clic a Siguiente i escriviu “dades” en el quadre anomenat Datos o bé $A$19:$A$118 si no<br />

heu definit “dades” abans. Introduïu C39:C44 en el quadre anomenat Grupos. Feu clic en<br />

el botó Aceptar i premeu alhora les tecles Retorn, Ctrl i Majúscules. Per a les freqüències<br />

relatives, podeu introduir la fórmula =D39/100 a la casella E39 i despres copiar-la a sota<br />

arrosegant la creueta inferior dreta. Per a la binomial exacta, podreu introduir fàcilment<br />

la fórmula DISTR.BINOM (C39;5;,25;falso) si la busqueu des de l’opció Función del menú<br />

Insertar. Busqueu DISTR.BINOM a la categoriade funcions estadístiques i feu clic a Siguiente.<br />

Haureu d’introduir la informació precisa: el valor de la binomial del qual voleu la<br />

probabilitat, el nombre d’experiments i la probabilitat d’èxit. Després, copieu la fórmula<br />

a sota. El resultat final és el següent:<br />

Valors Fr. absolutes Fr. relatives Binomial exacta<br />

0 24 0.24 0.237304688<br />

1 48 0.48 0.395507813<br />

2 22 0.22 0.263671875<br />

3 4 0.04 0.087890625<br />

4 2 0.02 0.014648438<br />

5 0 0 0.000976563<br />

“Si l’opció Análisis de datos no apareix al menú Herramientas, aquestes són les instruccions”<br />

necessàries per a activar les macros de l’Excel per a l’anàlisi de dades:<br />

– Trieu l’opció Macros automáticas del menú Herramientas.<br />

– Marqueu Herramientas para análisis en la llista de macros possibles<br />

– Feu clic en el botó Aceptar.<br />

“Si no apareix Herramientas para análisis en la llista de macros possibles, seguiu el procediment<br />

següent:”<br />

– Busqueu el CD-ROM o els disquets originals de l’Office 95.<br />

– Executeu el programa d’instal·lació de l’Office 95.<br />

– Aneu a Agregar o eliminar<br />

– Marqueu Microsoft Excel i Modificar opción del quadre de diàleg Mantenimiento<br />

– Marqueu Macros automáticas i Modificar opción<br />

– Assegureu-vos que Herramientas de Análisis està seleccionat.<br />

– Feu clic en el botó Aceptar fins que sortiu de la instal·lació.<br />

2.<br />

a) Per a comptar els resultats de treure tres boles, només hem de pensar que tenim 14<br />

boles diferents, que són les 14 possibilitats diferents per a la primera bola, tretze possi-<br />

1<br />

0<br />

1<br />

2<br />

1<br />

1<br />

2<br />

2<br />

0<br />

1<br />

1<br />

2<br />

1<br />

0<br />

1<br />

1<br />

2<br />

1<br />

2<br />

1<br />

2<br />

1<br />

3<br />

1<br />

0<br />

1<br />

0<br />

0<br />

3<br />

0<br />

0<br />

0<br />

1<br />

1<br />

0<br />

0<br />

0<br />

2<br />

1<br />

1<br />

0<br />

1<br />

2<br />

0<br />

3<br />

2<br />

1<br />

1<br />

3<br />

1<br />

Dades<br />

1<br />

2<br />

1<br />

0<br />

1<br />

1<br />

1<br />

1<br />

1<br />

1<br />

2<br />

1<br />

0<br />

1<br />

1<br />

4<br />

2<br />

1<br />

4<br />

0<br />

1<br />

1<br />

1<br />

2<br />

1<br />

1<br />

2<br />

0<br />

0<br />

2<br />

2<br />

2<br />

2<br />

1<br />

2<br />

0<br />

1<br />

0<br />

2<br />

1<br />

1<br />

1<br />

0<br />

0<br />

1<br />

0<br />

1<br />

1<br />

1<br />

2


© Universitat Oberta de Catalunya • W1/00702.06. 17<br />

Estadística<br />

3.<br />

bilitats per a la segona i només dotze per a la tercera: 14 × 13 × 12 = 2184 és el total de<br />

possibilitats.<br />

b) Per a saber quants resultats tenen alguna bola blanca, és molt més fàcil comptar quants<br />

no en tenen cap: 7 × 6 × 5 = 210 i restar: 2184 – 210 = 1974. Que tinguin exactament una<br />

bola blanca seran 7 possibles boles blanques en 3 posicions diferents i 7 × 6 possibilitats per<br />

a les altres dues boles que han de ser negres, total 7 × 3 × 7 × 6 = 882. Que tinguin exactament<br />

dues blanques seran 7 × 6 possibles parelles de boles blanques complementades amb<br />

7 possibles boles negres. Aquesta bola negra de complement pot anar col·locada en tres posicions<br />

diferents, total 7 × 6 × 7 × 3 = 882, la mateixa quantitat que abans. És casualitat?<br />

c) Si volem saber quantes d’aquestes possibilitats contenen una bola amb el nombre 1,<br />

serà més fàcil comptar quantes no tenen cap 1, que són 12 × 11 × 10 = 1320 i, per tant,<br />

que continguin algun 1 són 2184 – l320 = 864. La probabilitat d’obtenir algun 1 en treure<br />

tres boles és: 864/2184 ≈ 39,6%.<br />

a) La probabilitat que ens donen és p [ B | A ] = 0.3. La definició ens diu<br />

i d’això podem extreure que<br />

b)<br />

El diagrama de Venn de les fallades en el subministrament elèctric<br />

c) En la figura següent podeu veure l’arbre de probabilitats. Com sempre, posem en les<br />

branques probabilitats condicionals i en els nodes probabilitats absolutes de l’esdeveniment<br />

corresponent.<br />

1<br />

A<br />

Falla<br />

p [ B | A ] =<br />

.049<br />

HELSA<br />

Funciona<br />

0.07<br />

0.93<br />

La mateixa informació recollida en un arbre<br />

p [ A B]<br />

p [ A ]<br />

d) És ben clar que els successos A i B no són independents, ja que la probabilitat de B canvia<br />

quan condicionem A, és a dir,<br />

La probabilitat que ens demanen ara és:<br />

p [ A | B ] =<br />

U<br />

=<br />

p [ A B] = .021<br />

U<br />

0.021<br />

0.07<br />

0.93<br />

Falla<br />

JOCSA<br />

Funciona<br />

p [ B | A ] ≠ p [ B ]<br />

p [ A B]<br />

U<br />

p [ B ]<br />

=<br />

p [ A B]<br />

U<br />

0.07<br />

0.3<br />

0.7<br />

0.021<br />

0.05<br />

.029<br />

=<br />

B<br />

0.3<br />

0.021<br />

0.049<br />

=<br />

0.42<br />

.901


© Universitat Oberta de Catalunya • W1/00702.06. 18<br />

Estadística<br />

e) L’arbre corresponent a l’estratègia “primer JOCSA” és el de la figura següent. Veiem que la<br />

probabilitat de no tenir cap fallada és superior; en aquest sentit hi sortim guanyant. La probabilitat<br />

de necessitar el nostre equip electrogen continua essent, però, la mateixa, 0.021, i en<br />

aquest sentit és indiferent una estratègia o una altra.<br />

L’arbre per al cas que ens connectem primer amb JOCSA<br />

4.<br />

1<br />

Falla<br />

JOCSA<br />

Funciona<br />

a) Els resultats possibles són les sis parelles que es poden fer triant una opció de la primera<br />

fase i una altra de la segona fase (Dins o Fora). Tindrem l’espai mostral<br />

{(M1, D), (M2, D), (M3, D), (M1, F), (M2, F), (M3, F)}.<br />

Les probabilitats les podem presentar en una taula com la següent:<br />

Pel que fa als valors de la variable X, temps del procés, tindrem:<br />

b) La variable X té, doncs, només quatre valors diferents amb probabilitats respectives<br />

P[X = 3] = 0.15, P[X = 3.5] = 0.225 + 0.05 = 0.275<br />

P[X = 4] = 0.375 + 0.075 = 0.45, P[X = 4.5] = 0.125<br />

0.5<br />

0.45<br />

0.4<br />

0.35<br />

0.3<br />

0.25<br />

0.2<br />

0.15<br />

0.1<br />

0.05<br />

0<br />

2 2,5 3 3,5 4 4,5 5<br />

La funció de probabilitat de la variable temps<br />

0.05<br />

0.95<br />

0.05<br />

0.95<br />

Falla<br />

HELSA<br />

Funciona<br />

0.42<br />

0.58<br />

0.021<br />

0.029<br />

Probabilitat M1 M2 M3 Total<br />

Dins 0.15 0.225 0.375 0.75<br />

Fora 0.05 0.075 0.125 0.25<br />

Total 0.2 0.3 0.5 1<br />

Temps total M1 M2 M3<br />

Dins 3 3.5 4<br />

Fora 3.5 4 4.5


© Universitat Oberta de Catalunya • W1/00702.06. 19<br />

Estadística<br />

5.<br />

c) El valor esperat serà la suma dels productes dels valors per la seva probabilitat:<br />

E(X) = 30.15 + 3.50.275 + 40.875 + 4.50.25 = 3.775<br />

d) Que la primera fase i la segona són independents es tradueix en què la probabilitat que<br />

la segona fase es faci dins o fora de l’empresa és exactament la mateixa si la primera fase<br />

l’ha fet la màquina 1, la 2 o la 3.<br />

a) Els valors esperats seran:<br />

E(X1) = 0.21 + 0.31.5 + 0.52 = 1.65<br />

E(X2) = 0.752 + 0.252.5 = 2.125<br />

i veiem que la suma ens dóna 3.775, el mateix que hem obtingut a l’exercici anterior per<br />

a E(X).<br />

b) Les variàncies:<br />

V(X) = (3 – 3.775)2 * 0.15 + (3.5 – 3.775)2 * 0.275 + (4 – 3.775) 2 * 0.45 + (4.5 – 3.775) 2 *<br />

0.125 ≈ 0.1994<br />

V(X1) = (1 – 1.65)2 * 0.2 + (1.5 – 1.65)2 * 0.3 + (2 – 1.65) 2 * 0.5 = 0.1525<br />

V(X2) = 0.75 * (2 – 2.125) 2 + 0.25 * (2.5 – 2.125) 2 = .0468<br />

c) Es compleix (salvant errors d’arrodoniment) que la suma de variàncies és la variància<br />

de la suma, ja que les dues variables que sumen són independents (vegeu l’exercici anterior).<br />

Si en lloc de mesurar els temps en hores ho fem en minuts, treballem amb 60X en lloc de<br />

X i tindrem<br />

E(60X) = 60E(X) = 226.5, V(60X) = 60’V(X) = 717.84.


© Universitat Oberta de Catalunya • W1/00702.06. 21<br />

Estadística<br />

Distribucións de probabilitat<br />

1.<br />

a) S’ha obtingut el diagrama de tronc i fulles i el diagrama de caixa per a un conjunt de<br />

dades de la variable x.<br />

Cmd> stemleaf(x)<br />

17 +0 23334445677779999<br />

45 1 0011112223344444555666778899<br />

75 2 000011111222333444455555688899<br />

89 3 00122344778899<br />

(21) 4 000112223345556667899<br />

90 5 000123444669<br />

78 6 011244455666667899<br />

60 7 000002566778<br />

48 8 0235779<br />

41 9 02569<br />

36 10 0223469<br />

29 11 1223<br />

25 12 588<br />

22 13 13<br />

20 14 23<br />

18 15 3<br />

High 164, 172, 173, 190, 193, 200, 203, 221, 223, 301, 352, 409,<br />

442, 478, 543, 564, 788<br />

1 1 represents 0,11 Leaf digit unit = 0,01<br />

Cmd> boxplot(x,dumb:T)<br />

Box Plot<br />

+————+————+————+————+————+————+————+————++<br />

| |<br />

| |<br />

1,4 + +<br />

| +–+—+ |<br />

|+| | | |<br />

|+| | | |<br />

B 1,2 + | | | +<br />

o |+| | | |<br />

x |+| | | |<br />

|+| | |——–+**** * o o o o o o o o|<br />

N 1 + | | | +<br />

u |+| | | |<br />

m |+| | | |<br />

b |+| | | |<br />

e 0,8 + | | | +<br />

r | +–+—+ |<br />

| |<br />

| |<br />

0,6 + +<br />

| |<br />

+————+————+————+————+————+————+————+————++<br />

0 1 2 3 4<br />

Values<br />

5 6 7 8<br />

A partir d’aquests diagrames valoreu la normalitat d’aquestes dades. Diríeu que aquestes<br />

dades són una mostra procedent d’una distribució normal?


© Universitat Oberta de Catalunya • W1/00702.06. 22<br />

Estadística<br />

b) Aplicant una transformació logarítmica a les dades de x i adjudicant-les a la variable y<br />

s’obté el diagrama de tronc i fulles i el diagrama de caixa de les dades d’aquesta variable y.<br />

Cmd> y < – log (x)<br />

Cmd> stemleaf(y)<br />

Low –37<br />

7 –3* 322111<br />

13 –2. 876665<br />

27 –2* 33332211111100<br />

55 –1. 9999998888877776665555555555<br />

83 –1* 4444444333333332222211111000<br />

(40) –0. 9999999888888888877777777776666666655555<br />

77 –0* 44444444444443333333333222222211111110000<br />

36 +0* 00000001111222223344<br />

16 +0. 55666778<br />

8 +1* 1244<br />

4 +1. 567<br />

High 20<br />

+1* 1 represents 1,1 Leaf digit unit = 0,1<br />

Cmd> boxplot(y,dumb:T)<br />

Box Plot<br />

+ – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – +<br />

| |<br />

| |<br />

1,4 + +<br />

| + – – – – – + – – – + |<br />

| | | | |<br />

| | | | |<br />

B 1,2+ | | | +<br />

o | | | | |<br />

x | | | | |<br />

|* + – – – – – – – – – – – – – – | | | – – – – – – – – – – – – – +** * |<br />

N 1+ | | | +<br />

u | | | | |<br />

m | | | | |<br />

b | | | | |<br />

e 0,8+ | | | +<br />

r | + – – – – – + – – – + |<br />

| |<br />

| |<br />

0,6 + +<br />

| |<br />

+ – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – – – – – – – + – +<br />

–3 –2 –1<br />

Values<br />

0 1 2<br />

A partir d’aquests diagrames valoreu la normalitat d’aquestes dades transformades. Diríeu<br />

que aquestes dades són una mostra procedent d’una distribució normal?<br />

2. Les mesures següents corresponen a les notes d’examen de diferents assignatures d’un<br />

curs d’ensenyament bàsic, en tots els casos d’acord amb un model normal:<br />

assignatura mitjana estàndard<br />

Matemàtiques 3,9 1,4<br />

Llengua 5,4 1,5<br />

Història 6,0 2,1<br />

C. Naturals 5,8 2,2<br />

Esport 7,1 1,3<br />

Anglès 5,2 2,4<br />

Suposeu un alumne que ha tret respectivament en cada assignatura: 5,5 - 6 - 7,5 - 8 - 8,5 - 7,5.<br />

A partir de la tipificació d’aquestes notes indiqueu en quina assignatura l’alumne ocupa millor<br />

posició relativa i en quina ocupa pitjor posició respecte a la resta dels companys.<br />

Recordeu...!<br />

Per a estandarditzar una<br />

variable cal restar la mitjana<br />

i dividir per la desviació<br />

estàndard:<br />

Z =<br />

X –


© Universitat Oberta de Catalunya • W1/00702.06. 23<br />

Estadística<br />

3. Calculeu els valors z1, z2 i z3 corresponents al primer quartil, a la mediana i al tercer quartil,<br />

respectivament, d’una distribució normal estàndard.<br />

4. Expresseu en funció de i els valors x1, x2 i x3 corresponents al primer quartil, a la mediana<br />

i al tercer quartil, respectivament, d’una distribució normal de mitjana i desviació<br />

estàndard .<br />

5. Els experts han estimat per al proper any un increment en la xifra de vendes entre 70 i<br />

122 milions de ptes. amb una probabilitat del 80%, essent 96 milions la xifra més probable<br />

d’augment. Suposant un model acceptablement normal, quina probabilitat hi ha que l’increment<br />

no superi els 100 milions de ptes.?<br />

6. Hi ha dos tipus A i B de tests que mesuren la mateixa habilitat sobre un individu. L’aplicació<br />

reiterada d’aquests tests a molts individus ha permès establir que les puntuacions del test<br />

A es distribueixen segons una llei normal de mitjana 500 i desviació estàndard 100. De la mateixa<br />

manera, les puntuacions del test B es distribueixen segons una llei normal de mitjana<br />

18 i desviació estàndard 6. El Manel s’ha sotmès al test A i ha obtingut 680 punts, mentre que<br />

la Júlia s’ha sotmès al test B i ha obtingut una puntuació de 27 punts. Llavors, amb relació a<br />

l’habilitat mesurada per aquests dos tests, compareu totes dues puntuacions.<br />

7. Se sap d’altres convocatòries que les qualificacions mitjanes dels expedients acadèmics<br />

dels aspirants a obtenir una beca a l’estranger es distribueixen aproximadament segons una<br />

llei normal de mitjana 6,9 punts i desviació estàndard 0,7 punts. En la convocatòria d’aquest<br />

any s’han presentat 2.000 sol·licituds i només hi ha 50 beques per concedir. Aproximadament,<br />

a partir de quina nota d’expedient hom té possibilitats d’aconseguir una de les 50 beques?<br />

8. D’una distribució de mitjana i desviació estàndard desconegudes, se sap que l’interval<br />

(1831,5, 2160,5) està centrat en la mitjana de la distribució i conté un 90% de la població.<br />

Calculeu el valor de i .<br />

9. Un fabricant de camises vol treure una nova línia de producte adreçada a públic adolescent.<br />

S’ha calculat per a la futura clientela un diàmetre de coll normalment distribuït amb<br />

una mitjana de 36,5 cm i una desviació estàndard igual a 1 cm. Segons experiències anteriors,<br />

els que fan menys de 35 cm haurien de portar la talla petita, els que fan entre 35 i 36,5 cm la<br />

mitjana, entre 36,5 i 37,5 cm la gran i més de 37,5 cm l’extragran. Quina proporció de camises<br />

hauria de planificar de cada talla?<br />

10. Després de realitzar les proves de velocitat en l’examen de mecanografia s’ha comprovat<br />

que les pulsacions assolides pels alumnes s’adaptaven a un model normal de mitjana 265 i<br />

desviació estàndard de 20. En el supòsit que volguéssim suspendre el 33% de l’alumnat, donar<br />

aprovat al 15%, notable al 49,5% i excel·lent al 2,5% restant, quantes pulsacions hauríem<br />

de demanar per a cada qualificació?<br />

11. Experts d’una entitat d’estalvi han calculat que els recursos que es podrien captar amb un<br />

nou producte financer s’adapten a un model normal, estimant en un 73,5% la probabilitat de<br />

superar els 1.500 milions de ptes. i en un 98,8% la probabilitat de captar menys de 2.500 milions<br />

de ptes. Calculeu la probabilitat de superar els 1.700 milions de ptes. necessaris per fer<br />

rendible el llançament d’aquest nou producte financer.<br />

12. El 998 per mil de les ampolles d’oli contenen menys d’un litre, mentre que dues de cada<br />

tres ampolles contenen més de 0,870 litres d’oli. Assumint un model normal per al contingut<br />

de totes les botelles, quina proporció d’elles no arriba als 0,850 litres d’oli?<br />

13. Es calcula que la durada d’una pila d’una marca determinada s’adequa bastant bé a una<br />

llei normal, de manera que hi ha una probabilitat del 50% de superar les 7,56 hores d’ús i una<br />

probabilitat del 33% de superar-ne les 8 hores. Ens plantegem el càlcul de:<br />

a) Mitjana i desviació estàndard de la vida d’una pila.<br />

b) Proporció de piles que s’exhauriran abans de les 6,5 hores.<br />

c) Durada mínima que pot garantir el fabricant amb un risc d’incompliment del 4%.<br />

14. Necessitem fer una provisió d’un gran nombre de peces circulars el diàmetre de les quals<br />

ha d’estar necessàriament comprès entre 49 i 51 mm, ja que han d’encaixar correctament a<br />

l’interior d’una altra peça.<br />

Una fàbrica A ens informa que pot fer aquestes peces en un procés automàtic de producció<br />

en el qual el diàmetre de les peces fabricades es distribueix segons una llei normal de mitjana<br />

= 50 mm i desviació estàndard = 0,5 mm. El cost unitari és de 200 ptes.<br />

Una segona fàbrica B ens les pot servir igualment amb un cost unitari de 208 ptes., tot i que<br />

les característiques de fabricació són = 50 mm i desviació estàndard = 0,4 mm.<br />

Recordeu...!<br />

Es poden calcular àrees sota<br />

qualsevol corba normal, per<br />

a qualssevol paràmetres μ<br />

i σ, només estandarditzant<br />

i treballant sobre les taules<br />

de la distribució normal<br />

estàndard.<br />

Cal tenir present la simetria<br />

de la distribució normal per<br />

a fer un ús correcte de les<br />

taules.


© Universitat Oberta de Catalunya • W1/00702.06. 24<br />

Estadística<br />

Hem de decidir a quina de les dues fàbriques hem de comprar les peces, tenint en compte que<br />

les que no tinguin el diàmetre comprès entre 49 i 51 mm, no les podrem retornar ni reclamar<br />

a la fàbrica que ens les ha servides.<br />

Apliqueu un criteri de cost mínim per decidir entre una de les dues fàbriques.<br />

15. En un procés d’envasament automàtic de bosses de sucre, el contingut net introduït a<br />

la bossa es distribueix segons una llei normal de mitjana grams i desviació estàndard<br />

= 0,2 grams. Podem regular el procés canviant el valor de al nostre gust, sense que sigui<br />

possible canviar el valor de . Les bossetes haurien de contenir, com a mínim, 8 grams de sucre<br />

tal com figura a l’etiqueta. Les inspeccions oficials no permeten que més d’un 1,5% de les<br />

bossetes envasades tinguin un contingut inferior al que indica l’etiqueta.<br />

Calculeu el valor mínim de per tal d’assegurar que el procés d’envasament supera els controls<br />

oficials.<br />

16. A la ciutat de Girona, el 62,1% de la gent són catalanoparlants, el 31,2%<br />

castellanoparlants i la resta, 6,7%, parla una altra llengua. Un estudiant de ciències<br />

polítiques fa un estudi empíric sobre la nova llei lingüística i la gent, en la seva mostra de<br />

123 gironins, es divideix en els grups<br />

següents:<br />

– catalanoparlants 3<br />

– castellanoparlants 24<br />

– altres 6<br />

Aquesta mostra és representativa de la població de Girona o no ho és?<br />

17. Es tira un dau 60 vegades i surt cinc vegades l'1, dotze el 2, nou el 3, nou el 4, catorze el<br />

5 i onze el 6. Quines són les freqüències esperades si el dau no està trucat? Hi ha una<br />

diferència significativa entre aquest resultat observat i el que esperem?<br />

18. Mireu les dades dels tres poemes de Miguel Hernández en l’exercici 1 de l’apartat 1<br />

("Estadística descriptiva"). Calculeu l’estadístic khi quadrat per comprovar si hi ha<br />

diferències entre els poemes respecte a la utilització de les 9 paraules.<br />

19. El nombre d’inscripcions per a un diploma de postgrau en una universitat a Catalunya<br />

per als anys 1995-96 i 1996-97 és el següent:<br />

nois noies<br />

1995-96 64 25<br />

1996-97 49 6<br />

a) Per explicar la representació de les noies, quins percentatges calcularíeu? Percentatges<br />

files o percentatges columnes? Feu els càlculs i interpreteu els resultats.<br />

b) Si no hi hagués diferències en la representació femenina d’un any a l’altre, quants<br />

nois i quantes noies hauríeu esperat de les 89 persones que es van inscriure el 1995-96 i<br />

de les 65 del 1996-97?<br />

c) Calculeu l’estadístic khi quadrat que mesura la diferència entre les freqüències<br />

observades i les esperades i comenteu-ne el resultat.<br />

20. En una discoteca hi ha dos tipus de clients: els qui entren de franc presentant el carnet<br />

de soci i els qui abonen un tiquet a l’entrada amb dret a una consumició. S’ha fet un<br />

seguiment de cada un dels dos grups amb els resultats següents:<br />

mostra 86 111<br />

prenen 2 consumicions<br />

o més<br />

socis no socis<br />

59 60<br />

Calculeu l’estadístic khi quadrat per determinar si hi ha una diferència significativa entre les<br />

proporcions d’ambdós col·lectius que prenen més d’una consumició.


© Universitat Oberta de Catalunya • W1/00702.06. 25<br />

Estadística<br />

21. Sigui x una variable aleatòria amb valors 1, 2, 3, ..., n i amb funció de probabilitat:<br />

f(x) = k x x = 1, 2, ..., n<br />

a) Calculeu el valor de k .<br />

b) Quina és la funció de distribució de X?<br />

c) Calculeu la probabilitat que X sigui parell.<br />

22. Un examen tipus test consisteix en cinc preguntes, cada una amb tres possibles<br />

respostes. Un alumne contesta a l’atzar les cinc preguntes. Suposant que cada resposta<br />

correcta val dos punts, trobeu la funció de probabilitat del nombre de punts obtinguts de<br />

l’alumne.<br />

23. Sigui X una variable aleatòria que designa el nombre de cotxes venuts cada setmana en<br />

una concessionària. Sabem que X té la funció de probabilitat següent:<br />

X 0 1 2 3 4 5 6 7 8 o més<br />

p(x) 0.04 0.04 k 0.11 0.30 0.23 0.10 0.05 0.03<br />

a) Calculeu el valor de k.<br />

b) Determineu la funció de distribució de X.<br />

c) Calculeu les probabilitats següents: p(2 < X £ 5), p(X &sup3; 7) i p(X £ 6 | X > 3)<br />

24. Sigui X una variable aleatòria amb funció de probabilitat:<br />

f(x) = 1 - |x| |x| < 1<br />

a) Feu un diagrama d’aquesta funció.<br />

b) Determineu i dibuixeu la funció de distribució de X.<br />

c) Calculeu les probabilitats següents: p(X > = 0), i p(|X| < 0,5).<br />

25. El nombre de pacients, X, que necessiten diàriament els serveis de la unitat coronària de<br />

la comarca del Bages segueix la distribució de Poisson amb paràmetre l = 5. L’hospital<br />

comarcal només té capacitat per a rebre tres d’aquests pacients i en desvia la resta a una<br />

clínica a Barcelona. Determineu la funció de probabilitat del nombre d’ingressos diaris a la<br />

unitat coronària de l’hospital comarcal.<br />

26. El nombre de persones per cotxe que entra a l’aparcament de Port Aventura té la funció<br />

de probabilitat següent:<br />

nombre de persones, X 1 2 3 4 5<br />

p(x) 0.15 0.20 0.35 0.20 0.10<br />

Calculeu el nombre mitjà de persones per cotxe i la variància.<br />

27. El temps, en dies, que una persona abonada al servei CatNet d’Internet tarda a contestar<br />

un missatge de correu electrònic té la distribució de probabilitat següent:<br />

F(x) = 1 - (2/3)exp(-x/2)<br />

a) Demostreu que això és una distribució exponencial. Amb quin paràmetre?<br />

b) Calculeu el temps mitjà i el temps medià que tarda a contestar.<br />

c) Quin percentatge de gent contesta en menys d’un dia?<br />

28. Si X és una variable aleatòria amb distribució de Bernoulli, quin és el valor del paràmetre<br />

p que dóna la variància var(X) més gran?<br />

29. Sigui X una variable aleatòria amb distribució binomial de paràmetres p = 0.3 i n = 15.<br />

Calculeu:<br />

a) La probabilitat p(X = 2).<br />

b) La probabilitat p(X £ 2).<br />

c) El valor mínim de x tal que p(X £ x) &sup3; 0.3<br />

30. El nombre d’accidents laborals, X, que es produeixen en una fàbrica cada<br />

setmana segueix una distribució Poisson. Sabem que el percentatge de<br />

setmanes en què hi ha un accident és la meitat del percentatge de setmanes<br />

sense cap accident.


© Universitat Oberta de Catalunya • W1/00702.06. 26<br />

Estadística<br />

a) Quin és el valor del paràmetre l ?<br />

b) Quin és el nombre esperat d’accidents setmanals?<br />

c) Quina és la probabilitat que en dues setmanes successives es produeixin<br />

dos accidents cada setmana?<br />

31. Sabem, segons els partits que va jugar l’equip de bàsquet del TDK Manresa, que un<br />

jugador determinat té una probabilitat de 0.8 d’èxit en tirs lliures.<br />

a) Aquest jugador realitza una sèrie de 5 tirs lliures. Quina és la<br />

probabilitat que n’encerti almenys dos?<br />

b) Quin és el nombre mitjà de tirs lliures abans d'aconseguir el primer èxit<br />

de tir lliure?<br />

32. En la fabricació de certes làmines metàl·liques es produeixen<br />

imperfeccions que estan distribuïdes aleatòriament sobre tota la superfície.<br />

El nombre d’imperfeccions per làmina és una variable aleatòria de Poisson de<br />

mitjana 2.<br />

a) Es trien a l’atzar 10 làmines de la cadena de muntatge. Quina és la<br />

probabilitat que exactament 3 tinguin defectes?<br />

b) Quin percentatge de làmines tindran almenys 4 imperfeccions?


© Universitat Oberta de Catalunya • W1/00702.06. 27<br />

Estadística I<br />

Solucionari: Distribucións de probabilitat<br />

1.<br />

a) Tant el diagrama de tronc i fulles com el diagrama de caixa de la variable x mostren un<br />

clar biaix cap a la dreta, la qual cosa fa sospitar que la població origen de la mostra no es<br />

distribueix segons una llei normal amb relació a aquesta variable.<br />

b) Els dos diagrames presenten una simetria acceptable. El diagrama de tronc i fulles<br />

mostra una forma clarament de campana, pròpia de les distribucions normals. Per tant, a<br />

la vista d’aquests diagrames, es podria pensar que la variable transformada y = log(x) segueix<br />

una distribució normal sobre la població de procedència de la mostra.<br />

2. Un cop tipificades, les notes de l’alumne proporcionen els valors següents:<br />

assignatura nota tipificada<br />

Matemàtiques 1,14 (més alta)<br />

Llengua 0,40 (més baixa)<br />

Història 0,71<br />

C. Naturals 1,00<br />

Esport 1,07<br />

Anglès 0,96<br />

3. Els valors de la normal estàndard corresponents a la mediana i al primer i tercer quartils<br />

són:<br />

z1 = –0,675 z2 = 0 z3 = 0,675<br />

Les àrees sota les z del primer quartil, la mediana i el tercer quartil són, respectivament,<br />

0,250, 0,500 i 0,750. La consulta de les taules d’una distribució normal estàndard ens proporciona<br />

els valors corresponents z1, z2 i z3 abans indicats. (Com que, a les taules, no hi trobem<br />

exactament l’àrea 0,2500, fem la mitjana entre les z corresponents a les àrees de 0,2483 i<br />

0,2514. El mateix fem per a l’àrea 0,7500.)<br />

4. Els valors corresponents al primer quartil, a la mediana i al tercer quartil d’una distribució<br />

normal de mitjana i desviació estàndard són:<br />

x1 = – 0,675*σ x2 = x3 = + 0,675*<br />

N’hi ha prou a “llevar l’estandardització” (aplicar la fórmula inversa de l’estandardització)<br />

dels valors z1, z2 i z3 trobats a l’exercici anterior.<br />

5. Per a calcular la probabilitat demanada cal obtenir prèviament la mitjana i la desviació<br />

estàndard. Atès que 96 és la xifra més probable (moda), també coincideix amb la mitjana en<br />

una distribució normal:<br />

= 96<br />

D’altra banda, tipificant els punts 70 i 122 (centrats en la mitjana) obtenim l’acotació d’una<br />

àrea del 80%:<br />

122 – <br />

<br />

= 1,282<br />

70 – <br />

<br />

= 1,282<br />

d’on obtenim la desviació estàndard:<br />

= 20,28<br />

i ara ja podem calcular la probabilitat demanada:<br />

P (X < 100) = P (Z < 0,20) = 0,579<br />

6. Atès que les puntuacions dels dos tests segueixen distribucions normals amb diferents<br />

mitjanes i desviacions estàndard, la comparació s’ha de fer a partir de les respectives puntuacions<br />

estàndard:<br />

Puntuac. estàndard Manel = (680–500) / 100 = 1,8<br />

Puntuac. estàndard Júlia = (27–18) / 6 = 1,5<br />

D’aquesta manera, s’observa que la puntuació estàndard del Manel és més gran que la de la<br />

Júlia.<br />

7. Aproximadament, a partir de la nota 8,27 punts. Si només es poden adjudicar 50 beques<br />

entre les 2.000 sol·licituds, això vol dir que només seran acceptades un 2,5% de les peticions.<br />

Cal, doncs, buscar el valor x d’una llei normal X de = 6,9 i = 0,7 que té una àrea per sobre<br />

igual a 0,025. Aquest valor no és altre que x = 6,9 + 1,96 * 0,7 = 8,27 punts. (Trobareu el valor<br />

z = 1,96 a les taules.)


© Universitat Oberta de Catalunya • W1/00702.06. 28<br />

Estadística I<br />

8. Els valors de i demanats són: = 1,996 = 100<br />

El valor de serà el punt central de l’interval (1831,5, 2160,5): = (1831,5+2160,5) / 2 =<br />

1996. Ja que dins l’interval (1831,5, 2160,5) centrat a hi ha una àrea igual a 0,90, repartit en<br />

els dos extrems hi haurà el 0,10 que resta. Per tant, sota el valor 1831,5 hi ha una àrea de 0,05.<br />

Això fa que el valor estàndard de 1831,5 sigui z = –1,645 (consulteu taules) i que s’hagi de<br />

complir la igualtat:<br />

d’on, aïllant la , s’obté = 100.<br />

9.<br />

10.<br />

1831,5 = 1996 – 1,645 * <br />

11. Hi ha una probabilitat de 0,52 que l’operació sigui rendible.<br />

12. Cal calcular prèviament els paràmetres del model normal:<br />

2<br />

3<br />

Resolent el sistema tenim = 0,88688 i = 0,0393, la qual cosa permet obtenir la probabilitat<br />

demanada:<br />

P(X


© Universitat Oberta de Catalunya • W1/00702.06. 29<br />

Estadística I<br />

– Fàbrica B.<br />

Com que el seu procés de fabricació segueix una llei normal de mu = 50 mm i sigma<br />

= 0,4 mm, n’hi haurà prou a calcular l’àrea que sota aquesta corba normal queda a l’esquerra<br />

de 49 mm i l’àrea que queda a la dreta de 51 mm. O, equivalentment, l’àrea compresa<br />

entre 49 i 51 mm, i després restar d’1. Si estandarditzem aquests dos valors, obtenim:<br />

x1 = 49 mm z1 = (49-50) / 0,4 = –2,5 área a l’esquerra = 0,0062<br />

x2 = 51 mm z2 = (51-50) / 0,4 = +2,5 àrea a l’esquerra = 0,9938<br />

àrea compresa entre x1 i x2 = 0,9938 – 0,0062 = 0,9876<br />

àrea a l’esquerra de x1 + àrea a la dreta de x2 = 1– 0,9876 = 0,0124<br />

Per tant, un 1,24% de les peces fabricades per B seran dolentes.<br />

Cal prendre la decisió a partir de criteris econòmics. De cada peça que comprem a A només<br />

n’aprofitarem 0,9544 i en pagarem 200 ptes. Per tant, el preu real d’una peça bona (aprofitable)<br />

serà 200 / 0,9544 = 209,6 ptes. De la mateixa manera, de cada peça que comprem a B només<br />

n’aprofitarem 0,9876, i en pagarem 208 ptes. Per tant, el preu real d’una peça bona<br />

(aprofitable) serà de 208 / 0,9876 = 210,6 ptes. Així doncs, des d’un punt de vista estrictament<br />

econòmic, és aconsellable comprar a la fàbrica A.<br />

15. Hem de calcular la de la distribució normal de = 0,2 grams, de tal manera que a l’esquerra<br />

de 8 grams hi hagi, com a màxim, una àrea de 0,015. Mirant les taules d’una distribució<br />

normal estàndard, el valor z que deixa a l’esquerra una àrea de 0,015 ès z = –2,17. Això vol<br />

dir, doncs, que l’estandardització de x = 8 gr ha de ser z = –2,17. Si apliquem la fórmula de<br />

“llevar l’estandardització”:<br />

x = + z <br />

on x = 8, z = –217, sigma = 0,2, podem aïllar la i trobar que = 8.434 grams.


© Universitat Oberta de Catalunya • W1/00702.06. 31<br />

Estadística<br />

Distribucions mostrals<br />

1. Suposeu una aula de jocs amb 5 alumnes assistents: Mireia (4 anys), Lluís (6 anys), Susanna<br />

(8 anys), Roger (6 anys) i Esteve (4 anys). Si prenguéssim una mostra aleatòria i sense<br />

retorn de 2 alumnes:<br />

a) Quina és la distribució de l’edat mitjana de la mostra?<br />

b) Comproveu que la mitjana de totes les possibles mitjanes mostrals coincideix amb la<br />

mitjana de la població.<br />

c) Quina és la distribució de la proporció de noies que hi ha a la mostra?<br />

d) Comproveu que la mitjana de totes les proporcions mostrals coincideix amb la proporció<br />

de noies que hi ha a tota la població.<br />

2. Indiqueu raonadament quines de les afirmacions següents són certes i quines són falses.<br />

a) La mitjana X – n es distribueix sempre segons una llei normal, sigui quina sigui la mida n<br />

de la mostra i sigui quin sigui el tipus de distribució que segueix la variable X.<br />

b) Sigui X la variable (= població): “Edat de les persones mortes a Catalunya els últims<br />

5 anys”. Prenem mostres de mida n = 4. Llavors és cert que la variable X – 4 segueix una llei<br />

normal.<br />

c) Si la variable (= població) X es distribueix segons una llei normal, la variable X – n pot ser<br />

que no sigui normal, si la mida n de la mostra és petita.<br />

d) Si n ≥ 2, llavors la desviació estàndard de X – n és sempre menor que la desviació estàndard<br />

de X.<br />

3. S’ha calculat que un nen de 7 anys està veient televisió un nombre aleatori d’hores que<br />

segueix una distribució normal de paràmetres = 2,2 i = 0,8. Si prenem una mostra aleatòria<br />

de 25 nens d’aquella edat, quina probabilitat hi ha que la mitjana de la mostra no superi<br />

les dues hores?<br />

4. Una empresa que fabrica llumins se sotmet a una auditoria de control de qualitat. Un dels<br />

controls consisteix a auditar el nombre X de llumins que contenen les capses. L’empresari<br />

afirma que la variable X té una mitjana = 50 llumins i una desviació estàndard<br />

= 0,5 llumins.<br />

L’auditor pren una mostra de 25 capses i compta el nombre de llumins que contenen. Els<br />

25 valors que obté són els següents:<br />

48 49 49 49 50 50 51 50 50 51<br />

50 49 50 50 50 50 49 50 49 49<br />

50 49 51 50 49<br />

Donant per bona la desviació estàndard del procés, creieu que l’auditor donarà per bona la<br />

mitjana = 50 del procés? Raoneu la vostra resposta.<br />

5. Se sap que un 64% de les persones d’una població molt nombrosa són no fumadores. Simbolitzem<br />

amb p la proporció de persones no fumadores presents en una mostra<br />

aleatòria de mida n = 400 persones procedents d’aquesta població.<br />

a) Quin tipus de distribució segueix aproximadament la proporció mostral p?<br />

b) Quant valen la mitjana i la desviació estàndard d’aquesta distribució?<br />

c) Doneu un interval centrat a 0,64 (= 64%) que contingui un 95% dels possibles valors<br />

que pot adquirir p.<br />

d) És possible que, essent 64% la proporció real de no fumadors de la població, la proporció<br />

p de no fumadors de la nostra mostra de 400 persones sigui igual a 56,8%? Ho veieu<br />

gaire probable (= factible)? Raoneu la vostra resposta.<br />

6. El pes de les pomes d’una collita s’adapta bastant bé a un model normal de mitjana 212 gr i<br />

desviació estàndard 24 gr. Si prenem un cistell amb 16 unitats, quina probabilitat hi ha que el<br />

pes mitjà de les pomes:<br />

a) superi els 200 gr?<br />

b) estigui comprès entre 210 i 214 gr?<br />

7. Hom sap que el pes net de les garrafes d’aigua mineral de determinada marca segueix una<br />

llei normal de paràmetres = 8,062 i = 0,291 litres. Quina probabilitat hi ha que una mostra<br />

aleatòria de 16 garrafes proporcioni un pes mitjà inferior a 8 litres?<br />

8. Un registre inclou gran quantitat d’apunts comptables relatius a despeses corrents amb<br />

una variància igual a 2224. Volem prendre una mostra aleatòria de manera que la probabilitat<br />

que l’import mitjà mostral es desviï (per excés o per defecte) de la veritable mitjana poblacional<br />

més de 12 ptes. sigui d’un 5%. Quina mida de mostra ens caldrà?<br />

9. Quan un procés automàtic d’envasament de cafè està sota control, el contingut net de cafè<br />

dels paquets es distribueix segons una llei normal de = 251 gr i desviació estàndard<br />

= 0,6 gr. Per tal de controlar el procés, es treuen periòdicament mostres de 9 paquets de<br />

Recordeu...!<br />

La distribució de la mitjana<br />

mostral (X – ) se centra al<br />

voltant del valor de la mitjana<br />

poblacional () i té una<br />

dispersió inferior a la de la<br />

població, dispersió que ve<br />

donada per la seva desviació<br />

estàndard:<br />

¯x = n<br />

La distribució de la proporció<br />

mostral (ρ) se centra al voltant<br />

del valor de la proporció<br />

poblacional (π) amb una<br />

dispersió que ve donada per<br />

la seva desviació estàndard:<br />

(1– )<br />

p =<br />

n<br />

Nota:<br />

Si X simbolitza una variable<br />

(= població) qualsevol,<br />

convindrem a simbolitzar<br />

amb – Xn la variable: “Mitjana<br />

de les mostres de mida n<br />

procedents de X”.<br />

Recordeu...!<br />

Si podem suposar que la<br />

mitjana mostral es distribueix<br />

normalment i coneixem la<br />

mitjana poblacional (o un<br />

valor de referència<br />

prèviament fixat) i l’error<br />

estàndard de la mitjana<br />

mostral, aleshores podem<br />

fixar els límits de control de<br />

qualitat com a tres errors<br />

estàndard a cada costat de<br />

la mitjana poblacional.


© Universitat Oberta de Catalunya • W1/00702.06. 32<br />

Estadística<br />

cafè. Els paquets de la mostra es pesen juntament amb els seus envasos i es calcula la mitjana<br />

X – dels 9 pesos. Se sap que l’envàs d’un paquet té un pes constant de 10 gr.<br />

Indiqueu quins són els límits de control superior i inferior d’aquest procés amb relació a la<br />

variable “pes total (cafè + envàs) dels paquets de cafè”.<br />

10. Una empresa de calculadores de butxaca ha seleccionat una mostra aleatòria de 100 calculadores<br />

per tal de conèixer–ne el percentatge que el procés productiu genera com a defectuoses.<br />

Suposant que poblacionalment el 90% de les calculadores produïdes per l’empresa<br />

són acceptables, quina és la probabilitat que la proporció mostral no es desviï per excés ni per<br />

defecte més d’un 5% de la proporció poblacional?<br />

11. Un empresari assegura que el percentatge de productes defectuosos que fabrica és del 5%.<br />

Un client decideix comprovar l’afirmació del fabricant seleccionant aleatòriament 200 productes,<br />

entre els quals en troba 19 de defectuosos. El procés de fabricació es troba sota control?<br />

Seguirà el client comprant al fabricant?<br />

12. Una determinada escola de mecanografia afirma que només el 10% dels alumnes que superen<br />

les seves proves cometen errors mecanogràfics seriosos. Una empresa decideix iniciar<br />

un procès de selecció de mecanògrafs i mecanògrafes i efectua proves a 100 alumnes d’aquella<br />

escola. Quin haurà de ser el nombre d’entrevistats amb errors mecanogràfics seriosos per<br />

tal de poder afirmar que el procés d’aprenentatge està fora de control?


© Universitat Oberta de Catalunya • W1/00702.06. 33<br />

Estadística<br />

Solucionari: Distribucions mostrals<br />

1.<br />

2.<br />

a) Atès que realitzem un mostratge aleatori sense retorn, podem formar 10 parelles diferents<br />

amb els 5 nens; en conseqüència, podem obtenir 10 mostres diferents de 2 nens. La<br />

mitjana mostral de cadascuna de les 10 parelles és:<br />

M-Ll (4+6) / 2 = 5 M-S (8+4) / 2 = 6<br />

M-R (4+6) / 2 = 5 M-E (4+4) / 2 = 4<br />

L-S (6+8) / 2 = 7 L-R (6+6) / 2 = 6<br />

L-E (6+4) / 2 = 5 S-R (8+6) / 2 = 7<br />

S-E (8+4) / 2 = 6 R-E (6+4) / 2 = 5<br />

i, per tant, la distribució de la mitjana mostral és:<br />

mitjana % freqüència<br />

4 10<br />

5 40<br />

6 30<br />

7 20<br />

b) La mitjana aritmètica de totes les mitjanes mostrals és:<br />

(5+6+5+4+7+6+5+7+6+5) / 10 = 5,6<br />

valor coincident amb la mitjana de la població():<br />

(4+6+8+6+4) / 5 = 5,6<br />

c) Considerant ara la proporció de noies a les diferents mostres tenim:<br />

M-Ll 50% M-S 100%<br />

M-R 50% M-E 50%<br />

L-S 50% L-R 0%<br />

L-E 0% S-R 50%<br />

S-E 50% R-E 0%<br />

i, per tant, la distribució de la proporció mostral de noies és:<br />

proporció % freqüència<br />

0 30<br />

50 60<br />

100 10<br />

d) La mitjana aritmètica de totes les proporcions mostrals és:<br />

(0+0+0+50+50+50+50+50+50+100) / 10 = 40%<br />

valor coincident amb la proporció de noies que hi ha a la població ( = 2 / 5 = 40%).<br />

a) Fals. Si la variable X no és normal i la mida n de la mostra és petita, la variable X – n pot<br />

ser bastant diferent d’una llei normal.<br />

b) Fals. En aquest cas, la variable X té un biaix molt fort (és molt asimètrica) cap a l’esquerra.<br />

Per tant, X no és normal, i com la mida n = 4 de les mostres és molt petita, la variable<br />

X – n continuarà encara mostrant un biaix en la mateixa direcció i, en conseqüència, no<br />

s’ajustarà a una llei normal.<br />

c) Fals. Si X és normal, sigui quina sigui la mida n de la mostra, la variable X – n segueix<br />

sempre una llei normal.<br />

d) Cert. La desviació estàndard de X – n és igual a / n,<br />

essent la desviació estàndard de<br />

la variable (població) X. Per tant, si n ≥ 2, el valor de /n serà inferior al valor de .<br />

3. Atès que el nombre d’hores que un nen de 7 anys veu la televisió es distribueix normalment,<br />

la mitjana mostral obtinguda a partir d’una mostra aleatòria es distribuirà també normalment<br />

sigui quina sigui la mida de la mostra. En aquest cas, coneixem també els valors poblacionals<br />

= 2,2 hores i = 0,8 hores, la qual cosa ens permet determinar la distribució de la mitjana<br />

mostral, que serà normal de mitjana = 2,2 hores i desviació estàndard = 0,8 25 = 0,16.


© Universitat Oberta de Catalunya • W1/00702.06. 34<br />

Estadística<br />

En aquestes condicions podem calcular la probabilitat que la mitjana mostral prengui un valor<br />

inferior o igual a 2 hores, o el que és el mateix, l’àrea que queda per sota de la corba normal<br />

definida pels paràmetres que caracteritzen la distribució de la mitjana mostral:<br />

4. Segurament l’auditor no donarà per bona la mitjana X – = 50 llumins del procés.<br />

El més normal és que l’auditor comenci calculant la mitjana X – del nombre de llumins de la<br />

mostra de 25 capses. Aquesta mitjana és igual a X – = 49.68 llumins.<br />

El que procedeix tot seguit és preguntar-se fins a quin punt és possible obtenir una mitjana de<br />

X – = 49,68 llumins en una mostra de n = 25 capses quan el procés funciona correctament.<br />

Si l’empresari diu la veritat, la mitjana del procés val = 50 llumins i la desviació estàndard<br />

= 0,5 llumins. En aquest cas, doncs, la variable X – de les mostres de mida 25 es comportarà<br />

com una llei normal de mitjana = 50 llumins i desviació estàndard = 0,5 / 5 = 0,1 llumins.<br />

Ens podem preguntar, llavors, si la mitjana X – n<br />

= 49,68 llumins está gaire “allunyada” de<br />

la mitjana teòrica = 50 llumins. Per mesurar-ho, n’hi haurà prou a calcular el nombre de<br />

desviacions estàndards a què està situat X de μ:<br />

(49,68 – 50) / 0,1= –3,2<br />

La mitjana està, doncs, a 3,2 desviacions estàndard a l’esquerra del valor teòric de . Això és<br />

altament improbable que passi. Si mirem les taules, a l’esquerra de –3,2 només hi ha una àrea<br />

de 0,0007 = 0,07%.<br />

Per tant, hi ha molts motius per a sospitar que la real del procés no és = 50 llumins, sinó<br />

més petita.<br />

5.<br />

6.<br />

a) La proporció mostral p segueix una distribució normal atès que la mida de la mostra<br />

(n = 400) és molt gran i la proporció p no és excessivament petita.<br />

b) La mitjana de la proporció mostral p és igual a 0,64 i la desviació estàndard és<br />

igual a 0,024. Segons la teoria, la proporció mostral p calculada sobre mostres de mida n<br />

té per mitjana el valor que té la proporció en el conjunt de la població ( = 0,64 = 64%) i<br />

per desviació estàndard:<br />

c) Interval que conté la proporció mostral p:<br />

(0,64 – 1,96 x 0,024 , 0,64 + 1,96 x 0,024) = (0,593 , 0,687)<br />

d) Sí que és possible obtenir una mostra amb una proporció del 56,8% de persones no fumadores.<br />

No és, però, gens factible (probable).<br />

Segons es veu a l’apartat c), un 95% de les vegades, la proporció p de no fumadors en una<br />

mostra de mida 400 procedent d’una població amb un 64% de persones no fumadores,<br />

estarà compresa entre 59,3% i 68,7%. Per tant, si bé és possible que l’atzar ens faci obtenir<br />

una mostra amb una proporció de 56,8% de no fumadors, és altament improbable d’obtenir<br />

aquest valor.<br />

Podem ser encara més precisos: el valor 0,568 està a 3 desviacions estàndard a l’esquerra<br />

de la mitjana 0,064:<br />

(0,568 – 0,64) / 0,024 = –3<br />

L’àrea a l’esquerra de –3 en una distribució normal estàndard és 0,0013, la qual cosa vol<br />

dir que només un 0,13% de les proporcions mostrals estan tan allunyades de 0,64 com la<br />

proporció 0,568 de la nostra mostra o més.<br />

a) 0,977<br />

b) 0,262<br />

X – – <br />

P(X<br />

n<br />

– ≤2) = P(<br />

7. La probabilitat és de 0,19711.<br />

8. Calen entre 59 i 60 apunts comptables.<br />

9. Límit de control inferior: 260,4 gr<br />

Límit de control superior: 261,6 gr<br />

10. La probabilitat és d’un 0,91.<br />

(1–)<br />

n<br />

≥<br />

2 – 2,2<br />

0,16<br />

= P(Z≤–1,25) = 0,10565<br />

= 0,64 ⋅ 0,36/400 = 0,024


© Universitat Oberta de Catalunya • W1/00702.06. 35<br />

Estadística<br />

11. La desviació estàndard de la proporció mostral val 0,015. Els límits de control seran, doncs,<br />

0,05 ± 3 x 0,015 = (0,005 ; 0,095) = (0,5% ; 9,5%) de manera que el procés es troba vorejant els<br />

límits de control, atès que la proporció mostral pren un valor de 19 / 200 = 9,5%.<br />

12. La desviació estàndard de la proporció mostral val 0,03. Els límits de control seran,<br />

doncs, 0,10 ± 3 x 0,03 = (0,01 ; 0,19) = (1% ; 19%). En conseqüència, si apareixen més de 19<br />

mecanògrafs i mecanògrafes amb errors seriosos, el procés es trobarà fora de control.


© Universitat Oberta de Catalunya • W1/00702.06. 37<br />

Estadística<br />

Intervals de confiança<br />

1. Volem determinar el consum mitjà diari d’aigua beguda per un adult. Després de controlar<br />

una mostra de 612 persones adultes vàrem calcular una mitjana igual a 0,62 litres i una<br />

desviació estàndard de 0,28 litres. Treballant amb una confiança del 72%, obteniu un interval<br />

per a la mitjana de tota la població.<br />

2. Una màquina confecciona broques d’acer de llargada aleatòria normalment distribuïda.<br />

Per estimar la seva longitud mitjana s’ha pres una mostra a l’atzar de 18 peces amb les mides<br />

següents donades en mil·límetres:<br />

32,5 33,3 33,1 32,6 32,7 33,7 33,1 32,3 33,6 33,0<br />

32,7 32,8 32,3 32,6 33,6 33,5 33,4 32,9<br />

Estimeu un interval per a la mitjana de les llargades als nivells de confiança del:<br />

a) 80% b) 90% c) 95% d) 99%<br />

3. La velocitat màxima assolible per quatre models diferents de motocicleta, tots ells de característiques<br />

tècniques similars, s’adapta bastant bé a models normals. Per comprovar si<br />

aquesta velocitat punta també és similar, hem sotmès a prova 10 motocicletes de cada model<br />

amb els màxims enregistrats següents:<br />

Model 1 Model 2 Model 3 Model 4<br />

172 172 168 170<br />

168 171 169 168<br />

168 173 168 170<br />

173 172 169 170<br />

171 169 171 172<br />

171 170 173 172<br />

169 171 171 172<br />

168 170 171 169<br />

171 173 169 171<br />

168 172 172 168<br />

Heu de calcular un interval al 95% de confiança per a la velocitat màxima que es pot aconseguir<br />

en cada model de motocicleta i comprovar si hi ha algun valor comú que pertanyi als<br />

quatre intervals.<br />

4. Diversos estudis de mercat proporcionaven els resultats mostrals següents a partir<br />

dels quals heu de cercar l’interval de confiança per a la proporció poblacional al nivell<br />

1 – = 0,9:<br />

a) De 900 persones consultades, 225 feien més de 3 setmanes seguides de vacances.<br />

b) Preguntats 760 nens, 525 eren partidaris de les joguines bèl.liques.<br />

c) 442 de 508 homes casats deien compartir les tasques domèstiques de la llar.<br />

d) Una enquesta a 600 usuaris d’una línia de tren de rodalies mostrava satisfacció en el<br />

servei en 486 dels preguntats.<br />

5. Utilitzant l’expressió per a determinar la mida mostral en situació de màxima incertesa,<br />

calculeu la mostra necessària per a esbrinar la proporció de fumadors que hi ha entre la població<br />

adulta d’un país amb una precisió de més-menys 2% i una confiança del 70%, 80%,<br />

90%, 95% i 99%.<br />

6. Les dades següents corresponen als residents observats en una mostra de 60 habitatges<br />

d’una barriada:<br />

4 8 3 6 0 4 4 2 1 0 7 2 2 3 1<br />

1 6 3 2 3 0 0 3 5 3 1 3 4 3 1<br />

1 6 5 0 3 5 1 6 7 2 8 3 2 9 0<br />

6 5 2 9 2 1 0 6 0 5 3 6 1 4 2<br />

Treballant amb un nivell 0,95 de confiança, calculeu un interval:<br />

a) Per a la mitjana de residents per habitatge.<br />

b) Per a la proporció de vivendes desocupades.<br />

c) Per a la proporció de vivendes on viuen 5 o més persones.<br />

Recordeu...!<br />

El marge d’error d’un interval<br />

de confiança és el radi de<br />

l’interval al voltant de la<br />

mitjana o la proporció.<br />

Si coneixem la desviació<br />

estàndard poblacional d’una<br />

població normal o si es pot<br />

aplicar el teorema del límit<br />

central, el marge d’error es<br />

calcula utilitzant la distribució<br />

normal estàndard:<br />

±Z/2 ⋅ X –<br />

Si desconeixem la desviació<br />

estàndard poblacional i<br />

només disposem de la<br />

corresponent dada mostral,<br />

hem d’utilitzar la distribució t<br />

de Student:<br />

± t/2.n1 ⋅ S X –


© Universitat Oberta de Catalunya • W1/00702.06. 38<br />

Estadística<br />

7. En un supermercat s’està estudiant el temps que tarda el responsable de la caixa a atendre<br />

un client. Per això es mesura el temps que 25 clients triats a l’atzar tarden a ser atesos. Els 25<br />

temps mesurats, expressats en segons, són els següents:<br />

52 33 81 158 29 43 19 63 19 248<br />

31 123 70 21 57 99 10 20 18 14<br />

18 144 89 32 95<br />

Estimeu, a un nivell de confiança del 95%, la mitjana del temps de servei d’un client en els<br />

dos supòsits següents:<br />

a) Suposeu que la desviació estàndard del temps de servei és coneguda d’altres vegades<br />

i igual a = 50 segons.<br />

b) Suposeu que la desviació estàndard del temps de servei és desconeguda, per la qual<br />

cosa l’heu d’estimar a partir de la mostra obtinguda.<br />

8. El gerent d’una empresa de serveis vol conèixer el grau de satisfacció dels seus clients amb<br />

relació a l’atenció rebuda per part del personal de l’empresa. (Els clients es desplacen a l’empresa<br />

a hores concertades amb antelació.)<br />

Amb aquesta finalitat, durant un mes, demanen a uns quants clients que visiten l’empresa<br />

que contestin un breu qüestionari. Una de les preguntes del qüestionari és:<br />

Ha hagut d’esperar més de 5 minuts de l’hora prèviament concertada per ser atès?<br />

La resposta és senzillament sí o no i suposarem que no es produeixen respostes en blanc.<br />

Al final del mes s’han recollit un total de 600 enquestes, en què 225 enquestats contesten<br />

afirmativament a la pregunta anterior.<br />

a) Estimeu, a un nivell de confiança del 99%, la proporció (expressada en tant per cent)<br />

de clients d’aquesta empresa que s’han d’esperar més de 5 minuts per ser atesos.<br />

b) Fa 6 mesos es va passar la mateixa enquesta i la proporció de clients que varen contestar<br />

afirmativament l’anterior pregunta va ser del 40,2%. A la vista de les dades de l’última<br />

mostra, afirmaríeu (des d’un punt de vista estadístic) que la proporció ha disminuït significativament?<br />

9. En una enquesta preelectoral d’unes eleccions municipals, una empresa especialitzada ha<br />

preguntat la intenció de vot a una mostra de 400 persones triades aleatòriament, de les quals<br />

220 han manifestat que pensen votar el partit A. Els responsables del partit A, a la vista del resultat<br />

de l’enquesta, afirmen que tenen les eleccions guanyades.<br />

Jutgeu i critiqueu, des d’un punt de vista estrictament estadístic, l’afirmació dels responsables<br />

del partit A.<br />

10. Es vol estimar, amb un nivell de confiança del 95% i amb un marge d’error no superior a<br />

2.000 ptes., la mitjana dels ingressos familiars mensuals d’una gran col·lectivitat.<br />

Atès que no es té cap tipus d’informació del valor de la desviació estàndard d’aquesta variable<br />

en aquesta col·lectivitat, es treu una petita mostra inicial de 100 famílies i es calcula la<br />

desviació estàndard s dels seus ingressos. El valor que s’obté és s = 36.000 ptes.<br />

Prenent com a valor de el valor s de la mostra prospectiva, determineu la mida n que ha de<br />

tenir com a mínim la mostra per dur a terme l’estimació esmentada.<br />

11. En un procés de producció de copes de cristall, hom vol estimar, a un nivell de confiança<br />

del 99,6% i amb un marge d’error no superior a 0,5%, la proporció percentual de copes malmeses<br />

al final del procés de producció. Se sap d’altres vegades que aquesta proporció no supera<br />

l’1% de la producció total.<br />

Determineu la mida mínima n que ha de tenir la mostra que cal investigar.<br />

12. Raoneu si és certa l’afirmació següent o no:<br />

“Per fer una estimació, a un determinat nivell de confiança, de la intenció de vot a un<br />

partit A en una ciutat com Barcelona, s’ha de triar una mostra molt més gran que la que es<br />

triaria per fer la mateixa estimació en una ciutat més petita, com ara Girona”.<br />

Ho sabíeu...?<br />

Per provar la validesa<br />

d’alguns supòsits o creences<br />

apriorístiques hi ha<br />

procediments més adequats<br />

que els que fins ara heu après.<br />

Més endavant, estudiareu<br />

la contrastació d’hipòtesis,<br />

la qual aporta una metodologia<br />

de treball molt més<br />

estructurada i potent per a<br />

contestar algunes de les<br />

qüestions que aquí es<br />

plantegen.<br />

Ho sabíeu...?<br />

Quan la població sobre la<br />

qual es realitza el mostratge<br />

és finita, és a dir, quan està<br />

formada per pocs individus,<br />

cal realitzar unes correccions<br />

en les expressions dels errors<br />

estàndards de mitjanes i<br />

proporcions mostrals:<br />

¯x =<br />

<br />

n<br />

p = p(1–p)<br />

n<br />

on N és la mida de la<br />

població.<br />

N–n<br />

N–1<br />

N–n<br />

N–1


© Universitat Oberta de Catalunya • W1/00702.06. 39<br />

Estadística<br />

Solucionari: Intervals de confiança<br />

1. El fet de treballar amb una mostra gran (n = 612) ens permet que, malgrat desconèixer el<br />

valor de la desviació estàndard poblacional i, per tant, trobant-nos obligats a utilitzar la desviació<br />

estàndard mostral, puguem utilitzar la distribució normal estàndard per tal de fixar els<br />

valors que determinen l’interval de confiança.<br />

L’interval de confiança per a la mitjana poblacional és:<br />

–<br />

X ± z α /2 s n<br />

0,62 ± 1,08 ⋅ 0,28/ 612<br />

Al nivell de confiança del 72% hem de localitzar el valor de la normal estàndard que acumula<br />

fins a ell un 86% de l’àrea total, de manera que en les dues cues alienes a l’interval quedi el<br />

28% restant repartit a parts iguals entre ambdues cues. El valor cercat és z = 1,08.<br />

Finalment, realitzant les operacions l’interval és de 0,608 a 0,632 litres per persona i dia.<br />

2. Amb les dades mostrals:<br />

grandària = 18<br />

mitjana = 32,983<br />

desv. estàndard = 0,454<br />

i els punts crítics de la llei t de Student:<br />

trobem els intervals següents per a la mitjana:<br />

a) (32,841 33,126)<br />

b) (32,797 33,170)<br />

c) (32,757 33,209)<br />

d) (32,673 33,294)<br />

3. Amb els paràmetres mostrals següents:<br />

1- t/2<br />

0,80 1,333<br />

0,90 1,740<br />

0,95 2,110<br />

0,99 2,898<br />

mostra mitjana desv. est. est. de mitj.<br />

Model 1 10 169,90 1,91 0,60<br />

Model 2 10 171,30 1,34 0,42<br />

Model 3 10 170,10 1,73 0,55<br />

Model 4 10 170,20 1,55 0,49<br />

i el punt crític de la llei t de Student al nivell 0,95 i 9 graus de llibertat (2,262), trobem els intervals<br />

següents:<br />

Model 1 (168,532 171,268) (—————*—————)<br />

Model 2 (170,343 172,257) (—————*—————)<br />

Model 3 (168,863 171,337) (—————*—————)<br />

Model 4 (169,091 171,309) (—————*—————)<br />

on podem comprovar que admeten alguns valors comuns que farien admissible el supòsit<br />

que tots els models permeten assolir una mateixa mitjana de velocitat punta.<br />

4. Per a tots els casos, la proporció de la població () girarà al voltant de la proporció mostral (p)<br />

més-menys un marge d’error resultant de multiplicar el punt crític de la distribució normal<br />

(1,645 en aquest exercici) per l’error estàndard de l’estadístic p(1–p)<br />

.<br />

n<br />

p± 1,645<br />

la qual cosa implicaria els intervals següents:<br />

p(1–p)<br />

n<br />

a) 0,2263 - 0,2737 c) 0,8455 - 0,8946<br />

b) 0,6632 - 0,7184 d) 0,7837 - 0,8363


© Universitat Oberta de Catalunya • W1/00702.06. 40<br />

Estadística<br />

5. Les mides mostrals per a cadascun dels nivells de confiança són:<br />

6.<br />

7.<br />

8.<br />

a) Amb les mides mostrals:<br />

mitjana: 3,25<br />

desv. estàndard: 2,454<br />

obtenim l’interval per a la mitjana poblacional:<br />

(2,616 3,884)<br />

b) Amb el percentatge mostral de vivendes desocupades (0,133), obtenim l’interval de la<br />

proporció poblacional:<br />

(0,0473 0,2193)<br />

c) Amb el percentatge mostral d’habitatges amb 5 o més residents (0,3), obtenim l’interval<br />

de la proporció poblacional:<br />

(0,184 0,416)<br />

a) L’interval és de 43,84 a 83,04 segons.<br />

b) L’interval és de 39,90 a 86,98 segons.<br />

confiança mostra<br />

70% 526<br />

80% 801<br />

90% 1.028<br />

95% 1.225<br />

99% 1.610<br />

a) L’interval de confiança és de 32,4% a 42,59%.<br />

b) A la vista de les últimes dades i, per tant, treballant sobre la distribució de la proporció<br />

mostral que ve donada per p = 0,375 amb p = 0,01976, la probabilitat d’obtenir una proporció<br />

mostral més gran o igual que 40,2% és d’un 8,03%, relativament poc probable. En<br />

conseqüència es pot afirmar que hi ha hagut una reducció significativa del temps d’espera.<br />

9. A la vista dels resultats mostrals, amb una proporció de vot favorable al partit A del 55%,<br />

l’interval de confiança per a estimar la proporció poblacional amb un nivell de confiança del<br />

95% pren els valors de 50,1% a 59,9%. En aquest sentit, amb una confiança del 95% s’assegurarien<br />

la majoria absoluta.<br />

Malgrat tot, al 99% de confiança l’interval s’estén des del 48,6% fins al 61,44%, de tal manera<br />

que no és possible garantir la victòria d’una manera absoluta.<br />

10. La mida de la mostra ha de ser superior a 1.245 famílies.<br />

11. La mida mínima que ha de tenir la mostra és de 3.285 copes.<br />

12. Si malgrat haver-hi diferències substancials entre les poblacions de Barcelona i Girona es<br />

pot suposar que totes dues són infinites a efectes estadístics, es podrà utilitzar la mateixa<br />

mida de mostra per a ambdues ciutats.<br />

En cas contrari ens trobaríem davant de mostratge en poblacions finites i caldria efectuar una<br />

correcció en el càlcul de l’error estàndard de la proporció mostral que donaria lloc a diferències<br />

de mida mostral. L’error estàndard per a proporcions mostrals en mostratge per a poblacions<br />

finites és:<br />

p =<br />

p(1–p)<br />

n<br />

N–n<br />

N–1


© Universitat Oberta de Catalunya • W1/00702.06. 41<br />

Estadística<br />

Relacions entre variables<br />

1. Una factoria disposa de dades relatives al procés de producció: nombre d’unitats acabades<br />

(Y) i nombre d’hores treballades (X), sobre una mostra pilot de 10 setmanes:<br />

setm. Y X setm. Y X<br />

1 2.649 43 6 2.212 40<br />

2 3.305 51 7 3.045 47<br />

3 2.965 47 8 1.885 34<br />

4 1.865 34 9 1.997 36<br />

5 3.711 54 10 4.626 60<br />

A partir d’aquesta informació heu de realitzar una estimació completa de la relació lineal de Y<br />

sobre X.<br />

2. En dades de municipis de petita i mitjana dimensió hem observat el nombre d’agències<br />

bancàries que hi operen, com també un índex d’activitat comercial:<br />

Bancs 16 9 24 8 11 10 4 2<br />

Índex 113 74 185 70 85 82 60 51<br />

Efectueu les regressions de Bancs s/ Índex i d’Índex s/Bancs, comprovant que:<br />

a) Les dues rectes es tallen en les mitjanes de les variables.<br />

b) El coeficient de determinació és el mateix i coincideix amb el producte dels dos pendents.<br />

3. Sobre una mostra de 20 arbres d’una gran plantació hem observat les variables:<br />

Diàmetre de la soca del tronc en cm<br />

Alçada fins la copa en cm<br />

Volum de fusta en uu de capacitat<br />

Densitat de la fusta en uu de densitat<br />

amb els resultats següents:<br />

Arbre Diàmetre Alçada Volum Densitat<br />

1 21,0 213 0,292 729,452<br />

2 21,8 198 0,292 678,082<br />

3 22,4 192 0,289 664,360<br />

4 26,6 219 0,464 472,206<br />

5 27,2 247 0,532 464,286<br />

6 27,4 253 0,558 449,533<br />

7 28,0 210 0,480 437,500<br />

8 27,9 229 0,515 440,679<br />

9 26,6 217 0,423 513,002<br />

10 28,4 229 0,564 412,213<br />

11 28,7 241 0,685 351,825<br />

12 26,2 232 0,502 462,151<br />

13 29,0 232 0,606 365,360<br />

14 29,7 210 0,603 348,259<br />

15 30,5 229 0,541 419,234<br />

16 28,7 251 0,696 360,632<br />

17 32,8 259 0,957 272,223<br />

18 29,1 240 0,775 319,057<br />

19 34,8 216 0,728 296,703<br />

20 35,1 195 0,705 272,642<br />

El nostre propòsit és explicar la densitat a partir de la variable que estigui més correlacionada,<br />

qüestió per la qual se us demana que:<br />

a) Calculeu el coeficient de correlació lineal entre la densitat i cada una de les altres variables.<br />

b) Estimeu la recta de regressió entre la densitat i la variable que presenta major correlació.<br />

c) Presenteu la taula que conté els valors reals, estimats i errors en l’ajustament anterior.<br />

Ho sabíeu...?<br />

En la recta de regressió de Y<br />

sobre X el pendent pren el<br />

valor:<br />

cov (x,y)<br />

m =<br />

mentre que en la recta de<br />

regressió de X sobre Y el<br />

pendent pren el valor:<br />

m =<br />

cov (x,y)<br />

De manera que el producte<br />

de m per m’ serà igual al<br />

quadrat del coeficient de<br />

correlació lineal entre X i Y, o<br />

el que és el mateix, el<br />

coeficient de determinació R2 de la regressió lineal de X<br />

sobre Y o de Y sobre X:<br />

= r 2 = R2 [cov (x,y)] 2<br />

m ⋅ m’ =<br />

sx 2 sy 2<br />

sx 2<br />

sy 2


© Universitat Oberta de Catalunya • W1/00702.06. 42<br />

Estadística<br />

4. Sovint s’utilitza la regressió per determinar la trajectòria lineal que presenten algunes variables<br />

en el decurs del temps. Això l’equació:<br />

Y = a + b t<br />

representa la tendència d’una variable cronològica (Y), i com a variable explicativa emprem<br />

el temps (t).<br />

Suposeu la distribució de les vendes de telèfons portàtils en una regió observada per al període<br />

1991-1996:<br />

t 1 2 3 4 5 6<br />

Y 348 505 724 996 1.220 1.492<br />

Efectueu una estimació de la trajectòria anual de les vendes i feu una previsió fins l’any 2000<br />

projectant la recta d’ajust trobada.<br />

5. Disposem de dades relatives a alguns anys sobre les variables:<br />

Any VEN PUB<br />

1991 236,7 8,3<br />

1992 * 9,4<br />

1993 258,8 9,2<br />

1994 250,6 9,1<br />

1995 279,8 10,5<br />

1996 * 10,8<br />

VEN: vendes en milers de milions<br />

de pessetes<br />

PUB: despeses de publicitat<br />

en milions de pessetes<br />

Obteniu la recta de regressió que explica la xifra de vendes a partir de les despeses de publicitat<br />

utilitzant la informació dels anys 1991, 1993, 1994 i 1995 i feu una estimació per als anys<br />

1992 i 1996.<br />

6. S’ha pres una mostra pilot de famílies formades pel matrimoni i dos fills, un noi i una noia d’edats<br />

compreses entre 12 i 16 anys. En tots els casos se’ls ha demanat que valoressin de 0 a 10 una<br />

dotzena de programes de televisió, la qual cosa ens ha permès d’obtenir la taula de resultats següent<br />

a partir de les puntuacions mitjanes de tots els enquestats:<br />

Programa Mare Pare Filla Fill<br />

1 Notícies 6,4 7,1 3,7 2,9<br />

2 Futbol 2,3 9,0 4,2 9,2<br />

3 Concert 2,0 1,9 2,5 0,6<br />

4 Magazine 7,3 5,8 7,1 6,7<br />

5 Cabaret 4,4 8,1 2,7 7,8<br />

6 Concurs 5,4 5,5 6,7 6,7<br />

7 Natura 7,8 6,6 8,6 5,7<br />

8 Dibuixos 0,3 0,6 3,9 4,4<br />

9 Cinema 8,1 8,0 6,2 7,5<br />

10 Serial 7,7 2,7 6,9 3,1<br />

11 Humor 2,8 3,2 2,5 3,3<br />

12 Tertúlia 5,3 6,7 2,7 4,1<br />

Calculeu les correlacions dos a dos de les diferents puntuacions atorgades.<br />

7. Un cop calculats en dòlars els ingressos i estalvis de les famílies d’un país hem obtingut<br />

una correlació igual a 0,75. Quant hauria donat la correlació si haguéssim calculat les variables<br />

en pessetes?<br />

Ho sabíeu...?<br />

Un dels principals objectius<br />

de la regressió és la predicció<br />

o el pronòstic sobre el<br />

comportament esperat d’una<br />

variable donat un valor<br />

determinat de l’altre. Si la<br />

variable explicativa és el<br />

temps, t, aleshores el model<br />

de regressió lineal ens permet<br />

fer prediccions dels valors<br />

futurs de la variable<br />

dependent Y.


© Universitat Oberta de Catalunya • W1/00702.06. 43<br />

Estadística<br />

8. Disposem d’una distribució bivariant relativa als temps invertits per una dotzena de nens<br />

en els 100 i 200 metres llisos:<br />

nen 100 200<br />

1 13,8 30,6<br />

2 13,6 29,9<br />

3 12,9 28,2<br />

4 14,5 31,7<br />

5 14,2 31,1<br />

6 14,6 31,7<br />

7 13,0 28,7<br />

8 12,9 28,6<br />

9 13,8 30,3<br />

10 13,8 32,0<br />

11 14,6 32,6<br />

12 14,1 30,9<br />

a) Calculeu la mitjana i la desviació estàndard dels temps aconseguits en totes dues curses.<br />

b) Presenteu les distribucions estandarditzades.<br />

c) Calculeu la covariància entre les dues sèries tipificades i comproveu que coincideix<br />

amb la correlació que presenten les variables abans d’estandarditzar.<br />

9. Hom sap que hi ha una relació funcional entre el cost de producció (C) i el nombre d’unitats<br />

acabades (q). A partir de les dades corresponents a 12 dies de fabricació elegits a l’atzar:<br />

dia C q dia C q<br />

1 23563,3 217 2 51860,9 322<br />

3 32786,9 256 4 54799,4 331<br />

5 21031,3 205 6 64459,4 359<br />

7 84479,4 411 8 27631,3 235<br />

9 74903,4 387 10 88639,4 421<br />

11 92468,9 430 12 70331,4 375<br />

volem determinar quin dels models següents resultaria més adequat com a funció de costos:<br />

C = a + b q<br />

C = a + b q2<br />

C = a + b log q<br />

qüestió per la qual heu de calcular la correlació lineal que presenta la variable C i cada una de<br />

les variables explicatives q, q2 i log q.


© Universitat Oberta de Catalunya • W1/00702.06. 44<br />

Estadística<br />

Solucionari: Relacions entre variables<br />

1. L’estimació del model de producció és:<br />

2.<br />

3.<br />

predictor coeficient desv. est. raó t<br />

constant –1654,5 239,4 –6,911<br />

X 100,46 5,276 19,041<br />

Desv. estàndard de les pertorbacions: 139,6<br />

Coeficient de determinació: 0,978<br />

a) Les rectes de regressió:<br />

Bancs = – 3,729 + 0,1581 Índex<br />

Índex = 27,156 + 5,9851 Bancs<br />

es tallen en el punt 10,5 i 90, que correspon a les mitjanes respectives de bancs i índex.<br />

b) El producte dels dos pendents (0,1581 * 5,9851) coincideix amb el coeficient de determinació<br />

de les dues rectes de regressió (0,9462).<br />

a) Correlacions entre la densitat i la resta de variables:<br />

b) Regressió de la densitat respecte al diàmetre:<br />

diàmetre alçada volum<br />

densitat –0,933 –0,439 –0,925<br />

predictor coef. desv. est. estadístic-t<br />

constant 1356,04 84,25 16,09<br />

diàmetre –32,731 2,975 –11,00<br />

s = 47,87 R 2 = 0,871<br />

c) Llistat d’observacions, estimacions i errors de la regressió:<br />

arbre densitat estim. densit. error<br />

1 729,452 668,696 60,7565<br />

2 678,082 642,511 35,5713<br />

3 664,360 622,872 41,4875<br />

4 472,206 485,403 –13,1967<br />

5 464,286 465,764 –1,4784<br />

6 449,533 459,218 –9,6850<br />

7 437,500 439,579 –2,0794<br />

8 440,679 442,853 –2,1735<br />

9 513,002 485,403 27,5997<br />

10 412,213 426,487 –14,2741<br />

11 351,825 416,668 –64,8430<br />

12 462,151 498,495 –36,3435<br />

13 365,360 406,849 –41,4886<br />

14 348,259 383,937 –35,6782<br />

15 419,234 357,752 61,4818<br />

16 360,632 416,668 –56,0356<br />

17 272,223 282,471 –10,2482<br />

18 319,057 403,575 –84,5184<br />

19 296,703 217,009 79,6939<br />

20 272,642 207,190 65,4518


© Universitat Oberta de Catalunya • W1/00702.06. 45<br />

Estadística<br />

4. L’equació de la tendència ajustada és:<br />

Yt = 67,1333 + 232,486 * t<br />

i les previsions de vendes fins l’any 2000<br />

5. Aplicant la regressió mínim quadràtica obtindrem l’ajustament<br />

VEN = 74,86 + 19,581 PUB<br />

amb alta bondat d’adherència i capacitat explicativa, com mostren els seus coeficients:<br />

Coef. de determinació: 0,978<br />

Això fa que resultin molt fiables les estimacions dels anys 1992 i 1996, havent de substituir<br />

només en l’equació de regressió la variable PUB pels valors d’aquells anys<br />

6. Les correlacions són:<br />

7. Suposant un canvi del tipus: 1 dòlar = 135 pessetes, la covariància s’hauria multiplicat per<br />

135 2 i cada desviació estàndard per 135. Per tant, el coeficient de correlació no s’hauria alterat<br />

ja que és insensible a qualsevol canvi d’escala en les variables.<br />

8.<br />

a)<br />

any vendes esperades<br />

1997 1694,53<br />

1998 1927,02<br />

1999 2159,50<br />

2000 2391,99<br />

predictor coef. desv. est. estadístic-t<br />

constant 74,86 19,26 3,89<br />

PUB 19,581 2,069 9,47<br />

any VEN estimada<br />

1992 258,92<br />

1996 286,34<br />

Pare 0,440<br />

Filla 0,698 0,134<br />

Fill 0,176 0,713 0,330<br />

variable mitjana desv. estàndard<br />

100 m.ll. 13,817 0,626<br />

200 m.ll. 30,525 1,433<br />

Mare Pare Filla<br />

b) Si per a cada variable hi restem la mitjana i ho<br />

dividim per la desviació estàndard, haurem creat<br />

noves variables sense escala ni origen, obtenint:<br />

valors estandarditzats<br />

nen 100 m.ll. 200 m.ll.<br />

1 –0,02661 0,05232<br />

2 –0,34587 –0,43601<br />

3 –1,46330 –1,62196<br />

4 1,09082 0,81970<br />

5 0,61193 0,40113<br />

6 1,25046 0,81970<br />

7 –1,30367 –1,27315<br />

8 –1,46330 –1,34292<br />

9 –0,02661 –0,15696<br />

10 –0,02661 1,02899<br />

11 1,25046 1,44756<br />

12 0,45229 0,26161


© Universitat Oberta de Catalunya • W1/00702.06. 46<br />

Estadística<br />

Podríem comprovar que la nova mitjana és 0 i la desviació estàndard és 1 en cada cas.<br />

c) Un coeficient de correlació no és més que una covariància entre variables tipificades.<br />

Per tant:<br />

Cov ( X – X<br />

sx<br />

Y – Y ) = rxy<br />

sv<br />

En el nostre exemple dóna 0,929 tant en un cas com en un altre.<br />

,<br />

9. Correlacions entre el cost de producció i les variables seleccionades com a explicatives:<br />

q 0,996<br />

q 2 1,000<br />

log q 0,984<br />

q 2 és la variable que presenta major correlació amb C (correlació perfecta). L’equació funcional<br />

que millor explicaria els costos de producció seria la paràbola incompleta de segon grau.<br />

C

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!