14.01.2013 Views

CORSO INTENSIVO DI STATISTICA I (V.O.) Esercizi

CORSO INTENSIVO DI STATISTICA I (V.O.) Esercizi

CORSO INTENSIVO DI STATISTICA I (V.O.) Esercizi

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>CORSO</strong> <strong>INTENSIVO</strong> <strong>DI</strong> <strong>STATISTICA</strong> I (V.O.)<br />

<strong>Esercizi</strong><br />

Dott.ssa CATERINA CONIGLIANI<br />

Facoltà di Economia<br />

Università Roma Tre<br />

1 <strong>Esercizi</strong> di statistica descrittiva<br />

<strong>Esercizi</strong>o 1.1 (Prof. Pieraccini, 20–6-00) In un pronto soccorso di un ospedale<br />

sono stati registrati il numero delle richieste di intervento giornaliere (X) su un arco<br />

di 100 giorni, ottenendo la seguente distribuzione di frequenza:<br />

X 0 1 2 3 4 5 6 7 8 9 10<br />

n(X) 2 9 18 22 16 12 9 5 4 2 1<br />

Fare la rappresentazione grafica della distribuzione e della sua funzione di ripartizione;<br />

calcolarne la media e la mediana con i rispettivi indici di variabilità. Commentare i<br />

risultati. [R: µ = 3.84; Me = 3; σ 2 = 4.47; SMe = 1.68]<br />

<strong>Esercizi</strong>o 1.2 Data la seguente distribuzione delle frequenze cumulate relative di<br />

un collettivo rispetto al carattere X:<br />

X 0-2 2-4 4-6 6-10 10-20 20-30 30-50<br />

F(X) 0 0.08 0.32 0.64 0.86 0.96 1<br />

a) individuare la classe modale;<br />

b) calcolare la media aritmetica e la varianza della variabile Z=1-3X;<br />

c) calcolare la proporzione di unità che presentano un livello di X≤12.<br />

[R: classe modale: (4-6); µz = −33.2, σ 2 z = 659.16; F (12) = 0.684]<br />

<strong>Esercizi</strong>o 1.3 (Prof.ssa Mortera, 3-7-00) Dare una spiegazione breve della/e<br />

scelta/e: se la devizione standard di un insieme di numeri è pari a zero ne segue che:<br />

a) i dati sono distribuiti normalmente;<br />

b) la media deve essere pari a zero;<br />

c) i numeri sono tutti uguali;<br />

d) metà dei numeri sono positivi, e metà negativi.<br />

<strong>Esercizi</strong>o 1.4 (Prof.ssa Terzi, 8–2-99) Una sessione è costituita da tre appelli<br />

di esame, a cui si presentano, rispettivamente, 80, 100 e 50 studenti; tutti vengono<br />

promossi. Il voto medio riportato al primo appello risulta pari a 26.4, con scostamento<br />

quadratico medio (s.q.m.) pari a 4.5. Al secondo appello il voto medio risulta pari<br />

1


a 27.2. Al terzo appello si osserva uno s.q.m. pari a 5. Per l’intera sessione il voto<br />

medio risulta pari a 27.<br />

a) Valutare il voto medio relativo al terzo appello.<br />

b) Sapendo che lo s.q.m. complessivo vale 5.5, determinare lo s.q.m. relativo al<br />

secondo appello.<br />

[R: µ3 = 27.56; σ2 = 6.36]<br />

<strong>Esercizi</strong>o 1.5 (Prof.ssa Terzi, 19–6-01) Una ditta che produce telefoni cellulari<br />

distribuisce mensilmente il suo prodotto in tre negozi che si trovano in uno stesso paese<br />

nell’entroterra sardo. Il primo negozio vende in media 3.4 telefoni al mese, con s.q.m.<br />

pari a 0.6. Il secondo negozio vende in media 7 telefoni al mese, con s.q.m. pari a 1.2.<br />

Il terzo negozio vende in media 2.8 telefoni al mese con s.q.m. pari ad 1. Calcolare:<br />

a) il numero medio di vendite mensili per l’intero paese;<br />

b) lo s.q.m. delle vendite mensili per l’intero paese.<br />

[R: µ = 4.4; σ = 2.091]<br />

<strong>Esercizi</strong>o 1.6 (Prof.ssa Mortera, 13–06-01) Se la distanza interquartile di un<br />

insieme di dati è nulla allora<br />

� A la media è uguale a 0<br />

� B i numeri sono tutti uguali<br />

� C i dati sono distribuiti normalmente<br />

� D tutti i quartili sono uguali.<br />

<strong>Esercizi</strong>o 1.7 (Prof. Pieraccini, 20–6-00) Al censimento del 1981 le famiglie<br />

italiane secondo il numero di componenti (X) sono risultate così distribuite:<br />

X 1 2 3 4 5 6 7 8 e più<br />

n(X) 3323 4402 4117 4008 1773 629 224 154<br />

Fare la rappresentazione grafica: a) della distribuzione di frequenza; b) della funzione<br />

di ripartizione. Calcolare mediana e quartili, e rappresentarli sul grafico della funzione<br />

di ripartizione. [R: Me = 3; Q1 = 2; Q3 = 4]<br />

<strong>Esercizi</strong>o 1.8 (Prof. Pieraccini, 5–2-01) Data la seguente tabella:<br />

X 0-1 1-2 2-3 3-5 5-10 10-15 15-30<br />

n(X) 15 13 15 12 15 10 15<br />

Fare la rappresentazione grafica della distribuzione di frequenza e quella della sua<br />

funzione di ripartizione. Calcolare: a) la mediana; b) il primo e il terzo quartile; c) la<br />

differenza interquartile. Commentare i risultati ottenuti. [R: Me = 3.67; Q1 = 1.64;<br />

Q3 = 10.5; D = 8.86]<br />

<strong>Esercizi</strong>o 1.9 (Prof.ssa Mortera, 28–06-01) La media aritmetica è più grande<br />

della mediana quando<br />

� A la moda è grande<br />

� B ci sono valori anomali estremamente piccoli<br />

� C la popolazione non è normale<br />

� D ci sono valori anomali estremamente grandi.<br />

2


<strong>Esercizi</strong>o 1.10 (Prof. Pieraccini, 21–9-99) Sia data la seguente distribuzione<br />

dei redditi:<br />

Classi di reddito (milioni) Frequenze relative<br />

fino a 10 0.195<br />

10-20 0.419<br />

20-30 0.221<br />

30-40 0.095<br />

40-50 0.041<br />

oltre 50 0.029<br />

Totale 1.000<br />

Calcolare media, s.q.m., ed un indice di asimmetria. Commentare i risultati. [R:<br />

µ = 19.84; σ = 12.87; γ = 1.41]<br />

<strong>Esercizi</strong>o 1.11 (Prof. Pieraccini, 3-7-00) Data la seguente distribuzione di<br />

frequenza:<br />

X 0-1 1-2 2-3 3-5 5-10 10-15 15-20 20-30 30-40 40-50 50-100<br />

ni 15 13 12 11 10 10 8 6 6 5 4<br />

a) fare la rappresentazione grafica della distribuzione;<br />

b) fare la rappresentazione grafica della funzione di ripartizione;<br />

c) calcolare la mediana e la media aritmetica;<br />

d) calcolare lo scarto semplice medio dalla mediana e quello quadratico dalla media<br />

aritmetica;<br />

e) calcolare un indice di asimmetria.<br />

Commentare i risultati ottenuti. [R: Me = 4.8; µ = 13.26; SMe = 11.336; σ =<br />

17.61; γ = 2.006]<br />

<strong>Esercizi</strong>o 1.12 (Prof. Pieraccini, 3-2-97) In una cittadina degli Stati Uniti è<br />

stata rilevata la concentrazione media giornaliera di ozono (X in parti di miliardi) fra<br />

l’1/5/74 e il 13/9/74, ottenendo la seguente distribuzione di frequenza:<br />

X 0-50 50-75 75-100 100-150 150-200 200-250<br />

n(X) 35 29 25 28 11 8<br />

a) Fare la rappresentazione grafica delle frequenze relative e delle frequenze relative<br />

cumulate.<br />

b) Calcolare un indice di dimensione, uno di variabilità ed uno di asimmetria a<br />

vostra scelta.<br />

[R: µ = 88.97; σ = 56.19; γ = 0.78]<br />

<strong>Esercizi</strong>o 1.13 (Prof.ssa Mortera, 28–9-00) Da un campione di 100 aziende<br />

della provincia di Milano è stata rilevata la classe di addetti, ottenendo i seguenti<br />

risultati:<br />

Classe di superficie Numero di aziende<br />

0-10 33<br />

10-50 43<br />

50-100 12<br />

100-500 10<br />

500-1000 2<br />

3


a) Si rappresentino graficamente i dati nel modo che si ritiene più opportuno.<br />

b) Si determinino la classe modale e la classe mediana.<br />

c) Si calcolino la mediana e un indice di asimmetria.<br />

[R: classe modale: (0-10); Me=25.814;<br />

µ − Me<br />

σ<br />

= 0.33]<br />

<strong>Esercizi</strong>o 1.14 (Prof.ssa Mortera, 22-2-00) Data la seguente tabella a doppia<br />

entrata relativa ai caratteri reddito mensile in milioni di lire (X) e numero di weekend<br />

dedicati a viaggiare (Y):<br />

Y 0 − 1 2 − 3 4<br />

X<br />

0-1.5 20 15 3<br />

1.5-2.5 13 21 6<br />

2.5-4 18 10 8<br />

calcolare:<br />

a) la media e la varianza di X, la media e la varianza di Y, la Cov(X,Y);<br />

b) la media di X quando Y è tra 2 e 3 weekend;<br />

c) la media e la varianza di Z=X+Y e di W=X-Y;<br />

d) Cov(Z,W) in funzione di var(X) e var(Y).<br />

[R: µx = 1.98; σ 2 x = 1.01; µy = 1.83; σ 2 y = 1.67; σxy = 0.11; µx|y∈(2−3) = 1.86;<br />

µz = 3.81; σ 2 z = 2.9; µw = 0.15; σ 2 w = 2.46; σzw = σ 2 x − σ 2 y]<br />

<strong>Esercizi</strong>o 1.15 (Prof.ssa Mortera, 17-07-01) Con riferimento alla tabella<br />

seguente<br />

Età 10 − 18 18 − 20 20 − 60<br />

Settore<br />

Abbigliamento 312 913 3367<br />

Bigiotteria 710 377 208<br />

Profumi 248 211 341<br />

dire se (giustificando le risposte):<br />

a) la classe modale della distribuzione marginale dell’età è<br />

� A 10-18<br />

� B 18-20<br />

� C 20-60<br />

� D la distribuzione è bimodale<br />

b) la moda della distribuzione marginale del settore merceologico è<br />

� A abbigliamento<br />

� B bigiotteria<br />

� C non si può calcolare<br />

� D profumi<br />

c) la mediana della distribuzione marginale del settore merceologico è<br />

� A abbigliamento<br />

� B bigiotteria<br />

� C non si può calcolare<br />

4


� D 0.5.<br />

<strong>Esercizi</strong>o 1.16 (Prof.ssa Terzi, 21-9-98) Per la seguente serie di coppie di<br />

valori:<br />

X 1 2 6 10 X5<br />

Y 7 12 32 Y4 67<br />

si sa che il coefficiente di correlazione rxy=1. Si determinino i due valori mancanti X5<br />

e Y4. [R: X5 = 13; Y4 = 52]<br />

<strong>Esercizi</strong>o 1.17 (Prof.ssa Mortera, 13–06-01) Date due variabili statistiche X<br />

e Y, se si trova che rxy=1.09 allora X e Y<br />

� A sono indipendenti<br />

� B sono dipendenti in modo quadratico<br />

� C hanno una fortissima dipendenza lineare<br />

� D chi ci ha dato il risultato ha sbagliato i conti.<br />

<strong>Esercizi</strong>o 1.18 (Prof.ssa Terzi, 20-6-00) Si consideri il valore dei depositi in<br />

miliardi nelle aziende di credito e presso le amministrazioni postali in Italia nel 1987:<br />

Aziende di credito Amministrazioni postali<br />

Totale 460 000 78 000<br />

I due tipi di deposito sono così distribuiti (percentualmente) nelle due ripartizioni del<br />

Centro-Nord e Mezzogiorno:<br />

Aziende di credito Amministrazioni postali<br />

Centro-Nord 79.9% 65.9%<br />

Mezzogiorno 20.1% 34.1%<br />

Totale 100% 100%<br />

a) Sulla base di queste informazioni si costruisca la tabella che classifica congiuntamente<br />

i valori dei depositi per ripartizione territoriale e tipo di deposito.<br />

b) Quale tipo di indipendenza si può valutare su una tabella come quella del punto<br />

a)?<br />

c) Calcolare un indice adeguato per misurare la dipendenza tra i due caratteri. [R:<br />

χ 2 = 7585.39]<br />

<strong>Esercizi</strong>o 1.19 (Prof.ssa Terzi, 13–7-98) Data la seguente tabella a doppia<br />

entrata:<br />

Y 2 4 6 tot<br />

X<br />

1 4<br />

2<br />

3<br />

6 10<br />

tot 10 100<br />

completarla nell’ipotesi di indipendenza assoluta tra i due caratteri. Calcolare poi la<br />

media aritmetica e la mediana di Y. [R: µy = 4.4; Mey = 4]<br />

5


<strong>Esercizi</strong>o 1.20 (Prof.ssa Terzi, 22-10-99) Data la seguente tabella:<br />

Y 1 6 tot<br />

X<br />

1 70<br />

3 50<br />

7 30<br />

tot 100 50 150<br />

a) riempirla in modo che risulti η 2 Y |X =1;<br />

b) senza svolgere i calcoli, quanto vale χ 2 ?<br />

[R: χ 2 = 150]<br />

<strong>Esercizi</strong>o 1.21 (Prof.ssa Terzi, 21-9-98) Data la seguente distribuzione<br />

a) calcolare l’indice η 2 Y |X ;<br />

Y 0 1 tot<br />

X<br />

0 45 15 60<br />

1 5 35 40<br />

tot 50 50 100<br />

b) tenendo costanti le frequenze marginali, riempire la tabella in modo che risulti<br />

= 0.<br />

= 0.375]<br />

η2 X|Y<br />

[R: η2 Y |X<br />

<strong>Esercizi</strong>o 1.22 (Prof.ssa Terzi, 22-2-00) Data la seguente tabella a doppia<br />

entrata<br />

X 2 6 tot<br />

Y<br />

Y1 5 0 5<br />

Y2 0 5 5<br />

Y3 15 0 15<br />

tot 20 5 25<br />

a) Calcolare η 2 X|Y .<br />

b) Posto Y1=2, Y3=6, determinare quale deve essere il valore di Y2 affinchè risulti<br />

η 2 Y |X =0.<br />

[R: η 2 X|Y = 1; Y2 = 5]<br />

<strong>Esercizi</strong>o 1.23 Su una tabella a doppia entrata in cui la variabile X è articolata<br />

in 4 modalità e la variabile Y è articolata in 2 modalità, è stato calcolato il χ 2 relativo,<br />

che risulta pari a 1. Quali affermazioni si possono eventualmente fare sul valore che,<br />

su questa tabella, assumono gli indici η 2 Y |X , η2 X|Y , r2 ?<br />

6


<strong>Esercizi</strong>o 1.24 (Prof.ssa Terzi, 1-10-98) Data la seguente tabella a doppia<br />

entrata:<br />

Y 1 3 tot<br />

X<br />

1 90<br />

3 50<br />

7 60<br />

tot 150 50 200<br />

a) riempirla in modo che risulti η2 Y |X<br />

b) calcolare poi χ2 e χ2 relativo.<br />

[R: χ2 = 200]<br />

= 1;<br />

7


2 <strong>Esercizi</strong> di Calcolo delle Probabilità<br />

<strong>Esercizi</strong>o 2.1 (Prof.ssa Terzi, 1-10-98) Uno studente universitario ha programmato<br />

di sostenere nella sessione estiva gli esami X e Y. Sia A l’evento “supera l’esame<br />

X” e sia B l’evento “supera l’esame Y”, con P(A)=0.7, P(B)=0.5, P(A � B)=0.4. Calcolare<br />

la probabilità che non superi nessuno dei due esami, ovvero P(A � B). [R:<br />

P(A � B)= 0.2]<br />

<strong>Esercizi</strong>o 2.2 (Prof.ssa Mortera, 8–2-00) Una fabbrica produce RAM che<br />

possono avere due tipi di difetti, il difetto A e il difetto B. Il responsabile per la qualità<br />

della fabbrica afferma che, dall’esperienza passata, la probabilità che una RAM abbia<br />

almeno uno dei due difetti è pari a 0.3; la probabilità che abbia il difetto A ma non il<br />

B è pari a 0.1; la probabilità che abbia contemporaneamente i due difetti è pari a 0.2.<br />

Calcolare la probabilità che una RAM abbia:<br />

a) il difetto A;<br />

b) il difetto B;<br />

c) il difetto A, dato che si è riscontrato che non ha il difetto B.<br />

[R: P(A)=0.3; P(B)=0.2; P(A|B)=0.125]<br />

<strong>Esercizi</strong>o 2.3 (Prof.ssa Mortera, 28–9-00) Nel cinema Bianchini ci sono due<br />

sale. Marco ha deciso di andare a vedere il film che viene proiettato nella sala B, ma è<br />

in ritardo. Sa che, arrivando all’ultimo momento, la probabilità di trovare ancora un<br />

posto nella sala A è pari a 0.2, la probabilità di trovarlo in almeno una delle due sale<br />

è 0.4, e la probabilità che vi sia ancora un posto nella sala B sapendo che c’è ancora<br />

un posto nella sala A è 0.3.<br />

a) Quale è la probabilità che Marco riesca a vedere il film che proiettano nella sala<br />

B?<br />

b) Come cambia tale probabilità se sappiamo che la sala A è già completa?<br />

[R: P(B)=0.26; P(B|A)=0.25]<br />

<strong>Esercizi</strong>o 2.4 (Prof.ssa Mortera, 22-2-00) In ciascuna copia di una edizione<br />

economica dei Promessi Sposi, il 60% delle pagine contiene almeno un errore di stampa.<br />

Se ne produce una ristampa riveduta in cui errori di stampa sono contenuti solo nel<br />

20% delle pagine. Da uno scaffale, che contiene 20 libri della prima edizione e 10 della<br />

seconda, si sceglie un libro a caso. Si esamina una pagina, scelta anch’essa in modo<br />

casuale, e si trova un errore di stampa.<br />

a) Quale è la probabilità che il libro sia della prima edizione?<br />

b) E della ristampa?<br />

[R: P(I|E)=0.86; P(II|E)=0.14]<br />

<strong>Esercizi</strong>o 2.5 (Prof. Pieraccini, 20–6-00) Un’urna contiene 4 palline bianche<br />

e 2 rosse, un’altra ne contiene 2 bianche e 4 rosse. Da una delle due urne scelta a caso<br />

è stata estratta una pallina rossa. Quale è la probabilità che sia stata estratta dalla<br />

prima urna? [R: P(U1|R)=1/3]<br />

<strong>Esercizi</strong>o 2.6 (Prof. Pieraccini, 20–2-01) Un’urna contiene 6 palline rosse e 4<br />

nere, un’altra ne contiene 2 rosse e 8 nere. Se si estraggono con reimmissione 3 palline<br />

da una delle due urne scelta a caso, e si osservano 3 palline nere, quale è la probabilità<br />

che queste siano state estratte dalla prima urna? [R: P(U1|N � N � N)=1/9]<br />

8


<strong>Esercizi</strong>o 2.7 (Prof.ssa Mortera, 3-7-00) Dati due eventi A e B indipendenti,<br />

verificare se le seguenti affermazioni sono vere o false:<br />

a) P(A|B)=P(A|B);<br />

b) P(A � B)=P(A)-P(A)P(B);<br />

c) P(A � B)=P(A)P(B)+P(B).<br />

[R: le affermazioni sono tutte vere]<br />

<strong>Esercizi</strong>o 2.8 (Prof.ssa Mortera, 17-7-01) Due tifosi, Paolo e Carlo, vanno<br />

spesso allo stadio. Paolo ha assistito al 70% delle partite e Carlo ha assistito al 90%<br />

delle partite.<br />

a) Sapendo che la presenza di Paolo allo stadio è indipendente dalla presenza di<br />

Carlo (e viceversa), quale è la probabilità che almeno uno dei due tifosi abbia assistito<br />

ad una partita?<br />

b) Quale è la probabilità che Paolo abbia assistito alla quarta partita di campionato<br />

sapendo che Carlo ha assistito alla seconda partita di campionato?<br />

c) Dati due eventi A e B, definire la proprietà di incompatibilità e di indipendenza.<br />

[R: P(P � C)=0.97; P(P|C)=0.7]<br />

<strong>Esercizi</strong>o 2.9 (Prof.ssa Mortera, 3-7-00) Per arrivare ad una cena tra amici,<br />

Paolo e Giovanna scelgono, con uguale probabilità, fra i seguenti mezzi di trasporto:<br />

bus, auto e bicicletta. Le probabilità che ciascuno dei due amici giunga in ritardo, se<br />

prendono rispettivamente il bus, l’auto e la bicicletta, sono pari a 0.6, 0.2 e 0.4.<br />

a) Determinare la probabilità che Paolo arrivi in ritardo.<br />

b) Se Paolo e Giovanna viaggiano indipendentemente, quale è la probabilità che<br />

almeno uno giunga in ritardo?<br />

c) Sapendo che Paolo è arrivato in ritardo, quale è la probabilità che abbia viaggiato<br />

in auto?<br />

�<br />

[R: P(RP)=0.4; P(RP RG)=0.64; P(A|RP)=0.17]<br />

<strong>Esercizi</strong>o 2.10 (Prof.ssa Terzi, 20-6-00) La probabilità che durante la produzione<br />

giornaliera di una piccola azienda di componenti elettronici, si verifichino X<br />

pezzi difettosi è data da:<br />

P(X=0)=K, P(X=1)=3K, P(X=2)=K, P(X=3)=P(X=4)=2K, P(X ≥ 5)=0.<br />

a) Determinare il valore della costante K.<br />

b) Calcolare valore atteso e varianza della variabile casuale X.<br />

[R: K=1/9; E(X)=2.11; var(X)=1.88]<br />

<strong>Esercizi</strong>o 2.11 (Prof.ssa Terzi, 3-7-00) Una variabile casuale discreta X ha la<br />

seguente funzione di ripartizione:<br />

F(0)=0, F(1)=0.2, F(2)=0.4, F(3)=0.4, F(4)=0.8, F(5)=1.<br />

Calcolarne il valore atteso e la varianza. [R: E(X)=3.2; var(X)=2.16]<br />

<strong>Esercizi</strong>o 2.12 (Prof.ssa Terzi, 16–7-01) Un’urna contiene 5 palline bianche<br />

e 5 palline nere. Dall’urna vengono estratte (senza ripetizione) 2 palline. Sia X la<br />

9


variabile casuale “numero di palline bianche su due estratte”. Calcolare E(X) e var(X).<br />

[R: E(X)=1; var(X)=0.44]<br />

<strong>Esercizi</strong>o 2.13 (Prof. Pieraccini, 20–6-00) L’altezza di 450 studenti immatricolati<br />

all’Università di Roma Tre nel 1998 è risultata in media di 170 cm., con uno<br />

s.q.m. di 7.5 cm. Nell’ipotesi che la statura si distribuisca come una Normale, quale<br />

è il numero atteso di studenti con altezza<br />

a) maggiore di 180 cm.;<br />

b) minore o uguale a 160 cm.;<br />

c) tra 162.5 e 172.5.<br />

[R: n(X>180)�41; n(X≤160)�41; n(162.5


normale con µ = 1600 e σ 2 = 3600. Essa risarcisce un milione di lire all’acquirente se<br />

la durata della macchina acquistata è inferiore a 1450. Calcolare la probabilità che:<br />

a) su 5 macchine la ditta debba risarcire al massimo un milione di lire;<br />

b) su 100 macchine la ditta debba risarcire più di un milione.<br />

[R: P(N≤1)=0.99962; P(N>1)=0.1285]<br />

<strong>Esercizi</strong>o 2.20 (Prof.ssa Mortera, 19–6-00) Il numero di viaggi venduti in<br />

una settimana da ciascun agente dell’agenzia Kalimera, specializzata in viaggi verso la<br />

Grecia, si distribuisce come una Poisson con valore atteso λ=3. Il titolare dell’agenzia<br />

decide di dare un premio ai dipendenti che in una settimana vendono almeno 4 viaggi.<br />

a) Quale è la probabilità che un dipendente vinca il premio?<br />

b) Supposto che non esista nessuna relazione tra il numero di viaggi venduti dai<br />

diversi dipendenti dell’agenzia, calcolare la probabilità che non più di 3 dei 10 operatori<br />

complessivi ricevano il premio.<br />

c) Calcolare quanti viaggi vengono venduti mediamente in un mese.<br />

[R: P(X≥4)=0.35; P(N≤3)=0.513; E(Y)=130]<br />

<strong>Esercizi</strong>o 2.21 (Prof.ssa Mortera, 16-6-99) Il diametro interno delle guarnizioni<br />

prodotte dalla ditta Fido è di 0.502 cm e la deviazione standard è di 0.005 cm. Gli<br />

scopi per i quali queste guarnizioni sono prodotte permettono una tolleranza massima<br />

del diametro fra 0.496 e 0.508 cm, mentre nel caso contrario le guarnizioni sono<br />

considerate difettose. Assumendo la distribuzione dei diametri Normale:<br />

a) determinare la percentuale delle guarnizioni difettose prodotte dalla macchina;<br />

b) determinare quale è la probabilità di trovarne almeno 2 difettose in un campione<br />

casuale di 10 guarnizioni;<br />

c) determinare quale è la probabilità di trovarne più di 22 difettose in un campione<br />

casuale di 100 guarnizioni.<br />

[R: P(D)=0.23; P(N≥2)=0.71; P(N>22)=0.5478]<br />

<strong>Esercizi</strong>o 2.22 (Prof. Pieraccini, 10-9-01) Un’azienda che produce carta da<br />

parati decide di effettuare un controllo sulla qualità del prodotto; i difetti riscontrati<br />

possono essere distinti in due tipi: quelli dovuti allo spessore della carta e quelli dovuti<br />

alla colorazione. Sia X il numero di difetti del primo tipo (per ogni rotolo da 5 metri<br />

di carta) e sia Y il numero di difetti del secondo tipo. Si supponga che la distribuzione<br />

di probabilità congiunta di X e Y sia:<br />

X 0 1 2 3<br />

Y<br />

0 0.49 0.09 0.03 0<br />

1 0.12 0.07 0.01 0.01<br />

2 0.05 0.04 0.01 0<br />

3 0.04 0.03 0 0<br />

4 0.01 0 0 0<br />

Si calcoli :<br />

a) il valore atteso e la deviazione standard di ognuna delle due distribuzioni;<br />

b) la covarianza ed il coefficiente di correlazione tra X e Y;<br />

c) la probabilità P (X < 2, Y ≥ 2).<br />

11


[R: E(X)=0.36; var(X)=0.39; E(Y)=0.66; var(Y)=0.96; cov(X,Y)=0.0924; ρ(X,Y)=0.15;<br />

P(X606000)=0.35; P(N≥3)=0.2352; P(M≥2)=0.9987]<br />

12


3 <strong>Esercizi</strong> di inferenza<br />

<strong>Esercizi</strong>o 3.1 (Prof.ssa Mortera, 1-7-99) Il tempo che l’impiegato addetto allo<br />

sportello “accettazione telegrammi” di un certo ufficio postale dedica a ciascun utente<br />

segue una distribuzione normale di media 5 minuti. E’ anche noto che la probabilità<br />

che il tempo dedicato a ciascun utente sia inferiore a 3.2 minuti è pari a 0.209.<br />

a) Ricavare il valore dello scarto quadratico medio di X.<br />

b) Determinare la probabilità che il tempo medio ricavato sulla base di un campione<br />

casuale di 25 utenti superi i 6 minuti.<br />

c) Determinare l’intervallo in cui, con probabilità 0.9, cade la varianza campionaria<br />

corretta dello stesso campione.<br />

[R: σ = 2.22; P � X > 6 � = 0.01222; S 2 ∈ (2.85; 7.49)]<br />

<strong>Esercizi</strong>o 3.2 (Prof. Pieraccini, 19-6-01) Le cinque unità che compongono<br />

una popolazione presentano per la X i seguenti valori:<br />

3, 4, 6, 12, 17.<br />

Si considerino tutti i possibili campioni di ampiezza due che possono essere estratti<br />

con ripetizione da questa popolazione. Calcolare:<br />

a) la media della popolazione;<br />

b) lo scarto quadratico medio della popolazione;<br />

c) la distribuzione della media campionaria;<br />

d) verificare che la media campionaria è una stima non distorta della media della<br />

popolazione;<br />

e) controllare che la varianza della distribuzione campionaria delle medie è in accordo<br />

con il risultato teorico.<br />

[R: µ = 8.4; σ = 5.31]<br />

<strong>Esercizi</strong>o 3.3 (Prof.ssa Mortera, 28-6-01) Sia X1, X2,...,Xn un campione di<br />

ampiezza n (n ≥ 4) estratto da una popolazione X con E (X) = µ e varianza σ 2 . Si<br />

considerino i seguenti stimatori alternativi per µ:<br />

S1 = 2 X1<br />

n − X3 + X4<br />

+ X2 e S2 = X1 −<br />

n<br />

X2 + X3 − X4<br />

n<br />

a) Lo stimatore S1 è non distorto? In caso di risposta negativa proporre uno<br />

stimatore non distorto per µ modificando S1;<br />

b) lo stimatore S2 è non distorto? In caso di risposta negativa proporre uno stimatore<br />

non distorto per µ modificando S2;<br />

c) calcolare l’errore quadratico medio di S1e di S2;<br />

d) S1e di S2 sono consistenti in media quadratica?<br />

[R: S1 non distorto; S2 distorto, nS2/(n-1) non distorto; MSE(S1)=σ 2 (6/n 2 + 1),<br />

MSE(S2)=σ 2 (3/n 2 + 1) + µ 2 /n 2 ; S1 e S2 non sono consistenti in media quadratica]<br />

<strong>Esercizi</strong>o 3.4 (Prof.ssa Mortera, 16-6-99) Sia X1, X2,X3 un campione casuale<br />

estratto da una popolazione X con distribuzione di Poisson di parametro λ. Dati i due<br />

stimatori di λ:<br />

T1 = 2X1 + X2 + 2X3<br />

5<br />

13<br />

e T2 = X1 + X3<br />

2


a) stabilire se sono non distorti;<br />

b) ricavare l’errore quadratico medio di T1e di T2;<br />

c) quale tra i due stimatori è preferibile, e perchè?<br />

[R: T1e T2 non distorti; MSE(T1)=9λ/25, MSE(T2)=λ/2; è preferibile T1]<br />

<strong>Esercizi</strong>o 3.5 (Prof.ssa Mortera, 13-6-01) Il numero di clienti che si presentano<br />

ad uno sportello bancario in un giorno è descritto da una variabile casuale X con<br />

distribuzione di Poisson di parametro λ, cioè<br />

−λ λx<br />

f (x; λ) = e<br />

x!<br />

x > 0, λ > 0<br />

Al fine di stimare λ, è stato rilevato per cinque giorni il numero di clienti che si sono<br />

presentati a questo sportello e si è osservato: 10, 13, 8, 14, 12.<br />

a) Determinare lo stimatore di massima verosimiglianza di λ.<br />

b) Calcolarne la stima in corrispondenza del campione osservato.<br />

c) Lo stimatore di massima verosimiglianza trovato è consistente in media quadratica?<br />

Dimostrare.<br />

d) Definire la proprietà di consistenza di uno stimatore. Lo stimatore trovato è<br />

anche consistente?<br />

[R: � λML = X; x = 11.4; lo stimatore è consistente in media quadratica e consistente]<br />

<strong>Esercizi</strong>o 3.6 (Prof.ssa Mortera, 28-9-00) Un’impresa vuole valutare la durata<br />

media µ delle batterie prodotte nel proprio stabilimento. In un campione casuale di<br />

n=6 batterie si osservano le seguenti durate in ore:<br />

x1 = 10, x2 = 40, x3 = 25, x4 = 32, x5 = 27, x6 = 16.<br />

Nell’ipotesi che il tempo di vita X di ogni singola batteria segua una distribuzione<br />

esponenziale di parametro 1/µ, cioè abbia funzione di densità:<br />

f (x; µ) = 1<br />

µ e−x/µ<br />

x > 0<br />

a) determinare lo stimatore di massima verosimiglianza, L, per µ e ricavare il valore<br />

della stima sulla base del campione dato;<br />

b) dire se tale stimatore è corretto e consistente;<br />

c) considerare lo stimatore S= 3<br />

X e verificare la sua correttezza;<br />

4<br />

d) confrontare i due stimatori L e S utilizzando l’errore quadratico medio.<br />

[R: L=X; x = 25; L è non distorto e consistente; S è distorto; MSE(L)=µ 2 /n,<br />

MSE(S)=µ 2 (9 + n) /16n]<br />

<strong>Esercizi</strong>o 3.7 (Prof. Pieraccini, 20-02-01) In un campione di 100 piccole<br />

imprese si sono rilevate le seguenti spese annue per energia elettrica (in milioni):<br />

X 1-5 5-9 9-12 12-16 16-20 tot<br />

ni 2 37 32 28 1 100<br />

a) Costruire un intervallo di confidenza per la spesa media annua µ al livello di<br />

confidenza 0.90, sapendo che la varianza della popolazione risulta essere σ 2 = 9.<br />

14


) Quale deve essere la numerosità n del campione affinché l’intervallo calcolato al<br />

punto a) abbia lunghezza minore di 0.8?<br />

[R: (9.618; 10, 602) ; n ≥ 152]<br />

<strong>Esercizi</strong>o 3.8 (Prof.ssa Terzi, 19-7-00) Per un campione casuale di 14 ragazzi,<br />

sono stati osservati i seguenti pesi (in Kg):<br />

48, 46, 45, 47, 53, 50, 38, 49, 40, 43, 46, 38, 50, 41.<br />

Nell’ipotesi che tale campione provenga da una Normale, trovare l’intervallo di confidenza<br />

per la media µ (incognita) dell’intera popolazione, con α=0.05. [R: (42.6; 47.98)]<br />

<strong>Esercizi</strong>o 3.9 (Prof.ssa Mortera, 22-2-00) Supponiamo che X1, X2,...,Xn sia un<br />

campione casuale estratto da una popolazione X con distribuzione Normale di media µ<br />

incognita e varianza σ 2 nota. Quale deve essere la numerosità n del campione affinché<br />

sia possibile individuare un intervallo di confidenza per µ, al livello di confidenza 0.95,<br />

di lunghezza minore di 0.01σ? [R: n ≥ 153665]<br />

<strong>Esercizi</strong>o 3.10 (Prof.ssa Mortera, 3-7-00) In un campione di 500 famiglie,<br />

l’intervallo al 99% del reddito mensile medio (in milioni di lire) è dato da 2


in giorni diversi, sono stati ottenuti i seguenti ritardi in minuti: 12, 37, 23, 27, 19.<br />

Assumendo che i ritardi si distribuiscono come una variabile casuale Normale:<br />

a) verificare l’ipotesi che il ritardo medio sia superiore a 15 minuti, usando α=0.05;<br />

b) calcolare l’intervallo di confidenza al livello del 95% per il ritardo medio.<br />

[R: non rifiuto H0; (12.02; 35.18)]<br />

<strong>Esercizi</strong>o 3.15 (Prof.ssa Terzi, 3-7-00) Supponendo di voler verificare al livello<br />

α=0.10 l’ipotesi nulla che il voto medio riportato dagli studenti di Economia nell’esame<br />

di Statistica I sia pari a 27 contro l’ipotesi alternativa che sia pari a 25.5, quale dovrà<br />

essere la numerosità campionaria affinché la potenza del test risulti almeno pari a 0.95?<br />

Ai fini della soluzione si assume che la popolazione studentesca abbia una distribuzione<br />

Normale con varianza pari a 9. [R: n ≥ 35]<br />

<strong>Esercizi</strong>o 3.16 (Prof.ssa Mortera, 21–9-99) Una società telefonica dichiara<br />

che nel 1990 l’importo della bolletta bimensile pagata dagli abbonati privati ebbe una<br />

distribuzione con media 95 000 Lire e s.q.m. di 70 000 Lire.<br />

a) Se si estrae un campione di 50 bollette dagli elenchi degli abbonati del 1990,<br />

quale è approssimativamente la probabilità che la media campionaria degli importi sia<br />

maggiore di 100 000?<br />

b) Estraendo un campione di ampiezza 100, la probabilità di cui al punto a) sarebbe<br />

maggiore o minore? Perchè?<br />

c) Una agenzia per la protezione del consumatore estrae un campione di ampiezza<br />

100 ed osserva una media campionaria degli importi pari a 105 000. Si può concludere<br />

che l’importo medio bimensile pagato nel 1990 sia stato maggiore di 95 000? Usare un<br />

livello di significatività del 5%.<br />

[R: P(X>100000)� 0.3085; la probabilità al punto a) sarebbe minore; non rifiuto<br />

l’ipotesi nulla di importo medio bimensile uguale a 95000]<br />

<strong>Esercizi</strong>o 3.17 (Prof.ssa Terzi, 11-9-00) Per una popolazione Normale(µ,1), si<br />

vuole sottoporre a test l’ipotesi H0: µ=0 contro l’ipotesi alternativa H1: µ 52.90 � ∪ � X < 47.1 �� ; H1; 1 − β = 0.9049]<br />

<strong>Esercizi</strong>o 3.19 (Prof.ssa Terzi, 19-6-01) Per una popolazione Normale di varianza<br />

unitaria, si vuole fare un test d’ipotesi per verificare:<br />

H0 : µ = 12.7<br />

H1 : µ = 12<br />

16


Si decide di procedere nel seguente modo: si estrae un campione casuale di numerosità<br />

n=16 e se ne calcola la media campionaria. Se la media campionaria risulta minore di<br />

12.2 si rifiuta l’ipotesi H0.<br />

a) Calcolare α.<br />

b) Calcolare β.<br />

c) Supponendo di volere 1−β ≥ 0.9, quale dovrà essere la numerosità campionaria?<br />

[R: α = 0.02275; β = 0.21186; n ≥ 42]<br />

<strong>Esercizi</strong>o 3.20 (Prof.ssa Terzi, 19-6-01) Per una popolazione Normale di varianza<br />

=2 si vuole fare un test d’ipotesi per verificare:<br />

H0 : µ = 8<br />

H1 : µ = 8.5<br />

a) Posto α=0.07, sulla base di una numerosità campionaria n=25, trovare la regione<br />

critica.<br />

b) Supponendo di aver osservato una media campionaria pari a 8.2, cosa si conclude?<br />

c) Calcolare la potenza del test.<br />

d) Trovare la numerosità campionaria tale che la potenza risulti almeno pari a 0.98.<br />

[R: R: � X : X > 8.419 � ; non rifiuto H0; 1 − β = 0.6141; n ≥ 1306].<br />

<strong>Esercizi</strong>o 3.21 (Prof.ssa Terzi, 8-9-99) Data una popolazione Normale di varianza<br />

unitaria, si vuole sottoporre a verifica l’ipotesi H0: µ=10 contro H1: µ �=10,<br />

attraverso un campione casuale di n = 4 unità. Si adotta la seguente regola di decisione:<br />

A : si accetta H0 se 8 ≤ X ≤ 11.<br />

a) calcolare α.<br />

b) Calcolare la potenza del test per µ=11.<br />

[R: α = 0.02275; 1 − β = 0.5]<br />

<strong>Esercizi</strong>o 3.22 (Prof.ssa Terzi, 5-7-99) Si vuole sottoporre a verifica l’ipotesi<br />

H0: p=0.5 contro H1: p>0.5 per una popolazione bernoulliana di parametro p, sulla<br />

base di un campione di n = 5 elementi.<br />

a) Fissato α ≤ 0.2, trovare la regione critica.<br />

b) Calcolare la potenza del test per p=0.8.<br />

[R: R(α) = {�p : �p ≥ 0.8} ; 1 − β = 0.737]<br />

<strong>Esercizi</strong>o 3.23 (Prof.ssa Terzi, 1-10-98) In un campione di 1000 famiglie con<br />

5 figli, la distribuzione del numero di figli maschi è la seguente:<br />

n. maschi 0 1 2 3 4 5 tot<br />

n. famiglie 30 150 370 250 170 30 1000<br />

a) Sul totale dei figli, quale è la percentuale di femmine?<br />

b) Sia p la percentuale di femmine nella popolazione. Si vuole sottoporre a verifica<br />

l’ipotesi H0: p=0.5 contro l’alternativa H1: p�=0.5, con α=0.05. Individuare la regione<br />

di accettazione (A) del test, e indicare se si accetta o meno l’ipotesi H0.<br />

17


[R: �p = 0.506; A={�p : 0.486 < �p < 0.514} ; non si rifiuta H0]<br />

<strong>Esercizi</strong>o 3.24 (Prof.ssa Terzi, 16–7-01) Si sospetta che una moneta possa<br />

essere sbilanciata in maniera tale che l’uscita di Testa risulti più probabile dell’uscita<br />

di Croce. In particolare, si pensa che la probabilità che esca Testa possa essere 0.8.<br />

Si decide quindi di sottoporre a verifica l’ipotesi nulla che la moneta abbia due facce<br />

equi-probabili contro l’alternativa che la probabilità che esca Testa sia 0.8. Si decide<br />

di procedere nel seguente modo: si lancia la moneta 5 volte, se si ottiene Testa almeno<br />

4 volte si rifiuta l’ipotesi nulla. Calcolare la probabilità dell’errore di prima specie.<br />

Calcolare la potenza di questo test. [R: α = 0.1875; 1 − β = 0.7373].<br />

<strong>Esercizi</strong>o 3.25 (Prof.ssa Terzi, 3-7-00) Si sospetta che un dado possa essere sbilanciato<br />

in maniera tale che l’uscita di un numero pari risulti più probabile dell’uscita<br />

di un numero dispari. In particolare, si pensa che la probabilità che esca un numero<br />

pari sia 0.75. Si decide quindi di sottoporre a verifica l’ipotesi nulla che il dado sia ben<br />

bilanciato contro l’alternativa che la probabilità che esca un numero pari sia 3/4. Si<br />

decide di procedere nel seguente modo: si lancia un dado 5 volte, e se si ottiene una<br />

faccia pari almeno 4 volte si rifiuta l’ipotesi nulla. Calcolare la probabilità dell’errore<br />

di prima specie. Calcolare la potenza di questo test. [R: α = 0.1875; 1 − β = 0.6328]<br />

<strong>Esercizi</strong>o 3.26 (Prof.ssa Mortera, 28-9-00) La società Broglio decide di lanciare<br />

sul mercato un nuovo tipo di detersivo ”super-white”. A questo scopo viene<br />

inviato gratuitamente un flacone del nuovo detersivo a 150 persone chiedendo loro di<br />

provarlo e di dichiarare se saranno favorevoli o meno all’acquisto del suddetto prodotto.<br />

Di queste persone solo 30 dichiarano di essere interessate all’acquisto.<br />

a) Costruire un intervallo di confidenza al livello 1 − α = 0.7 per la proporzione di<br />

soggetti che acquisteranno il prodotto;<br />

b) verificare al livello α = 0.05 l’ipotesi nulla che la proporzione di soggetti che<br />

acquisteranno il prodotto sia superiore al 30%.<br />

[R: (0.166; 0.234) ; si rifiuta l’ipotesi nulla]<br />

<strong>Esercizi</strong>o 3.27 (Prof. Pieraccini, 24–6-96) Sia µ=5 la media di una popolazione<br />

Normale. Si vuole sottoporre a test l’ipotesi H0: σ 2 =1.5 contro l’alternativa<br />

bilaterale H1: σ 2 �=1.5.<br />

a) Trovare la regione critica del test per α=0.05.<br />

b) Avendo estratto il seguente campione: (3.1; 3.7; 5.5; 6.6; 4.8; 5.3; 3.1; 2.9; 8.1),<br />

per quale ipotesi si conclude?<br />

c) Trovare l’intervallo di confidenza per σ 2 .<br />

[R: R(α) = {�σ 2 : (�σ 2 ≤ 0.45) ∪ (�σ 2 ≥ 3.17)}; non si rifiuta H0; (0.359; 2.533)]<br />

<strong>Esercizi</strong>o 3.28 (Prof.ssa Terzi, 22-6-99) In 100 ristoranti di Roma, la voce<br />

“coperto” ammonta mediamente a 3 (migliaia di lire) con s.q.m. pari a 1. A Milano,<br />

invece, su un campione di 70 ristoranti, la voce “coperto” risulta mediamente pari a<br />

1, con s.q.m. pari a 4. Assumendo che le due popolazioni abbiano la stessa varianza,<br />

sottoporre a test l’ipotesi che le due medie siano uguali contro l’alternativa, unilaterale,<br />

che in media il “coperto” a Roma sia maggiore.<br />

a) Individuare la regione critica con α = 0.05.<br />

b) Individuare la regione critica con α = 0.01.<br />

18


c) Cosa si conclude nell’uno e nell’altro caso?<br />

[R: R(α) = � X − Y : X − Y > 0.69 � ;R(α) = � X − Y : X − Y > 0.98 � ; si rifiuta<br />

H0 in entrambi i casi]<br />

<strong>Esercizi</strong>o 3.29 (Prof. Pieraccini, 20–6-00) Un’indagine campionaria sul numero<br />

di sigarette fumate giornalmente, svolta tra studenti universitari, ha dato i seguenti<br />

risultati distinti per sesso:<br />

Campione Maschi Femmine<br />

Numerosità 81 62<br />

N. medio di sigarette 2.02 3.54<br />

Stima non distorta della varianza 22.70 22.81<br />

a) Sottoporre a test l’ipotesi di eguaglianza del numero medio di sigarette fumate<br />

dai due sessi al livello di significatività del 5%.<br />

b) Calcolare l’intervallo di confidenza al 95% per la differenza tra le due medie.<br />

[R: non si rifiuta H0; (−0.0575; 3.0975)]<br />

<strong>Esercizi</strong>o 3.30 (Prof. Pieraccini, 20–6-00) L’efficacia di una nuova cura dimagrante<br />

viene sperimentata su sei soggetti ottenendo i seguenti risultati:<br />

X 68 56 58 62 74 66<br />

Y 54 50 50 56 58 54<br />

(dove con X si è indicato il peso prima della cura e con Y quello dopo la stessa).<br />

Sottoporre a test l’ipotesi che la cura non abbia avuto effetto. [R: si rifiuta l’ipotesi<br />

nulla che la cura non abbia avuto effetto].<br />

<strong>Esercizi</strong>o 3.31 (Prof. Pieraccini, 20–6-00) I voti in Economia (X) ed in<br />

Statistica (Y) riportati da dieci studenti sono stati i seguenti:<br />

X 20 24 28 27 18 22 29 30 23 21<br />

Y 22 24 27 28 18 23 30 29 21 19<br />

Sotto l’assunzione di Normalità, sottoporre a test l’ipotesi di eguaglianza in media dei<br />

voti di Statistica a quelli di Economia sapendo che: Dev(X)=151.6, Dev(Y)=160.9,<br />

Cod(X,Y)=147.8. [R: non si rifiuta l’ipotesi nulla di uguaglianza in media dei voti]<br />

<strong>Esercizi</strong>o 3.32 (Prof. Pieraccini, 20–6-00) Un’indagine campionaria sul numero<br />

di sigarette fumate giornalmente svolta tra studenti universitari ha dato i seguenti<br />

risultati distinti per sesso:<br />

Campione Numerosità Frazione di fumatori<br />

Maschi 81 0.198<br />

Femmine 62 0.306<br />

a) Sottoporre a test l’ipotesi di eguaglianza della percentuale di fumatori fra gli<br />

studenti universitari maschi e femmine al livello di significatività del 5%.<br />

b) Calcolare l’intervallo di confidenza al 95% per la differenza tra le due percentuali.<br />

[R: non si rifiuta l’ipotesi nulla; (−0.25; 0.04)]<br />

19


<strong>Esercizi</strong>o 3.33 (Prof.ssa Mortera, 17–7-01) La seguente tabella riporta i furti<br />

commessi scoperti in un grande magazzino in un anno, a seconda del settore merceologico<br />

e dell’età del colpevole.<br />

Settore Età<br />

10-18 18-20 20-60<br />

Abbigliamento 312 913 3367<br />

Bigiotteria 710 377 208<br />

Profumi 248 211 341<br />

a) Sia p la probabilità che se un furto viene compiuto nel settore abbigliamento,<br />

l’età del colpevole sia 10-18. Costruire un intervallo di confidenza per p al 95%.<br />

b) Siano p1 e p2 le probabilità che il furto sia commesso nel settore dell’abbigliamento<br />

nell’ipotesi che il colpevole abbia rispettivamente età compresa nella classe 18-20 oppure<br />

20-60. Verificare l’ipotesi p1= p2 contro l’ipotesi alternativa p1 �= p2.<br />

[R: (0.0606; 0.0752) ; si rifiuta l’ipotesi nulla di uguaglianza delle probabilità]<br />

<strong>Esercizi</strong>o 3.34 (Prof. Pieraccini, 4–10-96) In un campione di 100 studenti<br />

maschi si sono rilevati i seguenti pesi:<br />

Peso (Kg) N. di studenti<br />

60-62 5<br />

63-65 18<br />

66-68 42<br />

69-71 27<br />

72-74 8<br />

Sottoporre a test l’ipotesi che i dati provengano da una distribuzione Normale. [R:<br />

non si rifiuta l’ipotesi nulla]<br />

<strong>Esercizi</strong>o 3.35 (Prof. Pieraccini, 3–7-00) La distribuzione dei pesi (X) dei<br />

portieri che hanno giocato nel campionato di calcio di serie A e B del 1998-99 è<br />

risultata la seguente:<br />

X n(X)<br />

83.5 3<br />

Si sottoponga a test l’ipotesi che i dati provengono da una distribuzione Normale. [R:<br />

non si rifiuta l’ipotesi nulla]<br />

<strong>Esercizi</strong>o 3.36 (Prof. Pieraccini, 20–6-00) In un pronto soccorso di un ospedale<br />

sono stati registrati il numero delle richieste di intervento giornaliere (X) su un<br />

arco di cento giorni, ottenendo la seguente distribuzione di frequenza:<br />

X 0 1 2 3 4 5 6 7 8 9 10<br />

n(X) 2 9 18 21 17 12 9 5 4 2 1<br />

20


Sapendo che il numero di interventi giornalieri per i quali il pronto soccorso è strutturato<br />

è uguale a 10, sottoporre a test l’ipotesi che la distribuzione osservata provenga<br />

da una distribuzione di Bernoulli. [R: si rifiuta H0]<br />

<strong>Esercizi</strong>o 3.37 (Prof. Pieraccini, 3–7-01) In 20 famiglie con 5 figli si è osservato<br />

il seguente numero di figli maschi:<br />

n. maschi 0 1 2 3 4 5<br />

n. famiglie 1 3 6 7 2 1<br />

Sottoporre a test l’ipotesi che la distribuzione delle famiglie secondo il numero di figli<br />

maschi segua una distribuzione Binomiale. [R: non si rifiuta l’ipotesi nulla]<br />

<strong>Esercizi</strong>o 3.38 (Prof. Pieraccini, 3–7-01) In un’impresa di soccorso stradale<br />

sono state registrate le richieste giornaliere di intervento su un arco di cento giorni<br />

ottenendo la seguente distribuzione di frequenza:<br />

n. interventi 0 1 2 3 4 5 6 7<br />

n. di giorni 14 22 31 17 8 5 2 1<br />

Sottoporre a test l’ipotesi che la distribuzione sia ben adattabile da una distribuzione<br />

di Poisson. [R: non si rifiuta l’ipotesi nulla]<br />

<strong>Esercizi</strong>o 3.39 (Prof.ssa Mortera, 8–2-00) Nell’isola Smeraldina, negli ultimi<br />

1000 giorni, sono arrivate delle navi, secondo la seguente tabella: 450 sono i giorni<br />

durante i quali non è arrivata alcuna nave, 360 i giorni durante i quali ne è arrivata<br />

una, 140 i giorni in cui ne sono arrivate due, 40 i giorni in cui ne sono arrivate tre, e<br />

10 i giorni in cui ne sono arrivate quattro. Questi dati sono conformi con l’ipotesi che<br />

la distribuzione del numero di arrivi sia una variabile casuale di Poisson? Usare un<br />

livello di significatività dell’1%. [R: non si rifiuta H0]<br />

<strong>Esercizi</strong>o 3.40 (Prof.ssa Mortera, 22–2-99) Per esaminare come vengono utilizzati<br />

i quattro ingressi di un grande supermercato si osserva un campione casuale di<br />

130 persone e risulta:<br />

Ingresso 1 2 3 4<br />

n.persone 24 36 30 40<br />

Si verifichi l’ipotesi che i quattro ingressi vengono utilizzati con la stessa intensità [R:<br />

non si rifiuta H0]<br />

<strong>Esercizi</strong>o 3.41 (Prof. Pieraccini, 3–7-01) Lanciando 240 volte un dado si sono<br />

ottenuti i seguenti punteggi:<br />

Punteggio 1 2 3 4 5 6<br />

Frequenza 27 45 35 46 34 53<br />

Sottoporre a test l’ipotesi che il dado non sia truccato, cioè che i punteggi siano<br />

equidistribuiti. [R: non si rifiuta H0 con α = 0.025, mentre si rifiuta H0 con α = 0.05]<br />

21


<strong>Esercizi</strong>o 3.42 (Prof. Pieraccini, 5-7-99) La distribuzione dei matrimoni celebrati<br />

in Italia secondo lo stato civile è risultata la seguente:<br />

Stato civile delle spose<br />

Stato civile degli sposi Nubili Vedove Divorziate<br />

Celibi 301.933 1.138 2.200<br />

Vedovi 3.964 1.286 577<br />

Divorziati 4.571 330 954<br />

Si controlli l’esistenza di una dipendenza assoluta fra i due caratteri e si commenti il<br />

risultato ottenuto. [R: si rifiuta l’ipotesi nulla di indipendenza].<br />

<strong>Esercizi</strong>o 3.43 (Prof.ssa Mortera, 13-6-01) Ad un campione di 80 giovani in<br />

età compresa tra 25 e 35 anni è stato chiesto se sono laureati e se hanno un’occupazione.<br />

Il risultato della rilevazione è contenuto nella tabella seguente:<br />

Stato occupazionale<br />

Titolo di studio Occupato Disoccupato<br />

Laureato 22 8 30<br />

Non laureato 16 34 50<br />

38 42 80<br />

a) C’è dipendenza o indipendenza tra il titolo di studio e lo stato occupazionale?<br />

Usare l’indice opportuno.<br />

b) Valutare se c’è indipendenza anche mediante l’opportuno test statistico.<br />

c) Lasciando inalterata la marginale del titolo di studio, costruire la tabella di<br />

massima dipendenza. [R: χ 2 = 12.845; si rifiuta l’ipotesi nulla di indipendenza]<br />

22


4 <strong>Esercizi</strong> sulla regressione<br />

<strong>Esercizi</strong>o 4.1 (Prof.ssa Terzi, 1-10-98) In 5 famiglie sono stati rilevati i seguenti<br />

redditi (X) e risparmi (Y):<br />

X 80 110 90 60 60<br />

Y 16 18 21 27 35<br />

a) determinare l’equazione della retta di regressione di Y su X;<br />

b) stimare il presumibile valore del risparmio per una famiglia con reddito pari a<br />

50: � Y(50);<br />

c) determinare il valore del coefficiente di correlazione rxy.<br />

[R: � Y=45-0.27X; � Y(50)=31.5; rxy = −0.75]<br />

<strong>Esercizi</strong>o 4.2 (Prof.ssa Terzi, 11-9-00) Per due variabili statistiche X e Y si<br />

hanno le seguenti coppie di osservazioni:<br />

X 1 3 4 7 8 10<br />

Y 5 4.9 4.5 3 2.2 2<br />

Stimare i parametri della retta di regressione Y=a +bX e valutarne la bontà di adattamento<br />

tramite l’indice R 2 . Posto poi che si osservi X=12, sulla base della retta stimata,<br />

qual’è il presumibile valore della Y?[R: �a = 5.75, � b = −0.39; R 2 = 0.94; � Y(12)=1.07]<br />

<strong>Esercizi</strong>o 4.3 (Prof. Pieraccini, 1–2-96) Per una distribuzione doppia si è<br />

stimata la retta di regressione � Xi=10-2Yi. Individuare quale, fra le seguenti, è la<br />

possibile equazione della retta di regressione di Y su X e motivare la scelta:<br />

a) � Yi= 4+0.4Xi<br />

b) � Yi= -7-0.8Xi<br />

c) � Yi= -3-0.4Xi<br />

d) � Yi= 0.8+0.5Xi.<br />

<strong>Esercizi</strong>o 4.4 (Prof.ssa Terzi, 1-10-98) La regressione di Y su X ha fornito la<br />

seguente retta dei minimi quadrati: � Y=13-1.5X, mentre quella di X su Y ha fornito:<br />

�X=31/6-(1/6)Y. Si determinino il coefficiente di correlazione rxy e le due medie M1 (X)<br />

e M1 (Y ) . [R: rxy = −0.5; M1 (X) = 4; M1 (Y ) = 7]<br />

<strong>Esercizi</strong>o 4.5 (Prof.ssa Mortera, 2-2-01) Su una variabile statistica doppia<br />

(X,Y) si sono stimate le seguenti equazioni delle rette di regressione:<br />

�Y = −0.3 + 1.6X,<br />

� X = 0.84 + 0.4Y.<br />

Determinare il coefficiente di correlazione lineare, la media di X e quella di Y. Sapendo<br />

poi che la media quadratica di X è pari a 4.36, determinare la media e la varianza<br />

della variabile Z=2X-4Y+1. [R: rxy = 0.8; M1 (X) = 2; M1 (Y ) = 2.89; M1 (Z) =<br />

−6.56, var (Z) = 636.42]<br />

<strong>Esercizi</strong>o 4.6 Data la variabile statistica doppia (X,Y), per cui è noto che X ha<br />

varianza doppia rispetto a Y, e data la variabile Z=Y+2, determinare il valore del<br />

23


apporto α1/β1, in cui α1 e β1 sono i coefficienti angolari delle rette di regressione di<br />

X su Z e di Z su X rispettivamente:<br />

[R: α1/β1 = 2]<br />

X = α0 + α1Z, Z = β0 + β1X.<br />

<strong>Esercizi</strong>o 4.7 Data la variabile statistica doppia (X,Y), si sono stimati i parametri<br />

della retta di regressione di X su Y, il cui coefficiente angolare è risultato uguale al<br />

coefficiente di correlazione lineare. Sappiamo inoltre che la variabile Z=2Y ha varianza<br />

pari a 36. Calcolare la varianza di X e individuare il campo di valori accettabili per<br />

la covarianza tra X e Y. [R: var(X)=9; σxy ∈ (−9, 9)]<br />

<strong>Esercizi</strong>o 4.8 Data la variabile statistica doppia (X,Y), per cui è noto che var(X)=81var(Y),<br />

indicare quali tra i seguenti valori del coefficiente angolare della retta di regressione di<br />

X su Y:<br />

−2, 0, 15<br />

non sono accettabili, motivando la risposta fornita. [R: il valore 15 non è accettabile].<br />

<strong>Esercizi</strong>o 4.9 (Prof.ssa Mortera, 19–6-00) Al fine di stabilire se esiste una<br />

relazione statistica tra l’altezza degli alberi di ciliegie (X) ed il diametro medio delle<br />

ciliegie prodotte (Y), si considerino le osservazioni della seguente tabella:<br />

Diametro (cm.) 3.4 4.3 3.0 3.2 2.1<br />

Altezza (m.) 5.5 6.0 5.6 5.1 4.5<br />

a) Calcolare la retta di regressione di Y su X. Stabilire se X e Y sono: incorrelate,<br />

correlate positivamente oppure correlate negativamente.<br />

b) Calcolare la devianza residua, la devianza spiegata e l’indice di accostamento<br />

lineare.<br />

c) Si preveda, sulla base della relazione trovata al punto a), il diametro delle ciliegie<br />

prodotte da un albero di altezza 3.5. Commentare il risultato.<br />

d) Costruire l’intervallo di confidenza per β1 con livello di confidenza del 95% e<br />

verificare l’ipotesi H0:β1=0 contro l’alternativa H1:β1 �=0 (con α=0.05).<br />

e) Si esprima l’altezza delle piante in centimetri e si indichi con W la corrispondente<br />

variabile statistica. Senza rifare i calcoli, a partire dai parametri della funzione di<br />

regressione trovata al punto a), determinare la funzione di regressione lineare di Y su<br />

W.<br />

[R: � Y = 1.26x − 3.53, σxy = 0.326; Dres = 0.449, Dtot = 2.5, R 2 = 0.82; � Y (3.5) =<br />

0.88; (0.18; 2.34) , si rifiuta l’ipotesi nulla di indipendenza lineare; � Y = 0.0126w − 3.53]<br />

<strong>Esercizi</strong>o 4.10 (Prof. Pieraccini, 24–6-96) In un campione di 12 famiglie si<br />

sono rilevati i pesi del padre (X) e del figlio primogenito (Y) qui di seguito riportati:<br />

X 75 73 77 74 78 72 80 76 78 77 79 81<br />

Y 78 76 78 75 79 76 78 75 81 77 78 80<br />

a) Stimare i parametri della retta di regressione della Y sulla X e calcolarne l’R 2 .<br />

24


) Nell’ipotesi di normalità della componente accidentale, sottoporre a test le due<br />

ipotesi α=0 e β=1 e commentare i risultati.<br />

[R: � Y = 38.48 + 0.51x, R 2 = 0.46; si rifiuta l’ipotesi nulla di assenza di intercetta,<br />

si rifiuta l’ipotesi nulla di coefficiente di regressione unitario]<br />

<strong>Esercizi</strong>o 4.11 (Prof. Pieraccini, 10–9-01) In un campione di 15 famiglie si è<br />

rilevato il reddito annuo e la spesa per generi alimentari:<br />

Reddito 25 40 20 32 60 18 24 42 45 36 15 21 34 25 58<br />

Spesa 8.0 11.4 6.5 9.6 16.2 6.0 7.5 12.0 15.0 12.2 6.0 7.5 10.0 8.0 14.1<br />

a) Si stimino i parametri della retta di regressione della spesa per alimenti in<br />

funzione del reddito netto annuo e si determini la bontà di adattamento della relazione<br />

stimata;<br />

b) si verifichi l’ipotesi di indipendenza lineare fra le due variabili ad un livello di<br />

significatività del 5%;<br />

c) si verifichi inoltre, per la retta stimata, l’ipotesi di passaggio per l’origine;<br />

c) si calcoli l’intervallo di confidenza per la spesa alimentare nel caso in cui il reddito<br />

sia di 58 milioni e nel caso in cui esso sia di 32 milioni.<br />

[R: � Y = 2.41 + 0.23x, R 2 = 0.93; si rifiuta l’ipotesi di indipendenza lineare; si<br />

rifiuta l’ipotesi di passaggio per l’origine; (14.67; 16.83) ; (9.26; 10.28)]<br />

<strong>Esercizi</strong>o 4.12 (Prof. Pieraccini, 3–7-00) In una indagine campionaria si sono<br />

rilevati i seguenti dati sulla superficie in ettari (X) e sul rendimento in q/ha (Y) di 10<br />

aziende cerealicole:<br />

(3, 27) (2, 26) (4, 30) (3, 28) (4, 32)<br />

(2, 30) (6, 33) (5, 29) (4, 31) (6, 31)<br />

Si verifichi al livello di significatività del 5% l’ipotesi di indipendenza lineare del rendimento<br />

dalla dimenzione aziendale contro l’ipotesi alternativa più opportuna. [R: si<br />

rifiuta l’ipotesi di indipendenza lineare]<br />

<strong>Esercizi</strong>o 4.13 (Prof.ssa Mortera, 28–6-01) “La torre di Pisa che pende che<br />

pende...”. Prima che la torre venisse chiusa, era stata condotta, con frequenza trimestrale,<br />

una rilevazione statistica sull’incremento dell’inclinazione della torre. Sia Y=<br />

“pendenza” X= “tempo” e Z=“cm di pioggia caduti su Pisa”. Sono state stimate le<br />

seguenti relazioni lineari:<br />

A : � Y = 3x + 0.5<br />

B : � Y = 3z + 0.5<br />

per le quali l’output di computer è risultato:<br />

Stima di β1 t p Dev. spiegata Dev(Y)<br />

Modello A 3 2.896 0.02 2.025 2.25<br />

Modello B 3 0.13 0.90 0.0225 2.25<br />

25


a) Per entrambi i modelli A e B, calcolare R 2 e Devianza residua.<br />

b) Confrontare i due modelli commentando i dati della tabella (t e p) e i risultati<br />

ottenuti in a).<br />

c) Dato il modello di regressione lineare Yi = β0 +β1Xi +εi, considerando le ipotesi<br />

assunte riguardo all’errore ε, quali delle seguenti affermazioni sono vere?<br />

� A E (εi) = β0, V ar (εi) = σ 2 e cov (εi, εj) = 0<br />

� B E (Yi| xi) = β0 + β1xi, V ar (εi) = σ 2 e E (εi · εj) = 0<br />

� C E (Yi| xi) = β0 + β1xi, V ar (Yi| xi) = σ2<br />

n e cov (εi, εj) = 0<br />

� D E (εi) = 0, V ar (εi) = σ 2 e ρ (εi, εj) = 0.<br />

[R: modello A: Dres = 0.225, R 2 = 0.9; modello B: Dres = 2.2575, R 2 = 0.01]<br />

<strong>Esercizi</strong>o 4.14 (Prof. Pieraccini, 5–2-01) Si considerino i seguenti dati relativi<br />

al numero di ore di studio (X) di un campione casuale di 8 studenti per la preparazione<br />

dell’esame di statistica ed il voto (Y) riportato:<br />

X 100 95 100 80 75 150 130 160<br />

Y 24 22 21 20 18 30 28 30<br />

Nell’ipotesi di normalità delle distribuzioni condizionate:<br />

a) trovare la retta di regressione delle votazioni riportate sulle ore di studio;<br />

b) sottoporre a test l’ipotesi β = 0 contro l’alternativa β > 0;<br />

c) trovare l’intervallo di previsione per il punteggio di uno studente che abbia<br />

studiato 110 ore per la preparazione dell’esame.<br />

[R: � Y = 8.55 + 0.14x; si rifiuta l’ipotesi di indipendenza lineare; (21.02; 26.88)]<br />

<strong>Esercizi</strong>o 4.15 (Prof. Pieraccini, 20–6-00) Si siano osservate le seguenti coppie<br />

di valori per le variabili X e Y:<br />

X 1 3 4 6 8 9 11 14<br />

Y 1 2 4 4 5 7 8 9<br />

Determinare l’equazione della retta che esprime la Y in funzione della X e calcolare<br />

gli intervalli di confidenza per i valori interpolati. Rappresentare sul piano cartesiano<br />

i punti osservati, la retta interpolante e gli intervalli di confidenza. [R: � β0 = 0.548,<br />

�β1 = 0.636; intervalli di confidenza: per � Y1: (0.179; 2.189) , per � Y2: (1.665; 3.247), ecc]<br />

<strong>Esercizi</strong>o 4.16 (Prof. Pieraccini, 20–6-00) I voti in Economia (X) ed in<br />

Statistica (Y) riportati da 10 studenti sono stati i seguenti:<br />

X 20 24 28 27 18 22 29 30 23 21<br />

Y 22 24 27 28 18 23 30 29 21 19<br />

Sapendo che Dev(X)=151.6, Dev(Y)=160.9, Cod(X,Y)=147.8, determinare l’intervallo<br />

di previsione per il voto in Statistica di uno studente che abbia preso 23 nell’esame di<br />

Economia, sotto l’assunzione di Normalità della componente accidentale. [R: (19.32; 26.54)]<br />

<strong>Esercizi</strong>o 4.17 Negli anni 1987-1993, l’ascolto di televisione (Y) nella fascia 19-20<br />

ha avuto il seguente andamento (dati Auditel, in milioni di ascoltatori):<br />

Anno 1987 1988 1989 1990 1991 1992 1993<br />

Y 0.7 0.8 0.9 1.1 1.4 1.6 2.0<br />

26


Interpolare tale distribuzione con una funzione di tipo Y=ab t e sulla base di questo<br />

modello prevedere il numero di ascoltatori (in milioni) per l’anno 1996. [R: �a = 0.66,<br />

� b = 1.20; � Y (1996) = 3.4]<br />

<strong>Esercizi</strong>o 4.18 (Prof.ssa Terzi, 5–7-99) Per le seguenti 5 coppie di osservazioni:<br />

X 1 2 3 4 5<br />

Y 1 5 8 15 28<br />

si vuole interpolare la Y con la funzione Y=c0+c1X 2 .<br />

a) calcolare i parametri c0 e c1;<br />

b) valutare la bontà di adattamento di tale funzione.<br />

[R: �c0 = −0.546, �c1 = 1.086; R 2 = 0.98]<br />

<strong>Esercizi</strong>o 4.19 (Prof.ssa Terzi, 8–9-99) Date le seguenti coppie di osservazioni:<br />

X 1 2.5 3 3.5 5<br />

Y 3 19 29 41 87<br />

a) interpolare con la funzione Y=a+bX 2 ;<br />

b) confrontare il danno (=somma dei quadrati dei residui) che si ha interpolando<br />

con tale parabola con il danno che si ha interpolando con la retta Y=a+bX.<br />

[R: �a = −2.078, � b = 3.54; Dres (X 2 ) = 4.05, Dres (X) = 238.7]<br />

<strong>Esercizi</strong>o 4.20 (Prof. Pieraccini, 1–2-96) Date le seguenti coppie di valori (X,<br />

Y):<br />

(3, 5) (6, 12.5) (9, 14) (15, 35) (25, 65)<br />

sulla base dei quadrati dei coefficienti di correlazione individuare quale di queste<br />

due funzioni<br />

a) Y=a1+b1X<br />

b) Y=a2+b2X 2<br />

approssima meglio la relazione esistente tra X e Y, e stimarne i parametri. Nell’ipotesi<br />

di Normalità della componente accidentale, sottoporre a test l’ipotesi b=0. [R: si<br />

adatta meglio la funzione a), con R 2 = 0.984; si rifiuta l’ipotesi nulla di indipendenza<br />

lineare].<br />

27

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!