CORSO INTENSIVO DI STATISTICA I (V.O.) Esercizi
CORSO INTENSIVO DI STATISTICA I (V.O.) Esercizi
CORSO INTENSIVO DI STATISTICA I (V.O.) Esercizi
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>CORSO</strong> <strong>INTENSIVO</strong> <strong>DI</strong> <strong>STATISTICA</strong> I (V.O.)<br />
<strong>Esercizi</strong><br />
Dott.ssa CATERINA CONIGLIANI<br />
Facoltà di Economia<br />
Università Roma Tre<br />
1 <strong>Esercizi</strong> di statistica descrittiva<br />
<strong>Esercizi</strong>o 1.1 (Prof. Pieraccini, 20–6-00) In un pronto soccorso di un ospedale<br />
sono stati registrati il numero delle richieste di intervento giornaliere (X) su un arco<br />
di 100 giorni, ottenendo la seguente distribuzione di frequenza:<br />
X 0 1 2 3 4 5 6 7 8 9 10<br />
n(X) 2 9 18 22 16 12 9 5 4 2 1<br />
Fare la rappresentazione grafica della distribuzione e della sua funzione di ripartizione;<br />
calcolarne la media e la mediana con i rispettivi indici di variabilità. Commentare i<br />
risultati. [R: µ = 3.84; Me = 3; σ 2 = 4.47; SMe = 1.68]<br />
<strong>Esercizi</strong>o 1.2 Data la seguente distribuzione delle frequenze cumulate relative di<br />
un collettivo rispetto al carattere X:<br />
X 0-2 2-4 4-6 6-10 10-20 20-30 30-50<br />
F(X) 0 0.08 0.32 0.64 0.86 0.96 1<br />
a) individuare la classe modale;<br />
b) calcolare la media aritmetica e la varianza della variabile Z=1-3X;<br />
c) calcolare la proporzione di unità che presentano un livello di X≤12.<br />
[R: classe modale: (4-6); µz = −33.2, σ 2 z = 659.16; F (12) = 0.684]<br />
<strong>Esercizi</strong>o 1.3 (Prof.ssa Mortera, 3-7-00) Dare una spiegazione breve della/e<br />
scelta/e: se la devizione standard di un insieme di numeri è pari a zero ne segue che:<br />
a) i dati sono distribuiti normalmente;<br />
b) la media deve essere pari a zero;<br />
c) i numeri sono tutti uguali;<br />
d) metà dei numeri sono positivi, e metà negativi.<br />
<strong>Esercizi</strong>o 1.4 (Prof.ssa Terzi, 8–2-99) Una sessione è costituita da tre appelli<br />
di esame, a cui si presentano, rispettivamente, 80, 100 e 50 studenti; tutti vengono<br />
promossi. Il voto medio riportato al primo appello risulta pari a 26.4, con scostamento<br />
quadratico medio (s.q.m.) pari a 4.5. Al secondo appello il voto medio risulta pari<br />
1
a 27.2. Al terzo appello si osserva uno s.q.m. pari a 5. Per l’intera sessione il voto<br />
medio risulta pari a 27.<br />
a) Valutare il voto medio relativo al terzo appello.<br />
b) Sapendo che lo s.q.m. complessivo vale 5.5, determinare lo s.q.m. relativo al<br />
secondo appello.<br />
[R: µ3 = 27.56; σ2 = 6.36]<br />
<strong>Esercizi</strong>o 1.5 (Prof.ssa Terzi, 19–6-01) Una ditta che produce telefoni cellulari<br />
distribuisce mensilmente il suo prodotto in tre negozi che si trovano in uno stesso paese<br />
nell’entroterra sardo. Il primo negozio vende in media 3.4 telefoni al mese, con s.q.m.<br />
pari a 0.6. Il secondo negozio vende in media 7 telefoni al mese, con s.q.m. pari a 1.2.<br />
Il terzo negozio vende in media 2.8 telefoni al mese con s.q.m. pari ad 1. Calcolare:<br />
a) il numero medio di vendite mensili per l’intero paese;<br />
b) lo s.q.m. delle vendite mensili per l’intero paese.<br />
[R: µ = 4.4; σ = 2.091]<br />
<strong>Esercizi</strong>o 1.6 (Prof.ssa Mortera, 13–06-01) Se la distanza interquartile di un<br />
insieme di dati è nulla allora<br />
� A la media è uguale a 0<br />
� B i numeri sono tutti uguali<br />
� C i dati sono distribuiti normalmente<br />
� D tutti i quartili sono uguali.<br />
<strong>Esercizi</strong>o 1.7 (Prof. Pieraccini, 20–6-00) Al censimento del 1981 le famiglie<br />
italiane secondo il numero di componenti (X) sono risultate così distribuite:<br />
X 1 2 3 4 5 6 7 8 e più<br />
n(X) 3323 4402 4117 4008 1773 629 224 154<br />
Fare la rappresentazione grafica: a) della distribuzione di frequenza; b) della funzione<br />
di ripartizione. Calcolare mediana e quartili, e rappresentarli sul grafico della funzione<br />
di ripartizione. [R: Me = 3; Q1 = 2; Q3 = 4]<br />
<strong>Esercizi</strong>o 1.8 (Prof. Pieraccini, 5–2-01) Data la seguente tabella:<br />
X 0-1 1-2 2-3 3-5 5-10 10-15 15-30<br />
n(X) 15 13 15 12 15 10 15<br />
Fare la rappresentazione grafica della distribuzione di frequenza e quella della sua<br />
funzione di ripartizione. Calcolare: a) la mediana; b) il primo e il terzo quartile; c) la<br />
differenza interquartile. Commentare i risultati ottenuti. [R: Me = 3.67; Q1 = 1.64;<br />
Q3 = 10.5; D = 8.86]<br />
<strong>Esercizi</strong>o 1.9 (Prof.ssa Mortera, 28–06-01) La media aritmetica è più grande<br />
della mediana quando<br />
� A la moda è grande<br />
� B ci sono valori anomali estremamente piccoli<br />
� C la popolazione non è normale<br />
� D ci sono valori anomali estremamente grandi.<br />
2
<strong>Esercizi</strong>o 1.10 (Prof. Pieraccini, 21–9-99) Sia data la seguente distribuzione<br />
dei redditi:<br />
Classi di reddito (milioni) Frequenze relative<br />
fino a 10 0.195<br />
10-20 0.419<br />
20-30 0.221<br />
30-40 0.095<br />
40-50 0.041<br />
oltre 50 0.029<br />
Totale 1.000<br />
Calcolare media, s.q.m., ed un indice di asimmetria. Commentare i risultati. [R:<br />
µ = 19.84; σ = 12.87; γ = 1.41]<br />
<strong>Esercizi</strong>o 1.11 (Prof. Pieraccini, 3-7-00) Data la seguente distribuzione di<br />
frequenza:<br />
X 0-1 1-2 2-3 3-5 5-10 10-15 15-20 20-30 30-40 40-50 50-100<br />
ni 15 13 12 11 10 10 8 6 6 5 4<br />
a) fare la rappresentazione grafica della distribuzione;<br />
b) fare la rappresentazione grafica della funzione di ripartizione;<br />
c) calcolare la mediana e la media aritmetica;<br />
d) calcolare lo scarto semplice medio dalla mediana e quello quadratico dalla media<br />
aritmetica;<br />
e) calcolare un indice di asimmetria.<br />
Commentare i risultati ottenuti. [R: Me = 4.8; µ = 13.26; SMe = 11.336; σ =<br />
17.61; γ = 2.006]<br />
<strong>Esercizi</strong>o 1.12 (Prof. Pieraccini, 3-2-97) In una cittadina degli Stati Uniti è<br />
stata rilevata la concentrazione media giornaliera di ozono (X in parti di miliardi) fra<br />
l’1/5/74 e il 13/9/74, ottenendo la seguente distribuzione di frequenza:<br />
X 0-50 50-75 75-100 100-150 150-200 200-250<br />
n(X) 35 29 25 28 11 8<br />
a) Fare la rappresentazione grafica delle frequenze relative e delle frequenze relative<br />
cumulate.<br />
b) Calcolare un indice di dimensione, uno di variabilità ed uno di asimmetria a<br />
vostra scelta.<br />
[R: µ = 88.97; σ = 56.19; γ = 0.78]<br />
<strong>Esercizi</strong>o 1.13 (Prof.ssa Mortera, 28–9-00) Da un campione di 100 aziende<br />
della provincia di Milano è stata rilevata la classe di addetti, ottenendo i seguenti<br />
risultati:<br />
Classe di superficie Numero di aziende<br />
0-10 33<br />
10-50 43<br />
50-100 12<br />
100-500 10<br />
500-1000 2<br />
3
a) Si rappresentino graficamente i dati nel modo che si ritiene più opportuno.<br />
b) Si determinino la classe modale e la classe mediana.<br />
c) Si calcolino la mediana e un indice di asimmetria.<br />
[R: classe modale: (0-10); Me=25.814;<br />
µ − Me<br />
σ<br />
= 0.33]<br />
<strong>Esercizi</strong>o 1.14 (Prof.ssa Mortera, 22-2-00) Data la seguente tabella a doppia<br />
entrata relativa ai caratteri reddito mensile in milioni di lire (X) e numero di weekend<br />
dedicati a viaggiare (Y):<br />
Y 0 − 1 2 − 3 4<br />
X<br />
0-1.5 20 15 3<br />
1.5-2.5 13 21 6<br />
2.5-4 18 10 8<br />
calcolare:<br />
a) la media e la varianza di X, la media e la varianza di Y, la Cov(X,Y);<br />
b) la media di X quando Y è tra 2 e 3 weekend;<br />
c) la media e la varianza di Z=X+Y e di W=X-Y;<br />
d) Cov(Z,W) in funzione di var(X) e var(Y).<br />
[R: µx = 1.98; σ 2 x = 1.01; µy = 1.83; σ 2 y = 1.67; σxy = 0.11; µx|y∈(2−3) = 1.86;<br />
µz = 3.81; σ 2 z = 2.9; µw = 0.15; σ 2 w = 2.46; σzw = σ 2 x − σ 2 y]<br />
<strong>Esercizi</strong>o 1.15 (Prof.ssa Mortera, 17-07-01) Con riferimento alla tabella<br />
seguente<br />
Età 10 − 18 18 − 20 20 − 60<br />
Settore<br />
Abbigliamento 312 913 3367<br />
Bigiotteria 710 377 208<br />
Profumi 248 211 341<br />
dire se (giustificando le risposte):<br />
a) la classe modale della distribuzione marginale dell’età è<br />
� A 10-18<br />
� B 18-20<br />
� C 20-60<br />
� D la distribuzione è bimodale<br />
b) la moda della distribuzione marginale del settore merceologico è<br />
� A abbigliamento<br />
� B bigiotteria<br />
� C non si può calcolare<br />
� D profumi<br />
c) la mediana della distribuzione marginale del settore merceologico è<br />
� A abbigliamento<br />
� B bigiotteria<br />
� C non si può calcolare<br />
4
� D 0.5.<br />
<strong>Esercizi</strong>o 1.16 (Prof.ssa Terzi, 21-9-98) Per la seguente serie di coppie di<br />
valori:<br />
X 1 2 6 10 X5<br />
Y 7 12 32 Y4 67<br />
si sa che il coefficiente di correlazione rxy=1. Si determinino i due valori mancanti X5<br />
e Y4. [R: X5 = 13; Y4 = 52]<br />
<strong>Esercizi</strong>o 1.17 (Prof.ssa Mortera, 13–06-01) Date due variabili statistiche X<br />
e Y, se si trova che rxy=1.09 allora X e Y<br />
� A sono indipendenti<br />
� B sono dipendenti in modo quadratico<br />
� C hanno una fortissima dipendenza lineare<br />
� D chi ci ha dato il risultato ha sbagliato i conti.<br />
<strong>Esercizi</strong>o 1.18 (Prof.ssa Terzi, 20-6-00) Si consideri il valore dei depositi in<br />
miliardi nelle aziende di credito e presso le amministrazioni postali in Italia nel 1987:<br />
Aziende di credito Amministrazioni postali<br />
Totale 460 000 78 000<br />
I due tipi di deposito sono così distribuiti (percentualmente) nelle due ripartizioni del<br />
Centro-Nord e Mezzogiorno:<br />
Aziende di credito Amministrazioni postali<br />
Centro-Nord 79.9% 65.9%<br />
Mezzogiorno 20.1% 34.1%<br />
Totale 100% 100%<br />
a) Sulla base di queste informazioni si costruisca la tabella che classifica congiuntamente<br />
i valori dei depositi per ripartizione territoriale e tipo di deposito.<br />
b) Quale tipo di indipendenza si può valutare su una tabella come quella del punto<br />
a)?<br />
c) Calcolare un indice adeguato per misurare la dipendenza tra i due caratteri. [R:<br />
χ 2 = 7585.39]<br />
<strong>Esercizi</strong>o 1.19 (Prof.ssa Terzi, 13–7-98) Data la seguente tabella a doppia<br />
entrata:<br />
Y 2 4 6 tot<br />
X<br />
1 4<br />
2<br />
3<br />
6 10<br />
tot 10 100<br />
completarla nell’ipotesi di indipendenza assoluta tra i due caratteri. Calcolare poi la<br />
media aritmetica e la mediana di Y. [R: µy = 4.4; Mey = 4]<br />
5
<strong>Esercizi</strong>o 1.20 (Prof.ssa Terzi, 22-10-99) Data la seguente tabella:<br />
Y 1 6 tot<br />
X<br />
1 70<br />
3 50<br />
7 30<br />
tot 100 50 150<br />
a) riempirla in modo che risulti η 2 Y |X =1;<br />
b) senza svolgere i calcoli, quanto vale χ 2 ?<br />
[R: χ 2 = 150]<br />
<strong>Esercizi</strong>o 1.21 (Prof.ssa Terzi, 21-9-98) Data la seguente distribuzione<br />
a) calcolare l’indice η 2 Y |X ;<br />
Y 0 1 tot<br />
X<br />
0 45 15 60<br />
1 5 35 40<br />
tot 50 50 100<br />
b) tenendo costanti le frequenze marginali, riempire la tabella in modo che risulti<br />
= 0.<br />
= 0.375]<br />
η2 X|Y<br />
[R: η2 Y |X<br />
<strong>Esercizi</strong>o 1.22 (Prof.ssa Terzi, 22-2-00) Data la seguente tabella a doppia<br />
entrata<br />
X 2 6 tot<br />
Y<br />
Y1 5 0 5<br />
Y2 0 5 5<br />
Y3 15 0 15<br />
tot 20 5 25<br />
a) Calcolare η 2 X|Y .<br />
b) Posto Y1=2, Y3=6, determinare quale deve essere il valore di Y2 affinchè risulti<br />
η 2 Y |X =0.<br />
[R: η 2 X|Y = 1; Y2 = 5]<br />
<strong>Esercizi</strong>o 1.23 Su una tabella a doppia entrata in cui la variabile X è articolata<br />
in 4 modalità e la variabile Y è articolata in 2 modalità, è stato calcolato il χ 2 relativo,<br />
che risulta pari a 1. Quali affermazioni si possono eventualmente fare sul valore che,<br />
su questa tabella, assumono gli indici η 2 Y |X , η2 X|Y , r2 ?<br />
6
<strong>Esercizi</strong>o 1.24 (Prof.ssa Terzi, 1-10-98) Data la seguente tabella a doppia<br />
entrata:<br />
Y 1 3 tot<br />
X<br />
1 90<br />
3 50<br />
7 60<br />
tot 150 50 200<br />
a) riempirla in modo che risulti η2 Y |X<br />
b) calcolare poi χ2 e χ2 relativo.<br />
[R: χ2 = 200]<br />
= 1;<br />
7
2 <strong>Esercizi</strong> di Calcolo delle Probabilità<br />
<strong>Esercizi</strong>o 2.1 (Prof.ssa Terzi, 1-10-98) Uno studente universitario ha programmato<br />
di sostenere nella sessione estiva gli esami X e Y. Sia A l’evento “supera l’esame<br />
X” e sia B l’evento “supera l’esame Y”, con P(A)=0.7, P(B)=0.5, P(A � B)=0.4. Calcolare<br />
la probabilità che non superi nessuno dei due esami, ovvero P(A � B). [R:<br />
P(A � B)= 0.2]<br />
<strong>Esercizi</strong>o 2.2 (Prof.ssa Mortera, 8–2-00) Una fabbrica produce RAM che<br />
possono avere due tipi di difetti, il difetto A e il difetto B. Il responsabile per la qualità<br />
della fabbrica afferma che, dall’esperienza passata, la probabilità che una RAM abbia<br />
almeno uno dei due difetti è pari a 0.3; la probabilità che abbia il difetto A ma non il<br />
B è pari a 0.1; la probabilità che abbia contemporaneamente i due difetti è pari a 0.2.<br />
Calcolare la probabilità che una RAM abbia:<br />
a) il difetto A;<br />
b) il difetto B;<br />
c) il difetto A, dato che si è riscontrato che non ha il difetto B.<br />
[R: P(A)=0.3; P(B)=0.2; P(A|B)=0.125]<br />
<strong>Esercizi</strong>o 2.3 (Prof.ssa Mortera, 28–9-00) Nel cinema Bianchini ci sono due<br />
sale. Marco ha deciso di andare a vedere il film che viene proiettato nella sala B, ma è<br />
in ritardo. Sa che, arrivando all’ultimo momento, la probabilità di trovare ancora un<br />
posto nella sala A è pari a 0.2, la probabilità di trovarlo in almeno una delle due sale<br />
è 0.4, e la probabilità che vi sia ancora un posto nella sala B sapendo che c’è ancora<br />
un posto nella sala A è 0.3.<br />
a) Quale è la probabilità che Marco riesca a vedere il film che proiettano nella sala<br />
B?<br />
b) Come cambia tale probabilità se sappiamo che la sala A è già completa?<br />
[R: P(B)=0.26; P(B|A)=0.25]<br />
<strong>Esercizi</strong>o 2.4 (Prof.ssa Mortera, 22-2-00) In ciascuna copia di una edizione<br />
economica dei Promessi Sposi, il 60% delle pagine contiene almeno un errore di stampa.<br />
Se ne produce una ristampa riveduta in cui errori di stampa sono contenuti solo nel<br />
20% delle pagine. Da uno scaffale, che contiene 20 libri della prima edizione e 10 della<br />
seconda, si sceglie un libro a caso. Si esamina una pagina, scelta anch’essa in modo<br />
casuale, e si trova un errore di stampa.<br />
a) Quale è la probabilità che il libro sia della prima edizione?<br />
b) E della ristampa?<br />
[R: P(I|E)=0.86; P(II|E)=0.14]<br />
<strong>Esercizi</strong>o 2.5 (Prof. Pieraccini, 20–6-00) Un’urna contiene 4 palline bianche<br />
e 2 rosse, un’altra ne contiene 2 bianche e 4 rosse. Da una delle due urne scelta a caso<br />
è stata estratta una pallina rossa. Quale è la probabilità che sia stata estratta dalla<br />
prima urna? [R: P(U1|R)=1/3]<br />
<strong>Esercizi</strong>o 2.6 (Prof. Pieraccini, 20–2-01) Un’urna contiene 6 palline rosse e 4<br />
nere, un’altra ne contiene 2 rosse e 8 nere. Se si estraggono con reimmissione 3 palline<br />
da una delle due urne scelta a caso, e si osservano 3 palline nere, quale è la probabilità<br />
che queste siano state estratte dalla prima urna? [R: P(U1|N � N � N)=1/9]<br />
8
<strong>Esercizi</strong>o 2.7 (Prof.ssa Mortera, 3-7-00) Dati due eventi A e B indipendenti,<br />
verificare se le seguenti affermazioni sono vere o false:<br />
a) P(A|B)=P(A|B);<br />
b) P(A � B)=P(A)-P(A)P(B);<br />
c) P(A � B)=P(A)P(B)+P(B).<br />
[R: le affermazioni sono tutte vere]<br />
<strong>Esercizi</strong>o 2.8 (Prof.ssa Mortera, 17-7-01) Due tifosi, Paolo e Carlo, vanno<br />
spesso allo stadio. Paolo ha assistito al 70% delle partite e Carlo ha assistito al 90%<br />
delle partite.<br />
a) Sapendo che la presenza di Paolo allo stadio è indipendente dalla presenza di<br />
Carlo (e viceversa), quale è la probabilità che almeno uno dei due tifosi abbia assistito<br />
ad una partita?<br />
b) Quale è la probabilità che Paolo abbia assistito alla quarta partita di campionato<br />
sapendo che Carlo ha assistito alla seconda partita di campionato?<br />
c) Dati due eventi A e B, definire la proprietà di incompatibilità e di indipendenza.<br />
[R: P(P � C)=0.97; P(P|C)=0.7]<br />
<strong>Esercizi</strong>o 2.9 (Prof.ssa Mortera, 3-7-00) Per arrivare ad una cena tra amici,<br />
Paolo e Giovanna scelgono, con uguale probabilità, fra i seguenti mezzi di trasporto:<br />
bus, auto e bicicletta. Le probabilità che ciascuno dei due amici giunga in ritardo, se<br />
prendono rispettivamente il bus, l’auto e la bicicletta, sono pari a 0.6, 0.2 e 0.4.<br />
a) Determinare la probabilità che Paolo arrivi in ritardo.<br />
b) Se Paolo e Giovanna viaggiano indipendentemente, quale è la probabilità che<br />
almeno uno giunga in ritardo?<br />
c) Sapendo che Paolo è arrivato in ritardo, quale è la probabilità che abbia viaggiato<br />
in auto?<br />
�<br />
[R: P(RP)=0.4; P(RP RG)=0.64; P(A|RP)=0.17]<br />
<strong>Esercizi</strong>o 2.10 (Prof.ssa Terzi, 20-6-00) La probabilità che durante la produzione<br />
giornaliera di una piccola azienda di componenti elettronici, si verifichino X<br />
pezzi difettosi è data da:<br />
P(X=0)=K, P(X=1)=3K, P(X=2)=K, P(X=3)=P(X=4)=2K, P(X ≥ 5)=0.<br />
a) Determinare il valore della costante K.<br />
b) Calcolare valore atteso e varianza della variabile casuale X.<br />
[R: K=1/9; E(X)=2.11; var(X)=1.88]<br />
<strong>Esercizi</strong>o 2.11 (Prof.ssa Terzi, 3-7-00) Una variabile casuale discreta X ha la<br />
seguente funzione di ripartizione:<br />
F(0)=0, F(1)=0.2, F(2)=0.4, F(3)=0.4, F(4)=0.8, F(5)=1.<br />
Calcolarne il valore atteso e la varianza. [R: E(X)=3.2; var(X)=2.16]<br />
<strong>Esercizi</strong>o 2.12 (Prof.ssa Terzi, 16–7-01) Un’urna contiene 5 palline bianche<br />
e 5 palline nere. Dall’urna vengono estratte (senza ripetizione) 2 palline. Sia X la<br />
9
variabile casuale “numero di palline bianche su due estratte”. Calcolare E(X) e var(X).<br />
[R: E(X)=1; var(X)=0.44]<br />
<strong>Esercizi</strong>o 2.13 (Prof. Pieraccini, 20–6-00) L’altezza di 450 studenti immatricolati<br />
all’Università di Roma Tre nel 1998 è risultata in media di 170 cm., con uno<br />
s.q.m. di 7.5 cm. Nell’ipotesi che la statura si distribuisca come una Normale, quale<br />
è il numero atteso di studenti con altezza<br />
a) maggiore di 180 cm.;<br />
b) minore o uguale a 160 cm.;<br />
c) tra 162.5 e 172.5.<br />
[R: n(X>180)�41; n(X≤160)�41; n(162.5
normale con µ = 1600 e σ 2 = 3600. Essa risarcisce un milione di lire all’acquirente se<br />
la durata della macchina acquistata è inferiore a 1450. Calcolare la probabilità che:<br />
a) su 5 macchine la ditta debba risarcire al massimo un milione di lire;<br />
b) su 100 macchine la ditta debba risarcire più di un milione.<br />
[R: P(N≤1)=0.99962; P(N>1)=0.1285]<br />
<strong>Esercizi</strong>o 2.20 (Prof.ssa Mortera, 19–6-00) Il numero di viaggi venduti in<br />
una settimana da ciascun agente dell’agenzia Kalimera, specializzata in viaggi verso la<br />
Grecia, si distribuisce come una Poisson con valore atteso λ=3. Il titolare dell’agenzia<br />
decide di dare un premio ai dipendenti che in una settimana vendono almeno 4 viaggi.<br />
a) Quale è la probabilità che un dipendente vinca il premio?<br />
b) Supposto che non esista nessuna relazione tra il numero di viaggi venduti dai<br />
diversi dipendenti dell’agenzia, calcolare la probabilità che non più di 3 dei 10 operatori<br />
complessivi ricevano il premio.<br />
c) Calcolare quanti viaggi vengono venduti mediamente in un mese.<br />
[R: P(X≥4)=0.35; P(N≤3)=0.513; E(Y)=130]<br />
<strong>Esercizi</strong>o 2.21 (Prof.ssa Mortera, 16-6-99) Il diametro interno delle guarnizioni<br />
prodotte dalla ditta Fido è di 0.502 cm e la deviazione standard è di 0.005 cm. Gli<br />
scopi per i quali queste guarnizioni sono prodotte permettono una tolleranza massima<br />
del diametro fra 0.496 e 0.508 cm, mentre nel caso contrario le guarnizioni sono<br />
considerate difettose. Assumendo la distribuzione dei diametri Normale:<br />
a) determinare la percentuale delle guarnizioni difettose prodotte dalla macchina;<br />
b) determinare quale è la probabilità di trovarne almeno 2 difettose in un campione<br />
casuale di 10 guarnizioni;<br />
c) determinare quale è la probabilità di trovarne più di 22 difettose in un campione<br />
casuale di 100 guarnizioni.<br />
[R: P(D)=0.23; P(N≥2)=0.71; P(N>22)=0.5478]<br />
<strong>Esercizi</strong>o 2.22 (Prof. Pieraccini, 10-9-01) Un’azienda che produce carta da<br />
parati decide di effettuare un controllo sulla qualità del prodotto; i difetti riscontrati<br />
possono essere distinti in due tipi: quelli dovuti allo spessore della carta e quelli dovuti<br />
alla colorazione. Sia X il numero di difetti del primo tipo (per ogni rotolo da 5 metri<br />
di carta) e sia Y il numero di difetti del secondo tipo. Si supponga che la distribuzione<br />
di probabilità congiunta di X e Y sia:<br />
X 0 1 2 3<br />
Y<br />
0 0.49 0.09 0.03 0<br />
1 0.12 0.07 0.01 0.01<br />
2 0.05 0.04 0.01 0<br />
3 0.04 0.03 0 0<br />
4 0.01 0 0 0<br />
Si calcoli :<br />
a) il valore atteso e la deviazione standard di ognuna delle due distribuzioni;<br />
b) la covarianza ed il coefficiente di correlazione tra X e Y;<br />
c) la probabilità P (X < 2, Y ≥ 2).<br />
11
[R: E(X)=0.36; var(X)=0.39; E(Y)=0.66; var(Y)=0.96; cov(X,Y)=0.0924; ρ(X,Y)=0.15;<br />
P(X606000)=0.35; P(N≥3)=0.2352; P(M≥2)=0.9987]<br />
12
3 <strong>Esercizi</strong> di inferenza<br />
<strong>Esercizi</strong>o 3.1 (Prof.ssa Mortera, 1-7-99) Il tempo che l’impiegato addetto allo<br />
sportello “accettazione telegrammi” di un certo ufficio postale dedica a ciascun utente<br />
segue una distribuzione normale di media 5 minuti. E’ anche noto che la probabilità<br />
che il tempo dedicato a ciascun utente sia inferiore a 3.2 minuti è pari a 0.209.<br />
a) Ricavare il valore dello scarto quadratico medio di X.<br />
b) Determinare la probabilità che il tempo medio ricavato sulla base di un campione<br />
casuale di 25 utenti superi i 6 minuti.<br />
c) Determinare l’intervallo in cui, con probabilità 0.9, cade la varianza campionaria<br />
corretta dello stesso campione.<br />
[R: σ = 2.22; P � X > 6 � = 0.01222; S 2 ∈ (2.85; 7.49)]<br />
<strong>Esercizi</strong>o 3.2 (Prof. Pieraccini, 19-6-01) Le cinque unità che compongono<br />
una popolazione presentano per la X i seguenti valori:<br />
3, 4, 6, 12, 17.<br />
Si considerino tutti i possibili campioni di ampiezza due che possono essere estratti<br />
con ripetizione da questa popolazione. Calcolare:<br />
a) la media della popolazione;<br />
b) lo scarto quadratico medio della popolazione;<br />
c) la distribuzione della media campionaria;<br />
d) verificare che la media campionaria è una stima non distorta della media della<br />
popolazione;<br />
e) controllare che la varianza della distribuzione campionaria delle medie è in accordo<br />
con il risultato teorico.<br />
[R: µ = 8.4; σ = 5.31]<br />
<strong>Esercizi</strong>o 3.3 (Prof.ssa Mortera, 28-6-01) Sia X1, X2,...,Xn un campione di<br />
ampiezza n (n ≥ 4) estratto da una popolazione X con E (X) = µ e varianza σ 2 . Si<br />
considerino i seguenti stimatori alternativi per µ:<br />
S1 = 2 X1<br />
n − X3 + X4<br />
+ X2 e S2 = X1 −<br />
n<br />
X2 + X3 − X4<br />
n<br />
a) Lo stimatore S1 è non distorto? In caso di risposta negativa proporre uno<br />
stimatore non distorto per µ modificando S1;<br />
b) lo stimatore S2 è non distorto? In caso di risposta negativa proporre uno stimatore<br />
non distorto per µ modificando S2;<br />
c) calcolare l’errore quadratico medio di S1e di S2;<br />
d) S1e di S2 sono consistenti in media quadratica?<br />
[R: S1 non distorto; S2 distorto, nS2/(n-1) non distorto; MSE(S1)=σ 2 (6/n 2 + 1),<br />
MSE(S2)=σ 2 (3/n 2 + 1) + µ 2 /n 2 ; S1 e S2 non sono consistenti in media quadratica]<br />
<strong>Esercizi</strong>o 3.4 (Prof.ssa Mortera, 16-6-99) Sia X1, X2,X3 un campione casuale<br />
estratto da una popolazione X con distribuzione di Poisson di parametro λ. Dati i due<br />
stimatori di λ:<br />
T1 = 2X1 + X2 + 2X3<br />
5<br />
13<br />
e T2 = X1 + X3<br />
2
a) stabilire se sono non distorti;<br />
b) ricavare l’errore quadratico medio di T1e di T2;<br />
c) quale tra i due stimatori è preferibile, e perchè?<br />
[R: T1e T2 non distorti; MSE(T1)=9λ/25, MSE(T2)=λ/2; è preferibile T1]<br />
<strong>Esercizi</strong>o 3.5 (Prof.ssa Mortera, 13-6-01) Il numero di clienti che si presentano<br />
ad uno sportello bancario in un giorno è descritto da una variabile casuale X con<br />
distribuzione di Poisson di parametro λ, cioè<br />
−λ λx<br />
f (x; λ) = e<br />
x!<br />
x > 0, λ > 0<br />
Al fine di stimare λ, è stato rilevato per cinque giorni il numero di clienti che si sono<br />
presentati a questo sportello e si è osservato: 10, 13, 8, 14, 12.<br />
a) Determinare lo stimatore di massima verosimiglianza di λ.<br />
b) Calcolarne la stima in corrispondenza del campione osservato.<br />
c) Lo stimatore di massima verosimiglianza trovato è consistente in media quadratica?<br />
Dimostrare.<br />
d) Definire la proprietà di consistenza di uno stimatore. Lo stimatore trovato è<br />
anche consistente?<br />
[R: � λML = X; x = 11.4; lo stimatore è consistente in media quadratica e consistente]<br />
<strong>Esercizi</strong>o 3.6 (Prof.ssa Mortera, 28-9-00) Un’impresa vuole valutare la durata<br />
media µ delle batterie prodotte nel proprio stabilimento. In un campione casuale di<br />
n=6 batterie si osservano le seguenti durate in ore:<br />
x1 = 10, x2 = 40, x3 = 25, x4 = 32, x5 = 27, x6 = 16.<br />
Nell’ipotesi che il tempo di vita X di ogni singola batteria segua una distribuzione<br />
esponenziale di parametro 1/µ, cioè abbia funzione di densità:<br />
f (x; µ) = 1<br />
µ e−x/µ<br />
x > 0<br />
a) determinare lo stimatore di massima verosimiglianza, L, per µ e ricavare il valore<br />
della stima sulla base del campione dato;<br />
b) dire se tale stimatore è corretto e consistente;<br />
c) considerare lo stimatore S= 3<br />
X e verificare la sua correttezza;<br />
4<br />
d) confrontare i due stimatori L e S utilizzando l’errore quadratico medio.<br />
[R: L=X; x = 25; L è non distorto e consistente; S è distorto; MSE(L)=µ 2 /n,<br />
MSE(S)=µ 2 (9 + n) /16n]<br />
<strong>Esercizi</strong>o 3.7 (Prof. Pieraccini, 20-02-01) In un campione di 100 piccole<br />
imprese si sono rilevate le seguenti spese annue per energia elettrica (in milioni):<br />
X 1-5 5-9 9-12 12-16 16-20 tot<br />
ni 2 37 32 28 1 100<br />
a) Costruire un intervallo di confidenza per la spesa media annua µ al livello di<br />
confidenza 0.90, sapendo che la varianza della popolazione risulta essere σ 2 = 9.<br />
14
) Quale deve essere la numerosità n del campione affinché l’intervallo calcolato al<br />
punto a) abbia lunghezza minore di 0.8?<br />
[R: (9.618; 10, 602) ; n ≥ 152]<br />
<strong>Esercizi</strong>o 3.8 (Prof.ssa Terzi, 19-7-00) Per un campione casuale di 14 ragazzi,<br />
sono stati osservati i seguenti pesi (in Kg):<br />
48, 46, 45, 47, 53, 50, 38, 49, 40, 43, 46, 38, 50, 41.<br />
Nell’ipotesi che tale campione provenga da una Normale, trovare l’intervallo di confidenza<br />
per la media µ (incognita) dell’intera popolazione, con α=0.05. [R: (42.6; 47.98)]<br />
<strong>Esercizi</strong>o 3.9 (Prof.ssa Mortera, 22-2-00) Supponiamo che X1, X2,...,Xn sia un<br />
campione casuale estratto da una popolazione X con distribuzione Normale di media µ<br />
incognita e varianza σ 2 nota. Quale deve essere la numerosità n del campione affinché<br />
sia possibile individuare un intervallo di confidenza per µ, al livello di confidenza 0.95,<br />
di lunghezza minore di 0.01σ? [R: n ≥ 153665]<br />
<strong>Esercizi</strong>o 3.10 (Prof.ssa Mortera, 3-7-00) In un campione di 500 famiglie,<br />
l’intervallo al 99% del reddito mensile medio (in milioni di lire) è dato da 2
in giorni diversi, sono stati ottenuti i seguenti ritardi in minuti: 12, 37, 23, 27, 19.<br />
Assumendo che i ritardi si distribuiscono come una variabile casuale Normale:<br />
a) verificare l’ipotesi che il ritardo medio sia superiore a 15 minuti, usando α=0.05;<br />
b) calcolare l’intervallo di confidenza al livello del 95% per il ritardo medio.<br />
[R: non rifiuto H0; (12.02; 35.18)]<br />
<strong>Esercizi</strong>o 3.15 (Prof.ssa Terzi, 3-7-00) Supponendo di voler verificare al livello<br />
α=0.10 l’ipotesi nulla che il voto medio riportato dagli studenti di Economia nell’esame<br />
di Statistica I sia pari a 27 contro l’ipotesi alternativa che sia pari a 25.5, quale dovrà<br />
essere la numerosità campionaria affinché la potenza del test risulti almeno pari a 0.95?<br />
Ai fini della soluzione si assume che la popolazione studentesca abbia una distribuzione<br />
Normale con varianza pari a 9. [R: n ≥ 35]<br />
<strong>Esercizi</strong>o 3.16 (Prof.ssa Mortera, 21–9-99) Una società telefonica dichiara<br />
che nel 1990 l’importo della bolletta bimensile pagata dagli abbonati privati ebbe una<br />
distribuzione con media 95 000 Lire e s.q.m. di 70 000 Lire.<br />
a) Se si estrae un campione di 50 bollette dagli elenchi degli abbonati del 1990,<br />
quale è approssimativamente la probabilità che la media campionaria degli importi sia<br />
maggiore di 100 000?<br />
b) Estraendo un campione di ampiezza 100, la probabilità di cui al punto a) sarebbe<br />
maggiore o minore? Perchè?<br />
c) Una agenzia per la protezione del consumatore estrae un campione di ampiezza<br />
100 ed osserva una media campionaria degli importi pari a 105 000. Si può concludere<br />
che l’importo medio bimensile pagato nel 1990 sia stato maggiore di 95 000? Usare un<br />
livello di significatività del 5%.<br />
[R: P(X>100000)� 0.3085; la probabilità al punto a) sarebbe minore; non rifiuto<br />
l’ipotesi nulla di importo medio bimensile uguale a 95000]<br />
<strong>Esercizi</strong>o 3.17 (Prof.ssa Terzi, 11-9-00) Per una popolazione Normale(µ,1), si<br />
vuole sottoporre a test l’ipotesi H0: µ=0 contro l’ipotesi alternativa H1: µ 52.90 � ∪ � X < 47.1 �� ; H1; 1 − β = 0.9049]<br />
<strong>Esercizi</strong>o 3.19 (Prof.ssa Terzi, 19-6-01) Per una popolazione Normale di varianza<br />
unitaria, si vuole fare un test d’ipotesi per verificare:<br />
H0 : µ = 12.7<br />
H1 : µ = 12<br />
16
Si decide di procedere nel seguente modo: si estrae un campione casuale di numerosità<br />
n=16 e se ne calcola la media campionaria. Se la media campionaria risulta minore di<br />
12.2 si rifiuta l’ipotesi H0.<br />
a) Calcolare α.<br />
b) Calcolare β.<br />
c) Supponendo di volere 1−β ≥ 0.9, quale dovrà essere la numerosità campionaria?<br />
[R: α = 0.02275; β = 0.21186; n ≥ 42]<br />
<strong>Esercizi</strong>o 3.20 (Prof.ssa Terzi, 19-6-01) Per una popolazione Normale di varianza<br />
=2 si vuole fare un test d’ipotesi per verificare:<br />
H0 : µ = 8<br />
H1 : µ = 8.5<br />
a) Posto α=0.07, sulla base di una numerosità campionaria n=25, trovare la regione<br />
critica.<br />
b) Supponendo di aver osservato una media campionaria pari a 8.2, cosa si conclude?<br />
c) Calcolare la potenza del test.<br />
d) Trovare la numerosità campionaria tale che la potenza risulti almeno pari a 0.98.<br />
[R: R: � X : X > 8.419 � ; non rifiuto H0; 1 − β = 0.6141; n ≥ 1306].<br />
<strong>Esercizi</strong>o 3.21 (Prof.ssa Terzi, 8-9-99) Data una popolazione Normale di varianza<br />
unitaria, si vuole sottoporre a verifica l’ipotesi H0: µ=10 contro H1: µ �=10,<br />
attraverso un campione casuale di n = 4 unità. Si adotta la seguente regola di decisione:<br />
A : si accetta H0 se 8 ≤ X ≤ 11.<br />
a) calcolare α.<br />
b) Calcolare la potenza del test per µ=11.<br />
[R: α = 0.02275; 1 − β = 0.5]<br />
<strong>Esercizi</strong>o 3.22 (Prof.ssa Terzi, 5-7-99) Si vuole sottoporre a verifica l’ipotesi<br />
H0: p=0.5 contro H1: p>0.5 per una popolazione bernoulliana di parametro p, sulla<br />
base di un campione di n = 5 elementi.<br />
a) Fissato α ≤ 0.2, trovare la regione critica.<br />
b) Calcolare la potenza del test per p=0.8.<br />
[R: R(α) = {�p : �p ≥ 0.8} ; 1 − β = 0.737]<br />
<strong>Esercizi</strong>o 3.23 (Prof.ssa Terzi, 1-10-98) In un campione di 1000 famiglie con<br />
5 figli, la distribuzione del numero di figli maschi è la seguente:<br />
n. maschi 0 1 2 3 4 5 tot<br />
n. famiglie 30 150 370 250 170 30 1000<br />
a) Sul totale dei figli, quale è la percentuale di femmine?<br />
b) Sia p la percentuale di femmine nella popolazione. Si vuole sottoporre a verifica<br />
l’ipotesi H0: p=0.5 contro l’alternativa H1: p�=0.5, con α=0.05. Individuare la regione<br />
di accettazione (A) del test, e indicare se si accetta o meno l’ipotesi H0.<br />
17
[R: �p = 0.506; A={�p : 0.486 < �p < 0.514} ; non si rifiuta H0]<br />
<strong>Esercizi</strong>o 3.24 (Prof.ssa Terzi, 16–7-01) Si sospetta che una moneta possa<br />
essere sbilanciata in maniera tale che l’uscita di Testa risulti più probabile dell’uscita<br />
di Croce. In particolare, si pensa che la probabilità che esca Testa possa essere 0.8.<br />
Si decide quindi di sottoporre a verifica l’ipotesi nulla che la moneta abbia due facce<br />
equi-probabili contro l’alternativa che la probabilità che esca Testa sia 0.8. Si decide<br />
di procedere nel seguente modo: si lancia la moneta 5 volte, se si ottiene Testa almeno<br />
4 volte si rifiuta l’ipotesi nulla. Calcolare la probabilità dell’errore di prima specie.<br />
Calcolare la potenza di questo test. [R: α = 0.1875; 1 − β = 0.7373].<br />
<strong>Esercizi</strong>o 3.25 (Prof.ssa Terzi, 3-7-00) Si sospetta che un dado possa essere sbilanciato<br />
in maniera tale che l’uscita di un numero pari risulti più probabile dell’uscita<br />
di un numero dispari. In particolare, si pensa che la probabilità che esca un numero<br />
pari sia 0.75. Si decide quindi di sottoporre a verifica l’ipotesi nulla che il dado sia ben<br />
bilanciato contro l’alternativa che la probabilità che esca un numero pari sia 3/4. Si<br />
decide di procedere nel seguente modo: si lancia un dado 5 volte, e se si ottiene una<br />
faccia pari almeno 4 volte si rifiuta l’ipotesi nulla. Calcolare la probabilità dell’errore<br />
di prima specie. Calcolare la potenza di questo test. [R: α = 0.1875; 1 − β = 0.6328]<br />
<strong>Esercizi</strong>o 3.26 (Prof.ssa Mortera, 28-9-00) La società Broglio decide di lanciare<br />
sul mercato un nuovo tipo di detersivo ”super-white”. A questo scopo viene<br />
inviato gratuitamente un flacone del nuovo detersivo a 150 persone chiedendo loro di<br />
provarlo e di dichiarare se saranno favorevoli o meno all’acquisto del suddetto prodotto.<br />
Di queste persone solo 30 dichiarano di essere interessate all’acquisto.<br />
a) Costruire un intervallo di confidenza al livello 1 − α = 0.7 per la proporzione di<br />
soggetti che acquisteranno il prodotto;<br />
b) verificare al livello α = 0.05 l’ipotesi nulla che la proporzione di soggetti che<br />
acquisteranno il prodotto sia superiore al 30%.<br />
[R: (0.166; 0.234) ; si rifiuta l’ipotesi nulla]<br />
<strong>Esercizi</strong>o 3.27 (Prof. Pieraccini, 24–6-96) Sia µ=5 la media di una popolazione<br />
Normale. Si vuole sottoporre a test l’ipotesi H0: σ 2 =1.5 contro l’alternativa<br />
bilaterale H1: σ 2 �=1.5.<br />
a) Trovare la regione critica del test per α=0.05.<br />
b) Avendo estratto il seguente campione: (3.1; 3.7; 5.5; 6.6; 4.8; 5.3; 3.1; 2.9; 8.1),<br />
per quale ipotesi si conclude?<br />
c) Trovare l’intervallo di confidenza per σ 2 .<br />
[R: R(α) = {�σ 2 : (�σ 2 ≤ 0.45) ∪ (�σ 2 ≥ 3.17)}; non si rifiuta H0; (0.359; 2.533)]<br />
<strong>Esercizi</strong>o 3.28 (Prof.ssa Terzi, 22-6-99) In 100 ristoranti di Roma, la voce<br />
“coperto” ammonta mediamente a 3 (migliaia di lire) con s.q.m. pari a 1. A Milano,<br />
invece, su un campione di 70 ristoranti, la voce “coperto” risulta mediamente pari a<br />
1, con s.q.m. pari a 4. Assumendo che le due popolazioni abbiano la stessa varianza,<br />
sottoporre a test l’ipotesi che le due medie siano uguali contro l’alternativa, unilaterale,<br />
che in media il “coperto” a Roma sia maggiore.<br />
a) Individuare la regione critica con α = 0.05.<br />
b) Individuare la regione critica con α = 0.01.<br />
18
c) Cosa si conclude nell’uno e nell’altro caso?<br />
[R: R(α) = � X − Y : X − Y > 0.69 � ;R(α) = � X − Y : X − Y > 0.98 � ; si rifiuta<br />
H0 in entrambi i casi]<br />
<strong>Esercizi</strong>o 3.29 (Prof. Pieraccini, 20–6-00) Un’indagine campionaria sul numero<br />
di sigarette fumate giornalmente, svolta tra studenti universitari, ha dato i seguenti<br />
risultati distinti per sesso:<br />
Campione Maschi Femmine<br />
Numerosità 81 62<br />
N. medio di sigarette 2.02 3.54<br />
Stima non distorta della varianza 22.70 22.81<br />
a) Sottoporre a test l’ipotesi di eguaglianza del numero medio di sigarette fumate<br />
dai due sessi al livello di significatività del 5%.<br />
b) Calcolare l’intervallo di confidenza al 95% per la differenza tra le due medie.<br />
[R: non si rifiuta H0; (−0.0575; 3.0975)]<br />
<strong>Esercizi</strong>o 3.30 (Prof. Pieraccini, 20–6-00) L’efficacia di una nuova cura dimagrante<br />
viene sperimentata su sei soggetti ottenendo i seguenti risultati:<br />
X 68 56 58 62 74 66<br />
Y 54 50 50 56 58 54<br />
(dove con X si è indicato il peso prima della cura e con Y quello dopo la stessa).<br />
Sottoporre a test l’ipotesi che la cura non abbia avuto effetto. [R: si rifiuta l’ipotesi<br />
nulla che la cura non abbia avuto effetto].<br />
<strong>Esercizi</strong>o 3.31 (Prof. Pieraccini, 20–6-00) I voti in Economia (X) ed in<br />
Statistica (Y) riportati da dieci studenti sono stati i seguenti:<br />
X 20 24 28 27 18 22 29 30 23 21<br />
Y 22 24 27 28 18 23 30 29 21 19<br />
Sotto l’assunzione di Normalità, sottoporre a test l’ipotesi di eguaglianza in media dei<br />
voti di Statistica a quelli di Economia sapendo che: Dev(X)=151.6, Dev(Y)=160.9,<br />
Cod(X,Y)=147.8. [R: non si rifiuta l’ipotesi nulla di uguaglianza in media dei voti]<br />
<strong>Esercizi</strong>o 3.32 (Prof. Pieraccini, 20–6-00) Un’indagine campionaria sul numero<br />
di sigarette fumate giornalmente svolta tra studenti universitari ha dato i seguenti<br />
risultati distinti per sesso:<br />
Campione Numerosità Frazione di fumatori<br />
Maschi 81 0.198<br />
Femmine 62 0.306<br />
a) Sottoporre a test l’ipotesi di eguaglianza della percentuale di fumatori fra gli<br />
studenti universitari maschi e femmine al livello di significatività del 5%.<br />
b) Calcolare l’intervallo di confidenza al 95% per la differenza tra le due percentuali.<br />
[R: non si rifiuta l’ipotesi nulla; (−0.25; 0.04)]<br />
19
<strong>Esercizi</strong>o 3.33 (Prof.ssa Mortera, 17–7-01) La seguente tabella riporta i furti<br />
commessi scoperti in un grande magazzino in un anno, a seconda del settore merceologico<br />
e dell’età del colpevole.<br />
Settore Età<br />
10-18 18-20 20-60<br />
Abbigliamento 312 913 3367<br />
Bigiotteria 710 377 208<br />
Profumi 248 211 341<br />
a) Sia p la probabilità che se un furto viene compiuto nel settore abbigliamento,<br />
l’età del colpevole sia 10-18. Costruire un intervallo di confidenza per p al 95%.<br />
b) Siano p1 e p2 le probabilità che il furto sia commesso nel settore dell’abbigliamento<br />
nell’ipotesi che il colpevole abbia rispettivamente età compresa nella classe 18-20 oppure<br />
20-60. Verificare l’ipotesi p1= p2 contro l’ipotesi alternativa p1 �= p2.<br />
[R: (0.0606; 0.0752) ; si rifiuta l’ipotesi nulla di uguaglianza delle probabilità]<br />
<strong>Esercizi</strong>o 3.34 (Prof. Pieraccini, 4–10-96) In un campione di 100 studenti<br />
maschi si sono rilevati i seguenti pesi:<br />
Peso (Kg) N. di studenti<br />
60-62 5<br />
63-65 18<br />
66-68 42<br />
69-71 27<br />
72-74 8<br />
Sottoporre a test l’ipotesi che i dati provengano da una distribuzione Normale. [R:<br />
non si rifiuta l’ipotesi nulla]<br />
<strong>Esercizi</strong>o 3.35 (Prof. Pieraccini, 3–7-00) La distribuzione dei pesi (X) dei<br />
portieri che hanno giocato nel campionato di calcio di serie A e B del 1998-99 è<br />
risultata la seguente:<br />
X n(X)<br />
83.5 3<br />
Si sottoponga a test l’ipotesi che i dati provengono da una distribuzione Normale. [R:<br />
non si rifiuta l’ipotesi nulla]<br />
<strong>Esercizi</strong>o 3.36 (Prof. Pieraccini, 20–6-00) In un pronto soccorso di un ospedale<br />
sono stati registrati il numero delle richieste di intervento giornaliere (X) su un<br />
arco di cento giorni, ottenendo la seguente distribuzione di frequenza:<br />
X 0 1 2 3 4 5 6 7 8 9 10<br />
n(X) 2 9 18 21 17 12 9 5 4 2 1<br />
20
Sapendo che il numero di interventi giornalieri per i quali il pronto soccorso è strutturato<br />
è uguale a 10, sottoporre a test l’ipotesi che la distribuzione osservata provenga<br />
da una distribuzione di Bernoulli. [R: si rifiuta H0]<br />
<strong>Esercizi</strong>o 3.37 (Prof. Pieraccini, 3–7-01) In 20 famiglie con 5 figli si è osservato<br />
il seguente numero di figli maschi:<br />
n. maschi 0 1 2 3 4 5<br />
n. famiglie 1 3 6 7 2 1<br />
Sottoporre a test l’ipotesi che la distribuzione delle famiglie secondo il numero di figli<br />
maschi segua una distribuzione Binomiale. [R: non si rifiuta l’ipotesi nulla]<br />
<strong>Esercizi</strong>o 3.38 (Prof. Pieraccini, 3–7-01) In un’impresa di soccorso stradale<br />
sono state registrate le richieste giornaliere di intervento su un arco di cento giorni<br />
ottenendo la seguente distribuzione di frequenza:<br />
n. interventi 0 1 2 3 4 5 6 7<br />
n. di giorni 14 22 31 17 8 5 2 1<br />
Sottoporre a test l’ipotesi che la distribuzione sia ben adattabile da una distribuzione<br />
di Poisson. [R: non si rifiuta l’ipotesi nulla]<br />
<strong>Esercizi</strong>o 3.39 (Prof.ssa Mortera, 8–2-00) Nell’isola Smeraldina, negli ultimi<br />
1000 giorni, sono arrivate delle navi, secondo la seguente tabella: 450 sono i giorni<br />
durante i quali non è arrivata alcuna nave, 360 i giorni durante i quali ne è arrivata<br />
una, 140 i giorni in cui ne sono arrivate due, 40 i giorni in cui ne sono arrivate tre, e<br />
10 i giorni in cui ne sono arrivate quattro. Questi dati sono conformi con l’ipotesi che<br />
la distribuzione del numero di arrivi sia una variabile casuale di Poisson? Usare un<br />
livello di significatività dell’1%. [R: non si rifiuta H0]<br />
<strong>Esercizi</strong>o 3.40 (Prof.ssa Mortera, 22–2-99) Per esaminare come vengono utilizzati<br />
i quattro ingressi di un grande supermercato si osserva un campione casuale di<br />
130 persone e risulta:<br />
Ingresso 1 2 3 4<br />
n.persone 24 36 30 40<br />
Si verifichi l’ipotesi che i quattro ingressi vengono utilizzati con la stessa intensità [R:<br />
non si rifiuta H0]<br />
<strong>Esercizi</strong>o 3.41 (Prof. Pieraccini, 3–7-01) Lanciando 240 volte un dado si sono<br />
ottenuti i seguenti punteggi:<br />
Punteggio 1 2 3 4 5 6<br />
Frequenza 27 45 35 46 34 53<br />
Sottoporre a test l’ipotesi che il dado non sia truccato, cioè che i punteggi siano<br />
equidistribuiti. [R: non si rifiuta H0 con α = 0.025, mentre si rifiuta H0 con α = 0.05]<br />
21
<strong>Esercizi</strong>o 3.42 (Prof. Pieraccini, 5-7-99) La distribuzione dei matrimoni celebrati<br />
in Italia secondo lo stato civile è risultata la seguente:<br />
Stato civile delle spose<br />
Stato civile degli sposi Nubili Vedove Divorziate<br />
Celibi 301.933 1.138 2.200<br />
Vedovi 3.964 1.286 577<br />
Divorziati 4.571 330 954<br />
Si controlli l’esistenza di una dipendenza assoluta fra i due caratteri e si commenti il<br />
risultato ottenuto. [R: si rifiuta l’ipotesi nulla di indipendenza].<br />
<strong>Esercizi</strong>o 3.43 (Prof.ssa Mortera, 13-6-01) Ad un campione di 80 giovani in<br />
età compresa tra 25 e 35 anni è stato chiesto se sono laureati e se hanno un’occupazione.<br />
Il risultato della rilevazione è contenuto nella tabella seguente:<br />
Stato occupazionale<br />
Titolo di studio Occupato Disoccupato<br />
Laureato 22 8 30<br />
Non laureato 16 34 50<br />
38 42 80<br />
a) C’è dipendenza o indipendenza tra il titolo di studio e lo stato occupazionale?<br />
Usare l’indice opportuno.<br />
b) Valutare se c’è indipendenza anche mediante l’opportuno test statistico.<br />
c) Lasciando inalterata la marginale del titolo di studio, costruire la tabella di<br />
massima dipendenza. [R: χ 2 = 12.845; si rifiuta l’ipotesi nulla di indipendenza]<br />
22
4 <strong>Esercizi</strong> sulla regressione<br />
<strong>Esercizi</strong>o 4.1 (Prof.ssa Terzi, 1-10-98) In 5 famiglie sono stati rilevati i seguenti<br />
redditi (X) e risparmi (Y):<br />
X 80 110 90 60 60<br />
Y 16 18 21 27 35<br />
a) determinare l’equazione della retta di regressione di Y su X;<br />
b) stimare il presumibile valore del risparmio per una famiglia con reddito pari a<br />
50: � Y(50);<br />
c) determinare il valore del coefficiente di correlazione rxy.<br />
[R: � Y=45-0.27X; � Y(50)=31.5; rxy = −0.75]<br />
<strong>Esercizi</strong>o 4.2 (Prof.ssa Terzi, 11-9-00) Per due variabili statistiche X e Y si<br />
hanno le seguenti coppie di osservazioni:<br />
X 1 3 4 7 8 10<br />
Y 5 4.9 4.5 3 2.2 2<br />
Stimare i parametri della retta di regressione Y=a +bX e valutarne la bontà di adattamento<br />
tramite l’indice R 2 . Posto poi che si osservi X=12, sulla base della retta stimata,<br />
qual’è il presumibile valore della Y?[R: �a = 5.75, � b = −0.39; R 2 = 0.94; � Y(12)=1.07]<br />
<strong>Esercizi</strong>o 4.3 (Prof. Pieraccini, 1–2-96) Per una distribuzione doppia si è<br />
stimata la retta di regressione � Xi=10-2Yi. Individuare quale, fra le seguenti, è la<br />
possibile equazione della retta di regressione di Y su X e motivare la scelta:<br />
a) � Yi= 4+0.4Xi<br />
b) � Yi= -7-0.8Xi<br />
c) � Yi= -3-0.4Xi<br />
d) � Yi= 0.8+0.5Xi.<br />
<strong>Esercizi</strong>o 4.4 (Prof.ssa Terzi, 1-10-98) La regressione di Y su X ha fornito la<br />
seguente retta dei minimi quadrati: � Y=13-1.5X, mentre quella di X su Y ha fornito:<br />
�X=31/6-(1/6)Y. Si determinino il coefficiente di correlazione rxy e le due medie M1 (X)<br />
e M1 (Y ) . [R: rxy = −0.5; M1 (X) = 4; M1 (Y ) = 7]<br />
<strong>Esercizi</strong>o 4.5 (Prof.ssa Mortera, 2-2-01) Su una variabile statistica doppia<br />
(X,Y) si sono stimate le seguenti equazioni delle rette di regressione:<br />
�Y = −0.3 + 1.6X,<br />
� X = 0.84 + 0.4Y.<br />
Determinare il coefficiente di correlazione lineare, la media di X e quella di Y. Sapendo<br />
poi che la media quadratica di X è pari a 4.36, determinare la media e la varianza<br />
della variabile Z=2X-4Y+1. [R: rxy = 0.8; M1 (X) = 2; M1 (Y ) = 2.89; M1 (Z) =<br />
−6.56, var (Z) = 636.42]<br />
<strong>Esercizi</strong>o 4.6 Data la variabile statistica doppia (X,Y), per cui è noto che X ha<br />
varianza doppia rispetto a Y, e data la variabile Z=Y+2, determinare il valore del<br />
23
apporto α1/β1, in cui α1 e β1 sono i coefficienti angolari delle rette di regressione di<br />
X su Z e di Z su X rispettivamente:<br />
[R: α1/β1 = 2]<br />
X = α0 + α1Z, Z = β0 + β1X.<br />
<strong>Esercizi</strong>o 4.7 Data la variabile statistica doppia (X,Y), si sono stimati i parametri<br />
della retta di regressione di X su Y, il cui coefficiente angolare è risultato uguale al<br />
coefficiente di correlazione lineare. Sappiamo inoltre che la variabile Z=2Y ha varianza<br />
pari a 36. Calcolare la varianza di X e individuare il campo di valori accettabili per<br />
la covarianza tra X e Y. [R: var(X)=9; σxy ∈ (−9, 9)]<br />
<strong>Esercizi</strong>o 4.8 Data la variabile statistica doppia (X,Y), per cui è noto che var(X)=81var(Y),<br />
indicare quali tra i seguenti valori del coefficiente angolare della retta di regressione di<br />
X su Y:<br />
−2, 0, 15<br />
non sono accettabili, motivando la risposta fornita. [R: il valore 15 non è accettabile].<br />
<strong>Esercizi</strong>o 4.9 (Prof.ssa Mortera, 19–6-00) Al fine di stabilire se esiste una<br />
relazione statistica tra l’altezza degli alberi di ciliegie (X) ed il diametro medio delle<br />
ciliegie prodotte (Y), si considerino le osservazioni della seguente tabella:<br />
Diametro (cm.) 3.4 4.3 3.0 3.2 2.1<br />
Altezza (m.) 5.5 6.0 5.6 5.1 4.5<br />
a) Calcolare la retta di regressione di Y su X. Stabilire se X e Y sono: incorrelate,<br />
correlate positivamente oppure correlate negativamente.<br />
b) Calcolare la devianza residua, la devianza spiegata e l’indice di accostamento<br />
lineare.<br />
c) Si preveda, sulla base della relazione trovata al punto a), il diametro delle ciliegie<br />
prodotte da un albero di altezza 3.5. Commentare il risultato.<br />
d) Costruire l’intervallo di confidenza per β1 con livello di confidenza del 95% e<br />
verificare l’ipotesi H0:β1=0 contro l’alternativa H1:β1 �=0 (con α=0.05).<br />
e) Si esprima l’altezza delle piante in centimetri e si indichi con W la corrispondente<br />
variabile statistica. Senza rifare i calcoli, a partire dai parametri della funzione di<br />
regressione trovata al punto a), determinare la funzione di regressione lineare di Y su<br />
W.<br />
[R: � Y = 1.26x − 3.53, σxy = 0.326; Dres = 0.449, Dtot = 2.5, R 2 = 0.82; � Y (3.5) =<br />
0.88; (0.18; 2.34) , si rifiuta l’ipotesi nulla di indipendenza lineare; � Y = 0.0126w − 3.53]<br />
<strong>Esercizi</strong>o 4.10 (Prof. Pieraccini, 24–6-96) In un campione di 12 famiglie si<br />
sono rilevati i pesi del padre (X) e del figlio primogenito (Y) qui di seguito riportati:<br />
X 75 73 77 74 78 72 80 76 78 77 79 81<br />
Y 78 76 78 75 79 76 78 75 81 77 78 80<br />
a) Stimare i parametri della retta di regressione della Y sulla X e calcolarne l’R 2 .<br />
24
) Nell’ipotesi di normalità della componente accidentale, sottoporre a test le due<br />
ipotesi α=0 e β=1 e commentare i risultati.<br />
[R: � Y = 38.48 + 0.51x, R 2 = 0.46; si rifiuta l’ipotesi nulla di assenza di intercetta,<br />
si rifiuta l’ipotesi nulla di coefficiente di regressione unitario]<br />
<strong>Esercizi</strong>o 4.11 (Prof. Pieraccini, 10–9-01) In un campione di 15 famiglie si è<br />
rilevato il reddito annuo e la spesa per generi alimentari:<br />
Reddito 25 40 20 32 60 18 24 42 45 36 15 21 34 25 58<br />
Spesa 8.0 11.4 6.5 9.6 16.2 6.0 7.5 12.0 15.0 12.2 6.0 7.5 10.0 8.0 14.1<br />
a) Si stimino i parametri della retta di regressione della spesa per alimenti in<br />
funzione del reddito netto annuo e si determini la bontà di adattamento della relazione<br />
stimata;<br />
b) si verifichi l’ipotesi di indipendenza lineare fra le due variabili ad un livello di<br />
significatività del 5%;<br />
c) si verifichi inoltre, per la retta stimata, l’ipotesi di passaggio per l’origine;<br />
c) si calcoli l’intervallo di confidenza per la spesa alimentare nel caso in cui il reddito<br />
sia di 58 milioni e nel caso in cui esso sia di 32 milioni.<br />
[R: � Y = 2.41 + 0.23x, R 2 = 0.93; si rifiuta l’ipotesi di indipendenza lineare; si<br />
rifiuta l’ipotesi di passaggio per l’origine; (14.67; 16.83) ; (9.26; 10.28)]<br />
<strong>Esercizi</strong>o 4.12 (Prof. Pieraccini, 3–7-00) In una indagine campionaria si sono<br />
rilevati i seguenti dati sulla superficie in ettari (X) e sul rendimento in q/ha (Y) di 10<br />
aziende cerealicole:<br />
(3, 27) (2, 26) (4, 30) (3, 28) (4, 32)<br />
(2, 30) (6, 33) (5, 29) (4, 31) (6, 31)<br />
Si verifichi al livello di significatività del 5% l’ipotesi di indipendenza lineare del rendimento<br />
dalla dimenzione aziendale contro l’ipotesi alternativa più opportuna. [R: si<br />
rifiuta l’ipotesi di indipendenza lineare]<br />
<strong>Esercizi</strong>o 4.13 (Prof.ssa Mortera, 28–6-01) “La torre di Pisa che pende che<br />
pende...”. Prima che la torre venisse chiusa, era stata condotta, con frequenza trimestrale,<br />
una rilevazione statistica sull’incremento dell’inclinazione della torre. Sia Y=<br />
“pendenza” X= “tempo” e Z=“cm di pioggia caduti su Pisa”. Sono state stimate le<br />
seguenti relazioni lineari:<br />
A : � Y = 3x + 0.5<br />
B : � Y = 3z + 0.5<br />
per le quali l’output di computer è risultato:<br />
Stima di β1 t p Dev. spiegata Dev(Y)<br />
Modello A 3 2.896 0.02 2.025 2.25<br />
Modello B 3 0.13 0.90 0.0225 2.25<br />
25
a) Per entrambi i modelli A e B, calcolare R 2 e Devianza residua.<br />
b) Confrontare i due modelli commentando i dati della tabella (t e p) e i risultati<br />
ottenuti in a).<br />
c) Dato il modello di regressione lineare Yi = β0 +β1Xi +εi, considerando le ipotesi<br />
assunte riguardo all’errore ε, quali delle seguenti affermazioni sono vere?<br />
� A E (εi) = β0, V ar (εi) = σ 2 e cov (εi, εj) = 0<br />
� B E (Yi| xi) = β0 + β1xi, V ar (εi) = σ 2 e E (εi · εj) = 0<br />
� C E (Yi| xi) = β0 + β1xi, V ar (Yi| xi) = σ2<br />
n e cov (εi, εj) = 0<br />
� D E (εi) = 0, V ar (εi) = σ 2 e ρ (εi, εj) = 0.<br />
[R: modello A: Dres = 0.225, R 2 = 0.9; modello B: Dres = 2.2575, R 2 = 0.01]<br />
<strong>Esercizi</strong>o 4.14 (Prof. Pieraccini, 5–2-01) Si considerino i seguenti dati relativi<br />
al numero di ore di studio (X) di un campione casuale di 8 studenti per la preparazione<br />
dell’esame di statistica ed il voto (Y) riportato:<br />
X 100 95 100 80 75 150 130 160<br />
Y 24 22 21 20 18 30 28 30<br />
Nell’ipotesi di normalità delle distribuzioni condizionate:<br />
a) trovare la retta di regressione delle votazioni riportate sulle ore di studio;<br />
b) sottoporre a test l’ipotesi β = 0 contro l’alternativa β > 0;<br />
c) trovare l’intervallo di previsione per il punteggio di uno studente che abbia<br />
studiato 110 ore per la preparazione dell’esame.<br />
[R: � Y = 8.55 + 0.14x; si rifiuta l’ipotesi di indipendenza lineare; (21.02; 26.88)]<br />
<strong>Esercizi</strong>o 4.15 (Prof. Pieraccini, 20–6-00) Si siano osservate le seguenti coppie<br />
di valori per le variabili X e Y:<br />
X 1 3 4 6 8 9 11 14<br />
Y 1 2 4 4 5 7 8 9<br />
Determinare l’equazione della retta che esprime la Y in funzione della X e calcolare<br />
gli intervalli di confidenza per i valori interpolati. Rappresentare sul piano cartesiano<br />
i punti osservati, la retta interpolante e gli intervalli di confidenza. [R: � β0 = 0.548,<br />
�β1 = 0.636; intervalli di confidenza: per � Y1: (0.179; 2.189) , per � Y2: (1.665; 3.247), ecc]<br />
<strong>Esercizi</strong>o 4.16 (Prof. Pieraccini, 20–6-00) I voti in Economia (X) ed in<br />
Statistica (Y) riportati da 10 studenti sono stati i seguenti:<br />
X 20 24 28 27 18 22 29 30 23 21<br />
Y 22 24 27 28 18 23 30 29 21 19<br />
Sapendo che Dev(X)=151.6, Dev(Y)=160.9, Cod(X,Y)=147.8, determinare l’intervallo<br />
di previsione per il voto in Statistica di uno studente che abbia preso 23 nell’esame di<br />
Economia, sotto l’assunzione di Normalità della componente accidentale. [R: (19.32; 26.54)]<br />
<strong>Esercizi</strong>o 4.17 Negli anni 1987-1993, l’ascolto di televisione (Y) nella fascia 19-20<br />
ha avuto il seguente andamento (dati Auditel, in milioni di ascoltatori):<br />
Anno 1987 1988 1989 1990 1991 1992 1993<br />
Y 0.7 0.8 0.9 1.1 1.4 1.6 2.0<br />
26
Interpolare tale distribuzione con una funzione di tipo Y=ab t e sulla base di questo<br />
modello prevedere il numero di ascoltatori (in milioni) per l’anno 1996. [R: �a = 0.66,<br />
� b = 1.20; � Y (1996) = 3.4]<br />
<strong>Esercizi</strong>o 4.18 (Prof.ssa Terzi, 5–7-99) Per le seguenti 5 coppie di osservazioni:<br />
X 1 2 3 4 5<br />
Y 1 5 8 15 28<br />
si vuole interpolare la Y con la funzione Y=c0+c1X 2 .<br />
a) calcolare i parametri c0 e c1;<br />
b) valutare la bontà di adattamento di tale funzione.<br />
[R: �c0 = −0.546, �c1 = 1.086; R 2 = 0.98]<br />
<strong>Esercizi</strong>o 4.19 (Prof.ssa Terzi, 8–9-99) Date le seguenti coppie di osservazioni:<br />
X 1 2.5 3 3.5 5<br />
Y 3 19 29 41 87<br />
a) interpolare con la funzione Y=a+bX 2 ;<br />
b) confrontare il danno (=somma dei quadrati dei residui) che si ha interpolando<br />
con tale parabola con il danno che si ha interpolando con la retta Y=a+bX.<br />
[R: �a = −2.078, � b = 3.54; Dres (X 2 ) = 4.05, Dres (X) = 238.7]<br />
<strong>Esercizi</strong>o 4.20 (Prof. Pieraccini, 1–2-96) Date le seguenti coppie di valori (X,<br />
Y):<br />
(3, 5) (6, 12.5) (9, 14) (15, 35) (25, 65)<br />
sulla base dei quadrati dei coefficienti di correlazione individuare quale di queste<br />
due funzioni<br />
a) Y=a1+b1X<br />
b) Y=a2+b2X 2<br />
approssima meglio la relazione esistente tra X e Y, e stimarne i parametri. Nell’ipotesi<br />
di Normalità della componente accidentale, sottoporre a test l’ipotesi b=0. [R: si<br />
adatta meglio la funzione a), con R 2 = 0.984; si rifiuta l’ipotesi nulla di indipendenza<br />
lineare].<br />
27