25.12.2012 Views

Dispense

Dispense

Dispense

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2.3. TEST STATISTICI 131<br />

Precisazioni sulla statistica del test<br />

Un test è un algoritmo. L’input è il campione sperimentale e l’ipotesi H0. l’output è il valore<br />

della statistica del test, o un passo oltre il p-value. Indichiamo genericamente con z il valore<br />

della statistica del test (era x nell’esempio).<br />

Esempio 65 Un politico a¤erma che il 65% della popolazione è con lui, preferisce cioè l’alternativa<br />

A alla B. Sospettiamo che abbia torto. Chiediamo allora a 100 persone ed osserviamo<br />

che solo 47 preferiscono A a B. Dobbiamo confrontare l’ipotesi nulla H0=“il 65% preferisce<br />

A a B”col campione. Abbiamo bisogno di un algoritmo che, presi i numeri 65, 47, 100 restituisca<br />

un risultato, la statistica del test, che indichiamo con z. Un esempio banale potrebbe<br />

essere l’errore relativo<br />

z =<br />

65 47<br />

65<br />

che però non tiene conto della numerosità del campione (è certo diverso chiedere a 10, a 100<br />

o a 1000 persone).<br />

Possiamo pensare che z sia aleatoria (si pensi a ripetere il campionamento), per cui sarebbe<br />

meglio usare la notazione Z. La v.a. Z è più propriamente chiamata statistica del test, ed<br />

ha una sua distribuzione di probabilità. Supponiamola descritta da una densità f (z).<br />

Più precisamente, se H0 vale, allora Z ha densità fH0 (z). Se invece vale una certa ipotesi<br />

alternativa H0 1 , Z avrà un’altra densità fH0 (z). Queste frasi spiegano l’idea ma non sono<br />

1<br />

molto precise, o almeno non universali. Dipende se le ipotesi sono così precise da identi…care<br />

una densità oppure sono vaghe. Un’ipotesi del tipo: la v.a. è gaussiana di media 3 e varianza<br />

24 è precisa; mentre un’ipotesi del tipo: la v.a. è gaussiana di media 6= 3 e varianza 24 non<br />

identi…ca una densità. In questo caso, se abbiamo bisogno di una densità anche per l’ipotesi<br />

alternativa, questa va frammentata in sottoipotesi precise.<br />

Introdotti questi concetti preliminari, il problema è: come si conclude, sulla base del<br />

valore sperimentale z, se H0 è falsa?<br />

Basta calcolare la probabilità che Z assuma valori più estremi di z, probabilità secondo<br />

la densità fH0 (z) (il p-value).<br />

C’è però un’alternativa: prescrivere a priori un valore piccolo di probabilità , es. 5%,<br />

che identi…ca una coda (o due code) con tale probabilità; fatto questo, si va a vedere se z<br />

cade nella coda o no. Se cade nella coda, si ri…uta H0.<br />

Se z cade nella coda, signi…ca che sperimentalmente abbiamo osservato un accadimento<br />

che aveva probabilità molto piccola di accadere, secondo fH0 (z). Siccome questo era improbabile<br />

(relativamente al valore piccolo di probabilità pre…ssato), riteniamo che il campione<br />

che ha prodotto quel valore di z non potesse provenire dalla v.a. di densità fH0 (z).<br />

Possiamo quindi o calcolare la probabilità della coda identi…cata da z oppure decidere la<br />

coda a priori e vedere se z ci cade dentro.<br />

2.3.4 Errori di prima e seconda specie; signi…catività e potenza di un test<br />

Supponiamo di aver sviluppato un test per valutare la validità di un’ipotesi. Il test non è<br />

infallibile. Ri…utiamo l’ipotesi H0 se z cade nelle code; ma, quando l’ipotesi H0 è valida, z

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!