20.04.2015 Views

Lucidi modulo Data Mining

Lucidi modulo Data Mining

Lucidi modulo Data Mining

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Riassumere i dati mediante<br />

semplici statistiche<br />

<br />

Confronto tra diversi indici di tendenza centrale<br />

la moda è l’indice meno informativo in quanto, essendo<br />

calcolato sulle frequenze, prescinde totalmente dalla<br />

natura numerica dalle osservazioni,<br />

<br />

<br />

fornisce conoscenza sul dato che ha la maggiore<br />

probabilità di presentarsi<br />

la mediana è più informativa della moda e considera anche<br />

l’ordine tra le osservazioni<br />

utilizzata per suddividere la distribuzione in parti uguali<br />

vantaggio di non essere influenzata da grandi differenze<br />

quantitative tra i dati, ma solo dalla posizione<br />

la media è l’indice più informativo in quanto considera<br />

anche la distanza tra le osservazioni<br />

si utilizza per esprimere un concetto di equidistribuzione<br />

Riassumere i dati mediante<br />

semplici statistiche<br />

<br />

Altre misure di posizione dei dati individuano diverse<br />

regioni dalla distribuzione dei valori dei dati<br />

percentili o centili: valori al di sotto dei quali si trova una<br />

determinata percentuale della distribuzione dei dati<br />

<br />

i quartili separano i dati in 4 parti uguali<br />

<br />

<br />

<br />

25° percentile o primo quartile (la mediana della parte<br />

inferiore dei dati)<br />

50° percentile mediana<br />

75° percentile o terzo quartile (la mediana della parte<br />

superiore dei dati)<br />

38

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!