Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

Figur 6.16 ‐ Frekvens af klynger inddelt efter klyngekvalitet (Q)

Af Figur 6.15 ses, at der ikke tilsyneladende er nogen sammenhæng mellem

klyngernes størrelse og kvalitet (Værdien for n=8 kan ikke medregnes, da der

kun er én måling), mens Figur 6.16 viser, at data tilsyneladende ikke er

normalfordelte, men derimod fortrinsvis befinder sig i to store grupper i hver

sin ende af spektret. For at tydeliggøre, at der ikke er tale om normalfordelte

data, vises her et Q‐Q plot for klyngekvaliteten:

Figur 6.17 ‐ Q‐Q plot for observerede værdier af Q og forventede normalværdier af Q

Da der tydeligvis ikke er tale om normalfordelte data, er det ikke muligt at

anvende en almindelig 1‐sample T‐test til at teste H30, men i stedet må der

anvendes en binomial test, hvor stikprøven inddeles i to grupper,

indeholdende værdierne henholdsvis over og under testværdien.

Nulhypotesen er, som anført i afsnit 5.4.6:

6 ‐ Analyse Side 79

More magazines by this user
Similar magazines