Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

haft siden starten. Løsningsforslaget var latent semantisk indeksering (LSI),

hvor man gennem matrixmanipulationer identificerer latente dimensioner, og

anvender disse som grundlag for genfindingen i stedet for de oprindelige

term×dokument matricer. Dette skulle muliggøre genfinding på begrebsniveau,

idet de fundne latente dimensioner opfattes som udtryk for de underliggende

begreber i sproget. Dette er en metode, der har trukket en stor mængde

forskning efterfølgende, og som desuden er blevet udvidet til at involvere

probabilistiske elementer (Hofmann, 1999).

Siden 2000 har det primære fokus for forskningen indenfor klyngeanalyse

været koncentreret omkring udvikling af algoritmer, der kan håndtere store

mængder data. Det betyder, at forskningen har grupperet sig i to retninger. En

retning der arbejder med at udvikle bedre k‐means algoritmer (Modha &

Spangler, 2007), og en der arbejder videre med de hierarkiske metoder, men

hvor fokus er på hvilke data der ligger til grund for klyngeanalysen (Tombros,

Villa, & van Rijsbergen, 2002). Det er desuden blevet påvist, at de gammeldags

hierarkiske metoder kan skaleres til store datamængder og stadig være

håndterbare i forhold til runtime (Cathey, Jensen, Beitzel, Frieder, &

Grossman, 2007).

4.3 Evaluering af genfindingssystemer

Af Jens Peter Andersen

Som det er antydet i indledningen til dette speciale, kan genfindingssystemer,

og deres evaluering spores tilbage til de allerældste biblioteker (Singhal, 2001),

men efterhånden som genfindingssystemerne har udviklet sig, er deres

evaluering fulgt med. Den type evaluering, der vil blive brugt i dette speciale,

og dermed beskrevet i dette review, er den type, der har med evaluering af

elektroniske genfindingssystemer at gøre.

4 ‐ Review Side 15

More magazines by this user
Similar magazines