Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

Ranking – En rangordning af (i dette tilfælde) poster i et søgeresultat. Efter

forudbestemte kriterier.

Performance – Et informationssøgningssystems evne til at skelne mellem

relevante og irelevante poster, og ranke dem efter relevans, i forhold til et

givet informationsbehov, udtrykt ved en søgeforespørgsel.

5.2.3 Litteratur

Denne undersøgelse bygger til dels videre på tidligere erfaringer med

klyngealgoritmer og query expansion (Andersen & Tronhus, 2005; Tronhus M.

, 2006; Andersen, Tronhus, & Johansen, 2007), evaluering af best‐match

algoritmer (Andersen & Svendsen, 2008), samt tags anvendelighed til query

expansion (Tronhus, 2008). Derfra stammer et kendskab til grundlæggende

litteratur om de nævnte emner. Denne er til nærværende undersøgelse blevet

suppleret med relevant litteratur, der hvor det har været nødvendigt

yderligere at dokumentere de valgte metoders anvendelighed, samt for at

argumentere for valget af de anvendte metoder frem for andre.

Baggrundslitteraturen kan opdeles i fire hovedområder, nemlig

klyngeanalyse, query expansion, bruger‐ og relevansstudier og evaluering af

genfindingssystemer. I det følgende vil der kort blive nævnt hvilken litteratur

det drejer sig om, og hvordan den er blevet anvendt til dette projekt.

Som baggrundslitteratur for klyngeanalyse er især anvendt Spärck Jonesʹ bog

ʺAutomatic keyword classification for information retrievalʺ (Spärck Jones, 1971),

van Rijsbergens oversigtsværk ʺInformation Retrievalʺ (van Rijsbergen, 1979),

og som baggrund for dem Saltons vektorrumsmodel (Salton, 1971; Salton,

Wong, & Yang, 1975). Derudover anvendes Peat & Willet (1991), Voorhees

(1985), Willett (1988) og Ahlgren, Jarneving & Rousseau (2003).

Efthimiadisʹ oversigtsartikel (Efthimiadis, 1996) fungerer som central

baggrundslitteratur for query expansion, da den leverer en omfattende

oversigt over litteraturen omkring query expansion op til

udgivelsestidspunktet. Artiklen er suppleret af mere primære kilder som for

eksempel Elkalifa (1991), Jing & Croft (1994) og Abdelali, Cowie & Soliman

(2007).

Som udgangspunkt for brugerstudier anvendes Borlunds simulated work

tasks (Borlund, 2000), mens studierne i relevans især tager udgangspunkt i

Saracevic (1996) og Swanson (1986), mens Ingwersen & Järvelin (2005)

anvendes som generel videnskabsteoretisk oversigt, blandt andet omkring

relevansbegrebet.

5 ‐ Metode Side 23

More magazines by this user
Similar magazines