Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

løbende publiceret negative resultater, som har demonstreret metodernes

mangler. Nogle af disse kritikpunkter er kontekstafhængige, andre er

generelle for de problemer der er med disse metoder (Efthimiadis, 1996).

Nogle af de centrale kritikpunkter af klyngeanalysen som metode til query

expansion er valget af lighedsmål, der som regel er baseret på termfrekvens på

én eller anden måde (Peat & Willett, 1991), samt samlingernes heterogenitet

(Elkalifa, 1991). Elkalifas Ph.D. afhandling viser, at opdelingen af en samling i

homogene delsamlinger giver klart forbedrede resultater, omend han selv kun

anvender en meget begrænset datamængde.

En anden fremgangsmåde ses i Inquery systemet, der anvender en

associations tesaurus til at tilføje fraser til den oprindelige søgeforespørgsel.

Systemet er testet af bl.a. Broglio, Callan, Croft & Nachbar (1995) og Jing &

Croft (1994), der finder, at systemet giver en forbedret retrieval performance.

Nyere forskning i query expansion ved hjælp af videnstrukturer anvender

gerne latent semantisk indeksering som alternativ til klyngeanalyse, f.eks.

Abdelali, Cowie & Soliman (2007).

Query modifikation baseret på videnstrukturer udenfor samlingen

At basere query expansion på vidensstrukturer der er uafhængige af den

samling systemet arbejder på, involverer en tilegnelse af disse strukturer. Hvis

det skal gøres automatisk, kræver det at systemet involverer elementer udefra

i sin etablering af disse strukturer. Dermed kan strukturerne ikke længere

siges at være uafhængige af samlingen, og deraf følger, at query expansion

baseret på eksterne vidensstrukturer ikke kan være rent automatiske, og

dermed ikke er relevante for dette speciale.

Siden de noget negative rapporter fra Efthimiadis blev publiceret i 1996, er der

dog sket en del med området. Som eksempel på noget af det nyere inden for

query expansion kan nævnes for eksempel at basere udvidelsen på logfiler af

brugeres søgeadfærd i systemet. Cui, Wen, Nie & Ma (2002) har demonstreret

en god performanceforbedring ved denne metode, dog har deres

udgangspunkt været internetsøgninger, i stedet for søgning i mere

begrænsede databaser (Cui, Wen, Nie, & Ma, 2002).

En anden, omtrent lige så optimistisk, forskningsretning repræsenteres her af

Carpineto, de Mori, Romano & Bigi (2001) der rapporterer fra en TREC‐

konference, hvor en stor del af de tilstedeværende projekter har fundet

potentiale i en model der baserer query expansion på en automatisk

emneudtrækning fra de højest rangerede dokumenter i det indledende

søgeresultat (Carpineto, de Mori, Romano, & Bigi, 2001).

Uanset, at det tilsyneladende har været problematisk at skaffe endegyldigt

bevis for at query expansion producerer brugbare resultater, i hvert tilfælde

indtil 1996 (1996), er det et emne der stadig bliver gjort til genstand for

4 ‐ Review Side 13

More magazines by this user
Similar magazines