Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

allerede fundne, relevante, men til gengæld ikke finder dokumenter fra f.eks.

andre forskningsfronter.

En lignende fremgangsmåde blev forsøgt med CITE systemet, der blev

designet som et relevance‐feedback interface til Medline. På baggrund af

brugerens relevansvurderinger blev den originale søgeforespørgsel udvidet

med MeSH tesaurustermer der var tilknyttet de relevante dokumenter

(Efthimiadis, 1996). Metoden minder meget om Rocchios metode, med den

forskel, at CITE anvendte kontrollerede emneord.

OKAPI er et andet eksempel på et relevance‐feedback system, men anvendte

derudover en automatisk udvidelse af søgeforespørgslen med synonyme

termer, hvorved semi‐automatiske og fuldautomatiske query modifikations

metoder blev kombineret (Fieldhouse & Beaulieu, 1994; Efthimiadis, 1996).

En helt anden måde at foretage query expansion på term‐niveau er ved at

gruppere termer på baggrund af deres morfologiske former, f.eks. ved hjælp

af stemming. Harman har undersøgt tre forskellige stemmingalgoritmer på

Cranfield 1400 og to andre systemer, og finder, at ingen af de tre algoritmer

gav en signifikant forøgelse i retrieval performance (Harman, 1991).

Nyere forskning fokuserer primært på den type query expansion, der

beskrives nedenfor, men den term‐baserede query expansion er stadig

genstandsfelt for undersøgelser. Query expansion på term‐niveau er f.eks.

blevet sammenlignet med (pseudo‐)relevance‐feedback for både korte og

lange passager, hvor det har vist sig, at expansion af enkelttermer giver langt

bedre resultater end forventet (Diaz & Allan, 2005). Rocchios oprindelige

relevance‐feedback model er også stadig et emne for diskussion, f.eks. i

sammenhæng med latent semantisk indeksering (Efron, 2008).

Query expansion baseret på videnstrukturer i en samling

I modsætning til term‐baseret query expansion er query expansion baseret på

en samlings videnstruktur ikke i samme omfang afhængigt af en brugers

tilbagemeldinger, da modifikationen som regel udføres fuldautomatisk på

baggrund af relationer, der eksisterer uafhængigt af brugerens

søgeforespørgsel. Metoden kom frem i 1960ʹerne og ʹ70ʹerne, hvor der var

fokus på automatisk gruppering af søgetermer i klynger. Klyngernes

anvendelse har været mange forskellige, men en af mulighederne er

automatisk udvidelse af søgeforespørgsler således at hver enkel term i

forespørgslen erstattes af samtlige elementer fra den klynge termen hører til.

Spärck Jones har gennem en række publikationer udviklet og demonstreret

metoderne, og finder at de bedste resultater af query expansion opnås, når der

dannes forholdsvis små klynger (Spärck Jones, 1971; Efthimiadis, 1996).

Siden 1970ʹerne er teorierne om automatisk query expansion baseret på

klynger af termer og på term co‐occurrence blevet diskuteret livligt, og der er

4 ‐ Review Side 12

More magazines by this user
Similar magazines