Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

bliver en relevant evalueringsparameter, hvorimod ranking er temmelig

overflødig for en exact‐match algoritme, da sorteringen her som regel er

alfabetisk efter forfatter, eller kronologisk efter udgivelsesår eller

inddateringsdato. Omend man ikke blankt kan afvise, at der er en

relevansrelateret mening med en sortering på f.eks. førsteforfatterens

efternavn, er det dog højst usandsynligt, og det er derfor heller ikke

sandsynligt, at sådanne sorteringer ville kunne anvendes som

evalueringsparameter.

Best‐match algoritmer er efterhånden blevet sofistikerede nok til at være

dominerende på mange områder, især indenfor Internettet, hvor

søgemaskiner som Google formår at præsentere i hvert fald et udsnit af de

mest relevante sider, udvalgt fra ofte flere millioner, som de øverste, og

dermed tilsyneladende bedste. Indenfor det medicinske domæne er best‐

match dog ikke nogen selvfølge på samme måde. F.eks. er PubMed et exact‐

match genfindingssystem, og det samme gælder for f.eks. Embase og Cinahl.

Det kunne derfor have været oplagt at fokusere på exact‐match, men også

indenfor det sundhedsvidenskabelige område sker der en udvikling i forhold

til hvad brugerne efterspørger i retning af Google‐lignende søgeresultater (van

den Brekel, 2007), og der findes etablerede eksempler på best‐match

genfindingssystemer, der tager udgangspunkt i PubMeds data (f.eks.

gopubmed 21 og HubMed 22 ). Valget af best‐match algoritme er derfor et

proaktivt valg, i forhold til brugerbehov, og konsekvensen er, at ranking er en

langt mere interessant evalueringsparameter end ren recall/precision. Det er

dog ikke ensbetydende med, at det er den eneste mulighed.

Cooper foreslår f.eks. at anvende brugerens generelle tilfredshed med

søgeresultatet som indikator for hvor godt et genfindingssystem virker

(Cooper, 1973). Vi vil dog tilslutte os Dagobert Soergels kritik af dette forslag,

og medgive ham, at det er meget mere interessant at se på hvor meget

brugeren rent faktisk får ud af søgeresultatet (utility) (Soergel, 1976). Soergel

mener, at dette bør udtrykkes som en forskel i arbejdseffektivitet efter

søgningen er foretaget, hvilket til gengæld er problematisk på mange

forskellige måder. Det er f.eks. ikke altid en søgning er direkte relateret til en

specifik arbejdsopgave, og selvom de i denne situation er det, er

forespørgslerne nærmere eksplorative eller bekræftende i deres natur.

Derudover kan det være problematisk at opgøre hvorvidt en arbejdsopgave

efterfølgende udføres mere effektivt – er der udelukkende fokus på forbrug af

ressourcer, eller er antallet og størrelsen af fejl vigtigere? Og hvordan skal

dette måles på en hensigtsmæssig, ikke‐forstyrrende måde? I stedet vælger vi

at se på Saracevic’ relevanstype af samme navn; utility, eller situationel

relevans (Saracevic, 1996), der ligeledes er et udtryk for hvor meget brugeren

får ud af søgningen i forhold til en given arbejdsopgave, men afgjort på

dokumentniveau, og ud fra brugerens egen kvalitative vurdering, i stedet for

en objektiv vurdering af forbedret effektivitet. Omend der findes adskillige

andre kriterier for hvad der er et godt søgeresultat, og der ikke findes én rigtig

21 http://www.gopubmed.org/

22 http://www.hubmed.org

7 ‐ Diskussion Side 86

More magazines by this user
Similar magazines