Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

7 Diskussion

7.1 Effekt af query expansion

Af Mikkel Just Tronhus

Helt overordnet er resultatet af undersøgelsen, at query expansion ved hjælp

af brugergenererede tags ikke virker. Testen af det endelige system viser

tydeligt, at formålet med undersøgelsen, altså at forbedre søgninger (og

særligt deres ranking) gennem automatisk query expansion, ikke er opnået.

Resultaterne fra performance evalueringerne, både gennem Cumulated Gain

metoden og ved hjælp af Relex, viser tydeligt, at de udvidede søgninger ikke

klarer sig bedre end de oprindelige søgninger. Der er dog en del spredning i

det resultat, idet der er stor forskel fra arbejdsopgave til arbejdsopgave og

ligeledes mellem de enkelte brugere. Dermed ikke være sagt, at de anvendte

performancemål skal tilsidesættes, blot, at der findes indikationer af, at der

eksisterer mere specifikke sammenhænge, hvor den anvendte metode kan

have en positiv effekt på performance.

Det fremgår af analysen, at den anvendte metode rent faktisk er i stand til at

etablere forbindelser mellem relaterede termer. Den gør det ikke konsistent

nok, og der er stadig for mange fejl, men samtidig mener vi også at

resultaterne af nærværende undersøgelse viser at der er potentiale i metoden.

Hvis man ser på den kvalitative undersøgelse af klyngekvaliteten, så viser den

jo, at der ud af 603 etablerede relationer er 251, der er ønskværdige. Ikke noget

prangende resultat i sig selv, og i hvert tilfælde ikke af en kaliber der egner sig

til operationalisering i sin nuværende form. Men dog udtryk for, at metoden

kan identificere de ønskede relationer. Udfordringen bliver herefter at få den

til enten at lade være med at lave så mange fejl, eller at identificere hvad der er

fejl, og hvad der ikke er. Fejl her defineret som dels ønskede relationer, der

ikke identificeres, og falske positive, relationer der ikke burde have været

identificeret.

Den kvantitative del af analysen viser, at der set over hele undersøgelsen ikke

er nogen forbedring af søgeresultaterne ved anvendelse af de udvidede

søgninger i forhold til de oprindelige. Men denne del af analysen afslører

samtidig store forskelle set over de forskellige situationer. Denne forskel kan

have mange forskellige oprindelser, det er slet ikke sikkert, at en tilsvarende

undersøgelse med andre tasks/brugere ville vise samme mønster, men det må

dog tages med i diskussionen som et usikkerhedsmoment ved det resultat

analysen har vist.

7 ‐ Diskussion Side 82

More magazines by this user
Similar magazines