Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

tærskelværdi for lighedsmålet, eller at den danner meget få klynger. Og hvis

tærskelværdien bliver lav, dannes der dermed et uforholdsmæssigt stort antal

klynger med to elementer. Problemet er, at antallet af klynger med to

elementer er de samme uanset om der er tale om en single link eller en

complete link metode. Derfor foreslåes her muligheden for at graduere

grænseværdien i forhold til klyngestørrelsen. Det er en utestet metode der

ikke er fundet litterært belæg for, så derfor er metoden ikke anvendt, men

præsenteres her som potentiel videreudvikling af systemet. Metoden ville

have som formål at kunne anvende den til en hver tid optimale grænseværdi,

netop i skillelinien mellem klynger med to elementer og klynger med tre eller

flere elementer. Man kunne forestille sig en complete link algoritme, hvor

grænseværdien sættes således at der dannes ʺpassendeʺ klynger, hvorefter

klyngerne med to elementer splittes op, hvis ikke de har en intern lighed der

er ʺvæsentligtʺ højere. Dette ville gøre det muligt at have en lav nok

tærskelværdi til at der kunne dannes relativt store klynger, samtidig med at

det ville være muligt at holde lidt snor i hvad det er for nogle små klynger der

bliver dannet. Det er i effekt, en tilsvarende tankegang, som gør sig gældende

for average link algoritmerne, men som tager klyngernes størrelse som en

ekstra parameter. Det kunne naturligvis også lade sig gøre, at lave en mere

findelt graduering, således at grænseværdien for lighedsmålet gradueredes i

takt med klyngestørrelsen, men dette ville kræve en mere avanceret software

at udføre, end en simpel todelt grænseværdi. Desuden mener vi at der i

relation til complete link er væsentlig større forskel på klynger med to

elementer, og klynger med tre eller flere elementer. Idet klynger med to

elementer i realiteten lige så kunne have været single link klynger. Hvis man

ser på udviklingen i krævede relationer der skal være opfyldt for at danne

klynger i en complete link algoritme er det (7.1):

(7.1)



Denne udvikling gør det ret hurtigt svært at danne klynger af en vis størrelse,

og derfor mener vi der er basis for at diskutere en gradueret metode.

7 ‐ Diskussion Side 92

More magazines by this user
Similar magazines