Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

Ochiai

(5.7)



(Ellis, Furner‐Hines, & Willet, 1993, s. 137‐138)

Ochiai er en udgave af det almene cosinus lighedsmål, som anvendes

andetsteds i specialet. Det er i forhold til de tre foregående lighedsmål et

markant mere komplekst mål, omend det dog stadig er ret simpelt at udregne

ud fra optællingerne af henholdsvis a, b, c og d. Det er helt ufølsomt overfor

negative hits (d), og dermed velegnet til denne form for analyse idet

vektorerne og matricerne er ”sparse”, det vil sige der er mange 0‐indførsler i

matricen.

Ochiai t1 t2 t3 t4 t5

t1 1

t2 0 1

t3 0,612 0 1

t4 0 0,535 0,668 1

t5 0 0 0,791 0,845 1

Tabel 5.10 ‐ Term×term matrice, Ochiai

Ranking af termpar med positiv lighed og dermed potentiale for at ende i

samme klynge:

1: (t4+t5)

2: (t3+t5)

3: (t3+t4)

4: (t1+t3)

5: (t2+t4)

Det har altså vist sig, at alle de ind til videre gennnemgåede lighedsmål ranker

lighederne mellem de 5 testvektorer ens. Det er en lille stikprøve at basere

noget på, foruden at det er urealistiske data i forhold til de meget tyndt

befolkede vektorer der arbejdes med i koforekomstanalyser.

5 ‐ Metode Side 39

More magazines by this user
Similar magazines