Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

Ranking af termpar med positiv lighed og dermed potentiale for at ende i

samme klynge:

Dice

1: (t4+t5)

2: (t3+t5)

3: (t3+t4)

4: (t1+t3)

5: (t2+t4)

(5.6)



Dice lighedsmålet er identisk med Jaccard, bortset fra, at der er en faktor

knyttet til koforekomsterne. Det eneste formål med denne faktor er at vægte

de situationer hvor begge termer forekommer sammen højere i

sammenligningen. Konsekvenserne af den metode er, at der bliver taget

relativt set mindre hensyn til mismatch situationerne i udregningen af

lighedsgraden. Hvis man ser på den samlede mængde af ligheder i det lille

testsystem fra før, viser det sig, at Dice lighederne er større end de tilsvarende

Jaccard ligheder, men at de følger samme progression i forhold til ranking af

termpar som Jaccard.

Dice t1 t2 t3 t4 t5

t1 1

t2 0 1

t3 0,545 0 1

t4 0 0,444 0,667 1

t5 0 0 0,769 0,833 1

Tabel 5.9 ‐ Term×term matrice, Dice

Ranking af termpar med positiv lighed og dermed potentiale for at ende i

samme klynge:

1: (t4+t5)

2: (t3+t5)

3: (t3+t4)

4: (t1+t3)

5: (t2+t4)

5 ‐ Metode Side 38

More magazines by this user
Similar magazines