Speciale a03jean a03mitr 2008 - Forskning

pure.iva.dk

Speciale a03jean a03mitr 2008 - Forskning

Query expansion med sociale tags til forbedret ranking af søgeresultater Danmarks Biblioteksskole

søgninger med støjtermer, der er relateret til det medicinske domæne. Alle

søgetermer fremgår af tabel 5.1:

Bruger input alzheimer, paranoia, diagnose, diagnosis, welfare, nurse, nursing,

massage, physiotherapy, pain, ache, back, acupuncture, relatives,

family, kin, zone, condom, contraception, birth, backpain,

prevention, sexual, pregnancy, urinary, dementia, old, tired,

fatigue, neurological, stress, hyperventilation, amnesia, smoking,

coughing

Støj carcinoma, cancer, kidney, pancreas, staging, squamous, thyroid,

metastasis, merkel, gastric, adenocarcinoma, breast, human,

microarray, microrna, prostate, breastcancer, carcinogenesis,

chromosome, colon, colorectal

Tabel 5.1 ‐ Søgetermer i CiteULike

Ved hjælp af ovenstående fremgangsmåde er der fundet 3014 HTML‐sider

indeholdende mellem 1 og 50 poster hver.

Disse poster har virket som grundlæggende samling, primært bestående af

poster fra det medicinske domæne. På grund af indsamlingens

fremgangsmåde forekommer der dog også adskillige poster fra andre

domæner.

De fundne HTML‐sider er blevet scannet ved hjælp af et PHP‐script, der på

baggrund af HTML‐koder har fundet titler på dokumenter og tilhørende tags.

Derudover har scriptet brugt CiteULikes eget artikel‐ID til at undgå dublet‐

forekomster.

5.3.2 Egenskaber

I det følgende beskrives de særlige kendetegn, der er fundet ved de

indsamlede data. Først analyseres i hvor høj grad CiteULikes dokumenter er

af videnskabelig karakter, hvorefter der foretages en frekvensanalyse af

fundne tags i forhold til Zipf’s lov (Zipf, 1949). Endelig analyseres tags for

deres lighed med termer der forekommer i titlen på dokumenter, for at kunne

afgøre, om tags rent faktisk tilfører ny information til indekseringen af

dokumenter, eller om de blot fremhæver eksisterende information.

5 ‐ Metode Side 25

More magazines by this user
Similar magazines