06.11.2013 Aufrufe

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.4 Content-based Filter<strong>in</strong>g<br />

Collaborative Methode Input Output<br />

Memory-based Bestimmung ähnlicher User-Item Bewertung für<br />

Benutzer zum aktiven Matrix unbekannte<br />

Benutzer per k-nearest<br />

Items des<br />

neighbor. Schätzung<br />

aktiven Benutzers<br />

der Bewertung anhand<br />

dieser Gruppe.<br />

(z.B. Mittelwert der<br />

Rat<strong>in</strong>gs)<br />

Item-based Bestimmung ähnlicher, User-Item Bewertung für<br />

geme<strong>in</strong>sam bewerteter Matrix unbekannte<br />

Items <strong>und</strong> Berechnung<br />

Items des<br />

der jeweiligen Ab-<br />

aktiven Benutzers<br />

stände <strong>und</strong> Bestimmung<br />

der Nachbarschaft<br />

(k-nearest neighbor)<br />

Model-based Cluster<strong>in</strong>g <strong>in</strong> Gruppen, User-Item Items werden <strong>in</strong><br />

oder per Bayes’scher Matrix Bewertungsgruppen<br />

Klassifikatoren die<br />

e<strong>in</strong>geteilt (Cluster)<br />

Bestimmung der wahr-,<br />

sche<strong>in</strong>lichen Bewertung<br />

oder die Bewertung<br />

mit der höchsten<br />

Whkt. wird<br />

ausgegeben (Bayes)<br />

Tabelle 2.3: Übersicht der collaborative-based Verfahren.<br />

Sei d j e<strong>in</strong> gegebenes Dokument oder Item <strong>und</strong> k i e<strong>in</strong> keyword <strong>in</strong> d j . Die normalisierte Häufigkeit<br />

des Auftretens dieses keywords ist def<strong>in</strong>iert als<br />

TF i,j =<br />

n i,j<br />

∑ k n k,j<br />

mit n i,j als die gesamte Anzahl des Auftretens von k i <strong>und</strong> der Zähler als Summe aller Auftrittshäufigkeiten<br />

aller keywords. Jedoch s<strong>in</strong>d keywords, die <strong>in</strong> vielen Dokumenten auftreten,<br />

nicht nützlich für die Unterscheidung von Dokumenten. Daher wird die <strong>in</strong>verse document<br />

frequency (IDF) <strong>in</strong> Komb<strong>in</strong>ation mit TF genutzt. IDF ist def<strong>in</strong>iert als<br />

IDF i = log N n i<br />

mit N für die gesamte Anzahl aller Dokumente <strong>und</strong> n i als Anzahl der Dokumente, <strong>in</strong> der k i<br />

auftritt. Das TDF/IDF-Gewicht für keyword k i ist def<strong>in</strong>iert als<br />

w i,j = TF i,j × IDF i<br />

<strong>und</strong> das Profil e<strong>in</strong>es Items i für e<strong>in</strong> Dokument d j als pro f ile(i) = (w 1,j , ..., w k,j ).<br />

Um nun bisher ungesehene Items e<strong>in</strong>em User zu empfehlen, werden diese mit den bisher bewerteten<br />

Items verglichen. Dabei wird aus den Profilen der bekannten <strong>und</strong> bewerteten Items<br />

9

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!