06.11.2013 Aufrufe

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

2.5 Collaborative Filter<strong>in</strong>g<br />

bewerten. Diese werden <strong>in</strong> Klassen C i e<strong>in</strong>geteilt, z.B. relevant <strong>und</strong> nicht relevant, <strong>in</strong>dem man<br />

die Wahrsche<strong>in</strong>lichkeiten berechnet zu welcher Klasse C i die Webseite p j gehört, gegeben die<br />

Keywords k 1j , · · · , k nj dieser Webseite:<br />

Pr(C i |k 1j & · · · &k nj ) (2.1)<br />

Weiter wird angenommen, dass die Schlüsselwörter e<strong>in</strong>er Webseite unabhängig s<strong>in</strong>d <strong>und</strong><br />

daher die Wahrsche<strong>in</strong>lichkeiten proportional zu<br />

P(C i ) ∏ P(k x,j |C i )<br />

x<br />

s<strong>in</strong>d. Es können P(C i ) <strong>und</strong> P(k x,j |C i ) aus den zugr<strong>und</strong>e liegenden Daten des Tra<strong>in</strong><strong>in</strong>gsdatensatzes<br />

bestimmt werden. Es wird die Wahrsche<strong>in</strong>lichkeit <strong>in</strong> Formel 2.1 für jede Webseite p j<br />

<strong>und</strong> jede Klasse C j berechnet <strong>und</strong> p j <strong>in</strong> eben die Klasse C j e<strong>in</strong>geteilt, die die höchste Wahrsche<strong>in</strong>lichkeit<br />

hat.<br />

2.5 Collaborative Filter<strong>in</strong>g<br />

Die gr<strong>und</strong>legende Idee h<strong>in</strong>ter collaborative filter<strong>in</strong>g ist die Empfehlung oder Vorhersage e<strong>in</strong>er<br />

Bewertung e<strong>in</strong>es Items auf Basis der Me<strong>in</strong>ungen anderer Benutzer mit ähnlichem Geschmack,<br />

die dieses Item schon bewertet haben. Die Me<strong>in</strong>ung über e<strong>in</strong> Item kann dabei entweder explizit<br />

oder implizit von den Benutzern e<strong>in</strong>geholt werden. Der Benutzer kann etwa e<strong>in</strong> explizites<br />

Rat<strong>in</strong>g auf e<strong>in</strong>er Skala von 1 bis 5 abgeben oder das Rat<strong>in</strong>g wird aufgr<strong>und</strong> der impliziten<br />

Beobachtungen se<strong>in</strong>es Kaufverhaltens, der Analyse von Logdateien oder des Klickverhalten<br />

auf e<strong>in</strong>er Webseite erstellt.<br />

Formal ausgedrückt ergibt sich die geschätzte Bewertung r ui e<strong>in</strong>es Users u für e<strong>in</strong> Item i aus<br />

den Bewertungen r uk i, die dem Item i von anderen Usern u k ∈ U gegeben wurde. E<strong>in</strong>e konkrete<br />

Implementierung e<strong>in</strong>es Recommendersystems für Filme würde beispielsweise zuerst<br />

die User suchen, die den gleichen Filmgeschmack wie der aktive User haben (d.h. manche<br />

Filme ähnlich bewertet), um mit diesen Informationen den Film zu f<strong>in</strong>den, der von dieser<br />

Nachbarschaft kollektiv am besten bewertet wurde.<br />

Im Folgenden werden die vier Hauptansätze der kollaborativen Filtermethoden vorgestellt.<br />

Die ersten drei Methoden, memory-based, item-based <strong>und</strong> model-based, werden <strong>in</strong> der Literatur<br />

häufig geme<strong>in</strong>schaftlich als neighbourhood-Methoden bezeichnet. Der vierte Ansatz, latent<br />

factor models kann man als model-based Ansatz ansehen, er wird hier aber als eigenständige<br />

Methode behandelt.<br />

2.5.1 Memory-based Ansatz<br />

Dieser Ansatz arbeitet auf dem gesamten Datensatz, also der gesamten User-Item Matrix (siehe<br />

Tabelle 2.1). Es werden verschiedene Methoden angewandt, um die ähnlichsten Benutzer<br />

11

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!