06.11.2013 Aufrufe

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

5 Evaluationsmethoden <strong>und</strong> Experimente<br />

In diesem Kapitel werden die <strong>in</strong> Kapitel 4 vorgestellten Verfahren experimentell untersucht.<br />

Die dabei verwendeten Maße werden zuerst vorgestellt, sowie e<strong>in</strong>e Beschreibung des Ablaufs<br />

der Experimente aufgezeigt. Zusätzlich wird der verwendete Datensatz <strong>und</strong> dessen Eigenschaften<br />

beschrieben.<br />

5.1 Datensatz<br />

Für die Evaluation der <strong>Algorithmen</strong> wird der Datensatz MovieLens 1 der Universität von M<strong>in</strong>nesota<br />

e<strong>in</strong>gesetzt. Dieser Datensatz ist <strong>in</strong> der Forschungsgeme<strong>in</strong>de zu Recommendersystemen<br />

verbreitet <strong>und</strong> wird oft für die Evaluation von neuen Verfahren verwendet. Neben diesem Datensatz<br />

ist noch der Datensatz des Netflix Grand Prize 2 des Onl<strong>in</strong>e-DVD-Verleihers Netflix, der<br />

Jester Datensatz 3 mit Bewertungen zu Witzen, der Book-Cross<strong>in</strong>g Datensatz 4 mit Buchbewertungen<br />

<strong>und</strong> der EachMovie Datensatz für Filme <strong>in</strong> der Literatur verwendete Datensätze. Der<br />

EachMovie Datensatz wird jedoch seit 2004 nicht mehr gepflegt <strong>und</strong> kann nicht mehr aus<br />

offizieller Quelle bezogen werden.<br />

MovieLens Der MovieLens ist <strong>in</strong> drei verschiedenen Varianten erhältlich, die sich jeweils<br />

nur <strong>in</strong> der Anzahl der abgegebenen Rat<strong>in</strong>gs, User <strong>und</strong> Filmen unterscheiden. Der Gr<strong>und</strong>aufbau<br />

des Datensatzes ist bei allen Varianten derselbe.<br />

Der Hauptdatensatz, siehe Tabelle 5.1, enthält jeweils e<strong>in</strong>en Benutzer, der von diesem Benutzer<br />

bewertete Film, die entsprechende Bewertung <strong>und</strong> e<strong>in</strong>en Zeitstempel. Für jeden Benutzer<br />

s<strong>in</strong>d <strong>in</strong> e<strong>in</strong>er weiteren Tabelle die jeweiligen demografischen Daten abgelegt, siehe Tabelle 5.2.<br />

Für jeden Film s<strong>in</strong>d dessen Details wie <strong>in</strong> Tabelle 5.3 abgelegt. Die Genre werden durch e<strong>in</strong>e<br />

Bitmaske def<strong>in</strong>iert, e<strong>in</strong>e 1 bedeutet der Film ist diesem Genre zugeordnet, bei e<strong>in</strong>er 0 nicht.<br />

E<strong>in</strong> Film kann zu mehreren Genres gehören.<br />

Nicht alle Daten dieses Datensatzes wurden verwendet. Die Postleitzahl, der Zeitstempel<br />

sowie das Veröffentlichungsdatum des Film (nicht <strong>in</strong> Tabelle 5.3 aufgeführt) werden nicht <strong>in</strong><br />

den hier vorgestellten Recommendersystemen verwendet, da diese Daten sich nicht für die<br />

<strong>in</strong> Kapitel 4 vorgestellten Methoden eignen. Der Zeitpunkt der Bewertungsabgabe sowie die<br />

Veröffentlichung des Film sagt nichts über die Präferenz e<strong>in</strong>es Benutzer zu e<strong>in</strong>em Item aus.<br />

1 http://grouplens.org/node/73<br />

2 http://archive.ics.uci.edu/ml/datasets/Netflix+Prize<br />

3 http://eigentaste.berkeley.edu/dataset/<br />

4 http://www.<strong>in</strong>formatik.uni-freiburg.de/~cziegler/BX/<br />

61

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!