06.11.2013 Aufrufe

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

5.2 Messverfahren <strong>und</strong> Qualitätsmaße<br />

Film ID Name des Films Genres<br />

1 Toy Story 0|0|0|1|1|1|0|0|0|0|0|0|0|0|0|0|0|0|0<br />

2 GoldenEye 0|1|1|0|0|0|0|0|0|0|0|0|0|0|0|0|1|0|0<br />

3 Four Rooms 0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|0|1|0|0<br />

4 Get Shorty 0|1|0|0|0|1|0|0|1|0|0|0|0|0|0|0|0|0|0<br />

5 Copycat 0|0|0|0|0|0|1|0|1|0|0|0|0|0|0|0|1|0|0<br />

6 Shanghai Triad 0|0|0|0|0|0|0|0|1|0|0|0|0|0|0|0|0|0|0<br />

7 Twelve Monkeys 0|0|0|0|0|0|0|0|1|0|0|0|0|0|0|1|0|0|0<br />

8 Babe 0|0|0|0|1|1|0|0|1|0|0|0|0|0|0|0|0|0|0<br />

9 Dead Man Walk<strong>in</strong>g 0|0|0|0|0|0|0|0|1|0|0|0|0|0|0|0|0|0|0<br />

10 Richard III 0|0|0|0|0|0|0|0|1|0|0|0|0|0|0|0|0|1|0<br />

11 Seven (Se7en) 0|0|0|0|0|0|1|0|0|0|0|0|0|0|0|0|1|0|0<br />

12 Usual Suspects, The 0|0|0|0|0|0|1|0|0|0|0|0|0|0|0|0|1|0|0<br />

Tabelle 5.3: Filmdetails im MovieLens Datensatz. Die 18 Genre-Bits geben an, ob e<strong>in</strong> Film<br />

e<strong>in</strong>em Genre zugeordnet ist (1) oder nicht (0). Filme können mehreren Genres<br />

zugeordnet werden. Die Genres obigen Genres s<strong>in</strong>d, <strong>in</strong> genau dieser Reihenfolge:<br />

Action, Adventure, Animation, Children, Comedy, Crime, Documentary, Drama,<br />

Fantasy, Film-Noir, Horror, Musical, Mystery, Romance, Sci-Fi, Thriller, War <strong>und</strong><br />

Western.<br />

5.2.1 Tra<strong>in</strong><strong>in</strong>gs- <strong>und</strong> Testdatensatz<br />

Um die Qualität der Empfehlungen für e<strong>in</strong>en aktiven User zu messen, wird der verwendete<br />

Datensatz <strong>in</strong> Tra<strong>in</strong><strong>in</strong>gs- <strong>und</strong> Testdatensatz aufgeteilt, siehe Abbildung 5.1. Es wird die<br />

beim MovieLens Datensatz mitgelieferte Aufteilungsmethode verwendet. Jeder Testdatensatz<br />

enthält e<strong>in</strong>e Teilmenge der Bewertungen e<strong>in</strong>es Users. Jeder User kommt <strong>in</strong> jedem Testdatensatz<br />

als Tupel 〈User, Item, Rat<strong>in</strong>g〉 m<strong>in</strong>destens e<strong>in</strong>mal vor. Der Algorithmus wird auf dem<br />

Tra<strong>in</strong><strong>in</strong>gsteil tra<strong>in</strong>iert, mit der die Nachbarschaft zum aktiven Benutzer <strong>in</strong>kl. des optimierten<br />

Gewichts bestimmt wird. Anschließend werden die im Testdatensatz enthaltenen Items<br />

des aktiven Users geschätzt (<strong>und</strong> die dar<strong>in</strong> enthaltenen echten Bewertungen ignoriert) <strong>und</strong><br />

nachfolgend mit dessen richtigen Bewertungen verglichen, siehe dafür Abschnitt 5.2.2.<br />

5.2.2 Vorhersagende Genauigkeitsmaße<br />

Vorhersagende Genauigkeitsmaße messen wie nahe die geschätzten Bewertungen e<strong>in</strong>es Recommendersystems<br />

an die wirklichen Bewertungen e<strong>in</strong>es Benutzer herankommen.<br />

Die mittlere absolute Abweichung (mean absolut error, MAE) misst die durchschnittliche Abweichung<br />

aller vom Recommendersystem geschätzten Bewertungen p i zu den echten Bewertungen<br />

r i <strong>und</strong> wird wie folgt berechnet:<br />

MAE = ∑n i=1 |r i − p i |<br />

n<br />

mit n als Anzahl aller Items im Testdatensatz des aktiven Benutzers.<br />

63

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!