06.11.2013 Aufrufe

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5 Evaluationsmethoden <strong>und</strong> Experimente<br />

True positive rate<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

3.43 3.78 4.13 4.49 4.84 5.19<br />

True positive rate<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

3.53 3.86 4.19 4.52 4.85 5.18<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

False positive rate<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

False positive rate<br />

Abbildung 5.7: ROC Kurven für e<strong>in</strong>en exemplatischen Benutzer (14). L<strong>in</strong>ks ohne optimierten<br />

Gewichtsvektor, rechts per PSOREC optimiert.<br />

Reduzierung von Features Es soll untersucht werden, <strong>in</strong>wiefern sich der MAE <strong>und</strong> die<br />

Gewichtsvektoren verändern, wenn Teile der demografischen Features <strong>und</strong> die Genres aus<br />

dem Datensatz entfernt werden. Es wurden dazu aus dem MovieLens Datensatz modifizierte<br />

Datensätze erstellt, die diese Features jeweils nicht enthalten. Es werden exemplarisch zwei<br />

Benutzer ausgewählt, die auch bei der Untersuchung zum globalen Optimum verwendet<br />

wurden: Benutzer 12 <strong>und</strong> 19, die beide Eigenschaften vorweisen, die zur experimentellen<br />

Untersuchung nützlich s<strong>in</strong>d (siehe dazu die Diskussion <strong>in</strong> Kapitel 6.5.3).<br />

Für beide Benutzer wurde jeweils die Abweichung der Gewichtswerte für folgende Varianten<br />

des Datensatzes <strong>in</strong> Abbildung 5.12 <strong>und</strong> 5.13 aufgezeigt: Ke<strong>in</strong> Geschlecht, ke<strong>in</strong> Alter,<br />

überhaupt ke<strong>in</strong>e demografischen Daten <strong>und</strong> ke<strong>in</strong>e Genre<strong>in</strong>formationen der Items. In Abbildung<br />

5.14 ist der Verlauf des mittleren absoluten Fehlers für 20 Benutzer abgebildet. Es ist zu<br />

erkennen, dass für manche Benutzer der Unterschied zwischen den Varianten größer ist als<br />

für andere. Es wurde der Kruskal-Wallis-Test als statistischer Test verwendet. H 0 lautet, dass<br />

es ke<strong>in</strong>en Unterschied zwischen den MAE Werten gibt, wenn Features weggelassen werden.<br />

Der Kruskal-Wallis-Test ergab e<strong>in</strong>en p-Wert von 0.9787, d.h. H 0 kann nicht abgelehnt werden.<br />

Auswirkungen von Velocity Clamp<strong>in</strong>g <strong>und</strong> Trägheitsgewichten Für die <strong>in</strong> Tabelle 5.7 aufgeführten<br />

Komb<strong>in</strong>ationen wurden 50 unabhängige Läufe durchgeführt <strong>und</strong> jeweils der MAE<br />

berechnet. Das Trägheitsgewicht (TG) wurde <strong>in</strong> zwei Varianten untersucht, siehe dazu auch<br />

Abschnitt 4.5.2. Die Mittelwerte des MAE über die 50 Läufe s<strong>in</strong>d <strong>in</strong> der zweiten Spalte aufgeführt.<br />

72

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!