06.11.2013 Aufrufe

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4 Recommender mit <strong>Schwarm<strong>in</strong>telligenz</strong> <strong>und</strong> <strong>evolutionäre</strong>n <strong>Algorithmen</strong><br />

⎛<br />

sim(u, v) = 1<br />

|I uv | ·<br />

⎜ ∑ ⎝<br />

i∈I uv<br />

⎞<br />

n<br />

∑ w u f<br />

p ui f<br />

p vi f<br />

f =1<br />

√ √ n∑<br />

n∑ ⎟<br />

w u f<br />

p 2 ui<br />

w u f f<br />

p 2 ⎠<br />

vi f<br />

f =1<br />

f =1<br />

(4.8)<br />

mit n als Anzahl der Features, p ui als Profil des Benutzer u für Item i sowie p vi als Profil des<br />

Benutzers v für Item i <strong>und</strong> w u als Gewichtsvektor des Users u.<br />

Die Idee, die dieser Formel zugr<strong>und</strong>e liegt, ist, dass die Ähnlichkeit zweier Benutzer als<br />

Mittelwert der Ähnlichkeiten aller geme<strong>in</strong>samen Items gebildet wird. Dabei wird für alle<br />

geme<strong>in</strong>samen Items I uv zweier Benutzer u <strong>und</strong> v jeweils zuerst die Ähnlichkeit der (Item-<br />

)Profile berechnet <strong>und</strong> anschließend der Mittelwert dieser Werte bestimmt.<br />

E<strong>in</strong>e weitere Möglichkeit, die mit dem gleichen Gr<strong>und</strong>gedanken entwickelt wurde, ist die<br />

Verwendung der gewichteten Pearson-Korrelation:<br />

⎛<br />

sim(u, v) = 1<br />

|I uv | ·<br />

⎜ ∑ ⎝<br />

i∈I uv<br />

⎞<br />

n<br />

∑ w u f<br />

(p ui f<br />

− ¯p ui )(p vi f<br />

− ¯p vi )<br />

f =1<br />

√ √ n∑<br />

n∑<br />

⎟<br />

w u f<br />

(p ui f<br />

− ¯p ui ) 2 w u f<br />

(p vi f<br />

− ¯p vi ) 2 ⎠<br />

f =1<br />

f =1<br />

mit ¯p ui als Mittelwert der Elemente des Vektors p für Item i <strong>und</strong> User u. Im Gegensatz zum<br />

euklidischen Abstand bedeutet hier e<strong>in</strong> Wert von 1 e<strong>in</strong>e perfekte Ähnlichkeit. Dies ist bei der<br />

Implementierung <strong>und</strong> der Bestimmung der Nachbarschaft zu beachten.<br />

Es wurden die Maße durch e<strong>in</strong>en entsprechenden Gewichtsvektor des Benutzers u erweitert,<br />

der die e<strong>in</strong>zelnen Features je nach Vorlieben des Benutzers gewichtet <strong>und</strong> somit e<strong>in</strong>e genauere<br />

Auswahl der Nachbarschaft erlaubt.<br />

Die Wahl dieser Abstandsmaße gegenüber dem euklidischen Abstand, der von Ujj<strong>in</strong> <strong>und</strong><br />

Bentley [75] für dieses Verfahren vorgeschlagen wurde, begründet sich dar<strong>in</strong>, dass die Pearson<br />

Korrelation <strong>und</strong> die Kos<strong>in</strong>usähnlichkeit <strong>in</strong> der Literatur durchweg bessere Ergebnisse erzielt<br />

haben als e<strong>in</strong> euklidischer Abstand [1]. Die gewichteten Varianten s<strong>in</strong>d <strong>in</strong> dieser Form <strong>in</strong><br />

Recommendersystemen, nach dem besten Wissen des Autors, noch nicht e<strong>in</strong>gesetzt worden<br />

s<strong>in</strong>d.<br />

(4.9)<br />

Wahl der Nachbarschaft Zaier et al. [78] untersucht die Auswirkung der Nachbarschaftsgröße<br />

auf die Empfehlungsqualität. Es wird gezeigt, dass ab e<strong>in</strong>er Größe von ungefähr 50%<br />

der gesamten Benutzer des Systems ke<strong>in</strong>e deutliche Verbesserung der mittleren Abweichung<br />

des Schätzungen mehr beobachtbar ist.<br />

In dieser Arbeit wird e<strong>in</strong>e andere Grenze für die Anzahl der Benutzer <strong>in</strong> der Nachbarschaft<br />

verwendet, da e<strong>in</strong> fester Wert immer auch User mit e<strong>in</strong>beziehen kann, die nur e<strong>in</strong>e ger<strong>in</strong>ge<br />

Ähnlichkeit zum aktiven User haben. Auch wenn deren Gewicht <strong>in</strong> der Schätzung der Bewertung<br />

(siehe Gleichung 4.2) sehr niedrig ist, kann bei der Aufnahme vieler solcher Benutzer<br />

52

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!