06.11.2013 Aufrufe

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

Schwarmintelligenz und evolutionäre Algorithmen in ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

2.5 Collaborative Filter<strong>in</strong>g<br />

<strong>und</strong> ¯r c als durchschnittliches Rat<strong>in</strong>g des Users u, def<strong>in</strong>iert als<br />

¯r u = 1<br />

|I u | ∑<br />

i∈I u<br />

r ui , mit I u = {i ∈ I|r ui ̸= ⊘}.<br />

Der e<strong>in</strong>fachste Fall ist der Mittelwert aller Rat<strong>in</strong>gs, Formel 2.2. Jedoch ist die gebräuchlichste<br />

Art die Schätzung der Rat<strong>in</strong>gs e<strong>in</strong>e gewichtete Summe der Mittelwerte, Formel 2.3. Die<br />

dabei verwendete Ähnlichkeit sim zweier User u <strong>und</strong> û, wird als Gewicht der Rat<strong>in</strong>gs verwendet.<br />

Je ähnlicher sich zwei User s<strong>in</strong>d, desto mehr fließt das Rat<strong>in</strong>g dieses Nachbarn î<br />

<strong>in</strong> das geschätzte Rat<strong>in</strong>g e<strong>in</strong>. Dabei können die verschiedenen Recommender für sim eigene<br />

Ähnlichkeitsmaße def<strong>in</strong>ieren, so lange sie e<strong>in</strong>e Normalisierung der Werte über den Faktor k<br />

durchführen. Jedoch berücksichtigt die gewichtete Summe nicht, dass verschiedene User die<br />

Rat<strong>in</strong>gskala durchaus anders verwenden bzw. <strong>in</strong>terpretieren. Zwei verschiedene User könnten<br />

e<strong>in</strong> Item unterschiedlich bewerten, obwohl sie subjektiv genau die gleiche Me<strong>in</strong>ung von<br />

ihm haben. Daher bietet sich e<strong>in</strong>e Modifikation der gewichteten Summe an, die diese Abweichungen<br />

korrigieren kann. Formel 2.4 tut dies <strong>und</strong> verwendet statt dem absoluten Betrag der<br />

Bewertung die Abweichung vom Mittelwert dieses Users.<br />

Für die Berechnung der Ähnlichkeit zweier User <strong>in</strong> kollaborativen Systemen wurden verschiedene<br />

Methoden entwickelt, die meist auf den Bewertungen der Items basieren, die beide<br />

User <strong>in</strong> der Vergangenheit bewertet haben. Zwei mögliche Maße s<strong>in</strong>d der Pearson Korrelationskoeffizient<br />

<strong>und</strong> der Kos<strong>in</strong>us des W<strong>in</strong>kel zwischen zwei Vektoren (Benutzer). Seien u <strong>und</strong><br />

v zwei verschiedene User <strong>und</strong> I uv = {i ∈ I|r ui ̸= ⊘ ∧ r vi ̸= ⊘} die Menge der Items, für die u<br />

<strong>und</strong> v beide Bewertungen abgegeben haben. Die Pearson Korrelation ist def<strong>in</strong>iert als<br />

sim(u, v) =<br />

∑ i∈Iuv (r ui − ¯r u )(r vi − ¯r v )<br />

√∑ i∈Iuv (r ui − ¯r u ) 2 ∑ i∈Iuv (r vi − ¯r v ) 2 (2.5)<br />

Das kos<strong>in</strong>us-basierte Ähnlichkeitsmaß, das die beiden User u <strong>und</strong> v als m-dimensionalen<br />

Vektor mit m = |I uv | beschreibt, wird bestimmt durch<br />

sim(u, v) = cos(⃗u,⃗v) =<br />

⃗u ·⃗v<br />

||⃗u|| 2 × ||⃗v|| 2<br />

=<br />

∑ i∈Iuv r ui r vi<br />

√<br />

∑ i∈Iuv r 2 ui<br />

√<br />

∑ i∈Iuv r 2 vi<br />

mit ⃗u · ⃗v als Skalarprodukt zwischen Vektor ⃗u <strong>und</strong> ⃗v. E<strong>in</strong> weiterer Korrelationskoeffizient ist<br />

der Rangkorrelationskoeffizient von Spearman. Für e<strong>in</strong>e Diskussion, siehe Kapitel 6.<br />

,<br />

2.5.2 Item-based Ansatz<br />

E<strong>in</strong> Nachteil von memory-basierenden Ansätzen ist der große Aufwand für die Berechnung<br />

aller Abstände zwischen den Usern. Dies hat vor allem dann Gewicht, wenn sich die Eigenschaften<br />

der User häufig ändern, d.h. wenn die User beispielsweise oft viele Filme bewerten<br />

<strong>und</strong> sich somit ihre persönliche Nachbarschaft verändert. Item-basierende Verfahren [66] umgehen<br />

dieses Problem, <strong>in</strong>dem sie die Ähnlichkeit zwischen Items <strong>und</strong> nicht zwischen Usern<br />

13

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!