Schwarmintelligenz und evolutionäre Algorithmen in ...

Empfehlungen

Info

2 Recommendersysteme sind. Dieses Modell ist ein naiver Bayes’schen Klassifikator: Pr(C = u, r 1 · · · r n ) = Pr(C = u) n ∏ i=1 Pr(r i |C = u) Der linke Teil der Formel beschreibt die Wahrscheinlichkeit, dass ein User u einer Klasse C angehört und ein dazugehöriger kompletter Satz von Bewertungen. Die in Formel 2.6 benötigte Wahrscheinlichkeit lässt sich nun aus dieser Formel bestimmen. Die Parameter für den naiven Bayes-Klassifikator, Pr(U = u) und Pr(r i |C = u), werden mit einem Trainingsdatensatz geschätzt. Der zweite Modell, basiert auf Bayes’schen Netzen. Dabei ist jedes Item ein Knoten in einem Bayes’schen Netz und der Zustand jedes Knoten entspricht den möglichen Werten der Bewertungsskala für jedes Item. Es wird auf einem Trainingsdatensatz ein Algorithmus für das Lernen von Bayes’schen Netzen angewandt [14]. Im daraus resultierenden Netz hat jedes Item die Knoten als Eltern, die die besten Vorhersagen über die Bewertung dieses Items treffen. Ein Problem bei diesem Verfahren ist, dass ein User nur in genau ein Cluster eingeteilt werden kann [1]. Es ist aber möglich, dass ein User sich für zwei vollkommen andere Themengebiete gleich interessiert und eine solche Einteilung daher problematisch ist. 2.5.4 Latent Factor Models Latent Factor Models schließen aus dem Bewertungsmuster der Benutzer per Lernverfahren auf mehrere Faktoren (ab ca. 20 bis über 100), die die Items und die User charakterisieren. Jedes Item und jeder User wird über einen Vektor charakterisiert, der diese Faktoren enthält. Jeder Faktor eines Items beschreibt dessen Eigenschaften, für den Fall von Filmen beispielsweise Faktoren wie Menge an Action, Tiefe der Charaktere, Comedy vs. Drama, Eignung für Kinder oder auch Faktoren, die direkt gar nicht vorherzusagen sind. Für den Benutzer misst jeder Faktor den Grad, wie sehr dieser an den entsprechenden Eigenschaften interessiert ist. Eine mögliche Durchführung von Latent Factor Models ist die Matrixfaktorisierung, die jedes Item und jeden Benutzer als Vektor von Faktoren darstellt [41]. Eine hohe Ähnlichkeit der beiden Vektoren führt zu einer Empfehlung. Viele Recommendersysteme arbeiten auf expliziten Bewertungen von anderen Items, beispielsweise wenn die Benutzer konkrete Werte für ein Item auf einer Skala von 1 bis 5 abgeben. Dies führt zu einer sehr spärlich gefüllten User-Item-Matrix, da die meisten Benutzer im Vergleich zur gesamten Anzahl an Items nur sehr wenige bewertet haben. Der Vorteil der Matrixfaktorisierung ist, dass auch implizite Bewertungen bzw. Präferenzen der Benutzer in das Modell mit einfließen können [41]. Dies wären z.B. Dinge wie die Art der besuchten Seiten einer Webseite, Muster bei der Suche, das Kaufverhalten der Benutzer, etc. Die Matrixfaktorisierung bildet Items und Benutzer in einen gemeinsamen latent factor Merkmalsraum ab, so dass man die Gemeinsamkeiten zwischen Items und Benutzern als Skalarprodukt der jeweiligen Vektoren beschreiben kann [39]. Die geschätzte Bewertung ˆr von 16
2.5 Collaborative Filtering Benutzer u für Item i berechnet sich als ˆr ui = q T i p u (2.7) mit q i als Vektor, der das Item mit den angesprochenen Faktoren beschreibt und p u als Vektor, der die Faktoren des Benutzers beinhaltet. Die Faktoren können dabei positiv wie negativ sein, je nach genauer Charakterisierung dieses Items bzw. Nutzers. Die eigentliche Schwierigkeit dieses Verfahrens ist die Abbildung des Verhaltens der Benutzer auf die Vektoren sowie das Lernen der Itemfaktoren in den Itemvektoren. Diese Beschreibungen der Items und Benutzer sind a priori nicht bekannt und müssen aus der User-Item- Matrix gelernt werden. Dieses Problem, das mit der Singulärwertszerlegung (SVD) verwandt ist, wird gelöst [41, 40, 39], indem die vorliegenden Bewertungen der Benutzer genommen werden, um damit direkt ein Modell des Benutzerverhaltens zu modellieren. Die Vektoren q i und p u werden erlernt, indem der regulierte, quadrierte Fehler in der Menge der bekannten Bewertungen minimiert wird: min ∑ (u,i)∈K (r ui − q T i p u) 2 + λ(||q i || 2 + ||p u || 2 ) (2.8) mit K als Menge aller Item-Nutzer-Paare (u, i), für die eine Bewertung r ui bekannt ist. Das System lernt die bisherigen Bewertungen und soll daraus eine Verallgemeinerung für zukünftige Bewertungen ableiten. Es besteht jedoch die Gefahr der Überanpassung, so dass die Konstante λ den Grad der Regulierung kontrolliert und üblicherweise per Kreuzvalidierung bestimmt wird [41]. Eine Möglichkeit, die Gleichung 2.8 zu minimieren ist ein stochastischer Gradientenabstieg, der von Simon Funk 1 vorgeschlagen und mit großem Erfolg im Netflix Prize eingesetzt wurde (die Lösung der Gewinner setzt dieses Verfahren erfolgreich ein [38]). Für jeden Fall im Trainingsdatensatz schätzt das Verfahren die echte Bewertung r ui und bestimmt den entsprechenden Fehler e: e ui := r ui − q T i p u. Danach modifiziert es die Parameter um die Größenordnung γ in die entgegengesetzte Richtung des Gradienten: q i ← q i + γ · (e ui · p u − λ · q i ) (2.9) p u ← p u + γ · (e ui · q i − λ · p u ) (2.10) Dieses Verfahren bietet die Möglichkeit, zusätzliche implizite Informationsquellen mit einzubeziehen. Dafür kann die Gleichung 2.7 erweitert werden. Eine sinnvolle Erweiterung ist die Beachtung des systematischen Fehlers, der sich ergeben kann, wenn beispielsweise zwei Benutzer die Bewertungsskala verschieden interpretieren oder wenn es Items gibt, die allgemein besser als alle anderen Items bewertet werden, auch wenn sie dies objektiv gar nicht 1 http://sifter.org/~simon/journal/20061211.html 17
Seite 1 und 2: Fakultät für Ingenieurwissenschaf
Seite 3 und 4: Inhaltsverzeichnis 1 Einleitung 1 1
Seite 5 und 6: 1 Einleitung In der heutigen Zeit w
Seite 7 und 8: 2 Recommendersysteme 2.1 Motivation
Seite 9 und 10: 2.3 Übersicht existierende Recomme
Seite 11 und 12: 2.3 Übersicht existierende Recomme
Seite 13 und 14: 2.4 Content-based Filtering Collabo
Seite 15 und 16: 2.5 Collaborative Filtering bewerte
Seite 17 und 18: 2.5 Collaborative Filtering und ¯r
Seite 19: 2.5 Collaborative Filtering Bei die
Seite 23 und 24: 2.7 Überblick über die bisherige
Seite 25 und 26: 2.7 Überblick über die bisherige
Seite 27 und 28: 3 Schwarmintelligenz und evolution
Seite 29 und 30: eiden Chromosome gekreuzt werden, w
Seite 31 und 32: GA ES Typisches Kombinatorische Kon
Seite 33 und 34: Ansatz leitete den Schwarm ohne die
Seite 35 und 36: 3.1 Genetischer Algorithmus 1 BEGIN
Seite 37 und 38: 3.1 Genetischer Algorithmus 0 0 0 0
Seite 39 und 40: 3.2 Particle Swarm Optimization 3.2
Seite 41 und 42: 3.2 Particle Swarm Optimization Abb
Seite 43 und 44: 3.3 Invasive Weed Optimization aus
Seite 45 und 46: 3.3 Invasive Weed Optimization bede
Seite 47 und 48: 4 Recommender mit Schwarmintelligen
Seite 49 und 50: 4.3 Forschungsüberblick Recommende
Seite 51 und 52: 4.5 Particle Swarm Optimization Rec
Seite 57 und 58: 4.6 Genetic Algorithm Recommender (
Seite 63 und 64: 4.7 Invasive Weed Optimization Reco
Seite 65 und 66: 5 Evaluationsmethoden und Experimen
Seite 67 und 68: 5.2 Messverfahren und Qualitätsma
Seite 69 und 70: 5.2 Messverfahren und Qualitätsma
Seite 71 und 72:
5.3 Experimente True positive rate
Seite 73 und 74:
5.3 Experimente zelnen Features ent
Seite 75 und 76:
5.3 Experimente 1.2 1.1 Optimierte
Seite 77 und 78:
5.3 Experimente 0.71546 0.70665 0.7
Seite 79 und 80:
5.3 Experimente MAE (mean absolute
Seite 81 und 82:
5.3 Experimente -0.2 0.0 0.2 0.4 0.
Seite 83 und 84:
5.3 Experimente MAE (mean absolute
Seite 85 und 86:
5.3 Experimente -0.2 -0.1 0.0 0.1 0
Seite 87 und 88:
5.3 Experimente 1.2 1.1 Mutationswh
Seite 89 und 90:
5.3 Experimente -0.05 0.00 0.05 0.1
Seite 91 und 92:
5.3 Experimente 1.2 1.1 Mit FPS Ohn
Seite 93 und 94:
6 Diskussion der Ergebnisse In dies
Seite 95 und 96:
6.2 Diskussion IWO und Vergleich zu
Seite 97 und 98:
6.4 Diskussion der Evaluationsmetho
Seite 99 und 100:
6.5 Diskussion der experimentellen
Seite 101 und 102:
Seite 103 und 104:
Seite 105 und 106:
6.7 Ausblick Dies ist aber bei den
Seite 107 und 108:
7 Zusammenfassung der Hauptergebnis
Seite 109 und 110:
Literaturverzeichnis [1] Adomaviciu
Seite 111 und 112:
Literaturverzeichnis [28] Good, N.
Seite 113 und 114:
Literaturverzeichnis ; Thrun, Sebas
Seite 115:
Name: Matthias Schneider Matrikelnu
Alle anzeigen

Schwarmintelligenz und evolutionäre Algorithmen in ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?