Schwarmintelligenz und evolutionäre Algorithmen in ...

Empfehlungen

Info

4 Recommender mit Schwarmintelligenz und evolutionären Algorithmen ⎛ sim(u, v) = 1 |I uv | · ⎜ ∑ ⎝ i∈I uv ⎞ n ∑ w u f p ui f p vi f f =1 √ √ n∑ n∑ ⎟ w u f p 2 ui w u f f p 2 ⎠ vi f f =1 f =1 (4.8) mit n als Anzahl der Features, p ui als Profil des Benutzer u für Item i sowie p vi als Profil des Benutzers v für Item i und w u als Gewichtsvektor des Users u. Die Idee, die dieser Formel zugrunde liegt, ist, dass die Ähnlichkeit zweier Benutzer als Mittelwert der Ähnlichkeiten aller gemeinsamen Items gebildet wird. Dabei wird für alle gemeinsamen Items I uv zweier Benutzer u und v jeweils zuerst die Ähnlichkeit der (Item- )Profile berechnet und anschließend der Mittelwert dieser Werte bestimmt. Eine weitere Möglichkeit, die mit dem gleichen Grundgedanken entwickelt wurde, ist die Verwendung der gewichteten Pearson-Korrelation: ⎛ sim(u, v) = 1 |I uv | · ⎜ ∑ ⎝ i∈I uv ⎞ n ∑ w u f (p ui f − ¯p ui )(p vi f − ¯p vi ) f =1 √ √ n∑ n∑ ⎟ w u f (p ui f − ¯p ui ) 2 w u f (p vi f − ¯p vi ) 2 ⎠ f =1 f =1 mit ¯p ui als Mittelwert der Elemente des Vektors p für Item i und User u. Im Gegensatz zum euklidischen Abstand bedeutet hier ein Wert von 1 eine perfekte Ähnlichkeit. Dies ist bei der Implementierung und der Bestimmung der Nachbarschaft zu beachten. Es wurden die Maße durch einen entsprechenden Gewichtsvektor des Benutzers u erweitert, der die einzelnen Features je nach Vorlieben des Benutzers gewichtet und somit eine genauere Auswahl der Nachbarschaft erlaubt. Die Wahl dieser Abstandsmaße gegenüber dem euklidischen Abstand, der von Ujjin und Bentley [75] für dieses Verfahren vorgeschlagen wurde, begründet sich darin, dass die Pearson Korrelation und die Kosinusähnlichkeit in der Literatur durchweg bessere Ergebnisse erzielt haben als ein euklidischer Abstand [1]. Die gewichteten Varianten sind in dieser Form in Recommendersystemen, nach dem besten Wissen des Autors, noch nicht eingesetzt worden sind. (4.9) Wahl der Nachbarschaft Zaier et al. [78] untersucht die Auswirkung der Nachbarschaftsgröße auf die Empfehlungsqualität. Es wird gezeigt, dass ab einer Größe von ungefähr 50% der gesamten Benutzer des Systems keine deutliche Verbesserung der mittleren Abweichung des Schätzungen mehr beobachtbar ist. In dieser Arbeit wird eine andere Grenze für die Anzahl der Benutzer in der Nachbarschaft verwendet, da ein fester Wert immer auch User mit einbeziehen kann, die nur eine geringe Ähnlichkeit zum aktiven User haben. Auch wenn deren Gewicht in der Schätzung der Bewertung (siehe Gleichung 4.2) sehr niedrig ist, kann bei der Aufnahme vieler solcher Benutzer 52
4.6 Genetic Algorithm Recommender (GAREC) die Empfehlung durchaus verfremdet werden. Daher wird in dieser Arbeit unter anderem ein Verfahren angewandt, dass nur die überdurchschnittlich ähnlichsten User betrachtet. Zuerst wird der Mittelwert aller Abstände vom aktiven Benutzer zu allen anderen Benutzern bestimmt. Wenn nun der Abstand eines Benutzers gleich oder kleiner als der Mittelwerts ist, wird er in die Nachbarschaft aufgenommen. Eine Untersuchung der Auswirkung dieser Maßnahme sowie alternative Werte für die Grenze erfolgt in Abschnitt 5.3.3. Untersuchung des globalen Optimum mit einem künstlichen Datensatz Die vermutlich dicht mit lokalen Optima durchsetzte Fitnesslandschaft soll mit einem künstlich erzeugten bzw. einer künstlich veränderten Variante des originalen Datensatzes untersucht werden. Es werden in verschiedenen Kombinationen Features aus dem originalen Datensatz entfernt und anschließend in Testläufen untersucht, wie sich diese Änderungen auf die Empfehlungsqualität und die weiteren Evaluationsmetriken auswirken. Vielleicht lässt sich aus den so gewonnenen Daten eine Erklärung für das Verhalten der ermittelten Gewichtsvektoren finden. 4.6 Genetic Algorithm Recommender (GAREC) Das nun folgende Verfahren verwendet das gleiche Recommendersystem wie in Abschnitt 4.5. Jedoch wird für die Bestimmung und Optimierung des Gewichtsvektors ein genetischer Algorithmus verwendet [74]. Zusätzlich wurde eine Variante implementiert, die Eigenschaften der Evolution Strategies umsetzt. 4.6.1 Beschreibung des Verfahrens Das verwendete Recommendersystem entspricht dem aus Abschnitt 4.5.1. Der dort verwendete Particle Swarm Optimierer wurde durch den hier vorgestellten genetischen Algorithmus ersetzt. Alle weiteren Details bleiben gleich und können im genannten Abschnitt nachgelesen werden. Details zum verwendeten GA Der genetische Algorithmus verwendet ein elitäres Auswahlverfahren für die Individuen der nächsten Generation, indem immer die besten 25% der Population in die nächste Generation übernommen werden, egal ob sie aus der Menge der Eltern µ oder der Menge der Nachkommen λ stammen. Es soll damit sichergestellt werden, dass keine guten Lösungen verworfen werden. Dies ist beispielsweise bei EAs der Fall, bei denen die komplette Kindgeneration die Elterngeneration ersetzt. Da wir an einer optimalen Lösung interessiert sind, die die Empfehlungsqualität möglichst optimiert und es egal ist, in welchen Bereichen des Lösungsraums diese gefunden wurden, sollte diese Strategie von Vorteil sein. Für die Wahl der Eltern in der Rekombination werden aus den besten 40% der Population zufällig Elternpaare gezogen. Die von diesen Paaren erzeugten Nachkommen werden immer per 53
Seite 1 und 2:
Fakultät für Ingenieurwissenschaf
Seite 3 und 4:
Inhaltsverzeichnis 1 Einleitung 1 1
Seite 5 und 6: 1 Einleitung In der heutigen Zeit w
Seite 7 und 8: 2 Recommendersysteme 2.1 Motivation
Seite 9 und 10: 2.3 Übersicht existierende Recomme
Seite 11 und 12: 2.3 Übersicht existierende Recomme
Seite 13 und 14: 2.4 Content-based Filtering Collabo
Seite 15 und 16: 2.5 Collaborative Filtering bewerte
Seite 17 und 18: 2.5 Collaborative Filtering und ¯r
Seite 19 und 20: 2.5 Collaborative Filtering Bei die
Seite 21 und 22: 2.5 Collaborative Filtering Benutze
Seite 23 und 24: 2.7 Überblick über die bisherige
Seite 25 und 26: 2.7 Überblick über die bisherige
Seite 27 und 28: 3 Schwarmintelligenz und evolution
Seite 29 und 30: eiden Chromosome gekreuzt werden, w
Seite 31 und 32: GA ES Typisches Kombinatorische Kon
Seite 33 und 34: Ansatz leitete den Schwarm ohne die
Seite 35 und 36: 3.1 Genetischer Algorithmus 1 BEGIN
Seite 37 und 38: 3.1 Genetischer Algorithmus 0 0 0 0
Seite 39 und 40: 3.2 Particle Swarm Optimization 3.2
Seite 41 und 42: 3.2 Particle Swarm Optimization Abb
Seite 43 und 44: 3.3 Invasive Weed Optimization aus
Seite 45 und 46: 3.3 Invasive Weed Optimization bede
Seite 47 und 48: 4 Recommender mit Schwarmintelligen
Seite 49 und 50: 4.3 Forschungsüberblick Recommende
Seite 51 und 52: 4.5 Particle Swarm Optimization Rec
Seite 53 und 54: 4.5 Particle Swarm Optimization Rec
Seite 55: 4.5 Particle Swarm Optimization Rec
Seite 59 und 60: 4.6 Genetic Algorithm Recommender (
Seite 61 und 62: 4.6 Genetic Algorithm Recommender (
Seite 63 und 64: 4.7 Invasive Weed Optimization Reco
Seite 65 und 66: 5 Evaluationsmethoden und Experimen
Seite 67 und 68: 5.2 Messverfahren und Qualitätsma
Seite 69 und 70: 5.2 Messverfahren und Qualitätsma
Seite 71 und 72: 5.3 Experimente True positive rate
Seite 73 und 74: 5.3 Experimente zelnen Features ent
Seite 75 und 76: 5.3 Experimente 1.2 1.1 Optimierte
Seite 77 und 78: 5.3 Experimente 0.71546 0.70665 0.7
Seite 79 und 80: 5.3 Experimente MAE (mean absolute
Seite 81 und 82: 5.3 Experimente -0.2 0.0 0.2 0.4 0.
Seite 83 und 84: 5.3 Experimente MAE (mean absolute
Seite 85 und 86: 5.3 Experimente -0.2 -0.1 0.0 0.1 0
Seite 87 und 88: 5.3 Experimente 1.2 1.1 Mutationswh
Seite 89 und 90: 5.3 Experimente -0.05 0.00 0.05 0.1
Seite 91 und 92: 5.3 Experimente 1.2 1.1 Mit FPS Ohn
Seite 93 und 94: 6 Diskussion der Ergebnisse In dies
Seite 95 und 96: 6.2 Diskussion IWO und Vergleich zu
Seite 97 und 98: 6.4 Diskussion der Evaluationsmetho
Seite 99 und 100: 6.5 Diskussion der experimentellen
Seite 105 und 106: 6.7 Ausblick Dies ist aber bei den
Seite 107 und 108:
7 Zusammenfassung der Hauptergebnis
Seite 109 und 110:
Literaturverzeichnis [1] Adomaviciu
Seite 111 und 112:
Literaturverzeichnis [28] Good, N.
Seite 113 und 114:
Literaturverzeichnis ; Thrun, Sebas
Seite 115:
Name: Matthias Schneider Matrikelnu
Alle anzeigen

Schwarmintelligenz und evolutionäre Algorithmen in ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?