Carl von Ossietzky Universität Oldenburg Hausarbeit ... - DIKO :: Index

Weitere Magazine

Empfehlungen

Info

etrifft. Auch kann sein Surfverhalten auf dem besuchten Server gespeichert werden. Es kann durch Cookies in einigen Fällen zu Netzbelastungen und damit verbundene Wartezeiten kommen. Jedoch haben Cookies auch Nutzen, bei einem wiederholten Dialog mit den gleichen Anbietern müssen die Daten nicht erneut eingegeben werden, das hat eine Zeitersparnis zur Folge und ist bequemer. Es gibt verschiedenste Verwendungsmöglichkeiten. Z.B. werden Cookies in Verbindung mit persönlich zugeschnittenen Webseiten verwendet. Als Beispiel ist hier ” My Yahoo“[Yah03], oder Amazon [Ama03] zu nennen. Eine der populärsten Anwendungen für den Einsatz von Cookies ist die eindeutige Benutzererkennung für das Nutzen diverser Online-Angebote. Internetbesucher mit dynamischen IP-Adressen werden trotz der geänderten IP-Adresse bei einem weiteren Besuch wieder erkannt und müssen so nicht wieder alle Einstellungen erneut tätigen, etc.. 3.3.3 explizite Benutzerregistrierung Die Identifikation durch explizite Benutzerregistrierung ist die einfachste Möglichkeit für den Anbieter Internetbesucher, bzw. Kunden wieder zuerkennen. Hier wird ein Benutzername und ein Passwort gewählt, über die der Besucher der Seite bei einem erneuten Log-in wieder erkannt werden kann. Das bedeutet diese Daten sind für eine Wiedererkennung notwendig. Es gibt auch die Verbindung zwischen der expliziten Benutzerregistrierung und Cookies, z.B. bei Banken. Die Einstellungen bleiben bestehen und der Anbieter der Webseite kann dem Kunden individuelle Angebote schicken. Der Kunde wird oft gebeten einige Angaben zu machen, meist in Form eines Fragebogens, bevor ein Konto, bzw. ein Account für ihn angelegt wird. Diese Art von Identifikation ist auch für die Pflege- und Updatemöglichkeiten die einfachste, denn der Benutzer kann in den meisten Fällen z.B. selbst seine Daten ändern, oder auch seine neue Interessen generieren. Er kann somit bei Bedarf in eine neue Klasse von Kunden eingegliedert werden. Dies hat sowohl für den Kunden, als auch für den Anbieter Vorteile. Der Kunde bekommt aktualisierte Werbung oder Angebote entsprechend seiner neuen Interessen oder Angaben, und der Anbieter erhält immer die aktuellsten Daten. Explizite Benutzerregistrierung findet man oft bei Emailanbietern, Online-Shops, Banken aber auch bei Foren und Chats. 4 Personalisierungstechniken Es gibt verschiedene Techniken der Personalisierung von Inhalten. Im folgenden sollen drei wichtige vorgestellt werden: Zum einen die Clusteranalyse in Verbindung mit den Recommender Systemen; zum anderen die Assoziationsund Sequenzanalyse, auf der typische Bewegungspfade dargestellt werden und darüber hinaus die Klassifikationsanalyse mit Entscheidungsbäumen und neuronalen Netzen. 14
4.1 Clusteranalyse Abbildung 4: Die Clusteranalyse nach Clarans[Fay96] Das Ziel einer Clusteranalyse ist laut Späth [Spä83] die Zusammenfassung der zu klassifizierenden Objekte zu Klassen, so dass die Objekte innerhalb einer Klasse möglichst ähnlich und die Klassen untereinander möglichst unähnlich sind. Die Clusteranalyse möchte durch Algorithmen eine Segmentierung erreichen, speziell auf Basis der expliziten und impliziten Daten. Es gibt verschiedene Clusterverfahren, die alle angewandt werden können, um das oben genannte Ziel zu erreichen. Die Wahl der jeweiligen Clusterverfahren ist abhängig von dem gewünschten Ergebnis und den vorhandenen Eingabedaten. Durch eine Vorauswahl bestimmter Datensätze, z.B. Aussortieren der so genannten Ausreiser aus der Statistik, kann die Effizienz gesteigert werden. Zum Beispiel bei einem Vergleich von Supermärkten wie Aldi, Lidl, Pennymarkt und Feinkost-Käfer, wäre letzteres ein Ausreißer; Feinkost-Käfer ist zwar auch ein Supermarkt, würde aber das durchschnittliche Ergebnis verfälschen, und die Auswertung wäre nicht sinnvoll. Da Käfer z.B. ein anderes Warenangebot besitzt und die Käuferschicht eine andere ist. Wichtig für eine sinnvolle Auswertung ist darüber hinaus die Definition, wie viele Cluster gebildet werden sollen und über wie viele Durchgänge der Algorithmus gehen soll. Man unterscheidet partionierende und hierarchische Clusteringverfahren. Sie werden im folgenden kurz beschrieben. Graphentheoretische Verfahren werden vernachlässigt. Im partionierenden Verfahren werden die Daten in k Cluster eingeteilt, wobei jeder Cluster C aus mindestens einem Objekt besteht, jedes Objekt höchstens einem Cluster angehört und die Cluster sich nicht überlappen. Partionierende Verfahren umfassen mehrere Ansätze z.B. den k-means- und den k-medoid- Ansatz. Hier werden Cluster durch zentrale Punkte dargestellt, die kompaktesten Cluster werden rausgefiltert. Es gibt darüber hinaus die Erwartungsmaximierung. Hier werden Cluster durch Gaußverteilungen repräsentiert und die Zugehörigkeit eines Objektes zu einem Cluster wird über Wahrscheinlichkeiten dargestellt. Gaußverteilungen sind eine statistische Kennzahl. Statistische Kennzahlen spielen bei der Clusteranalyse eine große Bedeutung. Auch bei hierarchischen Verfahren, wo das Distanzmaß, bzw. Unähnlichkeitsmaß 15
Seite 1 und 2: Carl von Ossietzky Universität Old
Seite 3 und 4: 1 Einleitung Personalisierung wird
Seite 5 und 6: Laden. Zwar ist der Preis der Produ
Seite 7 und 8: auch kann er durch speichern von Po
Seite 9 und 10: 3 Komponenten der Personalisierung
Seite 11 und 12: ... 192.168.156.36 - [20/Jan/2002:1
Seite 13: werden und transistente Cookies, di
Seite 17 und 18: z.B. durch Data Mining. Techniken d
Seite 19 und 20: Filterung könnte mit einer Art Mun
Seite 21 und 22: und kurz erklärt. Auf der Abbildun
Seite 23 und 24: Die kollaborative Filterung wurde d
Seite 25 und 26: Cookies, S.6 sind kleine Textdateie
Seite 27 und 28: [J.B96] J.Bacher. Clusteranalyse -

Carl von Ossietzky Universität Oldenburg Hausarbeit ... - DIKO :: Index

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?