Carl von Ossietzky Universität Oldenburg Hausarbeit ... - DIKO :: Index

Carl von Ossietzky Universität Oldenburg 

Hausarbeit 

VERWENDUNG PERSONALISIERTER 

DATEN IM WEB 

Fachbereich Informatik 

Abteilung Informationssysteme 

Prof. Dr. Appelrath 

Projektgruppe Personalisierung internetbasierter 

Handelszenarien 

Christian Reitenberger 

Hausbäker Weg 55, 

26131 Oldenburg, 

EMail: BaziR@gmx.de 

Matrikel-Nr: 7289710 

Studiengang 

Wirtschaftswissenschaften 

mit Schwerpunkt Informatik 

24. Februar 2003 

1

Zusammenfassung 

Gegenwärtig ist zu beobachten, dass die Nachfragebedürfnisse der Kunden 

schnell und oft wechseln. Die Anbieter, speziell die eines Online-Shops, 

stehen deshalb vor der Herausforderung, ihre Produkte und Dienstleistungen 

immer wieder auf die einzelnen Nachfrager personalisiert auszurichten. 

Online-Shops haben durch hohe Bequemlichkeit und zeitunabhängiges 

Einkaufen einen guten Stellenwert, jedoch fehlt den Kunden in vielen 

Fällen Kundenbetreuung und der persönliche Kontakt. Die Personalisierung 

gilt als probates Mittel, um die oben erwähnten Probleme zu lösen 

und die Beziehung zwischen Anbietern und Kunden zu fördern. Gleichzeitig 

wird die Personalisierung als Maßnahme gegen die wachsende Menge 

an Informationen zunehmend wichtiger, um die Informationen für die 

Kunden vorzufiltern. Personalisierung schafft Anbieterloyalität und Kundenbindung 

und wird dadurch immer unverzichtbarer, speziell in Verbindung 

mit dem immer noch als anonym angesehenen Internet. 

Inhaltsverzeichnis 

1 Einleitung 3 

2 Personalisierung 3 

2.1 Allgemeine Definition . . . . . . . . . . . . . . . . . . . . . . . . 3 

2.2 Vorteile der Personalisierung . . . . . . . . . . . . . . . . . . . . 5 

2.3 Rechtliche Aspekte . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

2.4 Mögliche Anwendungsgebiete . . . . . . . . . . . . . . . . . . . . 7 

3 Komponenten der Personalisierung 9 

3.1 Formen der Personalisieung . . . . . . . . . . . . . . . . . . . . . 9 

3.2 Einbinden der Informationen . . . . . . . . . . . . . . . . . . . . 10 

3.3 Identifikation der Internetbenutzer . . . . . . . . . . . . . . . . . 10 

3.3.1 Logfiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 

3.3.2 Cookies . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 

3.3.3 explizite Benutzerregistrierung . . . . . . . . . . . . . . . 14 

4 Personalisierungstechniken 14 

4.1 Clusteranalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 

4.2 Recommender Systeme . . . . . . . . . . . . . . . . . . . . . . . . 16 

4.3 Assoziationsund Sequenzanalyse . . . . . . . . . . . . . . . . . . 19 

4.4 Klassifikationsanalyse . . . . . . . . . . . . . . . . . . . . . . . . 19 

5 Praxisbeispiele 20 

6 Fazit 23 

2

1 Einleitung 

Personalisierung wird in letzter Zeit als Instrument zur Kundenbindung und 

Neukundengewinnung immer unverzichtbarer. Die nachfolgende Arbeit befasst 

sich mit der Verwendung personalisierter Daten im Web. Abschnitt 2 gibt zunächst 

einen allgemeinen Überblick und führt einige Definitionen ein. Des weiteren werden 

mögliche Anwendungsgebiete und Ziele der Personalisierung aufgezeigt. Es 

werden darüber hinaus kurz die rechtlichen Gesichtspunkte angeschnitten und 

es wird den Fragen nachgegangen, ob die Erfolge der Personalisierung messbar 

sind und wenn ja, wie und wo die Vorteile von Personalisierung liegen. 

Abschnitt 3 stellt die Komponenten der Personalisierung vor. Hier wird der Frage 

nachgegangen, welche Möglichkeiten bestehen um zu personalisieren. Auch 

beschäftigt sich die Arbeit mit den Fragen, wie der Nutzer wieder zu erkennen 

ist, wenn er sich nicht per Passwort und Log-in selber identifiziert, und wie der 

Anbieter an die notwendigen Daten kommt, die er zu einer Personalisierung 

benötigt. Bei der Identifizierung wird unter drei Möglichkeiten unterschieden, 

das oben genannte Log-in-Verfahren, Identifikation durch Cookies und durch 

Web-logs, so genannter Logfiles. 

An diesen Abschnitt anschließend betrachtet Abschnitt 4 die zur Verfügung stehenden 

Personalisierungstechniken. Der Schwerpunkt dieses Abschnittes sind 

Recommender Systeme. 

Abschließend wird anhand von Beispielen Personalisierung in der Praxis vorgestellt. 

Unterstützend dazu ist ein Ausschnitt der Seite des Online-Shops Amazon 

[Ama03] dargestellt und es wird ein Fazit gezogen. 

2 Personalisierung 

Dieser Abschnitt umfasst eine allgemeine Definition von Personalisierung mit 

Anwendungsgebieten, Vorteilen und rechtlichen Aspekten. 

2.1 Allgemeine Definition 

Eine allgemein gültige Definition für Personalisierung gibt es nicht. Eine mögliche 

wäre folgende: Personalisierung ist die Anpassung vorhandener Gegebenheiten 

und Möglichkeiten an persönliche Bedürfnisse.[RK02] 

Das kann unter anderem der Arbeitsplatz sein, der nach persönlichen Wünschen 

eingerichtet wird, in dem Blumen oder Bilder auf dem Schreibtisch aufgestellt 

werden. Auch die Einrichtung eines Rechners mit Hintergrundbild und Anwendung 

von Tools ist eine Personalisierung, im allgemeinen die Software-Konfiguration. 

Die vorliegende Arbeit beschränkt sich jedoch hauptsächlich auf die digitale Personalisierung. 

Diese umfasst das Internet und dort die Form der Kommunikation 

per Email in Verbindung mit personalisierter Werbung und der Anpassung von 

3

Produkten an Kundenwünsche. Es gibt darüber hinaus auch die analoge Personalisierung, 

wie das Telefon, das Fax und den Postweg. Hier wird der Kunde 

angerufen, um an Umfragen oder Gewinnspielen teilzunehmen, auch werden 

dem potentiellen oder schon gewonnenen Kunden per Fax individuelle Angebote 

oder Gewinnspiele zugesandt. 

Jedoch ist die meist angewandte analoge Personalisierung immer noch die Postzustellung, 

früher mit dem Schriftzug ” an alle Haushalte“. Inzwischen haben 

diese personalisierten Angebote die persönliche Ansprache, wie den eigenen Namen 

und meist den Beisatz ” ein Angebot speziell für Sie“. Zwei Firmen, die 

diese Art von Personalisierung verfolgen sind z.B. die Süddeutsche Klassenlotterie 

(SKL) und AOL Time Warner. Diese Art der Personalisierung, d.h. die 

Ansprache mit dem eigenen Namen im Web ist immer noch für den Anbieter 

der Personalisierung die einfachste und auch günstigste Art der Personalisierung. 

Darüber hinaus ist der eigene Name immer noch in der zwischenmenschlichen 

Ebene das wichtigste Wort im Wortschatz des Menschen. 

Im Fall der Personalisierung geht es hauptsächlich um Inhalte, die an Individuelle 

Ansprüche angepasst werden: Personalisierung ist eine Art der Entscheidungsfindung. 

Hier wird aus einer Menge von Möglichkeiten die Kombination 

ausgewählt, die dem Betrachter den bestmöglichen Nutzen bringt. In 

der Web-Personalisierung ist das ganze auf der virtuellen Ebene, nämlich auf 

Webseiten und per Emailing zu betrachten. Eine mögliche Definition für Web- 

Personalisierung ist die der Universität Ulm [Ulm01]: ” Personalisierung ist die 

Anpassung von auf Webseiten angebotenen Informationen an die Interessen des 

jeweiligen Betrachters durch Auswahl und Darstellung interessanter und Ausschneiden 

und Weglassen uninteressanter Daten.“ Diese Definition besagt, dass 

die Möglichkeit auf der Webseite bestehen muss, Tools zu verwenden, um den 

Benutzer Möglichkeiten zu geben sich die Seite nach seinen Wünschen zu gestalten 

und einzurichten. Die dargestellten Definitionen sind speziell für Online- 

Shops von großer Bedeutung. Im optimalen Fall könnte speziell in einem Online- 

Shop jeder Kunde seine eigene Angebotspallette besitzen, die für ihn vom Anbieter 

definiert wird. Darüber hinaus sollte der Kunde bei jedem Besuch persönlich 

angesprochen werden können. Dies wird auch als das so genannte ” Tante-Emma- 

Prinzip“ bezeichnet, auf das später im Zusammenhang mit den Vorteilen von 

Personalisierung noch eingegangen wird. Im bestmöglichen Fall bekommt der 

Kunde nur die Werbung, die ihn interessiert, so dass er nicht von der gebotenen 

und vorhandenen Informationsflut abgeschreckt wird - sonst wäre die Information 

verwirrend und er könnte das Interesse verlieren. Es wird also versucht, 

einen Information Overkill zu verhindern. 

In dieser Betrachtung der Personalisierung darf nicht vernachlässigt werden, 

dass Personalisierung ein Werkzeug ist, um Kunden zu binden und um neue 

Kunden zu werben. Das wichtigste Argument für jeden Anbieter, aus der die 

Motivation einer umfangreichen Personalisierung resultiert ist in jedem Fall die 

Tatsache, dass die Konkurrenz in jedem Fall nur einen Mausklick entfernt ist. Im 

traditionellen Markt dagegen können auch Standorte über Erfolg und Misserfolg 

entscheiden. Die Kunden berücksichtigen beim Kauf nicht nur den Preis, sondern 

entscheiden sich manchmal allein aus Bequemlichkeit für den nächst gelegenen 

4

Laden. Zwar ist der Preis der Produkte bei Online-Shops noch Kaufkriterium 

Nummer Eins, aber die Kundenbetreuung spielt eine ähnlich große Rolle und 

wird immer häufiger das entscheidene Kriterium. Die Preise sind nahezu gleich 

bzw. werden von den Konkurrenz-Unternehmen angeglichen.[IHK01] 

2.2 Vorteile der Personalisierung 

Eine Personalisierung ist zeitlich und finanziell sehr aufwändig. Personalisierung 

benötigt einen Mehraufwand an Rechnerleistung und Personal. Aus Sicht des 

Anbieters wird Personalisierung eingesetzt, um ein konkretes Ziel zu verfolgen. 

Wie in Abschnitt 2.1 erwähnt, soll Personalisierung ein Werkzeug sein, um sich 

von der Konkurrenz abzusetzen, oder Konkurrenzfähig zu werden. Hauptziel 

ist aber Neukunden zu werben und speziell vorhandene Kunden zu binden und 

zufrieden zu stellen. Dies basiert auf der Untersuchung, dass das Werben eines 

Neukunden fünfmal so teuer ist, wie einen zufrieden Kunden zu binden.[Dit00] 

Personalisierung wird aus Sicht des Anbieters eingesetzt um personalisierte Werbung 

zu verschicken z.B. per Email, oder um in den personalisierten Shops damit 

zu werben. Die Kundenbindung, die Neukundenwerbung und die Frage, ob das 

Direktmarketing anspricht, lässt sich auch messen und macht dadurch den Erfolg 

greifbar. Hierzu wird z.B. die durchschnittliche Bestellmenge, die Häufigkeit 

der Bestellungen und die Häufigkeit der wegen Reklamation, Unzufriedenheit, 

etc. zurückgesendeten Waren zur Auswertung herangezogen. Auch die Anzahl 

der Besuche auf der Webseite oder im eigenen personalisierten Shop, genau wie 

die Zeit, die sich ein Besucher auf der Seite aufhält, lässt sich messen, und gibt 

Auskunft über die Zufriedenheit des Kunden. 

Die Intensivierung und Loyalität der Kunden wird durch Personalisierung verstärkt 

und ausgebaut. Ein erfolgreicher Shop definiert sich nach Österle/Muther [RK02] 

dadurch, dass der Kunde alles das erhält, was er erwartet ( ” everything“), wo immer 

( ” everywhere“), wann immer er es benötigt ( ” non-stop“) und zwar möglichst 

effizient ( ” one-stop“), mit persönlicher Ansprache und optimaler Ausrichtung 

auf seine Bedürfnisse ( ” one-to-one“). Hinzu kommt die Freiheit, dies auf dem 

von ihm präferierten Weg zu tun ( ” every way“). Die einzige Einschränkung 

ist der wirtschaftliche Aspekt; das Unternehmen kann nur das anbieten, was 

auch mit dem Unternehmensziel konform ist und darüber hinaus wirtschaftlich 

vertretbar ist. Zu den oben erwähnten verfolgten Zielen der Anbieter von personalisierten 

Seiten oder Online-Shops kommt die persönliche Ansprache hinzu, 

die dem Internet die Anonymität nimmt und der Kunde sich persönlich angesprochen 

und individuell bedient fühlt. Aus Sicht des Kunden oder potentiellen 

Kunden ist Personalisierung Zeitersparnis. Er findet sich schneller auf der von 

ihm individuell und persönlich definierten Seite zurecht. Der Kunde erhält nur 

die von ihm gewünschten Informationen, z.B. bei Newslettern oder bei Emailanbietern. 

Für potentielle Neukunden kann Personalisierung sehr hilfreich sein, da 

diese in Klassen eingeordnet werden und sich gut betreut und beraten fühlen. 

Genau wie der Anbieter will der Kunde im Regelfall einen persönlichen Kontakt 

und somit die Anonymität des Internets aufheben und sich beraten und ” verpflegt“ 

wie in einem ” Tante-Emma-Laden“ fühlen. In diesem ist er namentlich 

5

ekannt und der Verkäufer weiß genau, wen er vor sich hat. In einigen Fällen, 

oder im bestmöglichen Fall, weiß der Verkäufer sogar, was der Kunde im Regelfall 

kauft und fungiert in manchen Fällen als eine Art ” Einkaufszettel“, oder 

Einkaufsberater und Bekannter. Um das zu erreichen und die oben erwänte 

Anonymität aufzuheben, bieten manche Anbieter zusätzlich zu ihrem Internet- 

Angebot einen virtuellen Berater in Form eines Forums oder eines Chats an, um 

auch so ein höheres Maß an persönlicher Interaktion zu erreichen und zusätzlich 

Vertrauen und Vertrautheit zu schaffen.[RK02] Die Kunden haben primär einen 

höheren Nutzen, der sich langfristig auch für das Unternehmen auszahlen kann, 

wenn aus dem potentiellen Kunden ein Kunde und aus dem Kunden ein loyaler 

und zufriedener Kunde wird. 

2.3 Rechtliche Aspekte 

Der rechtliche Aspekt wird häufig diskutiert. Speziell in letzter Zeit wurde in 

Verbindung mit Personalisierung immer wieder das Wort Datenmissbrauch, vermeht 

bei der Verwendung von Cookies, durch die Medien genannt. Cookies werden 

in Abschnitt 3.3 ausführlicher erklärt. 

Der rechtliche Aspekt ist ein sensibles Thema, denn es ist ein sehr schmaler 

Grat zwischen einem persönlichen Angebot, oder einer personalisierten Kunden- 

Verkäufer-Beziehung und dem ungewollten Eindringen in die Privatsphäre. In 

diesem Abschnitt wird nur kurz auf die Möglichkeiten der Anbieter und Nutzer 

eingegangen. Zum einen in welchem Umfang die Daten von dem Anbieter 

verwendet werden dürfen. Zum andern wie sich die Kunden vor Missbrauch 

schützen können und Einfluss auf die Verwendung ihrer persönlichen Daten 

haben Der Kunde hat aktiv die Möglichkeit das Sammeln seiner Daten zu verhindern. 

Er hat die Möglichkeit sich anonym im Internet zu bewegen, wenn er 

sich über einen Internet-Provider einwählt oder er sich hinter einer Firewall befindet. 

Darüber hinaus kann er jeder Zeit Cookies deaktivieren, oder sie löschen. 

Der Benutzer kann von vornherein über seine Browsereinstellungen die Ablage 

von Cookies auf sein System ablehnen. Er kann auch z.B. bei Fragebögen angeben, 

dass er seine Daten nicht an Dritte für Werbezwecke weitergeben will, 

oder dass diese vom Unternehmen verwendet werden dürfen.[IBM02] 

Zu dieser aktiven Möglichkeit kommen noch gesetzliche Regelungen, die dem 

Benutzer einen Schutz vor Missbrauch seiner Daten zusichert. Zum einen ist 

hier das Bundesdatenschutzgesetz (BDSG)[IBM02] im Allgemeinen und zum 

anderen das Teledienste-Datenschutzgesetz im Besonderen (TDDSG)[IBM02] 

zu nennen. Diese zwei Gesetze gelten aber nur für personenbezogene, nicht aber 

für anonyme Daten. 

Zu diesem Zweck muss der Unterschied dieser zwei Daten deutlich gemacht werden. 

Bei anonymen Daten wird nur die Zielgruppe dargestellt, der Zeitpunkt des 

Zugriffs, der Pfad und die Länge der besuchten Seiten Bei personenbezogenen 

Daten ist wichtig, welche Person, bzw. welche IP, hinter den Aktionen im Internet 

sitzt. [Agn01] Im besten Fall sind Name und andere persönliche Daten 

durch eine Registrierung des Benutzers bekannt. Der Anbieter kann die anonymen 

Daten für statistische Auswertungen nutzen und Zielgruppen definieren, 

6

auch kann er durch speichern von Postleitzahlen (wobei hier die Größe des zu 

betrachtenden Gebiets rechtlich eine Rolle spielt), Alter und Geschlecht (was 

nicht unter die personenbezogenen Daten fällt) wichtige Informationen rausfiltern 

und sich zumindest ein quantitatives Feedback zu verschaffen.[Agn01] 

Um eine negative Presse zu vermeiden, ist es aus Sicht des Unternehmens ganz 

wichtig, sich die Einwilligung des Kunden zu holen, bevor die Daten gesammelt, 

oder diese verarbeitet werden. Diese Einwilligung der Kunden führt nicht zum 

Verlust von Kunden bzw. potentieller Kunden durch schlechte Publicity. Das 

Vertrauen der Kunden muss weiterhin gestärkt werden. Der Kunde muss das 

Gefühl haben, dass er die Daten gerne und freiwillig gibt. Es gibt für den Internetbesucher 

Möglichkeiten sich vor Missbrauch,ungewünschter Werbung, also 

im Allgemeinen vor dem Eindringen in die Privatsphäre zu schützen. 

Für Anbieter gibt es jedoch legale Möglichkeiten, Informationen zu sammeln 

und diese für Werbezwecke einzusetzen, oder wie oben erwähnt für statistische 

Auswertungen zu verwenden. Abbildung 1 zeigt die Möglichkeiten Daten 

zu sammeln, um an eine Datenbasis zu gelangen, die für eine Personalisierung 

notwendig ist. 

Abbildung 1: Sammeln von Daten [unk02b] 

2.4 Mögliche Anwendungsgebiete 

Es gibt verschiedene Formen von Personalisierungen, wie in Abschnitt 2.1. erwähnt. 

In diesem Abschnitt werden einige Ansätze möglicher Personalisierungsideen 

aufgezeigt. Es gibt keine allgemein gültige Definition und es ist schwer eine klare 

Grenze zwischen den einzelnen Ideen zu ziehen, da manche Umsetzungen 

ineinander übergehen. Nach der Definition der Gartner Group [Gro01], werden 

fünf Kategorien unterschieden: 

• Inhalte-Personalisierung, 

• Angebots-Personalisierung, 

• Produkt-Personalisierung, 

7

• Preis-Personalisierung und 

• Service-Personalisierung. 

Unter der oben aufgeführten Inhalte-Personalisierung wird die Anpassung eines 

Inhaltes an die explizite und implizite Nutzenpräferenz verstanden. Explizite, 

vom Benutzer direkte und implizite, vom Benutzer indirekte Informationsbereitstellung 

wird in Abschnitt 3.1 in Verbindung mit den Formen der Personalisierung 

näher erläutert. 

Angebots-Personalisierung versucht dem jeweiligen Betrachter oder Kunden das 

richtige Produkt oder Angebot zu unterbreiten. Daraus kann das optimale Vorgehen 

abgeleitet werden, für Werbung zum Beispiel. 

Das Paradebeispiel Dell Computers [Del03] kann in Verbindung mit der Produktpersonalisierung 

genannt werden, Dell stimmt das Produkt, hier den Computer, 

individuell auf den Kunden ab, speziell bei der Zusammenstellung der 

Hard - und Software des Rechners. 

Preis-Personalisierung setzt eine Käufer-Verkäufer-Beziehung voraus. Aufbauend 

auf dieser werden abgesicherte Preis- und Verfügbarkeitsdaten für Dritte 

zur Verfügung gestellt, als Beispiel ist hier EBAY [Eba03] zu nennen. 

Service-Personalisierungen umfassen im wesentlichen Chats und Foren, zum 

einen für den Kundenservice, zum anderen aber auch nur als reine Kommunikationsebene. 

Das Unternehmen stellt hier dem Kunden einen optimalen Kommunikationskanal 

zur Verfügung. 

Weitere Ansätze ergeben sich nach Quocirca Business and IT Analysis.[Quo01] 

Hierbei wird unter vier möglichen Ansätze unterschieden: 

• Self Service Personalisierung 

• Lifestyle Personalisierung, 

• Personalisierung über kundenspezifische Anpassung und 

• Lernenden Personalisierung. 

Der Nutzer hat bei der Self Service Personalisierung die Möglichkeit, z.B. bei 

Portalen die Art und Darbietungsform der auf der Website präsentierten Informationen 

an seine Bedürfnisse anzupassen. 

Die Lifestyle Personalisierung versucht auf Basis von Profilen und Analysemethoden, 

sowie Trends den Output an die Nutzerbedürfnisse anzupassen, d.h. es 

werden personalisierte Angebote erstellt. 

Personalisierung über kundenspezifische Anpassung bietet dem Kunden die Möglichkeit 

sich Angebote und Artikel selbst zu konfigurieren und zu personalisieren. 

Der Kunde stellt sich über Tools, die der Anbieter zur Verfügung stellt, z.B. das 

Layout der Seite und das Angebot selber zusammen 

Bei der Lernenden Personalisierung geht es um das System, nicht um den Internetbesucher 

selbst. Dieses versucht aus dem Verhalten der Internetbesucher zu 

lernen und auf der Grundlage der Informationen darauf zu reagieren. Dieses System 

vergleicht z.B. neu erhaltene Daten mit schon erstellten Benutzerprofilen 

und ordnet die neuen Daten in Klassen ein. 

8

3 Komponenten der Personalisierung 

Dieser Abschnitt befasst sich mit den Möglichkeiten an Informationen zu gelangen, 

um eine gute Datenbasis für die Personalisierung zu bekommen. Darüber 

hinaus werden Möglichkeiten dargestellt die Kunden, bzw. Internetbesucher wieder 

zuerkennen. 

3.1 Formen der Personalisieung 

Bevor eine Personalisierung sinnvoll und auch langfristig lohnend ist, versuchen 

die Anbieter auf Basis von gesammelten Daten ein Benutzerprofil zu erstellen. 

Diese Daten können direkt vom Kunden kommen, oder diese können auch durch 

das Verhalten des Kunden herausgefiltert werden. Am besten ist die Kombination 

dieser zwei Möglichkeiten, nämlich der expliziten und impliziten Datenerfassung. 

Unter expliziten Daten, versteht man das bewusste, bzw. direkte Bereitstellen 

der Daten durch den Internetbesucher. Beispiele hierfür wären Newsletter, Fragebögen, 

die Teilnahme an Gewinnspielen und Softwareregistrierung. Bei den 

genannten Beispielen muss der Nutzer meistens animiert werden, durch Prämien 

und Preise korrekte Daten abzugeben, bzw. sinnvolle Daten zu liefern. Untersuchungen 

zeigen, dass 90% der Internetbesucher bereit sind, bei Auszahlung einer 

Prämie persönliche Daten bereit zu stellen.[Kra99] Da nur korrekte und sinnvolle 

Daten zu einem sinnvollen und für Werbezwecke zu benutzenden Ergebnis 

führen, die Richtigkeit der Daten ist für die Personalisierung das wichtigste Kriterium. 

Die Erfahrung zeigt jedoch, dass diese Form nur von wenigen Kunden, 

bzw. Internetbenutzern angenommen wird, wenn der Aufwand zu hoch ist, oder 

die Konfiguration zu komplex ist.[RK02] 

Bei der impliziten Datenerfassung, gibt der Internetbesucher unbewusst, bzw. 

indirekt seine Daten preis. Diese werden durch die Analyse des Verhaltens z.B. 

durch die Methoden der Clickstream-Analyse ausgewertet. Die Clickstream- 

Analyse wertet das Verhalten bei den Besuchen von Webseiten aus und erfasst 

den Pfad mit dem der Internetbesucher durch das Internet ” surft“. 

Auch die Auswertung des Kauf- und Surfverhalten stellt eine Basis für die Daten 

dar, um ein Benutzerprofil zu erstellen. Jedoch kann diese Datenerfassung 

nur durchgeführt werden, wenn auf der Seite ein genügend großer Benutzerkreis 

zu finden ist und dementsprechend eine große Anzahl an Daten vorhanden und 

so eine sinnvolle Auswertung möglich ist. Darüber hinaus können Daten auch 

offline gewonnen werden,z.B. in Call Centern. Um aber wirklich langfristig eine 

gute und effektive Personalisierung zu schaffen, muss man die Daten ständig 

sammeln und jede Transaktionsphase einzeln auswerten. Somit kann die Qualität 

der Daten verbessert werden, was speziell bei guten und treuen Kunden 

von großer Bedeutung ist, da das Kaufverhalten oft und stark variiert. 

9

3.2 Einbinden der Informationen 

Wie in 3.1 beschrieben wird ein sinnvolles Benutzerprofil durch die Kombination 

expliziter und impliziter Daten erstellt und einer ständigen Sammlung dieser. 

Man versucht auf Basis dieses erstellten Benutzerprofils dem Kunden personalisierte 

Angebote und personenbezogene Werbung zu unterbreiten. Im folgenden 

wird dargestellt, wie ein Benutzerprofil in einzelnen Schritten entsteht. Zunächst 

ist der Internetbesucher dem Anbieter unbekannt. Durch interessante Inhalte 

und unkomplizierte Handhabung muss sein Interesse geweckt werden. Der Kunde 

wird im Falle eines Interesses an der Seite, eines Emailanbieters oder an 

einem Portal sein Interessengebiet selektieren und sich die Inhalte individuell 

einrichten. Nach diesem Schritt lässt sich mit Einrichtung eines Accounts ein 

Primärprofil erstellen. Im nächsten Schritt wird ein Transaktionsprofil erstellt. 

Durch Auswertung des Click-, Surf- und evtl. auch schon des Kaufverhaltens 

wird ein Feinprofil erstellt, das so genannte Sekundärprofil, das sehr viel detaillierter 

ist. Bis hierhin handelt es sich um ein Front-Office und bis auf den 

letzten Punkt ist es ein reines Kunden-Pull, d.h. der Kunde hat einen sehr hohen 

Aufwand und stellt die Informationen bereit. Danach folgt eine Clusterbildung 

und es beginnt das Back-Office, der Anbieter-Push. Hier versucht der Anbieter 

die Kunden in wirtschaftliche Gruppen zusammen zufassen, daraus wird das 

Zielgruppen-Profil herausgearbeitet. Der letzte Schritt ist die Einordnung der 

Kunden als individuelles Mitglied der Community mit den bekannten Präferenzen 

und Vorlieben des Internetbesuchers. [Son01] Das Beispiel kann auch mit 

anderen Techniken durchgeführt werden, auf die in Abschnitt 4 eingegangen 

wird. 

3.3 Identifikation der Internetbenutzer 

3.3.1 Logfiles 

Es ist für den Anbieter möglich, anonyme Daten zu sammeln, die nicht unter 

das in Abschnitt 2.3 aufgeführte BDSG fällt und Internetbenutzer wieder zu 

erkennen. Anonyme Daten werden z.B. in Logfiles gespeichert. Diese speichern 

sämtliche Zugriffe auf Dateien einer Webseite und werden von einem Webserver 

protokolliert. Jede Zeile im Logfile entspricht einem Zugriff auf eine Datei der 

Webseite. Dieser Zugriff, auch Hitgenannt, entspricht einer Aufforderung eines 

Computers an den Webserver, eine bestimmte Aufgabe zu erledigen. Meistens 

lautet dieser Befehl das Senden einer Datei. Die so gesammelten Daten werden 

fortlaufend in eine Datei geschrieben, Abbildung 2 ist ein Ausschnitt eines solchen 

Logfiles, welches auch Protokoll- oder Log-Datei genannt wird. 

Diese Zeile beschreibt einen kompletten Aufruf einer Seite, die aus einer festen 

Struktur besteht. Die Zeilen der Logfiles sind nach einem bestimmten Schema 

aufgebaut. Als erstes wird die IP - Adresse gespeichert, manchmal auch der Provider, 

mit dem sich der Benutzer ins Internet eingewählt hat. Jedoch kann man 

anhand dieser nicht immer sehen, ob es sich um eine eindeutige IP - Adresse 

handelt. Auch weiß man nicht, ob es sich nur um einen Nutzer handelt, oder 

10

... 

192.168.156.36 - [20/Jan/2002:19:35:09 +0100] “GET / HTTP/1.1” 

200 25641 www.devmag.net “http://www.devmag.net/” “Mozilla/4.0 

(compatible; MSIE 5.5; Windows ME; DigExt)” 

... 

Abbildung 2: Ausschnitt eines Logfiles 

um verschiedene, die den gleichen Rechner benutzen. Jedoch ist diese IP innerhalb 

einer Session eindeutig und identifiziert den Internetbesucher. Der zweite 

Eintrag - auch Informationsblock genannt - ist das Datum und die Uhrzeit, und 

zwar in GMT-Zeitformat (bei MEZ wird eine Stunde aufsummiert). Die Bezeichnung 

” Get“ legt fest, welche Daten vom Server an den Client geschickt wurden. 

Dieses wird in einem Protokoll codiert, hier in http. Es gibt auch die Möglichkeit 

eines Eintrages ” Heads“, welcher meistens bei Suchmaschinen auftaucht. Hier 

wird das letzte Änderungsdatum dargestellt und gegebenenfalls wird abgewogen, 

ob die Seite neu indexiert wird. Die folgende Zahl stellt den Rückgabecode, 

bzw. Statusmeldung da, hier die Kennzahl 200, die bedeutet, dass der Zugriff 

erfolgreich war und der Server die Anforderung der Clients fehlerfrei erhalten, 

sie verstanden und akzeptiert hat. Weitere Rückgabecodes sind im folgenden: 

• 204 No Content Das Dokument, welches angefordert wird enthält keine 

Daten 

• 206 Partial Content Die Übertragung wurde unterbrochen. Dies kann vom 

Browser aus geschehen, oder bei einem Update der Seite. 

• 300 Multiple Choices Es gibt mehrere (ähnliche) Dateien. Der Server kann 

die Datei nichteindeutig ermitteln, und bietet mehrere Auswahlmöglichkeiten. 

• 301 Moved Permanently Die Datei wurde an einen anderen Ort verschoben. 

• 304 Not Modified Die Datei wird komplett aus dem Cache (Server und/oder 

Clientseitig) geladen. 

• 400 Bad Request Der Webserver ” versteht“ die Anfrage nicht. 

• 401 Unauthorized Sie sind nicht autorisiert, diesen Bereich zu betreten. 

• 403 Forbidden Der Zugriff auf die angeforderte Datei wird verweigert 

• 404 Not Found Die Datei wurde nicht gefunden (ist nicht vorhanden), oder 

der URL wurde falscheingegeben. 

• 500 Internal Server Error, ein unbekannter Server Fehler ist aufgetreten. 

Oftmals entstehen diese durch falsche Anwendung von .htaccess - Dateien, 

oder durch Fehler im CGI. 

11

• 503 Service Unavailable Der Server kann die Anfrage zeitweilig nicht bearbeiten, 

z.B. bei Wartungsarbeiten 

Die Zahl vor der URL ist die Anzahl der gesendeten Daten in Byte, bei Kenntnis 

der Gesamtgröße der Datei, kann erkannt werden, ob die Datei vollständig 

übertragen wurde. Bei einer indirekten Anfrage, z.B. über einen Link einer anderen 

Seite, oder über eine Suchmaschine, hier der erste URL in Abbildung 2, 

welche den Zugriff erzeugt hat, werden beide URL eingetragen. Zum einen die, 

die den Eintrag erzeugt hat, also die Seite die zuerst aufgerufen wurde, bspw. 

www.google.de [goo03], diese wird als Referer-Seite bezeichnet. In dem vorliegenden 

Beispiel ist sie www.devmag.net [dev03]. Bei einem direkten Zugriff auf 

eine Seite entfällt die zweite URL, d.h. es würde nur die Seite angezeigt werden, 

die den Zugriff erzeugt hätte. Als letztes werden nähere Informationen zu dem 

Client, bzw. zu dem System von welchem der Aufruf getätigt wurde gespeichert. 

Der verwendete Browser, bis zu dem Betriebssystem,in diesem Beispiel wird ein 

Internet Explorer Version 5.5 verwendet und der Benutzer arbeitet mit einem 

Windows ME Betriebssystem. [Dev02] Diese Daten der Logfiles können für statistische 

Auswertungen verwandt werden. Speziell bei Suchmaschinen werden so 

die Rankings kontrolliert. Außerdem bilden sie die Basis für eine Clickstream- 

Analyse. Das Problem der Logfiles ist, dass sie im rohem Zustand sehr viele 

Einträge enthalten, die den wahren Verkehr einer Seite verfälscht wiedergeben 

und deshalb zu falschen Ergebnissen führen könnten. Daher müssen Logfiles 

im Vorfeld einer Analyse sorgfältig aufbereitet werden. Ein weiteres Problem 

stellen so genannte Cache-Mechanismen dar. Diese legen angeforderte Seiten in 

einem lokalen Zwischenspeicher (Cache) ab und verfälschen dadurch die Anzahl 

der Seitenaufrufe. Diese Problem kann minimiert werden, indem man den 

User motiviert, oder ” zwingt“ die Seite regelmäßig zu aktualisieren. Die einzelnen 

Einträge der Logfiles werden zu einer Session zusammengefasst. Die entstehende 

Einheit, d.h. der gesamte Verlauf eines Internetbesuches wird gebündelt 

und gesamt betrachtet, darunter fallen die versch. Seitenaufrufe eines Benutzers. 

Die Bündelung wird als Sitzung oder Session bezeichnet, um eine genaue 

Auswertung, z.B. der Verweildauer zu erlangen werden nur die Daten zur Auswertung 

herangezogen, die zwischen zwei Seitenaufrufen maximal eine halbe 

Stunde betragen.[unk02b] 

3.3.2 Cookies 

Eine weitere Möglichkeit die Internetbesucher zu identifizieren ist die Speicherung 

in Cookies. Cookies sind Einträge in der Datei COOKIES.TXT oder 

im Verzeichnis COOKIES auf dem Rechner des Teilnehmers. Sie werden von 

Webservern generiert und beim nächsten sich anschließenden Zugriff des Teilnehmers 

auf den die Cookies erzeugenden Webserver wieder an diesen übermittelt. 

Man unterscheidet im Allgemeinen zwischen persistent gespeicherten Cookies, 

d.h. dauerhaft abgelegten Cookies, die datenschutzrechtlich sehr diskutiert 

12

werden und transistente Cookies, die nur innerhalb einer Session gespeichert 

werden, das bedeutet, dass Cookies eine so genannte ” Lebensdauer“ besitzen. 

Erreicht ein Cookie sein ” Verfallsdatum“, wird dieses automatisch vom Browser 

gelöscht. Name und Ablageverzeichnis sind abhängig vom eingesetzten Browser. 

Auch manuell können Cookies und diesen Verzeichnissen gelöscht werden, oder 

sie können, wie in Abschnitt 2.3 erwähnt über das Option-Menü des Browsers 

deaktiviert oder von Anfang an nicht zugelassen werden. Ein weiterer Punkt 

ist das Datenvolumen durch die Cookies, es dürfen maximal 20 cookie-Einträge 

eines einzelnen Servers auf dem Rechner erzeugt werden, wobei jeder Eintrag 

wiederum maximal 4 KB haben darf. Die Gesamtzahl der auf den Rechner gespeicherten 

Cookies darf 300 nicht überschreiten. In Abbildung 3 ist ein Auszug 

einer solchen Textdatei zu sehen. Jedes Tupel, d.h. jede Tabellenzeile steht dabei 

für ein Cookie. 

In der ersten Spalte wird die Domäne, hier ” .spiegel.de“ dargestellt, an die 

Abbildung 3: Auszug einer Cookiedatei [Unk02a] 

die Information weitergegeben wird. Die zweite Spalte legt das flag fest, es gibt 

an, ob alle Rechner dieser Domäne auf den Cookie lesenden Zugriff haben, bei 

” TRUE“(wahr) ist das der Fall. Bei dem Eintrag FALSE“(falsch) hätte nur 

” 

ein Rechner den Zugriff. Mit der Pfadangabe in der dritten Spalte kann weiter 

eingeschränkt werden, an welchen Server die Informationen übertragen werden. 

Dieser Eintrag gilt hauptsächlich für die Informationsübertragung. In den meisten 

Fällen steht in dieser Spalte ein einfaches / “, was bedeutet, dass die 

” 

Informationen grundsätzlich gesendet werden. Eine weiterer möglicher Eintrag 

wäre ein Verzeichnis. In diesem Fall wird der Cookie nur dann zurückgegeben, 

wenn die rufende Seite in diesem oder in einem Unterverzeichnis liegt. Der Secure 

-Eintrag in der vierten Spalte beinhaltet eine verschlüsselte Anfrage. Nur 

wenn in den Zeilen ein TRUE“ steht, wird die Information übertragen, das wäre 

” 

der Fall wenn eine sichere Verbindung zwischen Client und Server vorliegt, d.h. 

wenn Hypertext Transfer Protocols (HTTPS) verwendet werden. In der fünften 

Spalte wird die Gültigkeitsdauer in codierter Form gespeichert. Nach dem Ver- 

” 

fallsdatum“ wird die Information nicht mehr gesendet. Die letzten zwei Spalten 

der Cookiedatei enthalten den Namen und den Wert bzw. Inhalt des Eintrages. 

Ein Problem dieser Speicherung ist die Akzeptanz der Cookies von den Internetbesuchern, 

wie schon in Abschnitt 2.3 erwähnt, auf Grund der Gefahr des 

Missbrauchs der Daten. Die Gefahren bei Verwendung von Cookies können für 

den Benutzer sein, dass über ihn Statistik geführt wird, was seine Besuche an- 

13

etrifft. Auch kann sein Surfverhalten auf dem besuchten Server gespeichert 

werden. Es kann durch Cookies in einigen Fällen zu Netzbelastungen und damit 

verbundene Wartezeiten kommen. Jedoch haben Cookies auch Nutzen, bei 

einem wiederholten Dialog mit den gleichen Anbietern müssen die Daten nicht 

erneut eingegeben werden, das hat eine Zeitersparnis zur Folge und ist bequemer. 

Es gibt verschiedenste Verwendungsmöglichkeiten. Z.B. werden Cookies in 

Verbindung mit persönlich zugeschnittenen Webseiten verwendet. Als Beispiel 

ist hier ” My Yahoo“[Yah03], oder Amazon [Ama03] zu nennen. Eine der populärsten 

Anwendungen für den Einsatz von Cookies ist die eindeutige Benutzererkennung 

für das Nutzen diverser Online-Angebote. Internetbesucher mit 

dynamischen IP-Adressen werden trotz der geänderten IP-Adresse bei einem 

weiteren Besuch wieder erkannt und müssen so nicht wieder alle Einstellungen 

erneut tätigen, etc.. 

3.3.3 explizite Benutzerregistrierung 

Die Identifikation durch explizite Benutzerregistrierung ist die einfachste Möglichkeit 

für den Anbieter Internetbesucher, bzw. Kunden wieder zuerkennen. Hier 

wird ein Benutzername und ein Passwort gewählt, über die der Besucher der 

Seite bei einem erneuten Log-in wieder erkannt werden kann. Das bedeutet diese 

Daten sind für eine Wiedererkennung notwendig. Es gibt auch die Verbindung 

zwischen der expliziten Benutzerregistrierung und Cookies, z.B. bei Banken. Die 

Einstellungen bleiben bestehen und der Anbieter der Webseite kann dem Kunden 

individuelle Angebote schicken. Der Kunde wird oft gebeten einige Angaben 

zu machen, meist in Form eines Fragebogens, bevor ein Konto, bzw. ein Account 

für ihn angelegt wird. Diese Art von Identifikation ist auch für die Pflege- und 

Updatemöglichkeiten die einfachste, denn der Benutzer kann in den meisten 

Fällen z.B. selbst seine Daten ändern, oder auch seine neue Interessen generieren. 

Er kann somit bei Bedarf in eine neue Klasse von Kunden eingegliedert 

werden. Dies hat sowohl für den Kunden, als auch für den Anbieter Vorteile. 

Der Kunde bekommt aktualisierte Werbung oder Angebote entsprechend seiner 

neuen Interessen oder Angaben, und der Anbieter erhält immer die aktuellsten 

Daten. Explizite Benutzerregistrierung findet man oft bei Emailanbietern, 

Online-Shops, Banken aber auch bei Foren und Chats. 

4 Personalisierungstechniken 

Es gibt verschiedene Techniken der Personalisierung von Inhalten. Im folgenden 

sollen drei wichtige vorgestellt werden: Zum einen die Clusteranalyse in 

Verbindung mit den Recommender Systemen; zum anderen die Assoziationsund 

Sequenzanalyse, auf der typische Bewegungspfade dargestellt werden und 

darüber hinaus die Klassifikationsanalyse mit Entscheidungsbäumen und neuronalen 

Netzen. 

14

4.1 Clusteranalyse 

Abbildung 4: Die Clusteranalyse nach Clarans[Fay96] 

Das Ziel einer Clusteranalyse ist laut Späth [Spä83] die Zusammenfassung 

der zu klassifizierenden Objekte zu Klassen, so dass die Objekte innerhalb einer 

Klasse möglichst ähnlich und die Klassen untereinander möglichst unähnlich 

sind. Die Clusteranalyse möchte durch Algorithmen eine Segmentierung erreichen, 

speziell auf Basis der expliziten und impliziten Daten. Es gibt verschiedene 

Clusterverfahren, die alle angewandt werden können, um das oben genannte Ziel 

zu erreichen. Die Wahl der jeweiligen Clusterverfahren ist abhängig von dem 

gewünschten Ergebnis und den vorhandenen Eingabedaten. Durch eine Vorauswahl 

bestimmter Datensätze, z.B. Aussortieren der so genannten Ausreiser aus 

der Statistik, kann die Effizienz gesteigert werden. Zum Beispiel bei einem Vergleich 

von Supermärkten wie Aldi, Lidl, Pennymarkt und Feinkost-Käfer, wäre 

letzteres ein Ausreißer; Feinkost-Käfer ist zwar auch ein Supermarkt, würde aber 

das durchschnittliche Ergebnis verfälschen, und die Auswertung wäre nicht sinnvoll. 

Da Käfer z.B. ein anderes Warenangebot besitzt und die Käuferschicht eine 

andere ist. Wichtig für eine sinnvolle Auswertung ist darüber hinaus die Definition, 

wie viele Cluster gebildet werden sollen und über wie viele Durchgänge 

der Algorithmus gehen soll. 

Man unterscheidet partionierende und hierarchische Clusteringverfahren. Sie 

werden im folgenden kurz beschrieben. Graphentheoretische Verfahren werden 

vernachlässigt. Im partionierenden Verfahren werden die Daten in k Cluster eingeteilt, 

wobei jeder Cluster C aus mindestens einem Objekt besteht, jedes Objekt 

höchstens einem Cluster angehört und die Cluster sich nicht überlappen. 

Partionierende Verfahren umfassen mehrere Ansätze z.B. den k-means- und den 

k-medoid- Ansatz. Hier werden Cluster durch zentrale Punkte dargestellt, die 

kompaktesten Cluster werden rausgefiltert. Es gibt darüber hinaus die Erwartungsmaximierung. 

Hier werden Cluster durch Gaußverteilungen repräsentiert 

und die Zugehörigkeit eines Objektes zu einem Cluster wird über Wahrscheinlichkeiten 

dargestellt. Gaußverteilungen sind eine statistische Kennzahl. Statistische 

Kennzahlen spielen bei der Clusteranalyse eine große Bedeutung. 

Auch bei hierarchischen Verfahren, wo das Distanzmaß, bzw. Unähnlichkeitsmaß 

15

Abbildung 5: Auswahl einiger Clusterverfahren[Dui01] 

und umgekehrt das Ähnlichkeitsmaß für Auswertungen herangezogen wird. Als 

letzter Ansatz für partionierende Verfahren gibt es das dichte-basierte Clustering. 

Hier werden Cluster durch Regionen geringerer Dichte voneinander getrennt. 

In Abbildung 4 wird die Clusteranalyse nach CLARANS dargestellt, zur Veranschaulichung 

der oben beschriebenen drei Ansätze des partionierende Verfahren. 

Im ersten Bild ist der k-mean und k-medoid- Ansatz dargestellt. Das erste Bild 

weist die kompaktesten Cluster auf, hier werden die einzelnen Punkte den einzelnen 

Clustern zugeteilt. Auf dem zweiten Bild ist die Erwartungsmaximierung 

dargestellt, die in das erste Bild zusätzlich die Zugehörigkeit eines Objektes zu 

einem Cluster in Form der Wahrscheinlichkeit ergänzt. Im letzten Bild kommt 

der Dichte basierte Ansatz dazu, dieser trennt die Cluster noch einmal weiter 

auf. 

Hierarchische Verfahren sind noch mal unterteilt in verschiedene untergeordnete 

Verfahren, auf die in dieser Arbeit nicht näher eingegangen wird. Diese teilen 

den Eingaberaum nicht nur in disjunkte Cluster ein, d.h. die Verfahren trennen 

die Cluster nicht nur, sondern bauen gleichzeitig noch eine Hierarchie von Clustern 

auf. Verfahren hierfür sind wie oben schon erwähnt das Unähnlichkeitsbzw. 

Ähnlichkeitsmaß aus der Statistik. Die Clusteranalyse bietet sich an, wenn 

Inhalte nach Zielgruppen stark variieren und kein einheitliches Ergebnis gefunden 

werden kann. 

4.2 Recommender Systeme 

Recommender Systeme sind ” Empfehlungssysteme“. Sie schließen automatisch 

von vorhandenen Informationen auch auf neue Daten. Bevor jedoch Recommender 

Systeme eingesetzt werden, müssen die Daten schon vorverarbeitet sein, 

16

z.B. durch Data Mining. Techniken des Data Minings sind die in Abschnitt 4.2 

genannte Clusteranalyse, die in Abschnitt 4.3 folgende Assoziations- und Sequenzanalyse 

und in Abschnitt 4.4 folgende Klassifikationsanalyse. Es gibt eine 

Vielzahl von Empfehlungen auf der Basis dieser Vorverarbeitung: 

• Nicht-Personalisierte - Empfehlung 

• Attribut-basierte - Empfehlung 

• ” Item-to-Item“ - Korrelation und 

• ” People-to-People“ - Korrelation; die ” People-to-People“ -Korrelation ist 

wiederum unterteilt in 

– regelbasierte - und 

– kollaborative Filterung 

Nicht - Personalisierte - Empfehlungen binden das Individuum nicht ein. Die 

Grundlage dieser Empfehlung ist der Durchschnitt der Meinungen aller Kunden. 

Wie in Abbildung 6 zu erkennen, wird ein Internetbesucher - in diesem 

Fall in Form des Männchen auf der linken Seite - modelliert mit einem roten 

Hut, mit den Durchschnitt der Internetbesucher verglichen. Diese haben zu ihrem 

roten Hut eine rote Tasche gekauft, bzw. besitzen eine, deshalb wird dem 

Internetbesucher eine rote Tasche empfohlen, zu sehen auf der rechten Seite der 

Abbildung 6. 

Abbildung 6: Schaubild zu Nicht-Pesonalisierte-Empfehlungen[Buc01] 

Die zweite zu betrachtende Form der Empfehlung sind die Attribut - basierten 

Empfehlungen. Hier liegen syntaktische Eigenschaften den gewünschten Objektgruppen 

zu Grunde, d.h. der Kunde gibt an, welche Eigenschaften das gewünschte 

Objekt entsprechen soll. In Abbildung 7 wird dargestellt, dass ein Internetbesucher 

die Farbe des gewünschten Objekt definiert in dem betrachteten Beispiel 

17

trägt er einen roten Hut und definiert deshalb die Eigenschaft rot. Auf dieser 

Basis wird im eine rote Tasche empfohlen. 

Abbildung 7: Schaubild zu Attribut-basierten Empfehlungen[Buc01] 

Die ” Item-to-Item“ - Korrelation empfiehlt auf Basis der Produkte aus einem 

Warenkorb weitere sinnvolle Produkte. Ein Beispiel hierfür wäre der Kauf eines 

Handys. Aus diesem Kauf resultiert die Empfehlung von Handyzubehör, wie 

z.B. Oberschale, Akku, etc.. 

Die letzte Form von Empfehlungen ist die ” People-to-People“ - Korrelation, die 

ihrerseits noch mal unterteilt wird in Content-Based-Filtering, auch regelbasierte 

Filterung genannt und in kollaboratives Filtern, die ” soziale Filterung“. 

Bei der regelbasierten Filterung werden aus Verhaltensregeln und inhaltlichen 

Zusammenhängen Empfehlungssysteme erarbeitet, die nach dem ” WENN - DANN“ 

- Konzept arbeitet. Ein Beispiel hierfür wäre: wenn ein Kunde z.B. ein Hemd 

kauft wird ihm direkt eine Krawatte empfohlen, da diese zwei Sachen zusammenhängen 

und meist zusammen gekauft werden. 

In Abbildung 8 ist diese Filterregel zu sehen. Der Kunde kauft einen roten Hut - 

modelliert durch das Männchen auf der linken Seite -. Auf Grund der Erfahrungen 

ist bekannt, dass jeder, bzw. eine Vielzahl der Kunden, die einen roten Hut 

gekauft, auch eine rote Tasche gekauft haben, bzw. eine solche besitzen. Diese 

wird dem Kunden dann empfohlen und im besten Fall aus Sicht des Anbieters, 

bzw. Händlers wird diese auch gekauft. 

Abbildung 8: Schaubild zu regelbasierter Filterung[Buc01] 

Im Unterschied dazu bezieht sich die kollaborativen Filterung auf statistische 

Muster von Kundengruppen und legt keinen Wert auf den Inhalt, d.h. die Präferenzen 

eines Kunden werden mit denjenigen anderer Kunden abgeglichen. Die 

18

Filterung könnte mit einer Art Mund - zu -Mund - Propaganda verglichen werden. 

Abbildung 9 zeigt, dass jeder der nach einem roten Hut fragt, bzw. einen 

roten Hut kauft - modelliert durch das Männchen auf der linken Seite - auch 

eine grüne Tasche kauft. Auf Grund des Kaufverhalten der anderen Kunden, 

wird der Kauf eine grünen Tasche empfohlen. Andere Kunden empfehlen die 

grüne Tasche zu dem roten Hut. 

Abbildung 9: Schaubild zu kollaborativen Filterung[Buc01] 

Recommender Systeme sind eng mit dem Erfolg der Personalisierung verknüpft, 

denn ist die Empfehlung gut und treffend kann es sein, dass aus einem potentiellen 

Kunden ein Kunde wird. Es kann auch aus einem Kunden ein zufriedener 

Kunde werden, da sich dieser gut beraten und individuell betreut fühlt und 

deshalb häufiger und mehr kauft. 

4.3 Assoziationsund Sequenzanalyse 

Die Assoziations- und Sequenzanalyse ist hauptsächlich die Analyse typischer 

Bewegungspfade, auch ” Click-Stream“- Analyse genannt. Die Datenbasis für 

diese Analyse sind die in Abschnitt 3.3 beschriebenen Logfiles. Es gibt auch 

hier einige unterschiedliche Verfahren wie z.B. den Apriori - Algorithmus, hierarchische, 

quantitative Assoziationsregel und die Fuzzy Assoziationsregel. Sie 

sind für die Aussage über zeitliche Entwicklungen des Konsumverhaltens wichtig. 

Beispiele hierfür sind die Auswertungen, nach wie vielen ” Clicks“ es zum 

Kauf kommt, oder nach welchem zeitlichen Abstand der nächste Kauf getätigt 

wird. 

4.4 Klassifikationsanalyse 

In dem Klassifikationsverfahren werden Kunden in bestimmte Klassen eingeordnet, 

z.B. in ” Käufer und Nichtkäufer“. Hierbei teilt ein Klassenattribut ein 

unbekanntes Objekt in eine vorher bekannte Klasse ein. Die meist verwendeten 

Werkzeuge hierfür sind Entscheidungsbäume und Neuronale Netze. Die Vorteile 

von Entscheidungsbäumen sind die leicht verständlichen Ergebnisse. 

19

Nicht klassifizierte Objekte wandern von der ” Wurzel“ dieses Entscheidungs- 

Abbildung 10: Auszug eines Entscheidungsbaums einer Bank 

baums zu einem ” Blatt“ und werden dadurch klassifiziert auf Grund der bestimmten 

Attribute. Entscheidungsbäume verzweigen automatisch nach den Attributen, 

die die beste Selektion ermöglichen, um eine sinnvolle Auswertung 

zu erhalten. Sie erfordern aber einen hohe Rechenaufwand und es besteht die 

Gefahr zu kleiner Segmente. Neuronale Netze ermöglichen das Auffinden beliebiger 

Muster und sind gut geeignet für Vorhersage-Modelle. Die entstandenen 

Ergebnisse sind jedoch schwer zu erklären und neuronale Netze benötigen 

einen rechenintensiven Lernprozess. Es gibt aber noch eine Vielzahl von anderen 

Möglichkeiten wie Bayes - Klassifikatoren. Diese sind gut geeignet für 

Textklassifikationen und erhalten bei genauer Durchführung die höchste Klassifikationsgenauigkeit. 

Sie sind aber nicht immer einsetzbar und werden nicht 

näher erläutert. 

Ein weiteres Verfahren sind Nächste - Nachbarn - Klassifikatoren. Bei den Klassifikationsverfahren 

gilt das gleiche wie bei der Clusteranalyse. Ein bestes Verfahren 

ist nicht oder nur schwer auszumachen. Je nach Einsatzgebiet liefert jeder 

Ansatz unterschiedlich gute und sinnvolle Ergebnisse. 

5 Praxisbeispiele 

In dieser Arbeit wird das Paradebeispiel der Personalisierung, nämlich die Homepage 

von Amazon [Ama03] in Form zweier Screenshots dargestellt und ausgewertet. 

Darüber hinaus werden noch andere Beispiele aus der Praxis genannt 

20

und kurz erklärt. 

Auf der Abbildung 11 sind verschiedene Auswertungen zu erkennen, die zu ei- 

Abbildung 11: Screenshot der Homepage des Online Händlers Amazon[Ama03] 

ner Personalisierung geführt haben. Wenn ein Internetbesucher auf die Seite von 

Amazon kommt und z.B. ein Buch sucht, in diesem Beispiel Harry Potter. Auf 

diese Anfrage hin bekommt der Inetrenetsesucher ein Buch empfohlen, in diesem 

Fall das aktuellste, mit den Beisatz, ” das könnte ihnen gefallen“. Es könnte 

sich hierbei um die Nicht-Personalisierte Empfehlung handeln oder die Attribut 

- basierte Empfehlung. Denn der Benutzer wählt Harry Potter, der Großteil 

der Kunden wollte genau diesen Band und hat ihn gekauft. Es kann auch sein, 

dass der Kunde in eine Gruppe eingeordnet wird und diese hat sich auch bei 

den gewünschten Eigenschaften für das Buch entschieden. In diesem Fall wurde 

Harry Potter Buch als Grundlage genommen. Darüber hinaus gibt es auf 

der vom Betrachter aus rechten Seite eine Sparte Lieblingslisten. Hier werden 

21

Güterbündel von schon abgeschlossenen Transaktionen von Kunden aufgeführt 

als Anregung möglicher Kauf-Kombinationen. Der Vorteil hierbei ist, der Kunde 

kann sich in eine der vorhandenen Klassen selbst einordnen, wie hier z.B. 

Harry Potter Fan oder Leser und kann zusätzlich zu dem von ihm favorisierten 

Buch sich Anregungen holen. In der oberen Leiste kann der Kunde sich zum 

einen selber ein Log-in besorgen, welches für eine Transaktion benötigt wird. 

Dieses kann mit dem Button rechts oben ” mein Konto“ gepflegt und überwacht 

werden. In ” meinem Konto“sind die bereits bestellten Waren zu sehen und das 

dazugehörige Datum, die Empfehlungen, etc.. Ein Vorteil hierbei ist die One - 

Click -Bestellung, hierbei werden alte Daten, wie Kontonummer oder Adresse, 

die aus der vorherigen Transaktion gespeichert wurden aufgerufen. Der Kunde 

muss diese nicht erneut eingeben. 

Auf der Abbildung 12 lassen sich noch mehr Empfehlungsformen wieder finden. 

Abbildung 12: Screenshot der Homepage des Online Händlers Amazon[Ama03] 

22

Die kollaborative Filterung wurde durchgeführt, um dem Kunden weiterführende 

Empfehlungen auszusprechen. Diese wurden auf der Basis der Präferenzen 

von Kunden im Vergleich zu den eigenen Präferenzen. ( ” Kunden, die dieses Buch 

gekauft haben, haben auch diese Bücher gekauft:“). 

Amazon stellt auf ihrer Seite auch ein Forum zur Verfügung als Kommunikationsmöglichkeit. 

Amazon setzt in diesem Fall die in Abschnitt 2.4 vorgestellte 

Service-Personalisierung um. Diese hat den Vorteil hat, dass der Kunde objektive 

Meinungen zu dem Buch erhält, die nicht vom Anbieter selbst kommen (Rezensionen). 

Amazon stellt auch noch weitere Serviceleistungen zur Verfügung, 

die dem Kunden das Gefühl gibt, gut betreut zu sein und individuell beraten zu 

werden, wie zum Beispiel die statistische Auswertung, wie den Verkaufsrang, was 

einen Trend wieder spiegelt. Als weitere personalisierte Internetseiten kann man 

EBAY [Eba03] nennen, die durch die in Abschnitt 2.4 genannte Preispersonalisierung 

die Kunden bindet. EBAY stellt auf der Basis der bekannten Kunden- 

Verkäufer- Beziehung Nutzerdaten zur Verfügung zu bekannten Preisen. Kunden 

bekommen Daten, meistens Informationen über Produkte und EBAY stellt 

die Kommunikationsebene dafür bereit. Auch Comdirect[com03] ist eine personalisierte 

Internetseite, bzw. bietet Tools an, die der Kunde nutzen kann um 

sich z.B Portfolios und Watchlists zu generieren. Es gibt kaum noch eine Seite 

die nicht in irgendeiner Art und Weise mit Personalisierung oder den daraus resultierenden 

Empfehlungen arbeitet. Auch Emailanbieter, wie gmx, oder yahoo, 

sowie Suchmaschinen altavista, etc. verwenden Personalisierungstechniken, um 

individuelle Angebote und Werbungen an die Kunden zu verschicken. 

6 Fazit 

Immer mehr Menschen benutzen das Internet zum Einkaufen. Mit der wachsenden 

Anzahl der Internetbenutzer, gibt es immer mehr Onlineshops, die in 

einem starken Konkurrenzkampf stehen. Die Konkurrenten sind in jedem Fall 

nur einen Mausklick entfernt. Für jedes Unternehmen ist die Kundenbindung 

das höchste Gut, da diese eng mit dem Erfolg des Unternehmens in Verbindung 

steht. Das Unternehmen kann dies über den Preis erreichen, jedoch ist dieser 

alleine kein Instrument Kunden zu binden. Das wichtigste Instrument Kunden 

zu binden ist die Personalisierung, da bei Preisen die Konkurrenz nachziehen 

kann. Jeder einzelne Kunde muss ernst genommen, seine Bedürfnisse und seine 

Beschwerden erkannt und befriedigt, bzw. ausgeräumt werden. Dafür muss das 

Unternehmen ständig Informationen sammeln und dem Kunden Möglichkeiten 

geben sich zu äußern, z.B. in Foren. Der After - Sale - Service ist ein probates 

Mittel die Kundenzufriedenheit zu stärken, dieser Service kann ein Teil der Personalisierung 

sein. Personalisierung versucht durch ständiges Datensammeln die 

Kunden-Profile zu verdichten und so effektiver individualisierte Dienste anbieten 

zu können, wie personalisierte Werbung und Angebote. Personalisierung ist 

nur dann effektiv, wenn sie langfristig ausgelegt ist und mit qualitativ hochwertigen, 

d.h. mit sehr genauen Daten arbeitet. Personalisierung bringt bei erfolgreicher 

Anwendung dem Anbieter einen wirtschaftlichen Nutzen. Jedoch muss 

23

der Mehraufwand an Rechnerleistung, Zeit und finanzielle Ressourcen, der für 

Personalisierung notwendig ist, aus Sicht des Anbieters, ebenfalls berücksichtigt 

werden. 

Die Internetbenutzer haben durch Personalisierung eine Zeitersparnis, denn die 

gebotene Informationsflut wird für sie selektiert, und sie bekommen nur die 

gewünschten Informationen. Auch wird durch Personalisierung die Angst genommen, 

wie z.B. die Anonymität des Internets. Doch die Gefahr besteht, dass 

aus der durchaus gewünschten Personalisierung ein unerwünschtes Eindringen 

in die Privatsphäre wird und der Kunde regelmäßig auch unerwünschte Newsletter 

und Werbung bekommt. Ungeachtet dieser Gefahr ist Personalisierung eines 

der wichtigsten Instrumente Kunden zu binden, Neukunden zu werben und personalisierte 

Angebote zu unterbreiten. 

Wir müssen innerhalb unserer Projektgruppe versuchen, möglichst viele und 

korrekte Daten zu bekommen. Diese müssen in Datenbanken abgespeichert 

und bereinigt werden. Darüber hinaus müssen wir auch Datenschutzrechtliche 

Aspekte berücksichtigen und durch Auswahl der aufgeführten Techniken zu guten 

und sinnvollen Benutzerprofilen zu kommen. Wir agieren als Kartenanbieter 

und bekommen durch die Kartenanmeldung schon demographische Daten, bei 

einem Einkauf mit dieser Karte bekommen wir darüber hinaus noch Transaktionsdaten. 

Diese können wir mit den vorhandenen Daten und Informationen 

in Verbindung stellen und dem Händler ein Benutzerprofil verkaufen, mit dem 

dieser personalisierte Angebote und Werbung verschicken kann. 

Glossar 

A 

Accounts, S.10 Zugangsberechtigung auf einem Netzwerk. Dazu benötigt man 

einen Benutzernamen und ein persönliches Passwort 

B 

Benutzerprofil, S.9 Das Benutzerprofil enthält alle Infos, die einen Benutzer 

des Netzwerkes definieren. Dazu gehören unter z.B. der Benutzername 

(Kennwort), das Passwort, die Gruppen, denen der Benutzer angehört, 

sowie die Rechte des Benutzers. 

Betriebssystem, S.12 Grundlegendes Programm, das den Computer in die 

Lage versetzt zu arbeiten. Das Betriebssystem übernimmt die Steuerung 

und Verwaltung der internen Rechnerfunktionen, es legt Daten auf Datenträgern 

ab und sorgt für das Wiederauffinden. 

C 

24

Cookies, S.6 sind kleine Textdateien, die lokal auf dem Rechner abgelegt werden, 

in denen Informationen abgespeichert werden, die im Zusammenhang 

der gerade betrachteten Seite im Internet steht und mit dieser kommuniziert. 

H 

Hit, S.10 jeder Zugriff auf einen Teil (ob Seite, Bild oder Text) eines Web- 

Angebots, der im Log-File des Servers eingetragen wird. 

L 

Logfiles, S.10 Webserver protokollieren jeden Zugriff auf ein Element der Seite 

in einer Protokolldatei, deren Format durch die Konfiguration des Servers 

bestimmt wird. 

P 

Pull, S.10 ist das selbst bestimmte Heraussuchen von Informationen aus dem 

Web. 

Push, S.10 ist das ungefragte Erhalten von vorselektierten Daten aus dem 

Internet. Aktiv ist der Nutzer nur bei der Auswahl seines Interessenprofils 

T 

Tools, S.4 Bezeichnung für kleine Hilfsprogramme, die das Arbeiten erleichtern 

sollen. 

Literatur 

[ACPT99] Paolo Atzeni, Stefano Ceri, Stefano Paraboschi, and Riccardo Torlone. 

Database Systems. McGraw-Hill Publishing Company, 1999. 

[Agn01] Agnitas. Agnitas-newsletter ausgabe 24/01. www.agnitas.de/ 

newsletter/newsletter_24_01.htm, 2001. 

[Alt03] Altavista. www.altavista.com, 2003. 

[Ama03] Amazon. www.amazon.de, 2003. 

[Bon99] Monica Bonett. Personalization of Web Services: Opportunities and 

Challenges. unknown, 1999. 

[Buc01] Robert Buchberger. Wenn es persönlich wird ... - webpersonalisierung. 

http://www.contentmanager.de, 2001. 

25

[CB00] M. Calkins and M. Beckley. The ten rules of web personalization. 

unknown, 2000. 

[com03] comdirect. www.comdirect.de, 2003. 

[Del03] Dell. www.dell.com, 2003. 

[Dev02] Devmag. Logfiles - die spuren eines besuchers. http://wai.devmag. 

net, 2002. 

[dev03] devmag. www.devmag.net, 2003. 

[Dit00] Sabine Dittrich. Kundenbindung als Kernaufgabe im Marketing: 

Kundenpotentiale langfristig. Thexis Verlag, St. Gallen, 2000. 

[Dui01] Universität Duisburg. Clusteranalyse. http://www.uni-duisburg. 

de, 2001. 

[Eba03] Ebay. www.ebay.de, 2003. 

[Fay96] Fayyad. Knowledge Discovery and Data Mining: Towards a Unifying 

Frmework. unknown, 1996. 

[Fra00] H. Frank. Data Mining, Pratical Machine Learning tools and techniques 

with Java Implementations. unknown, 2000. 

[gme03] globale mobile exchange. www.gmx.de, 2003. 

[goo03] google. www.google.de, 2003. 

[Gro01] Gartner Group. Personalisierungsanwendungen. www. 

gartnergroup.de, 2001. 

[Han01] Kamber Han. Data Mining, Concepts and Techniques. Witte-Verlag, 

2001. 

[H.F01] H.Forstinger. Recommendation systems. http://www.iicm.edu/ 

thesis/hforstinger/Kapitel204.pdf, 2001. 

[HLHC01] Jens Herlück, Kai Larsen, Lars Kai Hansen, and Torben Christiansen. 

Are all e-costumers alike? unknown, 2001. 

[IBM02] IBM. Datenschutz: Datenschutzbestimmungen im web. www.ibm. 

com, 2002. 

[IHK01] IHK. Checkliste ecommerce für den mittelstand. http://www. 

duesseldorf.ihk.de/de/InnovationundUmwelt/innovation, 

2001. 

[Jan99] Dieter Janetzko. Statistische Anwendung im Internet. In Netzumgebung 

Daten erheben, auswerten und interpretieren. Addison Wesley, 

1999. 

26

[J.B96] J.Bacher. Clusteranalyse - Anwendungsorientierte Einführung. Oldenburg, 

1996. 

[Kra99] Jörg Krause. Electronic Commerce und Online-Marketing: Chancen, 

Risiken und Strategien. Hanser Verlag, München, Wien, 1999. 

[KSW00] H. Kuhn, H. Schabbel, and M. Wünsch. Personalisierung von websites. 


[Lin01] Johannes-Kepler-Universität Linz. My site! persoanlisierung von 

webinhalten. http://www.unet.univie.ac.at, 2001. 

[Man01] Prof. Dr. Roland Mangold. E-commerce: Kundenbindung. http: 

//www.psychologie.uni-mannheim.de, 2001. 

[Mün00] Westfälische Wilhelms-Universität Münster. Wissensrepräsentation 

für produktkataloge im hinblick auf recommender systems. http: 

//www.wi.uni-muenster.de/wi, 2000. 

[MN01] Marion Murzek and Sonja Nebl. Design ansätze zur personalisierung. 

http://www.ifs.univie.ac.at, 2001. 

[MWJL01] Dr.Matthias Meyer, Stefan Weingärtner, Thilo Jahke, and Oliver 

Lieven. Web Mining und Personalisierung in Echtzeit. Ludwig- 

Maximilian-Universität München, 2001. 

[NF01] S. Noller and J. Fink. Was bringt personalisierung auf meiner site? 


[Ott02] Prof. Dr. Jürgen Hans Ott. Data mining: Auswertung von daten in 

data warehouses. http://www.kecos.de/script/23dmining.htm, 

2002. 

[Quo01] Quocirca. Personalisierungsideen. http://www.quocirca.com/, 

2001. 

[RK02] Kai Riemer and Stefan Klein. Personalisierung von online-shops 

... und aus distanz wird nähe. http://www.firstsurf.com/ 

riemer0227_t.htm, 2002. 

[SH02] Peter Stahlknecht and Ulrich Hasenkamp. Einführung in die Wirtschaftsinformatik. 

Springer Verlag Berlin, 2002. 

[Son01] Dipl.-Ing. Michael Sonntag. Personalisierung. http://www.fim. 

uni-linzac.ac.at, 2001. 

[Spä83] H. Späth. Cluster-Formation und -Analyse. R. Oldenbourg -Verlag, 

1983. 

[Sto00] Markus Stolpmann. Kundenbindung im E-Business, Loyale Kunden 

- nachhaltiger Erfolg. Galileo Press, 2000. 

27

[TH01] Christiane Theusinger and Klaus-Peter Huber. Analysing the footsteps 

of your Costumers. unknown, 2001. 

[Ulm01] Universität Ulm. Was ist personalisierung? http://www. 

mathematik.uni-ulm.de/sai/ws01/portalsem/df/, 2001. 

[Unk02a] Unknown. Das ende der anonymität? www und mail: Kommunikation 

im internet. http://www.bsi.bund.de/literat/anonym/ 

wwwmail.htm, 2002. 

[unk02b] unknown. Web mining oder malen nach zahlen; mustersuche: 

die mining-verfahren. http://www.ecin.de/technik/ 

webminingprozess/index-3.html, 2002. 

[Yah03] Yahoo. www.yahoo.de, 2003. 

[Zie01] Gisela Ziedek. Wann personalisierungen sinn machen. http://www. 

contentmanager.de, 2001. 

28

Carl von Ossietzky Universität Oldenburg Hausarbeit ... - DIKO :: Index

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?