28.10.2013 Aufrufe

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Ein mo<strong>de</strong>rnes, im Internet präsentes Versandhaus analysiert seine Verkaufsdaten<br />

<strong>und</strong> macht die Feststellung, daß sich die K<strong>und</strong>en zwei verschie<strong>de</strong>ne<br />

Gruppen aufteilen lassen. Die Mitglie<strong>de</strong>r <strong>de</strong>r Gruppe ” Junger,<br />

gutverdienen<strong>de</strong>r, stadtbewohnen<strong>de</strong>r Karrierist“ weisen ein an<strong>de</strong>res Kaufverhalten<br />

auf als die K<strong>und</strong>en, die <strong>de</strong>r Gruppe ” Alleinerziehen<strong>de</strong> Sozialhilfeempfänger“<br />

angehören. Da die Mitglie<strong>de</strong>r <strong>de</strong>r ersten Gruppe <strong>de</strong>n größeren<br />

Beitrag zum Umsatz <strong>de</strong>s Unternehmens leisten, wird das Angebot <strong>de</strong>n<br />

Wünschen dieser K<strong>und</strong>en angepasst.<br />

Ein Supermarkt verwen<strong>de</strong>t die Barco<strong>de</strong>-Lesegeräte an <strong>de</strong>n Kassen dazu,<br />

die Daten <strong>de</strong>r einzelnen Einkäufe zu sammeln. Diese Daten wer<strong>de</strong>n an<br />

eine Datenbank übermittelt <strong>und</strong> dort gespeichert. Mittels KDD können<br />

Erkenntnisse darüber gewonnen wer<strong>de</strong>n, welche Waren häufig zusammen<br />

gekauft wer<strong>de</strong>n. Eine entsprechen<strong>de</strong> Anordnung dieser Waren in <strong>de</strong>n Regalen<br />

kann dann dazu führen, daß aufgr<strong>und</strong> zufrie<strong>de</strong>ner K<strong>und</strong>schaft die<br />

Verkaufszahlen steigen.<br />

Diese recht trivialen Beispiele machen <strong>de</strong>n allgemeinen Nutzen von KDD <strong>de</strong>utlich.<br />

In dieser Arbeit soll zunächst <strong>de</strong>r KDD-Prozess im Allgemeinen kurz vorgestellt<br />

wer<strong>de</strong>n, um anschließend näher auf zwei spezielle Metho<strong>de</strong>n einzugehen,<br />

die <strong>Assoziationsanalyse</strong> <strong>und</strong> die <strong>Konzeptbeschreibung</strong>. Die <strong>Assoziationsanalyse</strong><br />

wird anhand von Gr<strong>und</strong>lagen <strong>und</strong> Beispielen eingeführt. Im Anschluß wird<br />

mit <strong>de</strong>m Apriori-Algorithmus ein gr<strong>und</strong>liegen<strong>de</strong>r Algorithmus für das Fin<strong>de</strong>n<br />

von Assoziationsregeln erläutert. Das Kapitel <strong>Assoziationsanalyse</strong> schließt mit<br />

<strong>de</strong>r Vorstellung mehrerer komplexerer Assoziationsregeln ab, die für anspruchsvollere<br />

Aufgaben entwickelt wur<strong>de</strong>n. Mit <strong>de</strong>r <strong>Konzeptbeschreibung</strong> wird eine<br />

Metho<strong>de</strong> für die Ermittlung einer zusammengefaßten Sicht auf Datenmengen<br />

vorgestellt. Die <strong>Konzeptbeschreibung</strong> ist in zwei Komponenten geglie<strong>de</strong>rt: die<br />

Charakterisierung von Klassen <strong>und</strong> <strong>de</strong>m Klassenvergleich. Die Funktionsweise<br />

dieser bei<strong>de</strong>n Bereiche sowie auf <strong>de</strong>n ihnen zugr<strong>und</strong>eliegen<strong>de</strong>n Algorithmus <strong>de</strong>r<br />

attributorientierten Induktion wird im Rahmen dieser Arbeit genauer betrachtet<br />

wer<strong>de</strong>n.<br />

2 Knowledge Discovery in Databases<br />

KDD befasst sich mit <strong>de</strong>r automatischen Generierung <strong>und</strong> Prüfung von Metho<strong>de</strong>n<br />

<strong>und</strong> Hypothesen zur Beschreibung von in einem Datenbestand vorhan<strong>de</strong>nen<br />

Regelmässigkeiten. Es ist zwar keine allgemein anwendbare <strong>und</strong> sicher zum Erfolg<br />

führen<strong>de</strong> Metho<strong>de</strong> bekannt, mit <strong>de</strong>r Wissen aus Datenbanken gewonnen<br />

wer<strong>de</strong>n kann, aber es existieren viele Techniken, die auf viele praktische Probleme<br />

anwendbar sind <strong>und</strong> zu zufrie<strong>de</strong>nstellen<strong>de</strong>n Ergebnissen führen [bor]. KDD<br />

ist das Forschungsgebiet, daß sich mit <strong>de</strong>r Entwicklung <strong>und</strong> Untersuchung dieser<br />

Metho<strong>de</strong>n befasst. Die Anwendung dieser Techniken erfolgt im sogenannten<br />

KDD-Prozess. Dieser wird von Fayyad, Piatetsky-Shapiro & Smyth folgen<strong>de</strong>rmaßen<br />

<strong>de</strong>finiert [FPSS96]:<br />

KDD Process is the process of using the database along with any required<br />

selection, preprocessing subsampling, and transformations of it; to apply data<br />

mining methods (algorithms) to enumerate patterns from it; and to evaluate<br />

the products of data mining to i<strong>de</strong>ntify the subset of the enumerated patterns<br />

<strong>de</strong>emed ” knowledge“.<br />

2

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!