12.07.2015 Aufrufe

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

Temporale Aspekte des Data Mining - diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Themas. Zu <strong>de</strong>n Grundlagen gehören eine knappe Einführung in das <strong>Data</strong> <strong>Mining</strong>,die Definition <strong><strong>de</strong>s</strong> Zeitbegriffs und die Erläuterung <strong>de</strong>r notwendigen Voraussetzungen,um die Arbeit mit temporalen Daten zu ermöglichen.Zwei möglichen Repräsentationsformen ist das dritte Kapitel gewidmet. Hier wer<strong>de</strong>nzwei Wege vorgestellt, die zeigen wie mit temporalen Daten gearbeitet wer<strong>de</strong>n kann.Dazu gehören einerseits temporale Datenbanken, insbeson<strong>de</strong>re die Erweiterung <strong>de</strong>rbekannten relationalen Systeme und zum an<strong>de</strong>ren geht es um Zeitreihen.Das vierte Kapitel ”<strong>Temporale</strong> Muster“ stellt <strong>de</strong>n Kern <strong><strong>de</strong>s</strong> <strong>Data</strong> <strong>Mining</strong> dar, schließlichist das Ent<strong>de</strong>cken von Mustern (engl. Pattern) <strong><strong>de</strong>s</strong>sen Hauptziel. Innerhalb diesesKapitels wer<strong>de</strong>n ausgewählte temporale Muster vorgestellt, die beispielsweise zurPersonalisierung verwen<strong>de</strong>t wer<strong>de</strong>n können. Es gilt dabei häufige und wie<strong>de</strong>rkehren<strong>de</strong>Vorgänge festzustellen und allgemein gültig zu beschreiben. Zu <strong>de</strong>n bekanntestenMustern gehören die ”temporalen Assoziationsregeln“.Die Analyse <strong>de</strong>r temporalen Daten steht im Mittelpunkt <strong><strong>de</strong>s</strong> fünften Kapitels. In<strong>de</strong>r Datenanalyse wer<strong>de</strong>n die zuvor beschriebenen Muster ausfindig gemacht. ZurErläuterung <strong>de</strong>r Analysetechniken wer<strong>de</strong>n verschie<strong>de</strong>ne Algorithmen vorgestellt, diespeziell für die Bearbeitung von temporalen Daten konzipiert o<strong>de</strong>r daran angepasstwur<strong>de</strong>n. Dazu gehören Clustering- und Klassifikationsverfahren sowie <strong>de</strong>r GSP- undSPADE-Algorithmus.Die letzten bei<strong>de</strong>n Kapitel dieser Arbeit zeigen eine Einordnung dieses Teilthemas indas Gesamtbild <strong><strong>de</strong>s</strong> Projekts ”DIKO - <strong>Data</strong> in Knowledge out“ und die Schlussbetrachtung.Das Projekt beschäftigt sich mit <strong>de</strong>r Personalisierung internetbasieren<strong>de</strong>rHan<strong>de</strong>lsszenarien. Den Schluss dieser Arbeit bil<strong>de</strong>n Glossar und Literaturverzeichnis.2 Grundlagen und BegriffeIn diesem Kapitel wer<strong>de</strong>n die wichtigen Begriffe und notwendigen Voraussetzungenerläutert. Dazu gehören <strong>de</strong>r Zeitbegriff und die verwandten Begriffe ”Zeitraum“und ”Zeitpunkt“ sowie die ”Granularität“. Darüberhinaus gibt es unterschiedlicheMo<strong>de</strong>lle die Zeit darzustellen und es wird klar, dass <strong>de</strong>r Zeitbegriff an sich sehrsubjektiv sein kann. Bevor allerdings die mit <strong>de</strong>n temporalen <strong>Aspekte</strong>n in Zusammenhangstehen<strong>de</strong>n Begriffe eingeführt wer<strong>de</strong>n, soll noch knapp das <strong>Data</strong> <strong>Mining</strong>erklärt wer<strong>de</strong>n.2.1 <strong>Data</strong> <strong>Mining</strong>Im Zeitalter <strong>de</strong>r Informationstechnik wächst die Zahl <strong>de</strong>r Daten, die in Unternehmensowie in Wissenschaft und Forschung gespeichert wer<strong>de</strong>n ins Unüberschaubare[HK01]. Die Bemühungen, trotz <strong>de</strong>r Menge <strong>de</strong>r Daten die notwendigen wichtigen Informationenaufzu<strong>de</strong>cken, wer<strong>de</strong>n unter <strong>de</strong>m Oberbegriff ”Knowledge Discovery in<strong>Data</strong>bases“ (KDD) zusammengefasst. KKD ist <strong>de</strong>r ”nicht-triviale“ Prozess, <strong><strong>de</strong>s</strong>senZiel es ist, ”gültige, neue, potentiell nützliche und letztendlich verständliche Musterin Daten“ zu fin<strong>de</strong>n [FPSS96]. Man spricht <strong><strong>de</strong>s</strong>halb vom KDD-Prozess. DieserProzess besteht aus neun Schritten:1. Datenverständnis und Zielbestimmung (Kun<strong>de</strong>nsicht)2. Auswahl <strong>de</strong>r Daten3. Aufbereitung <strong>de</strong>r Daten (Preprocessing)4. Reduzierung und Projektion <strong>de</strong>r Daten5. Wahl einer geeigneten <strong>Data</strong>-<strong>Mining</strong>-Metho<strong>de</strong>3

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!