28.10.2013 Aufrufe

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4 <strong>Konzeptbeschreibung</strong> <strong>und</strong> Generalisierung<br />

Die in Datenbanken gespeicherten Datenmengen sind für Menschen für gewöhnlich<br />

höchst unübersichtlich. Für die Benutzer dieser Datenbanken ist es daher<br />

erstrebenswert, ein Werkzeug zu Verfügung zu haben, welches diese Daten<br />

in einer zusammengefassten, übersichtlicheren Form darstellen kann <strong>und</strong> Vergleichsmöglichkeiten<br />

bietet.<br />

Dieses Kapitel behan<strong>de</strong>lt die einzelnen Komponenten <strong>de</strong>r <strong>Konzeptbeschreibung</strong>.<br />

Dazu wer<strong>de</strong>n zunächst ein Einstieg in das <strong>de</strong>r <strong>Konzeptbeschreibung</strong> zugr<strong>und</strong>eliegen<strong>de</strong><br />

Verfahren <strong>de</strong>r Generalisierung vermittelt <strong>und</strong> Unterschie<strong>de</strong> zu<br />

einem an<strong>de</strong>ren Datenanalyse-Werkzeug ver<strong>de</strong>utlicht. Das Thema Attributrelevanzanalyse<br />

schließt das Kapitel ab.<br />

4.1 Motivation<br />

Die <strong>Konzeptbeschreibung</strong> o<strong>de</strong>r auch Klassenbeschreibung wur<strong>de</strong> zu diesem Zweck<br />

entwickelt. Sie ist die einfachste Form von beschreiben<strong>de</strong>m Data Mining. <strong>Konzeptbeschreibung</strong><br />

untersucht vorhan<strong>de</strong>ne Daten auf Gemeinsamkeiten <strong>und</strong> teilt<br />

sie <strong>de</strong>ment-sprechend in verschie<strong>de</strong>ne Gruppen bzw. Klassen auf (daher die Bezeichnung<br />

Klassenbeschreibung).<br />

Die <strong>Konzeptbeschreibung</strong> besteht aus zwei Komponenten, <strong>de</strong>r Charakterisierung<br />

von Klassen <strong>und</strong> <strong>de</strong>m Klassenvergleich. Bei<strong>de</strong> Teilbereiche basieren auf <strong>de</strong>r<br />

Generalisierung, einem Verfahren, das zur Abstrahierung von Relationen <strong>und</strong><br />

ihren Attributen eingesetzt wird.<br />

4.2 Einschub Generalisierung<br />

Seien Di, 1≤ i ≤ d, logisch zusammengehörige Mengen von Werten (Wertebereiche)<br />

mit ALLE ∈ Di. Sei R eine Relation R ⊆ D1 × D2 × ... × Dd mit <strong>de</strong>n<br />

Attributen A1, ..., Ad.<br />

Definition Konzepthierarchie (nach [San00b])<br />

Eine Konzepthierarchie für Di (bzw. für Ai) ist ein (typischerweise balancierter)<br />

Baum mit <strong>de</strong>n folgen<strong>de</strong>n Eigenschaften:<br />

Die Knoten <strong>de</strong>s Baumes repräsentieren Werte aus Di, die Wurzel <strong>de</strong>s Baumes<br />

repräsentiert <strong>de</strong>n speziellen Wert ALLE.<br />

Die Kanten <strong>de</strong>s Baumes repräsentieren eine ” is-a“-Beziehung zwischen <strong>de</strong>n<br />

verb<strong>und</strong>enen Knoten.<br />

Sind zwei Knoten über eine Kante miteinan<strong>de</strong>r verb<strong>und</strong>en, wird <strong>de</strong>r übergeordnete<br />

Knoten als Vorgänger, <strong>de</strong>r untergeordnete Knoten als Nachfolger<br />

bezeichnet.<br />

Die Konzeptebene eines Attributwerts ist <strong>de</strong>finiert als <strong>de</strong>r Abstand <strong>de</strong>s entsprechen<strong>de</strong>n<br />

Knotens von <strong>de</strong>n Blattknoten, d.h. die Blattknoten mit <strong>de</strong>n konkreten<br />

Attributwerten (wie z.B. Schützenweg) liegen auf <strong>de</strong>r Konzeptebene 0.<br />

Abbildung 5 stellt mögliche Konzepthierarchien dar.<br />

15

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!