Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
4 <strong>Konzeptbeschreibung</strong> <strong>und</strong> Generalisierung<br />
Die in Datenbanken gespeicherten Datenmengen sind für Menschen für gewöhnlich<br />
höchst unübersichtlich. Für die Benutzer dieser Datenbanken ist es daher<br />
erstrebenswert, ein Werkzeug zu Verfügung zu haben, welches diese Daten<br />
in einer zusammengefassten, übersichtlicheren Form darstellen kann <strong>und</strong> Vergleichsmöglichkeiten<br />
bietet.<br />
Dieses Kapitel behan<strong>de</strong>lt die einzelnen Komponenten <strong>de</strong>r <strong>Konzeptbeschreibung</strong>.<br />
Dazu wer<strong>de</strong>n zunächst ein Einstieg in das <strong>de</strong>r <strong>Konzeptbeschreibung</strong> zugr<strong>und</strong>eliegen<strong>de</strong><br />
Verfahren <strong>de</strong>r Generalisierung vermittelt <strong>und</strong> Unterschie<strong>de</strong> zu<br />
einem an<strong>de</strong>ren Datenanalyse-Werkzeug ver<strong>de</strong>utlicht. Das Thema Attributrelevanzanalyse<br />
schließt das Kapitel ab.<br />
4.1 Motivation<br />
Die <strong>Konzeptbeschreibung</strong> o<strong>de</strong>r auch Klassenbeschreibung wur<strong>de</strong> zu diesem Zweck<br />
entwickelt. Sie ist die einfachste Form von beschreiben<strong>de</strong>m Data Mining. <strong>Konzeptbeschreibung</strong><br />
untersucht vorhan<strong>de</strong>ne Daten auf Gemeinsamkeiten <strong>und</strong> teilt<br />
sie <strong>de</strong>ment-sprechend in verschie<strong>de</strong>ne Gruppen bzw. Klassen auf (daher die Bezeichnung<br />
Klassenbeschreibung).<br />
Die <strong>Konzeptbeschreibung</strong> besteht aus zwei Komponenten, <strong>de</strong>r Charakterisierung<br />
von Klassen <strong>und</strong> <strong>de</strong>m Klassenvergleich. Bei<strong>de</strong> Teilbereiche basieren auf <strong>de</strong>r<br />
Generalisierung, einem Verfahren, das zur Abstrahierung von Relationen <strong>und</strong><br />
ihren Attributen eingesetzt wird.<br />
4.2 Einschub Generalisierung<br />
Seien Di, 1≤ i ≤ d, logisch zusammengehörige Mengen von Werten (Wertebereiche)<br />
mit ALLE ∈ Di. Sei R eine Relation R ⊆ D1 × D2 × ... × Dd mit <strong>de</strong>n<br />
Attributen A1, ..., Ad.<br />
Definition Konzepthierarchie (nach [San00b])<br />
Eine Konzepthierarchie für Di (bzw. für Ai) ist ein (typischerweise balancierter)<br />
Baum mit <strong>de</strong>n folgen<strong>de</strong>n Eigenschaften:<br />
Die Knoten <strong>de</strong>s Baumes repräsentieren Werte aus Di, die Wurzel <strong>de</strong>s Baumes<br />
repräsentiert <strong>de</strong>n speziellen Wert ALLE.<br />
Die Kanten <strong>de</strong>s Baumes repräsentieren eine ” is-a“-Beziehung zwischen <strong>de</strong>n<br />
verb<strong>und</strong>enen Knoten.<br />
Sind zwei Knoten über eine Kante miteinan<strong>de</strong>r verb<strong>und</strong>en, wird <strong>de</strong>r übergeordnete<br />
Knoten als Vorgänger, <strong>de</strong>r untergeordnete Knoten als Nachfolger<br />
bezeichnet.<br />
Die Konzeptebene eines Attributwerts ist <strong>de</strong>finiert als <strong>de</strong>r Abstand <strong>de</strong>s entsprechen<strong>de</strong>n<br />
Knotens von <strong>de</strong>n Blattknoten, d.h. die Blattknoten mit <strong>de</strong>n konkreten<br />
Attributwerten (wie z.B. Schützenweg) liegen auf <strong>de</strong>r Konzeptebene 0.<br />
Abbildung 5 stellt mögliche Konzepthierarchien dar.<br />
15