Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
1. name: Es gibt eine große Auswahl an Möglichkeiten für dieses Attribut<br />
<strong>und</strong> esexistiert keine Konzepthierarchie. Also wird es aus <strong>de</strong>r Betrachtung<br />
ausgeschlossen.<br />
2. Geschlecht: Für dieses Attribut gibt es maximal zwei Möglichkeiten,<br />
M(ännlich) <strong>und</strong> W(eiblich). Dieser Anzahl <strong>de</strong>r Möglichkeiten liegt unter<br />
<strong>de</strong>m Schwellwert, das Attribut wird we<strong>de</strong>r generalisiert noch entfernt.<br />
3. Alter: Der Wertebereich dieses Attributs ist groß , aber es exisitert eine<br />
Konzepthierarchie, das Attribut wird generalisiert <strong>und</strong> die Werte durch<br />
jung, mittel alt o<strong>de</strong>r alt ersetzt.<br />
4. Wohnort: Auch hier gibt es viele verschie<strong>de</strong>ne Werte, die angenommen<br />
wer<strong>de</strong>n können <strong>und</strong> es existiert eine Konzepthierarchie. Allerdings hat die<br />
Relation bereits ein Attribut, das Werte besitzt, die auf <strong>de</strong>r nächsthöheren<br />
Ebene dieser Konzepthierarchie liegen. Das Attribut wird entfernt.<br />
5. B<strong>und</strong>esland: Es existieren nur zwei mögliche Werte, die nicht verän<strong>de</strong>rt<br />
wer<strong>de</strong>n müssen.<br />
Eine generalisierte Relation könnte wie in Abb. 5 aussehen.<br />
Geschlecht Alter B<strong>und</strong>esland Support<br />
M alt Nie<strong>de</strong>rsachsen 63<br />
W mittel alt Bayern 43<br />
M jung Nie<strong>de</strong>rsachsen 4<br />
W jung Nie<strong>de</strong>rsachsen 14<br />
... ... ... ...<br />
Tabelle 5: generalisierte Beispielrelation<br />
Das neu hinzugekommene Attribut Support gibt die Anzahl <strong>de</strong>r zusammengefassten<br />
Datensätze an.<br />
Als Maß für die Gewichtung eines Tupels qa in einer Relation führen wir noch<br />
<strong>de</strong>n Wert t weight ein. Formal gilt für n =#Tupel<strong>de</strong>r Relation: [Han01]<br />
t weight :=<br />
Support(qa<br />
n<br />
i=1 Support(qi)<br />
Je höher t weight, <strong>de</strong>sto größer ist die Zahl <strong>de</strong>r zu qa generalisierten Tupel (aus<br />
<strong>de</strong>r ursprünglichen Relation) im Verhältnis zur Gesamtzahl <strong>de</strong>r Tupel.<br />
Da jetzt die Zielklasse in einer zusammengefassten Form vorliegt, folgt abschließend<br />
<strong>de</strong>r letzte Teil <strong>de</strong>s AOI-Prozesses, die Präsentation <strong>de</strong>s Ergebnisses. Für<br />
diese Aufgabe stehen verschie<strong>de</strong>nste graphische Darstellungsformen wie Tortengrafiken,<br />
Säulen- o<strong>de</strong>r Balkendiagramme o<strong>de</strong>r Graphen zur Verfügung. Es<br />
besteht auch die Möglichkeit, die Klassen in Tabellenform, mittels Assoziationsregeln<br />
o<strong>de</strong>r als Data Cube zu präsentieren.<br />
Data-Mining-Tools können Standard-Darstellungsformen anbieten, letzten En<strong>de</strong>s<br />
liegt die Wahl <strong>de</strong>r Präsentationsform jedoch meist beim Benutzer.<br />
21