28.10.2013 Aufrufe

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

1. name: Es gibt eine große Auswahl an Möglichkeiten für dieses Attribut<br />

<strong>und</strong> esexistiert keine Konzepthierarchie. Also wird es aus <strong>de</strong>r Betrachtung<br />

ausgeschlossen.<br />

2. Geschlecht: Für dieses Attribut gibt es maximal zwei Möglichkeiten,<br />

M(ännlich) <strong>und</strong> W(eiblich). Dieser Anzahl <strong>de</strong>r Möglichkeiten liegt unter<br />

<strong>de</strong>m Schwellwert, das Attribut wird we<strong>de</strong>r generalisiert noch entfernt.<br />

3. Alter: Der Wertebereich dieses Attributs ist groß , aber es exisitert eine<br />

Konzepthierarchie, das Attribut wird generalisiert <strong>und</strong> die Werte durch<br />

jung, mittel alt o<strong>de</strong>r alt ersetzt.<br />

4. Wohnort: Auch hier gibt es viele verschie<strong>de</strong>ne Werte, die angenommen<br />

wer<strong>de</strong>n können <strong>und</strong> es existiert eine Konzepthierarchie. Allerdings hat die<br />

Relation bereits ein Attribut, das Werte besitzt, die auf <strong>de</strong>r nächsthöheren<br />

Ebene dieser Konzepthierarchie liegen. Das Attribut wird entfernt.<br />

5. B<strong>und</strong>esland: Es existieren nur zwei mögliche Werte, die nicht verän<strong>de</strong>rt<br />

wer<strong>de</strong>n müssen.<br />

Eine generalisierte Relation könnte wie in Abb. 5 aussehen.<br />

Geschlecht Alter B<strong>und</strong>esland Support<br />

M alt Nie<strong>de</strong>rsachsen 63<br />

W mittel alt Bayern 43<br />

M jung Nie<strong>de</strong>rsachsen 4<br />

W jung Nie<strong>de</strong>rsachsen 14<br />

... ... ... ...<br />

Tabelle 5: generalisierte Beispielrelation<br />

Das neu hinzugekommene Attribut Support gibt die Anzahl <strong>de</strong>r zusammengefassten<br />

Datensätze an.<br />

Als Maß für die Gewichtung eines Tupels qa in einer Relation führen wir noch<br />

<strong>de</strong>n Wert t weight ein. Formal gilt für n =#Tupel<strong>de</strong>r Relation: [Han01]<br />

t weight :=<br />

Support(qa<br />

n<br />

i=1 Support(qi)<br />

Je höher t weight, <strong>de</strong>sto größer ist die Zahl <strong>de</strong>r zu qa generalisierten Tupel (aus<br />

<strong>de</strong>r ursprünglichen Relation) im Verhältnis zur Gesamtzahl <strong>de</strong>r Tupel.<br />

Da jetzt die Zielklasse in einer zusammengefassten Form vorliegt, folgt abschließend<br />

<strong>de</strong>r letzte Teil <strong>de</strong>s AOI-Prozesses, die Präsentation <strong>de</strong>s Ergebnisses. Für<br />

diese Aufgabe stehen verschie<strong>de</strong>nste graphische Darstellungsformen wie Tortengrafiken,<br />

Säulen- o<strong>de</strong>r Balkendiagramme o<strong>de</strong>r Graphen zur Verfügung. Es<br />

besteht auch die Möglichkeit, die Klassen in Tabellenform, mittels Assoziationsregeln<br />

o<strong>de</strong>r als Data Cube zu präsentieren.<br />

Data-Mining-Tools können Standard-Darstellungsformen anbieten, letzten En<strong>de</strong>s<br />

liegt die Wahl <strong>de</strong>r Präsentationsform jedoch meist beim Benutzer.<br />

21

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!