28.10.2013 Aufrufe

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Der KDD-Prozess ist also ein iterativer (<strong>und</strong> interaktiver) Vorgang, in <strong>de</strong>ssen<br />

Verlauf auf Daten einer Datenbank zugegriffen wird, diese Daten mehrere Phasen<br />

<strong>de</strong>r Bearbeitung durchlaufen <strong>und</strong> schliesslich ein Ergebnis (neues Wissen)<br />

präsentiert wird. Nach diesem Verständnis besteht <strong>de</strong>r KDD-Prozeß aus folgen<strong>de</strong>n<br />

Schritten:<br />

1. Die Datenbereinigung sortiert fehlerhafte, abweichen<strong>de</strong>, unvollständige<br />

<strong>und</strong> irrelevante Daten aus.<br />

2. Die Datenintegration vereinigt mehrere Datenquellen zu einer einzigen.<br />

3. Die Datenselektion wählt die für <strong>de</strong>n KDD-Prozeß relevanten Daten<br />

aus.<br />

4. Durch Datentransformation wer<strong>de</strong>n die Daten in ein für Data Mining<br />

geeignetes Format gebracht.<br />

5. Data Mining ist schließlich <strong>de</strong>r essentielle Part <strong>de</strong>s KDD-Prozesses, in<br />

<strong>de</strong>m intelligente Algorithmen die Daten nach Mustern durchsuchen.<br />

6. In <strong>de</strong>r Musterevaluierung wer<strong>de</strong>n uninteressante Muster aussortiert.<br />

7. Die Wissensrepräsentation macht <strong>de</strong>m Benutzer das neue Wissen in<br />

einer verständlichen Form zugänglich.<br />

Die ersten 4 Phasen <strong>de</strong>s Prozessen lassen sich durch Interaktion mit <strong>de</strong>m Benutzer<br />

<strong>de</strong>s Data-Mining-Tools bewältigen. Die Phasen Musterevaluierung <strong>und</strong><br />

Wissensrepräsentation wer<strong>de</strong>n auch häufig <strong>de</strong>m Data Mining zugerechnet. Data<br />

Mining ist <strong>de</strong>r zentrale Schritt <strong>de</strong>s KDD-Prozesses, bestehend aus <strong>de</strong>r Anwendung<br />

von Algorithmen zur Datenanalyse <strong>und</strong> Ent<strong>de</strong>ckung von Strukturen, die<br />

neues Wissen enthalten.<br />

Die Auswahl <strong>de</strong>r zu verwen<strong>de</strong>n<strong>de</strong>n Ent<strong>de</strong>ckungstechniken hängt von <strong>de</strong>m gewünschten<br />

Ergebnis ab. Der Benutzer eines Data-Mining-Tools legt die Art <strong>de</strong>r gewünschten<br />

Ergebnisse fest, prüft <strong>und</strong> bewertet sie <strong>und</strong> läßt gegebenenfalls die Anwendung<br />

<strong>de</strong>r Data Mining Verfahren <strong>de</strong>s KDD-Prozesses erneut durchlaufen.<br />

Spätestens hier wird <strong>de</strong>utlich, daß KDD kein völlig automatisierter son<strong>de</strong>rn ein<br />

interaktiver Prozeß ist.<br />

Mit <strong>de</strong>r Zeit haben sich verschie<strong>de</strong>ne Aufgaben <strong>de</strong>s Data Mining herauskristallisiert,<br />

die anhand von Beispielen aus <strong>de</strong>m Han<strong>de</strong>l ver<strong>de</strong>utlicht wer<strong>de</strong>n;<br />

Klassifikation (classification)<br />

Ist dieser K<strong>und</strong>e kreditwürdig?<br />

<strong>Konzeptbeschreibung</strong> (concept <strong>de</strong>scription)<br />

Was unterschei<strong>de</strong>t reparaturanfällige Fahrzeuge von an<strong>de</strong>ren?<br />

Segmentierung (segmentation, clustering)<br />

Was für K<strong>und</strong>engruppen habe ich?<br />

Prognose (prediction, trend analysis)<br />

Wie wird sich <strong>de</strong>r Dollarkurs entwickeln?<br />

3

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!