Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Assoziationsanalyse und Konzeptbeschreibung - Diko-project.de
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Der KDD-Prozess ist also ein iterativer (<strong>und</strong> interaktiver) Vorgang, in <strong>de</strong>ssen<br />
Verlauf auf Daten einer Datenbank zugegriffen wird, diese Daten mehrere Phasen<br />
<strong>de</strong>r Bearbeitung durchlaufen <strong>und</strong> schliesslich ein Ergebnis (neues Wissen)<br />
präsentiert wird. Nach diesem Verständnis besteht <strong>de</strong>r KDD-Prozeß aus folgen<strong>de</strong>n<br />
Schritten:<br />
1. Die Datenbereinigung sortiert fehlerhafte, abweichen<strong>de</strong>, unvollständige<br />
<strong>und</strong> irrelevante Daten aus.<br />
2. Die Datenintegration vereinigt mehrere Datenquellen zu einer einzigen.<br />
3. Die Datenselektion wählt die für <strong>de</strong>n KDD-Prozeß relevanten Daten<br />
aus.<br />
4. Durch Datentransformation wer<strong>de</strong>n die Daten in ein für Data Mining<br />
geeignetes Format gebracht.<br />
5. Data Mining ist schließlich <strong>de</strong>r essentielle Part <strong>de</strong>s KDD-Prozesses, in<br />
<strong>de</strong>m intelligente Algorithmen die Daten nach Mustern durchsuchen.<br />
6. In <strong>de</strong>r Musterevaluierung wer<strong>de</strong>n uninteressante Muster aussortiert.<br />
7. Die Wissensrepräsentation macht <strong>de</strong>m Benutzer das neue Wissen in<br />
einer verständlichen Form zugänglich.<br />
Die ersten 4 Phasen <strong>de</strong>s Prozessen lassen sich durch Interaktion mit <strong>de</strong>m Benutzer<br />
<strong>de</strong>s Data-Mining-Tools bewältigen. Die Phasen Musterevaluierung <strong>und</strong><br />
Wissensrepräsentation wer<strong>de</strong>n auch häufig <strong>de</strong>m Data Mining zugerechnet. Data<br />
Mining ist <strong>de</strong>r zentrale Schritt <strong>de</strong>s KDD-Prozesses, bestehend aus <strong>de</strong>r Anwendung<br />
von Algorithmen zur Datenanalyse <strong>und</strong> Ent<strong>de</strong>ckung von Strukturen, die<br />
neues Wissen enthalten.<br />
Die Auswahl <strong>de</strong>r zu verwen<strong>de</strong>n<strong>de</strong>n Ent<strong>de</strong>ckungstechniken hängt von <strong>de</strong>m gewünschten<br />
Ergebnis ab. Der Benutzer eines Data-Mining-Tools legt die Art <strong>de</strong>r gewünschten<br />
Ergebnisse fest, prüft <strong>und</strong> bewertet sie <strong>und</strong> läßt gegebenenfalls die Anwendung<br />
<strong>de</strong>r Data Mining Verfahren <strong>de</strong>s KDD-Prozesses erneut durchlaufen.<br />
Spätestens hier wird <strong>de</strong>utlich, daß KDD kein völlig automatisierter son<strong>de</strong>rn ein<br />
interaktiver Prozeß ist.<br />
Mit <strong>de</strong>r Zeit haben sich verschie<strong>de</strong>ne Aufgaben <strong>de</strong>s Data Mining herauskristallisiert,<br />
die anhand von Beispielen aus <strong>de</strong>m Han<strong>de</strong>l ver<strong>de</strong>utlicht wer<strong>de</strong>n;<br />
Klassifikation (classification)<br />
Ist dieser K<strong>und</strong>e kreditwürdig?<br />
<strong>Konzeptbeschreibung</strong> (concept <strong>de</strong>scription)<br />
Was unterschei<strong>de</strong>t reparaturanfällige Fahrzeuge von an<strong>de</strong>ren?<br />
Segmentierung (segmentation, clustering)<br />
Was für K<strong>und</strong>engruppen habe ich?<br />
Prognose (prediction, trend analysis)<br />
Wie wird sich <strong>de</strong>r Dollarkurs entwickeln?<br />
3