kombiniertes data mining – klassifikation unter verwendung von ...
kombiniertes data mining – klassifikation unter verwendung von ...
kombiniertes data mining – klassifikation unter verwendung von ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Kombiniertes Data Mining <strong>–</strong> Klassifikation anhand <strong>von</strong> Hilfsinformationen<br />
Das heißt, dass X der Klasse Ci zugewiesen wird für die P(X|Ci) . P(Ci) ein<br />
Maximum ist [ES00], [HK01].<br />
2.3.2 Nearest-Neighbour-Klassifikation<br />
Untypisch für Klassifikationsverfahren verzichtet die Nearest-Neighbour-Klassifikation<br />
(Nächste-Nachbarn-Klassifikation) auf das Finden <strong>von</strong> explizitem Wissen (Bayes-<br />
Klassifikator, Entscheidungsregeln, Entscheidungsbaum, …) und wird stattdessen<br />
direkt auf die Trainingsdaten angewandt. Aus diesem Grund werden Nächste-<br />
Nachbarn-Klassifikatoren auch „lazy lerners“ genannt, da sie keinen Klassifikator<br />
erzeugen ehe ein neues, unklassifiziertes Objekt klassifiziert werden muss [HK00].<br />
Die verwendeten Trainingsobjekte werden durch einen n-dimensionalen Feature-<br />
Vektor repräsentiert, X = (x1, x2, …, xn), wobei jede Ausprägung zu einem <strong>von</strong> n<br />
Attributen gehört, A1, A2, …, An. Für jede Klasse Ci wird der Mittelwertvektor der<br />
zugehörigen Feature-Vektoren bestimmt. Die zu klassifizierenden Objekte werden<br />
der Klasse Ci des nächstgelegenen Mittelwertvektors µi zugeordnet.<br />
Bei der Anwendung des Nächste-Nachbarn-Klassifikators sind drei einfache Regeln<br />
entscheidend:<br />
Es soll mehr als ein Trainingsobjekt pro Klasse verwendet werden.<br />
Als Entscheidungsmenge soll nicht nur ein nächster Nachbar dienen, sondern<br />
die k > 1 nächsten Nachbarn.<br />
Die Klassen der k nächsten Nachbarn sollten gewichtet werden, z.B. nach<br />
Distanz der Nachbarn vom zu klassifizierenden Objekt.<br />
Abbildung 6 zeigt ein Beispiel für die Klassifikation eines Objekts anhand dieser<br />
Regeln.<br />
Seite 25