Methoden zur Klassifikation - OptiV
Methoden zur Klassifikation - OptiV
Methoden zur Klassifikation - OptiV
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
5.3 Anwendung von ID3<br />
Anwendungsvoraussetzungen<br />
Der ID3-Algorithmus kann unter folgenden Voraussetzungen einen Entschei-<br />
von ID3 dungsbaum generieren:<br />
Vorteile von<br />
ID3<br />
Nachteile von<br />
ID3<br />
• Die Daten müssen fehlerfrei und unverrauscht sein.<br />
• Die Merkmale müssen diskrete Werte besitzen oder bei reellen Werten<br />
müssen Intervallgrenzen festsetzbar sein. Diese Festlegung ist jedoch oft<br />
problematisch, da sie Einfluss auf die <strong>Klassifikation</strong>sgüte des Entscheidungsbaumes<br />
hat.<br />
Der ID3-Algorithmus ist insbesondere für die schnelle <strong>Klassifikation</strong> großer Datenmengen<br />
gut geeignet.<br />
Der ID3-Algorithmus bietet folgende Vorteile:<br />
• Der Lernprozess ist auch bei großen Datenmengen recheneffizient.<br />
• Die Repräsentation als Baumstruktur ist für den Anwender gut überschaubar<br />
und verständlich.<br />
• Aus dem Entscheidungsbaum können gut handhabbare Entscheidungsregeln<br />
gebildet werden.<br />
• Die Entscheidungsregeln können zum Zugriff auf Datenbanken in SQL-<br />
Abfragen übersetzt werden.<br />
Der ID3-Algorithmus hat eine Reihe von Nachteilen:<br />
• Da der Algorithmus auf eine vollständige <strong>Klassifikation</strong> aller Daten eingerichtet<br />
ist, reagiert er sehr empfindlich auf verrauschte und fehlerhafte<br />
Daten, da schon bei kleinen Änderungen der Merkmalswerte der<br />
Entscheidungsbaum entsprechend geändert wird und zu falschen <strong>Klassifikation</strong>en<br />
führt.<br />
• Da der Baum nur vorwärts aufgebaut wird und kein rückschreitendes Verbessern<br />
möglich ist, handelt es sich bei dem so gewonnenen Baum oft um<br />
ein lokales Optimum.<br />
18