20.03.2014 Aufrufe

Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...

Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...

Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8.3 Lernen mit Entscheidungsbäumen<br />

• Zu jedem Attribut a ∈ A gibt es e<strong>in</strong>e Menge von möglichen Werten W a . Die Wertemengen<br />

seien entwe<strong>der</strong> endlich, o<strong>der</strong> <strong>die</strong> reellen Zahlen: R.<br />

• E<strong>in</strong> Objekt wird beschrieben durch e<strong>in</strong>e Funktion A →× a∈A W a . E<strong>in</strong>e alternative Darstellung<br />

ist: E<strong>in</strong> Objekt ist e<strong>in</strong> Tupel mit |A| E<strong>in</strong>trägen, bzw. e<strong>in</strong> Record, <strong>in</strong> dem zu jedem<br />

Attribut a ∈ A <strong>der</strong> Wert notiert wird.<br />

• E<strong>in</strong> Konzept K ist repräsentiert durch e<strong>in</strong>e Prädikat P K auf <strong>der</strong> Menge <strong>der</strong> Objekte. D.h.<br />

e<strong>in</strong> Konzept entspricht e<strong>in</strong>er Teilmenge aller Objekte, nämlich <strong>der</strong> Objekte o, für <strong>die</strong> P K (o) =<br />

True ergibt.<br />

Beispiel 8.3.2. Bücher könnte man beschreiben durch <strong>die</strong> Attribute: (Autor, Titel, Seitenzahl,<br />

Preis, Ersche<strong>in</strong>ungsjahr). Das Konzept „billiges Buch“ könnte man durch Preis ≤ 10 beschreiben.<br />

Das Konzept „umfangreiches Buch“ durch Seitenzahl ≥ 500.<br />

Für <strong>die</strong> Lernverfahren nimmt man im Allgeme<strong>in</strong>en an, dass jedes Objekt zu jedem Attribut<br />

e<strong>in</strong>en Wert hat, und daher <strong>der</strong> Wert „unbekannt“ nicht vorkommt. Im Fall unbekannter<br />

Attributwerte muss man <strong>die</strong>se Verfahren adaptieren.<br />

Def<strong>in</strong>ition 8.3.3 (Entscheidungsbaum). E<strong>in</strong> Entscheidungsbaum zu e<strong>in</strong>em Konzept K ist<br />

e<strong>in</strong> endlicher Baum, <strong>der</strong> an <strong>in</strong>neren Knoten zum Wert e<strong>in</strong>es Attributes folgende Abfragen machen<br />

kann:<br />

• bei reellwertigen Attributen gibt es <strong>die</strong> Alternativen a ≤ v o<strong>der</strong> a > v für e<strong>in</strong>en Wert v ∈ R,<br />

Es gibt e<strong>in</strong>en Teilbaum für Ja und e<strong>in</strong>en für Ne<strong>in</strong>.<br />

• bei diskreten Attributen wird <strong>der</strong> exakte Wert abgefragt. Es gibt pro möglichem Attributwert<br />

e<strong>in</strong>en Teilbaum<br />

Die Blätter des Baumes s<strong>in</strong>d mit Ja o<strong>der</strong> Ne<strong>in</strong> markiert. Das entspricht <strong>der</strong> Antwort auf <strong>die</strong> Frage,<br />

ob das e<strong>in</strong>gegebene Objekte zum Konzept gehört o<strong>der</strong> nicht.<br />

Diskrete Attribute sollten pro Pfad im Baum nur e<strong>in</strong>mal vorkommen, stetige Attribute können<br />

im Pfad mehrmals geprüft werden.<br />

D.h. e<strong>in</strong> Entscheidungsbaum B K ist <strong>die</strong> Darstellung e<strong>in</strong>es Algorithmus zum Erkennen, ob e<strong>in</strong><br />

vorgelegtes Objekt O zum Konzept K gehört.<br />

Je<strong>der</strong> Entscheidungsbaum def<strong>in</strong>iert e<strong>in</strong> Konzept auf den Objekten. Die Entscheidungsbäume<br />

s<strong>in</strong>d so def<strong>in</strong>iert, dass für jedes Objekt nach Durchlauf des Entscheidungsbaumes<br />

e<strong>in</strong> Blatt mit Ja o<strong>der</strong> Ne<strong>in</strong> erreicht wird.<br />

Die Mengen <strong>der</strong> Objekte, bei denen <strong>der</strong> Pfad mit e<strong>in</strong>em Ja endet, s<strong>in</strong>d <strong>in</strong> <strong>die</strong>sem Konzept,<br />

<strong>die</strong> an<strong>der</strong>en Objekte nicht.<br />

• Wenn es nur diskrete Attribute gibt, dann entsprechen <strong>die</strong> Konzepte genau den Entscheidungsbäumen:<br />

Zu jedem Konzept kann man offenbar e<strong>in</strong>e (aussagenlogische)<br />

Formel <strong>in</strong> DNF angeben: <strong>die</strong> a 1 = v 1 ∧ . . . a n = v n als Konjunktion enthält, wenn<br />

M. Schmidt-Schauß & D. Sabel, Skript KI, WS 2012/13 265 Stand: 30. Januar 2013

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!