07.12.2012 Aufrufe

Vortrag Jaekel, Mikut, Malberg, Bretthauer

Vortrag Jaekel, Mikut, Malberg, Bretthauer

Vortrag Jaekel, Mikut, Malberg, Bretthauer

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

(Modellgute, Transparenz, Signi kanz). Ein Vorteil dieses Vorgehens gegenuber dem Generalisieren<br />

des Entscheidungsbaums besteht darin, nichtoptimale Entscheidungen uber<br />

die Aufteilung in einem Knoten aufheben zu konnen. Aus der Menge der generierter Regeln<br />

werden schlie lich diejenigen gewahlt, deren kooperatives Zusammenwirken in einer<br />

Regelbasis die beste Gesamtgute ergibt.<br />

Ziel der Arbeit ist es,<br />

zunachst einen Uberblick uber Verfahren zur Regelsuche zu geben, wobei eine Konzentration<br />

auf Verfahren des Maschinellen Lernens erfolgt, und<br />

ein baumorientiertes Verfahren vorzustellen, wozu eine Anwendung aus der medizinischen<br />

Diagnose herangezogen wird.<br />

2 Uberblick uber Verfahren zur datenbasierten Regelsuche<br />

Datenbasierte Regelsuchverfahren gehen von einer Menge von Beispielen B =<br />

fx[k];y[k] j k = 1;::: ;Ng aus, wobei vorausgesetzt wird, da die Beispiele u. U. mit<br />

Storungen uberlagerte Realisierungen einer unbekannten Funktion y = f(x) sind. Die<br />

Eingangsgro en x und die Ausgangsgro e y konnen nominale (kategorische), ordinale oder<br />

numerische Variable sein. Die Aufgabe besteht darin, eine regelbasierte Beschreibung bzw.<br />

Approximation dieser Funktion f zu nden.<br />

Ist y eine nominale oder ordinale Variable, wird i. allg. von einem Klassi kationsproblem<br />

gesprochen. Anwendungen nden sich z. B. bei Diagnose, der Entscheidungs ndung<br />

oder der Mustererkennung. Aufgabenstellungen mit numerischen y werden zumeist<br />

als Regressions- bzw. Approximationsprobleme bezeichnet. Entsprechende Anwendungen<br />

sind z. B. Pradiktionsmodelle oder Reglerfunktionale.<br />

Bei der o. g. Aufgabenstellung bestehen zusatzlich bestimmte Anforderungen, zu denen<br />

die Verstandlichkeit der Einzelregeln,<br />

die Transparenz ihres Zusammenwirkens,<br />

die Genauigkeit der Approximation von f,<br />

ein niedriger Aufwand zur Speicherung und Auswertung der Regeln,<br />

ein niedriger Me aufwand fur die in den Regelpramissen auftretenden Variablen<br />

gehoren. Diese Anforderungen schlagen sich zum einen in einem Vorzugskriterium bez. des<br />

Suchraums nieder, z. B. durch Beschrankung auf bestimmte Formen von Regeln oder auf<br />

Regeln mit einer festgelegten maximalen Anzahl von Partialpramissen und zum anderen in<br />

der Bewertung der Hypothesen. Dabei kann z. B. die Bevorzugung allgemeinerer Regeln,<br />

die Bevorzugung klarerer Regeln oder eine Kombination beider zugrunde liegen.<br />

Stellen die Hypothesen komplette Regelbasen dar, wird im Kontext sog. Classi er Systems<br />

hau g vom Pittsburgh-Ansatz [7] gesprochen. Hier soll dieser Fall als direkter Zugang<br />

bezeichnet werden. Im Unterschied dazu bilden beim Michigan-Ansatz einzelne Regeln<br />

die Hypothesen [8]. Dieser Ansatz wird im folgenden indirekter Zugang genannt.<br />

Beim direkten Zugang, bei dem i. allg. globale Gutema e angewendet werden, besteht das<br />

Problem, die Qualitat einzelner Regeln nicht bewerten zu konnen. Das kann dazu fuhren,<br />

da sich fehlerhafte Einzelregeln in ihren Auswirkungen kompensieren und so trotzdem ein<br />

gutes Approximationsverhalten ergeben, was die Interpretierbarkeit der Regeln reduziert.<br />

Au erdem ist der Suchraum wegen der gro en Anzahl moglicher Hypothesen sehr gro .

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!