Vortrag Jaekel, Mikut, Malberg, Bretthauer

Weitere Magazine

Empfehlungen

Info

ist insbesondere bei der Regelgenerierung mittels ID3 bzw. C4.5 vorteilhaft, da die Zugehorigkeitsfunktionen so festgelegt werden, da mit ihnen eine gute Trennung nach den Ausgangsklassen durch den Entscheidungsbaum erfolgen kann. Fur das Anwendungsbeispiel wird die Anzahl der Zugehorigkeitsfunktionen zu funf festgelegt, die mit sehr klein (SK), klein (K), mittel (M), gro (G) und sehr gro (SG) bezeichnet werden. Bild 3 zeigt beispielhaft die fur ein Merkmal ermittelten Zugehorigkeitsfunktionen und Histogramme uber die beiden Ausgangsklassen. Bild 3: Automatisch generierte Zugehorigkeitsfunktionen fur das Merkmal x141 und Histogramme fur die beiden Ausgangsklassen (schwarz: Proband, wei : Patient) 3.4 Induktion eines Entscheidungsbaums und Ableiten der Regeln Mit dem ID3- bzw. C4.5-Algorithmus wird wie in Abschnitt 2 ein Entscheidungsbaum generiert. Fur jeden Endknoten des Entscheidungsbaums wird eine Regel gebildet. Deren Pramisse besteht aus einer konjunktiven Verknupfung aller Variablen und ihrer linguistischen Terme in den Entscheidungsknoten, die auf dem Pfad zwischen der Wurzel des Baumes und dem jeweiligen Endknoten durchlaufen werden. Wegen der vollstandigen Partitionierung des Eingangsraums durch den ID3-Algorithmus ergibt sich eine Regelbasis, die den Eingangsraum redundanzfrei abdeckt. Die Zuweisung von Fuzzy-Mengen anstelle der gewohnlichen Menge erfolgt rein formal. Bild 4 zeigt den besten mit dem ID3-Algorithmus erzeugten Entscheidungsbaum, wobei alle 152 Merkmale zur Verfugung standen. Aus diesem Baum lassen sich 17 Regeln bilden, wobei lediglich vier Merkmale verwendet werden. Allerdings entstehen so auch einige Regeln, fur die nur ein oder gar kein Beispiel im Lerndatensatz existiert (vgl. Bild 4, z. B. x141=1, x18=1). Zur Gewinnung weiterer Regelhypothesen erweist sich die Induktion verschiedener Entscheidungsbaume, z. B. durch Herausstreichen dominanter Eingangsvariablen aus dem Datensatz, als sinnvoll. Damit wird der abgesuchte Hypothesenraum beim Generalisieren gro er (112 Regeln bei funf verschiedenen Entscheidungsbaumen). Als zusatzliches Ergebnis bei der Generierung von Entscheidungsbaumen entstehen heuristische Merkmalsrelevanzen, die aus einer gewichteten Addition der Transinformation
Bild 4: Mit ID3 generierter Entscheidungsbaum zur BRS-Analyse (oben im Knoten Entscheidungsvariable x l,unten im Knoten Entscheidung y, y =1Patient, y = 2 Proband, in Klammern Beispielanzahl, Terme: 1=SK, :::, 5=SG) zwischen dem jeweiligen Merkmal und der Ausgangsgro e entstehen. Der Wichtungsfaktor ergibt sich als Quotient der Beispielanzahl je Knoten und der Beispielanzahl aller untersuchten Knoten. Fur die BRS-Analyse ergeben sich die folgenden heuristischen Merkmalsrelevanzen: 1. Merkmal : x141 ( 10-15_brady_3_a) - Guete 0.370 2. Merkmal : x113 ( alle_tachy_3_a) - Guete 0.292 3. Merkmal : x151 ( alle_brady_3_a) - Guete 0.193 4. Merkmal : x95 ( 7.5-10_tachy_3_a) - Guete 0.181 5. Merkmal : x85 ( 4-5_tachy_3_a) - Guete 0.176 ... 31. Merkmal : x12 ( 0-2.5_tachy_1_p) - Guete 0.106 ... 49. Merkmal : x18 ( 5-7.5_tachy_1_p) - Guete 0.082 50. Merkmal : x100 ( 10-12.5_tachy_3_p) - Guete 0.082 ... 80. Merkmal : x33 ( 50-75_tachy_1_a) - Guete 0.058 ... 151. Merkmal : x69 ( 25-50_brady_1_a) - Guete 0.008 152. Merkmal : x71 ( 50-75_brady_1_a) - Guete 0.002 3.5 Generalisieren und logische Reduktion von Regeln Modulare Bewertung von Fuzzy-Regeln Die Bewertung der Regeln mu die Anforderungen Relevanz, Verstandlichkeit und statistische Absicherung in geeigneter Weise berucksichtigen. Dazu dient hier das Kriterium [32, 45] Q =(1, FP F 0 ) (1 , FK) ; ; > 0 (4) P dessen erster Term die relative Verbesserung der Prognosegute im Vergleich zur Trivialschatzung (Regel mit stets wahrer Pramisse und hau gstem Term in der Konklusion) angibt. Indirekt wird hierbei die statistische Absicherung bewertet, da nur Regeln, die hinreichend durch Beispiele abgedeckt sind, eine wesentliche Verbesserung der Prognosegute bewirken konnen. Der zweite Term, die Bewertung der Klarheit der Pramissen- Konklusionszuordnung, ist um so gro er, je geringer der Anteil von Gegenbeispielen in der Menge der abgedeckten Beispiele ist. Die Exponenten und erlauben eine Gewichtung
Seite 1 und 2: Datenbasierte Regelsuche fur Fuzzy-
Seite 3 und 4: Der Suchraum beim indirekten Zugang
Seite 5 und 6: Bei gestorten und nicht eindeutigen
Seite 7: In einer klinischen Studie [44] wur
Seite 11 und 12: Bild 5: Gra sche Darstellung der ge
Seite 13 und 14: speziellere Regel nicht besser bewe
Seite 15: [27] Runkler, T.; Roychowdhury, S.

Vortrag Jaekel, Mikut, Malberg, Bretthauer

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?