Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...
Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...
Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
8 Masch<strong>in</strong>elles Lernen<br />
Negative-Vorhersage-Rate Der Anteil richtig als falsch klassifizierten unter allen als<br />
falsch klassifizierten<br />
|{x ∈ M | P (x) = 0 ∧ K(x) = 0}|<br />
|{x ∈ M | P (x) = 0}|<br />
Im mediz<strong>in</strong>ischen Bereich s<strong>in</strong>d alle <strong>die</strong>se Werte wichtig. Bei seltenen Krankheiten<br />
kann e<strong>in</strong> guter Recall, d.h. <strong>der</strong> Anteil <strong>der</strong> Kranken, <strong>die</strong> erkannt wurden, mit e<strong>in</strong>er sehr<br />
schlechten Präzision verbunden se<strong>in</strong>. Zum Beispiel, könnte e<strong>in</strong> Klassifikator für Gelbfieber<br />
wie folgt vorgehen: Wenn Körpertemperatur über 38,5 C, dann liegt Gelbfieber vor. In<br />
Deutschland haben 10.000 Menschen Fieber mit 38,5 C aber nur 1 Mensch hat Gelbfieber,<br />
<strong>der</strong> dann auch Fieber hat. Dann ist <strong>der</strong> Recall 1, aber <strong>die</strong> Precision ist 0.0001, also sehr<br />
schlecht. Hier muss man also möglichst beide Größen ermitteln, und den Test genauer<br />
machen (precision erhöhen).<br />
8.2 Wahrsche<strong>in</strong>lichkeit und Entropie<br />
In <strong>die</strong>sem Abschnitt führen wir den Begriff <strong>der</strong> Entropie e<strong>in</strong>, wobei wir zunächst e<strong>in</strong>e kurze<br />
Wie<strong>der</strong>holung zu diskreten Wahrsche<strong>in</strong>lichkeiten geben.<br />
8.2.1 Wahrsche<strong>in</strong>lichkeit<br />
Sei X e<strong>in</strong> Orakel, das bei je<strong>der</strong> Anfrage e<strong>in</strong>en Wert aus <strong>der</strong> Menge {a 1 , . . . , a n } ausgibt,<br />
d.h. X ist analog zu e<strong>in</strong>er Zufallsvariablen. Man <strong>in</strong>teressiert sich für <strong>die</strong> Wahrsche<strong>in</strong>lichkeit<br />
p i , dass das Orakel den Wert a i ausgibt. Macht man (sehr) viele Versuche, so kommt <strong>in</strong><br />
<strong>der</strong> Folge <strong>der</strong> Ergebnisse b 1 , . . . , b m , für e<strong>in</strong> festes i <strong>der</strong> Anteil <strong>der</strong> a i <strong>in</strong> <strong>der</strong> Folge dem Wert<br />
p i immer näher. Man nennt <strong>die</strong> Zahlen p i , i = 1, . . . , n auch diskrete Wahrsche<strong>in</strong>lichkeitsverteilung<br />
(<strong>der</strong> Menge a i ), bzw. des Orakels X.<br />
Zum Beispiel ist beim Münzwurf mit den Ausgängen Kopf und Zahl <strong>in</strong> e<strong>in</strong>er ausreichend<br />
langen Folge <strong>in</strong> etwa <strong>die</strong> Hälfte Kopf, <strong>die</strong> an<strong>der</strong>e Hälfte Zahl, d.h. man würde hier<br />
Wahrsche<strong>in</strong>lichkeiten 0, 5 und 0, 5 zuordnen.<br />
Es gilt immer 0 ≤ p i ≤ 1 und ∑ i p i = 1. S<strong>in</strong>d <strong>die</strong> a i Zahlen, dann kann man auch den<br />
Erwartungswert ausrechnen: E(X) = ∑ i p ia i . Das ist <strong>der</strong> Wert, dem <strong>die</strong> Mittelwerte <strong>der</strong><br />
(Zahlen-)Folgen <strong>der</strong> Versuche immer näher kommen.<br />
Wenn man <strong>die</strong> Arbeitsweise von X kennt, dann kann man mehr Angaben machen. Z.B.<br />
das sogenannte Urnenmodell:<br />
X benutzt e<strong>in</strong>en Eimer <strong>in</strong> dem sich Kugeln bef<strong>in</strong>den, rote, blaue und grüne.<br />
Bei je<strong>der</strong> Anfrage wird „zufällig“ e<strong>in</strong>e Kugel gezogen, <strong>der</strong>en Farbe ist das Ergebnis,<br />
und danach wird <strong>die</strong> Kugel wie<strong>der</strong> <strong>in</strong> den Eimer gelegt.<br />
In <strong>die</strong>sem Fall s<strong>in</strong>d <strong>die</strong> Wahrsche<strong>in</strong>lichkeiten p rot , p blau , p grün jeweils genau <strong>die</strong> relativen<br />
Häufigkeiten <strong>der</strong> roten, blauen, bzw. grünen Kugeln unter den Kugeln, <strong>die</strong> sich <strong>in</strong> <strong>der</strong> Urne<br />
jeweils vor dem Ziehen bef<strong>in</strong>den.<br />
Stand: 30. Januar 2013 262 M. Schmidt-Schauß & D. Sabel, Skript KI, WS 2012/13