20.03.2014 Aufrufe

Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...

Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...

Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

8 Masch<strong>in</strong>elles Lernen<br />

Negative-Vorhersage-Rate Der Anteil richtig als falsch klassifizierten unter allen als<br />

falsch klassifizierten<br />

|{x ∈ M | P (x) = 0 ∧ K(x) = 0}|<br />

|{x ∈ M | P (x) = 0}|<br />

Im mediz<strong>in</strong>ischen Bereich s<strong>in</strong>d alle <strong>die</strong>se Werte wichtig. Bei seltenen Krankheiten<br />

kann e<strong>in</strong> guter Recall, d.h. <strong>der</strong> Anteil <strong>der</strong> Kranken, <strong>die</strong> erkannt wurden, mit e<strong>in</strong>er sehr<br />

schlechten Präzision verbunden se<strong>in</strong>. Zum Beispiel, könnte e<strong>in</strong> Klassifikator für Gelbfieber<br />

wie folgt vorgehen: Wenn Körpertemperatur über 38,5 C, dann liegt Gelbfieber vor. In<br />

Deutschland haben 10.000 Menschen Fieber mit 38,5 C aber nur 1 Mensch hat Gelbfieber,<br />

<strong>der</strong> dann auch Fieber hat. Dann ist <strong>der</strong> Recall 1, aber <strong>die</strong> Precision ist 0.0001, also sehr<br />

schlecht. Hier muss man also möglichst beide Größen ermitteln, und den Test genauer<br />

machen (precision erhöhen).<br />

8.2 Wahrsche<strong>in</strong>lichkeit und Entropie<br />

In <strong>die</strong>sem Abschnitt führen wir den Begriff <strong>der</strong> Entropie e<strong>in</strong>, wobei wir zunächst e<strong>in</strong>e kurze<br />

Wie<strong>der</strong>holung zu diskreten Wahrsche<strong>in</strong>lichkeiten geben.<br />

8.2.1 Wahrsche<strong>in</strong>lichkeit<br />

Sei X e<strong>in</strong> Orakel, das bei je<strong>der</strong> Anfrage e<strong>in</strong>en Wert aus <strong>der</strong> Menge {a 1 , . . . , a n } ausgibt,<br />

d.h. X ist analog zu e<strong>in</strong>er Zufallsvariablen. Man <strong>in</strong>teressiert sich für <strong>die</strong> Wahrsche<strong>in</strong>lichkeit<br />

p i , dass das Orakel den Wert a i ausgibt. Macht man (sehr) viele Versuche, so kommt <strong>in</strong><br />

<strong>der</strong> Folge <strong>der</strong> Ergebnisse b 1 , . . . , b m , für e<strong>in</strong> festes i <strong>der</strong> Anteil <strong>der</strong> a i <strong>in</strong> <strong>der</strong> Folge dem Wert<br />

p i immer näher. Man nennt <strong>die</strong> Zahlen p i , i = 1, . . . , n auch diskrete Wahrsche<strong>in</strong>lichkeitsverteilung<br />

(<strong>der</strong> Menge a i ), bzw. des Orakels X.<br />

Zum Beispiel ist beim Münzwurf mit den Ausgängen Kopf und Zahl <strong>in</strong> e<strong>in</strong>er ausreichend<br />

langen Folge <strong>in</strong> etwa <strong>die</strong> Hälfte Kopf, <strong>die</strong> an<strong>der</strong>e Hälfte Zahl, d.h. man würde hier<br />

Wahrsche<strong>in</strong>lichkeiten 0, 5 und 0, 5 zuordnen.<br />

Es gilt immer 0 ≤ p i ≤ 1 und ∑ i p i = 1. S<strong>in</strong>d <strong>die</strong> a i Zahlen, dann kann man auch den<br />

Erwartungswert ausrechnen: E(X) = ∑ i p ia i . Das ist <strong>der</strong> Wert, dem <strong>die</strong> Mittelwerte <strong>der</strong><br />

(Zahlen-)Folgen <strong>der</strong> Versuche immer näher kommen.<br />

Wenn man <strong>die</strong> Arbeitsweise von X kennt, dann kann man mehr Angaben machen. Z.B.<br />

das sogenannte Urnenmodell:<br />

X benutzt e<strong>in</strong>en Eimer <strong>in</strong> dem sich Kugeln bef<strong>in</strong>den, rote, blaue und grüne.<br />

Bei je<strong>der</strong> Anfrage wird „zufällig“ e<strong>in</strong>e Kugel gezogen, <strong>der</strong>en Farbe ist das Ergebnis,<br />

und danach wird <strong>die</strong> Kugel wie<strong>der</strong> <strong>in</strong> den Eimer gelegt.<br />

In <strong>die</strong>sem Fall s<strong>in</strong>d <strong>die</strong> Wahrsche<strong>in</strong>lichkeiten p rot , p blau , p grün jeweils genau <strong>die</strong> relativen<br />

Häufigkeiten <strong>der</strong> roten, blauen, bzw. grünen Kugeln unter den Kugeln, <strong>die</strong> sich <strong>in</strong> <strong>der</strong> Urne<br />

jeweils vor dem Ziehen bef<strong>in</strong>den.<br />

Stand: 30. Januar 2013 262 M. Schmidt-Schauß & D. Sabel, Skript KI, WS 2012/13

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!