Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...
Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...
Einführung in die Methoden der Künstlichen Intelligenz - Goethe ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2.4 Suche <strong>in</strong> Spielbäumen<br />
baum ab e<strong>in</strong>er bestimmten Tiefe ab. Nun bewertet man <strong>die</strong> Blattknoten (<strong>die</strong> i.A. ke<strong>in</strong>e Endsituationen<br />
s<strong>in</strong>d!) mithilfe e<strong>in</strong>er heuristische Bewertungsfunktion (Heuristik). Anschließend<br />
verfährt man wie bei <strong>der</strong> M<strong>in</strong>Max-Methode und berechnet <strong>die</strong> M<strong>in</strong>ima bzw. Maxima <strong>der</strong><br />
K<strong>in</strong><strong>der</strong>, um den aktuellen Wert des Knotens zu ermitteln. D.h. man m<strong>in</strong>imiert über <strong>die</strong><br />
Situationen nach Zug des Gegners und maximiert über <strong>die</strong> eigenen Zugmöglichkeiten.<br />
Die Zugmöglichkeit, mit dem optimalen Wert ist dann <strong>der</strong> berechnete Zug.<br />
E<strong>in</strong>e solche heuristische Bewertung von Spielsituationen muss algorithmisch berechenbar<br />
se<strong>in</strong>, und <strong>der</strong>en Güte bestimmt entsprechend auch <strong>die</strong> Güte des M<strong>in</strong>Max-Verfahrens.<br />
Beispiele für <strong>die</strong> Bewertungsfunktion s<strong>in</strong>d:<br />
Schach: Materialvorteil, evtl. Stellungsvorteil, Gew<strong>in</strong>nsituation, ...<br />
Mühle: Material, #Mühlen, Bewegungsfreiheit, ...<br />
Tictactoe: am e<strong>in</strong>fachsten: Gew<strong>in</strong>n = 1, Verlust = -1, Remis = 0<br />
nur e<strong>in</strong>deutige Spielsituationen werden direkt bewertet.<br />
Re<strong>in</strong> theoretisch reicht <strong>die</strong>se Bewertung bei allen <strong>die</strong>sen Spielen aus, wenn man bis<br />
zum Ende suchen könnte.<br />
Beachte, dass <strong>in</strong> Spielen ohne Zufall gilt: Die Berechnung des besten Zuges ist unabhängig<br />
von den exakten Werten <strong>der</strong> Bewertungsfunktion; es kommt nur auf <strong>die</strong> erzeugte<br />
Ordnung zwischen den Spielsituationen an. Z.B. ist bei TicTacToe egal, ob wir mit Sieg,<br />
Nie<strong>der</strong>lage, Unentschieden mit 1, -1, 0 bewerten o<strong>der</strong> 100, 10, 50. Allerd<strong>in</strong>gs än<strong>der</strong>t sich<br />
<strong>die</strong> Suche, wenn wir <strong>die</strong> Ordnung än<strong>der</strong>n und bspw. Sieg, Nie<strong>der</strong>lage, Unentschieden mit<br />
1,-1,1 bewerten (M<strong>in</strong>Max unterscheidet dann nicht zwischen Sieg und Unentschieden).<br />
Beispiel 2.4.2. Heuristische Bewertung für Tictactoe. E<strong>in</strong>e komplizierte Bewertung ist:<br />
(#e<strong>in</strong>fach X-besetzte Zeilen/Spalten/Diag) * 1<br />
+ (# doppelt X-besetzte Zeilen/Spalten/Diag) * 5<br />
+ (20, falls Gew<strong>in</strong>nsituation)<br />
- (#e<strong>in</strong>fach O-besetzte Zeilen/Spalten/Diag) * 1<br />
- (# doppelt O-besetzte Zeilen/Spalten/Diag) * 5<br />
- (20, falls Verlustsituation)<br />
Die aktuelle Spielsituation sei<br />
O X<br />
den Bewertungen, wenn X-Spieler dran ist, s<strong>in</strong>d:<br />
X<br />
O<br />
. Die nächsten Spielsituationen zusammen mit<br />
X<br />
O<br />
X X X X<br />
X<br />
X<br />
O<br />
O X O<br />
O X O<br />
X O X O X O X O X X<br />
0 8 −3 1 −3<br />
M. Schmidt-Schauß & D. Sabel, Skript KI, WS 2012/13 57 Stand: 19. Oktober 2012