Informatik II Übung 09

Informatik II 

Übung 09 

Christian Beckel 

beckel@inf.ethz.ch 

02.05.2013 

Lösung U8.A1a,b – Binäre Suche 

0 

3 

1 

7 

2 3 4 5 6 7 8 9 10 11 12 13 14 

17 25 33 47 56 62 65 66 68 70 78 89 92 

li mi re 

mi = (re-li)/2 + li; 

Informatik II - Übung 9 

2

Lösung U8.A1c – Binäre Suche (mit Faktor 3) 

0 

3 

1 

7 

2 3 4 5 6 7 8 9 10 11 12 13 14 

17 25 33 47 56 62 65 66 68 70 78 89 92 

li mi re 

mi = (re-li)/3 + li; 

Fazit: wenn ich nach kleinen Zahlen suche ist diese Methode schneller, im 

Durchschnitt aber schlechter (tiefer Baum) 


3 

Lösung U8.A1d – BinarySearch 

! Sub-arrays immer zu kopieren ist keine gute Idee 

" lieber eine eigene Methode erstellen, die zusätzlich zwei int-Werte, begin und 

end als Parameter nimmt: 

public Value find(ArrayList haystack, Key needle) 

{ 

return findRecursive(haystack, needle, 0, haystack.size()); 

} 

private Value findRecursive( ArrayList haystack, 

Key needle, int begin, int end) 

{ 

} 

... 

Eclipse DEMO 

Informatik II - Übung 9 4

Lösung U8.A2 – Tic-Tac-Toe 

MAX 

Strategie von 

MAX 

MIN 

MAX 

MIN 


5 

Lösung U8.A3a – checkMove: how to 


Lösung U8.A3a – checkMove 

! boolean checkMove(GameBoard …,Coordinates c) 

! Feld muss frei sein! 

! Überprüfen alle Richtungen 

! Solange nicht mindestens eine Richtung „gültig“ ist… 

for( int i = -1; i

Lösung U8.A3b – GreedyPlayer 

! Player-AI 

! für alle möglichen Züge 

! Simuliere Zug auf Kopie des aktuellen Boards 

! Bewerte die resultierende Situation 

! Speichere Zug und Bewertung in einer Liste 

! Sortiere die Liste / Such das/die Maximum/Maxima 

! Wähle den/zufällig einen maximalen Zug 

! Bewertungsfunktion (bisher) 

! Verhältnis eigene Steine vs. Gegnersteine 

! Datenstrukturen 

! MoveInfo: speichert ausgewertete Zuginformationen 

! Coordinates und Bewertung 

! List (z.B. eine ArrayList) 

! effizienter als ein Vector 

! praktischer als ein Array 

Ähnliche Lösung 

ohne Liste: 

Eclipse DEMO 

Informatik II - Übung 9 9 

HINWEISE ZU U9 

A1 – Rucksackproblem (Backtracking) 

A2 – Spielbaumauswertung 

A3 – Reversi (Teil 3) 


10

U9.A1 – Rucksackproblem und Backtracking 

x2 

g2, w2 

x3 

g3, w3 

x1 

g1, w1 

x4 

g4, w4 

x5 

g5, w5 


Hinweise zu U9.A1 

x1 

g1, w1 

x2 

g2, w2 

x3 

g3, w3 

Das allgemeine Rucksackproblem 

! k Gegenstände x 1 , ..., x k ; Jeweils bekannter Wert und Gewicht 

! Auswahl von Gegenständen, sodass Gesamtgewicht nicht überschritten 

wird 

! Optimierungsproblem: Maximieren des Wertes der ausgewählten 

Gegenstände 

x4 

g4, w4 

x5 

g5, w5 

a) Theorie 

b) Bruteforce Ansatz 

c) Backtracking Ansatz 

d) Vergleich von Bruteforce und Backtracking 


12

U9.A1 – Teilmengen 

! Wie viele unterschiedlichen Möglichkeiten hat unser Dieb? 

! M = Menge der „verfügbaren“ Gegenständen 

! Der Dieb kann nur eine Teilmenge davon nach Hause bringen 

! Der Dieb kann auch die leere Menge Ø (fauler Dieb) oder die gesamte 

Menge M (starker Dieb mit grossem Sack) schaffen! 

! #Teilmengen := #Elemente in der Potenzmenge von M 

! Beispiel 


U9.A1 – Backtracking 

! Was heisst „Backtracking“? 

! Prinzip: “trial and error” 

! Beispiel: Ausgang in einem Labyrinth suchen 

! Sich für eine Richtung entscheiden 

! In diese Richtung weitergehen 

! Wenn “letztendlich” erfolglos 

! zurückkehren und eine andere Richtung wählen 

! Wenn “letztendlich” erfolgreich 

! fertig… 

Backtracking 

Falls bereits alle Richtungen 

ausprobiert 

" noch weiter zurück. 



15 


16

Warum? 

Warum?

U9.A1 – Einfache Diebstrategie 

! Einfachen Algorithmus implementieren 

! zur Erinnerung: 

! Eine Menge M mit |M|=k besitzt 2^k Teilmengen 


U9.A1 – Einfache Diebstrategie 

! Zu implementierendes Verfahren in Pseudocode: 

1. Initialisierung 

2. Nimm nächste Konfiguration (wie genau…?) 

3. Berechne das gesamte Gewicht 

if (gesamtes Gewicht < G) 

berechne Gesamtwert 

if (neuer Gesamtwert > Gesamtwert aktuelle optimale Lösung) 

aktuelle Konfiguration ist neue optimale Lösung 

4. Falls noch Konfigurationen übrig, 

gehe zu Punkt 2 

else 

Berechnung fertig 


U9.A1.a – Einfache Diebstrategie 

! Liefert die einfache Dieb-Strategie immer das optimale Ergebnis? 

! Ja/Nein 

! Warum? .... 

! Gibt es immer genau eine optimale Lösung? 

! Ja/Nein? 

! Warum? ... 


U9.A1b,c – Bitwertigkeit 

! Konfiguration als Bitfolge: class Selection 

! Die Bitwertigkeit bezeichnet den Stellenwert eines einzelnen Bits, den es durch 

seine Position innerhalb einer Binärzahl hat. 

MSB - Most Significant Bit/Byte 

‣ Das höchstwertige Bit ist das Bit, das innerhalb der Zahl 

an der Stelle mit dem höchsten Stellenwert steht. 

LSB - Least Significant Bit/Byte 

‣ Analog dem MSB besitzt das niedrigstwertige Bit den 

niedrigsten Stellenwert. 


U9.A1b,c – Tipps für die Implementation 

! class Selection ist gut Dokumentiert 

! Achtung: bei Vergrösserung der Konfiguration (neuen Gegenstand in den Sack 

legen, A1c) muss der neue Stellenwert initialisiert werden 

! Beispiel-Selections für die Menge M 



Bruteforce Ansatz: 

public Selection findBest(ArrayList values, 

ArrayList weights, 

int maxWeight) 

{ 

... 

} 

int last = java.Math.pow(2, values.size()); //Anzahl der Teilmengen 

for( int i = 0; i < last; i++ ) 

{ 

new Selection(values.size(), i); //Selection Bitfeld mit Wert i 

... 

} 

... 



! Backtracking Ansatz: 

! FindResult Klasse (Selection und Value zusammen) 

! Rekursive Methode: 

FindResult fr = find(currSelection, currWeight, values, weights, maxWeight); 

! Abbruchbedingung: selection.size()==values.size(); //alles berücksichtigt 

! In der Methode zwei mögliche Richtungen zum Weitergehen: 

//Gegenstand hinterlassen 

Selection without = new Selection(...); //um eins vergrössern, bit auf 0 setzen 

//und weiter nach unten im Baum 

//prüfen ob Gewicht passt, dann Gegenstand mitnehmen 

... 

Selection with = new Selection(...); //um eins vergrössern, bit auf 1 setzen 

//und weiter nach unten im Baum 


Hinweise zu U9.A2 

Spieltheorie/Spielbaumauswertung 

a) Bisschen Theorie 

b) Minimax-Algorithmus 

c) Optimale Strategie für MAX-Spieler 

d) Alpha/Beta-Algorithmus 


26

U9.A2 – Spieltheorie 

! Bestanteile eines Spielbaums 

! Wurzel " Aktuellen Spielstellung 

! Knoten " Spielzustand 

! Kante " Spielzug 

! Blatt " Endzustand, (Spiel zu Ende) 


U9.A2b – Minimax-Algorithmus 

! Algorithmus zur Ermittlung der optimalen Spielstrategie für 

Nullsummenspiele 

! Sichert höchstmöglichen Gewinn bei optimaler Spielweise des 

Gegners 

! Bei Nicht-Nullsummenspielen können andere Algorithmen besser sein 


U9.A2b – Minimax-Algorithmus 

? 

0 

0 +1 

0 

0 +1 0 -1 +1 -1 

-1 +1 0 0 


U9.A2c – Strategie für Max 

! Strategie 

! Eine Strategie (für Max) sei ein Graph, der aus dem Spielbaum 

entsteht, indem man alle Kanten streicht und nur für jeden Max- 

Knoten eine einzige ausgehende Kante übrig lässt 

Also i.A. eine Menge von 

Knoten/Kanten, nicht nur ein 

Pfad!! 


U9.A2d – Der α-β-Algorithmus 

Online Beispiel durchgerechnet: 

http://www.vs.inf.ethz.ch/edu/FS2012/I2/slides/Info2-ITET-AlphaBeta.pdf 

(user: i2 password: i22012) 

Online JAVA Applet: 

http://www.ocf.berkeley.edu/~yosenl/extras/alphabeta/alphabeta.html 


31

Alpha-Beta-Algorithmus 

! Übungsbeispiel online, wir schauen mal rein... 

12.05.2011 


35 

Alpha-Beta-Algorithmus


beta 

Beta-Schnitt: MAX wird sicher einen Wert grössergleich 20 erreichen. Eine 

10 ist bereits bekannt. Der Wert des Teilbaums spielt keine Rolle! 


alpha 

beta 

Alpha-Schnitt: MIN wird sicher einen Wert kleinergleich 8 erreichen. Eine 10 

ist bereits bekannt. Der Wert des Teilbaums spielt keine Rolle!

Hinweise zu U9.A3 – Reversi (Teil 3) 

HumanPlayer 

RandomPlayer 

GreedyPlayer 

MinMaxPlayer 

nextMove() 

nextMove() 

nextMove() 

wartet auf Eingabe 

von der 

Kommandozeile 

nextMove() 

wählt ein 

zufälligen 

(aber gültigen!) 

nächsten Zug 

wählt nächsten 

Zug 

anhand einer 

einfachen, 

nicht-rekursiven 

Bewertungsfunktion 

wählt nächsten 

Zug 

anhand Min-Max- 

Analyse mit 

neuer 

Bewertungsfunktion 

Download 

Übung 7 Übung 8 Übung 9 


39 

U9.A3a – Reversi (Teil 3) 

! Auswertung von Spielbäumen 

! Implementieren Sie eine Methode, die den Spielbaum mit MinMax (oder 

NegaMax) maximal bis zur Tiefe d auswertet (abwechselnd Max und Min) 

! Suchtiefe konfigurierbar 

! Rekursiver Ansatz 

! Spielbaum rekursiv aufbauen 

! Situation auf Tiefe d bewerten 

! Minmax auf erhaltene Wertung ergibt die Strategie 

! Alle Spezialfälle berücksichtigen (z.B. passen)! 

! Noch keine Zeitbegrenzung 


U9.A3b – timeLimit 

! Zeitbegrenzung pro Zug: 

! Vor Ablauf von timeLimit Millisekunden soll ihre Methode nextMove() einen 

gültigen Zug zurückgeben 

! Seht einen kleinen Zeitbuffer vor (Grössenordnung einige 10ms), das 

Abbrechen und Resultat-zurückliefern passiert nicht sofort! 

! Möglicher Ansatz: eine out-of-time-exception werfen 


U9.A3c – Bewertungsfunktion (I) 

! Als „Inspirationsquelle“ könnt Ihr u.A. folgenden Artikel benutzen: 

! „The Development of a World Class Othello Program“, Kai-Fu Lee and 

Sanjoy Mahajan, 1990 

! Zum Herunterladen von der Reversi-Webseite 

! username: i2bib 

! password: reversi 

! Artificial Intelligence: A Modern Approach 

! Stuart Russell and Peter Norvig (2nd Edition, 2003) 


U9.A3c – Bewertungsfunktion (II) 

! Mögliche „Bewertungsfunktionen“ 

! Wie viele Steine werden umgedreht? 

! Wo liegen die umgedrehte Steine (innen/Rand)? 

! .... 

! Hinsichtlich dem Turnier empfiehlt sich 

! die Idee für die Bewertungsfunktion erst einmal mittels Pseudocode 

festzuhalten 

! den Pseudocode weiter zu entwickeln 

! der Pseudocode gibt erste Hinweise darauf, was für Informationen für jeden 

Zug berechnet werden müssen 

! aus den verschiedenen Versionen des Pseudocodes nach und nach den 

Turnierspieler implementieren 


…viel Spass! 


44

Informatik II Übung 09

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?