N - Grupo de Inteligencia Artificial

Inteligencia Artificial 

I.T. en Informática de Sistemas, 3º 

Curso académico: 2010/2011 

Profesores: Ramón Hermoso y Roberto Centeno 

Inteligencia Artificial 3º ITIS 

2010/11

Tema 2: Búsqueda 

2. Búsqueda 

2.1. Agentes de resolución de problemas 

2.2. Búsqueda no informada 

2.3. Búsqueda heurística 

2.4. Búsqueda multi-agente 


2010/11

Entorno: problemas bien definidos 

Problemas bien definidos: 

discreto: 

se puede concebir el mundo en estados 

en cada estado hay conjunto finito de percepciones y acciones 

accesible: el agente puede acceder a las características relevantes del mundo 

puede determinar el estado actual del mundo 

puede determinar el estado del mundo que le gustaría alcanzar 

estático y determinista: el agente puede planificar todas sus acciones, ya que 

el mundo cambia sólo cuando el agente actúa 

el resultado de cada acción está totalmente definido y previsible 


2010/11

Objetivo: 

Ejemplo: las Torres de Hanoi 

• Trasladar los discos 

de la aguja A a C en el 

mismo orden 

Restricción: 

• un disco mayor nunca 

debe reposar sobre 

uno de menor tamaño 

A B C 

A B C 

¿Cómo escribir el programa de agente correspondiente? 


2010/11

Solución 1: tablas de actuación 

Tablas de actuación específicos del problema: 

para cada situación hay una entrada en una tabla de 

actuación; 

dicha entrada compila la secuencia de acciones a emprender: 

cuatro discos en A ⇒ 

disco 1 de A a C / disco 2 de A a B / disco 1 de C a B / 

disco 3 de A a C / disco 1 de B a A / disco 2 de B a C / 

disco 1 de A a C / disco 4 de A a B / disco 1 de C a B / 

disco 2 de C a A / disco 1 de B a A / disco 3 de C a B / 

disco 1 de A a C / disco 2 de A a B / disco 1 de C a B 

problema: limitaciones de memoria 


2010/11

Algoritmos específicos del problema: 

• el diseñador del agente conoce un 

método para resolver el problema 

• codifica este método en un 

algoritmos particular para el 

problema 

• mejorar la flexibilidad: 

parametrizar el algoritmo 

• problema: el diseñador ha de 

anticipar todos los escenarios 

posibles 

• los entornos reales suelen ser 

demasiado complejos como para 

anticipar todas las posibilidades 

Solución 2: algoritmo 

PROCEDURE MoverDiscos(n:integer; 

origen,destino,auxiliar:char); 

{ Pre: n > 0 

Post: output = [movimientos para pasar n 

BEGIN 

discos de la aguja origen 

a la aguja destino] } 

IF n = 0 THEN {Caso base} 

writeln; 

ELSE BEGIN {Caso recurrente} 

MoverDiscos(n-1,origen,auxiliar,destino); 

write('Pasar disco',n,'de',origen,'a',destino); 

MoverDiscos(n-1,auxiliar,destino,origen) 

END; {fin ELSE} 

END; {fin MoverDiscos} 


2010/11

Solución 3: búsqueda 

Métodos independientes del problema : 

modelo declarativo del problema: 

“inicialmente todos los discos reposan en A y su tamaño decrece de abajo 

hasta arriba” 

“queremos que todos los discos estén en C en el mismo orden” 

“podemos mover un disco I a la aguja X, si no hay otro disco por encima de I 

y, si actualmente hay discos en X, entonces dichos discos han de ser más 

grandes que I” 

“cuanto menos movimientos de discos hagamos mejor” 

algoritmo de búsqueda genérico: 

genera una solución a cualquier problema representado mediante el modelo 

simbólico 

mayor flexibilidad: 

el diseñador no necesita conocer la solución de antemano 

es más fácil adaptar el método a nuevas características del problema 


2010/11

Solución 3: Modelo declarativo en 

CLIPS 

Escenario: 3 agujas (A, B, C) y 2 discos (uno, dos) 

(deffacts nombre-agujas 

"Lista con los nombres de las agujas" 

(agujas A B C)) 

(deffacts situacion-inicial 

"Lista describiendo la pos. inicial de los discos en las agujas" 

(situacion (acciones ) (posicion A uno dos base B base C base)) ) 

(deffacts situacion-final 

"Lista describiendo la pos. deseada de los discos en las agujas" 

(meta A base B base C uno dos base ) ) 

(deffacts predicado-menor 

"hechos que definen si un disco es menor que otro" 

(menor uno dos) (menor uno base) (menor dos base)) 


2010/11

Solución 3: Modelo declarativo en 

(defrule mover-x-a-y 

) 

(agujas $? ?x $?) 

(agujas $? ?y $?) 

(situacion (acciones $?acciones) 

CLIPS 

(posicion $?inicio ?x ?disco-x $?medio ?y ?disco-y $?final) ) 

(menor ?disco-x ?disco-y) 

=> 

(assert (situacion 

(defrule meta 

) 

(acciones $?acciones (format nil "%s-%s->%s" ?x ?disco-x ?y)) 

(posicion $?inicio ?x $?medio ?y ?disco-x ?disco-y $?final) ) ) 

(situacion (acciones $?acciones)(posicion $?s-final) ) 

(meta $?s-final) 

=> 

(printout t crlf "Solución: " $?acciones crlf) 

(halt) 


2010/11

Solución 3: Ajustes del Modelo 

Resultados de la búsqueda: 

• 3 agujas 2 discos: 

Declarativo 

– ("A-uno->B" "A-dos->C" "B-uno->C") 


– ("A-uno->C" "A-dos->B" "C-uno->B" "A-tres->C" "B-uno->A" 

"B-dos->C" "A-uno->C") 


– ("A-uno->B" "A-dos->C" "B-uno->C" "A-tres->B" "C-uno->A" 

"C-dos->B" "A-uno->B" "A-cuatro->C" "B-uno->C" "B-dos->A" 

"C-uno->A" "B-tres->C" "A-uno->B" "A-dos->C" "B-uno->C") 


– ("A-uno->B" "A-dos->D" "A-tres->C" "D-dos->C" "A-cuatro->D" 

"C-dos->A" "C-tres->D" "A-dos->D" "B-uno->D") 


2010/11

2. Búsqueda 





2.4. Búsqueda multiagente 


2010/11

Agentes de resolución de problemas 

mantienen un modelo simbólico del mundo 

desean modificar el estado del mundo de acuerdo con sus objetivos 

con tal fin, anticipan los efectos esperados de sus acciones sobre el 

modelo 

C 

A 

B 

D 

E 

A 

B 

C 

D 

E 


2010/11

Ciclo de actuación: 

1. Definir el modelo 

2. Generar los objetivos 

Agentes especializados 

3. Percibir y clasificar la situación presente 

4. Buscar un plan de actuación 

5. Ejecutar el plan de actuación 

Los agentes son especializados: 

• el diseñador dota al agente a priori con conocimientos 

específicos 

– que definen el modelo 

– que definen los objetivos 

• se supone una percepción y una ejecución ideal 


2010/11

Búsqueda en espacios de estados 

Espacio de estados: modelo del mundo representado por un grafo 

Problema de búsqueda: espacio de estados + actitud del agente 

Objetivo: encontrar el plan más eficiente que lleve del estado inicial a un 

estado meta 


2010/11

Estado: 

• configuración de n bloques 

Operadores: 

El problema de los bloques 

• apilar(X,Y): poner X encima de Y 

– Prec.: bloques X e Y están libres 

– Post.: bloque X está encima de Y 

• quitar(Y): poner Y en la mesa 

– Prec.: bloque Y está libre 

Coste: 

– Post.: bloque Y está en la mesa 

• la aplicación de cada operador vale 

una unidad 

Estado inicial 

C 

A B 

Estado meta 

A 

B 

C 


2010/11

Representación del problema 

Ejemplo con 3 bloques 

A 

B C 

C 

A 

B 

A 

C B 

B 

A 

C 

de los bloques 

C 

B A 

A 

C 

B 

A B C Plan óptimo: coste 3 

C 

A B 

B 

C 

A 

B 

C A 

A 

B 

C 

B 

A C 

C 

B 

A 


2010/11

€ 

Conocimientos del agente 

• Representación implícita del problema de búsqueda 

• Conocimientos mínimos a priori de un agente: 

• s 0 


• expandir: s {s i1 , ..., s in } Conjunto finito de sucesores 

de un estado 

• meta?: s verdad | falso Prueba de éxito en un estado 

• c: (s i , s j ) v, v ∈ ℵ Coste de un operador 

n−1 

• c ( s s …s i1 i2 in ) = ∑c 

( s ,s ik ik+1 ) Coste de un plan 

k=1 


2010/11

Ejercicio 1 

Problema de búsqueda / conocimiento del agente: 

En una mesa se encuentran dos jarras, una con una capacidad de 3 litros 

(llamada Tres), y la otra con una capacidad de 4 litros (llamada Cuatro). 

Inicialmente, Tres y Cuatro están vacías. Cualquiera de ellas puede llenarse con 

el agua de un grifo G. Asimismo, el contenido tanto de Tres como de Cuatro 

puede vaciarse en una pila P. Es posible verter todo el agua de una jarra a la otra. 

No se dispone de dispositivos de medición adicionales. Se trata de encontrar una 

secuencia de operadores que deje exactamente dos litros de agua en Cuatro. 

a) Modele este problema como un problema de búsqueda. Con tal fin, defina el 

estado inicial, el conjunto de estados meta, los operadores (especificando sus 

precondiciones y post-condiciones), así como el coste de cada operador. 

b) Caracterice el conocimiento a priori del agente de resolución del problema 

correspondiente? Facilite ejemplos de los resultados de la función expandir. 

c) Encuentre una solución al problema. 


2010/11

Método de búsqueda: 

• estrategia para explorar el 

espacio de estados 

• en cada paso se expande un 

estado 

• se desarrolla sucesivamente 

un árbol de búsqueda 

Método general de búsqueda: 

1. seleccionar nodo hoja 

2. comprobar si es nodo meta 

3. expandir este nodo hoja 

Método de búsqueda 

Arbol de búsqueda: 

A 

C 

B 

C 

B A 

A 

B 

C 

C 

A B 

B 

C 

A 

B 

A C 

A 

B 

B 

C A 

A 

B 

C 

C 


2010/11

Elementos del algoritmo 

• el árbol se representa en base 

a un registro del tipo nodo 

• abierta es una lista de nodos, 

que reúne las hojas del árbol 

• vacía? determina si una lista 

es vacía 

• primero quita el primer 

elemento de una lista 

• ordInsertar añade un nodo a 

una lista, clasificado según 

una función de orden 

Algoritmo de búsqueda 

{búsqueda general} 

abierta ← s 0 

Repetir 

Si vacía?(abierta) entonces 

devolver(negativo) 

nodo ← primero(abierta) 

Si meta?(nodo) entonces 

devolver(nodo) 

sucesores ← expandir(nodo) 

Para cada n∈sucesores hacer 

n.padre ← nodo 

ordInsertar(n,abierta,) 

Fin {repetir} 


2010/11

Problema: 

Estados repetidos 

• el mismo estado puede repetirse varias veces en el árbol de búsqueda 

• puede generarse el mismo subárbol varias veces 

Soluciones: 

• ignorarlo 

• evitar ciclos simples: 

– no añadir el padre de un nodo al conjunto de sucesores 

• evitar ciclos generales: 

– no añadir un antecesor de un nodo al conjunto de sucesores 

• evitar todos los estados repetidos: 

– no añadir ningún nodo existente en el árbol al conjunto de sucesores 


2010/11

Características: 

Clasificación de métodos 

• completitud: se encuentra una solución si existe 

• optimalidad: se encuentra la mejor solución si hay varias 

• complejidad en tiempo: ¿cuánto se tarda en encontrar la solución? 

• complejidad en espacio: ¿cuánta memoria se utiliza en la búsqueda? 

Tipos de métodos de búsqueda: 

• no informados: utilizan sólo los conocimientos mínimos 

• heurísticos: además utilizan información aproximada, y específica 

del problema, para guiar la búsqueda 


2010/11

úsqueda 

general 

Resumen de los métodos de búsqueda 

(i) 

búsqueda en 

amplitud 

2.2 búsqueda 

no informada 

(ii) búsqueda 

en 

profundidad 

(iii) Búsqueda 

profundidad 

iterativa 

(iv) búsqueda 

de coste 

uniforme 

(vii) IDA* 

(v) búsqueda 

avara 

2.3 búsqueda 

heurística 

(vi) A * 


2010/11

2. Búsqueda 


2.1. Agentes de resolución de 

problemas 





2010/11

Búsqueda en amplitud: 

• inglés: breadth first search 

• Estrategia: 

Búsqueda en amplitud 

– generar el árbol por niveles de 

profundidad 

– expandir todos los nodos de nivel 

i, antes de expandir nodos de 

nivel i+1 

• Resultado: 

– considera primero todos los 

caminos de longitud 1, después 

los caminos de longitud 2, etc. 

– Se encuentra el estado meta de 

menor profundidad 


2010/11

Árbol de búsqueda en amplitud 


Nivel 1 

Nivel 2 

Nivel 3 

Nivel 4 

A 

C 

B 

C 

B A 

A 

B 

. . . 

C 

B 

C 

A 

A 

B C 

C 

A B 

A 

C B 

. . . . . . 

A 

B 

B 

C A 

B 

C A 

C 

C 

B A 

A 

B 

C 

B 

A C 


2010/11

Algoritmo: 

Algoritmo para búsqueda en amplitud 

• usar el algoritmo general de 

búsqueda 

• añadir nuevos sucesores al final 

de la lista abierta 

• abierta funciona como cola 

– inserción al final 

– recuperación desde la cabeza 

• estructura FIFO: 

– siempre expandir primero el 

nodo más antiguo (es decir: 

menos profundo) 

{búsqueda en amplitud} 


Repetir 







Para cada n∈ sucesores hacer 


ordInsertar(n,abierta,final) 

Fin {repetir} 


2010/11

A 

C 

B 

C 

B A 

A 

B 

C 

Árbol de búsqueda en amplitud 

B 

C 

A 

A 

B C 

C 

A B 

A 

C B 

A 

. . . . . . . . . B 

B 

A C 

C 

A 

B 

B 

C A 

C 

C 

B A 

B 

A C 

Lista abierta: 

A 

C 

A B 

C 

B A 

B 

C 

A 

B 

A 

C 

B 

B 

C A 

C 

A 

A 

B 

C 

A 

B 

A 

C 

B 

B 

C 

C 

A 

A 

B 

A 

C 

B 

B 

A 

B C 

C 

C 

. . . 

C B 

B A A C ... 

A 

B 

A 

C B 

A 

C B 

B 

B 

B A A C ... A C 

C 

. . . 

C 

B 

C A 

C 

B A 


2010/11 

B 

A C

Mejor caso 

d–2 

d–1 

d 

1 

Complejidad 

Complejidad en tiempo y espacio: 

1+b+...+b d-1 +1 ∈ O(b d ) 

0 

• proporcional al número de nodos expandidos 

Suponemos que en el árbol de búsqueda 

• el factor de ramificación es b 

• el mejor nodo meta tiene profundidad d 

. . . 

Caso medio 

d–2 

d–1 

d 

1 

0 

. . . 

1+b+...+b d-1 +b d /2 ∈ O(b d ) 

Peor caso 

d–2 

d–1 

d 

1 

0 

. . . 

1+b+...+b d-1 +b d ∈ O(b d ) 


2010/11

Requerimientos de tiempo y memoria 

Requerimientos de recursos de una búsqueda en amplitud exponencial 

• factor de ramificación efectivo: 10 

• tiempo: 1000 nodos/segundo 

• memoria: 100 bytes/nodo 


2010/11

Búsqueda en amplitud: análisis 

Ventajas: 

• completo: 

• siempre se encuentra un nodo meta si existe 

• óptimo (para operadores de coste uno): 

• siempre se encuentra el nodo meta menos profundo 

Problemas: 

• complejidad 

• exponencial incluso en el mejor caso 

• los problemas de espacio son aún más graves que los 

problemas de tiempo 


2010/11


Ejercicio 2.2 

El grafo que se muestra al lado 

determina un problema de búsqueda. 

Cada nodo representa un estado; los 

arcos modelan la aplicación de 

operadores. Suponga que A es el 

estado inicial y que K y E son 

estados meta 

a) desarrolle el árbol de búsqueda 

que genera la búsqueda en 

amplitud. ¿Cuál de los nodos 

meta se encuentra primero? 

b) indique el orden en que se 

expanden los nodos 

c) ponga el estado de la lista abierta 

en cada paso del algoritmo 

H 

D 

C 

A 

F 

E 

G 

B K Z 

W 


2010/11

Búsqueda en profundidad: 

• inglés: depth first search 


Búsqueda en profundidad 

• expandir los nodos más 

profundos primero 

• si se llega a un nodo sin 

sucesores, dar vuelta atrás y 

expandir el siguiente nodo más 

profundo 

• Resultado: 

• el método va explorando un 

“camino actual” 

• no siempre se encuentra el 

nodo de profundidad mínima 


2010/11

Árbol de búsqueda en profundidad 

búsqueda en profundidad 

(evitando ciclos simples): 

B 

C 

A 

A 

C 

B 

B 

C A 

C 

A B 

A 

C B 

A 

B 

B 

C 

A C 

C 

B A 

A 

B 

A 

B C 

C 

A 

C 

B A 

B 

C 

B 

A C 


2010/11

Algoritmo: 

• usar el algoritmo general de 

búsqueda 

Búsqueda en profundidad 

• añadir nuevos sucesores en la 

cabeza de la lista abierta 

• abierta funciona como pila 

– inserción en la cabeza de la lista 

– recuperación desde la cabeza 

• estructura LIFO: 

– siempre expandir primero el 

nodo más reciente (es decir: 

el más profundo) 

• al guardar todos los sucesores de 

un nodo expandido en abierta, se 

permite la “vuelta atrás” 

{búsqueda en profundidad} 


Repetir 









ordInsertar(n,abierta,cabeza) 

Fin {repetir} 


2010/11

B 

C 

A 

Árbol de búsqueda en profundidad 

A 

C 

B 

B 

C A 

A 

B 

C 

C 

A B 

A 

C B 

B 

A C 

C 

B A 

A 

B 

A 

B C 

C 

A 

C 

B A 

B 

C 

B 

A C 

Lista abierta: 

C 

A B 

B 

C 

A 

C 

B A 

A 

C 

B 

A 

C 

B A 

B 

C 

A 

B 

C 

A B C A B C 

A B C A B C 

B 

C A 

A 

B 

C 

A 

C B 

B 

A C 

A 

B C 

A 

C B 

C 

B A 

A 

B C 

B 

A C 

C 

B A 

C 


2010/11 

A 

B 

B 

A C 

A 

B 

C

Problema: 

Límites de profundidad 

• la búsqueda en profundidad sólo es completa en el 

caso de árboles de búsqueda finitos 

• si existen caminos infinitos sin nodo meta, es posible 

que la búsqueda en profundidad no termine 

Solución: 

• búsqueda en profundidad limitada: 

– inglés: depth limited search 

– búsqueda en profundidad con límite de profundidad d * 

– expandir sólo nodos con profundidad d ≤ d * 

• incompleto si la profundidad del mejor nodo meta es mayor 

que d * 

. . . 


2010/11

Búsqueda en profundidad limitada: 

Complejidad en tiempo: 

complejidad 

• proporcional al número de nodos expandidos 

• factor de ramificación b / límite de profundidad d* / 

nodo meta con profundidad d≤d* 

• mejor caso: O(d) (se expanden sólo los nodos del camino meta) 

• peor caso: O(bd*) (se expanden todos los nodos de prof. ≤ d*) 

Complejidad en espacio: 

• sólo los nodos del camino actual y sus “vecinos” (sucesores) necesitan 

almacenarse en la memoria 

• lineal en la profundidad del árbol de búsqueda 

– mejor caso: O(b·d) / peor caso: O(b·d * ) 


2010/11

Búsqueda en profundidad limitada: 

Ventajas: 

análisis 

• mejora significativa de la complejidad en espacio con respecto a 

la búsqueda en amplitud (lineal frente a exponencial): 

• completo para límites de profundidad d* adecuados 

Problemas: 

• no es óptima: el nodo meta que se encuentra puede no ser de 

profundidad mínima 

• es común que unos límites “buenos” de profundidad sólo pueden 

establecerse cuando el problema ya haya sido resuelto 

• en general, no se puede asegurar que la profundidad d de un nodo 

meta sea d ≤ d * , es decir no se puede garantizar la completitud. 


2010/11

Búsqueda en profundidad: 

Ejercicio 2.3 

El grafo que se muestra al lado determina un 

problema de búsqueda. Cada nodo representa 

un estado; los arcos modelan la aplicación de 

operadores. Suponga que A es el estado inicial 

y que K y E son estados meta 

a) desarrolle el árbol de búsqueda que genera 

la búsqueda en profundidad. ¿Cuál de los 

nodos meta se encuentra primero? 

b) indique el orden en que se expanden los 

nodos 

c) ponga el estado de la lista abierta en cada 

paso del algoritmo 

d) ¿cómo cambiaría el proceso de búsqueda si 

aplicamos límites de profundidad, p.ej.: 

d * =2? 

H 

D 

C 

A 

F 

E 

G 

B K Z 

W 


2010/11

Ejercicio 2.4 

Búsqueda en profundidad (limitada): 

La búsqueda en profundidad puede 

implementarse fácilmente con un programa 

recursivo. 

a) Especifique una implementación recursiva de 

la búsqueda en profundidad en pseudocódigo. 

b) Modifique el pseudocódigo del ejercicio a) 

para incorporar límites de profundidad. 


2010/11

Búsqueda de profundización iterativa 

• Inglés: iterative deepening search 

• Idea: 

– esquivar el problema de elegir d * , al probar todos los posibles límites 

de profundidad 


– enumerar todos los límites de profundidad d´, empezando por 0 

– realizar búsqueda de profundidad limitada hasta d´ 

• Algoritmo: 

{búsqueda de profundización iterativa} 


desde d´ ← 0 hasta ∝ hacer 

si búsqueda-en-prof-limitada(problema, d´) = éxito entonces 

fin {desde} 

devolver(nodo-meta) 


2010/11

Búsqueda de profundización iterativa 

límite d * =1 

fallo 

. . . 


fallo 

. . . 


. . . 

éxito 


2010/11

Búsqueda de profundización iterativa: 

Complejidad en espacio: 

complejidad 

• igual que la búsqueda en profundidad: sólo se almacenan los nodos 

vecinos del camino actual 

• lineal en la profundidad del árbol de búsqueda: peor caso O(b·d) 

Complejidad en tiempo: 

• normalmente el coste adicional es relativamente pequeño 

• argumento intuitivo: 

– suponga un árbol de búsqueda de profundidad d 

– los nodos interiores (prof.

Búsqueda de prof. iterativa: complejidad en 

tiempo 

Complejidad en tiempo en el peor caso: 

• nº de nodos expandidos por la búsqueda en prof. limitada hasta prof. d: 

• nº de nodos expandidos por la búsqueda de prof. iterativa hasta prof. d: 


2010/11

Búsqueda de prof. iterativa: complejidad en 

tiempo 

Coste adicional de tiempo de la búsqueda de profundización iterativa: 

€ 

id 

Nw d 

dl 

Nw d 

( ) 

= 

( ) 

b d+2 −2b −bd +d +1 

b −1 

( ) 2 

b d+1 −1 

b −1 

= bd +2 − 2b − bd + d +1 

( b −1) 

2 ⋅ 

= bd +2 − 2b − bd + d +1 

b d +2 − b d +1 − b +1 

= bd +1 b − 2b 

= b − 2 

b −1 

b d +1 −1 

b d+1 − bd 

b d+1 + d 

b d+1 + 1 

( ) 

( ) 

b d +1 b − 

b d+1 

b d+1 − b 

b d+1 + 1 

b d − d 

b d + d 

b d+1 + 1 

b d+1 

b −1− 1 

b d + 1 

b d+1 

b d+1 

b d+1 


2010/11

Búsqueda en prof. iterativa: complejidad en 

tiempo 

Coste adicional de tiempo de la búsqueda de profundización iterativa: 

• para d→∞ se obtiene: 

• Ejemplo: b= 10 

• para b=10 y nodos meta profundos, la búsqueda de profundización 

iterativa expande sólo 11% más nodos que la búsqueda en 

profundidad limitada 

• complejidad en tiempo en el peor caso de la búsqueda de 

profundización iterativa : O(b d ) 


2010/11

Búsqueda no informada: resultados 

Resultados del peor caso: 

• factor de ramificación b / profundidad de la mejor solución d / 

límite de profundidad d * 

Método no 

informado 

preferido 


2010/11

Ejercicio 2.5 


El grafo que se muestra al lado determina un 

problema de búsqueda. Cada nodo representa 

un estado; los arcos modelan la aplicación de 

operadores. Suponga que A es el estado inicial 

y que K y E son estados meta 

a) desarrolle la secuencia de árboles de 

búsqueda generadas por la búsqueda de 

profundización iterativa, indicando para 

cada uno de ellos el orden en que se 

expanden los nodos 

b) ¿Cuál de los nodos meta se encuentra 

primero? 

H 

D 

C 

A 

F 

E 

G 

B K Z 

W 


2010/11

Ejercicio 2.6 


Describa características relevantes de los 

espacios de búsqueda en los que el 

rendimiento de la búsqueda de 

profundización iterativa es mucho peor 

que el de la búsqueda en profundidad 

estándar. Ponga un problema ejemplo que 

ilustre dichas características. 


2010/11

Problema de encontrar rutas 

Estado: estancia en una ciudad 

Coste de un operador: distancia por 

carretera a la ciudad vecina 

Operadores: ir a una ciudad vecina 

Coste de un plan: suma de distancias 

entre las ciudades visitadas 

Oradea 

Zerind 71 

75 

151 

Arad 

140 

Sibiu 99 

118 

80 

Rimnicu 

Timisoara 

97 

Neamt 

Fagaras 

211 

87 

142 

Iasi 

92 

Vaslui 

111 Lugoj 

70 146 

Mehadia 

75 

Dobreta 120 

Pitesti 

101 

138 

Craiova 

98 

85 

Urziceni 

Bucarest 

90 

Giurgiu 

Hirsova 

86 

Eforie 


2010/11

118 

Z 

75 

A 

T 

Problema de encontrar rutas: ejemplo 

71 

111 

75 

D 

O 

140 

70 

L 

M 

Problema: 

151 

120 

S 

80 

R 

146 

C 

99 

97 

138 

P 

F 

101 

211 

G 

90 

B 

N 

85 

U 

87 

142 

I 

98 

92 

V 

H 

86 

E 

Ejemplo: 

• p 1 = A-S-F-B 

c(p 1 ) = 450 

• los métodos de búsqueda no informados encuentran el nodo meta de 

menor profundidad; éste puede no ser el nodo meta de coste mínimo 

• prof.(B p1 ) = 3 < 4 = prof.(B p2 ) / c(p1) = 450 > 418=c(p2) 

• p 2 = A-S-R-P-B 

c(p 2 ) = 418 


2010/11

Búsqueda de coste uniforme 

Búsqueda de coste uniforme: 

• Inglés: uniform cost search 

• Idea: 

• guiar la búsqueda por el coste de los 

operadores 

• Método: 

• g(n): coste mínimo para llegar 

del nodo inicial al nodo n 

• expandir siempre el nodo de menor 

coste g primero 

• Algoritmo: 

• almacenar cada nodo con su valor g 

• insertar los nuevos nodos en abierta 

en orden ascendente según su valor g 

{búsqueda de coste uniforme} 


Repetir 

Si vacío?(abierta) entonces 








ordInsertar(n,abierta,g) 

Fin {repetir} 


2010/11

R 

g=220 

Ejemplo: Búsqueda de coste uniforme 

S 

g=140 g= 118 Z 

A O F 

g=280 g=291 g =239 

S P C g=366 

g=300 g=317 

B 

g = 0 

T M 

g = 340 g= 299 

g =75 

L A 

g=229 g=236 

. . . 

Z S 

g = 212 g= 292 

O A g=150 

g=146 

S Z T g=268 

g=290 g=225 

O A 

g=283 g=287 

O A 

g=296 g=300 


2010/11

Lógica de la búsqueda de coste uniforme 

118 

Z 

75 

A 

T 

71 

111 

75 

D 

O 

140 

70 

L 

M 

g = 80 

151 

S 

120 

80 

R 

146 

C 

99 

97 

138 

P 

F 

101 

211 

G 

90 

g = 120 

B 

N 

85 

U 

87 

142 

I 

98 

92 

V 

H 

86 

E 

g = 160 


2010/11

Características de la búsqueda de coste 

Dinámica: 

uniforme 

• la búsqueda de coste uniforme desarrolla sucesivamente todos los caminos por 

orden de valor g creciente 

• igual que la búsqueda en amplitud si g(n) = prof.(n) para todos los n 

La búsqueda de coste uniforme es óptima: 

• suponga que se encuentra un camino a un nodo meta n g con g(n g ) = k 

• los valores de g crecen de forma monótona la largo de todos los caminos del 

árbol de búsqueda 

• por tanto, la búsqueda de coste uniforme expande todos los nodos n g con g(n) 

< k 

• en particular, si hubiera un nodo meta n g ' con g(n g ') < k , éste se habría 

expandido antes que n g 

• contradicción; en consecuencia n g es el nodo meta de menor coste (valor de g) 


2010/11

Características de la búsqueda de coste 

uniforme 

La búsqueda de coste uniforme es completa: 

• sea n g un nodo meta con g(n g ) = k 

• suponga que no es encontrado por la búsqueda de coste uniforme 

– debe haber un número infinito de nodos n i con g(n i ) ≤ k 

– ya que el número de sucesores de un nodo es finito, debe haber un camino 

infinito p, tal que para todos los nodos n i de p se cumple que g(n i ) ≤ k 

– pero la función de coste c asigna un entero positivo a cada operador, 

y todas las sucesiones crecientes de enteros no tienen límite 

• contradicción; en consecuencia el nodo meta n g será encontrado 

Complejidad en tiempo y espacio: 

• exponencial, al igual que la búsqueda en amplitud 


2010/11

Ejercicio 2.7 

Búsqueda de coste uniforme: 

Aplique la búsqueda de coste uniforme para encontrar 

una ruta de Craiova (C) a Fagaras (F). Desarrolle el 

árbol de búsqueda generado por dicho algoritmo, 

asumiendo que se evitan ciclos simples. Indique el 

valor g de cada nodo, así como el orden en el que se 

expanden los nodos. 


2010/11

2. Búsqueda 


2.1. Agentes de resolución 

de problemas 





2010/11

Heurísticas 

Heurística (griego: heuriskein): “encontrar”, “descubrir” 

Inteligencia Artificial: 

• compila conocimiento “empírico” sobre un problema / un entorno 

Interpretación “fuerte”: 

• una heurística suele facilitar la resolución de un problema, pero no garantiza 

que se resuelva 

• una heurística es una “regla de tres” para un problema 

• búsqueda: optimalidad o incluso completitud no garantizados 

Interpretación “débil”: 

• método riguroso + información heurística 

• información heurística puede mejorar el rendimiento medio de un método de 

resolución de problemas, pero no garantiza una mejora en el peor caso 

• búsqueda: mejora de complejidad no garantizado 


2010/11

Funciones heurísticas 

Funciones heurísticas para búsqueda en el espacio de estados: 

• estiman de adecuación de un nodo para ser expandido 

• métodos de búsqueda “el mejor primero” eligen el nodo más 

prometedor para expandir 

Heurística usual: “distancia” hacia la meta 

• h :N→ℵ mide el coste real desde el nodo n hasta el nodo meta más 

cercano 

• h * :N→ℵ es una función heurística que estima el valor de h(n) 

• una función heurística h * es optimista, si h * (n) ≤ h(n) para todo nodo n 

Ejemplos de funciones heurísticas optimistas: 

• mundo de los bloques: número de bloques descolocados 

• encontrar rutas: distancia en línea recta hasta un nodo meta 


2010/11

118 

Función heurística para encontrar rutas 

Z 

75 

A 

T 

71 

111 

75 

D 

O 

140 

70 

L 

M 

151 

120 

S 

80 

R 

146 

C 

99 

97 

138 

P 

F 

101 

211 

G 

90 

B 

N 

85 

U 

87 

142 

I 

98 

92 

V 

H 

86 

E 

h * 

A 366 

B 0 

C 160 

D 242 

E 161 

F 178 

G 77 

H 151 

I 226 

L 244 

M 241 

N 234 

O 380 

P 98 

R 193 

S 253 

T 329 

U 80 

V 199 

Z 374 


2010/11

Búsqueda avara: 

Inglés: greedy search 

Idea: 

Estrategia: 

Algoritmo: 

minimizar el coste estimado para 

llegar a la meta 

Entre las hojas del árbol de 

búsqueda, seleccionar el nodo que 

minimice h * (n) 

mantener la lista abierta ordenada 

por valores crecientes de h * 

insertar nuevos nodos en abierta 

según sus valores h * 

Búsqueda avara 

{búsqueda avara} 


Repetir 









ordInsertar(n,abierta,h * ) 

Fin {repetir} 


2010/11

Ejemplo 1: búsqueda avara 

S T 

h * h = 374 

* = 253 h * = 329 Z 

h * A F O R 

= 366 h * = 178 h * = 380 h * = 193 

S h * = 253 B h * =0 

h * = 366 

Solución subóptima: 

• c(A-S-F-B) = 450 

• c(A-S-R-P-B) = 418 


2010/11

Ejemplo: 

• Nodo inicial: I (Iasi) 

Ejemplo 2: búsqueda avara 

• Nodo meta: F (Fagaras) 

• h F * estima la distancia hasta F 

h F * 

F 0 

I 226 

N 201 

V 246 

. . . 

h F * = 226 

N V h F * =246 

h F * = 201 

h F * = 226 

N V h F * =246 

h F * = 201 

h F * = 226 

. . . 


2010/11

Análisis: 

Búsqueda avara: análisis 

• en general, la búsqueda avara sufre los mismos problemas que la búsqueda en 

profundidad 

• no es óptima (ejemplo 1) 

• no es completa (ejemplo 2) 

• sin embargo, suele encontrar una solución aceptable de forma rápida 

Comentarios: 

• problema fundamental de la búsqueda avara: 

• sólo considera el coste para llegar al nodo actual 

• no se fija en la distancia restante desde el nodo actual 

• para asegurar la completitud habría que evitar todos los estados repetidos 

• el método es óptimo sólo en aquellos espacios de estados en los que el coste de un 

nodo n es independiente del camino por el que se llega hasta él 


2010/11

Problema de las 4 reinas: 

• 4 reinas en un tablero 4x4 

• estados: casillas de las 4 reinas 

• metal?: ninguna reina amenazada 

• op.: mover una reina a otra casilla 

de su misma fila 

• coste: el coste de cada op. es cero 

• estado inicial: 

Ejercicio 2.8 

Nótese: 

• dado que el coste de cada operador es 0, el 

camino por el cual se llega a un nodo no 

importa, siempre que al final se encuentre 

un nodo meta (ninguna reina esta 

amenazada) 

a) encuentre una heurística h * para el 

problema de las 4 reinas 

b) resuelve el problema aplicando la 

búsqueda avara con dicho heurística h * 

Comentario: 

si concebimos cada fila como una 

variable, podemos replantear el ejercicio 

como un problema de satisfacción de 

restricciones 


2010/11


Búsqueda A * 

• minimizar el coste estimado total de un camino en el árbol de búsqueda 

• combinar 

• el coste para llegar al nodo n (se conoce exactamente: g), y 

• el coste aproximado para llegar a un nodo meta desde el nodo n 

(estimado por la función heurística h * ) 

Función heurística de A * : 

– f (n) = g(n) + h(n): coste real del plan de mínimo coste que pasa por n 

– f * (n) = g(n) + h * (n): estimación de f 

Estrategia A * : 

• entre las hojas del árbol de búsqueda, elegir el nodo de valor f * mínimo 


2010/11

Algoritmo A* : 

• se basa en la búsqueda general 

• almacenar el valor g de cada nodo 

expandido 

• mantener la lista abierta ordenada 

por valores crecientes de f * 

• insertar nuevos nodos en abierta 

según sus valores f * 

El Algoritmo A * 

{A*} 


Repetir 

Si vacío?(abierta) entonces 








ordInsertar(n,abierta, f * ) 

Fin {repetir} 


2010/11

A 

f * = 280+366 

= 646 

S B 

f * = 338+253 

= 591 

f * = 450+0 

= 450 

Ejemplo 1: Búsqueda A * 

S 

f * = 140+253 

= 393 

F O R 

f * = 239+178 

= 417 

f * = 291+380 

= 671 

T 

f * = 118+329 

= 447 Z 

f * = 220+193 

= 413 

f * = 75+374 

= 449 

C P S f * f = 300+253 

* = 366+160 f * = 317+98 

= 526 

f * = 0+366 

= 366 

f * = 414+193 

= 607 

= 415 

f * = 455+160 

= 615 

R C B 

= 533 

f * = 418+0 

= 418 


2010/11

Ejemplo: 

Ejemplo 2: Búsqueda A * 

• Nodo inicial: I (Iasi) / nodo meta: F (Fagaras) 

• h F * estima la distancia hasta F 

f F * = 0+226 

= 226 

N V fF * fF = 92+246 

* = 87+201 

= 288 

f F * = 174+226 

= 400 

= 338 

U I fF * fF = 184+226 

* = 234+151 

f * = 376+246 

= 622 

. . . 

= 385 

f * = 319+180 

= 499 

V B H 

= 410 

f * = 332+350 

= 682 

h F * 

B 180 

F 0 

I 226 

N 201 

U 151 

V 246 

. . . 


2010/11

Valores de f * en árboles de búsqueda A * 

Posibles “tipos” de variación de los valores de f * a lo largo de un 

camino desde la raíz hasta un nodo n j 

f * 

f * (n j ) 

n 1 

(a) variable 

n j 

f * 

f * (n j ) 

n 1 

n j 

(b) monótono creciente 


2010/11

Funciones heurísticas consistentes 

Definición: 

Si para todo nodo n i y todo sucesor n j de n i se cumple que 

entonces h * es consistente 

Interpretación intuitiva: 

• h * es consistente si cumple la 

desigualdad triangular 

h * (n i ) – h * (n j ) ≤ c(n i ,n j ) 

c(n i ,n j ) 

n i 

n j 

h * (n i ) 

Nota: Si h * es consistente, entonces también es optimista 

h * (n j ) 

n g 


2010/11

Monotonía de f * con función 

heurística consistente 

Lema 1: Si h * es consistente, entonces f * crece de forma monótona en 

todos los caminos del árbol de búsqueda, es decir: si n j es 

sucesor de n i , entonces 

f * (n j ) ≥ f * (n i ) 

Prueba: 

h * (n j ) ≥ h * (n i ) – c(n i ,n j ) 

h * (n j ) + g(n j ) ≥ h * (n i ) + g(n j ) – c(n i ,n j ) 

h * (n j ) + g(n j ) ≥ h * (n i ) + g(n i ) + c(n i ,n j ) – c(n i ,n j ) 

f * (n j ) ≥ f * (n i ) 


2010/11

Valores de f * en árboles de búsqueda A * 

f * 

f * (n j ) 

n 1 

h * consistente 

n j 

f * 

f * (n j ) 

n 1 

h * consistente 

(a) variable (b) monótono creciente 

Corolario 1: Sea n m el mejor nodo meta. Si h * es consistente, entonces el 

conjunto de nodos expandidos por el algoritmo A * es 

{n i | f * (n i ) ≤ f * (n m ) } 

n j 


2010/11

Lógica de la búsqueda A * con función 

118 

Z 

75 

A 

T 

71 

111 

75 

D 

O 

140 

70 

L 

f * = 380 

heurística consistente 

M 

151 

120 

S 

80 

R 

146 

C 

99 

97 

138 

P 

F 

101 

211 

G 

90 

B 

f * = 400 

N 

85 

U 

87 

142 

I 

98 

92 

V 

H 

86 

E 

f * = 420 


2010/11

Optimalidad de A * 

Teorema 1: Si h * es consistente, entonces el método A * es óptimo 

Prueba: 

1. Debido a la consistencia de h * , la búsqueda se realiza por las “curvas de nivel” correspondientes a 

f * (lema 1). Se expanden sucesivamente los nodos de menor a mayor valor de f * 

2. Por tanto, el primer nodo meta encontrado n tendrá el valor mínimo de f * 

(e.d. la misma argumentación que en el caso de la búsqueda de coste uniforme) 

3. Un nodo meta con valor mínimo de f * también tiene el valor mínimo de g. 

• f * (n ) = g(n )+ h * (n ) 

• Si h * es consistente también es optimista, y entonces h * (n ) = 0 

para todo nodo meta 

4. En consecuencia, el camino en el árbol de búsqueda desde la raíz hasta el primer nodo meta n es 

de coste mínimo, y A * es óptimo 

Nota: se puede demostrar el siguiente teorema más general: 

Si h * es optimista, entonces el método A * es óptimo 


2010/11

Completitud de A * 

Teorema 2: Si h * es consistente, entonces el método A * es completo 

Prueba: 

• sea n g un nodo meta con f * (n g ) = k. Suponga que n g no es encontrado por el método 

A * 

• ya que el número de sucesores de un nodo es finito, debe haber un camino infinito p 

• debido al lema 1 (monotonía de f * ) todos los nodos n i de p han de cumplir f * (n i ) ≤ k 

• pero la secuencia de valores de g a lo largo de p no tiene límite 

(véase la prueba de completitud de la búsqueda de coste uniforme) 

• por definición h * (n) ≥ 0, por lo que la secuencia de f * (n i ) = g(n i ) + h * (n i ) tampoco tiene 

límite para los nodos n i a lo largo de p 

• contradicción; en consecuencia, el método A * encuentra el nodo meta n g 

Nota: se puede demostrar que A * es completo para cualquier función heurística 

positiva h * 


2010/11

Encontrar Funciones Heurísticas: Aprendizaje 

Idea: generar información heurística “sobre la marcha” 

• realizar varias búsquedas (ligeramente diferentes) en el mismo dominio 

(p.e. siempre a Bucarest, pero desde diferentes ciudades iniciales) 

• En cada paso de una búsqueda, usar el coste real de un paso parar mejorar el valor de h * 

• En la próxima búsqueda se utilizan los valores de h * actualizadas 

Método: 

• Inicialmente, se realiza una búsqueda con h * (n) = 0 para todos los nodos n 

• En cada paso de n i a n j : 

h * (ni)← min 

n j ∈expandir(n i ) h* (n j) + c(n i,n j) 

• Al visitar un nodo por segunda vez, se utilizan los valores de h * actualizados 

Problema: 

€ 

[ ] 

• Hay que almacenar los valores h * de todos los nodos en una tabla (memoria!) 


3º ITIS 2010/11

Ejemplo: A* con Aprendizaje de una Función 

80 

S 

140 

140 151 99 

A 

f L * = 140+0 

= 140 

R A O F 

fL *=220+0 

fL *= 280 

=220 

+75 

f L *= 291 

= 355 

+0 +142 

= 291 433 

80 97 146 

118 

S P C fL *=366 

fL *=300 fL *=317 

+80 

=380 

+0 

=317 

f L * = 239+0 

= 239 

+0 

=366 

Heurística 

f L * = 0+0 

= 0 

75 

f L * = 118+0 

= 118 Z 

111 

118 

L A 

f L *=229+0 

=229 

Ejemplo: ir de A a L 

Inicialmente h L *(n) = 0 para todo nodo n 

f L * = 75+0 

= 75 

fL *=236+75 

=311 

71 151 

fL *=146+0 

= 146 

O A f L 

* = 150+75 

= 225 

n A B C D E F G H I L M N O P R S T U V Z 

h L * 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 

75 142 97 80 111 71 

146 

71 

Z S 

f L *=217 

+71 

=288 

f L *=297 

+80 

=377 

75 

140 

75 

S Z T fL *=268 

fL *=290 fL *=225 

+80 

=370 

118 

+71 

=296 


3º ITIS 2010/11 

+111 

=379


f L *=295+97 

=392 

80 

140 

S 

Z 

75 

f L * = 0+71 

= 71 

A 

fL * = 75+146 

= 221 

140 118 

75 

f L * = 215+80 

= 295 

R A O F 

f L *= 355 

+220 

= 575 

151 

99 

f L *= 366 

+231 

= 597 

f L * = 314+0 

= 314 

Heurística 

71 

f L * = 193+111 

= 304 Z 

111 

Ejemplo: ir de Z a L 

Inicialmente h L *(n) aprendido anteriormente 

Z S fL *=222 

f L *=142 

+213 

=355 

fL *=222 

+80 +99 

=302 =321 


h L * 146 0 0 0 0 0 0 0 0 0 0 0 142 0 97 80 111 0 0 71 

118 

220 231 

99 111 213 

O 

f L * = 150+213 

= 363 

L A 

fL *=304+0 fL *=311+220 

=304 =531 

f L * = 71+142 

= 213 

71 

151 


3º ITIS 2010/11


S 

140 

A 

f L * = 140+99 

= 239 

Heurística 

f L * = 0+220 

= 220 

118 

f L * = 118+111 

= 229 Z 

111 

Ejemplo: ir de A a L 

Inicialmente h L *(n) aprendido anteriormente 

f L * = 75+213 

= 288 


h L * 220 0 0 0 0 0 0 0 0 0 0 0 231 0 97 99 111 0 0 213 

229 111 

75 

118 

L A 

fL *=229+0 fL *=236+229 

=229 =465 


3º ITIS 2010/11

Encontrar de Funciones Heurísticas: 

El problema del 8-puzzle: 

Diseño 


• Estados: 

• posición de cada una de las piezas 2 7 3 

• Operadores: 

• Coste: 

• mover pieza adyacente a la posición 

del “hueco” 

• de 2 a 4 operadores aplicables, 

según el estado 

• La aplicación de cada operador vale 

una unidad 

1 

6 

8 

4 

5 

Estado meta 

1 2 3 

8 

7 

6 

4 

5 


2010/11

Encontrar de Funciones Heurísticas: Diseño 


2 

1 

6 

7 

8 

3 

4 

5 

Estado meta 

1 2 3 

8 

7 

6 

4 

5 

• Problemas relajados: 

• menos restricciones para cada operador 

• h * : distancia h exacta en el problema relajado 

• 8 Puzzle: una pieza puede moverse de A a B... 

a) siempre 

b) si B está vació 

c) si A es adyacente a B 

• Funciones heurísticas: 

a) número de piezas descolocadas 

– h a * (s0 ) = 5 

b) suma de saltos necesarios 

– h b * (s0 ) = 5 

c) suma de las distancias de Manhattan 

– h c * (s0 ) = 1+1+1+3+1=7 


2010/11


1 

6 

8 

1 2 3 

8 

7 

2 

4 

7 

6 

3 

5 

Estado meta 

4 

5 

Ejercicio 2.9 

Heurísticas A* : 

Considere el 8-puzzle cuyo estado inicial y 

estado meta se muestra al lado: 

a) desarrolle el árbol de búsqueda del 

algoritmo A * usando la heurística h a * 

(número de piezas descolocadas) 

b)desarrolle el árbol de búsqueda del 

algoritmo A * usando la heurística h c * 

(suma de distancias Manhattan) 

c)¿Cuál de las heurística expande menos 

nodos? ¿Por qué? ¿Puede sacar una 

conclusión general con respecto a la 

“calidad” de la funciones heurísticas? 


2010/11

Calidad de las Funciones Heurísticas 

Definición: 

Sean h 1 * y h2 * dos funciones heurísticas optimistas. 

h 1 * es más informada que h2 * , si para todo nodo n se cumple que 

Ejemplo: 

h 1 * (n ) ≥ h 2 * (n ) 

• en el 8-puzzle, h c * es más informada que ha * 

– las piezas bien colocadas no cuenta en h a * ni en hc * 

– la distancia Manhattan de cada pieza descolocada es al menos 1 

– en consecuencia, en toda posible configuración n del 8-puzzle la suma de 

las distancias distancias es igual o mayor que la suma de piezas 

descolocadas 

– para todas las configuraciones n se cumple h c * (n ) ≥ h a * (n ) 


2010/11


Lema 2: Sean h 1 * y h2 * dos funciones heurísticas consistentes. Si h1 * es más 

informada que h 2 * , entonces A * (h2 * ) expande al menos tantos nodos 

como A * (h 1 * ) 

Prueba: 

1. Para el mejor nodo meta nm se cumple que f * (nm ) = f * ! 

1 (nm ) = f * 

2 (nm ) 

2. Ya que h 1 * es más informada que h2 * , para todos los nodos n se cumple que 

h 1 * (n ) ≥ h 2 * (n ), y por tanto f 1 * (n ) ≥ f 2 * (n ) 

3. Por (1) y el Corolario 1 se sigue que 

• A * (h 1 * ) expande todos los nodos nj con f 1 * (nj ) ≤ f * (n m ) 

• A * (h 2 * ) expande todos los nodos nj con f 2 * (nj ) ≤ f * (n m ) 

4. Por (2), se verifica que f 1 * (nj ) ≤ f * (n m ) → f 2 * (nj ) ≤ f * (n m ) 

5. Por (3) y (4) se concluye que cualquier nodo expandido por A * (h 1 * ) también 

será expandido por A * (h 2 * ) 


2010/11


€ 

Nota: 

• Se puede demostrar que el lema 2 también se cumple si se 

asume sólo que h 1 * y h2 * sean funciones heurísticas optimistas. 

Conclusión: 

• preferir grandes valores de h * , siempre que se mantenga 

optimista 

• si hay varias funciones heurísticas optimistas: 

h * * * * ( n) 

= max h ( n),h2 

( n),…,h 

1 

m n 

( ) 

( ) 


2010/11

Complejidad de A * 

El número de nodos expandidos por A * depende de la precisión de h * : 

• si h * (n) = h(n) para todos los nodos n: 

• información completa: complejidad lineal (¡sin contar la complejidad de computar h * !) 

• calcular h * (n) suele equivaler a resolver el problema completo 

• si h * (n) = 0 para todos los nodos n: 

• A * degenera a la búsqueda de coste uniforme 

• resultados generales [Russell, pág. 101]: 

• en el peor caso, A * es lineal sólo si para todos los nodos n, 

| h (n) – h * (n) | ≤ O(c) 

• en el peor caso, A * es polinomial sólo si para todos los nodos n, 

| h (n) – h * (n) | ≤ O(log h(n)) 

• en escenarios reales, el error heurístico |h (n) – h * (n) | crece, al menos, de forma 

proporcional al coste h (n) 

• aún así, suele haber una mejora notable en comparación con métodos no informados 


2010/11

Resultados experimentales 

Comparación experimental: 

• número de nodos expandidos en el problema del 8-puzzle 

• varias profundidades d de la solución 

• media sobre 100 instancias del problema 


2010/11

Resultados acerca de A * : 

Análisis de A * 

• A * es completo y óptimo para funciones heurísticas consistentes (optimistas) 

• la complejidad en espacio y tiempo de A * es proporcional al número de nodos 

expandidos 

• A * es de eficiencia óptima [véase Russell y Norvig] 

• para todo heurística optimista h * , se verifica que no existe otro algoritmo que 

asegure optimalidad y a la vez garantice expandir menos nodos 

• sin embargo, al igual que en el caso de la búsqueda en amplitud (véase la tabla 

correspondiente), en situaciones límite los problemas de espacio de A * son más 

graves que los problemas de tiempo 


2010/11

IDA * 

IDA * : Iterative Deepening A* (Korf 1985) 


• aplicar búsqueda de profundización iterativa, pero en vez de usar sucesivos 

límites de profundidad, usar sucesivos límites f * 

Estrategia: 

• usar inicialmente el valor f * de la raíz como limite f * 

• realiza búsqueda en profundidad estándar hasta llegar al limite f * actual 

(es decir: los valores f * no influyen en el orden de expandir los nodos) 

• “curiosear” encima del límite f * por el nodo con el siguiente valor f * más 

bajo 

• repetir el proceso con dicho valor f * como nuevo limite f * 

Características: 

• al igual que la búsqueda en profundidad, IDA * desarrolla un “camino 

actual” 

• sólo los nodos vecinos de dicho camino actual se mantienen en le memoria 


2010/11

límite f * = 366 

A 

f * = 280+366 

= 646 

S B 

f * = 338+253 

= 591 

Búsqueda IDA * : Ejemplo (1) 

f * = 450+0 

= 450 

S 

f * = 140+253 

= 393 

F O R 

f * = 239+178 

= 417 

f * = 146+380 

= 526 

T 

f * = 118+329 

= 447 Z 

f * = 220+193 

= 413 

f * = 75+374 

= 449 

C P S f * f = 300+253 

* = 366+160 f * = 317+98 

= 526 

f * = 0+366 

= 366 

f * = 414+193 

= 607 

= 415 

f * = 455+160 

= 615 

R C B 

= 533 

f * = 418+0 

= 418 


2010/11



A 

f * = 280+366 

= 646 

S B 

f * = 338+253 

= 591 

f * = 450+0 

= 450 

S 

T 

f * = 140+253 

= 393 

F O R 

f * = 239+178 

= 417 

f * = 146+380 

= 526 

f * = 118+329 

= 447 Z 

f * = 220+193 

= 413 

f * = 75+374 

= 449 

C P S f * f = 300+253 

* = 366+160 f * = 317+98 

= 526 

f * = 0+366 

= 366 

f * = 414+193 

= 607 

= 415 

f * = 455+160 

= 615 

R C B 

= 533 

f * = 418+0 

= 418 


2010/11



A 

f * = 280+366 

= 646 

S B 

f * = 338+253 

= 591 

f * = 450+0 

= 450 

S 

T 

f * = 140+253 

= 393 

F O R 

f * = 239+178 

= 417 

f * = 146+380 

= 526 

f * = 118+329 

= 447 Z 

f * = 220+193 

= 413 

f * = 75+374 

= 449 

C P S f * f = 300+253 

* = 366+160 f * = 317+98 

= 526 

f * = 0+366 

= 366 

f * = 414+193 

= 607 

= 415 

f * = 455+160 

= 615 

R C B 

= 533 

f * = 418+0 

= 418 


2010/11



A 

f * = 280+366 

= 646 

S B 

f * = 338+253 

= 591 

f * = 450+0 

= 450 

S 

T 

f * = 140+253 

= 393 

F O R 

f * = 239+178 

= 417 

f * = 146+380 

= 526 

f * = 118+329 

= 447 Z 

f * = 220+193 

= 413 

f * = 75+374 

= 449 

C P S f * f = 300+253 

* = 366+160 f * = 317+98 

= 526 

f * = 0+366 

= 366 

f * = 414+193 

= 607 

= 415 

f * = 455+160 

= 615 

R C B 

= 533 

f * = 418+0 

= 418 


2010/11



A 

f * = 280+366 

= 646 

S B 

f * = 338+253 

= 591 

f * = 450+0 

= 450 

S 

T 

f * = 140+253 

= 393 

F O R 

f * = 239+178 

= 417 

f * = 146+380 

= 526 

f * = 118+329 

= 447 Z 

f * = 220+193 

= 413 

f * = 75+374 

= 449 

C P S f * f = 300+253 

* = 366+160 f * = 317+98 

= 526 

f * = 0+366 

= 366 

f * = 414+193 

= 607 

= 415 

f * = 455+160 

= 615 

R C B 

= 533 

f * = 418+0 

= 418 


2010/11



A 

f * = 280+366 

= 646 

S B 

f * = 338+253 

= 591 

f * = 450+0 

= 450 

S 

T 

f * = 140+253 

= 393 

F O R 

f * = 239+178 

= 417 

f * = 146+380 

= 526 

f * = 118+329 

= 447 Z 

f * = 220+193 

= 413 

f * = 75+374 

= 449 

C P S f * f = 300+253 

* = 366+160 f * = 317+98 

= 526 

f * = 0+366 

= 366 

f * = 414+193 

= 607 

= 415 

f * = 455+160 

= 615 

R C B 

= 533 

f * = 418+0 

= 418 


2010/11

Algoritmo: 

• un subprograma bp-limite-f que 

realiza búsqueda en profundidad 

hasta un límite f * dado 

• devuelve el siguiente f * más bajo 

• un subprograma IDA* que actualiza 

el límite f * y detecta éxito/fallo 

{IDA*} 

limite-f ← f*(s 0 ) 

Repetir 

limite-f ← bp-limite-f(limite-f) 

Si éxito ent. devolver(solución) 

Si limite-f =∞ ent. devolver(fallo) 

Fin {repetir} 

Algoritmo IDA * 

{bp-limite-f} 


f-siguiente ← ∞ 

Repetir 

Si vacia?(abierta) entonces 

devolver(f-siguiente) {fallo} 



devolver(nodo) {éxito} 



Si f*(n )≤ límite-f entonces 


ordInsertar(n,abierta,cabeza) 

Sino 

f-siguiente ← min(f-siguiente, f*(n )) 

Fin {repetir} 


2010/11

Algoritmo IDA * : 

Ejercicio 2.10 

Aplique el algoritmo IDA * al problema del 8- 

puzzle del ejercicio 2.8. Simule a mano el 

proceso de búsqueda. ¿Cuántos diferentes límites 

f * son explorados ? 


2010/11

Algunos resultados sobre IDA * : 

Análisis de IDA * 

• completo y óptimo para funciones heurísticas optimistas, al igual que A * 

• complejidad en espacio: 

– δ : coste de un operador / m: mejor nodo meta / b: factor de ramificación / 

d: profundidad de m 

• complejidad en tiempo: 

– muchos valores diferentes de f * (p.e. búsqueda de rutas): 

puede elevar la complejidad en tiempo de A * al cuadrado 

– pocos valores diferentes de f * (p.e. 8 puzzle): 

proporcional a la complejidad en tiempo de A * 

• mejoras: “equilibrar” expansión repetida y uso de memoria 

– SMA * (Simplified Memory-bounded A * ) [Russell 1992] 

– RBFS (Recursive Best First Search) [Korf 1992] 


2010/11

Resultado clave: 

Resumen 

• algoritmos A * e IDA * — la información heurística puede mejorar la 

eficiencia de un método de búsqueda sin sacrificar su optimalidad 

Extensiones: 

• Búsqueda aproximada: 

– acotar el espacio de búsqueda con información heurística fuerte (e.d. sacrificando 

las garantías de optimalidad y completitud 

– búsqueda guiada por subobjetivos (island-driven search), búsqueda jerárquica, … 

• Búsqueda en línea: 

– “engranar” búsqueda (elección de acciones) y acción/percepción ejemplos 

– búsqueda de horizonte (limited-horizon search), A * en tiempo real (RTA * ), … 


2010/11


2. Búsqueda 






2010/11

Resolución de problemas con múltiples 

agentes 


2010/11

Situación: 

Agentes especializados 

• Múltiples agentes de resolución de problemas actúan en el mismo entorno 

• Las acciones de los demás agentes influyen en la medida de rendimiento 

de cada agente 

• Ningún agente puede controlar las acciones de los demás agentes 

• Hasta cierto punto, un agente puede predecir las acciones de los demás 

Tipos de problemas multiagente : 

• Escenarios cooperativos: metas compartidas 

• Escenarios parcialmente cooperativos: algunas metas compartidas, 

otras opuestas 

• Escenarios antagónicos: metas opuestas 


2010/11

Ejemplo: el mundo síncrono de los bloques 

Dos agentes “conviven” en el mundo de los bloques: 

• cada agente tiene sus propia situación meta 

• los agentes evalúan la situación actual respecto a su “distancia” a su meta 

• dicha distancia viene dada por el plan más corto que lleva a la meta del agente 

α 1 

situación inicial 

1 

4 

2 

3 

α 2 

1 

4 

α 1 

: 

3 

2 

metas α 2 

4 

3 

1 2 

distancia 2 distancia 4 

Actuación simultánea: 

• los agentes pueden actuar en paralelo (de modo síncrono) 

• las acciones (planes) pueden ejecutarse simultáneamente, siempre que no accedan 

al mismo bloque a la vez 

• el coste de un plan viene dado por el “tiempo” necesario para ejecutarlo 


2010/11

Escenarios cooperativos 

α1 Estado inicial 

α2 Estados meta α2 

1 

4 

2 

3 

Potencial para la cooperación: 

• metas compartidas: 

• los dos agentes desean alcanzar la misma situación 

• acuerdo respecto a realizar un plan conjunto P: 

• un agente trabaja en la pila izquierda, y el otro simultáneamente el la pila 

derecha: 

P = ( [quitar(1), quitar(2)], [apilar(4,1), apilar(3,2)] ) 

• los dos agentes sacan provecho si se ejecuta el plan conjunto 

4 

1 

α 1 

3 

2 

4 

1 

3 

2 


2010/11

α 1 

situación inicial 

1 

4 

2 

3 

Escenarios antagónicos 

α 2 

Potencial para el conflicto: 

• metas totalmente antagónicas: 

• todos los bloques deben colocarse en sitios diferentes, dependiendo del agente 

• no hay acuerdo, ni siquiera respecto a partes de un plan conjunto: 

• P a1 = ( [apilar(2,1), NOP], [apilar(3,2), NOP] ) 

• P a2 = ( [apilar(1,2), NOP], [apilar(4,1), NOP] ) 

α 1 

metas 

• todo lo que es “bueno” para a 1 es “malo” para a 2 , y viceversa 

3 

2 

1 

4 

α 2 

4 

1 

2 

3 


2010/11

α 1 

situación 

inicial 

Escenarios parcialmente cooperativos 

6 

4 

5 

3 

2 1 

α 2 

Potencial para la cooperación y el conflicto: 

• metas parcialmente compartidas: 

• los dos agentes desean que los bloques 1, 3 y 4 estén en la mesa, sin embargo a 1 prefiere que el 

bloque 2 esté encima de 3, mientras que a 2 prefiere que esté encima de 4 

• acuerdo sólo sobre partes de un plan conjunto P : 

• P a1 = ( [quitar(5), quitar(6)], [quitar(4), quitar(3)], [apilar(2,3), NOP ] ) 

• P a2 = ( [quitar(5), quitar(6)], [quitar(4), quitar(3)], [apilar(2,4), NOP ] ) 

• los dos agentes sacan provecho si se ejecuta un plan conjunto, pero dependiendo del plan un 

agente “gana” más que otro 


2010/11 

α 1 

2 

1 4 3 

... 

metas 

2 

1 4 

α 2 

... 3 ...

Juegos: 

Escenarios antagónicos: Juegos 

• ejemplo “clásico” de escenarios antagónicos (juegos de suma nula) 

• el escenario está totalmente definido por las reglas del juego, y los agentes 

jugadores los conocen completamente 

Tipos de juegos: 

• número de jugadores : 

– bipersonales (damas) / múltiples jugadores (Monopoly) 

• elementos de azar: 

– con elementos de azar (backgammon) / 

sin elementos de azar (damas) 

• información: 

– información perfecta (damas) / 

información incompleta (póker) 

juegos bipersonales con 

información perfecta y 

sin elementos de azar 


2010/11

Tres en Raya: 

• dos jugadores (min y max) 

Ejemplo: Tres en Raya 

• los jugadores van poniendo fichas en las casillas 

de un tablero 3x3 

– max usa las fichas X / min usa las fichas O 

– una casilla puede contener como mucho una ficha 

• Reglas: 

– Inicialmente el tablero está vacío 

– max empieza y los jugadores se van alternando en 

poner sus fichas 

– max gana si obtiene una raya de tres fichas X 

– min gana si obtiene una raya de tres fichas O 

– si todas las casillas están ocupadas sin que haya 

una raya de 3 fichas del mismo tipo, hay empate 

gana max 

gana min 

empate 


2010/11

Nótese: 

Modelo de juegos bipersonales 

Conocimientos mínimos a priori de los agentes max y de min : 

– s0 posición inicial (estado inicial) 

– expandir: s {si1 , ..., sin } cjto. finito de posiciones sucesores 

– terminal?: s true | false prueba terminal 

– U: s k, k∈ℜ función parcial de utilidad del juego 

• la función expandir 

• codifica las jugadas (acciones) permitidas en una posición s 

• supone implícitamente que los jugadores se alternan en realizar las jugadas 

• la función de utilidad está definida sólo en los estados terminales s 

• juegos de suma nula: max gana si sólo si min pierde 

• gana max: U(s) = +∞ / gana min : U(s) = –∞ / empate: U(s) = 0 


2010/11

max 

min 

max 

min 

terminal 

Ejemplo: Árbol de juego para Tres en Raya 

... 

–∞ 

... ... 

0 

+∞ 

utilidad 

. . . 

. . . 


2010/11

Definición: 

Árboles de juego 

Sea N un conjunto de nodos, E ⊆ N×N, L = { max, min }, y G = ( N, E, L ) un 

árbol etiquetado. G es un árbol de juego si 

– G no es vacío 

– la raíz está etiquetada max 

– todos los sucesores de max son etiquetados min 

– todos los sucesores de min son etiquetados max 

Observaciones: 

• cada nivel del árbol de juego representa un ply (media jugada) 

– en los nodos etiquetados max, es el turno del agente max 

– en los nodos etiquetados min, es el turno del agente min 

• las hojas de un árbol de juego (completamente desarrollado) 

representan las posiciones terminales del juego 


2010/11

Estrategias 

Problema del agente max: ¿cómo determinar su mejor jugada? 

• max podría aplicar métodos de búsqueda estándar, usando las posiciones en 

las que él gana como estados meta 

• pero min no querría realizar las acciones que el plan de max prevé para él ! 

Estrategia: 

• define las jugadas de max para cada posible jugada de min 

• un subárbol del árbol de juego 

Estrategia óptima (o racional) : 

• la estrategia que implica el mejor resultado garantizado para max 

• escenarios totalmente antagónicos con agentes racionales: 

– max puede asumir que min hará lo mejor para sí mismo, lo que a su vez es lo peor para 

max 

• la estrategia óptima para max es la estrategia minimax: 

– maximizar la utilidad mínima en cada jugada 


2010/11

max 

min 

terminal 

Ejemplo: estrategia minimax 

estrategia óptima: 

a 1 a 2 a 3 

0 -∞ -∞ 

a 1,1 a 1,2 a 1,3 a 2,1 a 2,2 a 2,3 

utilidad 0 0 +∞ +∞ +∞ –∞ 0 0 –∞ 

0 

mejor jugada de max: a 1 

a 3,1 a 3,2 a 3,3 


2010/11

Método Minimax: 

Método minimax 

1. Generar el árbol de juego completo 

2. Aplicar la función de utilidad en cada nodo terminal 

3. Propagar las utilidades hacia arriba 

– en los nodos max, usar la utilidad máxima de los sucesores 

– en los nodos min, usar la utilidad mínima de los sucesores 

4. Eventualmente los valores de utilidad llegan al nodo raíz (max) 

5. La jugada óptima de max es la que lleva al sucesor de utilidad máxima 


2010/11

Decisiones imperfectas 

Problema: crecimiento exponencial del árbol de juego 

• incluso en juegos muy simples, es imposible desarrollar el árbol de 

juego completo hasta todos sus nodos terminales 

Solución: Heurísticas 

• sustituir la prueba terminal por una prueba suspensión que detiene la 

búsqueda aún sin llegar a una posición terminal: 

– límite de profundidad fijo (número de plys fijo) 

– posiciones “en reposo” 

• aplicar una función de evaluación e, que estime la utilidad esperada 

del juego correspondiente a una posición s determinada 

– e debe coincidir con la función de utilidad u en los nodos terminales 

– suele ser función lineal ponderada : e(s) = w 1 f 1 (s) + w 2 f 2 (s) + . . . + w n f n (s) 

– Ajedrez: e(s) = “suma de los valores materiales en s” 

– Tres en Raya: e(s) = “nº de línea abiertas para líneas max en s” – 

“nº de línea abiertas para líneas min en s” 


2010/11

max 

min 

Ejemplo: minimax con suspensión 

estrategia óptima: 

a 1 a 2 a 3 

3 2 2 

a 1,1 a 1,2 a 1,3 a 2,1 a 2,2 a 2,3 

evaluación e 3 12 8 2 4 6 14 5 2 

3 

mejor jugada de max: a 1 

a 3,1 a 3,2 a 3,3 


2010/11

max 

min 

max 

Suspensión en ply 3 

Ejemplo: Tres en Raya 

... ... ... ... 

–∞ 

1 

–∞ 

+∞ 

–∞ –∞ –∞ 2 

+∞ 

0 1 1 1 1 +∞ 1 1 +∞ 


2010/11


Considérese el siguiente árbol de juego desarrollado hasta ply 3. Los nodos 

están etiquetados con los valores de la función de evaluación e. 

a) Evalúe el árbol del juego en base al algoritmo minimax. 

b) ¿Cuál es la mejor jugada para el agente max? 

7 6 8 5 2 3 0 –2 6 2 5 8 9 2 


2010/11

max 

min 

Nótese: 

Poda α-β 

• a veces es posible calcular la utilidad de un nodo sin tener que evaluar 

todos sus sucesores 

a 1 

3 ≤ 2 2 

a 1,1 a 1,2 a 1,3 a 2,1 

3 

a 2 

a 2,2 

a 2,3 

3 12 8 2 14 5 2 

a 3 

a 3,1 a 3,2 a 3,3 


2010/11

Poda α-β 

Utilidad más alta encontrada en un nodo max hasta el momento: α 

max 

min . . . 

β 

α 

Condición de poda: β≤α 

• La utilidad U min del nodo min 

será como mucho β 

• La utilidad U max del nodo max 

será al menos α 

• No es necesario explorar los 

sucesores restantes de min, ya 

que se cumple en todo caso: 

U min ≤ β ≤ α ≤ U max 


2010/11

Poda α-β 

Utilidad más baja encontrada en un nodo min hasta el momento: β 

min 

max . . . 

α 

β 

Condición de poda: α≥β 

• La utilidad U max del nodo max 

será al menos α 

• La utilidad U min del nodo min 

será como mucho β 

• No es necesario explorar los 

sucesores restantes de max, ya 

que se cumple en todo caso: 

U min ≤ β ≤ α ≤ U max 


2010/11


Considerese el árbol de juego del ejercicio anterior. Evalúe el árbol 

utilizando el algoritmo minimax con poda α-β. Cuando aplica una poda, 

indique la condición de poda correspondiente. 

7 6 8 5 2 3 0 –2 6 2 5 8 9 2 


2010/11

Resumen 

Análisis: 

• la eficiencia de minimax con poda α-β depende del orden en el que se 

exploran los nodos 

• en promedio, la poda α-β permite expandir 50% menos nodos que 

minimax 

Problemas: 

• efecto horizonte: 

– la búsqueda se suspende justo cuando el jugador está por hacer una gran jugada 

• suposición de racionalidad perfecta: 

– suponga que max está a punto de perder si min juega de forma óptima 

– sin embargo, hay una jugada que hacer ganar max, si min hace un solo error 

Extensiones: 

• juegos con elementos de azar (p.e. backgammon) 

– expectminimax: añadir niveles de “nodos azar” y calcular su utilidad esperada 

• aprender funciones de evaluación y de suspensión 

• heurísticas “fuertes” basados en meta-razonamiento 

– algoritmos de búsqueda guiados por la utilidad esperada de expandir un nodo 


2010/11

N - Grupo de Inteligencia Artificial

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?