Planejamento automatizado - Laboratório de Técnicas Inteligentes ...

Planejamento 

automatizado 

Introdução e Conceitos básicos 

Leliane Nunes de Barros 

1

Planejamento automatizado 

Planejamento é o processo de escolha e 

organização de ações através da antecipação 

(previsão) de seus efeitos (necessita um modelo) 

Objetivo: satisfazer, através da execução de ações, 

objetivos previamente estabelecidas. 

Planejamento automatizado é a sub-área da IA 

que estuda esse processo de raciocínio, usando o 

computador. 

Aplicação: sistemas que exigem comportamento 

autônomo e deliberativo em ambientes que 

se pode modelar. 

2

Planejamento: aplicações 

Veículo de exploração (rover) em Marte (NASA) 

Satélite de observação espacial (Deep Blue-NASA) 

Sistemas de manufatura (Xerox) e operações de 

estamparia (bending) na indústria automotiva 

Indústria de Jogos, por exemplo: nas narrativas e 

construção de personagens não-jogadores; Bridge 

(campeão), GO, etc. 

Suporte nas tarefas de planejamento quando 

realizadas por humanos 

Q 

J 6 

5 

North 

9 

7 

A 

K 

5 

3 

A 

9 

West 

2 

6 8 

Q 

South 

East 

3

Planejamento: motivação inicial 

Um dos principais objetivos da IA foi/é o 

desenvolvimento de um Resolvedor Geral de 

Problemas (General Problem Solver) 

[Newell & Simon, 1961] 

Problema Linguagem GPS Solução 

Idéia: problemas são descritos numa linguagem de 

alto-nível de abstração e são resolvidos 

automaticamente 

Objetivo: facilitar a modelagem de problemas (menor 

custo) com um prejuízo mínimo em termos de 

desempenho. 

4


Problema Linguagem GPS Solução 

Questão: das técnicas estudadas nessa disciplina, 

existe alguma que pode ser chamada de um GPS? 

5


Precisamos de uma linguagem geral 

que deve ser usada como entrada 

para algoritmos de busca! 

Problema Linguagem Busca ? Solução 

Questão: das técnicas estudadas nessa disciplina, 

existe alguma que pode ser chamada de um GPS? 

6


Um sistema de planejamento pode ser considerado 

um solucionador geral de problemas (STRIPS) 

[Fikes, 1971] 

Problema Linguagem Planejador Solução 

Importante: formas diferentes de planejamento 

envolvem modelos diferentes do mundo 

7


Agentes inteligentes ... 

... devem controlar a evolução do ambiente ao seu 

redor de uma maneira desejada, por exemplo, 

maximizando suas chances de fetivamente realizar 

esse controle. 

... devem ser capazes de construir planos, isto é, 

sequência de ações escolhidas com base nos objetivos 

a serem atingidos pelos agentes, bem como no estado 

atual e na dinâmica de evolução do ambiente. 

A complexidade de se construir planos depende de 

uma variedade de propriedades do ambiente e do agente 

8

Recordação: agente baseado em objetivo 

... ou estocástico! 

9

Propriedades do ambiente e do agente 

discreto ou contínuo 

ambiente 

determinístico/ 

não-determinístico/ 

probabilístico 

percepções 

Que plano 

devo 

executar? 

ações 

completamente 

ou parcialmente 

observável 

instantânea ou 

com duração de 

tempo 

única fonte de mudança ou 

ambiente de multiagente 

10


modelo conceitual 

suposições restritivas 

11

Modelo conceitual de um planejador 

Descrição de Σ 

Estado inicial 

Planejador 

Metas 

Status da execução Planos 

Controle 

Observações 

Ações 

Sistema Σ 

Eventos 

12

Modelo Conceitual 


Metas 

Planejador 


Ingredientes: 

Status da execução 

Controle 

Planos 

Observações 

Descrição do sistema (ambiente): 

modelo de estados possíveis 

Modelo de como o sistema muda: ações, 

eventos e seus efeitos 

Modelo de observação do sistema 

Modelo de execução de um plano no sistema 

Especificação de estados iniciais e metas 

Plano de ações que é gerado pelo planejador, 

também chamado de programa de controle 

Sistema Σ 

Ações 

Eventos 

13

Modelo conceitual de um planejador 



Planejador 

Metas 


Como construir 

o programa de 

controle (plano)? 

Controle 

Observações 

Ações 

Sistema Σ 

Eventos 

14

Como construir o programa de controle? 

Três abordagens: 

1. Programação: (modelo de Σ conhecido mas não explícito) 

Especificação do programa de controle pelo projetista. Tanto o 

modelo como o problema não são especificados formalmente 

mas estão na cabeça do programador e implícito no programa. 

2. Planejamento automatizado: (modelode Σ conhecido e explícito) 

Especificação do problema pelo projetista em uma linguagem 

formal o programa de controle é derivado automaticamente. 

3. Aprendizado automatizado: (modelode Σ édesconhecido) 

Especificação do problema pelo projetista em uma linguagem 

formal tanto o modelo como o controle são “aprendidos” 

automaticamente através da experiência (direta no sistema). 

Requer uma fase de exploração e explotação do ambiente. 

As três abordagens são consideradas não exclusivas e em geral, 

se complementam. Possuem seus pontos fortes e fracos. 

15


conhecimento sobre como obter o conhecimento 

completo para um problema específico sobre o sistema 

Σ, através de inúmeras interações com o ambiente, para 

finalmente construir um programa de controle de forma 

automática 

aprendizado 


conhecimento completo sobre Σ especificado numa 

linguagem geral passada como entrada de um 

sistema capaz de gerar o programa de controle 

de forma automática 

planejamento 


conhecimento completo sobre Σ para construir (manualmente) 

um programa de controle para um problema específico 

programação 

16


conhecimento sobre como obter o conhecimento 

completo para um problema específico sobre o sistema 

Σ, através de inúmeras interações com o ambiente, para 

finalmente construir um programa de controle de forma 

automática 

aprendizado 


... 

conhecimento completo sobre Σ especificado numa 

linguagem geral passada como entrada de um 

sistema capaz de gerar o programa de controle 

de forma automática 

planejamento 


... 

conhecimento completo sobre Σ para construir (manualmente) 

um programa de controle para um problema específico 

programação 

17

Aprendizagem de máquina (visão geral) 

Sistema de 

aprendizagem 



Planejador 

Metas 


Controle 

Observações 

Ações 

Sistema Σ 

Eventos 

18

Planejamento requer um modelo geral para 

descrever a dinâmica do sistema Σ. 

A maioria das abordagens de planejamento 

se baseia em sistemas de transição de 

estados 

Modelo do sistema Σ : 


Metas 

Planejador 

Controle 



Planos 

Observações 

Ações 

Modelo de transição de estados Σ = (S,A,E,γ) 

S = {s 1 , s 2 , …}= {estados} 

A = {a 1 , a 2 , …}= {ações} 

E = {e 1 , e 2 , …}= {eventos exógenos} 

Função de transição de estado 

Sistema Σ 

Eventos 

γ: S x (A ∪ E) → 2 S 

conjunto potência 

19


descrição de Σ 

Modelo Σ : 

o sistema evolui através de 

eventos e ações. 

representação gráfica: 

grafo dirigido cujos nós são 

estados em S. 


Metas 

Planejador 

Controle 



Planos 

Observações 

Ações 

se s’ ∈ γ(s,u), sendo u o par (a,e) 

com a ∈ A e e ∈ E, então o grafo 

contém um arco u de s a s’ 

Se a éumaação aplicável no 

estado s, executá-la em s leva 

Σ a um outroestados’=γ(s,a). 

s 

u = (a,e) 

s’ 

Sistema Σ 

Eventos 

ε é um evento neutro => γ(s,a, ε ) = γ(s,a) 

no-op é uma ação neutra => γ(s,no-op, e) = γ(s,e) 

20


modelo de observação 


Metas 

Planejador 



Planos 

Função de observação h: S → O 

produz observação o sobre o estado atual s 

Controle: dada a observação o ∈ O, produz ação a ∈ A 

Planejador: 

Observações 

Controle 

Sistema Σ 

entrada: descrição de Σ, estado inicial s 0 ∈ S e uma 

descrição de meta 

saída: um plano de ações para guiar o controle 

Ações 

Eventos 

21


metas 

Exemplos de descrições de metas: 

Conjunto de estados meta S g 

(metas de alcançabilidade) 

Encontre uma seqüência de 

transição de estados terminando 

em um estado meta s ∈ S g 


Metas 

Planejador 

Controle 



Planos 

Conjunto de estados meta S g + satisfazendo 

alguma condição sobre o conjunto de estados 

percorridos pelo sistema (metas estendidas) 

Atinja um estado meta s ∈ S g , passando por 

estados que valha r 

Observações 

Otimização de uma função utilidade (ou recompensa) 

relacionada aos estados (metas de otimização) 

Otimize alguma função utilidade (eventualmente 

terminando num estado s ∈ S g ) 

Execução de tarefas (planos abstratos), especificadas 

recursivamente como conjuntos de sub-tarefas e ações 

Sistema Σ 

Ações 

Eventos 

22

Exemplo dos Robôs Portuários 

Sistema de transição de 

estado Σ = (S,A,E,γ) 

S = {s 0 , …, s 5 } 

A = {move1, move2, 

put, take, load, unload} 

E = {} 

γ: como ilustrado 

h(s) = s para todo s 

Entrada do planejador: 

Modelo Σ 

Estado inicial s 0 

Estado meta s 5 

Um plano solução: 

move1→take→load→move2 

Representação gráfica do 

modelo de transição de estados 

s 1 

put 

take 

location 1 location 2 


move2 move1 

move2 move1 

s 3 

put 

take 



unload load 

s 4 

move2 

move1 

location 1 location 2 location 1 location 2 

s 0 

s 2 

s 5 

23

Planejamento Vs Escalonamento 

Escalonamento 

Decide como executar um dado conjunto de ações 

usando um número limitado de recursos 

em um intervalo de tempo limitado 

É tipicamente NP-completo 


Decide quais ações usar para atingir um 

conjunto de metas 

Pode ser muito pior que NP-completo 

Na maioria dos casos, é não-decidível 

Muitas pesquisas fazem um conjunto de suposições 

restritivas para garantir a decidibilidade 

Vamos ver algumas dessas restrições 

Planejador 

Escalonador 

Controle 

24


abordagem clássico 

25

Propriedades do ambiente e do agente 

discreta 

percepções 

ambiente 

Que plano 

devo 

executar? 

determinístico 

ações 

completamente 

observável 

instantânea 

única fonte 

de mudança 

26

Suposições restritivas 

A0 (Σ finito): 

O espaço de estados S é finito 

S = {s 0 ,s 1 , s 2 , … s k } para 

algum k 

A1 (Σ totalmente observável): 

A função de observação 

h: S → O é a função identidade 

o controle sempre sabe em que 

estado ele está. 


Metas 


Observações 

Planejador 

Controle 

Sistema Σ 


Σ = (S,A,E,γ) 

S = {estados} 

A = {ações} 

E = {eventos} 

γ: S x (A ∪ E) → 2 S 

Planos 

Ações 

Eventos 

27


A2 (Σ determinístico): 

Para todo u em A∪E, |γ(s,u)| = 1 

Cada ação ou evento tem apenas 

um saída possível 

A3 (Σ estático): 

E é vazio: nenhuma mudança 

ocorre no sistema Σ exceto 

aquelas efetuadas pelo controle 

A4 (metas de alcançabilidade): 

O objetivo é somente 

alcançar um s ∈ S g 


Metas 


Observações 

Planejador 

Controle 

Sistema Σ 


Σ = (S,A,E,γ) 

S = {estados} 

A = {ações} 

E = {eventos} 

γ: S x (A ∪ E) → 2 S 

Planos 

Ações 

Eventos 

28


A5 (planos sequenciais): 

A solução é uma seqüência de 

ações totalmente ordenada 

(a 1 , a 2 , … a n ) 

A6 (tempo implícito): 

Transições de estados 

instantâneas, i.e., ações 

sem duração de tempo 

A7 (planejamento off-line): 

O Planejador não considera 

o status da execução 


Metas 


Observações 

Planejador 

Controle 

Sistema Σ 


Σ = (S,A,E,γ) 

S = {estados} 

A = {ações} 

E = {eventos} 

γ: S x (A ∪ E) → 2 S 

Planos 

Ações 

Eventos 

29

Planejamento Clássico 

Planejamento clássico faz as 8 

suposições restritivas 

Problema de Planejamento Clássico: 

Dado (Σ, s 0 , S g ), encontre uma 

seqüência de ações (a 1 , a 2 , … a n ) 

que produza uma seqüência de 

transições de estados 

s 1 = γ(s 0 , a 1 ), 

s 2 = γ(s 1 , a 2 ), 

…, 

s n = γ(s n–1 , a n ) 

tal que s n pertença à S g . 



Planejador 

Metas 


Controle 

Observações 

Ações 

Sistema Σ 

Eventos 

30

Planejamento Clássico: exemplo 

Exemplo dos Robôs Portuários: 

sistema finito, 

determinístico, estático 

conhecimento completo 

metas de alcance 

tempo implícito 

planejamento offline 

Planejamento clássico é 

basicamente uma busca 

de caminho em um grafo 

estados são nós 

ações são arestas 

Esse é um problema trivial? 


move2 move1 


unload load 

s 1 

s 3 

s 4 

put 

take 

put 

take 

move2 

move1 


move2 move1 


s 0 

s 2 

s 5 

location 1 location 2 location 1 location 2 

31

Planejamento Clássico 

Computacionalmente muito difícil 

generalização do exemplo dos Robôs Portuários: 

5 localizações, 3 pilhas, 3 robôs, 100 containers 

isso implica em 10 277 estados 

mais do que 10 190 vezes o número 

de partículas no universo! 

s 0 


Existem muitas pesquisas de IA em planejamento clássico 

Apesar de ser uma abordagem muito restritiva para 

tratar a maioria dos problemas de interesse prático, … 

… muitas das idéias de soluções do planejamento 

clássico têm se mostrado úteis na resolução de 

problemas práticos 

32

Relaxando as Suposições 

Relaxar A0 (Σ finito): 

Contínuo, e.g. ações com 

variáveis numéricas 

Relaxar A1 (Σ totalmente 

observável): 

Busca por estados de crença ou 

mundo possíveis 



Planejador 

Metas 


Controle 

Observações 

Ações 

Sistema Σ 

Eventos 

A0: Finito 

A1: Totalmente observável 

A2: Determinístico 

A3: Estático 

A4: Satisfação de metas 

A5: Planos seqüenciais 

A6: Tempo implícito 

A7: Planejamento off-line 

33


Relaxar A2 (Σ determinístico): 

Ações possuem mais do que 1 

saída (efeito) possível com 

transições 

Sem probabilidades: 

Sistema de transição não 

determinístico, e.g., 

planejamento condicional 

Com probabilidades: 

Processos de decisão 

estocáticos (MDPs) 

Combinação de planejamento 

probabilístico e não 

determinístico 

imprecisão nas probabilidades 

de transição 


Metas 


Observações 

Planejador 

Controle 

Sistema Σ 


Planos 

Ações 

Eventos 

A0: Finito 



A3: Estático 





34


Relaxar A1 e A2 (Σ totalmente 

observável e determinístico): 

MDPs com obervação parcial - 

POMDPs finitos (planejamento 

sobre estados de crença) 

Relaxar A0 e A2 (Σ finito e 

determinístico): 

MDPs contínuos ou híbridos 

Teoria de controle 


Metas 


Observações 

Planejador 

Controle 

Sistema Σ 


Planos 

Ações 

Eventos 

A0: Finito 



A3: Estático 





35


Relaxar A3 (Σ estático): 

Outros agentes 

Jogos finitos de soma-zero 

e informação perfeita 

Ambientes de comportamento 

aleatório 

Análise de decisão (business, 

pesquisa operacional) 



Planejador 

Metas 


Controle 

Observações 

Ações 

Sistema Σ 

Eventos 

A0: Finito 



A3: Estático 





36


Relaxar A6 (tempo implícito): 

Planejamento temporal 

Relaxar A0, A5, A6 (Σ finito, planos 

sequenciais e tempo implícito): 

Planos com paralelismo e 

concorrência 

Problemas de escalonamento 

Relaxar A7 (planejamento off-line): 

Planejamento e execução 

Necessidade de coleta de 

informações durante o 

planejamento 

Existem outras 247 combinações 

para serem exploradas … 


Metas 


Observações 

Planejador 

Controle 

Sistema Σ 


Planos 

Ações 

Eventos 

A0: Finito 



A3: Estático 





37

Representação de 

estados, ações e metas 

38

Como especificar um problema de planejamento? 

descrição do problema 

planejador 

plano 

39


Representação explícita: 

todos os estados e 

transições possíveis! 


planejador 

plano 

40




transições possíveis 


planejador 

plano 

Representação implícita: 

todas as ações (com 

símbolos constantes) mas 

não todos os estados 

41




transições possíveis 


planejador 

plano 

Representação implícita: 

todas as ações (com 

símbolos constantes) mas 

não todos os estados 

Representação 

implícita e relacional: 

ações (com variáveis) 

de estado 

42

Exemplo: O Mundo dos Blocos 


C 

A 

B 

A 

B 

C 

43



C 

A 

B 

Objetos: blocos A,B,C,mesa 

Propriedades: 

A e B estão sobre a mesa 

C está sobre A 

o topo de C está livre 

otopo de B estálivre 

otopo de A não está livre 

C não está sobre B (mesa) 

A não está sobre B (C) 

B não está sobre C (A) 

a mesa está sempre livre 

44



C 

A 

B 

A 

B 

C 

coloque bloco C 

de A para mesa 

45



C 

B 

A 

B 

A 

B 

C 

A 

C 



move bloco B da 

mesa para cima de C 

46



A 

C 

B 

B 

A 

B 

A 

B 

C 

A 

C 

C 



move bloco B da 

mesa para cima de C 

move bloco A da 

mesa para cima de B 

Plano 

47

Representação de Estado (CWA) 

Closed World Assumption: 

aquilo que não está descrito 

no estado é considerado falso 

Ufa!! 

C 

A 

B 

Estado Inicial: 

sobre(B,mesa) 

sobre(A,mesa) 

sobre(C,A) 

limpo(C) 

limpo(B) 

¬ sobre(C,mesa) 

¬ sobre(C,B) 

¬ sobre(A,B) 

¬ sobre(A,C) 

¬ sobre(B,C) 

¬ sobre(B,A) 

¬ limpo(A) 

Na representação clássica de problemas 

de planejamento, um estado não descreve 

o que é falso, mas somente o que é verdadeiro 

48

Representação de Estados e Meta 

C 

A 

B 

Estado Inicial: 

sobre(B,mesa) 

sobre(A,mesa) 

sobre(C,A) 

limpo(C) 

limpo(B) 

A 

B 

C 

Estado Meta: 

sobre(C,mesa) 

sobre(B,C) 

sobre(A,B) 

limpo(A) 

Descrição da Meta: 

{sobre(A,B), sobre(B,C)} 

49

Representação do modelo explícita: 

todos os estados e transições possíveis 

C 

A 

B 

B 

A 

A 

C A B B C 

C 

C 

B 

A 

A 

B C 

A B C 

A 

B 

C 

B 

C 

A 

C 

A B 

A C 

B 

A 

B 

C 

modelo flat 

A 

C 

B 

50

Representação do modelo explícita: 

todos os estados e transições possíveis 

C 

A 

B 

B 

A 

A 

C A B B C 

C 

C 

B 

A 

A 

B C 

A B C 

A 

B 

C 

B 

C 

A 

C 

A B 

A C 

B 

A 

B 

C 

modelo flat 

A 

C 

B 

51

Descrição de ações 

Como descrever as “transições” ou ações? 

limpo(C), sobre(C,A), limpo(B) 

move(C,A,B) 

¬sobre(C,A), ¬limpo(B), 

limpo(A), sobre(A,B), 

Precisamos de uma linguagem para descrever ações! 

52

Representação do modelo implícita: 

todas as ações (constantes) mas não todos os estados 

Ações: 

precondições 

limpo(C), sobre(C,A), limpo(B) 

move(C,A,B) 

¬sobre(C,A), ¬limpo(B), 

limpo(A), sobre(A,B), 

efeitos 

limpo(A), sobre(A,B) 

coloque-sobre-mesa(A,B) 

¬sobre(A,B),limpo(B), 

sobre(A,mesa), 

53

Representação do modelo implícita e relacional: 

ações com variáveis de estado 

Esquema de Ações 

(operadores): 

precondições 

limpo(x), sobre(x,y), limpo(z) 

move(x,y,z) 

¬sobre(x,y), ¬limpo(z), 

limpo(y), sobre(y,z), 

efeitos 

limpo(x), sobre(x,y) 

coloque-sobre-mesa(x,y) 

¬sobre(x,y),limpo(y), 

sobre(x,mesa), 

54

Observação 

O fluente on(x,y) é uma versão abstrata (lifted) dos 

fluentes 

on(A,B) on(B,A) on(A,C) on(C, mesa) 

O operador move(x,y,z) é uma versão abstrata (lifted) das 

ações (ground): 

move(A,B,C) move(B,A,C) move(C,B,A) 

move(A,C,B) move(B,C,A) move(C,A,B) 

55

Domínio × Problema de Planejamento 

Domínio de planejamento: 

linguagem + conjunto de operadores 

corresponde a um conjunto de sistemas de transição de 

estados, um para cada conjunto possível de objetos (blocos 

A, B, …) 

Domain: 

operator: (move(x,y,z), 

precond: { limpo(z), limpo(y), sobre(z,x) }, 

effects: { limpo(x), sobre(z,y), ¬limpo(y), ¬sobre(z,x)}) 

operator: (coloque-sobre-mesa(x,z), 

precond: { limpo(x), sobre(x,z) }, 

effects: {¬sobre(x,z), limpo(z), sobre(x,mesa)}) 

56


Problema de planejamento: 

domínio + estado inicial + meta 

representação compacta porém, isso implica numa explosão 

combinatória no número de constantes do problema 

(tamanho do problema) 

Domain: 

PROBLEMA DE PLANEJAMENTO: 


precond: { limpo(z), limpo(y), sobre(z,x) }, 

effects: { limpo(x), sobre(z,y), ¬limpo(y), ¬sobre(z,x) }) 

operator: (coloque-sobre-mesa(x,z), 

precond: { limpo(x), sobre(x,z) }, 

effects: {¬sobre(x,z), limpo(z), sobre(x,mesa)}) 

Initial State: {sobre(B,mesa), sobre(A,mesa), sobre(C,A), 

limpo(C), limpo(B)} 

Goal: {sobre(A,B) ∧ sobre(B,C)} 

57

Linguagem para Descrição do Problema 

representação clássica 

Baseada na Lógica de Predicados (LPO), livre de funções: 

conjunto finito de símbolos de predicados (ex.: sobre, limpo, move …) e 

símbolos de objetos (variáveis ou constantes) (ex.: bloco A ou bloco x) 

predicados definem relações entre objetos 

um átomo éum predicado seguido de uma lista de objetos (ex.: 

sobre(x,y), limpo(A)). 

um átomo pode ser negativo ou positivo (¬limpo(z) ou limpo(z)). 

Expressões envolvem operadores clássicos da LPO, ex.: sobre(A,B) ∧ 

sobre(B,C). 

um átomo positivo ou negativo échamadode literal 

Um literal constante não contém variável. Ex.: sobre(A,B). 

θ = {x 1 /v 1 , x 2 /v 2 , …, x n /v n } representa uma substituição que 

quando aplicada a uma expressão troca a variável x i pelo objeto v i 

uma instância da expressão e, é o resultado da aplicação 

de uma substituição θ em e com v i = cte 

negação 

lógica 

58

Representação implícita e fatorada: 

esquema das transições 

Operator: representação fatorada (com variáveis) de ações, 

dada pela tripla (nome, precond, effects): 

name: expressão sintática da forma n (x 1 ,…,x k ) 

precond: precondições que devem ser verdadeiras para 

ser possível usar/executar o operador 

effects: lista de efeitos que serão verdadeiros e os que 

serão falsos, após a execução do operador 

operator: (move (x,z,y) 

;; move bloco x de cima do bloco z, para cima do bloco y 

precond: {limpo(x ), sobre(x,z), limpo(y)} 

effects: {limpo(z), sobre(x,y), ¬ sobre(x,z), ¬limpo(y) }) 

59

Representação implícita e fatorada: esquema 

das transições 

Chamamos de ações as instâncias de um operador 

operator: (move (x,z,y) 

;; move bloco x de cima do bloco z, para cima do bloco y 

precond: {limpo(x ), sobre(x,z), limpo(y)} 

effects: {limpo(z), sobre(x,y), ¬ sobre(x,z), ¬limpo(y)}) 

substituição = {x/C, y/A, z/B} 

action: (move (C,A,B) 

;; move bloco C de cima do bloco A, para cima do bloco B 

precond: {limpo(C ), sobre(C,A), limpo(B)} 

effects: {limpo(A), sobre(C,B), ¬ sobre(C,A), ¬ limpo(B) }) 

C 

A 

A 

B 

move (C,A,B) 

C 

B 

60


Dado um domínio de planejamento um problema de 

planejamento é definido pela tripla P=(O,s 0 ,g), sendo: 

O uma coleção de operadores (domínio) 

s 0 

um estado (o estado inicial) 

g um conjunto de literais (a fórmula meta), sendo S g , o conjunto 

de estados tal que S g ∩ g = g 

Dado Σ, um problema de planejamento éa triplaP=(Σ,s 0 ,S g ), sendo: 

s 0 e S g (como definidos acima, permitem identificar L) 

Σ = (S,A,γ) é um sistema de transição de estados 

S = {2 L = conjuntos de todos os átomos em L} 

A = {todas as instâncias dos operadores em O } 

γ = a função de transição de estado (também pode ser 

determinada pelos operadores) 

61


Dado um domínio de planejamento, um problema de 

planejamento édado pelatriplaP=(O,s 0 ,g), sendo: 

O uma coleção de operadores (domínio) também chamada de 

descrição de primeira ordem 

um estado (o estado inicial) 

s 0 

g um conjunto de literais (a fórmula meta), sendo S g , o conjunto 

de estados tal que S g ∩ g = g 

Um problema de planejamento éa triplaP=(Σ,s 0 ,S g ), sendo: 

s 0 e S g (como definidos acima) 

Σ = (S,A,γ) é um sistema de transição de estados também chamada de 

descrição proposicional 

S = {conjuntos de todos os átomos em L} 

A = {todasasinstânciasdos operadores em O } 

γ = a função de transição de estado (também pode ser 

determinada pelos operadores) 

62

Planos e Soluções 

63

Planos e Soluções 

Plano: qualquer seqüência de ações σ = 〈a 1 , a 2 , …, a n 〉 tal 

que cada a i éumainstânciade um operadoremO 

O plano é uma solução para P=(O,s 0 ,g) se ele é executável 

em s 0 e atinge algum estado de S g 

i.e., se há estados s 0 , s 1 , …, s n tal que 

γ (s 0 ,a 1 ) = s 1 

γ (s 1 ,a 2 ) = s 2 

… 

γ (s n–1 ,a n ) = s n 

s n satisfaz g (ou s n ∈ S g ) 

64

Semântica de Operadores 

(na geração progressiva de estados sucessores) 


precond: { limpo(x), limpo(z), sobre(x,y) }, 

effects: { limpo(y), sobre(x,z), ¬limpo(z), ¬sobre(x,y) }) 

substituição = {x/C, y/A, z/B} 

s 

s’ 

C 

A 

B 

move(C,A,B) 

A 

C 

B 

limpo(B) 

limpo(C) 

sobre (A,mesa) 

Sobre(B,mesa) 

sobre(C,A) 

65



action: (move(C,A,B), 

precond: { limpo(C), limpo(B), sobre(C,A) }, 

effects: { limpo(A), sobre(C,B), ¬limpo(B), ¬sobre(C,A) }) 

s’ = s ∪ efeitos(positivos) \ efeitos(negativos) 

s 

s’ 

C 

A 

B 

move(C,A,B) 

A 

C 

B 

limpo(B) 

limpo(C) 


Sobre(B,mesa) 

sobre(C,A) 

66







s 

s’ 

C 

A 

B 

move(C,A,B) 

A 

C 

B 

limpo(B) 

limpo(C) 


Sobre(B,mesa) 

sobre(C,A) 

limpo(B) 

limpo(C) 

sobre(A,mesa) 

sobre(B,mesa) 

sobre(C,A) 

67







s 

s’ 

C 

A 

B 

move(C,A,B) 

A 

C 

B 

limpo(B) 

limpo(C) 


Sobre(B,mesa) 

sobre(C,A) 

limpo(B) 

limpo(C) 

sobre(A,mesa) 

sobre(B,mesa) 

sobre(C,A) 

limpo(B) 

limpo(C) 

sobre(A,mesa) 

sobre(B,mesa) 

sobre(C,A) 

limpo(A) 

sobre(C,B) 

68







s 

s’ 

C 

A 

B 

move(C,A,B) 

A 

C 

B 

limpo(B) 

limpo(C) 


Sobre(B,mesa) 

sobre(C,A) 

limpo(B) 

limpo(C) 

sobre(A,mesa) 

sobre(B,mesa) 

sobre(C,A) 

limpo(B) 

limpo(C) 

sobre(A,mesa) 

sobre(B,mesa) 

sobre(C,A) 

limpo(A) 

sobre(C,B) 

limpo(B) 

limpo(C) 

sobre(A,mesa) 

sobre(B,mesa) 

sobre(C,A) 

limpo(A) 

sobre(C,B) 

69

Robôs Portuários 

Generalização do exemplo anterior 

Um cais de porto com várias localizações 

e.g., docas, navios com docas, áreas de 

armazenagem, áreas de transferência 

de carga (pallets) 

Containers 

vão/vêm de navios 

Carros Robôs 

Podem mover containers 

Guindastes 

podem carregar ou 

descarregar 

containers 

70


Localizações: l1, l2, … 

Containers: c1, c2, … 

Podem ser empilhados, carregados sobre os robôs, ou carregados pelos 

guindastes 

Pallets: p1, p2, … 

Plataforma fixa no fundo de cada pilha 

Carros Robôs: r1, r2, … 

Podem mover para localizações adjacentes 

carregam no máximo um container 

Guindastes: k1, k2, … 

cada um pertence a uma única localização 

carrega um container de uma pilha para um carro robô e vice-e-versa 

Se há uma pilha em uma localização então deve haver também um 

guindaste na mesma localização 

71


Relações fixas: é a mesma em todos os estados 

adjacent(l,l’) attached(p,l) belong(k,l) 

Relações dinâmicas (fluentes): diferem de um estado para outro 

occupied(l) at(r,l) 

loaded(r,c) unloaded(r) 

holding(k,c) empty(k) 

in(c,p) on(c,c’) 

top(c,p) top(pallet,p) 

Conjunto de ações: 

take(c,k,p) put(c,k,p) 

load(r,c,k) unload(r) move(r,l,l’) 

72

Exemplo de um estado para o 

problema dos Robôs Portuários 

73

Domínio de planejamento: 

linguagem + conjunto de 

operadores 

74

Planning Domain Definition Language PDDL 

Linguagem adotada como padrão para decrever domínios 

de planejamento. Permite incluir: tipos, funções, variáveis 

numéricas, ações durativas, funções de otimização ==> 

planejamento e escalonamento 

Proposta inicial para acompetição de planejamento: 

AIPS 2002 Planning Competition 

http://www.dur.ac.uk/d.p.long/competition.htm 

75

Mundo dos Blocos em PDDL 

C 

A 

B 

76

PDDL temporal e numér co 

Operador do Domínio Satélites de Observação 

Espacial 

(:durative-action take_image 

:parameters (?s - satellite ?d - direction ?i - instrument ?m - mode) 

:duration (= ?duration 7) 

:condition (and (over all (calibrated ?i)) 

(over all (on_board ?i ?s)) 

(over all (supports ?i ?m) ) 

(over all (power_on ?i)) 

(over all (pointing ?s ?d)) 

(at end (power_on ?i)) 

(at start (>= (data_capacity ?s) (data ?d ?m))) 

) 

:effect (and (at start (decrease (data_capacity ?s) (data ?d ?m))) 

(at end (have_image ?d ?m)) 

(at end (increase (data-stored) (data ?d ?m))) ) 

77

Bibliografia 

M. Ghallab, Dana Nau, and Paulo Traverso. Automated 

Planning: Theory and Practice. Morgan Kaufmann 

Publishers, 2004 

Stuart Russel and Peter Norvig. Artificial Intelligence: a 

Modern Approach (2nd edition). Elsevier, 2006. 

Silvio do Lago Pereira. Planejamento no Cálculo de 

Eventos. Dissertação de Mestrado em Ciência da 

Computação, IME-USP, 2002. 

78

Planejamento automatizado - Laboratório de Técnicas Inteligentes ...

Create successful ePaper yourself

Delete template?

Save as template?