13.07.2015 Views

TESIS DOCTORAL - Robotics Lab - Universidad Carlos III de Madrid

TESIS DOCTORAL - Robotics Lab - Universidad Carlos III de Madrid

TESIS DOCTORAL - Robotics Lab - Universidad Carlos III de Madrid

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

“empuja” el robot a evitar las situaciones peligrosas. Los <strong>de</strong>talles y las ventajas <strong>de</strong> estasemociones en un robot real se muestran empíricamente a lo largo <strong>de</strong> este libro.El robot <strong>de</strong>ci<strong>de</strong> sus acciones futuras en base a lo que ha aprendido en experienciaspasadas. A pesar <strong>de</strong> que el contexto actual <strong>de</strong>l robot está limitado a un laboratorio, el robotsocial cohabita con personas en un entorno potencialmente no-<strong>de</strong>terminístico. El robot estáequipado con un repertorio <strong>de</strong> acciones pero, inicialmente, no sabe qué acción ejecutar nicuando hacerlo. De echo, tiene que apren<strong>de</strong>r la política <strong>de</strong> comportamiento, esto es, quéacción ejecutar en diferentes configuraciones <strong>de</strong>l mundo (en cada estado) para satisfacerla necesidad relacionada con la motivación más alta. Puesto que el robot apren<strong>de</strong> en unentorno real interaccionando con distintos objetos, es necesario que este aprendizaje serealice en un tiempo aceptable.El algoritmo <strong>de</strong> aprendizaje que se utiliza es una variación <strong>de</strong>l conocido Q-Learning, elObject Q-Learning. Mediante este algoritmo el robot apren<strong>de</strong> el valor <strong>de</strong> cada par estadoaccióna través <strong>de</strong> interacción con el entorno. Esto significa, que apren<strong>de</strong> el valor <strong>de</strong> cadaacción in cada posible estado. Cuanto más alto sea el valor, mejor es la acción en ese estado.Al inicio <strong>de</strong>l proceso <strong>de</strong> aprendizaje, estos valores, llamados valores Q, pue<strong>de</strong>n tenertodos el mismo valor o pue<strong>de</strong>n pue<strong>de</strong>n tener asignados distintos valores. En el primer caso,el robot no dispone <strong>de</strong> conocimientos previos; en el segundo, el robot dispone <strong>de</strong> cierta informaciónsobre la acción a elegir. Estos valores serán actualizados durante el aprendizaje.La emoción <strong>de</strong> miedo es especialmente estudiada en esta tesis. La forma <strong>de</strong> generarseesta emoción (el appraisal) y las reacciones al miedo resultan realmente útiles a la hora <strong>de</strong>dotar al robot con un mecanismo <strong>de</strong> supervivencia adaptable y fiable. Esta tesis presenta unrobot social que utiliza un proceso particular para el aprendizaje <strong>de</strong> nuevos “liberadores”<strong>de</strong>l miedo, es <strong>de</strong>cir, dispone <strong>de</strong> la capacidad <strong>de</strong> i<strong>de</strong>ntificar nuevas situaciones peligrosas.A<strong>de</strong>más, mediante el sistema <strong>de</strong> toma <strong>de</strong> <strong>de</strong>cisiones, el robot apren<strong>de</strong> diferente reaccionespara protegerse ante posibles daños causados por diversos eventos impre<strong>de</strong>cibles. De echo,estas reacciones al miedo son bastante similares a las reacciones al miedo que se pue<strong>de</strong>nobservar en la naturaleza.Otro reto importante es el diseño <strong>de</strong> la solución: el sistema <strong>de</strong> toma <strong>de</strong> <strong>de</strong>cisiones tieneque diseñarse <strong>de</strong> forma que sea suficientemente flexible para permitir cambiar fácilmentela configuración o incluso para aplicarse a distintos robots.Teniendo en cuenta el enfoque bioinspirado <strong>de</strong> este trabajo, esta investigación (y muchosotros trabajos relacionados) surge como un intento <strong>de</strong> enten<strong>de</strong>r un poco más lo quesuce<strong>de</strong> en el cerebro. El autor espera que esta tesis pueda ayudar en el estudio <strong>de</strong> los procesosmentales, en particular aquellos que pue<strong>de</strong>n llevar a <strong>de</strong>sór<strong>de</strong>nes mentales o cognitivos.viii

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!