01.12.2012 Views

c11.pdf

c11.pdf

c11.pdf

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Invatare reimprospatata<br />

� Agentul invata prin interactiunea cu mediul si prin observarea<br />

rezultatelor lt t l obtinute bti t di din aceste t iinteractiuni. t ti i<br />

� Este vorba de “cauza si efect” si acesta este si modul in care noi ne<br />

formam cunoasterea aupra mediului pe parcursul vietii.<br />

� Ideea de “cauza si efect” se traduce in pasii urmatori pentru in<br />

agent tdi din cadrul d l iinvatarii t ii reimprospatate:<br />

i t t<br />

8<br />

1. Agentul observa o stare de intrare<br />

22. Actiunea sa este determinata de o functie de luare de decizie (o<br />

strategie).<br />

3. Actiunea este indeplinita<br />

4. Agentul primeste o recompensa numerica de la mediu<br />

5. Informatia despre recompensa primita pentru starea/actiunea<br />

respectiva p este retinuta

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!