04.01.2015 Views

Theoretical Neuroscience

Theoretical Neuroscience

Theoretical Neuroscience

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

9.2 Χλασσιχαλ Χονδιτιονινγ 337<br />

Τηισ ισ ϕυστ α δισχρετε τιµε ϖερσιον οφ τηε σορτ οφ λινεαρ ⇒λτερ υσεδ ιν χηαπ−<br />

τερσ 1 ανδ 2.<br />

Αρρανγινγ φορ v(τ) το πρεδιχτ τηε τοταλ φυτυρε ρεωαρδ ωουλδ αππεαρ το ρε−<br />

θυιρε α σιµπλε µοδι⇒χατιον οφ τηε δελτα ρυλε ωε ηαϖε δισχυσσεδ πρεϖιουσλψ,<br />

w(τ) → w(τ)+ ǫδ(τ)υ(τ − τ), (9.7)<br />

ωιτη δ(τ) βεινγ τηε διφφερενχε βετωεεν τηε αχτυαλ ανδ πρεδιχτεδ τοταλ φυ−<br />

τυρε ρεωαρδ, δ(τ) = ∑ τ ρ(τ + τ)− v(τ). Ηοωεϖερ, τηερε ισ α προβλεµ ωιτη<br />

αππλψινγ τηισ ρυλε ιν α στοχηαστιχ γραδιεντ δεσχεντ αλγοριτηµ. Χοµπυτα−<br />

τιον οφ δ(τ) ρεθυιρεσ κνοωλεδγε οφ τηε τοταλ φυτυρε ρεωαρδ ον α γιϖεν τριαλ.<br />

Αλτηουγη ρ(τ) ισ κνοων ατ τιµε τ, τηε συχχεεδινγ ρ(τ+1), ρ(τ+2)... ηαϖε<br />

ψετ το βε εξπεριενχεδ, µακινγ ιτ ιµποσσιβλε το χαλχυλατε δ(τ). Α ποσσιβλε<br />

σολυτιον ισ συγγεστεδ βψ τηε ρεχυρσιϖε φορµυλα<br />

∑Τ−τ<br />

Τ−τ−1 ∑<br />

ρ(τ + τ)= ρ(τ) + ρ(τ+1+τ). (9.8)<br />

τ=0<br />

τ=0<br />

Τηε τεµποραλ διφφερενχε µοδελ οφ πρεδιχτιον ισ βασεδ ον τηε οβσερϖατιον<br />

τηατ v(τ+1) προϖιδεσ αν αππροξιµατιον οφ τηε αϖεραγε ϖαλυε (αχροσσ τριαλσ)<br />

οφ τηε λαστ τερµ ιν εθυατιον 9.8, σο ωε χαν ωριτε<br />

∑Τ−τ<br />

ρ(τ + τ)≈ ρ(τ) + v(τ+1). (9.9)<br />

τ=0<br />

Ρεπλαχινγ τηε συµ ιν τηε εθυατιον δ(τ) = ∑ τ ρ(τ+τ)−v(τ) βψ τηισ αππροξ−<br />

ιµατιον γιϖεσ τηε τεµποραλ διφφερενχε λεαρνινγ ρυλε,<br />

w(τ) → w(τ)+ ǫδ(τ)υ(τ−τ) ωιτη δ(τ) = ρ(τ) + v(τ+1) − v(τ). (9.10)<br />

τεµποραλ<br />

διφφερενχε ρυλε<br />

Τηε ναµε οφ τηε ρυλε χοµεσ φροµ τηε τερµ v(τ+1) − v(τ), ωηιχη ισ τηε διφ−<br />

φερενχε βετωεεν τωο συχχεσσιϖε εστιµατεσ. δ(τ) ισ υσυαλλψ χαλλεδ τηε τεµ−<br />

ποραλ διφφερενχε ερρορ. Υνδερ α ϖαριετψ οφ χιρχυµστανχεσ, τηισ ρυλε ισ λικελψ<br />

το χονϖεργε το µακε τηε χορρεχτ πρεδιχτιονσ.<br />

Φιγυρε 9.2 σηοωσ ωηατ ηαππενσ ωηεν τηε τεµποραλ διφφερενχε ρυλε ισ απ−<br />

πλιεδ δυρινγ α τραινινγ περιοδ ιν ωηιχη α στιµυλυσ αππεαρσ ατ τιµε τ = 100,<br />

ανδ α ρεωαρδ ισ γιϖεν φορ α σηορτ ιντερϖαλ αρουνδ τ = 200. Ινιτιαλλψ, w(τ)= 0<br />

φορ αλλ τ. Φιγυρε 9.2Α σηοωσ τηατ τηε τεµποραλ διφφερενχε ερρορ σταρτσ οφφ βε−<br />

ινγ νονζερο ονλψ ατ τηε τιµε οφ τηε ρεωαρδ, τ = 200, ανδ τηεν, οϖερ τριαλσ,<br />

µοϖεσ βαχκωαρδ ιν τιµε, εϖεντυαλλψ σταβιλιζινγ αρουνδ τηε τιµε οφ τηε<br />

στιµυλυσ, ωηερε ιτ τακεσ τηε ϖαλυε 2. Τηισ ισ εθυαλ το τηε (ιντεγρατεδ) το−<br />

ταλ ρεωαρδ προϖιδεδ οϖερ τηε χουρσε οφ εαχη τριαλ. Φιγυρε 9.2Β σηοωσ τηε<br />

βεηαϖιορ δυρινγ α τριαλ οφ α νυµβερ οφ ϖαριαβλεσ βεφορε ανδ αφτερ λεαρνινγ.<br />

Αφτερ λεαρνινγ, τηε πρεδιχτιον v(τ) ισ 2 φροµ τηε τιµε τηε στιµυλυσ ισ ⇒ρστ<br />

πρεσεντεδ (τ = 100) υντιλ τηε τιµε τηε ρεωαρδ σταρτσ το βε δελιϖερεδ. Τηυσ,<br />

τηε τεµποραλ διφφερενχε πρεδιχτιον ερρορ (δ) ηασ α σπικε ατ τ = 99. Τηισ σπικε<br />

περσιστσ, βεχαυσε υ(τ) = 0φορτ < 100. Τηε τεµποραλ διφφερενχε τερµ (v)ισ<br />

νεγατιϖε αρουνδ τ = 200, εξαχτλψ χοµπενσατινγ φορ τηε δελιϖερψ οφ ρεωαρδ,<br />

ανδ τηυσ µακινγ δ = 0.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!