Note de curs - Departamentul Automatica, Calculatoare si ...
Note de curs - Departamentul Automatica, Calculatoare si ...
Note de curs - Departamentul Automatica, Calculatoare si ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
σ ( x)<br />
1<br />
= − α ( x−<br />
x p )<br />
1 + e<br />
<strong>si</strong> graficul din figura <strong>de</strong> mai jos.<br />
Functia <strong>si</strong>gmoidalǎ este tot <strong>de</strong> tipul salt dar saltul este neted. Saltul se apropie<br />
oricât <strong>de</strong> mult <strong>de</strong> saltul net din cazul functiei prag pe mǎsurǎ ce constanta<br />
pozitivǎ α creste. Functia <strong>de</strong> activare rǎmâne însǎ <strong>de</strong>rivabilǎ ceea ce este foarte<br />
important pentru meto<strong>de</strong>le <strong>de</strong> gradient.<br />
Referitor la structura retelelor neuronale se pune întrebarea (dublǎ) naturalǎ:<br />
câte straturi <strong>de</strong> neuroni sunt necesare, câte celule sunt necesare în fiecare strat<br />
<strong>de</strong> neuroni<br />
Stratul prim, cel <strong>de</strong> intrare trebuie sǎ continǎ atâtea celule câte componente are<br />
vectorul intrǎrilor retelei. Stratul ultim care produce ie<strong>si</strong>rile retelei trebuie sǎ<br />
continǎ nici mai mult nici mai putin <strong>de</strong>cât numǎrul <strong>de</strong> componente ale<br />
vectorului <strong>de</strong> ie<strong>si</strong>re. Rolul oricǎrui strat neuronal interior/ascuns este acela <strong>de</strong> a<br />
re-formula/re-aplica ie<strong>si</strong>rile stratului anterior pentru a obtine o reprezentare mai<br />
clar separabilǎ, mai limpe<strong>de</strong> cla<strong>si</strong>ficabilǎ a datelor. Straturile interioare sunt<br />
cele care permit atasarea unei semantici combinatiilor <strong>de</strong> intrǎri ale stratului.<br />
Kolmogorov a dat <strong>de</strong> timpuriu un rǎspuns (partial) la problema numǎrului <strong>de</strong><br />
celule dintr-un strat ascuns. Rǎspunsul bazat pe teoria aproximǎrii functiilor<br />
d c<br />
sunǎ astfel: fiind datǎ o functie continuǎ φ : I → R , φ ( x)<br />
= y , un<strong>de</strong> I = [0, 1]<br />
<strong>si</strong> în consecintǎ I d este cubul unitate d-dimen<strong>si</strong>onal, functia φ poate fi<br />
implementatǎ într-o retea neuronalǎ cu exact trei straturi, cu d unitǎti (celule) în<br />
stratul <strong>de</strong> intrare, cu (2c + 1) neuroni într-un unic strat ascuns <strong>si</strong> cu c unitǎti în<br />
stratul <strong>de</strong> ie<strong>si</strong>re.<br />
Teorema datǎ <strong>de</strong> Kolmogorov este numai o teoremǎ <strong>de</strong> existentǎ. Construirea<br />
efectivǎ a functiilor <strong>de</strong> activare este <strong>de</strong>schisǎ. Po<strong>si</strong>bilitǎtile <strong>de</strong> aproximare a<br />
functiei φ cu functii <strong>de</strong> un gen sau altul rǎmâne obiectul unor investigatii <strong>de</strong><br />
naturǎ mai curând aplicativǎ.<br />
Dupǎ cum s-a arǎtat mai <strong>de</strong>vreme, retelele neuronale artificiale sunt <strong>de</strong>ja larg<br />
utilizate pentru a rezolva probleme <strong>de</strong> învǎtare în diverse domenii. Prin<br />
utilizarea unor date experimentale existente, retelele neuronale “învatǎ” relatiile<br />
între intrǎri <strong>si</strong> ie<strong>si</strong>ri. Relatiile sunt aproape tot<strong>de</strong>auna neliniare <strong>si</strong> sunt cu totul<br />
empirice, fǎrǎ apel la vreo teorie din fundamentele fizicii, ale chimiei etc. Sub<br />
acest unghi, retelele neuronale sunt pur <strong>si</strong> <strong>si</strong>mplu mo<strong>de</strong>le regre<strong>si</strong>onale complexe<br />
68