Slika 2.2: Primjer optičke iluzije. Na slikama je prika<strong>za</strong>na rotirajuća maska. Maska na posljednje dvije slike izgleda konveksno iako je u stvarnosti konkavna. Adaptirano iz [18] 2.1.4 Računalni pristup percepciji David Marr (1945–1980) bio je <strong>za</strong>govornik računalnog pristupa vizualnoj percepciji. Na vizualnu je percepciju uglavnom gledao kao na problem koji se nalazi unutar područja obrade informacija, te koji <strong>za</strong>počinje sa velikim nizom intenziteta sive boje koji aproksimira sliku koju gledatelj vidi, a <strong>za</strong>vršava opisom koji ovisi o tom nizu i o svrsi koju mu pridoda gledatelj [20]. Algoritam <strong>za</strong> dobivanje opisa slike (tj. opisa ni<strong>za</strong> intenziteta sive boje) koji bi bio pogodan <strong>za</strong> <strong>prepoznavanje</strong> 3D oblika Marr je opisao u [20]. Njegov se algoritam sastoji od tri koraka: prvobitne skice (engl. primal sketch), 2 1 2-dimenzionalne skice (engl. 2 1 2-sketch) i 3D modela. Marr je u [20] objasnio da su scena i crtež te scene jako slični, čak i unatoč potpuno različitim slikama u razinama sive boje koje na temelju njih mogu nastati. Ovo znači da simboli na crtežu koje je umjetnik nacrtao na neki način odgovaraju simbolima u stvarnome svijetu koje gledatelj vidi dok gleda scenu na temelju koje je crtež nacrtan. Marr je na temelju toga predložio da bi se u prvobitnoj skici slika trebala transformirati u primitivan, ali bogat, opis načina na koji se intenziteti mijenjaju unutar vidnog polja. Prvobitna se skica ne bi trebala računati <strong>za</strong> sve točke, već bi se mogla računati <strong>za</strong> samo odre ¯dene točke (npr. točke lokalno niskog ili visokog intenziteta). U računalu bi prvobitna skica trebala predstavljati niz brojeva koji bi sadržavali informacije o smjeru, veličini i prostornim razmjerima promjena intenziteta na slici. Uz ove informacije, trebala bi se <strong>za</strong>pamtiti i lokalna geometrija slike, odnosno polažaja točaka <strong>za</strong> koje je izračunata prvobitna skica te njihov raspored me ¯du neposrednim susjednim točkama. Nadalje, informacije koje se dobiju iz stereo vida (engl. stereopsis), pokreta (ako se analizira niz slika), kontura, teksture, boje i sjena na slici kombiniraju se u tzv. 2 1 2-dimenzionalnu skicu koja predstavlja konture površinskih diskontinuiteta, te informacije o orijentaciji i dubini površina na slici. No, unatoč svim ovim informacijama, iz položaja, veličine i orijentacije nekog oblika ne može se mnogo toga saznati o njegovoj 3D strukturi. Marr je stoga predložio da se <strong>za</strong> oblike koji dopuštaju prirodan rastav na sastavne dijelove koji se mogu opisati pomoću svoga položaja, veličine i orijentacije, taj rastav i obavi (npr. slika 2.3). Tada bi relativni prostorni raspored tih dijelova mogao pripomoći prepoznavanju oblika (npr. slika 2.4). Dodatne informacije o Marrovom računalnom pristupu vizualnoj percepciji mogu se pronaći u [20, 21, 22], a o prepoznavanju objekata na temelju sastavnih dijelova od kojih se sastoje u [23]. 8
Slika 2.3: Primjer rastava oblika na njegove sastavne dijelove. Adaptirano iz [20] Slika 2.4: Ljudi mogu prepoznati oblike čak i kada su predstavljeni na jako jednostavan način, sve dok je relativni prostorni raspored njihovih sastavnih dijelova jednak onome koji postoji u stvarnosti. Adaptirano iz [20] 9