Interaktívne evolučné výpočty v oblasti rozpoznávania obrazu - TUKE

Miroslav Venglarčík Interaktívne evolučné výpočty v oblasti rozpoznávania obrazu 

TECHNICKÁ UNIVERZITA V KOŠICIACH 

KATEDRA KYBERNETIKY A UMELEJ INTELIGENCIE 

Miroslav Venglarčík 

Interaktívne evolučné výpočty v oblasti rozpoznávania obrazu 

Esej z predmetu Teoretické základy umelej inteligencie 

Košice 2008 

1/8


Abstrakt. Esej uvádza stručný úvod do problematiky interaktívnych 

evolučných algoritmov a je zameraná na spôsob akým sa dá použiť 

pri rozpoznávaní obrazu. 

1. Teoretické poznatky z interaktvínych evolučných výpočtov 

Interaktívne evolučné výpočty (ďalej iba IEC) sú optimalizačnou metódou, ktorá adoptuje evolučné 

výpočty (ďalej iba EC) medzi systémovú optimalizáciu založenú na subjektívnom ľudskom 

vyhodnocovaní. Je to jednoducho technika EC, ktorých fitness funkcia (funkcia vhodnosti) je 

nahradená ľudským používateľom. Obr. 1 znázorňuje všeobecný IEC systém, kde používateľ vidí alebo 

počuje výstupy zo systému, ktoré vyhodnocuje a EC optimalizuje cieľový systém za účelom 

obdržania preferovaného výstupu založeného na používateľovom vyhodnocovaní. 

Obr. 1 Všeobecný IEC systém [1] 

Môžeme povedať, že IEC sú technológiou, ktorá do cieľového systému vnáša ľudské preferencie, 

intuície, emócie, psychologické aspekty, všeobecnejším pojmom označované ako kansei. 

Zaužívané sú dve hlavné definície IEC. Užšia definícia IEC: technológia, pri ktorej EC optimalizuje 

cieľový systém na základe subjektívneho ľudského vyhodnotenia, ktoré predstavuje fitness hodnoty 

(hodnoty vhodnosti) pre systémové výstupy, viď [2]. Širšia definícia IEC: technológia, pri ktorej EC 

optimalizuje cieľový systém za existencie interaktívneho rozhrania človekstroj. 

1.1. Evolučné výpočty 

Evolučné výpočty (EC – evolutionary computation), je biologicky inšpirovaný výpočtový koncept 

k riešeniu optimalizačných problémov. Je to populačne založený prehľadávací algoritmus a jeho 

výstupom je istý počet kandidátov, nazývaných taktiež indivíduami (jedincami) (text tejto podkapitoly 

2/8


vychádza z [3]). Každý jedinec má daný svoj genotyp, ktorý vnútorne reprezentuje v tomto prípade parametre 

grafickej časti webstránky v jej CSS súbore , a takisto svoj fenotyp, ktorý reprezentuje jedinca 

navonok. Každý jedinec má ešte vhodnosť (fitness), ktorou je vlastne vyjadrená kvalita daného riešenia. 

Na Obr. 2 je zobrazená všeobecná schéma EC, a táto v zásade platí pre všetky typy EC. 

Obr. 2 Všeobecná schéma evolučného výpočtu [3] 

2. Rozpoznávanie obrazu v interaktívnych evolučných výpočtoch 

Podľa [1] existujú dva typy cieľových systémov pre systémovu optimalizáciu: systémy, ktorých 

optimalizačná výkonnosť sa dá numericky (alebo aspoň kvantitatívne) definovať ako hodnotiaca funkcia, 

a systémy, u ktorých je ťažké špecifikovať ich optimalizačné indexy. Väčšina inžinierskeho výskumu 

využíva viaceré optimalizačné metódy založené na minimalizácii chybového kritéria a zameriavajú 

sa na prvý typ systémov, ako automatizácia, rozpoznávanie obrazcov, atď. Avšak, na získanie 

3/8


najpriaznivejších výstupov z interaktívnych systémov, ktoré vytvárajú alebo spracúvajú grafiku alebo 

hudbu, musia byť tieto výstupy subjektívne vyhodnotené. 

Preto podľa mňa môže byť IEC pri rozpoznávaní obrazu aplikované dvojakým spôsobom : 

1. rozpoznávanie obrazu zaobstaráva nejaký klasifikátor, ktorého parametre sa postune menia 

pomocou IEC 

2. IEC spracúvava obraz do určitej podoby, na základe užívateľových znalostí a samotné rozpoznávanie 

uskutočňuje užívateľ 

2.1. Interaktívna evolúcia s klasifikátorom 

Keďže IEC samé nedokáže plniť funkciu rozpoznávania, je potrebné do nej implementovať 

nejaký klasifikátor, ktorého úlohou bude spracovanie a rozpoznanie žiadaného obrazu. 

Podľa [4] rozpoznávanie obrazov nie je iba identifikovanie niečoho, čo je niekde namaľované, 

nakreslené, alebo niekde zobrazené. Nie je to len identifikácia vizuálnych obrazov, nakoľko obrazy, 

ktoré chceme identifikovať môžu byť aj nevizuálne, napríklad akustické. Z tohto hľadiska by asi skôr 

hodil názov identifikácia signálov. Signál môže byť vizuálny, akustický, elektromagnetický, atď. Pomocou 

takýchto rôznych signálov môžeme zachytiť mnohé podnety z okolitého prostredia. A ak nejaký 

systém dokáže reagovať na podnety okolia, dokáže okolie lepšie pochopiť a prispôsobí sa mu. 

Obrazy však nemôžeme priamo rozpoznávať zo signálu, ktorý zachytíme. Tento signál si najskôr 

musíme previesť do tvaru, v ktorom ho ďalej vieme spracovávať. Napríklad reprezentáciou vizuálneho 

obrazu by mohla byť matica, v ktorej každý prvok reprezentuje farbu tej ktorej časti obrazu. Pritom sa 

obraz nemusí mapovať celý, tzn., že zachytíme všetky vizuálne vnemy z prostredia, ale môžeme pracovať 

len s častou signálu. 

Jednou z metód klasifikácie sú neurónové siete. Ak chceme úspešne rozpoznávať obrazy pomocou 

neurónových sietí, musíme si najskôr tento obraz zmapovať na vstupy neurónovej siete. Na vstup 

neurónovej siete teda privádzame hodnotu všetkých pixelov obrázku. Takže najskôr je nutné rozložiť 

obrázok na pixely. To nie je veľmi veľký problém, lebo obrazy reprezentované v počítači sú väčšinou 

zobrazované po pixeloch. 

Ak je tento obrázok čiernobiely, tak je veľmi jednoduché priviesť tento obrázok na vstup neurónovej 

siete. Vytvoríme si neurónovú sieť, ktorá bude mať toľko vstupov ako je pixelov v obrázku. Na 

jednotlivé vstupy neurónovej siete budeme privádzať buď jednotku, keď bude pixel napríklad čierny, 

alebo nulu, keď bude pixel biely. 

Týmto sme však len načrtli spôsob akým reprezentovať obrázok tak, aby sa dal použit na rozpoznávanie 

pomocou neurónovej siete. Toto je vlastne len vstup do neurónovej siete. Ale čo výstup? 

Veď neurónová sieť má predsa aj svoj výstup. Výstup z neurónovej siete môže byť rôzny a je veľmi silne 

závislý od úlohy, ktorú riešime. Neurónová sieť môže mať jeden výstup, ale nič nebráni tomu, aby 

ich mala aj viac : 

4/8


• Neurónová sieť s jedným výstupom je vlastne príznaková sieť. Príznaková sieť je taká, ktorá 

nám na výstupe povie, či zadaný obrázok patrí alebo nepatrí do určitej triedy objektov 

• Môže rozpoznávať, či sa na obrázku nachádzajú dva objekty, alebo len jeden a podľa toho 

nám poskytnúť výstup. Neurónová sieť, ktorá nám na výstupe vždy nastaví len jeden príznak sa nazýva 

rozpoznávacia neurónová sieť. 

Pre riešenie úlohy rozpoznávania znakov písaných rukou bola navrhnutá neurónová sieť neocognitron. 

Základným princípom funkcie neurónovej siete Neocognitron je hierarchická detekcia príznakov. 

Hierarchická detekcia príznakov spočíva v rozdelení detekovaných príznakov do niekoľkých 

úrovní. V prvej úrovni sa prevádza detekcia najjednoduchších príznakov (obvykle rôzne natočených 

čiarok) a v každej následujúcej úrovni sú detekované príznaky stále komplexnejšie. 

Pritom platí, že pre detekciu príznakov v určitej úrovni sú využívané len informácie 

získané v predchádzajúcej úrovni. 

Na obrázku 3 je schematicky znázornená hierarchia príznakov, ktoré by sme mohli v 

neurónovej sieti Neocognitron využiť pre rozpoznávanie číslice nula. 

Obr. 3 Princíp hierarchie detekcie príznakov [4] 

5/8


Takto vytvorená neurónová sieť by nám slúžila ako klasifikátor na rozpoznávanie jednotlivých 

obrazov, v tomto prípade písaných znakov. Pomocou IEC by boli menené parametre vybraných jedincov, 

ktorých krížením by vznikli nové generácie, ktoré by sa mali približovať požadovanému výsledku. 

2.2. Spracovanie obrazu interaktívnou evolúciou 

Základná forma interaktívnej evolúcie podľa [5] je zobrazená na nasledujúcom obrázku. 

Obr.2 Schéma spracovania obrazov pomocou interaktívnej evolúcie [5] 

Interakcia človeka a počítača je realizovaná prostredníctvom používateľského rozhrania. 

Požívateľské rozhranie zobrazuje kandidátske obrazy používateľovi a zachytáva hodnotenia zadané 

používateľom. Výpočtová časť pozostáva z evolučného algoritmu a transformácie obrazu. Ohodnotené 

obrazy vstupujú do procesu evolúcie, ktorá nastavuje filter. 

2.2.1. Spracovanie obrazu 

Vo všeobecnosti môžeme pri spracovaní obrazu interaktívnou evolúciou použiť podľa [5] tri typy 

filtrov, ktoré evolúciou vieme korigovať: 

6/8


• Algebrický filter 

• Parametrický filter 

• Štruktúrovaný filter 

Algebrický filter 

Algebrický filter vypočítava výstupnú hodnotu daného pixlu pomocou vstupnej (pôvodnej) 

hodnoty pixlu a matematickej funkcie, ktorá popisuje vzťah medzi vstupnou a výstupnou hodnotou. 

Parametrický filter 

Parametrické filtre s fixnou štruktúrou7 sú založené na parametrických funkciách a úlohou 

IEV je optimalizácia týchto parametrov. Pre jednoduchosť si môžeme predstaviť takýto filter ako 

množinu troch funkcií pre výpočet výstupnej intenzity pixla zvlášť pre červený, zelený a modrý kanál. 

Štruktúrovaný filter 

Štruktúrovaný filter je filter pozostávajúci z množiny filtrov, ktorá vhodným spôsobom 

kombinuje parametrické a algebrické filtre. To nám umožňuje využiť výhody algebrických filtrov 

paralelne s prednosťami parametrického filtra. 

Záver 

Pri písaní tejto eseje sa mi nepodarilo zistiť, či existuje systém, ktorý by využíval “čistú“ 

interaktívnu evolúciu pri rozpoznávaní obrazu. Z toho dôvodu som popísla rozpoznávanie obrazu 

interaktívnymi evolúčnymi výpočtami z dvoch pohľadov. Z pohľadu evolúcie klasifikátora, ktorý plnil 

základnú funkciu rozpoznávania a z pohľadu spracovanie obrazu interaktívnou evolúciou, kde úlohu 

rozpoznávania plnil človek. 

7/8


Zoznam použitej literatúry 

[1] UŽÁK, Matúš : Vizualizácia a interakcia v procese učenia neurónových sietí. 

Košice : TUFEI, 2005. 86 s. 

[2] JAKŠA, Rudolf – TAKAGI, Hideyuki : Tuning of Image Parameters by Interactive 

Evolutionary Computation. Proc. of 2003 IEEE International Conference on Systems, Man 

& Cybernetics (SMC2003), Washington D.C., pp.492497 (October 58, 2003) 

[3] GAJDOŠ, Miroslav : Redukcia únavy používateľa IEC pomocou neurónovej siete 

pri grafickom návrhu reklamných bannerov. Košice : TUFEI, 2006. 60 s. 

[4] DILUNG, Pavol – DUDÁŠ, Ladislav : Rozpoznávanie obrazu, 2002, 

http://neuron.tuke.sk/alumni/cogsci/source/12/Dilung_esej.pdf 

[5] NEUPAUER, Marek : Analýza medicínskych dát na báze interaktívnej evolúcie. 

Košice : TUFEI, 2006. 65 s. 

8/8

Interaktívne evolučné výpočty v oblasti rozpoznávania obrazu - TUKE

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?