09.06.2015 Views

Milan Uhrík - Slovenská technická univerzita v Bratislave

Milan Uhrík - Slovenská technická univerzita v Bratislave

Milan Uhrík - Slovenská technická univerzita v Bratislave

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Študentská vedecká a odborná činnosť sekcia: Meracia technika ŠVOČ 2007<br />

Fakultné kolo, 25. apríl 2007<br />

Fakulta elektrotechniky a informatiky STU Bratislava<br />

Trace transformácia<br />

<strong>Milan</strong> <strong>Uhrík</strong> *<br />

Fakulta Elektrotechniky a Informatiky, <strong>Slovenská</strong> Technická Univerzita v <strong>Bratislave</strong><br />

milan.uhrik@gmail.com<br />

Abstrakt<br />

Trace transformácia sa používa pri konštruovaní<br />

charakteristických čísiel obrazov, ktoré sú invariantné<br />

voči posunutiu, rotácii a zmene mierky. V tomto<br />

príspevku sa verifikuje použiteľnosť trace transformácie<br />

na rozlišovanie obrazu a ich následné rozdeľovanie do<br />

jednotlivých tried. Taktiež sa analyzuje vplyv rôznych<br />

kombinácií funkcionálov na invariantnosť výsledného<br />

charakteristického čísla obrazu.<br />

1. Úvod<br />

Častou úlohou počítačového videnia je rozdeliť<br />

množinu predmetov na triedy. Predmet je fyzikálny<br />

objekt, ktorý je v počítačovom videní reprezentovaný<br />

najčastejšie oblasťou segmetovaného obrazu. Triedami<br />

nazývame disjunktné podmnožiny, ktoré majú<br />

z hľadiska klasifikácie určité spoločné rysy. Stroj, ktorý<br />

vykonáva činnosť klasifikácie (rozpoznávania)<br />

predmetov, nazývame klasifikátor. Teória<br />

rozpoznávania obrazu sa zaoberá otázkou, ako pre<br />

zvolený popis predmetu (obraz) najlepšie navrhnúť<br />

vhodný klasifikátor.<br />

Predmety možno rozpoznávať pomocou príznakov<br />

(elementárnych popisov), alebo pomocou syntaktického<br />

popisu (v prípade, že príznakový popis nie je schopný<br />

obsiahnuť veľkú zložitosť popisovaného predmetu). Pri<br />

syntaktickom rozpoznávaní sa pri učení syntaktického<br />

klasifikátoru používajú gramatiky, ktoré vytvárajú<br />

popisy všetkých predmetov danej triedy. V prípade<br />

príznakového rozpoznávania sa klasifikátor na základe<br />

daného rozhodovacieho pravidla rozhodne, do ktorej<br />

triedy obraz patrí. Pri návrhu a nastavovaní klasifikátora<br />

vychádzame z trénovacej množiny. Trénovacia množina<br />

je vždy konečná a u každého obrazu predmetu poznáme<br />

príslušnosť k triede. Čím je trénovacia množina väčšia,<br />

tým sa zvyšuje pravdepodobnosť správneho nastavenia<br />

klasifikátora. Lineárne klasifikátory pracujú zväčša na<br />

princípe minimálnej vzdialenosti, nelineárne<br />

klasifikátory využívajú nelineárnu transformáciu<br />

obrazového priestoru do nového obrazového priestoru,<br />

v ktorom sa následne použije lineárny klasifikátor.<br />

Postupy, ktoré pri práci nevyžadujú existenciu<br />

trénovacej množiny a teda nepotrebujú ani učiteľa<br />

nazývame zhluková analýza. Metódy zhlukovej analýzy<br />

delíme na hierarchické a nehierarchické. Hierarchické<br />

vytvárajú zhlukovací strom tak, že množinu najskôr<br />

rozdelia na dve navzájom najmenej podobné množiny,<br />

ktoré potom opäť ďalej rozdeľujú. Nehierarchické<br />

metódy vytvárajú zhluky na základe priraďovania<br />

prvkov zhlukovanej množiny k jednotlivým zhlukom<br />

(MacQueenova metóda). [5]<br />

2. Trace transformácia<br />

Jednou z metód príznakového rozpoznávania je aj<br />

metóda trace transformácie, založená na zovšeobecnení<br />

princípov Radónovej transformácie. Kým v Radónovej<br />

transformácii sa používa na výpočet charakteristického<br />

čísla obrazu najmä integrál počítaný pozdĺž línií<br />

križujúcich obraz, v prípade trace transformácie sa na<br />

výpočet okrem integrálu používajú aj iné funkcionály.<br />

Radónová transformácia je teda v tomto zmysle istým<br />

špeciálnym prípadom trace transformácie. Celkovo<br />

používa trace transformácia kombináciu trojice rôznych,<br />

alebo aj rovnakých, funkcionálov operujúcich nad<br />

jednotlivými líniami.<br />

Výhodou trace transformácie je, že je možné zostrojiť<br />

tisíce rôznych charakteristíckých čŕt na základe<br />

požiadavky, podľa ktorej chceme obrazy triediť. Nie<br />

všetky črty musia mať nutne geometrický, alebo<br />

fyzikálny význam. Nevýhodou trace transformácie,<br />

napríklad oproti metóde lokálnych okien uverejnenej v<br />

práci Schaela a Burkhardta je, že nedokáže rozoznávať<br />

časti objektov, ale len objekty ako celky. [1]<br />

Jedinečnosť vygenerovaných charakteristických čísel<br />

závisí predovšetkým od zvolenej kombinácie<br />

funkcionálov. Existuje množstvo možných variácií<br />

používaných funkcionálov, avšak nie všetky sú<br />

použiteľné na praktické rozoznávanie obrazu, či už<br />

kvôli nejednoznačnosti vygenerovaného<br />

charakteristického čísla, alebo kvôli časovej náročnosti<br />

výpočtu.<br />

V nasledujúcich experimentoch sa prostredníctvom série<br />

skriptov vytvorených v programovom prostredí Matlabu<br />

vyhodnocovala použiteľnosť jednotlivých kombinácií<br />

* Vedúci práce : doc. Ing. Rudolf Ravas PhD.


sekcia: Meracia technika ŠVOČ 2007<br />

funkcionálov na rozpoznávanie obrazov zo skúšobnej<br />

vzorky, ktoré patria do rovnakých tried.<br />

3. Princíp trace transformácie<br />

Trace transformácia sa vykonáva pozdĺž línie l(r,θ,t).<br />

Na obrázku č.1 sú zadefinované parametre.<br />

Obr. 1. Definícia premenných pre trace transformáciu.<br />

Parameter t je definovaný ako množina bodov pozdĺž<br />

línie so začiatkom v mieste dotyku s normálou.<br />

Parameter r je dĺžka normálového vektora projektovanej<br />

línie l(r,θ,t) a parameter θ je uhol medzi normálovým<br />

vektorom a x-ovou osou obrazovej funkcie f(x,y).<br />

Vypočítaním funkcionálu T na línii l(r,θ,t) eliminujeme<br />

parameter t a vyšetrovaný vstupný obraz je tak<br />

prostredníctvom trace transformácie transformovaný do<br />

iného obrazu, ktorý je už 2-rozmernou funkciou<br />

premenných (θ,r).<br />

4. Funkcionály<br />

Voľba použitých funkcionálov závisí na type<br />

invariantnosti, ktorý požadujeme. Úlohou funkcionálu v<br />

tradičnom matematickom ponímaní je charakterizovať<br />

funkciu prostredníctvom čísla. Nech f(x) označuje<br />

funkciu premennej x. Potom je výsledkom funkcionálu<br />

F [ f ( x)]<br />

= y<br />

(1)<br />

kde y je už len jedno číslo.<br />

Vo všeobecnosti definujeme dva typy používaných<br />

funkcionálov: Invariantné a citlivé na posun (invariant<br />

and sensitive).<br />

Funkcionál F funkcie f(x) nazývame invariantný, ak:<br />

F[ f ( x+ a)] = F [ f( x)]<br />

∀a∈R<br />

(2)<br />

Tab. 1. Použité invariantné funkcionály.<br />

Ná<br />

zov<br />

Definícia k λ<br />

F1 ∫ f ( xdx )<br />

-1 1<br />

∫<br />

-r qr<br />

F3 ∫ f '( x)<br />

dx<br />

0 1<br />

q<br />

F2 ( f ( x)<br />

dx)<br />

∫ 1<br />

F4 ( x ) 2 ( )<br />

F5 ( ) 1/2<br />

r<br />

− S f x dx -3 1<br />

F / F -2 0<br />

4 1<br />

F6 max { f ( x )}<br />

0 1<br />

F7 F − min { f ( x)<br />

} 0 1<br />

6<br />

F8 Amplitúda 1.harmonickej f ( x ) - 1<br />

F9 Amplitúda 2.harmonickej f ( x ) - 1<br />

F10 Amplitúda 3.harmonickej f ( x ) - 1<br />

F11 Amplitúda 4.harmonickej f ( x ) - 1<br />

F12<br />

F13<br />

dĺžka minimálneho segmentu<br />

počet segmentov<br />

F14 var { f ( x )}<br />

∫ f<br />

2 ( x ) dx<br />

-1/2 1<br />

F16 počet extrémov f ( x )<br />

F15 ( ) 1/2<br />

Tab. 2. Použité citlivé funkcionály.<br />

Ná<br />

Definícia k λ<br />

zov<br />

∫ 1<br />

S1 { xf . ( xdx ) }<br />

/F -1 0<br />

S2 Fáza 1.harmonickej n/a<br />

S3 Fáza 2.harmonickej n/a<br />

S4 Fáza 3.harmonickej n/a<br />

S5 Fáza 4.harmonickej n/a<br />

Typickými predstaviteľmi funkcionálov invariantných<br />

voči posunutiu sú integrál, medián, maximum, atď.<br />

Invariantný funkcionál môže mať navyše nasledovné<br />

vlastnosti :<br />

- zmena mierky nezávisle premennej b mení mierku<br />

výsledku podľa faktora k F .<br />

k F<br />

F[ f ( bx)] = b F [ f ( x)]<br />

∀b ∈R<br />

(3)<br />

- zmena mierky funkcie podľa c mení mierku výsledku<br />

podľa faktora λ F .<br />

λF<br />

F[ cf . ( x)] = c F [ f( x)]<br />

∀c∈R<br />

(4)<br />

Parametre kF,<br />

λ<br />

F<br />

charakterizujú funkcionál F.<br />

Funkcionál nazývame citlivý, ak :<br />

Z[ f ( x+ a)] = Z [ f ( x)]<br />

−a ∀a∈R<br />

(5)


sekcia: Meracia technika ŠVOČ 2007<br />

V tabuľke č.1 sú uvedené niektoré invariantné<br />

funkcionály spolu s ich vlastnosťami. V tabuľke č.2 sú<br />

uvedené príklady niektorých citlivých funkcionálov<br />

použitých v ďalších experimentoch.<br />

5. Princíp generovania invariantných<br />

charakteristických čísel<br />

Nech je vstupný obraz opísaný obrazovou funkciou<br />

f(x,y) a nech je namapovaný súborom priamych čiar vo<br />

všetkých smeroch. Viacnásobným použitím trace<br />

transformácie na vstupnej obrazovej funkcii možno<br />

získať číslo charakteristické pre daný obraz. Na výpočet<br />

charakteristického čísla obrazu sa používa trojica<br />

funkcionálov vybraná na základe požiadavky na typ<br />

invariantnosti. Tieto funkcionály sa podľa miesta svojho<br />

uplatnenia nazývajú Trace (označovaný písmenom T)<br />

Diametric (označovaný písmenom R) a Circular<br />

(označovaný písmenom θ). Výsledné charakteristické<br />

číslo je potom definované ako:<br />

[ [ [ θ ]]]<br />

Π [ f] = θ R T f( r, , t)<br />

(6)<br />

Výpočtom trace funkcionálu pozdĺž všetkých čiar sa<br />

eliminuje parameter t.<br />

Následne sa vypočíta R funkcionál, čím sa eliminuje<br />

parameter r.<br />

θ je funkcionál operujúci nad premennou orientácie<br />

(natočenia), po tom, čo boli nad obrazovou funkciou<br />

vykonané obidve predchádzajúce operácie.<br />

Kombinácia použitých funkcionálov môže byť zvolená<br />

tak, že charakteristické číslo má jednu z nasledovných<br />

vlastností:<br />

1) je invariantné voči posunutiu, natočeniu a zmene<br />

mierky<br />

2) je citlivé na posunutie, natočenie a zmenu mierky,<br />

takže tieto zmeny môžu byť medzi jednotlivými<br />

obrazmi odhalené<br />

3) vzťahuje sa dobre k nejakej vlastnosti, ktorú chceme<br />

v rade obrazov nájsť<br />

Pre konštrukciu invariantných charakteristických čísiel<br />

sa môžu použiť dve kombinácie funkcionálov:<br />

I. Kombinácia:<br />

- Trace funkcionál je invariantný voči posunutiu<br />

- Diametric funkcionál je invariantný voči posunutiu<br />

- Circular funkcionál je invariantný voči posunutiu<br />

Potom sú výsledné charakteristické čísla pre pôvodný a<br />

modifikovaný obraz previazané nasledovne:<br />

− λθ<br />

( kTλR+<br />

kR)<br />

Π [ f ] = c Π [ f ]<br />

(7)<br />

M<br />

Podmienkou pre invariannosť je:<br />

λθ<br />

( kTλ R + kR) = 0<br />

(8)<br />

II. Kombinácia:<br />

- Trace funkcionál je invariantný voči posunutiu<br />

- Diametric funkcionál je citlivý voči posunutiu<br />

- Circular funkcionál je invariantný voči posunutiu<br />

V tomto prípade sú charakteristické čísla pre pôvodný<br />

obraz a geometricky modifikovaný obraz previazané<br />

nasledovne:<br />

Π [ f ] = c Π [ f ]<br />

(9)<br />

M<br />

λ θ<br />

A podmienkou pre invariantnosť v tomto prípade je:<br />

λ = 0<br />

(10)<br />

θ<br />

Obe podmienky môžu byť zjednodušené do formy:<br />

kde:<br />

α<br />

Π [ f ] = c Π [ f ]<br />

(11)<br />

M<br />

− λθ<br />

(<br />

T R R) pre kombináciu I.<br />

{ k λ + k<br />

α =<br />

λθ<br />

pre kombináciu II.<br />

Každé charakteristické číslo môže byť normalizované<br />

podľa α nasledovne:<br />

1/ α<br />

{ }<br />

Π n[ f ] = Π[ f ] sign Π [ f ] (12)<br />

Táto formula môže byť ďalej zjednodušená na :<br />

−1<br />

Π [ f ] = c Π [ f ]<br />

(13)<br />

n<br />

M<br />

n<br />

Z toho vyplýva, že výsledné charakteristické číslo závisí<br />

lineárne na veľkosti mierky c.<br />

Ak sa uvažuje pomer dvoch normalizovaných<br />

charakteristických čísel, tak výsledné číslo je<br />

invariantné voči posunutiu, natočeniu a zmene mierky.<br />

K procesu generovania invariantných čŕt sa môže pridať<br />

robustnosť tak, že namiesto iba dvoch normalizovaných<br />

charakteristických čísel bude počítať N takýchto čísel.<br />

Získa sa tak vektor charakteristických čísel, ktorého<br />

norma je priamo úmerná mierke.<br />

(1) ( N )<br />

n n<br />

S = ( Π ,..., Π )<br />

(14)<br />

Smer tohto vektora v priestore charakteristických čísel<br />

je invariantný voči posunutiu, rotácii a zmene mierky.<br />

n<br />

() i<br />

n<br />

Π<br />

S =<br />

(15)<br />

( j)<br />

∑( Πn<br />

)<br />

j= 1<br />

Výber najvhodnejších kombinácií funkcionálov je<br />

samostatná obsiahla téma. Vo všeobecnosti však platí,<br />

že ak je daných niekoľko základných tried obrazov, tak<br />

efektívne zvolené kombinácie funkcionálov by mali mať<br />

malý rozptyl v rámci jednotlivých tried obrazov a veľký<br />

rozptyl medzi samostatnými triedami.<br />

Výhodou tohto exaktného prístupu je, že stačí, ak sa<br />

vypočíta variancia vektora charakteristických čísel pre<br />

každú triedu a následne sa porovná s varanciou medzi<br />

jednotlivými triedami.<br />

2


sekcia: Meracia technika ŠVOČ 2007<br />

6. Experimenty na základných čiernobielych<br />

geometrických útvaroch<br />

Algoritmus trace transformácie bol naprogramovaný v<br />

prostredí Matlabu pomocou skriptov.<br />

Vstupom boli štyri typy základných geometrických<br />

útvarov : kruh, obdĺžnik, štvorec a trojuholník (Obrázok<br />

č.2). Všetky obrazy boli kreslené bielou farbou na<br />

čiernom pozadí. Rozmery obrazov boli 212 x 212<br />

pixelov a boli uložené vo formáte bmp vo farebnej škále<br />

greyscale. Obrazy boli nakreslené tak, aby mali rovnaký<br />

obsah (plochu bielej farby), čím sa vylúčila možnosť<br />

rozpoznávania obrazov prostredníctvom priemernej<br />

úrovne jasu. Z každého typu geometrického útvaru bolo<br />

vytvorených 6 geometricky rôzne modifikovaných<br />

vzoriek, pričom prvá vzorka slúžila ako referenčná.<br />

Obrazy boli modifikované posunutím, rotáciou a<br />

zmenou mierky.<br />

Keďže trace transformácia používa pri výpočte<br />

charakteristického čísla tri rôzne funkcionály, pričom<br />

posledný funkcionál operuje nad natočením obrazu,<br />

bolo potrebné obrazy natáčať buď algoritmicky v<br />

Matlabe, alebo v externom programe. Keďže otáčanie<br />

obrazov v Malabe bolo výpočtovo príliš zdĺhavé, použil<br />

sa externý program a z každého obrazu sa spravilo 7<br />

vzoriek, ktoré boli natočené po 15˚. Spolu predstavovali<br />

na vstupe jeden obraz. Týmto spôsobom natáčania<br />

obrazov je navyše jednoduché predstaviť si postup trace<br />

transformácie. V prvom kroku sa vypočíta funkcionál T<br />

na každom riadku každej z natočených vzoriek, čím je<br />

každému riadku priradené jedno číslo. Potom sa pre<br />

každú natočenú vzorku vypočíta funkcionál R z čísiel<br />

priradených jednotlivým riadkom. Tým je každej<br />

natočenej vzorke priradené jedno číslo. Nakoniec sa<br />

vypočíta funkcionál θ z čísiel priradených jednotlivým<br />

natočeným vzorkám, čím sa získa výsledné<br />

charakteristické číslo obrazu.<br />

Na obrázku č.2 sú nakreslené referenčné obrazy<br />

reprezentujúce jednotlivé obrazové triedy. Obrazy boli<br />

spolu s dvomi ich základnými modifikáciami použité<br />

v trénovacej množine.<br />

Ukážky modifikovaných obrazov sú znázornené na<br />

obrázku č.3.<br />

a) b)<br />

c) d)<br />

Obr. 3. Modifikované obrazy použité na testovanie<br />

trace transformácie<br />

6.1. Výber vhodných kombinácií funkcionálov<br />

Kľúčovým bodom získania invariantného<br />

charakteristického čísla je voľba kombinácie<br />

funkcionálov pre trace transformáciu. Keďže existuje<br />

veľa možných kombinácií a každá nemusí byť rovnako<br />

vhodná pre daný typ obrazu, vytvorila sa trénovacia<br />

množina, ktorá pozostávala z troch obrazov z každej<br />

triedy. Na výber najlepších kombinácií funkcionálov sa<br />

použil skript, ktorého úlohou bolo prechádzať<br />

jednotlivými kombináciami funkcionálov (testovaných<br />

bolo vyše 750 kombinácii) a vyhodnocovať ich<br />

účinnosť na základe výpočtu variancie charakteristikých<br />

čísiel v rámci každej triedy obrazov. Následne bola táto<br />

variancia porovnávaná s hodnotou variancie medzi<br />

jednotlivými triedami. Ak bola hodnota variancie v<br />

rámci každej triedy menšia ako 0,1 % variancie medzi<br />

jednotlivými triedami, kombinácia bola vyhodnotená<br />

ako použiteľná na rozlišovanie daného typu obrazov.<br />

Týmto spôsobom sa získalo asi 50 možných<br />

použiteľných kombinácií.<br />

Z nich sa vybral 4 nasledovné:<br />

- Eta : F6 R : F2 Trace : F1<br />

- Eta : F7 R : F2 Trace : F1<br />

- Eta : F7 R : F4 Trace : F2<br />

- Eta : F7 R : F2 Trace : F2<br />

V ďalšom skripte sa táto štvorica kombinácií<br />

funkcionálov použila už na množinu všetkých<br />

vstupných obrazov. Vstupom do skriptu bol obraz a<br />

informácia o mierke. Tak sa získal vektor 4<br />

charakteristických čísel pre každý vstupný obraz. Každé<br />

získané charakterisktcké číslo bolo normalizované<br />

podľa vzťahu (12). Hodnoty získaných<br />

charakteristických čísel sú uvedené v tabuľke č.3. Kvôli<br />

obmedzenému priestoru sú uvedené len charakteristické<br />

čísla pre referenčné obrazy. Charakteristické čísla pre<br />

modifikované obrazy však boli blízke charakteristickým<br />

číslam pre referenčné obrazy.<br />

Obr. 2. Základné obrazy použité na testovanie trace<br />

transformácie


sekcia: Meracia technika ŠVOČ 2007<br />

Tab. 3. Charakteristické čísla jednotlivých obrazov.<br />

Hodnoty charakteristických čísel pre referenčné obrazy<br />

a aj pre ich geometricky modifikované verzie sú<br />

graficky znázornené na obrázku č.4. Z grafu je vidieť,<br />

že podľa hodnoty charakteristického čísla je ľahko<br />

možné identifikovať, do ktorej triedy obraz patrí.<br />

Eta:F7 - R:F2 - Trace:F1<br />

Použitá kombinácia funkcionálov<br />

Obraz<br />

(Eta-R-Trace)<br />

F6-F2- F7-F2- F7-F4- F7-F2-<br />

F1 F1 F1 F2<br />

a 419.3 105.3 14.5 17.9<br />

b 517.8 461.9 63.2 134.1<br />

c 454.5 274.1 41.9 78.2<br />

d 499.1 334.9 56.6 104.5<br />

500<br />

450<br />

400<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

jednotlivými triedami. Pre ukážku sú uvedené hodnoty<br />

rozptylov pre kombináciu funkcií:<br />

Eta:F6 – R:F2 – Trace:F1<br />

Rozptyl medzi triedami : 1906.441740<br />

Rozptyl v skupine kruh : 0.429789<br />

Rozptyl v skupine obdĺžnik: 0.361870<br />

Rozptyl v skupine štvorec : 6.424035<br />

Rozptyl v skupine trojuholník : 5.275809<br />

Ďalšie pokusy boli zamerané na problém<br />

s nepresnosťou, ktorá vzniká pri obrazoch pri väčšej<br />

zmene mierky. Najlepšie sa dokázala so zmenou mierky<br />

vysporiadať kombinácia funkcionálov :<br />

Eta : F6 R : F2 Trace : F1.<br />

Táto kombinácia funkcionálov dávala pre modifikované<br />

obrazy podobné charakteristické čísla až do rozmeru<br />

25% z veľkosti pôvodného obrazu.<br />

7. Experimenty na šedotónových obrazoch<br />

V nasledujúcom experimente sa počítali charakteristické<br />

čísla prostredníctvom trace transform pre zložitejšie<br />

šedotónové obrazy. Ako vstupné obrazy boli použité<br />

rôzne logá áut. Obrazy mali opäť rozmery 212 x 212<br />

pixelov a boli uložené vo formáte bmp ako greyscale. Z<br />

každého loga bolo vytvorených 6 rôznych<br />

geometrických modifikácií. Základné východiskové<br />

obrazy sú znázornené na obrázku č.5.<br />

50<br />

400 420 440 460 480 500 520<br />

Eta:F6 - R:F2 - Trace:F1<br />

150<br />

Eta:F7 - R:F2 - Trace:F2<br />

100<br />

50<br />

a) Alfa Romeo b) BMW<br />

0<br />

10 20 30 40 50 60 70 80<br />

Eta:F7 - R:F4 - Trace:F2<br />

Legenda:<br />

Štvorec Kruh Trojuholník Obdĺžnik<br />

c) Kia d) Land-Rover<br />

Obr. 4.Grafické znázornenie charakteristických čísel v<br />

2-rozmernom priestore.<br />

Správnosť zvolených kombinácií funkcionálov bola<br />

potvrdená výpočtom variancie v rámci každej triedy<br />

a porovnaním jej hodnoty s varianciou medzi<br />

e) Porsche f) Volkswagen<br />

Obr. 5.Použité obrazy - logá áut


sekcia: Meracia technika ŠVOČ 2007<br />

7.1. Výber vhodných kombinácií funkcionálov<br />

Trénovaciu množinu tvorili v tomto prípade trojice<br />

modifikovaných obrazov z každej triedy a-f. Kritériom<br />

výberu kombinácie funkcionálov bolo, aby bola hodnota<br />

variancie v rámci každej triedy obrazov menšia ako 5%<br />

z variancie medzi triedami. Kritérium spĺňalo 36<br />

kombinácií funkcionálov.<br />

7.2. Generovanie invariantných<br />

charakteristických čísel pomocou trace<br />

transformácie<br />

Na generovanie vektorov charakteristických čísel pre<br />

každý obraz bol použitý skript napísaný v Matlabe.<br />

V tabuľke č.4 sú uvedené charakteristické čísla pre<br />

základné obrazy a štyri zvolené kombinácie<br />

funkcionálov.<br />

Na obrázku č.6 sú výsledky aj pre ostatné obrazy<br />

znázornené graficky. Súradnice každého bodu sú dané<br />

hodnotou charakteristického čísla pre danú kombináciu<br />

funkcionálov.<br />

Tab. 4. Charakteristické čísla jednotlivých obrazov.<br />

Použitá kombinácia funkcionálov<br />

Obraz<br />

Eta-R-Trace (.10 4 )<br />

F1-F3- F6-F1- F4-F4- F4-F4-<br />

F1 F7 F10 F11<br />

a 1,305 0,095 0,080 0,076<br />

b 1,666 0,117 0,098 0,091<br />

c 0,865 0,078 0,057 0,053<br />

d 0,793 0,082 0,062 0,059<br />

e 1,448 0,121 0,095 0,088<br />

f 1,120 0,069 0,066 0,062<br />

Eta:F6 - R:F4 - Trace:F7<br />

140<br />

130<br />

120<br />

110<br />

100<br />

90<br />

0.6 0.8 1 1.2 1.4<br />

Eta:F6 - R:F1 - Trace:F7<br />

x 10 4<br />

Alfa Romeo BMW Kia<br />

Land Rover Porsche Volkswagen<br />

Obr. 5. Grafické znázornenie charakteristických čísel<br />

znakov áut v 2-rozmernom priestore pre 2<br />

rôzne kombinácie funkcionálov.<br />

8. Zatrieďovanie obrazov do tried<br />

Vstupom skriptu na zatrieďovanie obrazov do tried boli<br />

názvy obrazov a k nim prislúchajúce vektory<br />

charakteristických čísel. Systém pracoval na princípe<br />

lineárneho klasifikátora a rozhodovacím kritériom pre<br />

príslušnosť k danej triede bola vzdialenosť<br />

charakteristického čísla daného obrazu k<br />

charakteristickému číslu niektorého z referenčných<br />

obrazov. V prípade viacerých charakteristických čísel sa<br />

obraz priradil k tej triede, ku ktorej ho priradilo najviac<br />

kombinácií funkcionálov. Účinnosť rozpoznávania sa<br />

zvyšovala s rasúcim počtom charakteristických čísel<br />

každého obrazu až nakoniec dosiahla pre uvedenú<br />

skúšobnú vzorku 100%.<br />

8.1. Hľadanie modifikovaných obrazov<br />

Použitím funkcionálu citlivého na posunutie je možné<br />

dosiahnuť citlivosť celej transformácie na posunutie,<br />

rotáciu a zmenu mierky obrazu. Takto možno zo série<br />

obrazov vyhľadať tie, ktoré sa odlišujú od referenčného<br />

obrazu. V pokuse bol použitý referenčný obraz<br />

trojuholníka d) z obrázku č.3. Druhý porovnávaný obraz<br />

trojuholníka bol posunutý o 5 pixelov doprava. Na ich<br />

vzájomné odlíšenie bola požitá kombinácia<br />

funkcionálov: Eta:F7 – R:SF1 – Trace:F1.<br />

Výsledné charakteristické čísla boli nasledovné:<br />

Referenčný obraz trojuholníka: 5,727<br />

Posunutý obraz trojuholníka: 2,000<br />

Rozdiel charakteristických čísel sa so zväčšujúcimi<br />

modifikáciami dramaticky zvyšoval.<br />

9. Záver<br />

Z vlastností trace transformácie vyplýva, že je to metóda<br />

vhodná na rozpoznávanie obrazu podľa rôznych kritérií<br />

invariantnosti voči posunutiu, natočeniu a zmene mierky<br />

obrazu. Výpočtová náročnosť závisí predovšetkým od<br />

počtu a vzájomnej podobnosti jednotlivých tried<br />

obrazov a teda aj od množstva charakteristických čísel<br />

potrebných na efektívne rozpoznávanie tried.<br />

10. Odkazy na literatúru<br />

[1] Kadyrov, A., Petrou, M.: The Trace Transform and Its<br />

Applications, IEEE Transactions on Pattern Analysis and<br />

Machine Intelligence, Vol.23, No.8, pp. 811-828, August<br />

2001.<br />

[2] Turán Ján a spol., Acta Electrotechnica et Informatica No.<br />

3, Vol. 6, 2006, pp. 1-11<br />

[3] Petrou M. Kadyrov, A., The Trace Transform in a<br />

Nutshell,<br />

http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COP<br />

IES/PETROU2/trace.doc<br />

[4] Volauf P., Numerické a štatistické výpočty v Matlabe,<br />

<strong>Slovenská</strong> Technická Univerzita , 2005<br />

[5] Šonka M., Hlaváč V., Počítačové vidění, GRADA, 1992

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!