Milan Uhrík - Slovenská technická univerzita v Bratislave
Milan Uhrík - Slovenská technická univerzita v Bratislave
Milan Uhrík - Slovenská technická univerzita v Bratislave
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Študentská vedecká a odborná činnosť sekcia: Meracia technika ŠVOČ 2007<br />
Fakultné kolo, 25. apríl 2007<br />
Fakulta elektrotechniky a informatiky STU Bratislava<br />
Trace transformácia<br />
<strong>Milan</strong> <strong>Uhrík</strong> *<br />
Fakulta Elektrotechniky a Informatiky, <strong>Slovenská</strong> Technická Univerzita v <strong>Bratislave</strong><br />
milan.uhrik@gmail.com<br />
Abstrakt<br />
Trace transformácia sa používa pri konštruovaní<br />
charakteristických čísiel obrazov, ktoré sú invariantné<br />
voči posunutiu, rotácii a zmene mierky. V tomto<br />
príspevku sa verifikuje použiteľnosť trace transformácie<br />
na rozlišovanie obrazu a ich následné rozdeľovanie do<br />
jednotlivých tried. Taktiež sa analyzuje vplyv rôznych<br />
kombinácií funkcionálov na invariantnosť výsledného<br />
charakteristického čísla obrazu.<br />
1. Úvod<br />
Častou úlohou počítačového videnia je rozdeliť<br />
množinu predmetov na triedy. Predmet je fyzikálny<br />
objekt, ktorý je v počítačovom videní reprezentovaný<br />
najčastejšie oblasťou segmetovaného obrazu. Triedami<br />
nazývame disjunktné podmnožiny, ktoré majú<br />
z hľadiska klasifikácie určité spoločné rysy. Stroj, ktorý<br />
vykonáva činnosť klasifikácie (rozpoznávania)<br />
predmetov, nazývame klasifikátor. Teória<br />
rozpoznávania obrazu sa zaoberá otázkou, ako pre<br />
zvolený popis predmetu (obraz) najlepšie navrhnúť<br />
vhodný klasifikátor.<br />
Predmety možno rozpoznávať pomocou príznakov<br />
(elementárnych popisov), alebo pomocou syntaktického<br />
popisu (v prípade, že príznakový popis nie je schopný<br />
obsiahnuť veľkú zložitosť popisovaného predmetu). Pri<br />
syntaktickom rozpoznávaní sa pri učení syntaktického<br />
klasifikátoru používajú gramatiky, ktoré vytvárajú<br />
popisy všetkých predmetov danej triedy. V prípade<br />
príznakového rozpoznávania sa klasifikátor na základe<br />
daného rozhodovacieho pravidla rozhodne, do ktorej<br />
triedy obraz patrí. Pri návrhu a nastavovaní klasifikátora<br />
vychádzame z trénovacej množiny. Trénovacia množina<br />
je vždy konečná a u každého obrazu predmetu poznáme<br />
príslušnosť k triede. Čím je trénovacia množina väčšia,<br />
tým sa zvyšuje pravdepodobnosť správneho nastavenia<br />
klasifikátora. Lineárne klasifikátory pracujú zväčša na<br />
princípe minimálnej vzdialenosti, nelineárne<br />
klasifikátory využívajú nelineárnu transformáciu<br />
obrazového priestoru do nového obrazového priestoru,<br />
v ktorom sa následne použije lineárny klasifikátor.<br />
Postupy, ktoré pri práci nevyžadujú existenciu<br />
trénovacej množiny a teda nepotrebujú ani učiteľa<br />
nazývame zhluková analýza. Metódy zhlukovej analýzy<br />
delíme na hierarchické a nehierarchické. Hierarchické<br />
vytvárajú zhlukovací strom tak, že množinu najskôr<br />
rozdelia na dve navzájom najmenej podobné množiny,<br />
ktoré potom opäť ďalej rozdeľujú. Nehierarchické<br />
metódy vytvárajú zhluky na základe priraďovania<br />
prvkov zhlukovanej množiny k jednotlivým zhlukom<br />
(MacQueenova metóda). [5]<br />
2. Trace transformácia<br />
Jednou z metód príznakového rozpoznávania je aj<br />
metóda trace transformácie, založená na zovšeobecnení<br />
princípov Radónovej transformácie. Kým v Radónovej<br />
transformácii sa používa na výpočet charakteristického<br />
čísla obrazu najmä integrál počítaný pozdĺž línií<br />
križujúcich obraz, v prípade trace transformácie sa na<br />
výpočet okrem integrálu používajú aj iné funkcionály.<br />
Radónová transformácia je teda v tomto zmysle istým<br />
špeciálnym prípadom trace transformácie. Celkovo<br />
používa trace transformácia kombináciu trojice rôznych,<br />
alebo aj rovnakých, funkcionálov operujúcich nad<br />
jednotlivými líniami.<br />
Výhodou trace transformácie je, že je možné zostrojiť<br />
tisíce rôznych charakteristíckých čŕt na základe<br />
požiadavky, podľa ktorej chceme obrazy triediť. Nie<br />
všetky črty musia mať nutne geometrický, alebo<br />
fyzikálny význam. Nevýhodou trace transformácie,<br />
napríklad oproti metóde lokálnych okien uverejnenej v<br />
práci Schaela a Burkhardta je, že nedokáže rozoznávať<br />
časti objektov, ale len objekty ako celky. [1]<br />
Jedinečnosť vygenerovaných charakteristických čísel<br />
závisí predovšetkým od zvolenej kombinácie<br />
funkcionálov. Existuje množstvo možných variácií<br />
používaných funkcionálov, avšak nie všetky sú<br />
použiteľné na praktické rozoznávanie obrazu, či už<br />
kvôli nejednoznačnosti vygenerovaného<br />
charakteristického čísla, alebo kvôli časovej náročnosti<br />
výpočtu.<br />
V nasledujúcich experimentoch sa prostredníctvom série<br />
skriptov vytvorených v programovom prostredí Matlabu<br />
vyhodnocovala použiteľnosť jednotlivých kombinácií<br />
* Vedúci práce : doc. Ing. Rudolf Ravas PhD.
sekcia: Meracia technika ŠVOČ 2007<br />
funkcionálov na rozpoznávanie obrazov zo skúšobnej<br />
vzorky, ktoré patria do rovnakých tried.<br />
3. Princíp trace transformácie<br />
Trace transformácia sa vykonáva pozdĺž línie l(r,θ,t).<br />
Na obrázku č.1 sú zadefinované parametre.<br />
Obr. 1. Definícia premenných pre trace transformáciu.<br />
Parameter t je definovaný ako množina bodov pozdĺž<br />
línie so začiatkom v mieste dotyku s normálou.<br />
Parameter r je dĺžka normálového vektora projektovanej<br />
línie l(r,θ,t) a parameter θ je uhol medzi normálovým<br />
vektorom a x-ovou osou obrazovej funkcie f(x,y).<br />
Vypočítaním funkcionálu T na línii l(r,θ,t) eliminujeme<br />
parameter t a vyšetrovaný vstupný obraz je tak<br />
prostredníctvom trace transformácie transformovaný do<br />
iného obrazu, ktorý je už 2-rozmernou funkciou<br />
premenných (θ,r).<br />
4. Funkcionály<br />
Voľba použitých funkcionálov závisí na type<br />
invariantnosti, ktorý požadujeme. Úlohou funkcionálu v<br />
tradičnom matematickom ponímaní je charakterizovať<br />
funkciu prostredníctvom čísla. Nech f(x) označuje<br />
funkciu premennej x. Potom je výsledkom funkcionálu<br />
F [ f ( x)]<br />
= y<br />
(1)<br />
kde y je už len jedno číslo.<br />
Vo všeobecnosti definujeme dva typy používaných<br />
funkcionálov: Invariantné a citlivé na posun (invariant<br />
and sensitive).<br />
Funkcionál F funkcie f(x) nazývame invariantný, ak:<br />
F[ f ( x+ a)] = F [ f( x)]<br />
∀a∈R<br />
(2)<br />
Tab. 1. Použité invariantné funkcionály.<br />
Ná<br />
zov<br />
Definícia k λ<br />
F1 ∫ f ( xdx )<br />
-1 1<br />
∫<br />
-r qr<br />
F3 ∫ f '( x)<br />
dx<br />
0 1<br />
q<br />
F2 ( f ( x)<br />
dx)<br />
∫ 1<br />
F4 ( x ) 2 ( )<br />
F5 ( ) 1/2<br />
r<br />
− S f x dx -3 1<br />
F / F -2 0<br />
4 1<br />
F6 max { f ( x )}<br />
0 1<br />
F7 F − min { f ( x)<br />
} 0 1<br />
6<br />
F8 Amplitúda 1.harmonickej f ( x ) - 1<br />
F9 Amplitúda 2.harmonickej f ( x ) - 1<br />
F10 Amplitúda 3.harmonickej f ( x ) - 1<br />
F11 Amplitúda 4.harmonickej f ( x ) - 1<br />
F12<br />
F13<br />
dĺžka minimálneho segmentu<br />
počet segmentov<br />
F14 var { f ( x )}<br />
∫ f<br />
2 ( x ) dx<br />
-1/2 1<br />
F16 počet extrémov f ( x )<br />
F15 ( ) 1/2<br />
Tab. 2. Použité citlivé funkcionály.<br />
Ná<br />
Definícia k λ<br />
zov<br />
∫ 1<br />
S1 { xf . ( xdx ) }<br />
/F -1 0<br />
S2 Fáza 1.harmonickej n/a<br />
S3 Fáza 2.harmonickej n/a<br />
S4 Fáza 3.harmonickej n/a<br />
S5 Fáza 4.harmonickej n/a<br />
Typickými predstaviteľmi funkcionálov invariantných<br />
voči posunutiu sú integrál, medián, maximum, atď.<br />
Invariantný funkcionál môže mať navyše nasledovné<br />
vlastnosti :<br />
- zmena mierky nezávisle premennej b mení mierku<br />
výsledku podľa faktora k F .<br />
k F<br />
F[ f ( bx)] = b F [ f ( x)]<br />
∀b ∈R<br />
(3)<br />
- zmena mierky funkcie podľa c mení mierku výsledku<br />
podľa faktora λ F .<br />
λF<br />
F[ cf . ( x)] = c F [ f( x)]<br />
∀c∈R<br />
(4)<br />
Parametre kF,<br />
λ<br />
F<br />
charakterizujú funkcionál F.<br />
Funkcionál nazývame citlivý, ak :<br />
Z[ f ( x+ a)] = Z [ f ( x)]<br />
−a ∀a∈R<br />
(5)
sekcia: Meracia technika ŠVOČ 2007<br />
V tabuľke č.1 sú uvedené niektoré invariantné<br />
funkcionály spolu s ich vlastnosťami. V tabuľke č.2 sú<br />
uvedené príklady niektorých citlivých funkcionálov<br />
použitých v ďalších experimentoch.<br />
5. Princíp generovania invariantných<br />
charakteristických čísel<br />
Nech je vstupný obraz opísaný obrazovou funkciou<br />
f(x,y) a nech je namapovaný súborom priamych čiar vo<br />
všetkých smeroch. Viacnásobným použitím trace<br />
transformácie na vstupnej obrazovej funkcii možno<br />
získať číslo charakteristické pre daný obraz. Na výpočet<br />
charakteristického čísla obrazu sa používa trojica<br />
funkcionálov vybraná na základe požiadavky na typ<br />
invariantnosti. Tieto funkcionály sa podľa miesta svojho<br />
uplatnenia nazývajú Trace (označovaný písmenom T)<br />
Diametric (označovaný písmenom R) a Circular<br />
(označovaný písmenom θ). Výsledné charakteristické<br />
číslo je potom definované ako:<br />
[ [ [ θ ]]]<br />
Π [ f] = θ R T f( r, , t)<br />
(6)<br />
Výpočtom trace funkcionálu pozdĺž všetkých čiar sa<br />
eliminuje parameter t.<br />
Následne sa vypočíta R funkcionál, čím sa eliminuje<br />
parameter r.<br />
θ je funkcionál operujúci nad premennou orientácie<br />
(natočenia), po tom, čo boli nad obrazovou funkciou<br />
vykonané obidve predchádzajúce operácie.<br />
Kombinácia použitých funkcionálov môže byť zvolená<br />
tak, že charakteristické číslo má jednu z nasledovných<br />
vlastností:<br />
1) je invariantné voči posunutiu, natočeniu a zmene<br />
mierky<br />
2) je citlivé na posunutie, natočenie a zmenu mierky,<br />
takže tieto zmeny môžu byť medzi jednotlivými<br />
obrazmi odhalené<br />
3) vzťahuje sa dobre k nejakej vlastnosti, ktorú chceme<br />
v rade obrazov nájsť<br />
Pre konštrukciu invariantných charakteristických čísiel<br />
sa môžu použiť dve kombinácie funkcionálov:<br />
I. Kombinácia:<br />
- Trace funkcionál je invariantný voči posunutiu<br />
- Diametric funkcionál je invariantný voči posunutiu<br />
- Circular funkcionál je invariantný voči posunutiu<br />
Potom sú výsledné charakteristické čísla pre pôvodný a<br />
modifikovaný obraz previazané nasledovne:<br />
− λθ<br />
( kTλR+<br />
kR)<br />
Π [ f ] = c Π [ f ]<br />
(7)<br />
M<br />
Podmienkou pre invariannosť je:<br />
λθ<br />
( kTλ R + kR) = 0<br />
(8)<br />
II. Kombinácia:<br />
- Trace funkcionál je invariantný voči posunutiu<br />
- Diametric funkcionál je citlivý voči posunutiu<br />
- Circular funkcionál je invariantný voči posunutiu<br />
V tomto prípade sú charakteristické čísla pre pôvodný<br />
obraz a geometricky modifikovaný obraz previazané<br />
nasledovne:<br />
Π [ f ] = c Π [ f ]<br />
(9)<br />
M<br />
λ θ<br />
A podmienkou pre invariantnosť v tomto prípade je:<br />
λ = 0<br />
(10)<br />
θ<br />
Obe podmienky môžu byť zjednodušené do formy:<br />
kde:<br />
α<br />
Π [ f ] = c Π [ f ]<br />
(11)<br />
M<br />
− λθ<br />
(<br />
T R R) pre kombináciu I.<br />
{ k λ + k<br />
α =<br />
λθ<br />
pre kombináciu II.<br />
Každé charakteristické číslo môže byť normalizované<br />
podľa α nasledovne:<br />
1/ α<br />
{ }<br />
Π n[ f ] = Π[ f ] sign Π [ f ] (12)<br />
Táto formula môže byť ďalej zjednodušená na :<br />
−1<br />
Π [ f ] = c Π [ f ]<br />
(13)<br />
n<br />
M<br />
n<br />
Z toho vyplýva, že výsledné charakteristické číslo závisí<br />
lineárne na veľkosti mierky c.<br />
Ak sa uvažuje pomer dvoch normalizovaných<br />
charakteristických čísel, tak výsledné číslo je<br />
invariantné voči posunutiu, natočeniu a zmene mierky.<br />
K procesu generovania invariantných čŕt sa môže pridať<br />
robustnosť tak, že namiesto iba dvoch normalizovaných<br />
charakteristických čísel bude počítať N takýchto čísel.<br />
Získa sa tak vektor charakteristických čísel, ktorého<br />
norma je priamo úmerná mierke.<br />
(1) ( N )<br />
n n<br />
S = ( Π ,..., Π )<br />
(14)<br />
Smer tohto vektora v priestore charakteristických čísel<br />
je invariantný voči posunutiu, rotácii a zmene mierky.<br />
n<br />
() i<br />
n<br />
Π<br />
S =<br />
(15)<br />
( j)<br />
∑( Πn<br />
)<br />
j= 1<br />
Výber najvhodnejších kombinácií funkcionálov je<br />
samostatná obsiahla téma. Vo všeobecnosti však platí,<br />
že ak je daných niekoľko základných tried obrazov, tak<br />
efektívne zvolené kombinácie funkcionálov by mali mať<br />
malý rozptyl v rámci jednotlivých tried obrazov a veľký<br />
rozptyl medzi samostatnými triedami.<br />
Výhodou tohto exaktného prístupu je, že stačí, ak sa<br />
vypočíta variancia vektora charakteristických čísel pre<br />
každú triedu a následne sa porovná s varanciou medzi<br />
jednotlivými triedami.<br />
2
sekcia: Meracia technika ŠVOČ 2007<br />
6. Experimenty na základných čiernobielych<br />
geometrických útvaroch<br />
Algoritmus trace transformácie bol naprogramovaný v<br />
prostredí Matlabu pomocou skriptov.<br />
Vstupom boli štyri typy základných geometrických<br />
útvarov : kruh, obdĺžnik, štvorec a trojuholník (Obrázok<br />
č.2). Všetky obrazy boli kreslené bielou farbou na<br />
čiernom pozadí. Rozmery obrazov boli 212 x 212<br />
pixelov a boli uložené vo formáte bmp vo farebnej škále<br />
greyscale. Obrazy boli nakreslené tak, aby mali rovnaký<br />
obsah (plochu bielej farby), čím sa vylúčila možnosť<br />
rozpoznávania obrazov prostredníctvom priemernej<br />
úrovne jasu. Z každého typu geometrického útvaru bolo<br />
vytvorených 6 geometricky rôzne modifikovaných<br />
vzoriek, pričom prvá vzorka slúžila ako referenčná.<br />
Obrazy boli modifikované posunutím, rotáciou a<br />
zmenou mierky.<br />
Keďže trace transformácia používa pri výpočte<br />
charakteristického čísla tri rôzne funkcionály, pričom<br />
posledný funkcionál operuje nad natočením obrazu,<br />
bolo potrebné obrazy natáčať buď algoritmicky v<br />
Matlabe, alebo v externom programe. Keďže otáčanie<br />
obrazov v Malabe bolo výpočtovo príliš zdĺhavé, použil<br />
sa externý program a z každého obrazu sa spravilo 7<br />
vzoriek, ktoré boli natočené po 15˚. Spolu predstavovali<br />
na vstupe jeden obraz. Týmto spôsobom natáčania<br />
obrazov je navyše jednoduché predstaviť si postup trace<br />
transformácie. V prvom kroku sa vypočíta funkcionál T<br />
na každom riadku každej z natočených vzoriek, čím je<br />
každému riadku priradené jedno číslo. Potom sa pre<br />
každú natočenú vzorku vypočíta funkcionál R z čísiel<br />
priradených jednotlivým riadkom. Tým je každej<br />
natočenej vzorke priradené jedno číslo. Nakoniec sa<br />
vypočíta funkcionál θ z čísiel priradených jednotlivým<br />
natočeným vzorkám, čím sa získa výsledné<br />
charakteristické číslo obrazu.<br />
Na obrázku č.2 sú nakreslené referenčné obrazy<br />
reprezentujúce jednotlivé obrazové triedy. Obrazy boli<br />
spolu s dvomi ich základnými modifikáciami použité<br />
v trénovacej množine.<br />
Ukážky modifikovaných obrazov sú znázornené na<br />
obrázku č.3.<br />
a) b)<br />
c) d)<br />
Obr. 3. Modifikované obrazy použité na testovanie<br />
trace transformácie<br />
6.1. Výber vhodných kombinácií funkcionálov<br />
Kľúčovým bodom získania invariantného<br />
charakteristického čísla je voľba kombinácie<br />
funkcionálov pre trace transformáciu. Keďže existuje<br />
veľa možných kombinácií a každá nemusí byť rovnako<br />
vhodná pre daný typ obrazu, vytvorila sa trénovacia<br />
množina, ktorá pozostávala z troch obrazov z každej<br />
triedy. Na výber najlepších kombinácií funkcionálov sa<br />
použil skript, ktorého úlohou bolo prechádzať<br />
jednotlivými kombináciami funkcionálov (testovaných<br />
bolo vyše 750 kombinácii) a vyhodnocovať ich<br />
účinnosť na základe výpočtu variancie charakteristikých<br />
čísiel v rámci každej triedy obrazov. Následne bola táto<br />
variancia porovnávaná s hodnotou variancie medzi<br />
jednotlivými triedami. Ak bola hodnota variancie v<br />
rámci každej triedy menšia ako 0,1 % variancie medzi<br />
jednotlivými triedami, kombinácia bola vyhodnotená<br />
ako použiteľná na rozlišovanie daného typu obrazov.<br />
Týmto spôsobom sa získalo asi 50 možných<br />
použiteľných kombinácií.<br />
Z nich sa vybral 4 nasledovné:<br />
- Eta : F6 R : F2 Trace : F1<br />
- Eta : F7 R : F2 Trace : F1<br />
- Eta : F7 R : F4 Trace : F2<br />
- Eta : F7 R : F2 Trace : F2<br />
V ďalšom skripte sa táto štvorica kombinácií<br />
funkcionálov použila už na množinu všetkých<br />
vstupných obrazov. Vstupom do skriptu bol obraz a<br />
informácia o mierke. Tak sa získal vektor 4<br />
charakteristických čísel pre každý vstupný obraz. Každé<br />
získané charakterisktcké číslo bolo normalizované<br />
podľa vzťahu (12). Hodnoty získaných<br />
charakteristických čísel sú uvedené v tabuľke č.3. Kvôli<br />
obmedzenému priestoru sú uvedené len charakteristické<br />
čísla pre referenčné obrazy. Charakteristické čísla pre<br />
modifikované obrazy však boli blízke charakteristickým<br />
číslam pre referenčné obrazy.<br />
Obr. 2. Základné obrazy použité na testovanie trace<br />
transformácie
sekcia: Meracia technika ŠVOČ 2007<br />
Tab. 3. Charakteristické čísla jednotlivých obrazov.<br />
Hodnoty charakteristických čísel pre referenčné obrazy<br />
a aj pre ich geometricky modifikované verzie sú<br />
graficky znázornené na obrázku č.4. Z grafu je vidieť,<br />
že podľa hodnoty charakteristického čísla je ľahko<br />
možné identifikovať, do ktorej triedy obraz patrí.<br />
Eta:F7 - R:F2 - Trace:F1<br />
Použitá kombinácia funkcionálov<br />
Obraz<br />
(Eta-R-Trace)<br />
F6-F2- F7-F2- F7-F4- F7-F2-<br />
F1 F1 F1 F2<br />
a 419.3 105.3 14.5 17.9<br />
b 517.8 461.9 63.2 134.1<br />
c 454.5 274.1 41.9 78.2<br />
d 499.1 334.9 56.6 104.5<br />
500<br />
450<br />
400<br />
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
jednotlivými triedami. Pre ukážku sú uvedené hodnoty<br />
rozptylov pre kombináciu funkcií:<br />
Eta:F6 – R:F2 – Trace:F1<br />
Rozptyl medzi triedami : 1906.441740<br />
Rozptyl v skupine kruh : 0.429789<br />
Rozptyl v skupine obdĺžnik: 0.361870<br />
Rozptyl v skupine štvorec : 6.424035<br />
Rozptyl v skupine trojuholník : 5.275809<br />
Ďalšie pokusy boli zamerané na problém<br />
s nepresnosťou, ktorá vzniká pri obrazoch pri väčšej<br />
zmene mierky. Najlepšie sa dokázala so zmenou mierky<br />
vysporiadať kombinácia funkcionálov :<br />
Eta : F6 R : F2 Trace : F1.<br />
Táto kombinácia funkcionálov dávala pre modifikované<br />
obrazy podobné charakteristické čísla až do rozmeru<br />
25% z veľkosti pôvodného obrazu.<br />
7. Experimenty na šedotónových obrazoch<br />
V nasledujúcom experimente sa počítali charakteristické<br />
čísla prostredníctvom trace transform pre zložitejšie<br />
šedotónové obrazy. Ako vstupné obrazy boli použité<br />
rôzne logá áut. Obrazy mali opäť rozmery 212 x 212<br />
pixelov a boli uložené vo formáte bmp ako greyscale. Z<br />
každého loga bolo vytvorených 6 rôznych<br />
geometrických modifikácií. Základné východiskové<br />
obrazy sú znázornené na obrázku č.5.<br />
50<br />
400 420 440 460 480 500 520<br />
Eta:F6 - R:F2 - Trace:F1<br />
150<br />
Eta:F7 - R:F2 - Trace:F2<br />
100<br />
50<br />
a) Alfa Romeo b) BMW<br />
0<br />
10 20 30 40 50 60 70 80<br />
Eta:F7 - R:F4 - Trace:F2<br />
Legenda:<br />
Štvorec Kruh Trojuholník Obdĺžnik<br />
c) Kia d) Land-Rover<br />
Obr. 4.Grafické znázornenie charakteristických čísel v<br />
2-rozmernom priestore.<br />
Správnosť zvolených kombinácií funkcionálov bola<br />
potvrdená výpočtom variancie v rámci každej triedy<br />
a porovnaním jej hodnoty s varianciou medzi<br />
e) Porsche f) Volkswagen<br />
Obr. 5.Použité obrazy - logá áut
sekcia: Meracia technika ŠVOČ 2007<br />
7.1. Výber vhodných kombinácií funkcionálov<br />
Trénovaciu množinu tvorili v tomto prípade trojice<br />
modifikovaných obrazov z každej triedy a-f. Kritériom<br />
výberu kombinácie funkcionálov bolo, aby bola hodnota<br />
variancie v rámci každej triedy obrazov menšia ako 5%<br />
z variancie medzi triedami. Kritérium spĺňalo 36<br />
kombinácií funkcionálov.<br />
7.2. Generovanie invariantných<br />
charakteristických čísel pomocou trace<br />
transformácie<br />
Na generovanie vektorov charakteristických čísel pre<br />
každý obraz bol použitý skript napísaný v Matlabe.<br />
V tabuľke č.4 sú uvedené charakteristické čísla pre<br />
základné obrazy a štyri zvolené kombinácie<br />
funkcionálov.<br />
Na obrázku č.6 sú výsledky aj pre ostatné obrazy<br />
znázornené graficky. Súradnice každého bodu sú dané<br />
hodnotou charakteristického čísla pre danú kombináciu<br />
funkcionálov.<br />
Tab. 4. Charakteristické čísla jednotlivých obrazov.<br />
Použitá kombinácia funkcionálov<br />
Obraz<br />
Eta-R-Trace (.10 4 )<br />
F1-F3- F6-F1- F4-F4- F4-F4-<br />
F1 F7 F10 F11<br />
a 1,305 0,095 0,080 0,076<br />
b 1,666 0,117 0,098 0,091<br />
c 0,865 0,078 0,057 0,053<br />
d 0,793 0,082 0,062 0,059<br />
e 1,448 0,121 0,095 0,088<br />
f 1,120 0,069 0,066 0,062<br />
Eta:F6 - R:F4 - Trace:F7<br />
140<br />
130<br />
120<br />
110<br />
100<br />
90<br />
0.6 0.8 1 1.2 1.4<br />
Eta:F6 - R:F1 - Trace:F7<br />
x 10 4<br />
Alfa Romeo BMW Kia<br />
Land Rover Porsche Volkswagen<br />
Obr. 5. Grafické znázornenie charakteristických čísel<br />
znakov áut v 2-rozmernom priestore pre 2<br />
rôzne kombinácie funkcionálov.<br />
8. Zatrieďovanie obrazov do tried<br />
Vstupom skriptu na zatrieďovanie obrazov do tried boli<br />
názvy obrazov a k nim prislúchajúce vektory<br />
charakteristických čísel. Systém pracoval na princípe<br />
lineárneho klasifikátora a rozhodovacím kritériom pre<br />
príslušnosť k danej triede bola vzdialenosť<br />
charakteristického čísla daného obrazu k<br />
charakteristickému číslu niektorého z referenčných<br />
obrazov. V prípade viacerých charakteristických čísel sa<br />
obraz priradil k tej triede, ku ktorej ho priradilo najviac<br />
kombinácií funkcionálov. Účinnosť rozpoznávania sa<br />
zvyšovala s rasúcim počtom charakteristických čísel<br />
každého obrazu až nakoniec dosiahla pre uvedenú<br />
skúšobnú vzorku 100%.<br />
8.1. Hľadanie modifikovaných obrazov<br />
Použitím funkcionálu citlivého na posunutie je možné<br />
dosiahnuť citlivosť celej transformácie na posunutie,<br />
rotáciu a zmenu mierky obrazu. Takto možno zo série<br />
obrazov vyhľadať tie, ktoré sa odlišujú od referenčného<br />
obrazu. V pokuse bol použitý referenčný obraz<br />
trojuholníka d) z obrázku č.3. Druhý porovnávaný obraz<br />
trojuholníka bol posunutý o 5 pixelov doprava. Na ich<br />
vzájomné odlíšenie bola požitá kombinácia<br />
funkcionálov: Eta:F7 – R:SF1 – Trace:F1.<br />
Výsledné charakteristické čísla boli nasledovné:<br />
Referenčný obraz trojuholníka: 5,727<br />
Posunutý obraz trojuholníka: 2,000<br />
Rozdiel charakteristických čísel sa so zväčšujúcimi<br />
modifikáciami dramaticky zvyšoval.<br />
9. Záver<br />
Z vlastností trace transformácie vyplýva, že je to metóda<br />
vhodná na rozpoznávanie obrazu podľa rôznych kritérií<br />
invariantnosti voči posunutiu, natočeniu a zmene mierky<br />
obrazu. Výpočtová náročnosť závisí predovšetkým od<br />
počtu a vzájomnej podobnosti jednotlivých tried<br />
obrazov a teda aj od množstva charakteristických čísel<br />
potrebných na efektívne rozpoznávanie tried.<br />
10. Odkazy na literatúru<br />
[1] Kadyrov, A., Petrou, M.: The Trace Transform and Its<br />
Applications, IEEE Transactions on Pattern Analysis and<br />
Machine Intelligence, Vol.23, No.8, pp. 811-828, August<br />
2001.<br />
[2] Turán Ján a spol., Acta Electrotechnica et Informatica No.<br />
3, Vol. 6, 2006, pp. 1-11<br />
[3] Petrou M. Kadyrov, A., The Trace Transform in a<br />
Nutshell,<br />
http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COP<br />
IES/PETROU2/trace.doc<br />
[4] Volauf P., Numerické a štatistické výpočty v Matlabe,<br />
<strong>Slovenská</strong> Technická Univerzita , 2005<br />
[5] Šonka M., Hlaváč V., Počítačové vidění, GRADA, 1992