30.11.2012 Views

CAPITOLUL 1.pdf

CAPITOLUL 1.pdf

CAPITOLUL 1.pdf

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

<strong>CAPITOLUL</strong> 1<br />

NOŢIUNI DE BAZĂ ÎN PRELUCRAREA<br />

NUMERICĂ A SEMNALELOR VIDEO<br />

Scopul acestui capitol este de a oferi cititorilor informaţiile de bază despre<br />

sistemele analogice şi digitale de prelucrare a semnalelor video şi despre problemele<br />

importante ce apar în aceste sisteme. Din acest motiv prezentarea are un caracter mai<br />

mult calitativ decât cantitativ. În capitolele următoare vom reveni asupra diferitelor<br />

probleme din acest capitol şi vom oferi descrieri şi soluţii mai riguroase.<br />

1.1 INTRODUCERE<br />

Prelucrarea numerică a imaginilor reprezintă un ansamblu de teorii şi tehnici<br />

folosite în înregistrarea, sinteza, codarea, transmiterea, reproducerea, recunoaşterea,<br />

estimarea, detecţia, filtrarea, îmbunătăţirea imaginilor digitale. Domeniile de<br />

aplicabilitate ale prelucrării digitale a imaginilor sunt: transmisiunile video, medicina,<br />

biologia, astronomia, industria, comunicaţiile, efectele speciale, educaţia la distanţă.<br />

Echipamentele de prelucrare a imaginilor realizează o serie de operaţii:<br />

• Achiziţia imaginilor realizată cu camera video sau scaner;<br />

• Prelucrarea imaginilor folosind calculatorul sau procesoare de semnal (DSP);<br />

• Memorarea imaginilor pe discuri optice, benzi magnetice;<br />

• Redarea imaginilor utilizând monitorul, televizorul, imprimanta;<br />

1<br />

Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

• Transmisia imaginilor pe diferite reţele de comunicaţii<br />

În marea majoritate a cazurilor informaţia pe care dorim să o prelucrăm şi să o<br />

transmitem este de natură analogică. Mai mult, informaţia este destinată într–o<br />

majoritate covârşitoare omului, deci aceasta trebuie redată sub formă analogică. Plecând<br />

de la imperfecţiunile simţurilor umane, mai întâi s–au creat standarde pentru<br />

prelucrarea şi transmiterea informaţiei sub formă analogică şi o dată cu tehnologia<br />

digitală, standarde privind conversia din analogic în digital şi invers, adăugând formate,<br />

coduri şi protocoale utilizate în reţele şi medii de stocare .<br />

1.2 VIDEO ANALOGIC<br />

Prima formă de transmitere a imaginii în mişcare a fost televiziunea. Odată cu<br />

aceasta s–au căutat şi găsit modalităţi de a folosi la maxim o lărgime de bandă în<br />

spectrul radio astfel încât la receptor imaginea să fie o redare cât mai fidelă a celei din<br />

cadrul transmis.<br />

Astfel, fiecare imagine completă este numită cadru. El se obţine prin explorarea<br />

linie cu linie a imaginii pe care vrem să o transmitem, realizând astfel o primă<br />

eşantionare, în timp. Aceste cadre trebuiesc transmise astfel încât discontinuităţile dintre<br />

ele să nu fie observate.<br />

Rata minimă, pentru care ochiul nu percepe caracterul discontinuu al cadrelor<br />

este de 50 Hz. La explorarea progresivă (Figura 1.1a) cadrul este redat linie după linie<br />

în ordine naturală. În schimb, la explorarea întreţesută (Figura 1.1b) fiecare cadru este<br />

împărţit în două câmpuri, furnizând astfel un echilibru între rezoluţia temporală şi cea<br />

verticală. În primul câmp sunt redate liniile cu număr impar iar în următorul cele cu<br />

număr par.<br />

2


Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

Figura 1.1 Explorarea imaginii a) progresivă; b) întreţesută<br />

Principalele sisteme de televiziune analogică folosite la ora actuală în lume sunt<br />

NTSC (National Television System Committee), folosit în America de Nord, America<br />

Centrala şi Japonia, PAL (Phase Alternating Lines), folosit in majoritatea ţărilor din<br />

Europa, Africa, Australia, America de Sud şi China, şi SECAM (Systeme Electronique<br />

Couleur Avec Memoire), folosit in Franţa, Rusia şi fostele ţări sovietice. În Tabelul 1.1<br />

sunt prezentate principalele caracteristici ale acestor sisteme de televiziune.<br />

Tabelul 1.1 Parametrii video standard<br />

Standarde TV NTSC PAL SECAM<br />

Imagini pe secundă 29,97 25 25<br />

Durata imaginii (ms) 33,37 40 40<br />

Linii pe imagine 525 625 625<br />

Raport de aspect 4:3 4:3 4:3<br />

Întreţesere 2:1 2:1 2:1<br />

Durata liniei (µs) 63,56 64 64<br />

Televiziunea digitală introduce eşantionarea şi pe linii făcând legătura dintre<br />

standardele de televiziune şi cele folosite la redarea pe ecranele monitoarelor<br />

calculatoarelor personale, unde se utilizează explorarea progresivă. Legătura dintre<br />

rezoluţia pe orizontală, banda video şi rata cadrelor este dată de relaţia (1.1).<br />

3<br />

Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

BW<br />

1 ( FR)(<br />

NL)(<br />

HR)<br />

= (1.1)<br />

2<br />

BW = banda video,<br />

FR = rata cadrelor,<br />

NL = numărul de linii/cadru,<br />

HR = rezoluţia pe orizontală,<br />

ρ = partea de timp alocată semnalului video activ dintr–o linie.<br />

Se poate obţine astfel rezoluţia necesară la conversia anumitor standarde de<br />

televiziune.<br />

Exemplu:<br />

Fie un semnal NTSC cu ρ =53.5/63.5=0.84 şi BW = 4.2 MHz.<br />

Atunci Rata liniilor = (FR)(NL) = 29.97 × 525 = 15734 linii/s şi<br />

HR =<br />

6<br />

2 × 4.<br />

2 × 10 × 0.<br />

84<br />

= 448 pixeli<br />

15734<br />

Achiziţia video analogica a datelor se poate face cu camere de luat vederi<br />

electronice bazate pe matrice CCD (Charge-Coupled Device) şi camere de filmat clasice<br />

cu tub vidicon, urmând un proces de cuantizare şi codare, transmitere sau stocare.<br />

ρ<br />

1.3 VIDEO DIGITAL<br />

Dezvoltarea tehnologiei de integrare pe scară largă a facilitat trecerea de la<br />

tehnica analogică la cea digitală. S-au făcut progrese imense în domenii cum ar fi<br />

comunicaţiile informaţionale digitale (reţele de calculatoare, e-mail), audio digital (CD<br />

player, telefonie digitală, compresia semnalelor audio), dar şi în domeniul prelucrării<br />

video digitale.<br />

Procesarea video digitală este un domeniu aflat încă la începuturi, dar care are o<br />

aplicabilitate tot mai mare. Aplicaţiile video digitale folosite sau încă în lucru sunt<br />

comunicaţiile în timp real (videoconferinţa/videofonul în ISDN, comunicaţiile video în<br />

reţelele de bandă largă ATM), televiziunea digitala, televiziunea de înaltă rezoluţie<br />

4


Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

(HDTV), aplicaţii multimedia PC (Compact Disk Interactive (CD-I), Digital Video<br />

Interactive (DVI), VideoCD, Digital Video Disk (DVD) ) şi Packet Video (standardele<br />

de compresie MPEG-1,2,4).<br />

Odata cu aplicaţiile video digitale apar însă şi debite mari de date. Prezentăm în<br />

continuare datele brute pentru audio şi video digital:<br />

- calitatea audio digitală a CD-ului: 44kHz rată de eşantionare × 16biţi/eşantion,<br />

rezultă un flux de aproximativ 700 kbps<br />

- video de înaltă definiţie: 1280 peli × 720 linii luminanţă, 640 peli × 360 linii<br />

chrominanţă × 60 cadre/s × 8 biţi/pel/canal, rezultă aproximativ 663.5 Mbps<br />

În continuare prezentăm câteva standarde video digitale de studio:<br />

Tabelul 1.2 Standarde video digital de studio<br />

ITU-R 601 ITU-R 601<br />

525/60 625/50 CIF (H.261)<br />

NTSC PAL/SECAM<br />

Număr de pixeli activi/linie<br />

Luminanţa (Y)<br />

720<br />

720<br />

360<br />

Crominanţa (U,V)<br />

Număr de linii active/imagine<br />

360<br />

360<br />

180<br />

Luminanţa (Y)<br />

480<br />

576<br />

288<br />

Crominanţa (U,V)<br />

480<br />

576<br />

144<br />

Întreţesere 2:1 2:1 1:1<br />

Rată temporală 60 50 30<br />

Factor de aspect 4:3 4:3 4:3<br />

Rate brute de date (Mbps) 165.9 165.9 37.3<br />

Reţelele de acces disponibile în acest moment pentru traficul de date şi fluxurile<br />

de date maxime pe care le permit, sunt enumerate în tabelul 1.3:<br />

5<br />

Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

Tabelul 1.3 Reţele de acces<br />

Reţea de acces Flux de date maxim<br />

Modem telefonic convenţional 28.8 kbps<br />

ISDN (Integrated Services Digital Network) 64-144 kbps (px64)<br />

T-1 (Trunk Level 1) 1,5 Mbps<br />

T-3 (Trunk Level 3) 45 Mbps<br />

ADSL (Asymetric Digital Subscriber Line) 1.5-6 Mbps în jos (downstream)<br />

Modem de cablu 30 Mbps în jos<br />

Ethernet (reţea locala cu transfer de pachete IP) 10 Mbps<br />

Fibră B-ISDN/ATM 55-200 Mbps<br />

Din tabelul 1.2 şi 1.3 se observă că fluxurile brute de date în cazul imaginilor în<br />

mişcare sunt foarte mari în comparaţie cu fluxurile de date maxime din sistemele de<br />

transmisiune folosite la ora actuala, ceea ce duce la ideea folosirii tehnicilor de<br />

compresie pentru obţinerea unor fluxuri de date mai scăzute, ce pot fi folosite în<br />

transmisiunile actuale. Cele mai importante astfel de standarde de compresie şi<br />

domeniile lor de aplicabilitate sunt:<br />

• CCITT G3/G4 (standarde CCITT grup 3, respectiv 4) - folosite pentru<br />

compresia imaginilor binare (non-adaptivă); codează imaginea sursa linie cu linie<br />

• JBIG (Joint Bi-level Image experts Group) - standard de compresie fără pierderi<br />

folosit pentru imagini binare, ce oferă o rata de compresie de maxim 20:1<br />

• JPEG (Joint Picture expert Group) - standardul de compresie pentru imagini cu<br />

noanţe de gri şi color cel mai folosit la ora actuala; ofera rate de compresie de la<br />

5:1 la 50:1<br />

• JPEG2000 - standard de compresia a imaginilor cu nuanţe de gri şi color derivat<br />

din JPEG, care foloseşte compresia bazată pe wavelet şi oferă imagini de calitate<br />

foarte bună şi rate de compresie foarte mari de până la 300:1<br />

6


Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

• H.261 - standard de codare video folosit în aplicaţii ISDN cu flux de date<br />

multiplu de 64kbps (numit şi p×64 kbps); oferă rate de compresie de la 25:1 la<br />

100:1<br />

• H.263 – standard de compresie video iniţial pentru aplicaţii PSTN (mai puţin de<br />

64 kbps), dar actual şi pentru fluxuri de date mai mari; urmează să înlocuiască<br />

standardul H.261; are rate de compresie cuprinse între 6:1 şi 140:1<br />

• MPEG-1 (Motion Picture Expert Group) – standard de compresie a imaginilor în<br />

mişcare şi a sunetului asociat pentru stocare pe medii digitale cu rată de bit de<br />

până la aproximativ 1,5 Mbps<br />

• MPEG-2 – îmbunătăţire a standardului MPEG-1 ce foloseşte codarea generică<br />

(4-20 Mbps)<br />

• MPEG-4 – o nouă îmbunătăţire a standardului MPEG cu codare bazată pe<br />

obiecte<br />

Având acum o imagine de ansamblu asupra sistemelor video analogice şi<br />

digitale, putem face o comparaţie între ele:<br />

• Reprezentarea digitală este robustă; corecţia erorilor minimizează efectul<br />

distorsiunilor din mediile de transmisie/stocare, efectul zgomotului şi a altor<br />

degradări.<br />

• Informaţia video digitală poate fi transmisă cu lărgime de bandă mai mică decât<br />

aceeaşi informaţie în formă analogică, de aceeaşi calitate, folosind compresia<br />

digitala<br />

• Sistemele video digitale pot fi aplicate cu succes în domenii ca multimedia,<br />

televiziune şi comunicaţii în timp real (videofon şi videoconferinţă) într-o<br />

arhitectură unificată.<br />

• Informaţia video digitală dovedeşte flexibilitate în procesarea semnalului pentru<br />

îmbunătăţire, conversia standardelor, compunerea imaginilor, efecte speciale,<br />

editare neliniară, etc.<br />

7<br />

Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

În comparaţie cu procesarea imaginilor statice, procesarea video foloseşte în<br />

plus şi alte tehnici:<br />

• Unele sarcini, cum ar fi estimarea mişcării sau analiza unei scene variabile în<br />

timp nu poate fi făcută pe baza unei singure imagini.<br />

• Utilizarea redundanţei temporale care există în mod natural într-o secvenţă de<br />

imagini pentru a dezvolta algoritmi eficienţi:<br />

- filtrare compensată de mişcare<br />

- predicţie compensată de mişcare<br />

Domeniul video digital este în continuă dezvoltare. Provocările în acest<br />

domeniu sunt analiza mişcării (estimarea şi segmentarea mişcării bidimensionale,<br />

mişcarea tridimensionala, estimarea structurii şi segmentarea ei, urmărirea obiectelor în<br />

imagine, ocluzie, deformare), filtrarea şi conversia standardelor (înlăturarea înceţoşării<br />

imaginii (deblurring), filtrarea zgomotului, ascuţirea marginilor, conversia frecvenţei<br />

cadrelor şi dezîntreţeserea, mărirea rezoluţiei), compresia (JPEG, H.261/H.263, MPEG<br />

1,2,4,7, codarea subbandă (Wavelet) şi codarea bazată pe model), etc. O parte din<br />

aceste aspecte vor fi discutate în capitolele următoare.<br />

1.4 SEMNALE ŞI SISTEME BIDIMENSIONALE<br />

În continuare vor fi discutate pe scurt câteva aspecte legate de semnalele şi<br />

sistemele bidimensionale şi vor fi explicaţi termenii cei mai importanţi folosiţi.<br />

Semnalele bidimensionale reprezintă modelarea matematică a distribuţiilor de<br />

intensitate luminoasă dintr–un spaţiu. Aceste semnale pot fi: continue, discrete sau<br />

mixte.<br />

Un semnal continuu se modelează ca o funcţie de două variabile independente<br />

pe o mulţime continuă de valori. Un semnal discret se modelează ca o funcţie definită<br />

doar pe o mulţime finită de valori. Un semnal mixt este un semnal bidimensional<br />

modelat ca o funcţie de variabile continue şi discrete.<br />

8


Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />

În prezent având în vedere tehnicile de eşantionare, cuantizare şi codare şi<br />

dezvoltarea integrării pe scară largă a circuitelor digitale, prelucrarea, transmisia şi<br />

stocarea sunt preponderent în format digital.<br />

Un semnal discret bidimensional este modelat de o funcţie ( 1 , n2<br />

) n s definită pe<br />

un set de perechi de forma s { s(<br />

n , n ) , −∞ < n , n < ∞}<br />

astfel încât<br />

= 1 2<br />

1 2<br />

s : Z × Z → R ( sauC)<br />

. Un element din această mulţime este numit eşantion, acesta<br />

putând avea valori reale sau complexe. În cazuri practice o astfel de mulţime are valori<br />

cunoscute ale eşantioanelor doar într–o regiune finită a planului ( n 1 , n2<br />

) . Planul<br />

determinat de ( n 1, n2<br />

) se numeşte regiune suport a semnalului. Secvenţele<br />

bidimensionale pot fi periodice pe fiecare direcţie în parte sau pe ambele direcţii<br />

simultan.<br />

Un sistem bidimensional poate fi încadrat într-una din categoriile:<br />

• Sisteme liniare (SL): Dacă răspunsul la impulsul variabil în spaţiu este cunoscut<br />

pentru fiecare eşantion ( n 1 , n2<br />

) , răspunsul sistemului liniar la orice alt semnal de<br />

intrare poate fi găsit prin superpoziţie;<br />

• Sisteme invariate la deplasare (SID): Un sistem invariant la deplasare este un sistem<br />

pentru care o deplasare a secvenţei de intrare implică o deplasare a secvenţei de<br />

ieşire;<br />

• Sisteme liniare şi invariante la deplasare (SLID);<br />

• Sisteme separabile: sunt sisteme SLID al căror răspuns la impuls este o secvenţă<br />

separabilă de forma h ( n1<br />

, n2<br />

) = h1<br />

( n1)<br />

h2<br />

( n2<br />

) unde ( 1, 2 ) n n h este funcţia pondere a<br />

sistemului 2–D.<br />

9

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!