CAPITOLUL 1.pdf
CAPITOLUL 1.pdf
CAPITOLUL 1.pdf
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
<strong>CAPITOLUL</strong> 1<br />
NOŢIUNI DE BAZĂ ÎN PRELUCRAREA<br />
NUMERICĂ A SEMNALELOR VIDEO<br />
Scopul acestui capitol este de a oferi cititorilor informaţiile de bază despre<br />
sistemele analogice şi digitale de prelucrare a semnalelor video şi despre problemele<br />
importante ce apar în aceste sisteme. Din acest motiv prezentarea are un caracter mai<br />
mult calitativ decât cantitativ. În capitolele următoare vom reveni asupra diferitelor<br />
probleme din acest capitol şi vom oferi descrieri şi soluţii mai riguroase.<br />
1.1 INTRODUCERE<br />
Prelucrarea numerică a imaginilor reprezintă un ansamblu de teorii şi tehnici<br />
folosite în înregistrarea, sinteza, codarea, transmiterea, reproducerea, recunoaşterea,<br />
estimarea, detecţia, filtrarea, îmbunătăţirea imaginilor digitale. Domeniile de<br />
aplicabilitate ale prelucrării digitale a imaginilor sunt: transmisiunile video, medicina,<br />
biologia, astronomia, industria, comunicaţiile, efectele speciale, educaţia la distanţă.<br />
Echipamentele de prelucrare a imaginilor realizează o serie de operaţii:<br />
• Achiziţia imaginilor realizată cu camera video sau scaner;<br />
• Prelucrarea imaginilor folosind calculatorul sau procesoare de semnal (DSP);<br />
• Memorarea imaginilor pe discuri optice, benzi magnetice;<br />
• Redarea imaginilor utilizând monitorul, televizorul, imprimanta;<br />
1<br />
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
• Transmisia imaginilor pe diferite reţele de comunicaţii<br />
În marea majoritate a cazurilor informaţia pe care dorim să o prelucrăm şi să o<br />
transmitem este de natură analogică. Mai mult, informaţia este destinată într–o<br />
majoritate covârşitoare omului, deci aceasta trebuie redată sub formă analogică. Plecând<br />
de la imperfecţiunile simţurilor umane, mai întâi s–au creat standarde pentru<br />
prelucrarea şi transmiterea informaţiei sub formă analogică şi o dată cu tehnologia<br />
digitală, standarde privind conversia din analogic în digital şi invers, adăugând formate,<br />
coduri şi protocoale utilizate în reţele şi medii de stocare .<br />
1.2 VIDEO ANALOGIC<br />
Prima formă de transmitere a imaginii în mişcare a fost televiziunea. Odată cu<br />
aceasta s–au căutat şi găsit modalităţi de a folosi la maxim o lărgime de bandă în<br />
spectrul radio astfel încât la receptor imaginea să fie o redare cât mai fidelă a celei din<br />
cadrul transmis.<br />
Astfel, fiecare imagine completă este numită cadru. El se obţine prin explorarea<br />
linie cu linie a imaginii pe care vrem să o transmitem, realizând astfel o primă<br />
eşantionare, în timp. Aceste cadre trebuiesc transmise astfel încât discontinuităţile dintre<br />
ele să nu fie observate.<br />
Rata minimă, pentru care ochiul nu percepe caracterul discontinuu al cadrelor<br />
este de 50 Hz. La explorarea progresivă (Figura 1.1a) cadrul este redat linie după linie<br />
în ordine naturală. În schimb, la explorarea întreţesută (Figura 1.1b) fiecare cadru este<br />
împărţit în două câmpuri, furnizând astfel un echilibru între rezoluţia temporală şi cea<br />
verticală. În primul câmp sunt redate liniile cu număr impar iar în următorul cele cu<br />
număr par.<br />
2
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
Figura 1.1 Explorarea imaginii a) progresivă; b) întreţesută<br />
Principalele sisteme de televiziune analogică folosite la ora actuală în lume sunt<br />
NTSC (National Television System Committee), folosit în America de Nord, America<br />
Centrala şi Japonia, PAL (Phase Alternating Lines), folosit in majoritatea ţărilor din<br />
Europa, Africa, Australia, America de Sud şi China, şi SECAM (Systeme Electronique<br />
Couleur Avec Memoire), folosit in Franţa, Rusia şi fostele ţări sovietice. În Tabelul 1.1<br />
sunt prezentate principalele caracteristici ale acestor sisteme de televiziune.<br />
Tabelul 1.1 Parametrii video standard<br />
Standarde TV NTSC PAL SECAM<br />
Imagini pe secundă 29,97 25 25<br />
Durata imaginii (ms) 33,37 40 40<br />
Linii pe imagine 525 625 625<br />
Raport de aspect 4:3 4:3 4:3<br />
Întreţesere 2:1 2:1 2:1<br />
Durata liniei (µs) 63,56 64 64<br />
Televiziunea digitală introduce eşantionarea şi pe linii făcând legătura dintre<br />
standardele de televiziune şi cele folosite la redarea pe ecranele monitoarelor<br />
calculatoarelor personale, unde se utilizează explorarea progresivă. Legătura dintre<br />
rezoluţia pe orizontală, banda video şi rata cadrelor este dată de relaţia (1.1).<br />
3<br />
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
BW<br />
1 ( FR)(<br />
NL)(<br />
HR)<br />
= (1.1)<br />
2<br />
BW = banda video,<br />
FR = rata cadrelor,<br />
NL = numărul de linii/cadru,<br />
HR = rezoluţia pe orizontală,<br />
ρ = partea de timp alocată semnalului video activ dintr–o linie.<br />
Se poate obţine astfel rezoluţia necesară la conversia anumitor standarde de<br />
televiziune.<br />
Exemplu:<br />
Fie un semnal NTSC cu ρ =53.5/63.5=0.84 şi BW = 4.2 MHz.<br />
Atunci Rata liniilor = (FR)(NL) = 29.97 × 525 = 15734 linii/s şi<br />
HR =<br />
6<br />
2 × 4.<br />
2 × 10 × 0.<br />
84<br />
= 448 pixeli<br />
15734<br />
Achiziţia video analogica a datelor se poate face cu camere de luat vederi<br />
electronice bazate pe matrice CCD (Charge-Coupled Device) şi camere de filmat clasice<br />
cu tub vidicon, urmând un proces de cuantizare şi codare, transmitere sau stocare.<br />
ρ<br />
1.3 VIDEO DIGITAL<br />
Dezvoltarea tehnologiei de integrare pe scară largă a facilitat trecerea de la<br />
tehnica analogică la cea digitală. S-au făcut progrese imense în domenii cum ar fi<br />
comunicaţiile informaţionale digitale (reţele de calculatoare, e-mail), audio digital (CD<br />
player, telefonie digitală, compresia semnalelor audio), dar şi în domeniul prelucrării<br />
video digitale.<br />
Procesarea video digitală este un domeniu aflat încă la începuturi, dar care are o<br />
aplicabilitate tot mai mare. Aplicaţiile video digitale folosite sau încă în lucru sunt<br />
comunicaţiile în timp real (videoconferinţa/videofonul în ISDN, comunicaţiile video în<br />
reţelele de bandă largă ATM), televiziunea digitala, televiziunea de înaltă rezoluţie<br />
4
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
(HDTV), aplicaţii multimedia PC (Compact Disk Interactive (CD-I), Digital Video<br />
Interactive (DVI), VideoCD, Digital Video Disk (DVD) ) şi Packet Video (standardele<br />
de compresie MPEG-1,2,4).<br />
Odata cu aplicaţiile video digitale apar însă şi debite mari de date. Prezentăm în<br />
continuare datele brute pentru audio şi video digital:<br />
- calitatea audio digitală a CD-ului: 44kHz rată de eşantionare × 16biţi/eşantion,<br />
rezultă un flux de aproximativ 700 kbps<br />
- video de înaltă definiţie: 1280 peli × 720 linii luminanţă, 640 peli × 360 linii<br />
chrominanţă × 60 cadre/s × 8 biţi/pel/canal, rezultă aproximativ 663.5 Mbps<br />
În continuare prezentăm câteva standarde video digitale de studio:<br />
Tabelul 1.2 Standarde video digital de studio<br />
ITU-R 601 ITU-R 601<br />
525/60 625/50 CIF (H.261)<br />
NTSC PAL/SECAM<br />
Număr de pixeli activi/linie<br />
Luminanţa (Y)<br />
720<br />
720<br />
360<br />
Crominanţa (U,V)<br />
Număr de linii active/imagine<br />
360<br />
360<br />
180<br />
Luminanţa (Y)<br />
480<br />
576<br />
288<br />
Crominanţa (U,V)<br />
480<br />
576<br />
144<br />
Întreţesere 2:1 2:1 1:1<br />
Rată temporală 60 50 30<br />
Factor de aspect 4:3 4:3 4:3<br />
Rate brute de date (Mbps) 165.9 165.9 37.3<br />
Reţelele de acces disponibile în acest moment pentru traficul de date şi fluxurile<br />
de date maxime pe care le permit, sunt enumerate în tabelul 1.3:<br />
5<br />
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
Tabelul 1.3 Reţele de acces<br />
Reţea de acces Flux de date maxim<br />
Modem telefonic convenţional 28.8 kbps<br />
ISDN (Integrated Services Digital Network) 64-144 kbps (px64)<br />
T-1 (Trunk Level 1) 1,5 Mbps<br />
T-3 (Trunk Level 3) 45 Mbps<br />
ADSL (Asymetric Digital Subscriber Line) 1.5-6 Mbps în jos (downstream)<br />
Modem de cablu 30 Mbps în jos<br />
Ethernet (reţea locala cu transfer de pachete IP) 10 Mbps<br />
Fibră B-ISDN/ATM 55-200 Mbps<br />
Din tabelul 1.2 şi 1.3 se observă că fluxurile brute de date în cazul imaginilor în<br />
mişcare sunt foarte mari în comparaţie cu fluxurile de date maxime din sistemele de<br />
transmisiune folosite la ora actuala, ceea ce duce la ideea folosirii tehnicilor de<br />
compresie pentru obţinerea unor fluxuri de date mai scăzute, ce pot fi folosite în<br />
transmisiunile actuale. Cele mai importante astfel de standarde de compresie şi<br />
domeniile lor de aplicabilitate sunt:<br />
• CCITT G3/G4 (standarde CCITT grup 3, respectiv 4) - folosite pentru<br />
compresia imaginilor binare (non-adaptivă); codează imaginea sursa linie cu linie<br />
• JBIG (Joint Bi-level Image experts Group) - standard de compresie fără pierderi<br />
folosit pentru imagini binare, ce oferă o rata de compresie de maxim 20:1<br />
• JPEG (Joint Picture expert Group) - standardul de compresie pentru imagini cu<br />
noanţe de gri şi color cel mai folosit la ora actuala; ofera rate de compresie de la<br />
5:1 la 50:1<br />
• JPEG2000 - standard de compresia a imaginilor cu nuanţe de gri şi color derivat<br />
din JPEG, care foloseşte compresia bazată pe wavelet şi oferă imagini de calitate<br />
foarte bună şi rate de compresie foarte mari de până la 300:1<br />
6
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
• H.261 - standard de codare video folosit în aplicaţii ISDN cu flux de date<br />
multiplu de 64kbps (numit şi p×64 kbps); oferă rate de compresie de la 25:1 la<br />
100:1<br />
• H.263 – standard de compresie video iniţial pentru aplicaţii PSTN (mai puţin de<br />
64 kbps), dar actual şi pentru fluxuri de date mai mari; urmează să înlocuiască<br />
standardul H.261; are rate de compresie cuprinse între 6:1 şi 140:1<br />
• MPEG-1 (Motion Picture Expert Group) – standard de compresie a imaginilor în<br />
mişcare şi a sunetului asociat pentru stocare pe medii digitale cu rată de bit de<br />
până la aproximativ 1,5 Mbps<br />
• MPEG-2 – îmbunătăţire a standardului MPEG-1 ce foloseşte codarea generică<br />
(4-20 Mbps)<br />
• MPEG-4 – o nouă îmbunătăţire a standardului MPEG cu codare bazată pe<br />
obiecte<br />
Având acum o imagine de ansamblu asupra sistemelor video analogice şi<br />
digitale, putem face o comparaţie între ele:<br />
• Reprezentarea digitală este robustă; corecţia erorilor minimizează efectul<br />
distorsiunilor din mediile de transmisie/stocare, efectul zgomotului şi a altor<br />
degradări.<br />
• Informaţia video digitală poate fi transmisă cu lărgime de bandă mai mică decât<br />
aceeaşi informaţie în formă analogică, de aceeaşi calitate, folosind compresia<br />
digitala<br />
• Sistemele video digitale pot fi aplicate cu succes în domenii ca multimedia,<br />
televiziune şi comunicaţii în timp real (videofon şi videoconferinţă) într-o<br />
arhitectură unificată.<br />
• Informaţia video digitală dovedeşte flexibilitate în procesarea semnalului pentru<br />
îmbunătăţire, conversia standardelor, compunerea imaginilor, efecte speciale,<br />
editare neliniară, etc.<br />
7<br />
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
În comparaţie cu procesarea imaginilor statice, procesarea video foloseşte în<br />
plus şi alte tehnici:<br />
• Unele sarcini, cum ar fi estimarea mişcării sau analiza unei scene variabile în<br />
timp nu poate fi făcută pe baza unei singure imagini.<br />
• Utilizarea redundanţei temporale care există în mod natural într-o secvenţă de<br />
imagini pentru a dezvolta algoritmi eficienţi:<br />
- filtrare compensată de mişcare<br />
- predicţie compensată de mişcare<br />
Domeniul video digital este în continuă dezvoltare. Provocările în acest<br />
domeniu sunt analiza mişcării (estimarea şi segmentarea mişcării bidimensionale,<br />
mişcarea tridimensionala, estimarea structurii şi segmentarea ei, urmărirea obiectelor în<br />
imagine, ocluzie, deformare), filtrarea şi conversia standardelor (înlăturarea înceţoşării<br />
imaginii (deblurring), filtrarea zgomotului, ascuţirea marginilor, conversia frecvenţei<br />
cadrelor şi dezîntreţeserea, mărirea rezoluţiei), compresia (JPEG, H.261/H.263, MPEG<br />
1,2,4,7, codarea subbandă (Wavelet) şi codarea bazată pe model), etc. O parte din<br />
aceste aspecte vor fi discutate în capitolele următoare.<br />
1.4 SEMNALE ŞI SISTEME BIDIMENSIONALE<br />
În continuare vor fi discutate pe scurt câteva aspecte legate de semnalele şi<br />
sistemele bidimensionale şi vor fi explicaţi termenii cei mai importanţi folosiţi.<br />
Semnalele bidimensionale reprezintă modelarea matematică a distribuţiilor de<br />
intensitate luminoasă dintr–un spaţiu. Aceste semnale pot fi: continue, discrete sau<br />
mixte.<br />
Un semnal continuu se modelează ca o funcţie de două variabile independente<br />
pe o mulţime continuă de valori. Un semnal discret se modelează ca o funcţie definită<br />
doar pe o mulţime finită de valori. Un semnal mixt este un semnal bidimensional<br />
modelat ca o funcţie de variabile continue şi discrete.<br />
8
Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video<br />
În prezent având în vedere tehnicile de eşantionare, cuantizare şi codare şi<br />
dezvoltarea integrării pe scară largă a circuitelor digitale, prelucrarea, transmisia şi<br />
stocarea sunt preponderent în format digital.<br />
Un semnal discret bidimensional este modelat de o funcţie ( 1 , n2<br />
) n s definită pe<br />
un set de perechi de forma s { s(<br />
n , n ) , −∞ < n , n < ∞}<br />
astfel încât<br />
= 1 2<br />
1 2<br />
s : Z × Z → R ( sauC)<br />
. Un element din această mulţime este numit eşantion, acesta<br />
putând avea valori reale sau complexe. În cazuri practice o astfel de mulţime are valori<br />
cunoscute ale eşantioanelor doar într–o regiune finită a planului ( n 1 , n2<br />
) . Planul<br />
determinat de ( n 1, n2<br />
) se numeşte regiune suport a semnalului. Secvenţele<br />
bidimensionale pot fi periodice pe fiecare direcţie în parte sau pe ambele direcţii<br />
simultan.<br />
Un sistem bidimensional poate fi încadrat într-una din categoriile:<br />
• Sisteme liniare (SL): Dacă răspunsul la impulsul variabil în spaţiu este cunoscut<br />
pentru fiecare eşantion ( n 1 , n2<br />
) , răspunsul sistemului liniar la orice alt semnal de<br />
intrare poate fi găsit prin superpoziţie;<br />
• Sisteme invariate la deplasare (SID): Un sistem invariant la deplasare este un sistem<br />
pentru care o deplasare a secvenţei de intrare implică o deplasare a secvenţei de<br />
ieşire;<br />
• Sisteme liniare şi invariante la deplasare (SLID);<br />
• Sisteme separabile: sunt sisteme SLID al căror răspuns la impuls este o secvenţă<br />
separabilă de forma h ( n1<br />
, n2<br />
) = h1<br />
( n1)<br />
h2<br />
( n2<br />
) unde ( 1, 2 ) n n h este funcţia pondere a<br />
sistemului 2–D.<br />
9