CAPITOLUL 1.pdf

Capitolul 1 – Noţiuni de bază în prelucrarea numerică a semnalelor video 

CAPITOLUL 1 

NOŢIUNI DE BAZĂ ÎN PRELUCRAREA 

NUMERICĂ A SEMNALELOR VIDEO 

Scopul acestui capitol este de a oferi cititorilor informaţiile de bază despre 

sistemele analogice şi digitale de prelucrare a semnalelor video şi despre problemele 

importante ce apar în aceste sisteme. Din acest motiv prezentarea are un caracter mai 

mult calitativ decât cantitativ. În capitolele următoare vom reveni asupra diferitelor 

probleme din acest capitol şi vom oferi descrieri şi soluţii mai riguroase. 

1.1 INTRODUCERE 

Prelucrarea numerică a imaginilor reprezintă un ansamblu de teorii şi tehnici 

folosite în înregistrarea, sinteza, codarea, transmiterea, reproducerea, recunoaşterea, 

estimarea, detecţia, filtrarea, îmbunătăţirea imaginilor digitale. Domeniile de 

aplicabilitate ale prelucrării digitale a imaginilor sunt: transmisiunile video, medicina, 

biologia, astronomia, industria, comunicaţiile, efectele speciale, educaţia la distanţă. 

Echipamentele de prelucrare a imaginilor realizează o serie de operaţii: 

• Achiziţia imaginilor realizată cu camera video sau scaner; 

• Prelucrarea imaginilor folosind calculatorul sau procesoare de semnal (DSP); 

• Memorarea imaginilor pe discuri optice, benzi magnetice; 

• Redarea imaginilor utilizând monitorul, televizorul, imprimanta; 

1 


• Transmisia imaginilor pe diferite reţele de comunicaţii 

În marea majoritate a cazurilor informaţia pe care dorim să o prelucrăm şi să o 

transmitem este de natură analogică. Mai mult, informaţia este destinată într–o 

majoritate covârşitoare omului, deci aceasta trebuie redată sub formă analogică. Plecând 

de la imperfecţiunile simţurilor umane, mai întâi s–au creat standarde pentru 

prelucrarea şi transmiterea informaţiei sub formă analogică şi o dată cu tehnologia 

digitală, standarde privind conversia din analogic în digital şi invers, adăugând formate, 

coduri şi protocoale utilizate în reţele şi medii de stocare . 

1.2 VIDEO ANALOGIC 

Prima formă de transmitere a imaginii în mişcare a fost televiziunea. Odată cu 

aceasta s–au căutat şi găsit modalităţi de a folosi la maxim o lărgime de bandă în 

spectrul radio astfel încât la receptor imaginea să fie o redare cât mai fidelă a celei din 

cadrul transmis. 

Astfel, fiecare imagine completă este numită cadru. El se obţine prin explorarea 

linie cu linie a imaginii pe care vrem să o transmitem, realizând astfel o primă 

eşantionare, în timp. Aceste cadre trebuiesc transmise astfel încât discontinuităţile dintre 

ele să nu fie observate. 

Rata minimă, pentru care ochiul nu percepe caracterul discontinuu al cadrelor 

este de 50 Hz. La explorarea progresivă (Figura 1.1a) cadrul este redat linie după linie 

în ordine naturală. În schimb, la explorarea întreţesută (Figura 1.1b) fiecare cadru este 

împărţit în două câmpuri, furnizând astfel un echilibru între rezoluţia temporală şi cea 

verticală. În primul câmp sunt redate liniile cu număr impar iar în următorul cele cu 

număr par. 

2


Figura 1.1 Explorarea imaginii a) progresivă; b) întreţesută 

Principalele sisteme de televiziune analogică folosite la ora actuală în lume sunt 

NTSC (National Television System Committee), folosit în America de Nord, America 

Centrala şi Japonia, PAL (Phase Alternating Lines), folosit in majoritatea ţărilor din 

Europa, Africa, Australia, America de Sud şi China, şi SECAM (Systeme Electronique 

Couleur Avec Memoire), folosit in Franţa, Rusia şi fostele ţări sovietice. În Tabelul 1.1 

sunt prezentate principalele caracteristici ale acestor sisteme de televiziune. 

Tabelul 1.1 Parametrii video standard 

Standarde TV NTSC PAL SECAM 

Imagini pe secundă 29,97 25 25 

Durata imaginii (ms) 33,37 40 40 

Linii pe imagine 525 625 625 

Raport de aspect 4:3 4:3 4:3 

Întreţesere 2:1 2:1 2:1 

Durata liniei (µs) 63,56 64 64 

Televiziunea digitală introduce eşantionarea şi pe linii făcând legătura dintre 

standardele de televiziune şi cele folosite la redarea pe ecranele monitoarelor 

calculatoarelor personale, unde se utilizează explorarea progresivă. Legătura dintre 

rezoluţia pe orizontală, banda video şi rata cadrelor este dată de relaţia (1.1). 

3 


BW 

1 ( FR)( 

NL)( 

HR) 

= (1.1) 

2 

BW = banda video, 

FR = rata cadrelor, 

NL = numărul de linii/cadru, 

HR = rezoluţia pe orizontală, 

ρ = partea de timp alocată semnalului video activ dintr–o linie. 

Se poate obţine astfel rezoluţia necesară la conversia anumitor standarde de 

televiziune. 

Exemplu: 

Fie un semnal NTSC cu ρ =53.5/63.5=0.84 şi BW = 4.2 MHz. 

Atunci Rata liniilor = (FR)(NL) = 29.97 × 525 = 15734 linii/s şi 

HR = 

6 

2 × 4. 

2 × 10 × 0. 

84 

= 448 pixeli 

15734 

Achiziţia video analogica a datelor se poate face cu camere de luat vederi 

electronice bazate pe matrice CCD (Charge-Coupled Device) şi camere de filmat clasice 

cu tub vidicon, urmând un proces de cuantizare şi codare, transmitere sau stocare. 

ρ 

1.3 VIDEO DIGITAL 

Dezvoltarea tehnologiei de integrare pe scară largă a facilitat trecerea de la 

tehnica analogică la cea digitală. S-au făcut progrese imense în domenii cum ar fi 

comunicaţiile informaţionale digitale (reţele de calculatoare, e-mail), audio digital (CD 

player, telefonie digitală, compresia semnalelor audio), dar şi în domeniul prelucrării 

video digitale. 

Procesarea video digitală este un domeniu aflat încă la începuturi, dar care are o 

aplicabilitate tot mai mare. Aplicaţiile video digitale folosite sau încă în lucru sunt 

comunicaţiile în timp real (videoconferinţa/videofonul în ISDN, comunicaţiile video în 

reţelele de bandă largă ATM), televiziunea digitala, televiziunea de înaltă rezoluţie 

4


(HDTV), aplicaţii multimedia PC (Compact Disk Interactive (CD-I), Digital Video 

Interactive (DVI), VideoCD, Digital Video Disk (DVD) ) şi Packet Video (standardele 

de compresie MPEG-1,2,4). 

Odata cu aplicaţiile video digitale apar însă şi debite mari de date. Prezentăm în 

continuare datele brute pentru audio şi video digital: 

- calitatea audio digitală a CD-ului: 44kHz rată de eşantionare × 16biţi/eşantion, 

rezultă un flux de aproximativ 700 kbps 

- video de înaltă definiţie: 1280 peli × 720 linii luminanţă, 640 peli × 360 linii 

chrominanţă × 60 cadre/s × 8 biţi/pel/canal, rezultă aproximativ 663.5 Mbps 

În continuare prezentăm câteva standarde video digitale de studio: 

Tabelul 1.2 Standarde video digital de studio 

ITU-R 601 ITU-R 601 

525/60 625/50 CIF (H.261) 

NTSC PAL/SECAM 

Număr de pixeli activi/linie 

Luminanţa (Y) 

720 

720 

360 

Crominanţa (U,V) 

Număr de linii active/imagine 

360 

360 

180 

Luminanţa (Y) 

480 

576 

288 

Crominanţa (U,V) 

480 

576 

144 

Întreţesere 2:1 2:1 1:1 

Rată temporală 60 50 30 

Factor de aspect 4:3 4:3 4:3 

Rate brute de date (Mbps) 165.9 165.9 37.3 

Reţelele de acces disponibile în acest moment pentru traficul de date şi fluxurile 

de date maxime pe care le permit, sunt enumerate în tabelul 1.3: 

5 


Tabelul 1.3 Reţele de acces 

Reţea de acces Flux de date maxim 

Modem telefonic convenţional 28.8 kbps 

ISDN (Integrated Services Digital Network) 64-144 kbps (px64) 

T-1 (Trunk Level 1) 1,5 Mbps 

T-3 (Trunk Level 3) 45 Mbps 

ADSL (Asymetric Digital Subscriber Line) 1.5-6 Mbps în jos (downstream) 

Modem de cablu 30 Mbps în jos 

Ethernet (reţea locala cu transfer de pachete IP) 10 Mbps 

Fibră B-ISDN/ATM 55-200 Mbps 

Din tabelul 1.2 şi 1.3 se observă că fluxurile brute de date în cazul imaginilor în 

mişcare sunt foarte mari în comparaţie cu fluxurile de date maxime din sistemele de 

transmisiune folosite la ora actuala, ceea ce duce la ideea folosirii tehnicilor de 

compresie pentru obţinerea unor fluxuri de date mai scăzute, ce pot fi folosite în 

transmisiunile actuale. Cele mai importante astfel de standarde de compresie şi 

domeniile lor de aplicabilitate sunt: 

• CCITT G3/G4 (standarde CCITT grup 3, respectiv 4) - folosite pentru 

compresia imaginilor binare (non-adaptivă); codează imaginea sursa linie cu linie 

• JBIG (Joint Bi-level Image experts Group) - standard de compresie fără pierderi 

folosit pentru imagini binare, ce oferă o rata de compresie de maxim 20:1 

• JPEG (Joint Picture expert Group) - standardul de compresie pentru imagini cu 

noanţe de gri şi color cel mai folosit la ora actuala; ofera rate de compresie de la 

5:1 la 50:1 

• JPEG2000 - standard de compresia a imaginilor cu nuanţe de gri şi color derivat 

din JPEG, care foloseşte compresia bazată pe wavelet şi oferă imagini de calitate 

foarte bună şi rate de compresie foarte mari de până la 300:1 

6


• H.261 - standard de codare video folosit în aplicaţii ISDN cu flux de date 

multiplu de 64kbps (numit şi p×64 kbps); oferă rate de compresie de la 25:1 la 

100:1 

• H.263 – standard de compresie video iniţial pentru aplicaţii PSTN (mai puţin de 

64 kbps), dar actual şi pentru fluxuri de date mai mari; urmează să înlocuiască 

standardul H.261; are rate de compresie cuprinse între 6:1 şi 140:1 

• MPEG-1 (Motion Picture Expert Group) – standard de compresie a imaginilor în 

mişcare şi a sunetului asociat pentru stocare pe medii digitale cu rată de bit de 

până la aproximativ 1,5 Mbps 

• MPEG-2 – îmbunătăţire a standardului MPEG-1 ce foloseşte codarea generică 

(4-20 Mbps) 

• MPEG-4 – o nouă îmbunătăţire a standardului MPEG cu codare bazată pe 

obiecte 

Având acum o imagine de ansamblu asupra sistemelor video analogice şi 

digitale, putem face o comparaţie între ele: 

• Reprezentarea digitală este robustă; corecţia erorilor minimizează efectul 

distorsiunilor din mediile de transmisie/stocare, efectul zgomotului şi a altor 

degradări. 

• Informaţia video digitală poate fi transmisă cu lărgime de bandă mai mică decât 

aceeaşi informaţie în formă analogică, de aceeaşi calitate, folosind compresia 

digitala 

• Sistemele video digitale pot fi aplicate cu succes în domenii ca multimedia, 

televiziune şi comunicaţii în timp real (videofon şi videoconferinţă) într-o 

arhitectură unificată. 

• Informaţia video digitală dovedeşte flexibilitate în procesarea semnalului pentru 

îmbunătăţire, conversia standardelor, compunerea imaginilor, efecte speciale, 

editare neliniară, etc. 

7 


În comparaţie cu procesarea imaginilor statice, procesarea video foloseşte în 

plus şi alte tehnici: 

• Unele sarcini, cum ar fi estimarea mişcării sau analiza unei scene variabile în 

timp nu poate fi făcută pe baza unei singure imagini. 

• Utilizarea redundanţei temporale care există în mod natural într-o secvenţă de 

imagini pentru a dezvolta algoritmi eficienţi: 

- filtrare compensată de mişcare 

- predicţie compensată de mişcare 

Domeniul video digital este în continuă dezvoltare. Provocările în acest 

domeniu sunt analiza mişcării (estimarea şi segmentarea mişcării bidimensionale, 

mişcarea tridimensionala, estimarea structurii şi segmentarea ei, urmărirea obiectelor în 

imagine, ocluzie, deformare), filtrarea şi conversia standardelor (înlăturarea înceţoşării 

imaginii (deblurring), filtrarea zgomotului, ascuţirea marginilor, conversia frecvenţei 

cadrelor şi dezîntreţeserea, mărirea rezoluţiei), compresia (JPEG, H.261/H.263, MPEG 

1,2,4,7, codarea subbandă (Wavelet) şi codarea bazată pe model), etc. O parte din 

aceste aspecte vor fi discutate în capitolele următoare. 

1.4 SEMNALE ŞI SISTEME BIDIMENSIONALE 

În continuare vor fi discutate pe scurt câteva aspecte legate de semnalele şi 

sistemele bidimensionale şi vor fi explicaţi termenii cei mai importanţi folosiţi. 

Semnalele bidimensionale reprezintă modelarea matematică a distribuţiilor de 

intensitate luminoasă dintr–un spaţiu. Aceste semnale pot fi: continue, discrete sau 

mixte. 

Un semnal continuu se modelează ca o funcţie de două variabile independente 

pe o mulţime continuă de valori. Un semnal discret se modelează ca o funcţie definită 

doar pe o mulţime finită de valori. Un semnal mixt este un semnal bidimensional 

modelat ca o funcţie de variabile continue şi discrete. 

8


În prezent având în vedere tehnicile de eşantionare, cuantizare şi codare şi 

dezvoltarea integrării pe scară largă a circuitelor digitale, prelucrarea, transmisia şi 

stocarea sunt preponderent în format digital. 

Un semnal discret bidimensional este modelat de o funcţie ( 1 , n2 

) n s definită pe 

un set de perechi de forma s { s( 

n , n ) , −∞ < n , n < ∞} 

astfel încât 

= 1 2 

1 2 

s : Z × Z → R ( sauC) 

. Un element din această mulţime este numit eşantion, acesta 

putând avea valori reale sau complexe. În cazuri practice o astfel de mulţime are valori 

cunoscute ale eşantioanelor doar într–o regiune finită a planului ( n 1 , n2 

) . Planul 

determinat de ( n 1, n2 

) se numeşte regiune suport a semnalului. Secvenţele 

bidimensionale pot fi periodice pe fiecare direcţie în parte sau pe ambele direcţii 

simultan. 

Un sistem bidimensional poate fi încadrat într-una din categoriile: 

• Sisteme liniare (SL): Dacă răspunsul la impulsul variabil în spaţiu este cunoscut 

pentru fiecare eşantion ( n 1 , n2 

) , răspunsul sistemului liniar la orice alt semnal de 

intrare poate fi găsit prin superpoziţie; 

• Sisteme invariate la deplasare (SID): Un sistem invariant la deplasare este un sistem 

pentru care o deplasare a secvenţei de intrare implică o deplasare a secvenţei de 

ieşire; 

• Sisteme liniare şi invariante la deplasare (SLID); 

• Sisteme separabile: sunt sisteme SLID al căror răspuns la impuls este o secvenţă 

separabilă de forma h ( n1 

, n2 

) = h1 

( n1) 

h2 

( n2 

) unde ( 1, 2 ) n n h este funcţia pondere a 

sistemului 2–D. 

9

CAPITOLUL 1.pdf

Create successful ePaper yourself

Delete template?

Save as template?