Calculul valorilor si vectorilor proprii

Capitolul 4 

Calculul valorilor şi 

vectorilor proprii 

Valorile şi vectorii proprii joacă un rol fundamental în descriereamatematică a unor 

categoriifoartelargide procese tehnice, economice, biologiceetc. Astfel, proprietăţi 

esenţiale (cum este, e.g. stabilitatea)ale modelelormatematice cunoscutesub denumirea 

de sisteme dinamice se exprimă în raport cu valorile proprii ale unor matrice. 

În acestcontext, calculul câtmaieficient şimai exactalvalorilorşi vectorilorproprii 

se impune cu necesitate. 

Cadrul cel mai natural de abordare a problemei este cel al matricelor complexe, 

în care caz valorile şi vectorii proprii sunt, în general, numere complexe, respectiv 

vectori complecşi. Totuşi, majoritatea problemelor tehnice conduc la necesitatea 

calculului valorilor şi vectorilor proprii pentru matrice reale. Deşi valorile proprii 

şi vectorii proprii asociaţi ai unei matrice reale pot fi numere complexe, respectiv 

vectori complecşi, calculul cu numere complexe este sensibil mai puţin eficient şi, 

din acest motiv, în cazul datelor iniţiale reale, dezvoltările procedurale vor urmări 

utilizarea, practic exclusivă, a calculului cu numere reale. 

4.1 Formularea problemei 

4.1.1 Valori şi vectori proprii 

Valorileşi vectoriipropriipentru o matricepătratăA ∈ IC n×n sunt noţiuni introduse 

în capitolul 1 în contextul prezentării unor algoritmi de calcul elementari (secţiunea 

1.10). Problemadeterminării valorilorşi vectorilorpropriipoate fi apreciatăca fiind 

simplă numai pentru matrice cu structură triunghiulară, caz care a şi fost tratat în 

capitolul menţionat (v. algoritmul 1.23). 

Cu riscul de a ne repeta, reluăm câteva definiţii şi rezultate fundamentale introduse 

în §1.10 cu dezvoltările corespunzătoare necesare abordării problemei în cazul 

general.

210 CAPITOLUL 4. VALORI ŞI VECTORI PROPRII 

Definiţia 4.1 Fie o matrice A ∈ IC n×n . Un număr λ ∈ IC se numeşte valoare 

proprie a matricei A, dacă există un vector nenul x ∈ IC n astfel încât 

Ax = λx. (4.1) 

Un vector x ≠ 0 care satisface (4.1) se numeşte vector propriu al matricei A asociat 

valorii proprii λ. 

Valorile proprii ale matricei A ∈ IC n×n , conform teoremei 1.13, sunt zerourile 

polinomului caracteristic 

p(λ) = det(λI n −A), (4.2) 

care este un polinom de gradul n cu coeficienţi complecşi 1 . În consecinţă, orice 

matrice A ∈ IC n×n are exact n valori proprii complexe, nu neapărat distincte. 

Dacă matricea este reală, atunci polinomul caracteristic are coeficienţii reali şi 

valorile propriicomplexe apar înperechi complex-conjugate 2 . Dacă x = u+iv ∈ IC n 

cu u, v ∈ IR n , este un vector propriu asociat valorii proprii λ = α+iβ, α, β ∈ IR, 

β ≠ 0, a unei matrice reale, atunci ¯x = u−iv este un vector propriu asociat valorii 

proprii ¯λ = α−iβ (verificaţi!). 

Ordinuldemultiplicitate n i alrădăciniiλ i apolinomuluicaracteristicsenumeşte 

multiplicitate algebrică a valorii proprii respective. Dacă n i = 1 valoarea proprie λ i 

se numeşte simplă. 

Mulţimea 

λ(A) = {λ 1 ,λ 2 ,...,λ n } = {λ ∈ IC | det(λI −A) = 0} (4.3) 

a valorilor proprii ale unei matrice A ∈ IC n×n se numeşte spectrul matricei A, iar 

numărul real nenegativ 

ρ(A) = max(|λ 1 |,|λ 2 |,...,|λ n |) (4.4) 

se numeşte raza spectrală a matricei A. Deci, în planul complex IC, valorile proprii 

ale unei matrice A sunt situate în discul închis de rază ρ(A) cu centrul în origine. 

Se poate arăta imediat că valorile proprii ale unei matrice A ∈ IC n×n satisfac 

relaţiile 

n∑ 

λ i = 

i=1 

n∑ 

i=1 

a ii 

def 

= tr(A), 

n∏ 

λ i = det(A), (4.5) 

unde tr(A) este, prin definiţie, urma matricei A. În particular, o matrice este 

singulară dacă şi numai dacă are (cel puţin) o valoare proprie nulă. 

Vectorii proprii introduşi prin definiţia 4.1 sunt denumiţi uneori vectori proprii 

la dreapta ai matricei A şi satisfac sistemul liniar omogen singular 

i=1 

(λI n −A)x = 0. (4.6) 

Deci, fiecăreivaloripropriiîicorespundecelpuţinunvectorpropriu. Vectoriiproprii 

asociaţi valorilor proprii distincte sunt liniar independenţi. 

1 Ecuaţia p(λ) = 0 se numeşte ecuaţie caracteristică a matricei A. 

2 O mulţime de numere (reale şi complexe) în care numerele complexe apar în perechi complexconjugate 

va fi numită în continuare mulţime simetrică.

4.1. FORMULAREA PROBLEMEI 211 

În acest context, vectorii proprii la stânga sunt vectorii nenuli y ∈ IC n ce satisfac 

condiţia 

y H A = λy H , (4.7) 

unde H reprezintă operatorul cumulat de transpunere şi conjugare. Aplicând operatorul 

H relaţiei (4.7) obţinem 

A H y = ¯λy, (4.8) 

i.e. vectorii proprii la stânga ai matricei A asociaţi valorii proprii λ sunt vectori 

proprii (la dreapta) ai matricei A H asociaţi valorii proprii ¯λ ∈ λ(A H ). De aici 

rezultă 

λ(A H ) = ¯λ(A), (4.9) 

adică valorile proprii ale matricei A H sunt conjugatele valorilor proprii ale matricei 

A. 

Întrucât det(λI n − A) = det(λI n − A T ) matricele A şi A T au acelaşi polinom 

caracteristic şi, deci, aceleaşi valori proprii dar vectorii proprii, în general, diferă. 

Cum un vector propriu y al matricei A T asociat valorii proprii λ satisface A T y = λy 

sau y T A = λy T vectorii proprii reali ai matricei A T sunt vectori proprii la stânga 

ai matricei A. 

Dacă x i este un vector propriu al matricei A asociat valorii proprii λ i , vectorul 

y i = αx i este, de asemenea, un vector propriu al matricei A asociat aceleiaşi valori 

proprii λ i , oricare ar fi α ∈ IC, α ≠ 0. Mai mult, este clar că mulţimea vectorilor 

proprii asociaţi unei valori proprii λ i împreună cu vectorul nul din IC n formează 

subspaţiul liniar V i = Ker(λ i I n −A) ⊂ IC n numit subspaţiul propriu asociat valorii 

proprii λ i . Dimensiunea ν i = dimV i a subspaţiului propriu, i.e. numărul de vectori 

proprii liniar independenţi asociaţi lui λ i , se numeşte multiplicitate geometrică a 

valorii proprii λ i . Este evident că 

ν i ≤ n i . (4.10) 

4.1.2 Subspaţii invariante 

Subspaţiile proprii sunt subspaţii A-invariante în sensul definiţiei următoare 

(v. şi §1.10). 

Definiţia 4.2 Fie o matrice A ∈ IC n×n . Un subspaţiu liniar V ⊂ IC n se numeşte 

subspaţiu invariant al matricei A sau, pe scurt, subspaţiu A-invariant dacă 

AV ⊂ V i.e. Ax ∈ V, ∀x ∈ V. (4.11) 

Cum IR n ⊂ IC n , pot exista subspaţii A-invariante în IR n pentru matrice A complexe. 

De asemenea, pentru matrice A reale pot exista subspaţii A-invariante care nu sunt 

în IR n . Dintre proprietăţile subspaţiilor A-invariante amintim următoarele.


Propoziţia 4.1 Fie matricea A ∈ IC n×n . 

1 ◦ . Dacă x 1 , x 2 , ... ,x p sunt vectori proprii ai matricei A, atunci subspaţiul 

S = Im[x 1 x 2 ... x p ] ⊂ IC n este A-invariant. 

2 ◦ . Dacă S este un subspaţiu A-invariant cu dimS = p şi coloanele matricei 

(monice) V = [v 1 v 2 ... v p ] ∈ IC n×p formează o bază a lui S, atunci există o matrice 

B ∈ IC p×p astfel încât 

AV = VB. (4.12) 

Mai mult, avem 

λ(B) ⊂ λ(A). (4.13) 

(Matricea B se numeşte restricţia matricei A la subspaţiul A-invariant S şi se 

notează B = A|S.) 

În particular, orice subspaţiu A-invariant nenul (i.e. p ≥ 1) conţine un vector 

propriu al matricei A. Reciproc, dacă are loc o relaţie de forma (4.12), atunci ImV 

este un subspaţiu A-invariant. 

3 ◦ Complementul ortogonal T = S ⊥ în IC n al subspaţiului A-invariant S este un 

subspaţiu A H -invariant. 

În cazul real un subspaţiu A-invariant generat de vectori proprii reali este, evident, 

real. Dacă x 1,2 = v 1 ± iv 2 , v 1 , v 2 ∈ IR n , sunt vectori proprii asociaţi unei 

perechi de valori proprii complex conjugate λ 1,2 = α ± iβ, α, β ∈ IR, β ≠ 0, 

atunci vectorii v 1 , v 2 sunt liniar independenţi şi S = Im[v 1 v 2 ] este un subspaţiu 

A-invariant. Mai mult, dacă are loc o relaţie de forma (4.12), unde coloanele lui 

V ∈ IR n×p formează o bază a unui subspaţiu A-invariant S ⊂ IR n , atunci restricţia 

B ∈ IR p×p a lui A la S satisface (4.13) cu λ(B) o mulţime simetrică. În sfârşit, 

complementul ortogonal T = S ⊥ în IR n al subspaţiului A-invariant real S este un 

subspaţiu A T -invariant. 

Demonstraţie. Proprietatea 1 ◦ este evidentă. Pentru a arăta 2 ◦ să observăm 

că Av j ∈ S, de unde rezultă Av j = Vb j , j = 1 : p, i.e. (4.12) este adevărată. 

Dacă z ∈ IC p este un vector propriu al matricei B, i.e. Bz = µz, asociat valorii 

proprii µ ∈ λ(B), atunci din (4.12) avem AVz = µVz. Cum z ≠ 0 iar V este 

monică, rezultă y = Vz ≠ 0, i.e. y este un vector propriu al lui A conţinut în 

S. În consecinţă, S conţine un vector propriu al matricei A şi avem µ ∈ λ(A), 

deci (4.13) este adevărată. Acum, dacă are loc o relaţie de forma (4.12), atunci 

AVz = VBz = Vw ∈ ImV, ∀z ∈ IC p , i.e. ImV este A-invariant. 3 ◦ . Fie x ∈ S, 

y ∈ T doi vectori arbitrari. Atunci Ax ∈ S şi, deci, y H Ax = (A H y) H x = 0. Cum 

x ∈ S este arbitrar, rezultă A H y ⊥ S, respectiv A H y ∈ T , i.e. T este A H -invariant. 

În cazul real, din A(v 1 ±iv 2 ) = (α±iβ)(v 1 ±iv 2 ) rezultă 

{ [ ] 

Av1 = αv 1 −βv 2 

α −β 

, i.e. AV = VB cu B = . (4.14) 

Av 2 = βv 1 +αv 2 β α 

Dacă v 1 , v 2 sunt liniar dependenţi, atunci v 2 = γv 1 cu γ ≠ 0 şi din (4.14) rezultă 

β(1 + γ 2 )v 1 = 0. Cum β ≠ 0, obţinem v 1 = 0, de unde v 2 = 0 şi x 1,2 = 0, ceea 

ce contrazice definiţia vectorilor proprii. Celelalte afirmaţii se demonstrează similar 

cazului complex. 

✸


Exemplul 4.1 Se consideră matricea 

⎡ 

A = 1 6 

care are polinomul caracteristic 

⎣ 5 25 9 

−1 −5 −9 

0 24 24 

p(λ) = det(λI 3 −A) = λ 3 −4λ 2 +6λ−4 

şi valorile proprii λ 1 = 2, λ 2,3 = 1±i. Vectorii 

⎡ 

def 

x 1 = v 1 = ⎣ −1 ⎤ 

−1 

2 

⎦, x 2,3 

def 

= v 2 ±iv 3 = 

⎤ 

⎦ 

⎡ 

⎣ 5 

−1 

2 

⎤ 

⎦±i 

⎡ 

⎣ 2 2 

−2 

sunt vectori proprii ai matricei A asociaţi valorilor proprii λ 1 şi, respectiv, λ 2,3 . Fie 

V 1 = v 1 şi V 23 = [v 2 v 3 ]. Avem următoarele relaţii de tipul (4.12) (verificaţi!): 

[ ] 

1 1 

AV 1 = V 1 B 1 cu B 1 = 2, AV 23 = V 23 B 23 cu B 23 = 

−1 1 

şi, prin urmare, S 1 = ImV 1 şi S 23 = ImV 23 (vezi fig.4.1) sunt subspaţii A-invariante, 

⎤ 

⎦ 

✻3 

IR 

❅ 

S 3 

1 =ImV 1 

✘✘ ✘✘✘ ✘ ✘✘✘ ✘ ✘✘ ❈ 

❅ ❈❈❈❈❈❈❈❈ 

❅ S 23 =ImV 23 

❈ ❅❅■ 

v 1 

v 2 

❈❈ ❅ 

✘ ✘✘✘ ✘✘✿ 

❅ 

❈ 

✑ 

0 

✑ ❈ 

❈❈❈❈❈ ✑ ❈❈❈❲ 

✑ 

✑ v 3 

✑ 

✑ 

✑✰ ✑ ✘ ✘ ✘ ✘✘✘ ✘ ✘✘✘ ✘✘ 

2 

❅ 

❅ 

❅ 

✲1 

Fig. 4.1: Vectori proprii şi subspaţii A-invariante pentru matricea A din exemplul 

4.1. 

iar B 1 = A|S 1 şi B 23 = A|S 23 sunt restricţii ale matricei A la cele două subspaţii 

(sunt aceste restricţii unic determinate). Propunem cititorului să calculeze complementele 

ortogonale înIR 3 ale celordouă subspaţii şi săverificecă acestesubspaţii 

sunt A T -invariante. 

✸ 

Problema de calcul care face obiectul acestui capitol este determinarea valorilor 

şi vectorilor proprii ai unei matrice date. Deşi pentru calculul unei valori proprii


sau al unui grup de valori proprii pot fi utilizate tehnici specifice, ne vom concentra 

demersul nostru, în principal, asupra problema de calcul al întregului spectru. Problema 

calculului vectorilor proprii va fi tratată în subsidiar, ţinând seama şi de 

faptul că în multe aplicaţii calculul explicit al vectorilor proprii poate fi (şi este bine 

să fie) evitat. 

4.1.3 Matrice asemenea 

Urmând metodologia generală de reducere a unei probleme de calcul la alte probleme 

mai simple, utilizată şi în capitolele precedente, suntem interesaţi să evidenţiem 

transformările matriceale care conservă spectrul unei matrice date. 

Aşa cum s-a specificat şi în §1.10, valorile proprii sunt conservate de transformările 

de asemănare definite mai jos. 

Definiţia 4.3 Două matrice A,B ∈ IC n×n se numesc asemenea dacă există o matrice 

nesingulară T ∈ IC n×n astfel încât 

B = T −1 AT. (4.15) 

Dacă matricea de transformare T este unitară, atunci matricele A şi B se numesc 

unitar asemenea. În cazul real, dacă matricea de transformare T este ortogonală, 

matricele A şi B se numesc ortogonal asemenea. 

Într-adevăr,conformteoremei1.14,dacămatriceleA,B ∈ IC n×n satisfacorelaţie 

de forma (4.15), i.e. sunt asemenea, atunci ele au acelaşi spectru 3 

λ(A) = λ(B) (4.16) 

şi dacă x este un vector propriu al matricei A asociat valorii proprii λ ∈ λ(A), 

atunci vectorul 

y = T −1 x (4.17) 

este un vector propriu al matricei B, asociat aceleiaşi valori proprii. 

În dezvoltările din această lucrare vom insista asupra cazului generic al matricelorde 

ordinn careadmit un set (complet) de n vectoripropriiliniar independenţi. 

Aşa cum s-a demonstrat în teorema 1.15, în acest caz, utilizând în (4.15) ca matrice 

de transformare T = X, unde X este o matrice având drept coloane n vectori 

proprii liniar independenţi ai matricei A, obţinem o matrice diagonală: 

X −1 AX = Λ = diag(λ 1 ,λ 2 ,...,λ j ,...,λ n ) ∈ IC n×n . (4.18) 

Astfel de matrice se numesc diagonalizabile (peste IC). Dacă o matrice n×n are n 

valori proprii distincte, atunci este diagonalizabilă dar reciproca nu este, în general, 

adevărată 4 . 

3 De remarcat faptul că transformările uzuale cum ar fi multiplicările cu matrice (la stânga 

sau la dreapta) alterează spectrul matricei date. În particular, operaţiile elementare cu linii sau 

coloane, inclusiv permutările, pot modifica valorile şi vectorii proprii. 

4 O matrice cu toate valorile proprii simple (i.e. distincte) se numeşte cu spectru simplu, iar 

matricele care admit seturi complete de vectori proprii liniar independenţi sunt cunoscute sub 

denumirea de matrice simple. În acest din urmă caz multiplicităţile algebrice ale valorilor proprii 

distincte coincid cu multiplicităţile lor geometrice. Evident, matricele cu spectru simplu sunt 

simple dar nu şi reciproc.


În cazul general, structura ”fină” a unei matrice, care poate fi dezvăluită prin 

transformărideasemănarecorespunzătoare,estedatădeaşanumitaformă canonică 

Jordan. Deşi forma canonică Jordan joacă un rol esenţial în analiza matriceală, 

conţinând maximum de informaţie structurală privitor la o matrice dată, totuşi 

rolul ei în calculul numeric este mult diminuat de sensibilitatea structurii Jordan la 

perturbaţii numerice în elementele matricei iniţiale, perturbaţii inerente în calcule 

efectuate pe un calculator datorită reprezentării informaţiei numerice în virgulă 

mobilă. Acesta este motivul pentru care în toate dezvoltările numerice se preferă 

o structură mult mai robustă şi anume forma Schur reală sau complexă prezentată 

într-una din secţiunile următoare 5 . 

4.1.4 Valorile proprii ale matricelor simetrice şi hermitice 

Prezentăm în continuare câteva rezultate referitoare la valorile şi vectorii proprii 

pentru matricele hermitice (simetrice). Matricele hermitice (simetrice) se întâlnesc 

în numeroase aplicaţii şi prezintă particularităţi remarcabile. 

Definiţia 4.4 Fie A ∈ IC n×n . Matricea A se numeşte normală dacă 

A H A = AA H . (4.19) 

În cazul real, matricea A ∈ IR n×n este normală dacă 

A T A = AA T . (4.20) 

În acest context reamintim că matricea A se numeşte hermitică dacă A H = A 

şi simetrică dacă A T = A. De asemenea, o matrice A ∈ IC n×n se numeşte unitară 

dacă A H A = I n şi ortogonală dacă A T A = I n . 

Se constată imediat că matricele hermitice şi cele unitare sunt matrice normale. 

Matricele hermitice au proprietatea că elementele simetrice faţă de diagonala principală 

sunt complex conjugate, i.e. a ij = ā ji , i,j ∈ 1 : n, deci elementele diagonale 

ale matricelor hermitice sunt reale. O matrice hermitică reală este simetrică. O 

matrice unitară reală este ortogonală. Prin urmare matricele reale simetrice sau 

ortogonale sunt normale. Există [ matrice ] normale care nu sunt nici simetrice nici 

1 −1 

ortogonale, de exemplu A = . 

1 1 

Prezentăm în continuare câteva rezultate fundamentale, urmând ca aspectele 

specifice legate de calculul efectiv al valorilor şi vectorilor proprii pentru matrice 

hermitice (simetrice) să fie date în două secţiuni distincte (§4.8 şi §4.9), iar cele 

legate de condiţionare şi stabilitate în §4.10 şi §4.11. 

Teorema 4.1 O matrice n×n complexă A este normală dacă şi numai dacă admite 

un set complet de n vectori proprii ortogonali, adică există o matrice unitară Q ∈ 

∈ IC n×n ale cărei coloane sunt vectori proprii ai matricei A astfel încât 

Q H AQ = Λ = diag(λ 1 ,λ 2 ,...,λ n ) ∈ IC n×n . (4.21) 

5 Algoritmii de reducere la forma canonică Jordan, prezentaţi în unele lucrări de matematică 

(vezi, e.g. [XVI]) nu prezintă interes practic decât în contextul unor medii de calcul exact. Pentru 

detalii privitoare la aspectele numerice şi algoritmice ale calculului formei canonice Jordan, vezi 

secţiunea 4.7.


Altfel spus, matricele normale sunt matricele unitar diagonalizabile (peste IC). 

În cazul real, matricea A este normală dacă şi numai dacă satisface aceleaşi 

condiţii, i.e. este unitar diagonalizabilă. 

Demonstraţie. 

Presupunem că matricea A este normală. Demonstrăm mai întâi următorul 

rezultat preliminar. 

Lema 4.1 Dacă S este un subspaţiu simultan A-invariant şi A H -invariant, atunci 

A şi A H admit un vector propriu comun x conţinut în S 6 . Dacă Ax = λx atunci 

A H x = ¯λx. 

Subspaţiul S fiind A-invariant, în conformitate cu propoziţia 4.1, punctul 2 ◦ , există 

un vector propriu x al matricei A (i.e. care satisface Ax = λx, x ≠ 0) conţinut în 

S. Din (4.19) rezultă imediat că A(A H ) k = (A H ) k A. Deci A(A H ) k x = λ(A H ) k x, 

k = 0,1,2,..., i.e. y k = (A H ) k x ≠ 0 sunt vectori proprii ai matricei A asociaţi 

aceleiaşi valori proprii λ. Cum subspaţiul S este şi A H -invariant rezultă că toţi 

vectorii y k sunt conţinuţi în S. Fie p întregul pentru care y 0 ,y 1 ,...,y p−1 sunt 

liniar independenţi, iar y p este o combinaţie liniară a acestora. Atunci, subspaţiul 

S ′ = ImY ⊂ S, unde Y = [y 0 y 1 ... y p−1 ] este A-invariant (conform propoziţiei 

4.1, punctul 1 ◦ ) şi, fiind generat de vectori proprii asociaţi aceleiaşi valori proprii, 

orice vector nenul din S ′ este vector propriu al lui A. Pe de altă parte, S ′ este 

şi A H -invariant întrucât ∀x = Yu ∈ S avem A H x = A H Yu = Yv ∈ S ′ . În 

consecinţă, conform propoziţiei 4.1, 2 ◦ , există o matrice B astfel încât A H Y = YB, 

de unde rezultă A H Yz = YBz = µYz pentru orice vector propriu z al ei asociat 

valorii proprii µ ∈ λ(B). Prin urmare, notând x = Yz avem A H x = µx cu µ ∈ 

∈ λ(B) ⊂ λ(A H ). Altfel spus, există un vector propriu al matricei A H conţinut 

în S ′ . Cum toţi vectorii nenuli din S ′ sunt vectori proprii ai lui A, am arătat că 

matriceanormalăAşimatriceaA H au(cel puţin) un vectorpropriucomunconţinut 

în S ′ , deci şi în S. Mai mult, din Ax = λx şi A H x = µx cu acelaşi x ≠ 0, avem 

λ‖x‖ 2 = λx H x = x H Ax = (A H x) H x = (µx) H x = ¯µ‖x‖ 2 , de unde rezultă µ = ¯λ. 

Demonstraţia lemei este completă. 

Vom construi acum un set complet de vectori proprii ortogonali ai matricei 

normale A. 

Pasul 1 ◦ . Spaţiul IC n fiind simultan A- şi A H -invariant, conform lemei de mai sus 

matricele A şi A H admit un vector propriu comun x 1 care poate fi normat: 

Ax 1 = λ 1 x 1 , A H x 1 = ¯λ 1 x 1 , ‖x 1 ‖ = 1. 

Subspaţiul S 1 = Im[x 1 ] este simultan A-invariant şi A H -invariant. Conform propoziţiei 

4.1, 3 ◦ complementul său ortogonal T 1 = S ⊥ 1 în ICn este, de asemenea, 

simultan A- şi A H -invariant. În consecinţă matricele A şi A H admit un vector 

propriu (normat) comun x 2 ∈ T 1 , i.e. ortogonal cu x 1 : 

Ax 2 = λ 2 x 2 , A H x 2 = ¯λ 2 x 2 , ‖x 2 ‖ = 1, x 2 ⊥ x 1 . 

6 Un rezultat mai general este următorul: două matrice care comută admit un vector propriu 

comun (v. exerciţiul 4.7).


Pasul k ◦ . Presupunem că am construit un set de k < n vectori proprii ortogonali 

x 1 , x 2 , ... ,x k ai matricei normale A (şi, simultan, ai matricei A H ). Subspaţiul 

S k = Im[x 1 x 2 ... x k ] este simultan A-invariant şi A H -invariant. Cu aceleaşi argumente, 

complementul său ortogonal T k = S ⊥ k în ICn este, de asemenea, simultan A- 

şi A H -invariant. În consecinţă, matricele A şi AH admit un vector propriu(normat) 

comun x k+1 ∈ T 1 , i.e. ortogonal cu x 1 , x 2 , ... ,x k : 

Ax k+1 = λ k+1 x k+1 , A H x k+1 = ¯λ k+1 x k+1 , ‖x k+1 ‖ = 1, x k+1 ⊥ S k . 

Procesul recurent de construcţie a vectorilor proprii ortogonali conduce după k = 

= n−1paşiladeterminareaunui setortogonalcompletdevectoripropriiaimatricei 

A şi, simultan, ai matricei A H . Notând cu Q matricea vectorilor proprii, implicaţia 

directă este demonstrată. 

Reciproc, presupunem că matricea A admite un set complet de vectori proprii 

ortogonali x i , i ∈ 1 : n, respectiv o matrice unitară Q def 

= X = [x 1 x 2 ··· x n ] de 

vectori proprii. Avem 

de unde rezultă 

X H AX = Λ = diag(λ 1 ,λ 2 ,...,λ n ) ∈ IC n×n , 

X H A H X = ¯Λ. 

Din ultimele două relaţii avem Λ¯Λ = ¯ΛΛ = X H AA H X = X H A H AX, i.e. AA H = 

= A H A şi teorema este complet demonstrată. ✸ 

Observaţia 4.1 Demonstraţiaprezentatămaisusevidenţiază,printrealtele,următoarele 

proprietăţi suplimentare ale matricelor normale: 

1 ◦ Dacă A este normală, atunci matricele A şi A H au aceiaşi vectori proprii. 

2 ◦ Dacă S este un subspaţiu A-invariant, atunci şi complementul său ortogonal 

în IC n este A-invariant. 

✸ 

Teorema 4.2 O matrice n × n complexă A este hermitică dacă şi numai dacă 

admite un set complet de n vectori proprii ortogonali şi toate valorile proprii sunt 

reale adică există o matrice unitară Q, ale cărei coloane sunt vectori proprii, astfel 

încât 

Q H AQ = Λ = diag(λ 1 ,λ 2 ,...,λ n ) ∈ IR n×n . (4.22) 

Altfel spus, matricele hermitice sunt matricele unitar diagonalizabile cu spectru real. 

În cazul real matricea A este simetrică dacă şi numai dacă admite un set complet 

de n vectori proprii ortogonali reali şi toate valorile proprii sunt reale adică există 

o matrice ortogonală Q, ale cărei coloane sunt vectori proprii, astfel încât 

Q T AQ = Λ = diag(λ 1 ,λ 2 ,...,λ n ) ∈ IR n×n , (4.23) 

i.e. matricele reale simetrice 7 sunt matricele ortogonal diagonalizabile cu spectru 

real. 

7 Matricele complexe simetrice sunt matrice cu multe proprietăţi esenţial diferite de cele ale 

matricelor hermitice sau ale matricelor reale simetrice (vezi [I], [II] şi exerciţiul 4.31).


Demonstraţie. Matricele hermitice fiind normale, conform teoremei precedente 

sunt unitar diagonalizabile, i.e. are loc (4.21). Acum, din A H = A rezultă că Λ H = 

Λ, i.e. spectrul este real. În cazul realaceastaare drept consecinţă faptul că vectorii 

proprii sunt reali. Reciproc, din (4.22) rezultă Λ H = Λ, i.e. Q H AQ = Q H A H Q, de 

unde obţinem A H = A. 

✸ 

Faptul că matricele hermitice (în cazul real, simetrice) au spectrul real şi sunt 

unitar(ortogonal)diagonalizabileareimplicaţiimajoreasupratehnicilordecalculal 

valorilor proprii, asigurând o complexitate relativ redusă a algoritmilor şi o precizie 

ridicată a rezultatelor. Pentru dezvoltarea algoritmilor de calcul se vor dovedi utile 

rezultatele prezentate în continuare. Formularea rezultatelor şi demonstraţiile vor 

fi prezentate pentru matricele hermitice, particularizarea pentru matricele reale 

simetrice (care se reduce, în esenţă, la înlocuirea mulţimii IC cu mulţimea IR şi 

a operatorului hermitic H cu operatorul de transpunere T ) fiind lăsată în sarcina 

cititorului. 

Fie matricea hermitică A ∈ IC n×n şi funcţia reală de n variabile complexe 

µ : IC\{0} → IR definită de µ(x) = xH Ax 

x H . Vom fi interesaţi de extremele funcţiei 

x 

µ. Pentru determinarea acestora, observăm mai întâi că µ(x) = µ(αx) pentru toţi 

α nenuli din IC. În consecinţă, este suficient să ne rezumăm la vectorii x de normă 

euclidiană unitară, i.e. să considerăm funcţia 

µ : S → IR, x ↦→ µ(x) = x H Ax, (4.24) 

unde 

S = { x ∈ IC n ‖x‖ 2 = x H x = 1 } (4.25) 

estesferaderazăunitarădinIC n . Vomconsideracăspectrulλ(A) = {λ 1 ,λ 2 ,...,λ n } 

al matricei A este ordonat descrescător, i.e. 

λ 1 ≥ λ 2 ≥ ... ≥ λ n , (4.26) 

şi fie q j ∈ IC n , j = 1 : n un set complet de vectori proprii, de normă euclidiană 

unitară, ai matricei A, asociaţi valorilor proprii λ j . Vom nota 

Q = [ ] 

q 1 q 2 ··· q n , Q 

′ 

k = Q(:,1 : k), Q ′′ 

k = Q(:,k +1 : n). (4.27) 

Avem următorul rezultat. 

Teorema 4.3 Valorile extreme absolute ale funcţiei µ definite în (4.24), (4.25) sunt 

date de 

M = max 

x ∈ S xH Ax = λ 1 , m = min 

x ∈ S xH Ax = λ n . (4.28) 

Mai mult, dacă W k = ImQ ′′ 

k este subspaţiul A-invariant asociat valorilor proprii 

λ j , j = k +1 : n, atunci 

max x H Ax = λ k+1 . (4.29) 

x ∈ S ∩W k


Demonstraţie. Conform teoremei 4.2, matricea Q este unitară, A = QΛQ H unde 

Λ = diag(λ 1 ,λ 2 ,...,λ n ) şi, prin urmare, 

µ(x) = x H Ax = y H Λy = 

n∑ 

λ k |y (k) | 2 , y = Q H x = [y (1) y (2) ··· y (n) ] T . 

k=1 

(4.30) 

Cum vectorii x şi y din (4.30) se află într-o relaţie biunivocă, iar transformările 

unitare conservă norma euclidiană, rezultă că extremele funcţiei µ coincid cu extremele 

funcţiei ν : S → IR, ν(y) = y H Λy. Din faptul că vectorii y sunt de normă 

unitară, i.e. ∑ n 

j=1 |y(j) | 2 = 1, rezultă 

ν(y) = λ 1 − 

n∑ 

n−1 

∑ 

(λ 1 −λ j )|y (j) | 2 = (λ j −λ n )|y (j) | 2 +λ n . (4.31) 

j=2 

Întrucât sumele din relaţia (4.31) sunt, datorită (4.26), nenegative, iar valoarea 

nulă a acestor sume se poate realiza, e.g. pentru y (j) = 0, j = 2 : n în primul 

caz şi j = 1 : n − 1 în cel de al doilea, avem egalităţile (4.28). Dacă valorile 

proprii maximă, respectiv minimă, sunt simple, atunci valorile extreme ale funcţiei 

ν se ating pentru vectorii y de forma y 1 = [y (1) 0 ··· 0] T = e iθ1 e 1 , respectiv 

y n = [0 ··· 0 y (n) ] T = e iθn e n , cu θ 1 , θ n ∈ IR. Prin urmare, cele două extreme ale 

funcţiei µ se ating pentru vectorii x de forma x 1 = e iθ1 q 1 şi, respectiv x n = e iθn q n . 

Dacă λ 1 are multiplicitatea s, iar λ n multiplicitatea t, atunci maximul se atinge 

pentru orice vector x de normă unitară din V s = ImQ ′ s, i.e. subspaţiul A-invariant 

asociat valorilor proprii λ j , j = 1 : s, iar minimul se atinge pentru orice vector de 

normă unitară din W n−t . 

Pentru cea de a doua parte a teoremei, dacă x ∈ W k = V ⊥ k atunci xH Q ′ k = 0 şi 

y = Q H x = [0 ··· 0 y (k+1) ··· y (n) ] T . Prin urmare, 

µ(x) = ν(y) = λ k+1 − 

n∑ 

j=k+2 

j=1 

de unde, cu aceleaşi argumente ca mai sus, se obţine (4.29). 

(λ k+1 −λ j )|y (j) | 2 , (4.32) 

Rezultatul următor prezintă o interesantă caracterizareminimax a valorilorproprii 

ale unei matrice hermitice (în cazul real, simetrice) şi este util prin consecinţele 

sale. Notăm, generic, cu V subspaţiile liniare ale spaţiului IC n şi cu W = V ⊥ complementele 

lor ortogonale în IC n . De asemenea, vom nota cu V S = V ∩S şi, respectiv, 

W S = W ∩S, mulţimile vectorilor de normă euclidiană unitară din V şi W. 

Teorema 4.4 (Courant – Fisher) Dacă matricea hermitică A ∈ IC n×n are valorile 

proprii ordonate ca în (4.26) atunci pentru toţi k ∈ 1 : n avem 

λ k = max 

dimV = k 

min x H Ax = min 

x ∈ V S dimV = k 

✸ 

max x H Ax 8 . (4.33) 

x ∈ W S 

8 Întrucât oricărui subspaţiu n − k dimensional din IC n îi corespunde un complement ortogonal 

k dimensional, ultimul termen al egalităţilor (4.33) poate fi scris şi în forma λ k = 

= min dimV = n−k max x ∈ VS x H Ax.


Demonstraţie. Fie V un subspaţiu arbitrar de dimensiune k şi v j , j = 1 : k, o bază 

a lui V. Fie, de asemenea, w j , j = 1 : n−k, o bază a lui W. Notăm cu V ∈ IC k , 

respectiv W ∈ IC n−k , matricele vectorilor care formează bazele celor două subspaţii 

complementare. Conform teoremei precedente 

λ n ≤ x H Ax ≤ λ 1 (4.34) 

pentru toţi x din S, i.e. funcţia µ este mărginită pe compactul V S şi, în consecinţă, 

îşi atinge marginile pe această mulţime. La fel ca în demonstraţia teoremei precedente, 

fie y = Q H x, unde Q este o matrice unitară de vectori proprii, ordonaţi 

conform (4.26). Avem, evident, ‖y‖ = ‖x‖ şi x = Qy ∈ V dacă şi numai dacă este 

ortogonal pe W, i.e. 

W H x = W H Qy = 0. (4.35) 

[ ] 

Întrucât W este monică, factorizarea QR a matricei ˜W = Q H W = ˜Q R 

are 

0 

matriceasuperior triunghiularăR ∈ IC (n−k)×(n−k) nesingulară. În consecinţă, (4.35) 

devine [ 

R H 0 ] ˜QH y = 0. (4.36) 

Notând z def 

= ˜Q H y relaţia (4.36) impune z(1 : n−k) = 0. Notând, încă o dată, 

u def 

= z(n−k +1 : n) ∈ IC k şi ţinând seama de faptul că transformările unitare 

conservă norma euclidiană, din (4.35), (4.36) rezultă că x = Qy = Q˜Qz = ˆQu, unde 

ˆQ = Q˜Q(:,n−k+1 : n), aparţine mulţimii V S dacă şi numai dacă ‖u‖ = 1, fără 

nici o altă restricţie asupra lui u. Acum, putem alege u astfel încât y(1 : k−1) = 0. 

Într-adevăr, y = ˜Q(:,n−k+1: n)u şi orice soluţie normată(i.e. de normă euclidiană 

unitară)asistemuluisubdeterminat ˆQ(1 : k−1,,n−k+1 : n)u = 0asigurăsatisfacerea 

acestei condiţii. Cu această alegere a lui u, pentru vectorul corespunzător x din V S , 

avem 

n∑ 

µ(x) = x H Ax = y H Λy = λ k − (λ k −λ j )|y (j) | 2 ≤ λ k , (4.37) 

j=k+1 

unde am ţinut seama de faptul că ∑ n 

j=k |y(j) | 2 = ‖y‖ 2 = 1 şi de ordonarea descrescătoare 

a valorilor proprii. Natural, din (4.37) rezultă 

min x H Ax ≤ λ k (4.38) 

x ∈ V S 

şi, cum subspaţiul V, de dimensiune k, era arbitrar, inegalitatea (4.38) are loc în 

toate subspaţiile de aceeaşi dimensiune sau, altfel spus, 

max 

dimV = k 

min x H Ax ≤ λ k . (4.39) 

x ∈ V S 

Rămâne să arătăm că această margine este atinsă efectiv. Aceasta se întâmplă în 

subspaţiul A-invariant asociat primelor k valori proprii din secvenţa (4.26). Întradevăr, 

fie V = ImQ ′ k şi x = Q′ k z cu ‖z‖ = 1. Rezultă ‖x‖ = 1, i.e. x ∈ V S şi 

k−1 

∑ 

µ(x) = x H Ax = (λ j −λ k )|z (j) | 2 +λ k ≥ λ k , (4.40) 

j=1


de unde, în acest subspaţiu, 

min x H Ax ≥ λ k (4.41) 

x ∈ V S 

egalitatea obţinându-se pentru z = [0 ··· 0 1] T . Prima egalitate din (4.33) este 

demonstrată. Demonstraţia celei de a doua egalităţi (4.33) urmează aceleaşi idei. 

Întrucât dimW = n−k, există un vector x ∈ W S astfel încât vectorul y = Q H x are 

componentele k+1 : n nule (demonstraţi!). Pentru această alegere a lui x avem o 

relaţie de forma (4.40) 


k−1 

∑ 

µ(x) = x H Ax = y H Λy = (λ j −λ k )|y (j) | 2 +λ k ≥ λ k , (4.42) 

j=1 

max x H Ax ≥ λ k . (4.43) 

x ∈ W S 

Cum subspaţiul (n−k)-dimensional W a fost arbitrar, rezultă că inegalitatea (4.43) 

are loc în toate subspaţiile de această dimensiune sau, altfel spus, 

min 

dimV = k 

max x H Ax ≥ λ k . (4.44) 

x ∈ W S 

Adăugând faptul că marginea din (4.44) se atinge efectiv în subspaţiul W = ImQ ′′ 

k , 

cea de a doua egalitate (4.33), şi o dată cu ea întreaga teoremă, sunt complet 

demonstrate. 

✸ 

Teorema Courant – Fisher este importantă, în contextul calculatoriu al acestei 

lucrări, prin consecinţele sale, dintre care câteva sunt prezentate în continuare. 

Notăm A [k] def 

= A(1:k,1:k) submatricele lider principale de ordinul k ale matricei 

hermitice A ∈ IC n×n , care sunt la rândul lor, evident, hermitice. Presupunem 

că spectrele λ(A [k] ) = {λ [k] 

1 ,λ[k] 2 ,...,λ[k] k 

} (evident, reale) ale submatricelor lider 

principale sunt, şi ele, ordonate descrescător, i.e. 

λ [k] 

1 ≥ λ [k] 

2 ≥ ... ≥ λ [k] 

k . (4.45) 

Teorema 4.5 (Teoremade separare) Valorile proprii ale submatricelor lider principale 

de ordinul k ale unei matrice hermitice separă valorile proprii ale submatricelor 

lider principale de ordinul k +1, i.e. 

λ [k+1] 

1 ≥ λ [k] 

1 ≥ λ [k+1] 

2 ≥ λ [k] 

2 ≥ ... ≥ λ [k] 

k−1 ≥ λ[k+1] k 

≥ λ [k] 

k ≥ λ[k+1] k+1 , (4.46) 

pentru toţi k ∈ 1 : n−1. 

Demonstraţie. Este suficient să considerăm cazul k = n−1. Pentru simplificarea 

notaţiilor, fie λ ′ def 

i = λ [n−1] 

i , i = 1 : n−1. Cu aceste notaţii, este suficient să dovedim 

inegalităţile 

λ i ≥ λ ′ i ≥ λ i+1 , i = 1 : n−1. (4.47)


Avem, evident, 

x H A [n−1] x = [ x H 

0 ] [ x 

A 

0 

] 

, ∀x ∈ IC n−1 . (4.48) 

Pe această bază, între mulţimile 

M i = { µ ∈ IR 

µ = max x∈WS x H Ax, W ⊂ IC n , dimW = n−i 

} 

, (4.49) 

M ′ i ={ µ ′ ∈ IR µ ′ =max x∈WS x H A [n−1] x, W ⊂ IC n−1 , dimW = n−1−i } , 

(4.50) 

există relaţiile 

M i ⊆ M ′ i ⊆ M i+1, (4.51) 


minM i+1 ≤ minM ′ i ≤ minM i , (4.52) 

inegalităţi care, în baza teoremei Courant-Fisher, sunt echivalente cu (4.47). Teorema 

este demonstrată. 

✸ 

O relaţie dintre valorile proprii a două matrice hermitice şi valorile proprii ale 

sumei lor, utilă în aprecierea influenţei perturbaţiilor numerice hermitice, este dată 

în teorema următoare. 

Teorema 4.6 Dacă matricele hermitice A,E ∈ IC n×n au spectrele ordonate descrescător, 

atunci, cu notaţii evidente, avem 

pentru toţi k ∈ 1 : n. 

λ k (A)+λ 1 (E) ≥ λ k (A+E) ≥ λ k (A)+λ n (E) (4.53) 

Demonstraţie. Conform teoremei Courant-Fisher 

λ k (A+E) = 

≤ 

≤ 

min 

dimV = k 

max x H (A+E)x ≤ 

x ∈ W S 

min 

dimV = k ( x max x H Ax+ max x H Ex) ≤ 

∈ W S x ∈ W S 

min 

dimV = k ( x max x H Ax+λ 1 (E)) = λ k (A)+λ 1 (E). (4.54) 

∈ W S 

Pentru a demonstra a doua inegalitate (4.53) avem, similar, 

λ k (A+E) = max 

dimV = k 

min x H (A+E)x ≥ 

x ∈ V S 

≥ max 

dimV = k ( min 

x ∈ V S 

x H Ax+ min 

x ∈ V S 

x H Ex) ≥ 

≥ max 

dimV = k ( x min x H Ax+λ n (E)) = λ k (A)+λ n (E). 

∈ V S 

(4.55) 

Teorema este demonstrată. 

✸ 

În sfârşit, cu notaţiile utilizate în teorema 4.8, formulăm următorul rezultat 

util, de asemenea, în evaluarea influenţelor perturbaţiilor numerice asupra valorilor 

proprii ale matricelor hermitice.


Teorema 4.7 (Wielandt – Hoffmann) Dacă matricele A,E ∈ IC n×n sunt hermitice, 

atunci 

n∑ 

(λ j (A+E)−λ j (A)) 2 ≤ ‖E‖ 2 F, (4.56) 

∑ i−1 

j=1 |e ij| 2 = √ ∑ n 

i=1 λ2 i (E) este norma Fro- 

unde ‖E‖ F = 

benius a matricei E. 

j=1 

√ ∑n 

i=1 |e ii| 2 +2 ∑ n 

i=2 

Demonstraţie. Pentru demonstraţie se poate consulta [IV]. 

Un rezultat remarcabil, de o factură aparte, se referă la inerţia unei matrice. 

Inerţia unei matrice hermitice A ∈ IC n×n se defineşte prin tripletul (n − ,n 0 ,n + ) 

unde n − este numărul valorilor proprii negative, n 0 este numărul valorilor proprii 

nule şi, respectiv, n + este numărul valorilor proprii pozitive ale matricei A. De 

asemenea, se spune că două matrice (hermitice) A,B ∈ IC n×n sunt congruente dacă 

există o matrice nesingulară T ∈ IC n×n astfel încât B = T H AT. Rezultatul, datorat 

lui Sylvester, are următorul enunţ. 

Teorema 4.8 Două matrice hermitice congruente au aceeaşi inerţie. 

Demonstraţie. Fie A ∈ IC n×n hermitică, B = T H AT cu T nesingulară şi λ k (A) 

o valoare proprie nenulă a matricei A. Presupunem că spectrele matricelor A şi B 

sunt ordonate descrescător. Conform teoremei Courant-Fisher avem 

λ k (B) = max 

dimV = k 

min x H Bx ≥ min x H x H Bx 

Bx = min 

x ∈ V S x ∈ ṼS x ∈ Ṽ∗ x H x , (4.57) 

unde Ṽ este orice subspaţiu particular de dimensiune k, iar Ṽ∗ = Ṽ \ {0}. Considerând 

Ṽ = ImT−1 Q ′ k , cu Q′ k definit în (4.27), avem x ∈ Ṽ∗ dacă şi numai dacă 

x = T −1 Q ′ k z cu z ∈ ICk , z ≠ 0. Pe de altă parte, matricea R def 

= TT H este hermitică, 

pozitiv definită (i.e. x H Rx > 0, ∀x ≠ 0) şi, prin urmare, are spectrul real şi 

pozitiv (demonstraţi!) aceleaşi proprietăţi avându-le şi matricea R −1 = T −H T −1 . 

Cu aceste precizări, pentru toţi x ∈ Ṽ∗ , avem 

{ 

x H Bx = x H T H QΛ A Q H Tx = z H diag(λ 1 (A),λ 2 (A),...,λ k (A))z 

x H x = z H Q ′H 

k R−1 Q ′ k z, , (4.58) 

de unde, ţinând seama de ordonarea valorilor proprii, rezultă 

✸ 

Cu aceste inegalităţi, din (4.57), obţinem 

⎧ 

⎪⎨ 

⎪⎩ 

x H Bx ≥ λ k (A)z H z 

λ min (R −1 )z H z ≤ x H x ≤ λ max (R −1 )z H z. 

λ k (B) ≥ 

λ k(A) 

λ max (R −1 ) , dacă λ k(A) > 0 

λ k (B) ≥ λ k(A) 

λ min (R −1 ) , dacă λ k(A) < 0. 

(4.59) 

(4.60)


Schimbând rolul matricelor A şi B, cu un raţionament analog obţinem următoarele 

corespondente ale relaţiilor (4.60) 

{ 

λk (B) ≤ λ max (R)λ k (A), dacă λ k (A) > 0 

(4.61) 

λ k (B) ≤ λ min (R)λ k (A), dacă λ k (A) < 0. 

În concluzie, în toate cazurile, αλ k (A) ≤ λ k (B) ≤ βλ k (A) cu α > 0, β > 0, i.e. 

λ k (A) şi λ k (B) au acelaşi semn. Rezultă că A şi B au aceeaşi inerţie. ✸ 

În contextul acestuiparagrafeste natural săintroducem matriceleantihermitice, 

respectiv antisimetrice în cazul real. 

Definiţia 4.5 Matricea A ∈ IC n×n se numeşte antihermitică dacă 

A H = −A. (4.62) 

În cazul real, matricea A ∈ IR n×n se numeşte antisimetrică dacă 

A T = −A. (4.63) 

O matrice antihermitică are elementele diagonale pur imaginare. Este uşor de observat 

că dacă matricea complexă A este antihermitică, atunci matricea B = −iA 

este hermitică. În consecinţă, A este unitar diagonalizabilă şi are toate valorile 

proprii pur imaginare. Matricele antihermitice sunt normale. 

În cazul real, o matrice antisimetrică are elementele diagonale nule. Dacă A 

este antisimetrică, atunci B = −iA este o matrice complexă hermitică. Rezultă 

că A este unitar diagonalizabilă şi are toate valorile proprii pur imaginare. Cum, 

în această situaţie, valorile proprii apar în perechi complex conjugate rezultă că o 

matrice antisimetrică de ordin impar are, în mod necesar, o valoare proprie nulă, 

i.e. este singulară. Evident, o matrice antisimetrică este normală. 

Ultimulrezultatpecareîlprezentămsereferălavalorileşivectoriipropriipentru 

matricele unitare şi ortogonale. 

Teorema 4.9 O matrice n×n complexă A este unitară dacă şi numai dacă admite 

un set complet de n vectori proprii ortogonali şi toate valorile proprii sunt de modul 

unitar, adică este unitar diagonalizabilă cu spectru unitar, respectiv există o matrice 

unitară Q ∈ IC n×n astfel încât 

Q H AQ = Λ = diag(λ 1 ,λ 2 ,...,λ n ) cu |λ i | = 1, ∀ λ i . (4.64) 

În cazul real matricea A este ortogonală dacă şi numai satisface aceleaşi condiţii, 

i.e. este unitar diagonalizabilă cu spectru unitar. 

Demonstraţie. O matrice unitară A ∈ IC n×n fiind normală, conform teoremei 

4.1, este unitar diagonalizabilă, i.e. există o matrice unitară Q ∈ IC n×n astfel încât 

Q H AQ = Λ = diag(λ 1 ,λ 2 ,...,λ n ), de unde rezultă A = QΛQ H . În plus, din 

A H A = I n obţinem ¯ΛΛ = I n , i.e. ¯λj λ j = |λ j | 2 = 1, de unde rezultă |λ j | = 1, 

j = 1 : n. Deci toate valorile proprii sunt de modul unitar, i.e. pot fi scrise sub 

forma λ j = e iθj , cu θ j ∈ IR, j = 1 : n. Reciproc, dacă avem Q H AQ = Λ, cu Q


unitară şi Λ diagonală cu elementele diagonale de modul unitar, atunci prin calcul 

direct rezultă imediat A H A = I n , i.e. A este unitară. În cazul real demonstraţia 

este identică cu singura menţiune suplimentară că alături de orice valoare proprie 

complexă λ j = e iθj ∈ IC\IR apare şi conjugata ei λ j = e −iθj . ✸ 

Observaţia 4.2 Este simplu de constatat că dacă o matrice complexă A este 

normală, hermitică sau unitară, atunci orice matrice B unitar asemenea cu A are 

aceleaşi proprietăţi. Similar, în cazul real, proprietăţile de normalitate, simetrie şi 

ortogonalitate sunt conservate de transformările ortogonale de asemănare. Această 

invarianţă explică utilizarea exclusivă a transformărilor unitare (ortogonale) în demersul 

calculatoriu legat de valorile şi vectorii proprii. 

✸ 

Încheiem acest paragraf cu precizarea că principala proprietate comună a celor 

trei tipuri de matrice menţionate mai sus, indusă de proprietatea de normalitate, 

constă în faptul că toate admit seturi complete de vectori proprii ortogonali, fapt 

care le conferă o perfectă condiţionare a spectrelor de valori proprii (v. § 4.10). 

4.1.5 Localizarea valorilor proprii 

În finalul acestei secţiuni introductive vom prezenta câteva rezultate privitoare la 

localizarea valorilor proprii în planul complex, rezultate utile atât prin ele însele cât 

şi în contextul stabilirii iniţializărilor pentru diverse metode iterative de calcul sau 

al analizei sensibilităţii valorilor proprii la perturbaţii în matricea dată. 

Unele din cele mai cunoscute rezultate în această privinţă sunt oferite de teoremele 

următoare. 

Teorema 4.10 Oricare ar fi matricea A ∈ IC n×n şi ‖·‖ o familie arbitrară de norme 

consistente avem 

ρ(A) ≤ ‖A‖. (4.65) 

Demonstraţie. Din proprietatea de consistenţă a familiei de norme pentru orice 

λ ∈ λ(A) şi vector propriu asociat x cu ‖x‖ = 1 avem |λ| = ‖λx‖ = ‖Ax‖ ≤ 

≤ ‖A‖‖x‖ = ‖A‖, de unde rezultă (4.65) 9 . 

✸ 

Teorema 4.11 (Gershgorin) Valorile proprii ale unei matrice A ∈ IC n×n sunt situate 

în domeniul D din planul complex definit de 

D = 

n⋃ 

D i , (4.66) 

i=1 

9 Există şi un rezultat, datorat lui Householder (v. exerciţiul 4.32), care arată că pentru 

orice ε > 0 există o normă consistentă ‖ · ‖ astfel încât ‖A‖ ≤ ρ(A) + ε, relaţie care, împreună 

cu (4.65), permite aproximarea oricât de bună a razei spectrale a unei matrice cu ajutorul unei 

norme a acesteia. Din păcate, această normă este o normă specială care depinde de A şi ε, astfel 

că rezultatul menţionat are o valoare în primul rând teoretică.


unde D i sunt discurile 

numite discuri Gershgorin. 

D i = {z ∈ IC | |z −a ii | ≤ 

n∑ 

|a ij |}, i = 1 : n, (4.67) 

j=1 

j≠i 

Demonstraţie. Fie x un vector propriu asociat valorii proprii λ ∈ λ(A). Atunci 

linia i a relaţiei Ax = λx se scrie 

(λ−a ii )x i = 

n∑ 

a ij x j , (4.68) 

de unde rezultă |λ − a ii ||x i | ≤ ∑ n 

j=1 |a ij ||x j |. Alegând linia i astfel încât |x i | = 

j≠i 

= max k=1:n (|x k |) ≠ 0, rezultă 

|λ−a ii | ≤ 

j=1 

j≠i 

n∑ 

|a ij | |x j| 

n 

|x i | ≤ ∑ 

|a ij |, (4.69) 

j=1 

j≠i 

j=1 

j≠i 

i.e. λ ∈ D i . 

✸ 

Dacă o linie a matricei A are elementele extradiagonale nule, atunci elementul 

diagonal este o valoare proprie a matricei A, iar discul Gershgorin corespunzător 

liniei respective se reduce la punctul {a ii }. De asemenea, se poate arăta [I] că dacă 

m discuri Gershgorin formează o mulţime disjunctă de mulţimea celorlalte n −m 

discuri, atunci exact m valori proprii se găsesc situate în reuniunea celor m discuri. 

În particular, un disc disjunct de celelalte conţine exact o valoare proprie 10 . 

✻Imλ 

✻Imλ 

✬✩ ✬✩ 

λ 2 

✓✏ ✓✏ ✓✏λ 2 

✓✏ 

× λ 1 Reλ 

× ✲ × λ 1 Reλ 

× ✲ 

× 

× 

λ 3 ✒✑ ✒✑ ✒✑λ 3 ✒✑ 

✫✪ ✫✪ 

a) b) 

Fig. 4.2: Utilizarea discurilor Gershgorin ”pe linii” (a) şi ”pe coloane” (b) pentru 

localizarea valorilor proprii ai matricei din exemplul 4.2. 

10 Discurile Gershgorin (4.67) ar putea fi denumite discuri-linie întrucât sunt construite cu 

ajutorul liniilor matricei date. Cum transpusa matricei are acelaşi spectru, aplicând teorema 

4.11 matricei transpuse obţinem o localizare a valorilor proprii în reuniunea discurilor Gershgorin 

definite pe coloane. Evident, o localizare mai bună se obţine intersectând cele două domenii.

4.2. FORMA SCHUR 227 

Exemplul 4.2 Considerăm matricea 

⎡ 

A = 

⎣ 1 0 1 

1 5 0 

−1 1 −1 

pentru care cele trei discuri Gershgorinsunt D 1 de centru 1 şi rază1, D 2 de centru 5 

şirază1şiD 3 decentru-1şirază2(v. fig. 4.2), iarvalorilepropriisuntλ 1 = 5.0394, 

λ 2,3 = −0.0197± 0.4450i. Raza spectrală este deci ρ(A) = 5.0394, inferioară e.g. 

normei ‖A‖ F 

= 5.5678. 

✸ 

Teoremalui Gershgorineste utilă, de exemplu, pentru deciziile de neglijareaelementelor 

extradiagonale la o precizie fixată a valorilor proprii calculate în tehnicile 

de diagonalizareiterativăprintransformăride asemănare. Generalizărialeteoremei 

4.11 fac obiectul exerciţiilor 4.40 şi 4.41. Alte rezultate privind localizarea valorilor 

proprii se pot găsi în [I], [II]. 

⎤ 

⎦ 

4.2 Forma Schur 

Transformările de asemănare unitare, respectiv ortogonale în cazul real, prezintă 

marele avantaj de a conserva condiţionarea spectrului de valori proprii ale unei 

matrice date (v. §4.10). De aceea vom fi interesaţi în utilizarea lor exclusivă pentru 

determinarea valorilor proprii. Pe de altă parte, structurile canonice, cum este 

formaJordan, nuse pot obţine, îngeneral, prin astfelde transformări 11 . Rezultatul 

principalalacestuiparagrafaratăcăoricematriceesteunitar asemeneacuomatrice 

triunghiulară, numită forma Schur. În acest fel este posibilă evidenţierea valorilor 

proprii ale unei matrice (elementele diagonale ale formei sale Schur), utilizând o 

secvenţă de transformări unitare de asemănare. 

4.2.1 Forma Schur (complexă) 

Calculul valorilor proprii ale unei matrice este intim legat de calculul vectorilor 

proprii asociaţi. Dacă λ ∈ λ(A) este cunoscută, atunci vectorul propriu asociat este 

o soluţie nenulă a unui sistem liniar omogen. Dacă se cunoaşte un vector propriu x 

al matricei A, atunci valoarea proprie asociată poate fi calculată cu relaţia 

x H Ax 

x H x = xH λx 

x H x = λ (4.70) 

care, pentru x de normă euclidiană unitară, i.e. ‖x‖ = 1, devine 

λ = x H Ax. (4.71) 

Întrucât valorile proprii sunt rădăcinile unei ecuaţii algebrice, calculul lor pentru 

matrice de ordin superior lui patru, în absenţa cunoaşterii vectorilor proprii, este 

11 Matricele normale, care sunt unitar diagonalizabile (v. teorema 4.10), nu constituie un caz 

generic.


în mod necesar un proces (iterativ) infinit, aceeaşi situaţie apărând şi la calculul 

vectorilor proprii fără a se cunoaşte valorile proprii asociate. 

De aceea, una din ideile aflate la baza asigurării eficienţei tehnicilor de calcul 

a valorilor şi vectorilor proprii este exploatarea rezultatelor parţiale prin reducerea 

corespunzătoare a dimensiunii problemei. În sprijinul aplicării acestei idei vin 

următoarele rezultate. 

Propoziţia 4.2 Fie A ∈ IC n×n şi X ⊂ IC n un subspaţiu A-invariant p-dimensional 

dat printr-o bază ortogonală x 1 , x 2 , ..., x p . Atunci există o matrice unitară Q ∈ 

∈ IC n×n cu Q(:,j) = x j , j = 1:p, astfel încât 

[ ] 

Q H S11 S 

AQ = 12 

, (4.72) 

0 S 22 

cu S 11 ∈ IC p×p . 

În cazul real, i.e. A ∈ IR n×n şi X ⊂ IR n , matricea Q poate fi reală (i.e. ortogonală), 

iar matricea reală Q T AQ are structura (4.72). 

Demonstraţie. Fie Q(:,1:p) = X def 

= [x 1 x 2 ··· x p ] şi Y ∈ IC n×(n−p) o bază 

ortogonală a complementului ortogonal Y = X ⊥ al lui X în IC n . Atunci matricea 

Q = [X Y ] este unitară. Conform propoziţiei 4.1, punctul 2 ◦ , există o matrice 

S 11 ∈ IC p×p cu λ(S 11 ) ⊂ λ(A) astfel încât AX = XS 11 , i.e. X H AX = S 11 . În plus 

Y H AX = Y H XS 11 = 0. În consecinţă avem 

[ ] 

S=Q H X 

H 

AQ= 

Y H A [ X Y ] [ ] [ ] 

X 

= 

H AX X H AY S11 S 

Y H AX Y H = 12 

AY 0 S 22 

(4.73) 

unde, evident, S 12 = X H AY, S 22 = Y H AY. q.e.d. 

În cazul real, conform aceleiaşi propoziţii 4.1, toate subspaţiile implicate în 

demonstraţia de mai sus sunt în IR n , iar matricea Q este ortogonală. Evident, în 

acest caz spectrul matricei S 11 este o submulţime simetrică a spectrului matricei A. 

Demonstraţia este completă. 

✸ 

Observaţia 4.3 CalcululmatriceiunitaredeasemănareQestecondiţionatesenţial 

de cunoaşterea unei baze V = [v 1 v 2 ··· v p ] a subspaţiului A-invariant X. În acest 

caz, construcţia unei baze ortogonale X a lui X şi a unei completări ortogonale Y 

se poate face după recomandările din capitolul 3. Concret, dacă 

[ ] 

R1 

V = Q 

0 

este factorizarea QR (complexă) a matricei V, unde Q ∈ IC n×n este unitară, iar 

R 1 ∈ IC p×p este nesingulară, atunci X = Q(:,1 : p), Y = Q(:,p +1 : n) sunt 

cele două baze ortogonale căutate, iar Q este matricea de transformare unitară de 

asemănare din (4.72). 

✸ 

Pentru p = 1 baza V a subspaţiului A-invariant din propoziţia 4.2 se reduce 

la un vector propriu x de normă unitară asociat valorii proprii λ. În acest caz 

propoziţia 4.2 se particularizează în următoarea lemă.


Lema 4.2 (Deflaţie unitară) Fie A ∈ IC n×n şi λ ∈ λ(A). Atunci există o matrice 

unitară Q ∈ IC n×n astfel încât 

[ ] λ 

Q H S12 

AQ = . (4.74) 

0 S 22 

Conform observaţiei 4.3, matricea de transformare poate fi Q = U H 1 , unde U 1 este 

reflectorul (complex) care anulează elementele 2 : n ale vectorului propriu x asociat 

valorii proprii λ. 

Aplicarea consecventă a lemei 4.2 ne conduce la următorul rezultat important. 

Teorema 4.12 (Forma Schur) Oricare ar fi matricea A ∈ IC n×n există o matrice 

unitară Q ∈ IC n×n astfel încât matricea 

Q H AQ = S, (4.75) 

este superior triunghiulară. Elementele diagonale ale matricei S sunt valorile proprii 

ale matricei A şi pot fi dispuse în orice ordine predeterminată. 

Matricea S se numeşte forma Schur (FS) a matricei A, iar coloanele matricei 

de transformare Q se numesc vectori Schur ai matricei A asociaţi formei Schur S. 

Demonstraţie. Pasul 1 ◦ . Conform lemei 4.2, dacă λ 1 ∈ λ(A), atunci există o 

matrice unitară Q 1 astfel încât 

⎡ ⎤ 

S 1 = Q H 1 AQ 1 = ⎣ λ 1 S (1) 

12 

0 S (1) ⎦, 

22 

realizându-se o deflaţie în prima coloană. 

Pasul k ◦ . Presupunem că în primii k − 1 paşi am realizat triangularizarea în 

primele k −1 coloane prin transformări unitare de asemănare 

S k−1 = Q H k−1 ... Q H 2 Q H 1 AQ 1 Q 2 ... Q k−1 = 

⎡ 

⎣ S(k−1) 11 S (k−1) 

12 

0 S (k−1) 

22 

⎤ 

⎦, 

unde S (k−1) 

11 ∈ IC (k−1)×(k−1) este superior triunghiulară. Vom aplica lema 4.2 pentru 

a realiza deflaţia în coloana k. Pentru aceasta, dacă λ k ∈ λ(S (k−1) 

22 ), atunci există 

o matrice unitară ˜Q k astfel încât 

˜Q H k S(k−1) 22 

˜Q k = 

[ 

λk Ŝ (k) 

12 

0 S (k) 

22 

] 

. 

Acum, matricea 

Q k = 

[ 

Ik−1 0 

0 ˜Qk 

] 

∈ IC n×n


este unitară şi 

S k = Q H k S k−1 Q k = 

[ 

(k) S 11 S (k) 

12 

0 S (k) 

22 

este superior triunghiulară în primele k coloane. 

Procesul de triangularizare prin transformări unitare de asemănare, iniţiat conform 

pasului 1 ◦ şi continuat conform celor prezentate la pasul k ◦ , produce după 

n−1 paşi matricea superior triunghiulară 

unde matricea 

S = Q H AQ, 

Q = Q 1 Q 2 ... Q n−1 , (4.76) 

este unitară ca produs de matrice unitare. 

Evident, ordinea elementelor diagonale ale matricei S poate fi aleasă în mod 

arbitrar prin selectarea corespunzătoare a vectorilor proprii în aplicarea lemei 4.2. 


✸ 

Încheiem paragrafulsubliniind faptul că oricematrice pătrată este unitar asemeneacu 

omatricesuperiortriunghiulară. DacămatriceaAeste reală,darareşivalori 

proprii complexe, atunci forma Schur S este complexă ca şi matricea de transformare 

Q. În acest caz se spune că S este forma Schur complexă (FSC) a matricei A. 

] 

4.2.2 Forma Schur reală 

În majoritateaaplicaţiilor încareestenecesarcalcululvalorilorproprii, matriceaare 

elementele reale. În aceste situaţii este mult mai eficientă utilizarea unei aritmetici 

reale. Pentru aceasta, perechile de valori proprii complexe şi perechile de vectori 

propriiasociaţi(care,dupăcums-amaiprecizat,potficonsideraţi, larândullor,sub 

forma unor vectori complex conjugaţi) trebuie şi pot fi tratate în mod unitar, într-o 

aritmetică reală, prin intermediul unor blocuri matriceale 2 ×2, respectiv al unor 

subspaţii A-invariantereale. Corespondentulformei Schurdin cazulcomplex devine 

o matrice cvasi-superior triunghiulară în care perechile de valori proprii complex 

conjugate sunt evidenţiate prin blocuri diagonale 2×2, numită forma Schur reală. 

În acest context vom formula şi, în măsura încare apar aspecte noi, vom demonstra 

corespondentele ”reale” ale lemei 4.2 şi teoremei 4.12. 

Lema 4.3 (Deflaţie ortogonală) Fie A ∈ IR n×n . 

a) Dacă λ ∈ λ(A)∩IR, atunci există o matrice ortogonală Q ∈ IR n×n astfel încât 

[ ] 

Q T λ S12 

AQ = . (4.77) 

0 S 22 

b) Dacă λ 1,2 = α±iβ ∈ λ(A), β ≠ 0, atunci există o matrice ortogonală Q ∈ IR n×n 

astfel încât 

[ ] 

Q T S11 S 

AQ = 12 

, (4.78) 

0 S 22


unde 

S 11 ∈ IR 2×2 , cu λ(S 11 ) = {λ 1 ,λ 2 }. (4.79) 

Demonstraţie. Prima parte a lemei se demonstreazăla fel cu lema 4.2 considerând 

o matrice ortogonală Q a cărei primă coloană este un vector propriu de normă 

euclidiană unitarăasociat valoriipropriiλ. Pentruadouaparte a lemei considerăm 

vectorii proprii x 1,2 = v 1 ± iv 2 asociaţi valorilor proprii complex conjugate λ 1,2 şi 

Y = [y 1 y 2 ] ∈ IR n×2 o bază ortogonală a subspaţiului liniar A-invariant S = ImV, 

unde V = [v 1 v 2 ] ∈ IR n×2 şi Z ∈ IR n×(n−2) o bază ortogonală a complementului 

ortogonal T = S ⊥ a lui S în IR n 12 . Evident, matricea Q = [Y Z] este ortogonală. 

Pe de altă parte, întrucât vectorii v 1 şi v 2 sunt liniar independenţi (vezi propoziţia 

4.1), există o matrice nesingulară P[ ∈ IR 2×2 astfel ] încât V = YP. În consecinţă, 

α −β 

din (4.14) avem AV = VB cu B = . Rezultă 

β α 

unde 

şi, deci, 

A 1 = Q T AQ = 

AY = AVP −1 = VBP −1 = YS 11 , 

[ 

α −β 

S 11 = P 

β α 

[ ] 

Y 

T 

Z T A [ Y Z ] [ 

Y 

= 

T AY Y T AZ 

0 Z T AZ 

] 

P −1 . (4.80) 

] 

= 

[ ] 

S11 S 12 

, 

0 S 22 

(4.81) 

punându-se în evidenţă blocul diagonal de ordinul 2 real S 11 având valorile proprii 

complexe λ 1,2 . 

✸ 

Calculul matricei ortogonale de asemănare Q din lema de mai sus este condiţionat 

esenţial de cunoaşterea unui vector propriu (real) x asociat valorii proprii reale 

evidenţiate respectiv a parţii reale si a celei imaginare a unui vector propriu asociat 

unei valori proprii complexe. Altfel spus, posibilitatea deflaţiei este condiţionată de 

cunoaşterea subspaţiului A-invariant corespunzător. 

Procedând ca în demonstraţia teoremei 4.12, i.e. efectuând deflaţia matricei 

A pentru valorile proprii reale, respectiv pentru perechile de valori proprii complexe, 

prin aplicarea sistematică a lemei de mai sus, până la epuizarea întregului 

spectru şi cumulând transformările ortogonale parţiale, obţinem următorul rezultat 

important. 

Teorema 4.13 (Forma Schurreală) Oricare ar fi matricea reală A ∈ IR n×n , există 

o matrice ortogonală Q ∈ IR n×n astfel încât 

⎡ ⎤ 

S 11 S 12 ··· S 1p 

Q T AQ = S = ⎢ 0 S 22 ··· S 2p 

⎥ 

⎣ ··· ··· ··· ··· ⎦ , (4.82) 

0 0 ··· S pp 

12 Pentru construcţia acestor baze vezi observaţia 4.3.


unde S ii ∈ IR 1×1 sau S ii ∈ IR 2×2 şi toate blocurile diagonale 2×2 au valorile proprii 

complexe. Avem, evident, 

λ(A) = λ(S) = 

p⋃ 

λ(S ii ). (4.83) 

Matricea cvasi-superior triunghiulară S se numeşte forma Schur reală (FSR) a matricei 

A, iar coloanele matricei de transformare Q se numesc vectori Schur ai matricei 

A asociaţi formei Schur reale S. 

Evident, ordinea paşilor de deflaţie fiind arbitrară, forma Schur reală a unei 

matrice poate avea blocurile diagonale în orice ordine predeterminată. 

Conform (4.83) valorile proprii reale ale unei matrice pot fi determinate prin 

simplăinspecţieaelementelordiagonalealeformeisaleSchurreale,iarcelecomplexe 

se pot calcula prin rezolvarea ecuaţiilor caracteristice (de gradul 2) ale blocurilor 

diagonale ale acesteia. 

Procedura de deflaţie sugerează o tehnică de calcul a valorilor proprii ale unei 

matrice prin reducerea acesteia la forma Schur (reală). Din păcate, punerea în 

evidenţă a fiecărei valori proprii necesită cunoaşterea unui vector propriu asociat, 

care, la rândul său, nu poate fi calculat direct fără a cunoaşte valoarea proprie 

respectivă. De aceea, procedura de deflaţie trebuie să fie completată cu o metodă 

de calcul a unui vector propriu fără cunoaşterea valorii proprii asociate. 

Metodelecelemaifolositedecalculiterativalunuivectorpropriusuntcunoscute 

sub denumirile de metoda puterii şi metoda puterii inverse. 

i=1 

4.3 Metoda puterii. Metoda puterii inverse 

În această secţiune vom prezenta două modalităţi de construcţie recurentă a unor 

şiruri de vectori convergente, în condiţii precizate, către un vector propriu al unei 

matrice date. Aceste metode se bazează pe următorul rezultat simplu, a cărui 

demonstraţie face obiectul exerciţiului 4.11. 

Lema 4.4 Fie o matrice A ∈ IC n×n cu spectrul 

λ(A) = {λ 1 ,λ 2 ,...,λ n }. (4.84) 

Atuncimatricele A k , k ∈ IN ∗ , A−µI n , µ ∈ IC, şi, în cazul în care A este nesingulară, 

A −1 au aceiaşi vectori proprii cu matricea A şi spectrele 

λ(A k ) = {λ k 1 ,λk 2 ,...,λk n }, (4.85) 

λ(A−µI n ) = {λ 1 −µ,λ 2 −µ,...,λ n −µ}, (4.86) 

{ } 1 

λ(A −1 1 1 

) = , ,..., . 

λ 1 λ 2 λ n 

(4.87)

4.3. METODA PUTERII. METODA PUTERII INVERSE 233 

4.3.1 Metoda puterii 

Considerăm o matrice A ∈ IC n×n care are o valoare proprie dominantă, i.e. o valoare 

proprie de modul strict superior modulelor tuturor celorlalte. Numerotăm valorile 

proprii ale matricei A în ordinea descrescătoare a modulelor 

|λ 1 | > |λ 2 | ≥ |λ 3 | ≥ ... ≥ |λ n |. (4.88) 

Fie y (0) ∈ IC n un vector de normă euclidiană unitară a cărui proiecţie ortogonală 

pe ”direcţia” vectorului propriu x 1 asociat valorii proprii dominante λ 1 ∈ λ(A) este 

nenulă, i.e. x H 1 y(0) ≠ 0. Generic, un vector aleator normat satisface o astfel de 

condiţie. Dacă A este o matrice simplă, i.e. există o bază a spaţiului IC n formată 

din vectorii proprii x 1 , x 2 , ..., x n ai acesteia, atunci y (0) poate fi descompus, în mod 

unic, în raport cu acestă bază 

unde 

y (0) = 

n∑ 

γ i x i , (4.89) 

i=1 

Dacă definim şirul vectorial (y (k) ) k∈IN prin 

γ 1 ≠ 0. (4.90) 

y (k) = ρ k Ay (k−1) , k = 1,2,··· (4.91) 

cu iniţializarea y (0) şi ρ k un factor de normare definit de 

ρ k = 

atunci, folosind inducţia, este uşor de arătat că 

1 

‖Ay (k−1) ‖ , (4.92) 

y (k) = ˜ρ k A k y (0) , (4.93) 

unde ˜ρ k este un factor de normare cumulat ˜ρ k = 1/‖A k y (0) ‖. Din (4.89), (4.93) şi 

lema 4.2 rezultă 

∑ n n 

( ) 

∑ 

n∑ 

y (k) = ˜ρ k A k x i = ˜ρ k γ i λ k i x i = ˜ρ k λ k 1 γ 1 x 1 + γ i ( λ i 

) k x i . (4.94) 

λ 1 

i=1 

i=1 

∣ ∣∣ 

Utilizând (4.88) obţinem ∣ λi 

λ 1 

< 1, i = 2 : n, de unde rezultă 

şi 

i=2 

( ) k λi 

lim = 0, i = 2 : n, (4.95) 

k→∞ λ 1 

lim 

k→∞ y(k) = γx 1 , (4.96) 

în care γ este un scalar nenul astfel încât ‖γx 1 ‖ = 1. Prin urmare, şirul vectorial 

construit cu schema de calcul


MP 1. Pentru k = 1,2,... 

1. Se calculează vectorul y (k) = Ay (k−1) 

2. y (k) ← y (k) /‖y (k) ‖ 

bazată pe relaţia de recurenţă (4.91), care defineşte metoda puterii, este convergent 

către vectorul propriu (4.95) asociat valorii proprii dominante a matricei A. Viteza 

de convergenţă este determinată de raportul |λ 2 /λ 1 |, fiind cu atât mai mare cu cât 

acest raport este mai mic. În consecinţă, metoda este eficientă în cazul matricelor 

care au o valoare proprie net dominantă şi o structură cu multe elemente nule (în 

vederea unei implementări eficiente a produsului Ay (k−1) ). 

Pentru oprirea iterării este necesar un criteriu care să asigure o precizie de calcul 

impusă. Având în vedere faptul că un vector propriu de normă unitară este 

determinat până la o multiplicare cu un număr de modul unitar (i.e. e iθ cu θ ∈ IR 

în cazul complex şi ±1 în cazul real), un criteriu posibil este asigurarea unei colinearităţi 

impuse între vectorii calculaţi la doi paşi consecutivi. Cum, în cazul 

complex unghiul dintre doi vectori u şi v este definit de φ(u,v) = arccos 

iar în cazul real de φ(u,v) = arccos 

v H u 

‖u‖·‖v‖ 

v T u 

, condiţia de oprire a iterării poate fi 

‖u‖·‖v‖ 

e k = |1−|(y (k) ) H y (k−1) || < tol, respectiv e k = |1−|(y (k) ) T y (k−1) || < tol, 

(4.97) 

unde tol esteotoleranţăprescrisă(vezi şiexerciţiul 4.48). Introducândşi abandonul 

iterării la atingerea unui număr maxim de iteraţii, obţinem următorul algoritm. 

Algoritmul 4.1 (Metoda puterii) (Dată o matrice A ∈ IC n×n , un 

niveldetoleranţătol ∈ IR, tol > 1,şiunnumărmaximadmismaxiterde 

iteraţii, algoritmul calculează un vector propriu unitar y asociat valorii 

propriidominanteamatricei date sautipăreşteun mesajdacăobiectivul 

nu a fost atins în numărul de iteraţii admis.) 

1. Se alege aleator un vector y ∈ IC n . 

2. y ← y/‖y‖ 

3. i = 0, e = 1 

4. Cât timp e > tol 

1. Dacă i > maxiter atunci 

1. Tipăreşte ’S-a atins numărul maxim de iteraţii fără a se 

fi obţinut nivelul prescris al toleranţei.’ 

2. Stop 

2. z = Ay 

3. z ← z/‖z‖ 

4. e = |1−|z H y|| 

5. y ← z 

6. i ← i+1


Comentarii. Având în vedere simplitatea relaţiei de recurenţă, metoda puterii 

se poate dovedi atractivă dacă se cunoaşte apriori existenţa unei valori proprii net 

dominante. În caz contrar, viteza de convergenţă poate fi nesatisfăcătoare, iar în 

cazul absenţei unei valori proprii dominante şirul poate fi divergent. De aceea, 

folosind rezultatele lemei 4.4, trebuie realizate transformări ale matricei A care, 

fără a afecta vectorii proprii, să creeze o astfel de valoare proprie (net) dominantă. 

O posibilitate este de a utiliza o ”deplasare” µ (eventual variabilă µ k ) a spectrului 

matricei A astfel încât matricea A−µI n să aibă o valoare proprie (net) dominantă. 

În acest caz schema de calcul pentru o iteraţie a metodei puterii cu deplasare devine 

MP’ 1. Pentru k = 1,2,... 

1. Se calculează vectorul y (k) = (A−µ k )y (k−1) . 

2. y (k) ← y (k) /‖y (k) ‖. 

Din nefericire, determinarea deplasării µ k efectiv utile nu este deloc simplă, motiv 

pentru care această idee este folosită în paragraful următor pentru rezolvarea 

aceleiaşi probleme într-un context modificat. 

✸ 

4.3.2 Metoda puterii inverse 

Presupunem din nou că matricea A ∈ IC n×n este simplă având valorile proprii λ i , 

i = 1:n (nu neapărat într-o ordine anumită) şi vectorii proprii asociaţi x i , i = 1 : n. 

Fieµ ∉ λ(A)oaproximaţiealuiλ 1 . Atunci, conformlemei4.4,matricea(µI n −A) −1 

are valorile proprii (µ−λ i ) −1 , i = 1 : n, şi aceiaşi vectori proprii cu cei ai matricei 

A. Prin urmare, dacă alegem un vector iniţial y (0) nedefectiv în raport cu x 1 , i.e. 

satisfăcând (4.89) şi (4.90), putem defini, utilizând metoda puterii pentru matricea 

(µI n −A) −1 , şirul de vectori unitari 

y (k) = ρ k (µI −A) −1 y (k−1) , k = 1,2,... (4.98) 

unde ρ k este un factor scalar de normare. Acum, dacă deplasarea µ este mult mai 

apropiată de λ 1 decât de λ i , i = 2 : n, atunci |(µ − λ 1 ) −1 | va fi mult mai mare 

decât |(µ−λ i ) −1 |, i = 2 : n, i.e., 

max i=2:n |(µ−λ i ) −1 | 

|(µ−λ 1 ) −1 | 

≪ 1, (4.99) 

şi, în consecinţă şirul (y (k) ) este foarte rapid convergent către γx 1 . 

Relaţia de recurenţă(4.98) defineşte metoda puterii pentru matricea(µI n −A) −1 

şi este cunoscută sub denumirea de metoda puterii inverse cu deplasare pentru 

matricea A. Desigur, pentru calculul iteraţiei (4.98) nu se inversează matricea 

µI n −A ci se rezolvă sistemul liniar corespunzător, conform următoarei scheme de 

calcul, definitorie pentru o iteraţie a metodei puterii inverse. 

MPI 1. Pentru k = 1,2,... 

1. Se rezolvă sistemul (µI n −A)y (k) = y (k−1) în raport cu y (k) . 

2. y (k) ← y (k) /‖y (k) ‖.


Rezolvarea sistemului liniar din schema de mai sus necesită un efort de calcul apreciat 

la ≈ n 3 /3 operaţii scalare în virgulă mobilă de tipul α∗β+γ, ceea ce reprezintă 

un preţ foarte ridicat pentru o singură iteraţie a procesului de calcul al unui singur 

vector propriu. Din fericire, cel mai adesea metoda se aplică unor matrice având 

structura superior Hessenberg ceea ce reduce numărul de operaţii la ≈ n 2 pentru 

o iteraţie. Utilizarea unei deplasări constante µ asigură convergenţa către vectorul 

propriu asociat valorii proprii dominante a matricei (A−µI n ) −1 , i.e. asociat valorii 

proprii a matricei A celei mai apropiate de deplasarea µ. 

În continuare prezentăm o versiune importantă a metodei puterii inverse care 

utilizează o deplasare µ k variabilă cu pasul k şi optimală într-un sens precizat. 

Conform celor arătate mai sus, deplasarea care asigură cea mai mare viteză de 

convergenţăesteegală”cu cea mai bună”aproximaţieauneivaloripropriiamatricei 

A, disponibilă la pasul respectiv. O modalitate cu excelente rezultate practice este 

aceea în care această aproximaţie se obţine rezolvând, în sens CMMP, sistemul 

supradeterminat 

y (k−1) µ k = Ay (k−1) (4.100) 

de n ecuaţii cu necunoscuta scalară µ k , sistem obţinut prin ”actualizarea”, pentru 

pasul curent, a relaţiei asimptotice y (∞) µ ∞ = Ay (∞) , care este chiar relaţia de 

definiţie a valorilor şi vectorilor proprii. Pseudosoluţia în sens CMMP a sistemului 

(4.100) (vezi cap. 3) este aşa numitul cât Rayleigh al perechii (A,y (k−1) ) definit de 

µ k = (y(k−1) ) H Ay (k−1) 

‖y (k−1) ‖ 2 = (y (k−1) ) H Ay (k−1) . (4.101) 

Având în vedere faptul că această aproximare este din ce în ce mai bună rezultă că 

viteza de convergenţă a şirului (y (k) ) k∈IN este din ce în ce mai ridicată. Concret, se 

poate demonstra că are loc aşa-numitaconvergenţă pătratică, i.e. există o constantă 

τ astfel încât 

‖y (k+1) −γx 1 ‖ ≤ τ‖y (k) −γx 1 ‖ 2 . (4.102) 

Criteriile practice de trunchiere a şirului construit prin metoda puterii inverse sunt 

aceleaşi cu cele utilizate în cadrul algoritmului 4.1. Cu aceste precizări prezentăm 

algoritmul de implementare a metodei puterii inverse cu deplasările (4.101). 

Algoritmul 4.2 (Metoda puterii inverse cu deplasare Rayleigh) 

(Dată o matrice A ∈ IC n×n , un nivel de toleranţă tol ∈ IR, tol < 1, şi un 

numărmaxim admismaxiter de iteraţii, algoritmulcalculeazăun vector 

propriu unitar y al matricei date sau tipăreşte un mesaj dacă obiectivul 

nu a fost atins în numărul admis de iteraţii.) 

1. Se alege aleator un vector y ∈ IC n . 

2. y ← y/‖y‖ 

3. i = 0, e = 1 

4. Cât timp e > tol 

1. Dacă i > maxiter atunci 


fi obţinut nivelul prescris al toleranţei.’


2. Stop 

2. µ = y H Ay 

3. Se rezolvă sistemul liniar (µI n −A)z = y 

4. z ← z/‖z‖ 

5. e = |1−|z H y|| 

6. y ← z 

7. i ← i+1 

Comentarii. Metoda puterii inverse cu deplasare variabilă dată de câtul Rayleigh 

reprezintă cea mai bună cale de calcul al unui vector propriu al unei matrice. Convergenţa 

pătratică este foarte rapidă (după cum se poate vedea şi din exemplul 

4.3). Astfel, e.g. dacă ‖y (0) − γx 1 ‖ ≤ ε şi τ = 1, atunci ‖y (k) − γx 1 ‖ ≤ ε 2k . 

Simultan cu calculul vectorului propriu, algoritmul calculează şi valoarea proprie 

asociată, dată de valoarea finală a deplasării µ. În vederea obţinerii unei eficienţe 

sporite, este utilă transformarea prealabilă a matricei date la o formă (e.g., forma 

superior Hessenberg) care să aibă ca efect reducerea efortului de calcul necesar 

pentru rezolvarea sistemului liniar de la instrucţiunea 4.3. ✸ 

Metoda puterii Metoda puterii inverse 

k e k λ (k) 

1 e k µ k = λ (k) 

1 

0 1.0000000000000 2.0000000000000 1.0000000000000 2.0000000000000 

1 0.1055728090001 3.2000000000000 0.1322781687254 2.9411764705882 

2 0.0262710088797 3.1481481481482 0.2003991735561 3.0045159755566 

3 0.0026194296043 2.8921933085502 0.0000155353785 3.0000169808688 

4 0.0006379322733 3.0572569906791 0.0000000000709 3.0000000001717 

5 0.0002519147863 2.9922635151170 0.0000000000000 3.0000000000000 

6 0.0000549638856 2.9945140858135 

7 0.0000060060669 3.0060698628267 

8 0.0000014882055 2.9974207755674 

9 0.0000006272018 3.0004545082285 

. 

. 

. 

23 0.00000000000000 3.0000000351815 

Tabelul 4.1: Rezultate numerice privind evoluţia erorii de pas e k şi aproximaţiei 

curente λ (k) 

1 = (y (k) ) H Ay (k) a valorii proprii dominante din exemplul 4.3. 

Exemplul 4.3 Se consideră matricea companion 

⎡ ⎤ 

2 3 2 −6 

A = ⎢ 1 0 0 0 

⎥ 

⎣ 0 1 0 0 ⎦ , 

0 0 1 0


având valorile proprii (exacte) 

λ 1 = 3, λ 2,3 = −1±i, λ 4 = 1. 

Un vector propriu exact asociat valorii proprii dominante λ 1 = 3 şi, respectiv, 

vectorul propriu normat calculat pe baza valorii exacte sunt (verificaţi!) 

⎡ ⎤ ⎡ ⎤ 

999 

0.94288089928893 

x 1 = ⎢ 333 

⎥ 

⎣ 111 ⎦ , ˜x 1 = x 1 

‖x 1 ‖ = ⎢ 0.31429363309631 

⎥ 

⎣ 0.10476454436544 ⎦ . 

37 

0.03492151478848 

Evoluţia erorii curente e k din (4.97) şi a aproximaţiei curente λ 1k a valorii proprii 

dominante, calculate cu metoda puterii şi metoda puterii inverse în variantele algoritmice 

4.1 şi 4.2, sunt prezentate în tabelul 4.1, unde au fost utilizate iniţializarea 

y (0) = [1 0 0 0] T pentru vectorul propriu şi toleranţa de 1.0×10 −15 . Se verifică 

faptul că, în aceleaşi condiţii iniţiale, convergenţa metodei puterii inverse este mult 

mai rapidă. Mai mult, valoarea proprie şi vectorul propriu asociat (vezi tabelul 

4.2), calculate în aceleaşi condiţii de oprire a iterării (i.e. cu aceeaşi toleranţă) sunt 

y (23) = 

Metoda puterii 

⎡ 

⎢ 

⎣ 

0.94288089793487 

0.31429363608802 

0.10476454880574 

0.03492151110188 

⎤ 

⎥ 

⎦ y (5) = 

Metoda puterii inverse 

⎡ 

⎢ 

⎣ 

0.94288089928893 

0.31429363309631 

0.10476454436544 

0.03492151478848 

⎤ 

⎥ 

⎦ 

Tabelul 4.2: Vectorii proprii calculaţi pentru datele din exemplul 4.3. 

sensibil mai precise în cazul metodei puterii inverse (nu se constată nici o diferenţă 

în cele 15 cifre semnificative utilizate la afişare faţă de valoarea considerată exactă). 

✸ 

În conformitate cu cele prezentate în această secţiune, problema calculului valorilor 

şi vectorilor proprii 13 se poate rezolva astfel: 

1. Se calculează un vector propriu, utilizând metoda puterii sau metoda 

puterii inverse. 

2. Se calculează valoarea proprie asociată, utilizând câtul Rayleigh. 

3. Se aplică procedura de deflaţie, punând în evidenţă valoarea proprie 

calculată şi reducând dimensiunea problemei. 

4. Dacă nu s-au calculat toate valorile proprii se revine la pasul 1. 

Această procedură este elegant exprimată, într-o formă implicită, în cadrul unui 

algoritm performant, cunoscut în literatura de specialitate sub denumirea de algoritmul 

QR. 

13 În cadrul procedurii de deflaţie, este vorba de vectorii proprii ai matricei (reduse) curente 

care, de la al doilea pas, nu mai sunt vectori proprii ai matricei iniţiale. Totuşi aceşti vectori 

proprii pot servi, ulterior, la calculul vectorilor proprii ai matricei iniţiale (vezi exerciţiul 4.49).

4.4. ALGORITMUL QR 239 

4.4 Algoritmul QR 

Algoritmul QR este, în esenţă, o procedură de deflaţie iterativă care construieşte 

(recurent)unşirdematriceunitarasemeneacu matriceainiţială, şircare, încondiţii 

precizate,esteconvergentcătreformaSchur. Încazulrealsepoateimpuneutilizarea 

exclusivă a aritmeticii reale. În această situaţie termenii şirului sunt matrice ortogonal 

asemenea, iar limita sa este o formă Schur reală a matricei iniţiale. 

În vederea minimizării efortului de calcul, într-o fază preliminară, matricea dată 

este adusă, prin transformări de asemănare ce implică un număr (teoretic) finit 

şi (practic) rezonabil de mic de operaţii, la cea mai apropiată structură posibilă 

de forma Schur (reală). Această structură este forma superior Hessenberg 14 . În 

continuare, structura Hessenberg este conservată de recurenţa fazei iterative a algoritmului. 

În acest fel, se obţine o importantă reducere a complexităţii unei iteraţii 

QR, fapt esenţial în economia algoritmului. 

Performanţele deosebite ale algoritmului QR se explică atât prin deciziile teoretice 

– cum sunt cele referitoare la maximizarea vitezei de convergenţă – cât şi 

prin numeroase decizii ”tehnice” de gestionare structurală optimă pe parcursul 

desfăşurării calculului. 

În vederea unei prezentări mai clare şi mai concise a algoritmilor din această 

secţiune vom folosi o serie de proceduri dezvoltate în capitolul 3. Sintaxa utilizată 

şi o descriere succintă a acestor proceduri sunt date în tabelul 4.3 15 . Precizăm 

că, dacă în apelul acestor proceduri, unii dintre parametrii de ieşire au acelaşi 

nume cu unii dintre parametrii de intrare, atunci suprascrierea are loc în interiorul 

procedurii respective, cu efecte benefice corespunzătoare pentru economia spaţiului 

de memorie necesar. De asemenea, pentru a crea posibilitatea unor comparaţii 

corecte a complexităţilor, numărul asimptotic de operaţii aritmetice dat în tabel 

este cel corespunzător operaţiilor cu numere reale 16 . 

14 Reamintim că matricea H ∈ IC n×n este în formă superior Hessenberg dacă h ij = 0, ∀i > j+1. 

15 Atragem atenţia că, din dorinţa de a prezenta cât mai unitar şi mai limpede algoritmii 

din capitolele 4, 5 şi 6, procedurile din tabelul 4.3 au denumirile şi sintaxele posibil diferite de 

cele introduse în capitolul 3. Evident, pentru o implementare performantă a acestor proceduri 

(acurateţe maximă, memorare optimă etc.) vor fi urmate recomandările date în capitolul 3. Facem, 

de asemenea, precizarea că reflectorii complecşi utilizaţi în algoritmii din capitolele 4, 5 şi 6 sunt, în 

exclusivitate, reflectori hermitici. Acolo unde utilizarea reflectorilor nehermitici oferă o alternativă 

de calcul viabilă (cum este cazul unor algoritmi din capitolul 5), versiunile respective fac obiectul 

unor exerciţii. 

16 În cadrul algoritmilor care operează cu numere complexe evaluarea numărului asimptotic de 

operaţii aritmetice s-a realizat cu următoarele corespondenţe: 

Operaţie cu numere complexe Operaţii cu numere reale 

adunare/scădere 2 

înmulţire 6 

împărţire 11. 

Totuşi, chiar cu acceptarea aritmeticii complexe, acolo unde economia de efort de calcul este evidentă, 

evaluarea s-a făcut considerându-se că s-au utilizat explicit operaţiile aritmetice cu numere 

reale. Astfel, de exemplu, pentru un vector x ∈ IC n , ‖x‖ 2 2 se calculează cu expresia ‖x‖2 2 = 

= ‖Rex‖ 2 2 + ‖Imx‖2 2 şi nu folosind ‖x‖2 2 = xH x = ∑ n 

i=1 ¯x ix i , realizându-se un efort de 4n flopi 

în loc de 7n flopi. Precizăm, de asemenea, că evaluările numărului de operaţii nu includ operaţii 

conexe cum ar fi scalarea.


Sintaxa Intrări Ieşiri Descriere N op 

b ∈ IR n Calculul unui reflector real 

[b,u,β] = Hr(a) a ∈ IR n u ∈ IR n U 1 = I n −uu T /β astfel 2n 

β ∈ IR încât (b = U 1a)(2 : n) = 0. 

b ∈ IC n Calculul unui reflector com- 

[b,u,β] = Hc(a) a ∈ IC n u ∈ IC n plex U 1 = I n −uu H /β astfel 4n 

β ∈ IR încât (b = U 1a)(2 : n) = 0. 

u ∈ IR n Înmulţirea la stânga a ma- 

B = Hrs(u,β,A) β ∈ IR B ∈ IR n×m tricei A cu reflectorul real 4nm 

A ∈ IR n×m U 1 = I n −uu T /β, i.e. 

B = U 1A. 

A ∈ IR m×n Înmulţirea la dreapta a ma- 

B = Hrd(A,u,β) u ∈ IR n B ∈ IR m×n tricei A cu reflectorul real 4mn 

β ∈ IR U 1 = I n −uu T /β, i.e. 

B = AU 1. 

u ∈ IC n Înmulţirea la stânga a ma- 

B = Hcs(u,β,A) β ∈ IR B ∈ IC n×m tricei A cu reflectorul com- 14nm 

A ∈ IC n×m plex U 1 = I n −uu H /β, 

i.e. B = U 1A. 

A ∈ IC m×n Înmulţirea la dreapta a ma- 

B = Hcd(A,u,β) u ∈ IC n B ∈ IC m×n tricei A cu reflectorul com- 14mn 

β ∈ IR plex U 1 = I n −uu H /β, 

i.e. B = AU 1. 

b ∈ IR 2 Calculul unei rotaţii reale P, 

[b,c,s] = Gr(a) a ∈ IR 2 c ∈ IR de ordinul 2, astfel încât 6 

s ∈ IR (b = P T a)(2) = 0. 

b ∈ IC 2 Calculul unei rotaţii comple- 

[b,c,s] = Gc(a) a ∈ IC 2 c ∈ IR xe P, de ordinul 2, astfel încât 18 

(b = P H a)(2) = 0. 

c ∈ IR Înmulţirea la stânga a matri- 

B = Grs(c,s,A) s ∈ IR B ∈ IR 2×m cei A cu P T , i.e. B = P T A, 6m 

A ∈ IR 2×m unde P este o rotaţie reală 

de ordinul 2. 

A ∈ IR m×2 Înmulţirea la dreapta a ma- 

B = Grd(A,c,s) c ∈ IR B ∈ IR m×2 tricei A cu rotaţia reală de 6m 

s ∈ IR ordinul 2 P, i.e. B = AP. 

c ∈ IR Înmulţirea la stânga a matri- 

B = Gcs(c,s,A) s ∈ IC B ∈ IC 2×m cei A cu P H , i.e. B = P H A, 26m 

A ∈ IC 2×m unde P este o rotaţie complexă 

de ordinul 2. 

A ∈ IC m×2 Înmulţirea la dreapta a ma- 

B = Gcd(A,c,s) c ∈ IR B ∈ IC m×2 tricei A cu rotaţia complexă 26m 

s ∈ IC P de ordinul 2, i.e. B = AP. 

Tabelul 4.3: Proceduri utilizate pentru scrierea algoritmilor din capitolele 4, 5 şi 

6. Evaluarea numărului asimptotic de operţii N op s-a efectuat în flopi cu numere 

reale, pentru operaţiile cu numere complexe utilizându-se echivalările din nota de 

subsol alăturată. Nu au fost incluse eventuale operaţii de scalare pentru evitarea 

depăşirilor în format virgulă mobilă.


4.4.1 Reducerea la forma superior Hessenberg 

Este binecunoscută teorema conform căreia rezolvarea ecuaţiilor algebrice generale 

de grad superior lui patru nu este posibilă printr-o secvenţă finită de operaţii aritmetice 

(inclusiv extrageri de radical). Întrucât calculul valorilor proprii este echivalent 

cu rezolvarea ecuaţiei caracteristice, deducem că nu există un algoritm direct 

care să reducă o matrice dată, de ordin superior lui patru, la o formă mai 

”apropiată” de forma Schur decât forma Hessenberg şi care, în acelaşi timp, să 

conserve valorile proprii. 

Posibilitatea reducerii unei matrice A ∈ IC n×n la forma superior Hessenberg, cu 

conservarea valorilor proprii, este dată de următorul rezultat. 

Teorema 4.14 Oricare ar fi matricea A ∈ IC n×n , există o matrice unitară Q ∈ 

∈ IC n×n , calculabilă printr-o secvenţă finită de operaţii aritmetice, astfel încât matricea 

H = Q H AQ (4.103) 

este superior Hessenberg. 

În cazul real matricele H şi Q sunt reale, i.e. matricea Q este ortogonală. 

Demonstraţie. Vom da o demonstraţie constructivă bazată pe următoareaschemă 

de calcul 

HQ 1. Pentru k = 1 : n−2 

1. Se calculează un reflector elementar (complex) U k+1 

astfel încât (Uk+1 H A)(k +2 : n,k) = 0. 

2. A ← Uk+1 H A 

3. A ← AU k+1 

care suprascrie matricea A cu matricea 

Notând 

A ← H = U H n−1···UH 3 UH 2 AU 2U 3···U n−1 . (4.104) 

Q = U 2 U 3···U n−1 (4.105) 

avem Q H = U n−1···UH H 3 UH 2 şi, în consecinţă, (4.104) poate fi scrisă în forma 

(4.103). Rămâne de arătat că schema de calcul de mai sus creazăefectiv o structură 

superior Hessenberg. Vom aplica un procedeu bazat pe inducţie finită. 

Pasul 1 ◦ . Există un reflector elementar (complex) U 2 de ordinul n astfel încât 

(U2 H A)(3:n,1) = 0 (vezi cap. 3), care realizează structura superior Hessenberg în 

prima coloană. Matricea U 2 are structura 

[ ] 1 0 

U 2 = . (4.106) 

0 Ũ 2 

Prinurmare, postmultiplicareamatriceiU H 2 A cu U 2 nu modifică prima coloanăa lui 

U H 2 A, i.e. zerourile create în prima coloană a lui U H 2 A sunt conservate în U H 2 AU 2 .


Pasul k ◦ . Presupunem că în cadrul primilor k −1 paşi (k < n−1) am obţinut 

o matrice având o structură superior Hessenberg în primele k −1 coloane: 

A ← A k 

def 

= U H k ···U H 2 AU 2···U k . (4.107) 

Acum, există un reflector elementar U k+1 astfel încât (Uk+1 H A)(k +2:n,k) = 0, i.e. 

premultiplicarea cu Uk+1 H creează structura superior Hessenberg în coloana k fără 

să afecteze structura de zerouri din primele k −1 coloane. Mai mult, structura 

[ ] 

Ik 0 

U k+1 = 

(4.108) 

0 Ũ k+1 

a reflectorului utilizat la acest pas, ne asigură, de asemenea, că postmultiplicarea 

cu U k+1 nu afectează nici una din primele k coloane ale matricei (Uk+1 H A k). 

Prin urmare, schema de calcul prezentată la începutul demonstraţiei realizează 

reducerea matricei date la forma superior Hessenberg prin transformarea unitară 

de asemănare (4.104). 

În cazul real demonstraţia este identică cu precizarea că transformarea ortogonală 

de asemănare este un produs de reflectori reali. Caracterul finit al calculului 

este evident. 

✸ 

Utilizând procedurile din tabelul 4.3, demonstraţia de mai sus conduce imediat 

la următorul algoritm. 

Algoritmul 4.3 (HQc – Reducerea la forma superior Hessenberg) 

(Date o matrice A ∈ IC n×n şi o matrice unitară Q ∈ IC n×n , algoritmul 

calculează o secvenţă de reflectori (complecşi) U 2 , U 3 , ···, U n−1 astfel 

încât matricea transformată A ← H = U H n−1···UH 3 UH 2 AU 2U 3···U n−1 

este în forma superior Hessenberg. Opţional se calculează actualizarea 

matricei de transformare, i.e. Q ← QU 2 U 3···U n−1 . Opţiunea se exprimă 

prin intermediul unei variabile logice opt de tipul şir de caractere 

ce poate lua valorile ′ da ′ sau ′ nu ′ . Dacă opt = ′ nu ′ , matricea Q rămâne 

nemodificată.) 

1. Pentru k = 1 : n−2 

1. [A(k +1 : n,k),u,β] = Hc(A(k +1 : n,k)) 

2. A(k +1 : n,k +1 : n) = Hcs(u,β,A(k +1 : n,k +1 : n)) 

3. A(1 : n,k +1 : n) = Hcd(A(1 : n,k +1 : n),u,β) 

4. Dacă opt = ′ da ′ atunci 

Q(1 : n,k +1 : n) = Hcd(Q(1 : n,k +1 : n),u,β) 

Comentarii. Pentru apelul algoritmului HQc va fi utilizată sintaxa generală 

[H,V ] = HQc(A,Q,opt), 

careexprimăposibilitatea de a memorarezultatele înalte tablouridecât cele iniţiale 

deşi calculele se fac cu suprascrierea internă a matricei iniţiale şi a matricei de 

transformare. Sintaxa propusă mai sus se poate dovedi utilă în asigurarea unei


prezentări clare a procedurilor care utilizează algoritmul HQc. De exemplu, apelul 

[A,U ] = HQc(A,I n , ′ da ′ ) calculează, pe loc, reducerea la forma Hessenberg şi 

creează matricea de transformare din (4.104). 

În cazul real reflectorii utilizaţi vor fi reali şi, în consecinţă, matricea Hessenberg 

rezultată va fi reală. Întrucât această particularizare se obţine pur şi simplu 

înlocuind identificatorii procedurilor ”complexe” cu cei ai procedurilor ”reale” corespunzătoare, 

ne mărginim să precizăm sintaxa de apel cu care această variantă va 

fi folosită în continuare: 

[H,V ] = HQr(A,Q,opt). 

Complexitatea algoritmului este O(n 3 ), execuţia sa implicând N op ≈ 10n 3 /3 

operaţii cu numere complexe în format virgulă mobilă. Acumularea matricei de 

transformare necesită N ′ op ≈ 4n3 /3 operaţii suplimentare. Algoritmul HQ este numeric 

stabil, i.e. matricea superior Hessenberg calculată într-o aritmetică în virgulă 

mobilă este o matrice exact unitar (ortogonal) asemenea cu o matrice uşor perturbată 

A+E, unde matricea de perturbaţie E satisface condiţia ‖E‖ ≤ p(n)ε M ‖A‖, 

cu p(n) o funcţie cu creştere ”modestă” de dimensiunea n a problemei. ✸ 

Observaţia 4.4 Pentru obţinerea formei Hessenberg se pot utiliza şi transformări 

deasemănareneunitare(neortogonale). Într-adevăr,folosindtransformărigaussiene 

elementare stabilizate M k P k , k = 2 : n − 1, unde M k este o matrice inferior triunghiulară 

elementară, iar P k este o matrice de permutare elementară (v. cap.2), 

determinate corespunzător pentru anularea elementelor k +1 : n din coloana k −1 

a matricei curente, matricea 

H = M n−1 P n−1 ...M 2 P 2 AP 2 M −1 

2 ...P n−1 M −1 

n−1 

va fi superior Hessenberg. O implementare îngrijită a secvenţei de transformări de 

mai sus conduce la un efort de calcul redus la jumătate faţa de cel necesar pentru 

execuţia algoritmului HQ. Detaliile algoritmului fac obiectul exerciţiului 4.50. 

Anumite reţineri existente în utilizarea acestei soluţii sunt datorate unor posibile 

instabilităţi numerice (a căror existenţă este dovedită teoretic, dar care apar foarte 

rar în practică) precum şi unor dificultăţi în analiza erorilor, dificultăţi induse de 

faptul că transformările neunitare (neortogonale) nu conservă condiţionarea valorilor 

proprii. 

✸ 

4.4.2 Faza iterativă a algoritmului QR 

Etapa iterativă a algoritmului QR utilizează, într-o manieră implicită, metodele 

puterii şi puterii inverse pentru reducerea unei matrice la forma Schur (reală). Deşi 

implementările profesionale ale algoritmului QR utilizează, în exclusivitate, din 

motive de eficienţă calculatorie (în cazul matricelor reale), varianta cu deplasare 

implicită cu pas dublu, din raţiuni pedagogice vom prezenta şi variantele cu deplasare 

explicită.


A. Algoritmul QR cu deplasare explicită 

PresupunemcămatriceaH ∈ IC n×n areostructurăsuperiorHessenberg. Algoritmul 

QR cu deplasare explicită construieşte un şir de matrice 

H = H 1 ,H 2 ,···,H k ,H k+1 ,··· (4.109) 

pe baza relaţiei de recurenţă 

{ 

Hk −µ k I n = Q k R k 

H k+1 = R k Q k +µ k I n 

, k = 1,2,···, H 1 = H, (4.110) 

unde scalarul µ k , denumit deplasare, este folosit pentru asigurarea convergenţei. În 

prima relaţie (4.110) matricea H k −µ k I n este factorizată QR, i.e. scrisă sub forma 

unui produs dintre matricea unitară Q k şi matricea superior triunghiulară R k (vezi 

cap.3). În relaţia a doua din (4.110) matricea succesor H k+1 se obţine înmulţind 

matricele Q k şi R k în ordine inversă şi anulând deplasarea prin adunarea matricei 

µ k I n . Şirul (4.109), generat de (4.110), este denumit şirul QR. Corespunzător, 

tranziţia H k → H k+1 se numeşte un pas sau o transformare QR. 

Principalele proprietăţi ale şirului QR sunt date de următoarea propoziţie. 

Propoziţia 4.3 a) Dacă matricea iniţială H 1 = H a şirului matriceal QR este 

superior Hessenberg, atunci toate matricele şirului au aceeaşi structură. Altfel spus, 

structura Hessenberg este invariantă la transformările QR. 

b) Toate matricele şirului QR sunt unitar asemenea şi, prin urmare, au acelaşi 

spectru de valori proprii. 

În cazul real afirmaţiile de mai sus rămân valabile dacă în locul operatorului 

hermitic, de transpunere şi conjugare, se utilizează operatorul de transpunere. 

Demonstraţie. a) Dacă H k din (4.110) este o matrice superior Hessenberg, aceeaşi 

structură o are şi matricea H k −µ k I n . Algoritmul de factorizareQR (v. cap.3) aplicat 

matricei superior Hessenberg H k −µ k I n produce o matrice unitară Q k superior 

Hessenberg 17 . Întrucât R k este superior triunghiulară rezultă că matricea unitară 

Q k este, de asemenea, superiorHessenberg. Cum produsul dintreomatricesuperior 

triunghiulară şi o matrice superior Hessenberg este o matrice superior Hessenberg 

(verificaţi!) rezultă că R k Q k este superior Hessenberg şi, evident, aceeaşi structură 

o are şi matricea H k+1 . Prin inducţie, dacă H 1 = H este superior Hessenberg, 

atunci toate matricele H k ,k = 2,3,... sunt matrice superior Hessenberg. 

b) Din prima relaţie (4.110) avem 

R k = Q H k (H k −µ k I n ), (4.111) 

care, introdusă în cea de a doua relaţie (4.110), conduce la 

H k+1 = Q H k (H k −µ k I n )Q k +µ k I n = Q H k H kQ k , (4.112) 

17 Dacă µ k ∉ λ(H k ) (care este cazul curent), atunci matricea superior triunghiulară R k este 

nesingulară şi matricea Q k este, în mod necesar, superior Hessenberg.


i.e. H k+1 şi H k sunt unitar asemenea şi au acelaşi spectru. Aplicând (4.112) în 

mod repetat obţinem 

H k = Q H k−1 QH k−2···QH 1 H 1Q 1···Q k−2 Q k−1 = ˜Q H k H ˜Q k , (4.113) 

unde 

˜Q k = Q 1 Q 2···Q k−1 (4.114) 

este o matrice unitară (ca produs de matrice unitare). Prin urmare, toate matricele 

din şirul QR sunt unitar asemenea şi, în consecinţă, au acelaşi spectru. Transformarea 

unitară cumulată (4.114) poate fi construită recurent cu relaţia 

˜Q k+1 = ˜Q k Q k , k = 1,2,···, ˜Q1 = I n . (4.115) 

Propoziţia este demonstrată. 

✸ 

În continuare, vom arăta că, prin alegerea adecvată a deplasărilor µ k , k = 

= 1,2,..., înafaraunorsituaţiipatologice(veziexemplul4.4), şirulQResteconvergent 

către forma Schur (reală). Mai precis, vom arăta că, în primul rând, elementul 

extradiagonal al ultimei linii a matricei H k se anulează asimptotic pentru k → ∞. 

Mai mult, generic, toate elementele subdiagonale, cu viteze diferite, au tendinţa de 

anulare. Argumentele sunt următoarele. 

(i) Cu o alegere adecvată a deplasărilor µ k , şirul QR implementează, într-o 

formă implicită, o versiune a metodei puterii inverse cu deplasare Rayleigh şi, în 

consecinţă, asigură o convergenţă pătratică a ultimei coloane a matricei de transformare 

cumulate ˜Q k către un vector propriu al matricei H H ceea ce are ca efect 

anularea asimptotică a elementului H k (n,n−1). 

Pentru a justifica această afirmaţie observăm mai întâi faptul că din relaţiile 

(4.111), (4.113) şi (4.115) rezultă 

R k = Q H k (˜Q H k H ˜Q k −µ k I n ) = Q H k ˜Q H k (H−µ kI n )˜Q k = ˜Q H k+1 (H−µ kI n )˜Q k , (4.116) 

de unde 

R k ˜QH k = ˜Q H k+1 (H −µ kI n ). (4.117) 

Putem scrie acum dependenţa dintre ultimele coloane ˜q n 

(k+1) şi ˜q n (k) ale matricelor 

˜Q k+1 şi, respectiv, ˜Q k . Într-adevăr, prin transpunerea şi conjugarea relaţiei (4.117) 

se obţine 

˜Q k Rk H = (H H − ¯µ k I n )˜Q k+1 , (4.118) 

este inferior triunghiulară, ega- 

unde ¯µ k este conjugata deplasării µ k . Întrucât RH k 

litatea ultimelor coloane din (4.118) conduce la 

¯r (k) 

nn˜q(k) n = (HH − ¯µ k I n )˜q (k+1) 

n (4.119) 

sau, dacă µ k ∉ λ(H), 

˜q (k+1) 

n 

= ¯r (k) 

nn(H H − ¯µ k I n ) 

−1˜q 

(k) 

n , (4.120)


unde ¯r nn (k) este conjugatul lui r nn. (k) Relaţia (4.120) defineşte iteraţia puterii inverse 

pentru determinarea unui vector propriu al matricei H H . În continuare vom arăta 

că dacă ultima coloană a matricei unitare de transformare este un vector propriu al 

matricei H H atunci elementele extradiagonale ale ultimei linii ale matricei H se a- 

nulează, similar cu procedurastandard de deflaţie. Pentru aceastareamintim faptul 

că valorile proprii ale matricei H H sunt conjugatele valorilor proprii ale matricei H 

şi considerăm transformarea unitară definită de matricea 

cu v n un vector propriu al matricei H H , i.e. 

˜Q = [ ˆQ vn 

] 

, (4.121) 

H H v n = ¯λ n v n , cu λ n ∈ λ(H). (4.122) 

Atunci, din (4.121) şi (4.122) avem 

{ 

v 

H 

n H ˆQ = λ n v H n ˆQ = 0, 

v H n Hv n = λ n v H n v n = λ n , 

(4.123) 


[ 

˜Q H H ˜Q 

ˆQH 

= 

v T n 

] 

H [ [ 

] ˆQ ˆQH H ˆQ ˆQ ] [ ] 

H Hv 

vn = 

n Ĥ h 

H 

vn H H ˆQ vn H = . 

Hv n 0 λ n 

(4.124) 

Viteza pătraticăde convergenţăavectoruluicoloană ˜q n (k) din (4.120)cătreun vector 

propriu al matricei H H poate fi obţinută alegând pentru deplasarea ¯µ k valoarea 

(4.101) a câtului Rayleigh 

¯µ k = (˜q(k) n ) H H 

(˜q n (k) ) 

respectiv, 

H˜q 

(k) 

n 

(k) H˜q n 

= (˜q n (k) ) H (k) 

H 

H˜q n = e T ˜Q n H k H H ˜Qk e n = e T nHk H (k) 

e n = ¯h nn, 

µ k = h (k) 

nn. (4.125) 

Alegerea (4.125) a deplasării originii garantează o rată excelentă de convergenţă 

a şirului QR către forma Schur în ultima linie, i.e. de anulare asimptotică a 

elementului h (k) 

n,n−1 . Când elementul h(k) satisface o condiţie de forma 

n,n−1 

|h (k) 

n,n−1 | < tol(|h(k) 

n−1,n−1 |+|h(k) nn 

|), (4.126) 

unde tol este un nivel prescris de toleranţă, putem considera că h (k) 

n,n−1 este numeric 

neglijabil şi îl putem anula efectiv. Astfel h (k) 

nn devine o valoare proprie calculată a 

lui H. După această operaţie, dimensiunea problemei s-a redus cu o unitate. 

(ii) Şirul QR implementează simultan o versiune a metodei puterii cu deplasare. 

Astfel, în acelaşi timp, şirul QR pune asimptotic în evidenţă, chiar dacă 

cu o viteză mai redusă, şi alte valori proprii pe diagonala matricei curente a şirului.


Într-adevăr, din (4.116), avem 

˜Q k+1 R k = (H −µ k I n )˜Q k . (4.127) 

Egalitatea primelor coloane ale matricelor din (4.121) conduce la 

˜Q k+1 r (k) 

1 = (H −µ k I n )˜q (k) 

1 , (4.128) 

unde ˜q (k) 

1 = ˜Q k e 1 este prima coloană a matricei ˜Qk şi r (k) 

1 = R k e 1 este prima 

coloană a matricei R k . Întrucât R k este superior triunghiulară, avem r (k) 

1 = r (k) 

11 e 1 

şi, deci, (4.128) poate fi scrisă în forma echivalentă 

˜q (k+1) 

1 = 1 

r (k) 

11 

(H −µ k I n )˜q (k) 

1 , (4.129) 

care exprimă recurenţa ce defineşte metoda puterii pentru calculul unui vector propriu 

al matricei H, utilizând un parametru scalar de deplasare µ k . Conform celor 

arătate în secţiunea 4.3, dacă µ k evoluează astfel încât matricea H − µ k I n are o 

valoare proprie dominantă atunci prima coloană a matricei unitare de transformare 

˜Q k converge către un vector propriu asociat acestei valori proprii. În conformitate 

cuproceduradedeflaţie(vezisecţiunea4.2)primacoloanăamatricei ˜Q H k H ˜Q k = H k 

converge către prima coloană a formei Schur a lui A, i.e. elementul subdiagonal din 

prima coloană a lui H se anulează asimptotic. Viteza de convergenţă depinde de 

evoluţia modulului raportului primelor două valori proprii (enumerate în ordinea 

descrescătoare a modulelor) ale matricei H −µ k I n . 

Având în vedere faptul că cele două procese de deflaţie au loc simultan şi că, 

odată luată decizia de neglijare a elementelor subdiagonale suficient de mici, dimensiunea 

problemei de calcul scade, o experienţă numerică destul de consistentă 

a condus la evaluarea că, în mod obişnuit, pentru calculul unei valori proprii a unei 

matrice Hessenberg sunt suficiente, în medie, 1.5-2 iteraţii QR. Această viteză de 

convergenţăexcepţionalăsedatoreazăfaptului, constatatexperimental, căodatăcu 

elementele subdiagonale din ultima linie şi prima coloană, toate celelalte elemente 

subdiagonale au tendinţa de anulare asimptotică. 

Pe de altă parte, aşa cum s-a precizat, şirul QR nu converge întotdeauna, existând 

situaţii în care elementele subdiagonale, inclusiv cel de pe poziţia (n,n−1), 

nu se anulează asimptotic. În practica numerică astfel de situaţii sunt rare, ”patologice”, 

şi se pot lua măsuri care să le facă extrem de rare. Prezentăm în continuare 

un astfel de caz. 

Exemplul 4.4 Se consideră matricea H ∈ IR 4×4 în formă superior Hessenberg 

⎡ ⎤ 

0 0 0 1 

H = ⎢ 1 0 0 0 

⎥ 

⎣ 0 1 0 0 ⎦ , 

0 0 1 0 

având valorile proprii (exacte), ordonate arbitrar, 

λ 1 = −1, λ 2,3 = ±i, λ 4 = 1.


k 

µ 1 = 0.001 

h (k) 

21 

h (k) 

32 

h (k) 

43 

1 1.00000000000000 1.00000000000000 1.00000000000000 

2 0.99999900000088 0.99999999999950 0.99999949999887 

3 0.99999800000800 0.99999999999800 0.99999799999200 

. 

. 

11 0.89589063292443 0.99770241027003 0.86085664887513 

12 0.74524339988451 0.99080233083311 0.48323652626445 

13 0.58630453030022 0.99453900211462 0.04719725489411 

14 0.44579447911603 0.99846792286246 0.00003625307539 

15 0.32803260297652 0.99959510209257 0.00000000000002 

16 0.23685107105612 0.99989584829055 0.00000000000000 

. 

. 

. 

. 

25 0.01069551270948 0.99999999959102 0 

. 

. 

. 

. 

50 0.00000184648291 1.00000000000000 0 

. 

. 

. 

. 

100 0.00000000000006 1.00000000000000 0 

. 

. 

Tabelul 4.4: Rezultate numerice pentru exemplul 4.4 privind evoluţia elementelor 

subdiagonale h (k) 

i+1,i , i = 1:3, ale matricelor H k cu iniţializarea µ 1 = 0.001 ≠ 0 a 

deplasării.


Se observă că H este o matrice ortogonală (de permutare). De asemenea nu este 

greu de văzut că şirul QR construit cu relaţiile (4.110) cu deplasările (4.125) lasă 

matricea H nemodificată, i.e. 

H k = H, k = 1,2,... 

def 

Într-adevăr, fie H 1 = H. Avem µ 1 = h 44 = 0, deci H 1 − µ 1 I 4 = H 1 . Cum H 1 

este ortogonală, o factorizare QR a lui H 1 se obţine pentru Q 1 = H 1 şi R 1 = I 4 . 

Rezultă H 2 = H 1 şi, prin inducţie, se obţine relaţia de mai sus pentru toţi k. 

Evoluţia elementelor subdiagonale h (k) 

i+1,i , i = 1 : 3, ale matricelor H k pentru 

iniţializarea µ 1 = 0.001 ≠ 0 a deplasării este prezentată în tabelul 4.4, iar pentru 

iniţializarea ”recomandată” µ 1 = 2 ≠ 0 a deplasării este prezentată în tabelul 4.5, 

din care se poate observa viteza diferită de anulare asimptotică a elementelor h 43 

k 

µ 1 = 2 

h (k) 

21 

h (k) 

32 

h (k) 

43 

1 1.00000000000000 1.00000000000000 1.00000000000000 

2 0.91651513899117 0.98169181562325 −0.80868982852162 

3 0.78445125612917 0.97895246315181 −0.34595766230725 

4 0.63665525316291 0.99162466881300 −0.01531773203215 

5 0.49164479289711 0.99761224919910 −0.00000122920448 

6 0.36518170914743 0.99936015720678 −0.00000000000000 

. 

. 

. 

. 

25 0.00053197970928 1.00000000000000 0 

. 

. 

. 

. 

50 0.00000009183752 1.00000000000000 0 

. 

. 

. 

. 

100 0.000000000000000 1.00000000000000 0 

Tabelul 4.5: Rezultate numerice pentru exemplul 4.4 privind evoluţia elementelor 

subdiagonale h (k) 

i+1,i , i = 1 : 3, ale matricelor H k cu iniţializarea µ 1 = 2 ≠ 0 a 

deplasării. 

şi h 21 şi evidenţierea valorilor proprii reale λ 1 şi λ 4 în poziţiile diagonale 11 şi 44 . 

Iterând de un număr suficient de ori cititorul interesat va avea confirmarea faptului 

că limita şirului QR construit cu una din iniţializările date pentru µ este 

Faptul că elementul h (k) 

32 

H k −→ H ∞ = 

⎡ 

⎢ 

⎣ 

−1 0 0 0 

0 0 −1 0 

0 1 0 0 

0 0 0 1 

⎤ 

⎥ 

⎦ . 

nu se anulează asimptotic se datorează utilizării exclusive


a aritmeticii reale şi alegerii µ k = h (k) 

44 , a deplasării pentru toţi k ≥ 2. Modul în 

care se gestionează întreaga structură a matricei H k este tratat mai departe. ✸ 

Observaţia 4.5 Situaţiile de genul celor evidenţiate în exemplul 4.4 se pot sesiza 

prin supravegherea elementului h n,n−1 şi dacă, după un număr convenit de 

iteraţii 18 modulul său nu scade sub o toleranţă impusă, se intervine, de obicei prin 

renunţarea, pentru un singur pas, la deplasarea dată de (4.125). În literatura de 

specialitate (vezi [X]) există unele recomandări pentru alegerea acestei deplasări 

modificate, bazate pe o bogată experienţa numerică dar lipsite de o justificare teoretică 

corespunzătoare. Dacă o astfel de măsură nu dă rezultate, în general se 

renunţă la continuarea calculului 19 . Detaliile vor fi precizate în descrierea algoritmilor. 

✸ 

În concluzie, algoritmul QR cu deplasare explicită este definit, în esenţă, de 

recurenţa (4.110), cu alegerea (4.125) a deplasării. Avându-se în vedere structura 

superior Hessenberg a tuturor matricelor şirului QR, pentru factorizarea QR se 

recomandă utilizarea rotaţiilor. În consecinţă, un pas simplu QR cu deplasare 

explicită (fără acumularea transformării) constă în efectuarea următoarelor calcule, 

pe loc, în spaţiul de memorie al matricei H. 

1. µ = h nn 

2. H ← H −µI n 

3. Pentru j = 1 : n−1 

1. Se determină rotaţia plană (complexă) P j,j+1 astfel 

încât (P H j,j+1 H) j+1,j = 0. 

2. H ← P H j,j+1 H 

4. Pentru j = 1 : n−1 

1. H ← HP j,j+1 

5. H ← H +µI n 

Matricea de transformare curentă este dată de 

Q k = P 12 P 23···P n−1,n , 

iar completarea algoritmului cu acumularea transformărilor (care se face numai în 

caz de necesitate) este lăsată în sarcina cititorului. 

Complexitatea unui pas QR cu deplasare explicită aplicat unei matrice superior 

Hessenberg este O(n 2 ) algoritmul de mai sus necesitând N ≈ 6n 2 flopi (complecşi). 

PasulQRdemaisusseajusteazăladimensiuneacurentăaproblemei,pemăsură 

ce se pun în evidenţă valorile proprii calculate. O modalitate concretă de gestionare 

a valorilor proprii calculate va fi prezentată în cadrul algoritmului QR cu deplasare 

implicită. 

18 Valorile uzuale sunt în jurul lui 10. 

19 Numărul de iteraţii la care se ia decizia de ”lipsă de convergenţă” şi de oprire a calculului 

este, uzual, între 20 şi 30.


B. Strategia paşilor dubli 

În cazul matricelorrealese poate impune utilizarea exclusivăaunei aritmetici reale. 

Dacă matricea are şi valori proprii complex conjugate alegerearecomandatămai sus 

pentru deplasarea µ k nu mai poate asigura convergenţa procesului de evidenţiere a 

valorilor proprii. Aşa cum s-a văzut în demonstraţia lemei 4.3, pentru evidenţierea 

unui bloc 2×2 alformei Schurreale, deflaţia se face cu ajutorulunei baze ortogonale 

(reale) a subspaţiului A-invariantgenerat de parteareală şi cea imaginarăaperechii 

devectoripropriiasociaţi. Aceastaaconduslaideeacomasăriiadoipaşiconsecutivi 

QR într-unul singur 20 şi a utilizării unei perechi de deplasări complex conjugate 

care, în pasul dublu, apar în combinaţii reale. 

Concret, fie H ∈ IR n×n o matrice superior Hessenberg şi doi paşi consecutivi 

QR cu deplasare explicită 

{ 

Hk −µ k I n = Q k R k 

H k+1 = R k Q k +µ k I n 

, 

{ 

Hk+1 −µ k+1 I n = Q k+1 R k+1 

H k+2 = R k+1 Q k+1 +µ k+1 I n 

, (4.130) 

care pot fi contraşi în transformarea directă H k −→ H k+2 , numită pas dublu QR. 

Într-adevăr, pasul k produce matricea H k+1 = Q H k H kQ k astfel încât factorizarea 

QR din cadrul pasului k + 1 poate fi scrisă sub forma Q H k H kQ k − µ k+1 I n = 

= Q k+1 R k+1 . Înmulţind această relaţie la stânga cu Q k, la dreapta cu R k şi utilizând 

factorizareaQR din cadrulpasului k, rezultă căun pasdublu QReste descris 

de { (Hk −µ k I n )(H k −µ k+1 I n ) = Q k Q k+1 R k+1 R k 

, (4.131) 

H k+2 = (Q k Q k+1 ) T H k Q k Q k+1 

şi implică efectuarea următoarelor calcule: 

1. SecalculeazămatriceaM def 

= H 2 k −s kH k +p k I n ,undes k = µ k +µ k+1 

şi p k = µ k µ k+1 . 

2. Se calculează factorizarea QR a matricei M, i.e. M = ˘Q˘R, unde 

˘Q = Q k Q k+1 şi ˘R = Rk R k+1 . 

3. H k+2 = ˘Q T H k ˘Q. 

Deplasările µ k şi µ k+1 se aleg, în concordanţă cu cele discutate mai sus, egale cu 

valorile proprii ale blocului 2×2 din colţul din dreapta jos al matricei H k : 

[ 

(k) h n−1,n−1 h (k) ] 

n−1,n 

H k (n−1 : n, n−1 : n) = 

. (4.132) 

h (k) 

n,n−1 

h (k) 

n,n 

Important este faptul că, în schema de calcul aferentă unui pas dublu QR, cele 

două valori proprii apar sub formă de sumă şi produs: 

⎧ 

⎨ 

⎩ 

s k = µ k +µ k+1 = h (k) 

n−1,n−1 +h(k) n,n 

p k = µ k µ k+1 = h (k) 

n−1,n−1 h(k) n,n −h (k) 

n−1,n h(k) n,n−1 

, (4.133) 

20 Se poate imagina şi o comasare a mai mulţi paşi QR în cadrul unei strategii a paşilor 

”multipli”. O astfel de soluţie este utilizată în LAPACK [XV] pentru procedurile bloc de calcul 

al valorilor proprii.


care sunt reale chiar dacă cele două deplasări individuale sunt complexe. 

Strategia pasului dublu QR nu se aplică însă în forma explicită de mai sus 

întrucât implementarea schemei de calcul prezentate conduce la o reducere sensibilă 

a eficienţei. Într-adevăr, complexitatea unui pas simplu QR este O(n2 ) şi la fel 

este şi complexitatea a doi paşi simpli QR în timp ce numărul de operaţii necesar 

pentru execuţia unui pas dublu QR, datorită calculului explicit al matricei M, este 

de ordinul O(n 3 ). Aceasta înseamnă că forma explicită a pasului dublu QR nu este 

optimală. Refacerea complexităţii la O(n 2 ) este posibilă (dar nu apare în mod simplu), 

iar varianta de calcul este cunoscută sub denumirea de varianta cu deplasare 

implicită şi este utilizată în toate implementările profesionale ale algoritmului QR 

pentru matrice reale. 

C. Ideea algoritmului QR cu deplasare implicită 

Scopul fundamental al dezvoltării variantei cu deplasare implicită a algoritmului 

QR este reducerea complexităţii unui pas dublu QR aplicat unei matrice reale 

în formă superior Hessenberg la nivelul complexităţii a doi paşi simpli QR. Deşi, 

principial, există toate motivele ca acest lucru să fie posibil, aspectele tehnice sunt 

departe de a fi triviale. Algoritmul QR cu deplasare implicită datează din anul 

1961 şi a fost propus de J.G.F. Francis [26] şi V.N. Kublanovskaia [39]. 

Conform celor prezentate mai sus referitor la pasul dublu QR, matricele H k 

şi H k+2 = ˘Q T k H k ˘Q k au structura superior Hessenberg şi sunt ortogonal asemenea. 

Şansele de a găsi o cale alternativă de calcul a matricei succesor H k+2 şi, eventual, 

a matricei de transformare asociate, sunt legate nemijlocit de evidenţierea gradelor 

de libertate existente. Având în vedere această observaţie, suntem interesaţi de 

condiţiile în care transformarea care defineşte un pas QR este unică sau poate fi 

restrânsă la o clasă bine precizată. 

Pentru început, observăm că, în general, matricea unitară Q k care defineşte 

relaţia de asemănare dintre matricele superior Hessenberg H k şi H k+1 din şirul QR 

nu este unică. Într-adevăr, fie V ∈ IC n×n o matrice unitară arbitrară. Aplicarea 

algoritmului HQc matricei V H H k V conduce la obţinerea unei matrice superior 

Hessenberg unitar asemenea cu H k şi care depinde de alegerea lui V. 

Restrângerea transformărilor la o clasă de transformări, ”echivalente” din punctul 

de vedere al convergenţei către forma Schur, va fi făcută pentru matricele superior 

Hessenberg ireductibile 21 definite mai jos. 

Definiţia 4.6 O matrice n × n complexă sau reală H superior Hessenberg se numeşte 

ireductibilă dacă are toate elementele subdiagonale nenule, i.e. 

h j+1,j ≠ 0, j ∈ 1 : n−1. (4.134) 

Pentru matricele superior Hessenberg ireductibile prezentăm teorema următoare. 

21 Problema calculului valorilor proprii ale unor matrice superior Hessenberg reductibile se 

reduce la calculul valorilor proprii ale unor matrice superior Hessenberg ireductibile de dimensiuni 

mai mici (vezi mai departe).


Teorema 4.15 Fie matricea A ∈ IC n×n şi matricele unitare U ∈ IC n×n şi V ∈ IC n×n 

astfel încât matricele 

H = U H AU, G = V H AV (4.135) 

sunt ambele superior Hessenberg ireductibile. Dacă matricele U şi V au aceeaşi 

primă coloană, i.e. 

Ue 1 = Ve 1 , (4.136) 

atunci 

Ue j = e iθj Ve j , θ j ∈ IR, j = 2 : n, (4.137) 

i.e. există o matrice diagonală unitară D = diag(1,δ 2 ,...,δ n ) cu δ j = e iθj , j = 2:n, 


H = D H GD. (4.138) 

În cazul real, i.e. A ∈ IR n×n şi matricele U ∈ IR n×n şi V ∈ IR n×n ortogonale, 

condiţia (4.136) implică Ue j = ±Ve j , j = 2 : n, i.e. matricea diagonală din (4.138) 

este ortogonală având δ j ∈ {−1, 1}, j = 2 : n. Dacă elementele subdiagonale 

corespondente ale matricelor G şi H din (4.135) au acelaşi semn, atunci (4.136) 

implică U = V, i.e transformarea este unic determinată. 

Observaţia 4.6 Având în vedere obiectivele urmărite, putem afirma că, în condiţiile 

teoremei 4.15, matricele H şi G sunt esenţial aceleaşi. Într-adevăr, este uşor 

de constatat că |h ij | = |g ij | (în cazul real aceasta înseamnă h ij = ±g ij ) pentru toţi 

i şi j şi, prin urmare, ”distanţa” (în norma Frobenius) până la forma Schur ”cea 

mai apropiată” a celor două matrice poate fi considerată aceeaşi. ✸ 

Demonstraţia teoremei 4.15. Fie W def 

= V H U şi W = [w 1 w 2 ··· w n ] partiţia sa 

pe coloane. Atunci, din (4.136), rezultă w 1 = We 1 = e 1 , iar din (4.135) avem 

GW = WH relaţie care, scrisă pe coloane, devine 

j∑ 

Gw j = WH(:,j) = w k h kj +w j+1 h j+1,j , j = 1 : n−1. 

k=1 

Întrucât h j+1,j ≠ 0, obţinem următoarea exprimare a coloanei j +1 a matricei W 

în funcţie de coloanele precedente 

w j+1 = 1 

h j+1,j 

(Gw j − 

j∑ 

w k h kj ), 

expresie care, cu iniţializarea w 1 = e 1 , probează faptul că matricea W este superior 

triunghiulară. Cum o matrice unitară triunghiulară este în mod necesar diagonală 

cu toate elementele diagonale de modul unitar (vezi exerciţiul 4.20), rezultă w j = 

= We j = e iθj e j , j = 2:n, şi, deci, în (4.138) matricea diagonală D este chiar W, 

i.e. avem D def 

= W. Relaţiile (4.137) sunt o consecinţă imediată a relaţiei (4.138). 

În cazul real demonstraţia este aceeaşi dacă se ţine seama de faptul că operaţia de 

conjugare nu are efect şi că singurele numere reale de modul unitar sunt −1 şi 1. 

Fie δ 1 = 1. Atunci elementele diagonale ale matricei D se determină cu relaţia de 

recurenţă δ i = g i,i−1 

δ i−1 de unde rezultă că, dacă g i,i−1 şi h i,i−1 au acelaşi semn, 

h i,i−1 

atunci δ i = 1, i = 2:n, i.e. D = I n . 

✸ 

k=1


D. Un pas QR cu deplasare implicită 

pentru matrice complexe 

Teorema 4.15 reprezintă fundamentul teoretic pentru variantele cu deplasare implicită 

ale algoritmului QR. Ideea centrală a acestora constă în asigurarea condiţiei 

ca prima coloană a matricei de transformare cumulate aferente unui pas QR să 

coincidă cu prima coloană a matricei de transformare de la varianta cu deplasare 

explicită corespunzătoare, simultan cu minimizarea numărului de operaţii aritmetice, 

prin exploatarea eficientă a structurilor de zerouri ale matricelor implicate. 

Concret, pentru implementarea unui pas simplu QR cu deplasare implicită se 

procedează în felul următor: 

1. Se calculează prima coloană q (k) 

1 a matricei Q k din (4.110) ce defineşte 

transformarea unitară aferentă unui pas simplu QR cu deplasare 

explicită. 

2. Se determină o matrice unitară U 1 astfel încât prima sa coloană să 

fie q (k) 

1 , i.e. U 1e 1 = q (k) 

1 . 

3. Se calculează matricea B = U H 1 H kU 1 (a cărei structură nu mai 

este superior Hessenberg). 

4. Se reface structura superior Hessenberg, aplicând algoritmul HQc 

matricei B: [H k+1 , ˜Q k+1 ] = HQc(B, ˜Q k ,opt). Transformările implicate 

de această reducere nu afectează prima coloană a matricei 

de transformare cumulate. 

AceastăschemădecalculdefineşteunpasQRcu deplasare implicită. Dacămatricea 

H k este ireductibilă, atunci rezultatul H k+1 al aplicării schemei de calcul de mai 

sus va fi esenţial acelaşi, în sensul observaţiei 4.6, cu cel dat de un pas QR cu 

deplasare explicită. Pentru ca procedura cu deplasare implicită sa nu fie inferioară, 

din punctul de vedere al eficienţei, celei cu deplasare explicită, trebuie exploatate 

corespunzător avantajele structurale date de forma Hessenberg a matricelor iniţială 

şi finală. Detaliile unei implementări eficiente sunt prezentate în continuare. 

not 

Fie, pentru simplificarea notaţiilor, H k = H matricea curentă a şirului QR, 

not 

presupusă ireductibilă, H k+1 = H ′ not 

matricea succesor, µ k = µ etc. (i.e. renunţăm 

la indicele k). Aceste notaţii se justifică şi prin faptul că atât matricea H ′ cât şi 

matricea intermediară B pot suprascrie matricea H, i.e. toate calculele aferente 

unui pas simplu QR cu deplasare implicită se pot desfăşura pe loc, în tabloul H. 

Urmând etapele din schema de calcul de mai sus avem următoarele particularităţi. 

1. Presupunem că µ = h nn ∉ λ(H), i.e. matricea H − µI n este nesingulară. 

PrinurmarematriceasuperiortriunghiularăR k 

not 

= R din (4.110)este, de asemenea,


nesingulară, iar prima coloană a matricei de transformare Q k 

not 

= Q este 

⎡ 

q 1 = Qe 1 = 1 

r 11 ⎢ 

⎣ 

h 11 −µ 

h 21 

0 

. 

. 

0 

⎤ 

. (4.139) 

⎥ 

⎦ 

Numim vectorul 

w = 

[ ] 

h11 −µ 

∈ IC 2 (4.140) 

h 21 

vector de deplasare implicită aferent unui pas QR. 

2. Matricea unitară U 1 de la instrucţiunea 2 a schemei de calcul de mai sus 

poate fi un reflector (complex) sau, şi mai simplu, datorită structurii vectorului q 1 

din (4.139), o rotaţie (complexă) U 1 = P 12 , astfel calculată încât 

În ambele situaţii, structura matricei U 1 este 

U H 1 q 1 = ±‖q 1 ‖e 1 . (4.141) 

U 1 = 

[ ] 

Û1 0 

, (4.142) 

0 I n−2 

cu Û 1 ∈ IC 2×2 . Vom opta pentru utilizarea rotaţiilor, aşadar elementele definitorii 

c 1 şi s 1 ale rotaţiei P 12 se obţin cu ajutorul funcţiei Gc în cazul complex, respectiv 

Gr în cel real (vezi tabelul 4.3) aplicate vectorului de deplasare implicită w. 

3. Datorită structurii (4.142) a matricei U 1 alterarea formei Hessenberg prin 

calculul matricei B de la instrucţiunea 3 are loc numai în poziţia (3,1). 

4. Matricea B având un singur element nenul ce alterează forma superior 

Hessenberg, pentru asigurarea eficienţei se impune adaptarea algoritmului HQc 

la această situaţie structurală. Concret, putem utiliza o transformare unitară de 

asemănare definită de o secvenţă de rotaţii (complexe) care elimină elementul nenul 

din afara structurii Hessenberg prin ”deplasarea”lui de-a lungul unui traseu paralel 

cu diagonala principală. Schema de calcul este următoarea: 

1. Pentru i = 2 : n−1 

1. Se calculează rotaţia (complexă) P i,i+1 astfel încât 

(Pi,i+1 H B)(i+1,i−1)= 0. 

2. B ← Pi,i+1 H B. % Se anulează elementul (i+1,i−1). 

3. B ← BP i,i+1 . % Pentru i < n−1 apare un element nenul 

în poziţia (i+2,i). 

Pentru exemplificare prezentăm evoluţia structurală a matricei B în cazul n = 5. 

În diagramele structurale de mai jos zerourile nou create au fost marcate cu ∅, iar 

alterările de zerouri de la transformarea curentă au fost marcate cu +. Încadrările


marchează liniile şi/sau coloanele afectate de transformarea curentă. 

⎡ ⎤ 

× × × × × 

H ← B = U1 H HU × × × × × 

1 = 

⎢ + × × × × 

⎥ 

⎣ 0 0 × × × ⎦ , 

0 0 0 × × 

⎡ 

H ← P23 H H = ⎢ 

⎣ 

⎡ 

H ← HP 23 = 

⎢ 

⎣ 

⎡ 

H ← P34 H H = ⎢ 

⎣ 

⎡ 

H ← HP 34 = 

⎢ 

⎣ 

⎡ 

H ← P45 H H = ⎢ 

⎣ 

⎡ 

H ← HP 45 = 

⎢ 

⎣ 

× × × × × 

× × × × × 

∅ × × × × 

× 

× 

0 

0 

0 

0 0 × × × 

0 0 0 × × 

× × 

× × 

× × 

+ × 

0 0 

× × 

× × 

× × 

× × 

× × 

× × × × × 

× × × × × 

0 × × × × 

0 ∅ × × × 

0 0 0 × × 

× × 

× × 

0 × 

0 0 

0 0 

× × 

× × 

× × 

× × 

+ × 

× 

× 

× 

× 

× 

× × × × × 

× × × × × 

0 × × × × 

0 × × × × 

0 0 ∅ × × 

× × × 

× × × 

0 × × 

0 0 × 

0 0 0 

× × 

× × 

× × 

× × 

× × 

Calcululelementelordefinitoriic i şis i alerotaţieiP i,i+1 sefacecufuncţiaGc, iar 

calculul economic al produselor Pi,i+1 H B si ¸ BP i,i+1 exploatează structura (aproape) 

⎤ 

, 

⎥ 

⎦ 

⎤ 

, 

⎥ 

⎦ 

⎤ 

, 

⎥ 

⎦ 

⎤ 

, 

⎥ 

⎦ 

⎤ 

, 

⎥ 

⎦ 

⎤ 

. 

⎥ 

⎦


Hessenberg a matricei B. Varianta adaptată a algoritmului HQc dată de schema 

de calcul de mai sus calculează matricea superior Hessenberg 

H ← H ′ = P H n−1,n···PH 34 PH 23 BP 23P 34···P n−1,n = 

= P H n−1,n···PH 23 PH 12 HP 12P 23···P n−1,n = Q H k HQ k, (4.143) 

i.e. matricea succesor a lui H din şirul QR cu paşi simpli. 

Din raţiuni de organizare judicioasă a algoritmului QR şi, mai ales, a algoritmului 

de ordonare a formei Schur (vezi secţiunea 4.6), vom introduce un algoritm 

distinct de calcul al vectorului de deplasare implicită asociat unui pas simplu QR. 

Algoritmul 4.4 (VD1 – Calculul vectorului de deplasare implicită 

pentru un pas simplu QR) (Dată o matrice superior Hessenberg ireductibilă 

H ∈ IC n×n , algoritmul calculează vectorul w ∈ IC 2 de deplasare 

implicită pentru un pas simplu QR.) 

1. µ = h nn 

[ ] 

h11 −µ 

2. w = 

h 21 

Comentarii. Sintaxa de apel a acestui algoritm va fi 

w = VD1(H), 

iar execuţia sa implică efectuarea unei singure operaţii cu numere complexe. 

Cu aceste precizări putem prezenta algoritmul de implementare a unui pas simplu 

QR cu deplasare implicită. Sunt utilizate proceduri prezentate în tabelul 4.3. 

Algoritmul 4.5 (IT QR1 – Un pas simplu QR cu deplasare implicită) 

(Date o matrice superior Hessenberg ireductibilă H ∈ IC n×n şi 

vectorul de deplasare implicită w ∈ IC 2 , algoritmul suprascrie matricea 

H cu matriceasuccesorH ← H ′ = Q k HQ H k din şirul QR.De asemenea, 

algoritmul furnizează vectorii c ∈ IR n−1 şi s ∈ IC n−1 ale căror elemente 

(c i ,s i ) definesc rotaţiile P i,i+1 utilizate.) 

1. % Calculul şi aplicarea rotaţiei P 12 

1. [w,c 1 ,s 1 ] = Gc(w) 

2. H(1 : 2,:) = Gcs(c 1 ,s 1 ,H(1 : 2,:)) 

3. H(1 : min(3,n),1 : 2) = Gcd(H(1 : min(3,n),1 : 2),c 1 ,s 1 ) 

2. % Refacerea structurii Hessenberg 

Pentru i = 2 : n−1 

1. [H(i : i+1, i−1),c i ,s i ] = Gc(H(i : i+1,i−1)) 

2. H(i : i+1, i : n) = Gcs(c i ,s i ,H(i : i+1, i : n)) 

3. H(1 : min(i+2,n), i : i+1) = 

= Gcd(H(1 : min(i+2,n), i : i+1),c i ,s i ). 

✸


Comentarii. Vom utiliza următoarea sintaxă de apel a algoritmului de mai sus 

[H,c,s] = IT QR1(H,w). 

Complexitatea unui pas simplu QR este O(n 2 ) în ambele variante de utilizare a 

deplasării. Concret, pentru execuţia algoritmului 4.5 sunt necesari N op ≈ 6n 2 flopi 

complecşi, cărora le corespund N op ≈ 26n 2 flopi reali, la care se adaugă cele n−1 

extrageri de radical. 

Preferinţa pentru varianta cu deplasare implicită este justificată de o anume 

omogenitate a demersului de calcul al valorilor proprii, ţinând seama de faptul că 

în cazul matricelor reale această variantă se impune cu necesitate. ✸ 

E. Algoritmul QR pentru matrice complexe 

Algoritmul QR pentru matrice complexe 22 se obţine prin iterarea algoritmului 

4.5, anularea efectivă a elementelor subdiagonale devenite neglijabile şi exploatarea 

structurală a acestor anulări în vederea obţinerii unei eficienţe maxime. 

Pentru deciziile de anulare a elementelor subdiagonale criteriul uzual este de 

forma (4.126), i.e. 

|h i+1,i | < tol(|h ii |+|h i+1,i+1 |), (4.144) 

unde scalarul tol defineşte nivelul de toleranţă şi are, în mod obişnuit, un ordin 

de mărime comparabil cu eroarea de reprezentare din formatul virgulă mobilă al 

maşinii ţintă. Acest criteriu îşi găseşte o fundamentare, în sensul asigurării unei 

erori de evaluare a valorilor proprii de ordinul de mărime al toleranţei tol, mai 

ales în situaţiile în care are loc o scalare prealabilă a matricei date (vezi § 4.4 H). 

De asemenea, având în vedere faptul că testul (4.144) are o pondere importantă în 

economiaalgoritmului,efectuâdu-selafiecareiteraţiepentrutoateelementelesubdiagonaleale 

submatriceisuperiorHessenbergireductibile curente, încazul matricelor 

complexe se obţine un spor semnificativ de eficienţă dacă se utilizează criteriul 

|Reh i+1,i |+|Imh i+1,i | < tol(|Reh ii |+|Imh ii |+|Reh i+1,i+1 |+|Imh i+1,i+1 |), 

(4.145) 

practic echivalent cu criteriul (4.144). 

Pentru monitorizarea evoluţiei structurale a matricelor din şirul QR, la fiecare 

iteraţie, după anularea elementelor subdiagonale h i+1,i , care satisfac condiţia din 

(4.145), se va determina cel mai mic întreg p şi cel mai mare întreg q astfel încât 

matricea Hessenberg curentă să aibă structura 

⎡ 

H = ⎣ H ⎤ 

11 H 12 H 13 

0 H 22 H 23 

⎦ }p 

}n−p−q , (4.146) 

0 0 H 33 }q 

22 Algoritmul ce urmează se poate aplica, evident, şi matricelor reale, cu condiţia acceptării 

efectuării operaţiilor aritmetice cu numere complexe. Cum o operaţie elementară cu numere complexe 

implică între două şi unsprezece operaţii cu numere reale, utilizarea acestui algoritm pentru 

matrice reale este ineficientă. De aceea, în cazul real se utilizează algoritmul 4.10 care operează 

numai cu date reale.


cu H 11 ∈ IC p×p , H 22 ∈ IC (n−p−q)×(n−p−q) superior Hessenberg ireductibilă şi H 33 ∈ 

∈ IR q×q superior triunghiulară. Astfel, elementele diagonale ale blocului H 33 reprezintă 

valori proprii deja evidenţiate 23 , iar iteraţia QR se va aplica, de fapt, numai 

blocului H 22 

H 22 ← H ′ 22 = Q H 22H 22 Q 22 , (4.147) 

echivalentă cu aplicarea transformării (4.110) cu 

Q = diag(I p ,Q 22 ,I q ). (4.148) 

Această transformare afectează celelalte blocuri ale matricei H din (4.146) în felul 

următor: 

⎡ 

H ← H ′ = Q H HQ = ⎣ H ⎤ 

11 H 12 Q 22 H 13 

0 Q H 22H 22 Q 22 Q H 22H 23 

⎦. (4.149) 

0 0 H 33 

Algoritmul QR se termină în momentul în care se anulează toate elementele 

subdiagonale, i.e. q devine n−1. 

Aşa cum s-a arătat în exemplul 4.4, există situaţii în care algoritmul QR, cu 

deplasările utilizate în pasul QR cu deplasare implicită din algoritmul 4.4, nu este 

convergent. Conform recomandărilor din observaţia 4.5, în marea majoritate a 

acestorsituaţiiconvergenţapoatefirestabilitămodificând, pentruosingurăiteraţie, 

modul de calcul al vectorului de deplasare implicită. Pentru constatarea lipsei de 

convergenţă sau a unei rate de convergenţă prea reduse vom contoriza iteraţiile 

efectuate pentru evidenţierea valorii proprii din poziţia curentă (n−q,n−q) (vezi 

(4.146)). Dacă după 10 sau 20 iteraţii elementul subdiagonal (n−q,n−q −1) nu 

satisface condiţia (4.145), vectorul w de deplasare implicită (4.140) va fi calculat 

folosind deplasarea empirică, recomandată e.g. în [X], 

µ = |Reh n−q,n−q−1 |+|Reh n−q−1,n−q−2 |+i(|Imh n−q,n−q−1 |+|Imh n−q−1,n−q−2 |), 

(4.150) 

unde i este unitatea imaginară. Dacă nici această dublă măsură nu asigură o 

viteză de convergenţă satisfăcătoare, fapt apreciat prin efectuarea a încă 10 iteraţii 

fără satisfacerea condiţiei (4.145) de către elementul (n − q,n − q − 1), atunci se 

declară eşecul rezolvării problemei de calcul al valorilor proprii ale matricei date. 

Menţionăm că deşi, teoretic, o astfel de posibilitate nu este exclusă, practic ea nu 

apare decât pentru date special create în acest scop. 

Utilizând sintaxele de apel menţionate ale algoritmilor 4.4 şi 4.5 precum şi ale 

procedurilor din tabelul 4.3, algoritmul QR cu pasi ¸ simpli, cu deplasări implicite, 

se scrie astfel. 

Algoritmul 4.6 (QR1– Algoritmul QR cu paşi simpli, cu deplasări 

implicite) (Date o matrice A ∈ IC n×n , o matrice unitară Q ∈ IC n×n 

şi un nivel de toleranţă tol pentru anularea elementelor subdiagonale, 

algoritmul calculează forma Schur A ← S = ˜Q H A˜Q a matricei A (şi, 

deci, valorile proprii ale matricei A care sunt elementele diagonale ale 

23 Alte valori proprii evidenţiate se pot găsi printre elementele diagonale ale blocului H 11 .


lui S). Toate calculele se efectuează pe loc, în locaţiile de memorie ale 

tabloului A. Opţional, se acumulează transformările înmatricea unitară 

Q ← Q˜Q. Opţiunea se exprimă cu ajutorul variabilei logice opt de tipul 

şir de caractere care poate lua valorile ′ da ′ sau ′ nu ′ . Dacă nu se doreşte 

acumularea transformărilor, matricea Q rămâne nemodificată.) 

1. Dacă n = 1 atunci return 

2. % Reducerea la forma Hessenberg 

1. [A,Q] =HQc(A,Q,opt) 

3. % Faza iterativă 

1. p = 0, q = 0, cont it = 0 

2. Cât timp q < n 

1. % Anularea elementelor subdiagonale neglijabile 

1. Pentru i = p+1 : n−q −1 

1. Dacă |Rea i+1,i |+|Ima i+1,i | < 

< tol(|Rea ii |+|Ima ii |+|Rea i+1,i+1 |+|Ima i+1,i+1 |) 

atunci a i+1,i = 0 

2. % Determinarea lui q 

1. Cât timp a n−q,n−q−1 = 0 

1. q ← q +1 

2. % Terminarea normală a algoritmului 

Dacă q = n−1 atunci return. 

3. cont it = 0 

3. % Terminarea prin eşec a algoritmului 

1. Dacă cont it > 30 atunci 

1. Tipăreşte ’S-au consumat 30 iteraţii QR pentru 

evidenţierea unei valori proprii fără a se atinge 

acest obiectiv. Este posibil ca, pentru aceste date 

de intrare, algoritmul QR să nu fie convergent.’ 

2. Return. 

4. % Determinarea lui p 

1. p = n−q −1 

2. Cât timp a p+1,p ≠ 0 

1. p ← p−1 

2. Dacă p = 0 atunci break 

5. % Iteraţia curentă 

1. k = p+1, l = n−q 

2. w = VD1(A(k:l,k:l)) 

3. % Calculul deplasării implicite modificate 

1. Dacă cont it = 10 sau cont it = 20 atunci 

1. µ = |Reh l,l−1 |+i|Imh l,l−1 | 

2. Dacă l > k +1 atunci 

µ = µ+|Reh l−1,l−2 |+i|Imh l−1,l−2 | 

3. w = [h kk −µ h k+1,k ] T


4. [A(k : l,k : l),c,s] = IT QR1(A(k:l,k:l),w) 

5. Dacă k > 1 atunci 

1. Pentru i = 1 : l−k 

1. A(1:p,p+i : p+i+1)= 

= Gcd(A(1:p,p+i : p+i+1),c i ,s i ). 

6. Dacă l < n atunci 


1. A(p+i : p+i+1,l+1: n) = 

= Gcs(c i ,s i ,A(p+i : p+i+1,l+1: n)) 

7. cont it ← cont it+1 



1. Q(:, p+i : p+i+1)= Gcd(Q(:, p+i : p+i+1),c i ,s i ) 

Comentarii. Algoritmul implementează ideile expuse în prezentarea teoretică premergătoare, 

iar comentariile incluse asigură, sperăm, transparenţa necesară pentru 

identificarea lor. Menţionăm suplimentar că, pentru contorizarea iteraţiilor, a fost 

utilizată variabila întreagă cont it care se reiniţializeză la zero ori de câte ori se a- 

nulează un nou element subdiagonal. De asemenea, s-a utilizat instrucţiunea break 

(de ieşire forţată din cicluri de tip pentru sau cât timp) pentru încadrarea indexărilor 

în limitele permise de dimensiunile matricelor. Vom apela în continuare 

acest algoritm utilizând sintaxa 

[S,Q] = QR1(A,Q,tol,opt). 

În aspectele sale esenţiale, algoritmul de mai sus stă la baza tuturor programelor 

profesionale de calcul al valorilor proprii ale unei matrice complexe. Utilizarea lui 

pentru calculul formei Schur a unei matrice reale este posibilă 24 , dar este mai puţin 

eficientă în raportcu variantaspecial elaboratăpentru aceastăsituaţie şi prezentată 

în continuarea acestui capitol. 

Datorită procesului iterativ complexitatea algoritmului depinde de datele de intrare 

precum şi de toleranţa practicată. Pentru un nivel de toleranţă de ordinul 

de mărime al erorilor de reprezentare 25 , evaluările experimentale converg către 

aprecierea că, în medie, două iteraţii sunt suficiente pentru a pune în evidenţă o 

valoare proprie. În această situaţie, pentru matrice de ordin superior (de exemplu 

n > 100), se poate aprecia că algoritmul QR1 are o complexitate O(n 3 ). Evaluarea 

de mai sus este corectă pentru matrice de dimensiuni medii şi mari. În exemplele 

academice sau aplicaţiile studenţeşti apar, de regulă, matrice de ordin redus 

24 Pentru probleme de mică dimensiune diferenţa de eficienţă nu este decisivă astfel că acest 

algoritm poate fi folosit cu succes. Atragem însă atenţia că procedura Gc de calcul a unei rotaţii 

complexe (vezi capitolul 3) aplicată unui vector real calculează de fapt o rotaţie reală astfel încât 

pentru date reale acest algoritm va lucra exclusiv cu numere reale privite ca numere complexe şi 

nu va fi capabil să reducă blocurile diagonale 2 × 2 cu valori proprii complexe. Pentru a depăşi 

acest impas se poate proceda, de exemplu, ca în algoritmul special destinat cazului real (vezi mai 

departe) prin identificarea unor astfel de situaţii şi monitorizarea blocurilor diagonale sau prin 

introducerea unor deplasări implicite modificate cu parte imaginară nenulă. 

25 În pachetele comerciale de programe acest nivel de toleranţa este practicat uzual şi nu poate 

fi modificat de utilizator.


(e.g. în jurul lui n = 10), pentru care numărul mediu de iteraţii necesar pentru 

evidenţierea unei valori prorii este ceva mai mare (din experienţa noastră didactică 

apreciem acest număr la 3-4). Aceasta se explică prin faptul că, simultan cu 

elementele subdiagonale din ultima linie şi prima coloană, toate elementele subdiagonale 

ale blocului iterat au tendinţă de anulare asimptotică astfel încât, la matrice 

de dimensiuni mai mari, ultima fază a procesului iterativ este extrem de rapidă. 

Evaluări mai fine sunt date la varianta reală. 

Utilizarea exclusivă a transformărilorunitare conferă algoritmului QR1 o foarte 

bună stabilitate numerică. Aspectele cantitative ale acestei aprecieri calitative a algoritmuluiQR1,precumşispectesuplimentarereferitoarelacondiţionareavalorilor 

proprii sunt prezentate în secţiunile §4.10 şi §4.11. 

✸ 

F. Un pas dublu QR cu deplasare implicită 

pentru matrice reale 

În cazul matricelor reale un spor important de eficienţă se obţine utilizând o aritmetică 

reală şi strategia paşilor dubli QR. La fel ca în cazul pasului simplu, un 

pas dublu QR cu deplasare implicită are ca bază teoretică aceeaşi teoremă 4.15. Şi 

aici, ideea centrală constă în asigurarea coincidenţei primei coloane a matricei de 

transformare cumulate aferente unui pas dublu QR cu prima coloană a matricei de 

transformare cumulate de la doi paşi simpli consecutivi din varianta cu deplasare 

explicită. Reducerea efortului de calcul la nivelul a doi paşi cu deplasare explicită se 

bazează esenţial pe minimizarea numărului de operaţii aritmetice, prin exploatarea 

eficientă a structurilor de zerouri ale matricelor implicate. 

Concret, un pas dublu QR cu deplasare implicită constă din următoarele transformări. 

1. Se calculează prima coloană ˘q (k) 

1 a matricei ˘Q = Qk Q k+1 ce defineşte 

transformarea ortogonală aferentă unui pas dublu QR cu 

deplasare explicită. 

2. Se determină o matrice ortogonalăU 1 astfel încât prima sa coloană 

să fie ˘q (k) 

1 , i.e. U 1e 1 = ˘q (k) 

1 . 

3. Se calculeazămatricea B = U1 TH kU 1 (a cărei structură nu mai este 

superior Hessenberg). 

4. Se reface structura superior Hessenberg aplicând algoritmul HQ 

matriceiB: [H k+2 ,Ū] = HQ(B). Transformărileimplicatedeaceastă 

reducere nu afectează prima coloanăamatricei de transformare 

cumulate. 

Dacă matricea H k este ireductibilă atunci rezultatul H k+2 al aplicării schemei de 

calcul de mai sus va fi esenţial acelaşi, în sensul observaţiei 4.5, cu cel dat de un pas 

dublu QR cu deplasare explicită. Mai mult, schema de mai sus este determinant 

mai eficientă decât varianta cu deplasare explicită. Într-adevăr, exploatând corespunzător 

avantajele structurale date de forma Hessenberg a matricelor iniţială şi 

finală se poate reduce complexitatea pasului dublu de la O(n 3 ) la O(n 2 ), ceea ce în 

economia întregului algoritm este esenţial. Detaliile sunt prezentate în continuare.


not 

Considerăm şi aici, pentru simplificarea notaţiilor, H k = H matricea curentă a 

not 

şirului QR, presupusă ireductibilă, iar H k+2 = H ′ matricea succesor în varianta 

cu utilizarea paşilor dubli. Urmând etapele din schema de calcul de mai sus avem 

următoarele particularităţi. 

1. Fără a reduce generalitatea, presupunem că matricea superior triunghiulară 

not 

R k R k+1 = ˘R este nesingulară. Atunci prima coloană a matricei de transformare 

not 

Q k Q k+1 = ˘Q este 

⎡ 

˘q 1 = ˘Qe 1 = 1 

˘r 11 ⎢ 

⎣ 

h 2 11 +h 12h 21 −sh 11 +p 

h 21 (h 11 +h 22 −s) 

h 21 h 32 

0 

. 

. 

0 

⎤ 

, (4.151) 

⎥ 

⎦ 

not not 

unde s k = s şi p k = p sunt scalari reali definiţi în (4.133). Similar cu cazul pasului 

simplu, numim ⎡ 

⎤ 

w = ⎣ h2 11 +h 12 h 21 −sh 11 +p 

h 21 (h 11 +h 22 −s) ⎦ ∈ IR 3 (4.152) 

h 21 h 32 

vector de deplasare implicită aferent pasului dublu QR. 

2. Matricea ortogonală U 1 de la instrucţiunea 2 a schemei de calcul de mai sus 

poate fi un reflector (real) astfel calculat încât 

U T 1 ˘q 1 = U 1˘q 1 = ±‖˘q 1 ‖e 1 . (4.153) 

Datorită structurii vectorului ˘q 1 din (4.151), structura matricei U 1 este 

[ ] 

Û1 0 

U 1 = 

0 I n−3 

(4.154) 

cu Û1 ∈ IR 3×3 reflector elementar (real) de ordinul 3. 

3. Datorită structurii (4.154) a matricei U 1 , alterarea formei Hessenberg prin 

calculul matricei B de la instrucţiunea 3 are loc numai în poziţiile (3,1), (4,1) şi 

(4,2). 

4. Matricea B având numai trei elemente nenule ce alterează forma superior 

Hessenberg,sporuldeeficienţăseobţineprinadaptareaalgoritmuluiHQrlaaceastă 

situaţie structurală. Concret, se evită operaţiile de adunare şi înmulţire cu zerouri, 

ţinându-se seama de următoarea structură 

⎡ ⎤ 

I i−1 0 0 

[ ] 

U i = ⎣ 

In−2 0 

0 Û i 0 ⎦, i = 2 : n−2, U n−1 = (4.155) 

0 Û 

0 0 I n−1 

n−i−2 

areflectorilorU i , i = 2 : n−1, utilizaţi în cadrulalgoritmuluiHQr, unde Ûi ∈ IR 3×3 

şi Ûn−1 ∈ IR 2×2 sunt reflectori elementari de indice 1. 

Schema de calcul este următoarea:


1. Pentru i = 2 : n−2 

1. Se calculează reflectorul elementar U i cu structura (4.155) 

astfel încât (Ui T B)(i+1 : i+2, i−1) = 0. 

2. B ← Ui T B. % Se anulează elementele (i+1 : i+2,i−1). 

3. B ← BU i . % Pentru i < n−2 sunt alterate zerourile 

din poziţiile (i+3,i : i+1). 

2. % Ultima transformare 

1. Se calculează reflectorul elementar U n−1 astfel încât 

(Un−1 T B)(n, n−2) = 0. 

2. B ← Un−1B. T % Se anulează elementul (n,n−2). 

3. B ← BU n−1 . 

În acest fel, eliminarea elementelor nenule care alterează structura Hessenberg se 

realizează prin ”deplasarea” lor de-a lungul unor trasee paralele cu diagonala principală. 

Pentruexemplificareprezentăm evoluţia structuralăamatricei B în cazul n = 5. 

Şi aici zerourile nou create au fost marcate cu ∅, alterările de zerouri au fost 

evidenţiate cu +, iar încadrările indică liniile şi/sau coloanele afectate de transformarea 

curentă. 

⎡ 

H ← B = U1 T HU 1 = 

⎢ 

⎣ 

× × × × × 

× × × × × 

+ × × × × 

+ + × × × 

0 0 0 × × 

⎤ 

⎥ 

⎦ , 

⎡ 

H ← U2 T H = 

⎢ 

⎣ 

× × × × × 

× × × × × 

∅ × × × × 

∅ + × × × 

0 0 0 × × 

⎤ 

, 

⎥ 

⎦ 

⎡ 

H ← HU 2 = 

⎢ 

⎣ 

× 

× 

0 

0 

0 

× × × 

× × × 

× × × 

+ × × 

+ + × 

× 

× 

× 

× 

× 

⎤ 

, 

⎥ 

⎦ 

⎡ 

H ← U3 T H = ⎢ 

⎣ 

× × × × × 

× × × × × 

0 × × × × 

0 ∅ × × × 

0 ∅ + × × 

⎤ 

, 

⎥ 

⎦


⎡ 

H ← HU 3 = 

⎢ 

⎣ 

⎡ 

H ← U4 T H = ⎢ 

⎣ 

⎡ 

H ← HU 4 = 

⎢ 

⎣ 

× × 

× × 

0 × 

0 0 

0 0 

× × × 

× × × 

× × × 

× × × 

+ × × 

× × × × × 

× × × × × 

0 × × × × 

0 0 × × × 

0 0 ∅ × × 

× × × 

× × × 

0 × × 

0 0 × 

0 0 0 

× × 

× × 

× × 

× × 

× × 

⎤ 

, 

⎥ 

⎦ 

⎤ 

, 

⎥ 

⎦ 

⎤ 

. 

⎥ 

⎦ 

Şi în această variantă adaptată a algoritmului HQr, atât matricea succesor 

H ′ cât şi matricea intermediară B pot suprascrie matricea H, i.e. toate calculele 

aferenteunui pasdublu QRcudeplasareimplicită sepot desfăşurape loc, întabloul 

matricei H. 

Din aceleaşi raţiuni de organizare corespunzătoare a algoritmului QR pentru 

matrice reale şi, mai ales, a algoritmului de ordonare a formei Schur reale (vezi 

secţiunea 4.6), vom introduce şi aici un algoritm distinct de calcul al vectorului de 

deplasare implicită asociat unui pas dublu QR. 


pentru un pas dublu QR) (Dată o matrice superior Hessenberg H ∈ 

∈ IR n×n , algoritmul calculează vectorul w ∈ IR 3 , de deplasare implicită 

pentru un pas dublu QR.) 

1. s = h n−1,n−1 +h nn 

2. p = h n−1,n−1 h nn −h n−1,n h n,n−1 

⎡ 

⎤ 

3. w = ⎣ h2 11 +h 12 h 21 −sh 11 +p 

h 21 (h 11 +h 22 −s) ⎦ 

h 21 h 32 


iar complexitatea sa este, evident, O(1). 

w = VD2(H), 

Cu acesteprecizăriputem prezentaalgoritmulde implementare aunui pas dublu 

QR cu deplasare implicită. 

✸


Algoritmul 4.8 (IT QR2 – Pas dublu QR cu deplasare implicită) 

(Date o matrice superior Hessenberg ireductibilă H ∈ IR n×n şi vectorul 

de deplasare implicită w ∈ IR 3 , algoritmul suprascrie matricea H cu matricea 

succesor H ← H ′ = ˘Q T H ˘Q din şirul QR. Algoritmul furnizează, 

de asemenea, elementele definitorii semnificative ale reflectorilor utilizaţi, 

i.e. elementele definitorii ale blocurilor reflector 3×3 în matricele 

V ∈ IR 3×(n−1) şi b ∈ IR n−1 .) 

1. % Calculul şi aplicarea reflectorului U 1 

1. [w,V(:,1),b 1 ] = Hr(w) 

2. H(1:3,:) = Hrs(V(:,1),b 1 ,H(1:3,:)) 

3. H(1:min(4,n),1:3) = Hrd(H(1:min(4,n),1:3),V(:,1),b 1 ) 

2. % Refacerea formei superior Hessenberg 

1. Pentru i = 2 : n−2 

1. [H(i : i+2,i−1),V(:,i),b i ] = Hr(H(i : i+2,i−1)) 

2. H(i : i+2,i: n) = Hrs(V(:,i),b i ,H(i : i+2,i : n)) 

3. H(1 : min(i+3,n),i : i+2) = 

= Hrd(H(1 : min(i+3,n),i : i+2),V(:,i),b i ) 

3. % Ultimul pas 

1. [H(n−1 : n, n−2),V(1:2, n−1),b n−1 ] = 

= Hr(H(n−1 : n,n−2)) 

2. H(n−1 : n, n−1 : n) = 

= Hrs(V(1:2, n−1),b n−1 ,H(n−1 : n, n−1 : n)) 

3. H(:, n−1 : n) = Hrd(H(:,n−1 : n),V(1:2,n−1),b n−1 ). 


[H,V,b] = IT QR2(H,w). 

Complexitatea unui pas dublu QR realizat de algoritmul 4.8 este O(n 2 ). Concret, 

pentru execuţia algoritmului sunt necesari N op ≈ 24n 2 flopi (reali) la care se 

adaugă cele n−1 extrageri de radical. Subliniem faptul că această soluţie este cea 

mai eficientă implementare cunoscută a iteraţiilor QR pentru matricele reale, fiind 

utilizată în toate programele profesionale de calcul al valorilor proprii. 

Algoritmul 4.8 nu calculează actualizarea matricei de transformare curente Q 

dar oferă, prin matricea V şi vectorul b, informaţia necesară pentru un eventual 

calcul al acesteia. 

✸ 

G. Algoritmul QR pentru matrice reale 

Algoritmul QR pentru matrice reale 26 se obţine prin iterarea algoritmului 4.8, 

anularea efectivă a elementelor subdiagonale devenite neglijabile şi exploatarea 

26 Algoritmul ce urmează se poate aplica şi pentru calculul valorilor proprii ale matricelor 

complexe (mai mult, în unele pachete profesionale de calcul numeric aşa se şi procedează). 

Într-adevăr, dacă C ∈ IC n×n se scrie C = A+iB cu A, B ∈ IR n×n , atunci este uşor de arătat că


structurală a acestor anulări în vederea obţinerii unei eficienţe maxime. După 

epuizarea procedurii de iterare se obţine o matrice cvasisuperior triunghiulară, ortogonal 

asemenea cu matricea iniţială, cu blocurile diagonale de dimensiune cel 

mult 2×2. Pentru obţinerea unei forme Schur reale a matricei iniţiale, algoritmul 

se completează cu reducerea la forma superior triunghiulară a blocurilor diagonale 

2×2 care au valori proprii reale. 

Aspectele tehnice, pe care le trecem succint în revistă mai jos, sunt similare cu 

cele din cazul complex. 

Pentrudeciziiledesetarelazeroaelementelorsubdiagonaleseutilizeazăcriteriul 

dat de relaţia (4.144). 

Similarcualgoritmul4.6, pentru monitorizareaevoluţieistructuraleamatricelor 

din şirul QR, la fiecare iteraţie, după anularea elementelor subdiagonale care satisfac 

condiţia (4.144), se va determina cel mai mic întreg p şi cel mai mare întreg q 

astfel încât matricea Hessenberg curentă să aibă structura (4.146) cu H 11 ∈ IC p×p , 

H 22 ∈ IC (n−p−q)×(n−p−q) superior Hessenberg ireductibilă şi H 33 ∈ IR q×q cvasisuperior 

triunghiulară (i.e. cu blocurile diagonale de dimensiune cel mult 2 × 2). 

Astfel, blocurile diagonale ale submatricei H 33 au valori proprii pe care le considerăm 

”deja evidenţiate” (alte valoriproprii evidenţiate se pot găsi printrevalorile 

proprii ale blocurilor diagonale de dimensiune cel mult 2×2 ale submatricei H 11 ), 

iar iteraţia QR se va aplica, de fapt, numai submatricei H 22 (v. (4.146)-(4.148)). 

Această transformare afectează celelalte blocuri ale matricei H din (4.146) ca în 

relaţia (4.149). 

Faza iterativă a algoritmului QR se termină în momentul în care ordinul submatricei 

H 22 scade la cel mult 2, i.e. q devine mai mare sau egal cu n−2. 

Supravegherea convergenţei procesului iterativ se efectuează similar cu cazul 

complex, cu următoarele aspecte specifice: 

– aprecierea convergenţei se face la nivelul evidenţierii unui bloc diagonal în 

colţul din dreapta jos al submatricei H 22 (în 10 sau 20 de iteraţii pentru modificarea 

modului de calcul alvectoruluide deplasareimplicită, respectiv 30de iteraţii pentru 

renunţarea la continuarea calculului); 

– pentru calculul vectorului de deplasare implicită w modificat în (4.152) se vor 

utiliza următoarele relaţii empirice pentru suma şi produsul deplasărilor µ 1 şi µ 2 

{ 

s = 1.5(|hn−q,n−q−1 |+|h n−q−1,n−q−2 |) 

p = (|h n−q,n−q−1 |+|h n−q−1,n−q−2 |) 2 (4.156) 

, 

valorile şi vectorii [ proprii ale ] matricei C se pot exprima în funcţie de valorile şi vectorii proprii ale 

A −B 

matricei F = ∈ IR 

B A 

2n×2n . Concret, fiecărei valori proprii complexe λ k a matricei C, 

cu x k = u k +iv k (u k ,v k ∈ IR n ) vector propriu asociat, îi corespund [ valorile ] proprii λ] 

k şi conjugata 

ei ¯λ uk 

k , ale matricei reale F, cu vectorii proprii asociaţi de forma −i[ −vk 

şi, respectiv, 

v k u 

[ ] ] 

k 

uk 

+i[ −vk 

, iar fiecărei valori proprii reale λ 

v k u k , cu vectorul propriu asociat notat identic, 

k 

i.e. x k = u k + iv k cu u[ k , v k ∈] 

IR n [, a matricei ] C, îi corespunde o valoare proprie dublă λ k şi doi 

uk −vk 

vectori proprii asociaţi şi ai matricei reale F. Dacă se calculează numai valorile 

v k u k 

proprii ale matricei F nu se poate deduce prin mijloace simple care din valorile proprii complex 

conjugate ale matricei F aparţin spectrului lui C.


recomandate în [X]. 

La terminarea cu succes a fazei iterative, triangularizarea blocurilor diagonale 

2×2 cu valori proprii reale se poate face aplicând procedura standard de deflaţie. 

Dacă G ∈ IR 2×2 are valorile proprii reale, i.e. 

∆ = (g 11 −g 22 ) 2 +4g 12 g 21 ≥ 0, (4.157) 

atunci 

x 1 = 

[ ] 

λ1 −g 22 

g 21 

este un vector propriu asociat valorii proprii λ 1 ∈ λ(G) dată de 

(4.158) 

λ 1 = g 11 +g 22 +sgn(g 11 +g 22 ) √ ∆ 

. (4.159) 

2 

Atunci rotaţia P ∈ IR 2×2 , care asigură satisfacerea condiţiei (P T x 1 )(2) = 0, are 

prima coloană coliniară cu x 1 şi, conform lemei 4.3, realizează triangularizarea 

urmărită 

[ ] 

˜G = P T λ1 ˜g 

GP = 12 

. (4.160) 

0 λ 2 

Dacă blocul diagonal ce trebuie triangularizat, pe care îl notăm generic cu G, se 

află în poziţia definită de liniile şi coloanele k şi k + 1, atunci rezultatul dorit se 

obţine aplicând matricei date o transformare ortogonală de asemănare definită de 

matricea diag(I k−1 ,P,I n−k−1 ). 

Învedereaunei scrierimaiconciseaalgoritmuluiQRcudeplasareimplicită pentru 

matrice reale, prezentăm aici un algoritm preliminar care procesează perechea 

bloc-diagonală 2×2 aflată în poziţia (k,k +1). 

Algoritmul 4.9 (TRID2 – Triangularizarea unui bloc diagonal 

2 × 2) (Dată o matrice S ∈ IR n×n în formă cvasisuperior triunghiulară 

şi întregul k ∈ 1 : n−1 algoritmul testează dacă submatricea 

S(k : k+1,k : k+1) are valorile proprii reale şi, în caz afirmativ, calculează 

triangularizarea ortogonală a blocului diagonal vizat, rezultatul 

suprascriindmatriceaS. Deasemenea, algoritmulreturneazăelementele 

definitorii c şi s ale rotaţiei reale calculate. În caz contrar matricea 

S rămâne nemodificată şi, pentru identificarea acestei situaţii, se returnează 

c = 1, s = 0.) 

1. c = 1, s = 0 

2. β = s k,k +s k+1,k+1 , γ = s k,k s k+1,k+1 −s k,k+1 s k+1,k , ∆ = β 2 −4γ. 

3. Dacă ∆ ≥ 0 atunci 

1. λ = (β +sgn(β) √ ∆)/2 

[ ] 

λ−sk+1,k+1 

2. x = 

s k+1,k 

3. [x,c,s] = Gr(x) 

4. S(1 : k+1,k:k+1) = Grd(S(1 : k+1,k:k+1),c,s)


5. S(k:k+1,k:n) = Grs(c,s,S(k: k+1,k:n)) 

6. S(k+1,k) = 0 % Zeroul calculat devine un zero efectiv. 


iar complexitatea sa este O(n). 

[S,c,s] = TRID2(S,k), 

Cu precizările de mai sus, algoritmul QR standard cu paşi dubli cu deplasări 

implicite pentru calculul formei Schur reale se scrie astfel. 

Algoritmul 4.10 (QR2– Algoritmul QR cu paşi dubli, cu deplasări 

implicite) (Date o matrice A ∈ IR n×n , o matrice ortogonală Q ∈ IR n×n 

şi un nivel de toleranţă tol pentru anularea elementelor subdiagonale, 

algoritmul calculează forma Schur reală a matricei A ← S = ˜Q T A˜Q. 

Toate calculele se efectuează pe loc, în locaţiile de memorie ale tabloului 

A. Opţional, se acumulează transformările prin actualizarea matricei 

ortogonale Q, i.e. Q ← Q˜Q. Opţiunea se exprimă prin intermediul 

variabilei logice opt de tip şir de caractere care poate lua valorile ’da’ 

sau ’nu’. Dacă opt = ′ nu ′ , matricea Q rămâne nemodificată.) 

1. Dacă n = 1 atunci return 

2. % Reducerea la forma Hessenberg 

1. [A,Q] =HQr(A,Q,opt) 


1. p = 0, q = 0, cont it = 0 



1. Pentru i = p+1 : n−q −1 

1. Dacă |a i+1,i | ≤ tol(|a ii |+|a i+1,i+1 |) atunci 

1. a i+1,i = 0 


1. continuă = ′ da ′ 

2. Cât timp continuă = ′ da ′ 

1. Dacă q ≥ n−2 atunci break 

2. Dacă a n−q,n−q−1 = 0 

atunci 

1. q ← q +1 


altfel 

1. Dacă a n−q−1,n−q−2 = 0 

atunci 

1. q ← q +2 


altfel continuă = ′ nu ′ . 

✸


3. % Terminarea normală a fazei iterative 




1. Tipăreşte ’S-au consumat 30 iteraţii QR pentru 

evidenţierea unui bloc diagonal fără a se atinge 


de intrare, algoritmul QR să nu fie convergent.’ 

2. Return 


1. p = n−q −1 


1. p = p−1 



1. k = p+1, l = n−q 

2. w = VD2(A(k:l,k:l)) 

3. % Calculul deplasării implicite modificate 

1. Dacă cont it = 10 sau cont it = 20 atunci 

1. s = 1.5(|a l,l−1 |+|a l−1,l−2 |) 

2. p = (|a l,l−1 |+|a l−1,l−2 |) 2 

⎡ 

3. w = ⎣ a2 kk +a k,k+1a k+1,k −sa kk +p 

a k+1,k (a kk +a k+1,k+1 −s) ⎦ 

a k+1,k a k+2,k+1 

4. [A(k : l,k : l),V,b] = IT QR2(A(k:l,k:l),w) 

5. t = 3 


1. Dacă i = l−k atunci t = 2 

2. r = min(p+i+2,l) 


1. A(1 : p,p+i : r) = 

= Hrd(A(1 : p,p+i : r),V(1:t,i),b i ) 


1. A(p+i : r,l+1 : n) = 

= Hrs(V(1:t,i),b i ,A(p+i : r,l+1 : n)) 

7. cont it = cont it+1 

7. Dacă opt =’da’ atunci 

1. t = 3 


1. Dacă i = l−k atunci t = 2 

2. r = min(p+i+2,l) 

3. Q(:, p+i : r) = Hrd(Q(:, p+i : r),V(1:t,i),b i )) 

⎤


4. % Triangularizareablocurilor diagonale 2×2 cu valori proprii reale 

1. k = 1 

2. Cât timp k < n 

1. Dacă a k+1,k = 0 atunci k = k +1, 

altfel 

1. [A,c,s] =TRID2(A,k) 

2. Dacă opt =’da’ şi c ≠ 1 atunci 

1. Q(:,k:k+1) = Grd(Q(:,k:k+1),c,s) 

3. k = k +2 

Comentarii. În aspectele sale esenţiale, algoritmul de mai sus stă la baza tuturor 

programelor profesionale de calcul al valorilor proprii ale unei matrice reale. 

Precizările referitoare la aspectele de organizare a algoritmului făcute la varianta 

complexă rămân valabile. Sintaxa de utilizare a algoritmului de mai sus va fi 

[A,Q] = QR2(A,Q,tol,opt). 

Acceptând evaluarea conform căreia sunt suficiente, în medie, două iteraţii 

pentru a pune în evidenţă o valoare proprie, algoritmul necesită un număr de 

Nop A = 30n3 flopi fără acumularea transformărilor, Nop Q = 16n3 flopi suplimentari 

pentru calculul vectorilor Schur, i.e. al matricei ortogonale Q. Putem, deci, 

considera că pentru matrice de ordin superior (e.g. n > 100) algoritmul QR2 are o 

complexitate O(n 3 ). 

Şi aici, utilizarea exclusivă a transformărilor ortogonale conferă algoritmului 

QR2 o foarte bună stabilitate numerică. Pentru aspecte suplimentare, referitoare 

la condiţionarea valorilor proprii şi stabilitatea numerică a algoritmului de mai sus, 

vezi secţiunile §4.10 şi §4.11. 

✸ 

H. Permutare şi echilibrare 

Implementările profesionale ale algoritmului QR conţin o fază de prelucrări preliminare 

efectuate asupra matricei A care urmăresc două obiective: 

– a) creşterea eficienţei prin evidenţierea eventualelor valori proprii ”izolate” 

utilizând exclusiv transformări de asemănaredefinite de matrice de permutare (deci 

fără efectuarea de operaţii aritmetice); 

– b) îmbunătăţirea condiţionării spectrului de valori proprii prin transformări 

de asemănare diagonale şi, în acest mod, asigurarea unei acurateţi superioare a 

rezultatelor. 

Permutare 

Dacă matricea A ∈ IC n×n are toate elementele extradiagonale ale liniei sau coloanei 

i nule, atunci elementul diagonal (i,i) este o valoare proprie a matricelor A T şi A 

şi, fapt esenţial, e i este un vector propriu al matricei A T , respectiv A, asociat ei. 

De aceea, elementul diagonal (i,i) poate fi adus în poziţia (1,1) sau (n,n) printr-o


”deflaţiedepermutare”, i.e. printr-otransformaredeasemănaredefinită deomatrice 

de permutare elementară P 1i 27 , respectiv P in . Evident, acest proces poate continua 

examinând matricea rămasă A(2 : n,2 : n) sau A(1 : n−1,1 : n−1). Pentru 

a sistematiza procesul de căutare şi permutare vom deplasa mai întâi liniile cu 

elementele extradiagonalenule în jos (i.e. pe ultima linie a matricei rămasecurente) 

conformschemeiprezentatemaijos. Pentruclaritate, utilizăminstrucţiunea”break 

i”pentruieşireaforţatădinciclul”pentrui = ...”, variabiladeindexareirămânând 

cu valoarea avută în momentul ieşirii din ciclu. 

1. Pentru l = n : −1 : 1 

1. Pentru i = l : −1 : 1 

1. Dacă elementele extradiagonale ale liniei i ale matricei A(1 : l,1 : l) 

sunt nule atunci 

1. Se permută liniile i şi l ale matricei A 

2. Se permută coloanele i şi l ale matricei A 

3. break i 

altfel dacă i = 1 (i.e. nu există nici o linie a matricei A(1 : l,1 : l) 

cu toate elementele extradiagonale nule) atunci 

1. break l 

Se obţine o matrice având structura 

Ǎ = P T 1 AP 1 = 

[ ] 

Ǎ11 Ǎ 12 

, (4.161) 

0 Ǎ 22 

cuǍ11 ∈ IC l×l fărănicioliniecutoateelementeleextradiagonalenuleşiǍ22 superior 

triunghiulară. Matricea de permutare P 1 cumulează toate permutările efectuate. 

Procedând similar cu matricea Ā11 prin deplasarea coloanelor cu toate elementele 

extradiagonale nule spre stânga (i.e., la fiecare pas, în prima coloană a 

matricei ”rămase”) se obţine în final o matrice cu structura 

⎡ ⎤ 

Ã 11 Ã 12 Ã 13 

Ã = P T AP = ⎣ 0 Ã 22 Ã 23 

⎦, (4.162) 

0 0 Ã 33 

cu Ã11, Ã 33 superior triunghiulare şi Ã 22 fără nici o linie şi nici o coloană cu toate 

elementele extradiagonale nule. Matricea de permutare P cumulează permutările 

efectuate. 

Elementele diagonale ale matricelor Ã11 şi Ã 33 sunt valori proprii ale matricei A 

careau fost puse în evidenţă fără a efectua nici o operaţie aritmetică. Pentruaflarea 

celorlalte valori proprii algoritmul QR se aplică numai blocului Ã 22 . Dacă pe lângă 

calculul valorilor proprii se urmăreşte şi calculul vectorilor proprii, atunci trebuie 

reţinută matricea de permutare P (de obicei, în formă factorizată, prin reţinerea 

27 Amintim că matricea de permutare elementară P ij se obţine din matricea unitate prin permutarea 

liniilor (sau coloanelor) i şi j. Premultiplicarea (postmultiplicarea) unei matrice cu P ij 

are ca efect permutarea liniilor (coloanelor) i şi j.


elementelor definitorii ale permutărilor elementare). Transformările efectuate de 

algoritmul QR aplicat blocului Ã 22 definite Ã22 ← S 22 = Q H 22Ã22Q 22 vor acţiona 

şi asupra blocurilor Ã12 şi Ã 23 , i.e. vom efectua Ã12 ← Ã12Q 22 şi, respectiv, 

Ã 23 ← Q H 22Ã23. 

Algoritmul de reducere la forma (4.162), în care este utilizată instrucţiunea 

break având semnificaţia precizată mai sus, este următorul. 

Algoritmul 4.11 (Π – Evidenţierea, prin permutări, a valorilor 

proprii izolate) (Dată matricea A ∈ IC n×n , algoritmul calculează o matrice 

de permutare P astfel încât matricea Ã = PT AP să aibă structura 

(4.162) având blocurile Ã11 = Ã(1 : k−1,1 : k−1) şi Ã 33 = 

= Ã(l+1:n,l+1:n) superior triunghiulare iar blocul Ã 22 = Ã(k : l,k : l) 

nu are nici o linie şi nici o coloană cu toate elementele extradiagonale 

nule. Matricea Ã suprascrie matricea A, iar permutările elementare 

sunt memorate prin elementele vectorului p ∈ IN n , p(i) ≠ i având 

drept semnificaţie faptul că linia (şi coloana) i a fost permutată cu 

linia (respectiv, coloana) p(i). Ordinea de aplicare a permutărilor este 

p(n),p(n−1),...,p(l+1),p(1),p(2),...,p(k −1).) 

1. p = [0 0 ... 0] 

2. Pentru l = n : −1 : 1 

1. Pentru i = l : −1 : 1 

1. Dacă A(i,j) = 0, j = 1 : l, j ≠ i, atunci 

1. A(i, :) ↔ A(l, :) 

2. A(1 : l,i) ↔ A(1 : l,l) 

3. p(l) = i 

4. break i 

altfel dacă i = 1 atunci 

1. break l 

3. Pentru k = 1 : l 

1. Pentru j = k : l 

1. Dacă A(i,j) = 0, i = k : l, i ≠ j, atunci 

1. A(j,k : n) ↔ A(k,k : n) 

2. A(1 : l,j) ↔ A(1 : l,k) 

3. p(k) = j 

4. break j 

altfel dacă j = l atunci 

1. break k 

Comentarii. Vom utiliza în continuare următoarea sintaxă pentru apelarea algoritmului 

de permutare de mai sus: 

[A,p,k,l] = Π(A), 

unde semnificaţia parametrilor este evidentă.


Trebuie precizat că algoritmul Π nu pune în evidenţă, în cazul general, toate 

valorileproprii”izolate”, i.e. cares-arputeaobţine fărăaefectua calculearitmetice. 

Astfel, dacă matricea iniţială are, e.g. structura 

⎡ 

A = 

⎢ 

⎣ 

× × × × × × 

× × × × × × 

0 0 × × × × 

0 0 0 × × × 

0 0 0 0 × × 

0 0 0 0 × × 

unde elementele marcate × sunt nenule, aceasta nu va fi modificată de algoritmul 

de mai sus (întrucât nu are nici o linie şi nici o coloană cu toate elementele extradiagonale 

nule) deşi se vede clar că elementele (3,3) şi (4,4) sunt valori proprii. 

Obţinerea prin transformări de asemănare cu permutări a structurii bloc (4.162) 

nu mai este posibilă în acest caz pentru că vectorii proprii asociaţi valorilor proprii 

remarcate au o structură mai complexă. 

✸ 

Echilibrare 

Aşa cum vom vedea în §4.10, condiţionarea spectrului de valori proprii ale unei 

matrice A este dependentă de ‖A‖ F şi este de dorit ca această normă să fie cât 

mai mică. Pe de altă parte, toate transformările efectuate în diversele variante ale 

algoritmului QR sunt unitare (ortogonale) deci, printre altele, asigură conservarea 

condiţionării spectrului. Se ridică în mod natural problema dacă, într-o fază preliminară, 

această condiţionare nu ar putea fi îmbunătăţită aplicând transformări de 

asemănare neunitare (neortogonale). 

Din motive de eficienţă, în practica numerică s-a pus numai problema unei preprocesări 

a matricei A în sensul reducerii iniţiale a normei ‖A‖ F 

prin transformări 

de asemănare definite de matrice diagonale, i.e. a determinării matricei diagonale 

D = diag(d 1 ,d 2 ,...,d n ), astfel încât ‖D −1 AD‖ F 

să fie minimă 28 . 

Fie D⊂IR n×n mulţimea tuturor matricelor diagonale nesingulare de ordinul n. 

Procesul de minimizare a normei ‖D −1 AD‖ F 

are la bază următoarelerezultate [X]. 

1 ◦ . Pentru orice matrice ireductibilă 29 A ∈ IR n×n 30 există o matrice A c ∈ 

∈ IR n×n astfel încât ‖A c ‖ F = inf D∈D ‖D −1 AD‖ F 

. 

2 ◦ . Se poate construi recurent un şir de matrice (A k ), diagonal asemenea cu A, 

astfel încât A ∞ = lim k→∞ A k = A c . 

3 ◦ . Matricea A c este echilibrată în sensul că normele euclidiene ale liniilor şi 

coloanelor cu acelaşi indice sunt egale, i.e. ‖A c (k,:)‖ = ‖A c (:,k)‖, ∀ k ∈ 1 : n. 

4 ◦ . Oricarear fi matriceadiagonalănesingularăD 0 şirurile (A k ) şi (B k ) asociate 

matricelor iniţiale A şi, respectiv, B = D0 −1 AD 0 au aceeaşi limită A c . 

Aceste rezultate teoretice nu pot fi utilizate ca atare într-o operaţie de precondiţionare 

a unei matrice întrucât înseşi aceste calcule sunt afectate de erorile de 

28 Evident, pot fi utilizate şi alte norme matriceale consistente. 

29 O matrice A ∈ IR n×n (sau A ∈ IC n×n ), n[ ≥ 2 se numeşte ] ireductibilă dacă nu există nici o 

B C 

matrice de permutare P astfel încât P T AP = cu B ∈ IR 

0 D 

r×r , 1 ≤ r < n. 

30 Cazul matricelor complexe se tratează analog. 

⎤ 

, 

⎥ 

⎦


rotunjire şi, în consecinţă, se obţine o matrice cu un spectru mai robust dar, posibil, 

deja afectat de erori de nivel inadmisibil. 

Ţinând seama de aceste observaţii, algoritmii de precondiţionare utilizaţi în 

practică au drept obiectiv concret o echilibrare cât mai bună a normelor euclidiene 

ale liniilor şi coloanelor cu acelaşi indice prin utilizarea unor matrice de transformarediagonalecarepermitefectuareaunorcalculeexacteînformatulvirgulămobilă 

(FVM) al maşinii ţintă. Pentru aceastafie β baza de numeraţie a FVM utilizat 31 şi 

D β ⊂ D mulţimea matricelor diagonale de forma D = diag(β σ1 ,β σ2 ,...,β σn ), σ i ∈ 

∈ Z, i = 1 : n. Întrucât calculul matricei D −1 AD implică numai operaţii de 

înmulţire şi împărţire, aceste calcule se efectuează exact 32 şi precondiţionarea matricei 

este efectiv utilă pentru îmbunătăţirea preciziei valorilor şi vectorilor proprii 

calculaţi. 

Pentru prezentarea algoritmului de echilibrare considerăm matricea A ∈ IR n×n 

şi scriem 

A = A D +A 0 , unde A D = diag(A), (4.163) 

i.e. A 0 este matricea elementelor extradiagonale ale lui A. Se constată imediat că 

pentru orice matrice D ∈ D avem 

D −1 AD = A D +D −1 A 0 D, (4.164) 

i.e. elementele diagonalenu sunt afectate de transformărilediagonalede asemănare. 

Prin urmare, pentru reducerea normei lui D −1 AD este suficient să acţionăm numai 

asupra matricei A 0 . Vom presupune în continuare că matricea A 0 nu are nici o linie 

şi nici o coloană nule 33 . 

Reducerea ‖D −1 A 0 D‖ F 

se face iterativ construind şirul A k , k = 0,1,2,..., 

printr-o relaţie recurentă de forma 

A k+1 = D −1 

k A kD k , (4.165) 

cu D k ∈ D β astfel calculat încât ‖A k+1 ‖ F să fie cât mai mică. Vom efectua această 

minimizare descompunând matricea D k într-un produs de matrice diagonale elementare 

D k = D k1 D k2···D kn , (4.166) 

cu D ki = diag(1,1,...,d ki ,...,1) cu d ki = β σ ki 

(pe poziţia diagonală (i,i)) şi 

maximizând scăderea de normă 

δ ki 

def 

= ‖A ki ‖ F 2 −‖A k,i+1 ‖ F 2 , (4.167) 

unde A ki = D k,i−1···D−1 −1 

k2 D−1 k1 A kD k1 D k2···D k,i−1 , i = 0 : n − 1, A k0 = A k , 

A kn = A k+1 . Pentru aceasta fie, pentru început, d ki = ν o variabilă reală şi 

31 Uzual β = 2, dar se întâlnesc şi situaţii cu β = 10 sau β = 16. 

32 Dacă α = (m,e) este reprezentarea în FVM a numărului real α, unde m este mantisa iar e 

exponentul, atunci α ∗ β σ = (m,e + σ) şi α/β σ = (m,e − σ) deci este afectat numai exponentul 

care, fiind întreg, se calculează exact. Dacă se utilizează un limbaj de programare de nivel înalt 

este posibil să fie necesar ca porţiunile de cod pentru efectuarea acestor operaţii să fie scrise în 

limbaj de asamblare. 

33 În caz contrar se foloseşte algoritmul de permutare Π şi precondiţionarea se aplică unei 

matrice de ordin redus.


ρ ki = ‖A ki (i,:)‖, κ ki = ‖A ki (:,i)‖ normele liniei, respectiv a coloanei i a matricei 

A ki , singurele afectate de transformarea definită de D ki . (Datorită ipotezei că 

matricea A 0 nu are linii sau coloane nule avem ρ ki κ ki ≠ 0). Atunci diferenţa din 

(4.167), ca funcţie de ν, are expresia 

δ ki (ν) = ‖A ki ‖ F 2 −‖A k,i+1 ‖ F 2 = ρ 2 ki +κ 2 ki −( ρ2 ki 

ν 2 +κ2 kiν 2 ) (4.168) 

şi este maximă pentru 

ν ∗ = 

√ 

ρki 

κ ki 

. (4.169) 

Acum, considerăm d ki = β σ ki 

cel mai apropiat de valoarea de mai sus a lui ν ∗ , i.e. 

acel σ ki întreg (unic determinat) pentru care 

sau, echivalent, 

β σ ki− 1 2 < ν ∗ ≤ β σ ki+ 1 2 (4.170) 

β 2σ ki−1 < ρ ki 

κ ki 

≤ β 2σ ki+1 . (4.171) 

Calculul efectiv al lui σ def 

= σ ki , pentru µ def 

= ρ ki 

κ ki 

> 0 dat, se poate face eficient 

observând că 

β 2σ−1 < µ ≤ β 2σ+1 ⇐⇒ µ ≤ β 2σ+1 < µβ 2 , (4.172) 

observaţie care conduce la următoarea schemă de calcul. 

σ 1. σ = 0 

2. ν = 1 

3. α = β 

4. Cât timp α < µ 

1. σ ← σ +1 

2. ν = νβ 

3. α = αβ 2 

5. Cât timp α ≥ µβ 2 

1. σ ← σ −1 

2. ν = ν β 

3. α = α β 2 

De reţinut că toate calculele din schema de mai sus se pot efectua exact (i.e. 

instrucţiunile 4.2, 4.3, 5.2, 5.3 conţin operaţii aritmetice care se efectuează, esenţial, 

în numere întregi), iar după execuţia lor avem α = β 2σ+1 şi ν = β σ , cea mai 

apropiată valoare de acest tip de valoarea optimă ν ∗ . 

Pentru a se evita cicluri, posibile datorită formei speciale a elementelor matricelor 

diagonale de transformare, modificarea efectivă a unei perechi linie-coloană 

i are loc numai atunci când valoarea relativă a lui δ de la un pas elementar este 

superioară unei toleranţe tol impuse, i.e. 

δ ki (d ki ) = ρ 2 ki +κ2 ki −(ρ2 ki 

d 2 +κ 2 ki d2 ki ) > tol(ρ2 ki +κ2 ki ) (4.173) 

ki


sau 

( ρ ki 

) 2 +(κ ki d ki ) 2 < γ(ρ 2 ki 

d +κ2 ki )) (4.174) 

ki 

unde γ = 1−tol. Valoarea recomandată în [X] pentru tol este 0.05, respectiv 0.95 

pentru γ. 

Procesuldeiterareseopreşteatuncicândlapasulcurentk nuarelocmodificarea 

nici unei perechi linie-coloană. 

Rezultă următorul algoritm. 

Algoritmul 4.12 (ECH – Echilibrare) (Date matricea A ∈ IC n×n 

şi baza β a sistemului de numeraţie, algoritmul calculează matricea diagonală 

D, având ca elemente diagonale numai puteri întregi ale bazei β, 

astfel încât matricea Ã = D−1 AD să aibă norma Frobenius minimă în 

raport cu toate transformările de acest tip. Matricea Ã suprascrieA, iar 

puterile σ i ale bazei β, care definesc elementele diagonale D(i,i) = β σi , 

sunt memorate în vectorul s ∈ Z n .) 

1. Pentru i = 1 : n 

1. s i = 0 

2. η = β 2 

3. final = ′ nu ′ 

4. Cât timp final = ′ nu ′ 

1. final = ′ da ′ 


1. ρ = ∑ n 

j=1 |a ij | 2 , κ = ∑ n 

j=1 |a ji | 2 

j≠i j≠i 

2. µ = ρ κ 

3. ν = 1 

4. α = β 

5. σ = s(i) 

6. Cât timp α < µ 

1. σ ← σ +1 

2. ν = νβ 

3. α = αη 

7. Cât timp α ≥ µη 

1. σ ← σ −1 

2. ν = ν β 

3. α = α η 

8. Dacă ρ ν 2 +κν2 < 0.95(ρ+κ) atunci 

1. s(i) = σ 

2. A(i,:) ← A(i,:) , A(:,i) ← A(:,i)ν 

ν 

3. final = ′ nu ′ .


Comentarii. Apelul algoritmului se poate face cu sintaxa 

[A,s] = ECH(A,β). 

Variabila logică final este utilizată pentru sesizarea apariţiei unui pas în care nu 

are loc modificarea nici unei perechi linie-coloană şi a stabili astfel terminarea algoritmului. 

În unele implementări profesionale ale algoritmului, pentru reducerea efortului 

de calcul, în locul echilibrării normelor euclidiene ale liniilor şi coloanelor, se 

efectuează o echilibrare a normelor ‖ · ‖ 1 ale acestora. Ţinând seama de faptul 

că ‖z‖ ≤ ‖z‖ 1 ≤ √ n‖z‖, o echilibrare a normelor ‖ · ‖ 1 are drept consecinţă şi o 

echilibrare, considerată corespunzătoare în aplicaţiile curente, a normelor euclidiene. 

Într-un astfel de caz, instrucţiunea 4.2.1 se modifică adecvat. 

Avându-se în vedere caracterul iterativ, complexitatea algoritmului nu poate 

fi evaluată exact. Totuşi, întrucât majoritatea calculelor se fac practic cu numere 

întregi,sepoateapreciacăpondereaeventualeiutilizăriaalgoritmuluideechilibrare 

în calculul valorilor proprii este puţin semnificativă. 

✸ 

Permutare şi echilibrare 

Algoritmii de permutare şi echilibrare se utilizează de obicei în tandem, situaţie 

în care apar detalii tehnice interesante. Dintre acestea, semnalăm posibilitatea 

memorăriipermutărilorelementareşiaelementelordefinitoriialematriceidiagonale 

D de echilibrare în cadrul aceluiaşi vector de întregi. Într-adevăr, după evidenţierea 

valorilor proprii izolate, echilibrarea se efectuează numai asupra blocului diagonal 

median A 22 = A(k : l,k : l), i.e. 

⎡ 

⎤ 

A 11 A 12 D 22 A 13 

A ← D −1 P T APD = ⎣ 0 D22 −1 A 22D 22 D22 −1 A 23 

⎦. (4.175) 

0 0 A 33 

Prin urmare, pentru memorarea elementelor diagonale se poate utiliza porţiunea 

din vectorul destinat memorării permutărilor neafectată de acestea. Tandemul permutare 

echilibrare poate fi descris în felul următor: 

Algoritmul 4.13 (ΠECH – Permutare şi echilibrare) (Date matricea 

A ∈ IC n×n şi baza de numeraţie β, algoritmul calculează matricea 

de permutare P şi matricea diagonală D 22 (prin puterile bazei β 

care dau valorile elementelor diagonale ale lui D 22 ) astfel încât matricea 

A obţinută în (4.175) să aibe submatricele A(1 : k − 1,1 : k − 1) şi 

A(l+1 : n,l+1 : n) superior triunghiulare iar submatricea A(k : l,k : l) 

echilibrată. Permutările sunt memorate în subvectorii d(1 : k − 1) şi 

d(l + 1 : n) iar puterile bazei care definesc elementele diagonale ale 

matricei D 22 în subvectorul d(k : l).) 

1. [A,d,k,l] = Π(A) 

2. Dacă l > k 

1. [A(k : l,k : l),d(k : l)] = ECH(A(k : l,k : l),β)


2. Pentru i = k : l 

1. c i = 1 

2. Pentru j = 1 : |d i | 

1. Dacă d i > 0 atunci 

1. c i = c i β 

altfel 

1. c i = c i 

β 

3. Dacă l < n 

1. Pentru i = k : l 

1. A(i,l+1 : n) ← A(i,l+1 : n)/c i 

4. Dacă k > 1 


1. A(1 : k −1,j) ← A(1 : k −1,j)c j 

Comentarii. Apelul algoritmului se va face cu sintaxa 

[A,d,k,l] = ΠECH(A,β). 

Evident, calculele de la instrucţiunile 4 şi 5 se pot efectua exact. Dacă porţiunile 

de interes se codifică în limbaj de asamblare, atunci calculul efectiv al numerelor c i 

nu este necesar, operaţiile de la instrucţiunile 4 şi 5 realizându-se prin modificarea 

exponenţilor. 

Complexitatea algoritmului este dictată esenţial de valorile parametrilor k şi 

l, dar aprecierea că ponderea sa în economia unui algoritm de calcul al valorilor 

proprii este puţin semnificativă rămâne valabilă. 

✸ 

4.4.3 Programe principale (”driver”-e) 

Utilizareaalgoritmilorprezentaţi înaceastăsecţiune încadrulunorprogramedecalcul 

al valorilor şi vectorilor proprii (vezi şi secţiunea următoare) se poate face în diverse 

variante, în raport cu tipul datelor iniţiale şi al obiectivelor concrete urmărite. 

Deşi o astfel de întreprindere nu prezintă dificultăţi de principiu, prezentăm, totuşi, 

o exemplificare pentru următoarea situaţie concretă: 

• date iniţiale: o matrice reală A ∈ IR n×n , baza β a sistemului de numeraţie a 

FVM utilizat şi toleranţa tol pentru aprecierea elementelor neglijabile; 

• obiective: calculul formei Schur reale, acumularea tuturor transformărilor şi 

calculul părţilor reale şi complexe ale tuturor valorilor proprii. 

Admitem în continuare, pentru simplificare, că o mulţime de tipul M = n 1 : n 2 , cu 

n 2 < n 1 , este vidă şi că orice operaţie care implică (cel puţin) o mulţime vidă nu 

se execută. O soluţie posibilă pentru problema formulată, incluzând permutarea şi 

echilibrarea, este următoarea.


1. [A,d,l,k] = ΠECH(A,β) 

2. T = I n 

3. % Acumularea transformărilor din faza de permutare 

1. Pentru j = n : −1 : l+1 

1. T(:,j) ↔ T(:,d j ) 

2. Pentru j = 1 : k −1 

1. T(:,j) ↔ T(:,d j ) 

4. % Acumularea transformărilor din faza de echilibrare 


1. c = 1 

2. Pentru i = 1 : |d j | 

1. Dacă d j > 0 atunci 

1. c = cβ 

altfel 

1. c = c β 

3. T(:,j) ← T(:,j)c 

5. % Aplicarea algoritmului QR pentru matrice reale 

1. [A(k : l,k : l),Q] = QR2(A(k : l,k : l),I l−k+1 ,tol, ′ da ′ ) 

2. A(1 : k −1,k : l) = A(1 : k −1,l : k)Q 

3. A(k : l,l+1 : n) = Q T A(k : l,l+1 : n) 

4. T(:,k : l) = T(:,k : l)Q 

6. % Calculul vectorilor cu părţile reale şi imaginare ale valorilor proprii 

1. Pentru i = 1 : k −1 

2. i = k 

1. λ re (i) = a ii , λ im (i) = 0 

3. Cât timp i < l 

1. Dacă a i+1,i ≠ 0 atunci 

1. ∆ = (a ii −a i+1,i+1 ) 2 +4a i,i+1 a i+1,i 

2. λ re (i) = (a ii +a i+1,i+1 )/2, λ im (i) = √ −∆/2 

3. λ re (i+1) = λ re (i), λ im (i+1) = −λ im (i) 

4. i ← i+2 

altfel 

1. λ re (i) = a ii , λ im (i) = 0 

2. i ← i+1

4.5. CALCULUL VECTORILOR PROPRII 281 

4. Pentru i = l+1 : n 

1. λ re (i) = a ii , λ im (i) = 0 

Acest program calculează matricea de transformare nesingulară (dar nu în mod 

necesar ortogonală) T ∈ IR n×n şi matricea A ← S ∈ IR n×n în formă Schur reală, 

astfel încât A ← S = T −1 AT, precum şi toate valorileproprii. El poate fi completat 

cu calculul vectorilorproprii, al unorbazepentru subspaţii invarianteetc., probleme 

tratate în alte secţiuni ale capitolului. 

4.5 Calculul vectorilor proprii 

Este important de precizat că în multe aplicaţii (cum este, e.g. calculul subspaţiilor 

invariante) vectorii proprii pot fi înlocuiţi cu succes de către vectorii Schur. 

Dacăsedoreştetotuşideterminareaexplicităavectorilorpropriix i , i ∈ I ⊂ 1:n, 

ai unei matrice n×n A date, aceştia pot fi calculaţi în următoarele două modalităţi 

folosite curent. 

a) Dacă numărul vectorilor proprii ce trebuie calculaţi depăşeşte 25 de procente 

din numărul total, atunci se recomandă următoarea schemă de calcul: 

VP 1 1. Se calculează formă Schur (reală), utilizând algoritmul QR corespunzător, 

cu acumularea transformărilor, i.e. se calculează matricea (cvasi-) 

superior triunghiulară S şi matricea unitară (ortogonală) Q astfel încât 

S = Q H AQ. 

2. Se calculează vectorii proprii v i ai matricei S, asociaţi valorilor proprii 

de interes, prin rezolvarea sistemelor liniare omogene corespunzătoare. 

3. Vectorii proprii x i ai matricei iniţiale A se calculează cu relaţia 

x i = Qv i . 

În cadrul acestei scheme singura problemă netratată exhaustiv până acum este 

calculul vectorilor proprii ai formelor Schur (reale). 

b) Dacă numărul vectorilor proprii ce trebuie calculaţi este relativ mic, atunci 

se consideră mai economică următoarea schemă de calcul: 

VP 2 1. Se determină, utilizând algoritmul HQ, forma superior Hessenberg 

H = Q H AQ, a matricei A, cu acumularea transformărilor Q. 

2. Se calculează valorile proprii de interes, cel mai adesea prin execuţia 

fazei iterative a algoritmului QR corespunzător, fără acumularea 

transformărilor. 

3. Se calculează vectorii proprii w i ai matricei H, asociaţi valorilor proprii 

de interes, prin câteva iteraţii (teoretic, datorită cunoaşterii valorilor 

proprii, într-o singură iteraţie) ale metodei puterii inverse. 

4. Vectorii proprii x i ai matricei iniţiale A se calculează cu relaţia 

x i = Qw i .


În cadrul acestei scheme singura problemă care necesită o tratare suplimentară este 

aplicarea metodei puterii inverse în contextul unei cunoaşteri (aproape exacte) a 

valorilor proprii asociate. 

Prezentăm succint unele aspecte importante referitoare la cele două probleme 

semnalate mai sus. 

4.5.1 Calculul vectorilor proprii ai formelor Schur 

Considerăm matricea n × n A complexă sau reală. Presupunem obţinute forma 

Schur (reală) S şi, implicit, valorile proprii ale matricei A, precum şi vectorii Schur 

definiţi de coloanele matricei de transformare unitară (ortogonală) cumulate Q. 

În cazul complex, matricea S ∈ IC n×n este superior triunghiulară, iar elementele 

sale diagonale sunt valorile proprii ale matricei S. Calculul vectorilorproprii pentru 

matricele triunghiulare a fost tratat în capitolul 1 (algoritmul 1.23 – TRV). 

În cazul real, forma Schur reală S este o matrice cvasi-superior triunghiulară. 

Fie structura ⎡ 

S = ⎣ S ⎤ 

11 S 12 S 13 

0 S 22 S 23 

⎦ (4.176) 

0 0 S 33 

a matricei S, unde vom considera, pe rând, că blocul S 22 este un scalar, respectiv 

o matrice 2 × 2 cu valori proprii complex conjugate, iar matricele S 11 ∈ IR n1×n1 , 

S 33 ∈ IR n3×n3 sunt cvasi-superior triunghiulare. În primul caz, dacă λ = S 22 este o 

valoare proprie distinctă a matricei S, atunci orice vector de forma 

⎡ 

u = α⎣ u ⎤ 

1 

1 ⎦, (4.177) 

0 

unde u 1 este soluţia sistemului liniar cvasi-superior triunghiular 

(S 11 −λI n1 )u 1 = −S 12 (4.178) 

şi α un scalarrealnenul, estevectorpropriuasociatvaloriipropriiλ = S 22 . În cel de 

al doilea caz, vectorii proprii asociaţi perechii de valori proprii complex conjugate 

α ± iβ ale blocului S 22 se pot considera, la rândul lor, ca doi vectori complex 

conjugaţi u±iv, u,v ∈ IR n . Pentru a rămâne în limitele utilizării aritmeticii reale, 

în practica numerică se obişnuieşte calculul exclusiv al vectorilor reali u şi v ca 

soluţie nenulă a sistemului omogen, singular, 2n-dimensional 

[ ][ ] [ ] 

S −αIn βI n u 0 

= . (4.179) 

−βI n S −αI n v 0 

Presupunem că perechea de valori proprii α ± iβ este distinctă şi considerăm o 

partiţie conformă ⎡ 

u = ⎣ u ⎤ ⎡ 

1 

u 2 

⎦, v = ⎣ v ⎤ 

1 

v 2 

⎦, (4.180) 

u 3 v 3


a[ părţilor reală u şi imaginară ] v ale vectorilor proprii asociaţi. Întrucât matricea 

S33 −αI n3 βI n3 

este nesingulară rezultă u 

−βI n3 S 33 −αI 3 = 0, v 3 = 0. Acum, dacă 

n3 

vectoriibidimensionali u 2 şi v 2 formeazăosoluţie nenulă a sistemului liniar omogen, 

singular, real, de patru ecuaţii cu patru necunoscute, 

[ ] 

S22 −αI 2 βI 2 

, (4.181) 

−βI 2 

S 22 −αI 2 

][ 

u2 

v 2 

] 

= 

atunci u 1 , v 1 se calculeazărezolvând, cu mijloacele clasice, sistemul liniarnesingular 

[ ][ ] [ ] 

S11 −αI n1 βI n1 u1 S12 u 

= − 2 

. (4.182) 

−βI n1 S 11 −αI n1 v 1 S 12 v 2 

Pentru calculul unei soluţii nenule a sistemului liniar omogen (4.181) se constată 

uşorcă, de exemplu, vectorulnenul u 2 ∈ IR 2 poate fi alesarbitrar, e.g. u 2 = [1 0] T , 

caz în care vectorul v 2 ∈ IR 2 se obţine rezolvând sistemul liniar, nesingular, de două 

ecuaţii 

(S 22 −αI 2 )v 2 = βu 2 . (4.183) 

Cuacesteprecizăriputem prezentaurmătorulalgoritmdecalculalvectorilorproprii 

ale unei matrice în formă Schur reală. 

Algoritmul 4.14 (VPS – Calculul vectorilor proprii ai unei matrice 

în formă Schur reală) (Dată matricea S ∈ IR n×n , în formă Schur 

reală, cu valori proprii distincte, algoritmul calculează un set de vectori 

proprii ai matricei S. Vectorii proprii x j , asociaţi valorilor proprii reale 

λ j = s jj sunt situaţi în coloanele j ale matricei X, i.e. x j = X(:,j). 

Pentru valorile proprii complex conjugate corespunzătoare blocului diagonal 

S(j : j +1,j : j +1), vectorii proprii asociaţi x j,j+1 = u j ±iv j 

sunt obţinuţi prin calculul vectorilor reali u j şi v j care se memorează în 

coloanele j şi j+1 ale matricei X, i.e. u j = X(:,j) şi v j = X(:,j+1).) 

1. Dacă n = 1 atunci 

1. X = 1 

2. Return 

2. j = 1 

3. Cât timp j < n 

[ 0 

0 

1. Dacă s j+1,j = 0 atunci 

1. X(j +1 : n,j) = 0 

2. x jj = 1 

3. Dacă j > 1 atunci 

1. Se rezolvă sistemul cvasisuperior triunghiular 

(S(1:j−1,1:j−1)−s jj I j−1 )X(1:j−1,j) = −S(1:j−1,j) 

4. j ← j +1 

altfel


1. α = (s jj +s j+1,j+1 )/2 

2. β = √ −(s jj −s j+1,j+1 ) 2 −4s j+1,j s j,j+1 /2 

3. X(j +2 : n,j : j +1) = 0 

4. x j,j = 1, x j+1,j = 0 

5. Fie S 22 = S(j : j +1,j : j +1). 

Se rezolvă sistemul nesingular de două ecuaţii 

(S 22 −αI 2 )X(j : j +1,j +1) = βX(j : j +1,j) 


1. Fie S 11 [ = S(1:j−1,1:j−1), S 12 = S(1:j−1,j:j+1) ] 

S11 −αI 

şi F = j−1 βI j−1 

. 

−βI j−1 S 11 −αI j−1 

Se[ 

rezolvă sistemul nesingular ] [ 

X(1 : j−1,j) 

F 

= 

X(1 : j−1,j +1) 

7. j ← j +2 

4. Dacă j = n atunci 

−S 12 X(j:j+1,j) 

−S 12 X(j:j−1,j+1) 

1. x jj = 1 

2. Se rezolvă sistemul cvasisuperior triunghiular 

(S(1:j−1,1:j−1)−s jj I j−1 )X(1:j−1,j) = −S(1:j−1,j) 

Comentarii. Sintaxa de apel a algoritmului este 

X = VPS(S). 

În cadrul algoritmului nu are loc o verificare a faptului că matricea S este în formă 

Schur reală. De asemenea, utilizarea matricei vectorilor proprii X se poate face 

numai în conjuncţie cu structura blocurilor diagonale ale matricei S, care trebuie 

cunoscută pentru a putea forma vectorii proprii asociaţi valorilor proprii complex 

conjugate. 

✸ 

Calculul vectorilor proprii asociaţi valorilor proprii multiple ridică dificultăţi 

similare celor evidenţiate în cazul matricelor triunghiulare (v. cap. 1). Într-o astfel 

de situaţie, în algoritmul VPS, sistemele liniare ce se rezolvă devin singulare şi 

trebuie luate măsuri speciale pentru a evita împărţirile cu 0 sau cu numere foarte 

mici. O cale de urmat este utilizată în algoritmul de calcul al vectorilor proprii 

pentru matrice triunghiulare prezentat în capitolul 1. O altă cale, utilizată, de 

exemplu, în [X], înlocuieşte diferenţele λ i −λ j , apreciate ca fiind nule, cu ε M ‖S‖, 

erorile introduse de o astfel de decizie fiind de nivelul erorilor de calcul. În orice 

caz, calculul vectorilor proprii asociaţi valorilor proprii apropiate ridică probleme 

datorită relei condiţionări a sistemelor liniare menţionate. 

4.5.2 Calculul vectorilor proprii ai matricelor 

superior Hessenberg 

În cazul în care numărul vectorilor proprii care se calculează este inferior procentului 

de 25%, în practica numerică s-a format convingerea că este mai avantajoasă 

]


schema de calcul VP 2 , care presupune acumularea transformărilor numai în faza 

directă (neiterativă) a algoritmuluiQR şi aplicareametodei puterii inverse matricei 

superior Hessenberg rezultată în această fază 34 . De aceea considerăm util să semnalăm 

unele dificultăţi ce pot apărea la rezolvarea unor sisteme (de tip Hessenberg) 

aproape singulare. 

Fie A ∈ IC n×n şi H = Q H AQ matricea superior Hessenberg obţinută, e.g. cu algoritmulHQ.Reamintimcămetodaputeriiinverse(v. 

§4.3)decalculalunuivector 

propriu al matricei H constă într-un proces iterativ bazat pe relaţia de recurenţă 

(H −µI n )z k+1 = ρ k z k , k = 0,1,..., z 0 arbitrar, (4.184) 

unde ρ k este un factor scalar de normare. Spre deosebire de cazul curent, aici 

vom presupune că deplasarea µ este o valoare proprie calculată a matricei H (şi, 

în limitele preciziei de calcul, a matricei A). Notăm cu λ 1 valoarea proprie exactă 

a matricei H a cărei aproximaţie este µ. Admiţând că µ a fost calculată cu un 

algoritm numeric stabil (cum este, e.g. algoritmul QR) rezultă că µ este o valoare 

proprie exactă a matricei G = H +E unde E este o matrice de perturbaţie 

de normă spectrală ”mică”, i.e. satisfăcând ‖E‖ ≤ ǫ‖H‖, unde ǫ are ordinul de 

mărime al erorilor de reprezentare (v. § 4.11). Dacă, în plus, λ 1 este o valoare bine 

condiţionată (v. §4.10) atunci 

η = λ 1 −µ (4.185) 

esteşieadeordinulde mărimeallui ǫ‖H‖. PresupunândcămatriceaH estesimplă, 

i.e. există vectorii proprii w i , i = 1 : n, care formează o bază a lui IC n , şi scriind 

rezultă 

z 0 = 

n∑ 

γ i w i , (4.186) 

i=1 

z k = ˜ρ k (γ 1 w 1 +η k n ∑ 

i=2 

γ i 

(λ i −µ) kw i), (4.187) 

unde ˜ρ k este un factor cumulat de normare. Dacă γ 1 nu este neglijabilă (ceea ce este 

o ipoteză plauzibilă) şi λ 1 este o valoareproprie simplă şi ”suficient de bine separată 

de celelalte”, i.e. |λ i −µ| ≫ |η|, i = 2 : n (ceea ce nu este întotdeauna adevărat), 

atunci z k devine coliniar cu w 1 , cu precizia formatului virgulă mobilă, practic într-o 

singură iteraţie, cu toate că sistemul (4.184) este aproape singular şi, deci, posibil 

rău condiţionat. Dacă însă λ 1 nu este simplă, sau nu este suficient de departe 

de celelalte sau este rău condiţionată, atunci analiza de mai sus nu poate garanta 

acurateţea rezultatului, chiar dacă se execută mai multe iteraţii. Pentru a depista 

astfel de situaţii şi pentru a le depăşi, în [X] se propune determinarea unui factor 

de creştere definit după cum urmează. Fie z vectorul propriu de normă euclidiană 

unitară (i.e. ‖z‖ 2 = z H z = 1) calculat cu metoda puterii inverse. Considerăm 

reziduul 

r = Hz −µz. (4.188) 

34 Renunţarea completă la acumularea transformărilor şi aplicarea, după determinarea valorilor 

proprii, a metodei puterii inverse matricei iniţiale se consideră a fi o procedură mai puţin avantajoasă.


Relaţia anterioară poate fi scrisă şi sub forma 

(H −rz H )z = µz. (4.189) 

Avem ‖rz H ‖ = ‖r‖ şi, dacă norma ‖r‖ a reziduului este mică (e.g. de ordinul 

de mărime al lui ε M ‖H‖), atunci z este un vector propriu al unei matrice foarte 

uşor perturbate faţă de H, ceea ce este tot ce se poate spera într-o aritmetică 

aproximativă. Pentru evaluarea normei reziduului r se procedează astfel. Fie z 0 

vectorul iniţial având ‖z 0 ‖ = 1 şi y soluţia sistemului 

(H −µI n )y = z 0 , (4.190) 

i.e. rezultatul primei iteraţii a metodei puterii inverse fără normarea acestuia. 

Atunci definind vectorul succesor al lui z 0 prin normarea lui y, i.e. 

obţinem 

z 1 = y 

‖y‖ , (4.191) 

(H −µI n )z 1 = 1 

‖y‖ z 0. (4.192) 

Prin urmare, cu cât ‖y‖ este mai mare cu atât norma reziduului definit în (4.188) 

este mai mică. De aceea putem defini ‖y‖ drept factor de creştere şi cere ca acesta 

să fie superior unei valori impuse. Mecanismul de realizare a acestui deziderat este 

modificarea iniţializării z 0 şi reluarea primei iteraţii (în locul continuării iteraţiilor 

care nu oferă şansa îmbunătăţirii rezultatului). În [X] este propusă o strategie de 

modificare a iniţializării. Pentru detalii recomandăm consultarea referinţei citate. 

Încheiemacestăsecţiunesemnalândfaptulcă, înmajoritateaaplicaţiilor,vectorii 

proprii pot fi supliniţi cu succes de către vectorii Schur, al căror calcul, apelând în 

exclusivitate la transformări unitare (ortogonale), este mult mai fiabil. 

4.6 Forma Schur ordonată. 

Calculul subspaţiilor invariante 

Aşacums-aarătatînsecţiunea4.1,conceptuldesubspaţiuinvariantaluneimatrice, 

introdus prin definiţia 4.2, este intim legat de valorile şi vectorii proprii ale matricei 

respective şi joacă un rol fundamental în tratarea operatorială a spaţiilor liniare IC n 

sau IR n . În sens larg, subspaţiile invariante sunt subspaţii generate de vectori proprii. 

În contextul problemelor de calcul numeric abordate în prezenta lucrare, acest 

concept a fost folosit pentru a demonstra posibilitatea reducerii, prin transformări 

unitare (ortogonale) de asemănare, a unei matrice la forma Schur (propoziţia 4.2 şi 

lemele 4.2, 4.3). 

Reciproc, cunoaşterea formei Schur şi a vectorilor Schur asociaţi permite calculul 

subspaţiilor invariante asociate unor grupuri precizate de valori proprii ale 

matricei iniţiale. Mai precis, prin calculul subspaţiilor invariante vom înţelege aici 

determinarea unor baze ortonormale pentru acestea.

4.6. CALCULUL SUBSPAŢIILOR INVARIANTE 287 

Fie o matrice A ∈ IC n×n , S = Q H AQ o formă Schur a acesteia şi următoarele 

partiţii ale matricelor S şi Q 

Avem 

S = 

k n−k 

{}}{ {}}{ 

k n−k 

[ ] {}}{ {}}{ 

S11 S 12 }k 

0 S 22 }n−k , Q = [ ] 

Q1 Q 2 

. (4.193) 

AQ 1 = Q 1 S 11 (4.194) 

i.e., conform propoziţiei 4.1, V = ImQ 1 este un subspaţiu A-invariant, subspaţiu 

pe care îl asociem, în mod natural, cu setul de valori proprii λ(S 11 ) ⊂ λ(A), unde 

S 11 = A|S este restricţia lui A la V. Altfel spus, coloanelematricei Q 1 = Q(:, 1 : k) 

formează o bază ortonormală a subspaţiului A-invariant asociat valorilor proprii ale 

matricei A date de primele k elemente diagonale ale matricei S. 

În cazul real, consideraţiile de mai sus rămân valabile cu singurul amendament 

că subspaţiile invariante reale ale unei matrice reale se asociază întotdeauna unor 

seturisimetricede valoriproprii 35 , faptindus de posibilitateaunorpartiţiide forma 

(4.193) unde, de data aceasta, S este în formă Schur reală. 

Ţinând seama de cele de mai sus, un subspaţiu A-invariant este complet definit 

de un set de valori proprii, iar calculul său se reduce, în definitiv, la obţinerea unei 

forme Schur S = Q H AQ în care setul de valori proprii precizat coincide cu spectrul 

de valori proprii al submatricei lider principale de dimensiune corespunzătoare. 

O dată obţinută această formă Schur, baza căutată este dată de primele coloane 

ale matricei de transformare Q. Prin urmare, după aplicarea algoritmului QR şi 

obţinerea unei prime forme Schur, în care elementele (blocurile, în cazul real) diagonale 

nu au o ordine predeterminată, calculul unui subspaţiu invariant se reduce 

la ordonarea elementelor diagonale (i.e. aducerea în primele poziţii diagonale a 

valorilor proprii vizate), prin transformări unitare (ortogonale) de asemănare, şi 

actualizarea matricei de transformare Q. 

Avându-se în vedere faptul că, datorită structurii (cvasi)superior triunghiulare 

a matricei S, permutarea a două elemente (blocuri) neadiacente nu este posibilă 

printr-o transformare elementară (rotaţie sau reflector) fără alterarea structurii, 

mecanismul de ordonare a formei Schur constă dintr-o secvenţă de permutări de 

elemente (blocuri) diagonale adiacente. 

4.6.1 Ordonarea formei Schur 

În cazul complex forma Schur este triunghiulară astfel că este suficient să stabilim 

o procedură de permutare a două elemente diagonale adiacente (vecine). Pentru 

aceasta, considerăm mai întâi o matrice superior triunghiulară de ordinul doi S ∈ 

∈ IC 2×2 cu valorile proprii distincte, i.e. s 11 ≠ s 22 . Fie x 2 un vector propriu unitar 

al matricei S asociat valorii proprii λ 2 = s 22 , i.e. (exerciţiu pentru cititor), 

x 2 = e iθ y 

‖y‖ , unde y = [ 

] 

s 12 

, (4.195) 

s 22 −s 11 

35 Reamintim că prin set simetric înţelegem o mulţime numerică în care elementele complexe 

apar în perechi complex conjugate.


şi unde, fără a reduce generalitatea, putem considera θ = 0, i.e. x 2 = y/‖y‖. 

Conform lemei de deflaţie unitară 4.2, o transformare de asemănare S ′ = P H SP, 

în care matricea unitară P are ca primă coloană vectorul propriu x 2 , va evidenţia, 

în poziţia 11 a matricei S ′ valoarea proprie asociată vectorului propriu x 2 , i.e. s 22 , 

conservând, în acelaşi timp, zeroul din poziţia 21 . Concret, dacă P ∈ IC 2×2 este 

rotaţia (complexă) care asigură 

(P H y)(2) = 0, (4.196) 

unde y este vectorul definit în (4.195), obţinem (încă un exerciţiu pentru cititor) 

[ ] 

S ′ = P H s22 s 

SP = 12 

. (4.197) 

0 s 11 

S-a realizat astfel permutarea celor două valori proprii. 

Pentru o matrice superior triunghiulară S de ordinul n permutarea valorilor 

proprii adiacente s kk şi s k+1,k+1 se realizează folosind transformarea unitară de 

asemănare S ′ = Q H SQ cu 

Q = diag(I k−1 ,P,I n−k−1 ), (4.198) 

unde transformarea definită de matricea de ordinul doi P asigură permutarea valorilor 

proprii ale matricei S(k : k+1,k : k+1). 

Rezumând cele prezentate mai sus, rezultă următoarea schemă de calcul 

P11c 

1. Dacă s kk ≠ s k+1,k+1 atunci 

1. Se calculează vectorul y din (4.195). 

2. Se calculează rotaţia P astfel încât (P H y)(2) = 0. 

3. S ← diag(I k−1 ,P H ,I n−k−1 )S 

4. S ← Sdiag(I k−1 ,P,I n−k−1 ) 

iar algoritmul corespunzător, bazat pe procedurile din tabelul 4.3, este prezentat în 

continuare. 

Algoritmul 4.15 (P11c – Permutarea a două valori proprii adiacente) 

(Date o matrice S ∈ IC n×n în formă Schur, matricea de transformare 

iniţială Q ∈ IC n×n şi întregul k ∈ 1 : n−1, algoritmul suprascrie 

matriceaS cu matriceaS ′ = ˜Q H S ˜Qcarerealizeazăpermutareavalorilor 

proprii s kk , s k+1,k+1 şi actualizează matricea de transformare Q.) 

1. Dacă s kk ≠ s k+1,k+1 atunci 

[ ] 

s 

1. y = k,k+1 

s k+1,k+1 −s kk 

2. [y,c,s] = Gc(y) 

3. s kk ↔ s k+1,k+1 


1. S(1 : k−1,k : k+1) = Gcd(S(1 : k−1,k,k+1),c,s) 

5. Dacă k < n−1 atunci


1. S(k : k+1,k+2 : n) = Gcs(c,s,S(k : k+1,k+2 : n)) 

6. Q(:,k : k+1) = Gcd(Q(:,k : k+1),c,s) 

Comentarii. Sintaxa de apel a algoritmului de mai sus va fi 

[S,Q] = P11c(S,Q,k). 

Complexitatea unei permutări a două valori proprii vecine distincte este O(n), 

numărul asimptotic de flopi (reali) fiind N op = 52n (independent de k). ✸ 

Din momentul în care dispunem de procedura de permutare a două valori proprii 

învecinate, algoritmul de ordonare a formei Schur se reduce, în esenţă, la 

un algoritm de sortare a unei mulţimi bazat pe interschimbarea elementelor adiacente. 

Vom prezenta mai întâi cazul unei ordonări totale care dispune valorile 

proprii ale unei forme Schur S a matricei A în ordinea impusă de o permutare dată 

π = {i 1 ,i 2 ,...,i n } a mulţimii 1 : n, în sensul că elementul diagonal aflat iniţial 

în poziţia (k,k) va fi plasat în final în poziţia (i k ,i k ). Prin actualizarea matricei 

unitare de transformare Q, se calculează bazele ortogonale pentru subspaţiile A- 

invariante asociate unor grupuri impuse de valori proprii. Concret, coloanele 1 : k 

ale matricei actualizate, i.e. Q(:,1:k), formează o bază a subspaţiului A-invariant 

V k asociat setului de valori proprii Λ k = {λ i = s ii | i = 1 : k} (în numerotarea 

finală). Prezentăm un algoritm de ordonare bazat pe o procedură de sortare prin 

selecţie. Invităm cititorul să elaboreze alte variante care să aibe la bază algoritmi 

de sortare alternativi. 

Algoritmul 4.16 (FSC ORD – Ordonarea formei Schur) (Date 

o matrice S ∈ IC n×n în formă Schur, matricea unitară Q ∈ IC n×n şi permutarea 

π = {i 1 ,i 2 ,...,i n }, algoritmul suprascrie matricea S cu matricea 

unitar asemenea S ′ = ˜Q H S ˜Q care are s ′ i k ,i k 

= s kk şi actualizează 

în mod corespunzător matricea de transformare Q.) 

1. Pentru k = 1 : n−1 

1. mută =’nu’ 

2. l = k 

3. Pentru j = k+1 : n 

1. Dacă i j 

1. l = j 

2. mută =’da’ 

4. Dacă mută =’da’ atunci 

1. Pentru j = (l−1) : −1 : k 

1. [S,Q] = P11c(S,Q,j) 

2. i j ↔ i j+1 

Comentarii. Sintaxa naturală de apel a algoritmului prezentat este 

[S,Q] = FSC ORD(S,Q,π).


Complexitatea unei ordonări este dictată esenţial de natura permutării. Cazurile 

limită sunt permutarea identică, pentru care nu se face nici o operaţie aritmetică, şi 

inversiunea, pentru care se efectuează Cn 2 = n(n+1)/2 apelări ale procedurii P11c 

care conduc la o complexitate O(n 3 ). 

De multe ori este mai comod ca în locul permutării π să utilizăm permutarea 

inversă σ = π −1 = {j 1 ,j 2 ,...,j n }. În acest caz, algoritmul suprascrie matricea S 

cu matricea unitar asemenea S ′ = ˜Q H S ˜Q care are s ′ kk = s j k ,j k 

. O variantă a unui 

astfel de algoritm de ordonare arată astfel. 

FSC ORD −1 1. Pentru k = 1 : n−1 

1. Dacă k ≠ j k atunci 

1. Pentru i = (j k −1) : −1 : k 

1. [S,Q] = P11c(S,Q,i) 

2. Pentru i = k+1 : n 

1. Dacă j i < j k atunci j i = j i +1. 

După execuţia acestui algoritm coloanele 1 : k ale matricei de transformare actualizate, 

i.e. Q(:,1:k), formează o bază ortonormală a subspaţiului A-invariant V k 

asociatsetuluidevaloripropriiΛ k = {λ i = s ii | i ∈ {j 1 ,j 2 ,...,j k }}(înnumerotarea 

iniţială). Observaţiile de mai sus privitoare la complexitate rămân valabile. 

Algoritmul de mai sus realizează o ordonare totală a perechilor diagonale. Dacă 

se urmăreşteexclusiv construcţia unei baze unitare pentru un subspaţiu A-invariant 

k-dimensional (k < n), este suficientă o ordonare parţială constând în aducerea, pe 

căile cele mai ”scurte”, a valorilor proprii vizate în primele k poziţii diagonale. O 

variantă posibilă pentru rezolvarea acestei probleme este următoarea. Presupunem 

că dorim construcţia unei baze ortonormale a subspaţiului A-invariant asociat valorilor 

proprii s i1i 1 

, s i2i 2 

, ..., s ik i k 

. Fără a reduce generalitatea, putem considera că 

i 1 

poziţii diagonale se face cu următorul algoritm simplu. 

FSC ORD p 1. Pentru j = 1 : k−1 

1. Dacă i j > j atunci 

1. Pentru l = (i j −1) : −1 : j 

1. [S,Q] = P11c(S,Q,l) 

Încheiem aici comentariile la algoritmul 4.16şi consideraţiile privitoarela ordonarea 

formeiSchurcomplexecumenţiuneacăacesteaspectevorfiîntâlniteşi laordonarea 

formei Schur reale. 

✸ 

4.6.2 Ordonarea formei Schur reale 

Încazulrealvomconsiderapartiţiablocdictatădedimensiunilel k ×l k cul k ∈ {1,2}, 

k = 1 : p, ale blocurilor diagonale ale formei Schur reale S = Q T AQ a matricei 

A ∈ IR n×n ⎡ ⎤ 

S 11 S 12 ··· S 1p 

0 S 22 ··· S 1p 

S = ⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ . (4.199) 

0 0 ··· S pp


ProblemacalcululuisubspaţiilorA-invarianterealeasociateunorseturisimetrice 

de valori proprii revine la ordonarea corespunzătoare a blocurilor diagonale ale 

formei Schur reale. În acest scop este necesar să ştim să permutăm două blocuri 

diagonale adiacente. Permutarea a două blocuri vecine 1×1 se face cu algoritmul 

P11c, cu singura menţiune că toate transformările utilizate sunt reale. Întrucât 

scrierea variantei reale a algoritmului se rezumă la înlocuirea siglei c cu sigla r în 

identificatorii procedurilor, ne mărginim să introducem sintaxa de utilizare 

[S,Q] = P11r(S,Q,k), 

cu menţiunea ca aici k reprezintă linia (şi coloana) pe care se află primul dintre cele 

două blocuri 1×1 ce se permută. 

Rămâne să arătăm cum se pot permuta, prin transformări ortogonale de asemănare, 

două blocuri diagonale vecine din care cel puţin unul are ordinul 2. 

Considerăm acum matricea de ordinul 3 sau 4 

[ ] 

S11 S 

S = 12 

, (4.200) 

0 S 22 

unde, prin urmare, cel puţin unul din blocurile diagonale S 11 , S 22 este 2 × 2. În 

principiu, putem aplica ideile utilizate la elaborarea algoritmului P11, i.e. calculul 

unei baze ortogonale a subspaţiului invariant asociat valorilor proprii ale matricei 

S 22 şi aplicarea lemei de deflaţie ortogonală, soluţie propusă cititorului. Aici vom 

urmaocaleechivalentăcareutilizeazăalgoritmulQRcudeplasareimplicită. Având 

în vedere faptul că matricea S din (4.200) este deja în formă Schur reală rezultă că 

putem determina deplasarea(în formă implicită) exactă care, utilizată în algoritmul 

QR2 pune în evidenţă, în poziţia (2,2), blocul cu valorile proprii dorite, în cazul 

nostru, în vederea permutării, cu valorile proprii ale matricei S 11 . Cunoaşterea 

exactă a deplasării face ca, teoretic, să fie suficientă o singură iteraţie QR pentru 

obţinerea rezultatului dorit. În practică, dacă nivelul de toleranţă practicat este de 

ordinul de mărime al erorilor de rotunjire, este posibil să fie necesare câteva (douătrei) 

iteraţii pentru a putea considera elementele blocului (2,1) neglijabile. De 

asemenea, întrucât algoritmul QR cu deplasare implicită acţionează corect numai 

asupramatricelor înformăHessenbergireductibilă este necesarmai întâiun pas QR 

artificial,cuunvectordedeplasareimplicităaleator,caresăalterezestructuraSchur 

reală a matricei S în sensul obţinerii formei Hessenberg ireductibile. În consecinţă, 

toate cele trei tipuri de permutare se vor supune următoarei scheme de calcul. 

Pij 

1. Se determină elementele definitorii exacte pentru vectorul de deplasare 

implicită (i.e. valoarea proprie dacă primul bloc este 1×1, respectiv suma 

şi produsul valorilor proprii în cazul când primul bloc este 2×2). 

2. Se executa un pas QR cu un vector de deplasare implicită fixat aleator 

(e.g. alegerea w = [1 1 1] T dă bune rezultate). 

3. Se aplică algoritmul QR cu deplasarea implicită exactă (i.e. calculată cu 

elementele de la punctul 1).


Pentrumatricean×ndin (4.199)permutareablocuriloradiacenteS rr şiS r+1,r+1 

ale formei Schur reale S ∈ IR n×n se obţine folosind transformarea ortogonală de 

asemănare S ′ = ˜Q T S ˜Q definită de 

˜Q = diag(I k−1 , ˆQ,I s ), (4.201) 

undetransformareadefinitădematricea ˆQ, deordinul2,3sau4,asigurăpermutarea 

blocurilor diagonale ale matricei 

[ ] 

Srr S ˜S = r,r+1 

, (4.202) 

0 S r+1,r+1 

şi unde k este poziţia diagonală a elementului 11 al blocului diagonal S rr , iar s este 

ordinul cumulat al blocurilor diagonale r+2 : p. 

Vomimplementaschemadecalculdemaisus într-unalgoritmcarevatratatoate 

cazurile dimensionale. Pentru aceasta vom utiliza rezultatele stabilite şi procedurile 

elaborate în acest capitol. 

Pentru o înţelegere mai lesnicioasă a algoritmului facem următoarele precizări: 

– localizarea blocurilor diagonale ale matricei S care vor fi permutate se face 

prin poziţia diagonală k a elementului 11 al primului bloc diagonal şi ordinele i şi j 

ale celor două blocuri; 

– elementele definitorii ale vectorilor de deplasare implicită exactă în vederea 

permutării blocurilor diagonale ale submatricei (4.202) sunt deplasarea µ = s kk în 

cazul în care i = 1 şi, respectiv, suma şi produsul deplasărilor exacte σ = µ 1 +µ 2 = 

= s kk +s k+1,k+1 şi π = µ 1 µ 2 = s kk s k+1,k+1 −s k+1,k s k,k+1 în cazul în care i = 2; 

după efectuarea unui pas dublu QR cu deplasare aleatoare, vectorii de deplasare 

exactă, în cele două cazuri, vor fi 


w exact = 

⎡ 

w exact = 

⎡ 

⎣ s kk −µ 

s k+1,k 

0 

⎣ s2 kk +s k,k+1s k+1,k −σs kk +π 

s k+1,k (s kk +s k+1,k+1 −σ) 

s k+1,k s k+2,k+1 

vezi (4.140), (4.152); 

– vom renunţa la apelarea algoritmului QR2 şi vom adapta ideile acestuia la 

situaţia concretă existentă; pentru aprecierea ca neglijabile a elementelor subdiagonalevomutilizatoleranţatol, 

uzualdeordinuldemărimealerorilordereprezentare; 

– actualizarea blocurilor nediagonale de pe bloc-liniile şi bloc-coloanele afectate, 

conform relaţiei (4.201), se va face utilizând elementele definitorii ale reflectorilor 

implicaţi memorate în tablourile de lucru V şi b. 

Cu convingerea că pentru cititorul interesat nu va fi greu să identifice ideile 

menţionate mai sus, prezentăm acest algoritm. 

Algoritmul 4.17 (Pr – Permutarea a doua blocuri diagonale adiacente) 

(Date o matrice S ∈ IR n×n în formă Schur reală, matricea de 

⎤ 

⎦ 

⎤ 

⎦,


transformare iniţială Q ∈ IR n×n , întregul k care marchează poziţia elementului 

11 al primului bloc diagonal, precum şi ordinele i,j ∈ {1,2} 

ale celor două blocuri diagonale, algoritmul suprascrie matricea S cu 

matricea S ′ = ˜Q T S ˜Q care realizează permutarea blocurilor diagonale 

menţionate şi actualizează matricea de transformare Q.) 

1. Dacă i = 1 şi j = 1 atunci 

1. [S,Q] = P11r(S,Q,k) 

2. Return 

2. Dacă i = 1 şi j = 2 atunci 

1. l = k +2 

2. µ = s kk 

3. w = [1 1 1] T 

4. [S(k : l,k : l),V,b] = IT QR2(S(k : l,k : l),w) 


1. S(1 : k −1,k : l) = Hrd(S(1 : k −1,k : l),V(:,1),b(1)) 

2. S(1 : k −1,k+1 : l) = 

= Hrd(S(1 : k −1,k+1 : l),V(1 : 2,2),b(2)) 


1. S(k : l,l+1 : n) = Hrs(V(:,1),b(1),S(k : l,l+1 : n)) 

2. S(k +1 : l,l+1 : n) = 

= Hrs(V(1 : 2,2),b(2),S(k+1 : l,l+1 : n)) 

7. Q(:,k : l) = Hrd(Q(:,k : l),V(:,1),b(1)) 

8. Q(:,k +1 : l) = Hrd(Q(:,k +1 : l),V(1 : 2,2),b(2)) 

9. Cât timp |s k+2,k+1 | ≥ tol(|s k+1,k+1 |+|s k+2,k+2 |) 

1. w exact = [s kk −µ s k+1,k 0] T 

2. [S(k : l,k : l),V,b] = IT QR2(S(k : l,k : l),w exact ) 


1. S(1 : k −1,k : l) = Hrd(S(1 : k −1,k : l),V(:,1),b(1)) 

2. S(1 : k −1,k+1 : l) = 

= Hrd(S(1 : k −1,k+1 : l),V(1 : 2,2),b(2)) 


1. S(k : l,l+1 : n) = Hrs(V(:,1),b(1),S(k : l,l+1 : n)) 

2. S(k +1 : l,l+1 : n) = 

= Hrs(V(1 : 2,2),b(2),S(k+1 : l,l+1 : n)) 

5. Q(:,k : l) = Hrd(Q(:,k : l),V(:,1),b(1)) 

6. Q(:,k +1 : l) = Hrd(Q(:,k +1 : l),V(1 : 2,2),b(2)) 

10. s k+2,k+1 = 0 % anularea efectivă a elementului neglijabil 

11. Return 

3. Dacă i = 2 atunci 

1. l = k +1+j


2. σ = s kk +s k+1,k+1 

3. π = s kk s k+1,k+1 −s k+1,k s k,k+1 

4. w = [1 1 1] T 

5. [S(k : l,k : l),V,b] = IT QR2(S(k : l,k : l),w) 


1. Pentru q = 1 : i+j −2 

1. S(1 : k −1,k+q −1 : k +q +1) = 

= Hrd(S(1 : k+q−1,k+q−1 : k+q+1),V(:,q),b(q)) 

2. S(1 : k −1,l−1 : l) = 

= Hrd(S(1 : k−1,l−1 : l),V(1 : 2,i+j−1),b(i+j−1)) 


1. Pentru q = 1 : i+j −2 

1. S(k +q −1 : k +q +1,l+1 : n) = 

= Hrs(V(:,q),b(q),S(k +q −1 : k +q +1,l+1 : n)) 

2. S(l−1 : l,l+1 : n) = 

= Hrs(V(1 : 2,i+j −1),b(i+j −1),S(l−1 : l,l+1 : n)) 

8. Pentru q = 1 : i+j −2 

1. Q(:,k +q −1 : k +q +1) = 

= Hrd(Q(:,k +q −1 : k +q +1),V(:,q),b(q)) 

9. Q(:,l−1 : l) = 

= Hrd(Q(:,l−1 : l),V(1 : 2,i+j −1),b(i+j −1)) 

10. r = k +j −1 

11. Cât timp |s r+1,r | ≥ tol(|s r,r |+|s r+1,r+1 |) 

⎡ 

1. w exact = ⎣ s2 kk +s ⎤ 

k,k+1s k+1,k −σs kk +π 

s k+1,k (s kk +s k+1,k+1 −σ) ⎦ 

s k+1,k s k+2,k+1 

2. [S(k : l,k : l),V,b] = IT QR2(S(k : l,k : l),w exact ) 


1. Pentru q = 1 : i+j −2 

1. S(1 : k −1,k +q −1 : k +q +1) = 

= Hrd(S(1 : k −1,k+q −1 : k +q +1),V(:,q),b(q)) 

2. S(1 : k −1,l−1 : l) = 

= Hrd(S(1 : k−1,l−1 : l),V(1 : 2,i+j−1),b(i+j−1)) 


1. Pentru q = 1 : i+j −2 

1. S(k +q −1 : k +q +1,l+1 : n) = 

= Hrs(V(:,q),b(q),S(k +q −1 : k +q +1,l+1 : n)) 

2. S(l−1 : l,l+1 : n) = 

= Hrs(V(1 : 2,i+j−1),b(i+j−1),S(l−1 : l,l+1 : n)) 

5. Pentru q = 1 : i+j −2 

1. Q(:,k +q −1 : k +q +1) = 

= Hrd(Q(:,k +q −1 : k +q +1),V(:,q),b(q))


6. Q(:,l−1:l) = Hrd(Q(:,l−1:l),V(1:2,i+j−1),b(i+j−1)) 

12. s r+1,r = 0 % anularea efectivă a elementului neglijabil 

13. Return 

Comentarii. Sintaxa de apel naturală a algoritmului de mai sus este 

[S,Q] = Pr(S,Q,k,i,j,tol). 

Numărul de operaţii necesar depinde, evident, de tipul blocurilor permutate dar nu 

depinde de poziţia acestora. Asimptotic, în toate cazurile complexitatea algoritmului 

se încadrează totuşi în categoria O(n). 

✸ 

Dispunând de procedura de mai sus, de permutare a două blocuri diagonale 

adiacente, algoritmul de ordonare a formei Schur reale este, în esenţă, identic cu cel 

de ordonare a formei Schur complexe. Pentru un plus de claritate, facem, şi aici, 

câteva precizări: 

–structura blocurilordiagonaleale matricei S în FSR va fi memorată învectorul 

strbl, i.e. strbl(k), k = 1:p, este ordinul blocului diagonal k al matricei S la momentul 

curent al procesării; structura iniţială este unul din parametrii de intrare; 

– pentru localizarea blocurilor diagonale ale matricei S vom utiliza vectorul lcbl 

care va conţine poziţiile elementelor 11 ale acestora, i.e. lcbl(k), k = 1 : p, este 

linia (şi coloana) elementului 11 al blocului diagonal k al matricei S de la momentul 

curent al procesării. 


Algoritmul 4.18 (FSR ORD – Ordonarea formei Schur reale) 

(Date o matrice S ∈ IR n×n în formă Schur reală (4.199), matricea de 

transformare iniţială Q ∈ IR n×n , numărul p al blocurilor diagonale, 

vectorul strbl ∈ IN p al ordinelor blocurilor diagonale şi permutarea 

π = {i 1 ,i 2 ,...,i p }, algoritmul suprascrie matricea S cu matricea ortogonal 

asemenea S ′ = ˜Q T S ˜Q având s ′ i k i k 

= s kk şi actualizează, în mod 

corespunzător, matricea de transformare Q.) 

1. Pentru k = 1 : (p−1) 


2. l = k 

3. Pentru j = (k +1) : n 


1. l = j 



1. Pentru j = (l−1) : −1 : k 

1. lcbl(1) = 1 

2. Pentru i = 2 : j 

1. lcbl(i) = lcbl(i−1)+strbl(i−1)


3. [S,Q] = Pr(S,Q,lcbl(j),strbl(j),strbl(j +1),tol) 

4. i j ↔ i j+1 

5. strbl(j) ↔ strbl(j +1) 

Comentarii. Sintaxa de apel a algoritmului de mai sus este 

[S,Q] = FSR ORD(S,Q,p,strbl,π,tol). 

La fel ca în cazul complex, volumul de calcul necesar pentru ordonare este dictat 

esenţial de natura permutării. În cazul cel mai defavorabil, când permutarea este o 

inversiune şi toate blocurile sunt 2×2, se efectuează 1 2p(p+1) permutări de blocuri 

2×2 adiacente care conduc la o complexitate de O(n 3 ). 

Încazul încaresepreferăutilizareapermutăriiinverseσ = π −1 = {j 1 ,j 2 ,...,j p } 

se poate utiliza o schemă de calcul FSR ORD −1 , similară cu FSC ORD −1 , 

prezentată în comentariile la algoritmul 4.16. 

Şi aici, dacă se urmăreşte exclusiv construcţia unei baze unitare pentru un 

subspaţiu A-invariant asociat unui set simetric de valori proprii definite de k blocuri 

diagonale (k < p), este suficientă o ordonare parţială. Adaptarea algoritmului la 

aceastăsituaţie este similarăcu ceadin cazul complex (vezi schema FSC ORD p ), 

şi este propusă ca exerciţiu cititorului. 

✸ 

4.7 Forma bloc-diagonală 

Forma Schur S a unei matrice reale sau complexe A, împreună cu matricea ortogonală 

sau unitară Q utilizată pentru obţinerea acesteia, joacă un rol fundamental 

în rezolvarea multor probleme concrete care au o legătură mai mult sau mai puţin 

directă cu conceptele de valori şi vectori proprii. Există însă şi probleme 36 în care 

este necesară o descompunere suplimentară a formei Schur, descompunere care să 

ofere informaţii structurale cu semnificaţie mai profundă. 

Precizăm, de la început, că transformările de asemănare unitare (ortogonale, în 

cazul real) şi-au epuizat potenţele în evidenţierea formei Schur (ordonate) şi orice 

alte transformări structurale suplimentare, cu conservarea spectrului, fac apel, în 

mod necesar, la transformări de asemănare neunitare (neortogonale). 

Posibilităţile de construcţie a aşa numitei forme bloc-diagonale a unei matrice 

pătrate sunt intim conexatecu existenţa şi calculul soluţiilor unorecuaţii matriceale 

Sylvester asociate. De aceea, consacrăm paragraful următor acestei probleme. 

4.7.1 Ecuaţia matriceală Sylvester 

Considerăm date matricele A ∈ IC m×m , B ∈ IC n×n şi C ∈ IC m×n . Ecuaţia matriceală 

liniară 

AX −XB = C, (4.203) 

36 Amintim, în acest sens, problemele de descompunere spectrală a sistemelor dinamice liniare 

în care se urmăreşte obţinerea unor submatrice ”decuplate” cu spectre având proprietăţi specifice. 

De asemenea, forma bloc diagonală este utilă în calculul funcţiilor de matrice.

4.7. FORMA BLOC-DIAGONALĂ 297 

cu matricea necunoscutelor X ∈ IC m×n , se numeşte ecuaţie matriceală Sylvester 

37 şi este echivalentă cu un sistem liniar determinat de mn ecuaţii scalare cu mn 

necunoscute 38 . 

Având în vedere structurarea matricei coeficienţilor acestui sistem în cele două 

matrice de date A şi B este interesant şi util să exprimăm condiţiile de existenţă 

şi unicitate ale soluţiei în raport cu aceste matrice şi să găsim metode specifice de 

rezolvare. 

Teorema de existenţă şi unicitate a soluţiei are următorul enunţ. 

Teorema 4.16 Ecuaţia Sylvester (4.203) admite o soluţie X ∈ IC m×n şi această 

soluţie este unic determinată dacă şi numai dacă 

λ(A)∩λ(B) = ∅ 39 . (4.204) 

Demonstraţie. Fie formele Schur 40 S = U H AU şi T = V H BV ale matricelor A 

şi B. Avem A = USU H şi B = VTV H , expresii care, introduse în (4.203), conduc 

la ecuaţia 

USU H X −XVTV H = C, (4.205) 

echivalentă, datorită nesingularităţii matricelor unitare U şi V, cu ecuaţia (4.203). 

Notând 

Y = U H XV, ˜C = U H CV, (4.206) 

ecuaţia (4.205) devine 

SY −YT = ˜C. (4.207) 

Cu aceleaşi argumente ca mai sus, ecuaţia (4.203) admite o soluţie X şi această 

soluţie este unic determinată dacă şi numai dacă ecuaţia (4.207) admite o soluţie 

Y unic determinată. Dar ecuaţia matriceală (4.207) poate fi scrisă sub forma unui 

sistem bloc-inferior triunghiular de mn ecuaţii cu mn necunoscute. Într-adevăr, 

37 Într-un context sistemic, ecuaţia (4.203) este cunoscută sub denumirea de ecuaţie Sylvester 

”continuă”, context în care ecuaţia Sylvester ”discretă” are forma AXB −X = C. 

38 Dacă ˜x ∈ IC mn şi ˜c ∈ IC mn sunt vectorii definiţi, de exemplu, prin concatenarea, în ordinea naturală, 

a coloanelor matricelor X şi, respectiv C, atunci sistemul de mn ecuaţii şi mn necunoscute 

(4.203) poate fi scris ”explicit” sub forma 

(I n ⊗A+B T ⊗I m)˜x = ˜c. 

În relaţia de mai sus ⊗ este operatorul pentru produsul Kronecker a două matrice definit în felul 

următor: dacă M ∈ IC p×q şi N ∈ IC r×s , atunci P def = M ⊗ N ∈ IC pr×qs este matricea având 

structura bloc P = [P ij ] i=1:p,j=1:q cu P ij = m ij N. 

39 Dacă (4.204) nu este satisfăcută, atunci ecuaţia Sylvester (neomogenă) (4.203) poate să 

admită sau să nu admită soluţii (alternativa lui Fredholm) în raport cu matricea termenilor liberi 

C. Dacă admite soluţii, atunci soluţia generală este de forma X = X p + X o, unde X p este o 

soluţie particulară a ecuaţiei Sylvester neomogene (4.203), iar X o este soluţia generală a ecuaţiei 

omogene AX −XB = 0. În aceasta situaţie, ecuaţia omogenă are soluţia generală Xo dependentă 

de N ∑ parametri arbitrari (sau, altfel spus, admite un sistem de N soluţii liniar independente). Aici 

p q 

N = 

i=1∑ 

l=1 ν il cu ν il = min(m i ,n l ) unde m i şi, respectiv, n l sunt ordinele celulelor Jordan 

ale matricelor A şi, respectiv, B care au aceeaşi valoare proprie. Pentru detalii se poate consulta 

referinţa [I]. 

40 Dacă matricele A şi B sunt reale atunci S şi, respectiv, T sunt forme Schur complexe ale 

acestora.


având în vedere structura superior triunghiulară a matricelor S şi T ecuaţia (4.207) 

se poate scrie ”pe coloane” sub forma 

Sy j −Yt j = ˜c j , j = 1 : n, (4.208) 

unde y j = Ye j , t j = Te j = [t 1j t 2j ... t jj 0 ... 0] T şi ˜c j = ˜Ce j . Prin urmare, 

ecuaţiile (4.208) devin 

Sy j − 

j∑ 

t kj y k = ˜c j , j = 1 : n, (4.209) 

k=1 

care se scriu sub forma matriceală 41 

⎡ 

⎤⎡ 

⎤ ⎡ 

S−t 11 I m 0 ··· 0 y 1 

−t 12 I m S−t 22 I m 0 0 

y 2 

⎢ . . 

⎣ 

. 

. . .. 

. ⎥⎢ 

. ⎥ 

. ⎦⎣ 

. ⎦ = ⎢ 

⎣ 

−t 1n I m −t 2n I m ··· S−t nn I m y n 

⎤ 

˜c 1 

˜c 2.. 

⎥ 

˜c n 

⎦ . (4.210) 

Acest sistem admite o soluţie unică dacă şi numai dacă matricea sistemului este 

nesingulară, i.e. dacă şi numai dacă matricele S−t jj I m , j = 1 : n, sunt nesingulare, 

respectiv 

s ii −t jj ≠ 0, i = 1 : m, j = 1 : n. (4.211) 

Având în vedere faptul că λ(A) = {s 11 ,s 22 ,...,s mm } şi λ(B) = {t 11 ,t 22 ,...,t nn } 

condiţia(4.211)esteechivalentăcu(4.204). Aceastăobservaţieîncheiedemonstraţia 

teoremei. 

✸ 

Structura bloc-inferior triunghiulară a sistemului (4.210) împreună cu structura 

superior triunghiulară a blocurilor diagonale fac ca rezolvarea sistemului (4.210) să 

fie posibilă prin rezolvarea sistemelor 

∑j−1 

(S −t jj I m )y j = ˜c j + t kj y k , j = 1 : n, (4.212) 

în ordinea j = 1,2,...,n, necunoscutele scalare y ij calculându-se, în ordinea i = 

= n,n−1,...,2,1, cu formula 

k=1 

y ij = ˜c ij + ∑ j−1 

k=1 y ikt kj − ∑ m 

k=i+1 s iky kj 

s ii −t jj 

. (4.213) 

După calculul matricei Y, matricea necunoscută iniţială se determină din prima 

relaţie (4.206) cu formula 

X = UYV H . (4.214) 

Valorificarea algoritmică a părţii constructive a demonstraţiei teoremei 4.16 o 

vom face în două etape. Mai întâi vom prezenta un algoritm pentru rezolvarea 

unei ecuaţii Sylvester ”triunghiulare” de tipul (4.207) care va fi apoi folosit într-un 

algoritm pentru rezolvarea ecuaţiei Sylvester având forma generală (4.203). 

41 Vezi şi una din notele de subsol precedente, referitoare la utilizarea produselor Kronecker.


Algoritmul 4.19 (SYLVtri - Rezolvarea ecuaţiei Sylvester triunghiulare) 

(Date matricele superior triunghiulare S ∈ IC m×m , T ∈ IC n×n 

cuλ(A)∩λ(B) = ∅, precumşimatriceaC ∈ IC m×n , algoritmulcalculează 

soluţia Y ∈ IC m×n a ecuaţiei Sylvester SY −YT = C. 

1. Pentru j = 1 : n 


1. Pentru i = 1 : m 

1. c ij = c ij + ∑ j−1 

k=1 y ikt kj . 

2. Pentru i = m : −1 : 1 

1. Dacă i < m atunci 

1. c ij = c ij − ∑ m 

k=i+1 s iky kj . 

c ij 

2. y ij = . 

s ii −t jj 

Comentarii. Sintaxa de apel a algoritmului 4.19 este 

Y = SYLVtri(S,T,C). 

Complexitatea algoritmului este O(n 3 ) (sau O(m 3 )), numărul de flopi complecşi 

fiind N ∗ 

(c) = 1 4 (m2 n+mn 2 ) înmulţiri şi N (c) 

± = 1 4 (m2 n+mn 2 ) adunări şi scăderi, 

echivalat cu evaluările uzuale la N = 2(m 2 n+mn 2 ) flopi reali. În cazul real, evident, 

N op = 1 2 (m2 n+mn 2 ). Algoritmul fiind, în esenţă, o colecţie de rezolvări de 

sisteme triunghiulare are, cel puţin în parte, proprietăţile algoritmilor de rezolvare 

ale acestora. Se poate afirma că dacă spectrele matricelor S şi T sunt bine ”separate”, 

i.e. în acest caz |s ii − t jj | sunt suficient de mari, atunci algoritmul este 

numeric stabil. Asupra conceptului de separare a spectrelor se va reveni, într-un 

context mai general, în secţiunea 4.10. 

✸ 

Algoritmul de rezolvare a ecuaţiei Sylvester triunghiulare serveşte ca bază, conform 

celor arătate mai sus, pentru rezolvarea ecuaţiei Sylvester generale. Avem 

următorul algoritm. 

Algoritmul 4.20(SYLVc-Rezolvarea ecuaţiei matriceale Sylvester 

complexe) (Date matricele A ∈ IC m×m , B ∈ IC n×n , C ∈ IC m×n cu λ(A)∩ 

∩λ(B) = ∅ şi toleranţa tol, algoritmul calculează soluţia X ∈ IC m×n a 

ecuaţiei Sylvester continue AX − XB = C utilizând algoritmul QR1 

pentru reducerea matricelor A şi B la forma Schur. Se presupune că 

algoritmul QR1 se termină normal în ambele cazuri.) 

1. [S, U ] = QR1(A,I m ,tol, ′ da ′ ) 

2. [T, V ] = QR1(B,I n ,tol, ′ da ′ ) 

3. C ← ˜C = U H CV 

4. Y = SYLVtri(S,T,C) 

5. X = UYV H .


Comentarii. Sintaxa de apel a algoritmului 4.20 este 

X = SYLVc(A,B,C). 

Complexitateaalgoritmuluieste O(n 3 ). Evident, efortulde calculcel maiimportant 

se consumă în execuţia instrucţiunilor 1 şi 2 de aducere la forma Schur a matricelor 

A, B şi de acumulare a transformărilor (dar nici efortul pentru rezolvarea ecuaţiei 

Sylvester triunghiulare şi efectuarea produselor matriceale nu poate fi neglijat). 

Dacă numim, ad-hoc, metoda prezentată mai sus varianta Schur-Schur, din motive 

de asigurare a unei eficienţe maxime, se impune analiza alternativelor în care se 

renunţă la aducerea la forma Schur a ambelor matrice A şi B. Astfel, în aşa numita 

variantă Hessenberg-Schur numai matricea B este adusă la forma Schur apărând 

următoarele diferenţe în raport cu algoritmul 4.20 de mai sus: 

– în instrucţiunea 1 matricea A este adusă, printr-un algoritm de calcul direct 

(neiterativ) – algoritmul HQc – la forma superior Hessenberg; în acest fel se evită 

faza iterativă a algoritmului QR1; 

– în compensaţie, la instrucţiunea 3, în loc de rezolvarea unei ecuaţii Sylvester 

triunghiulare se rezolvă o ecuaţie Sylvester Hessenberg-triunghiulară, ceea ce presupune 

rezolvarea a n sisteme de tip Hessenberg, incluzând eliminare gaussiană cu 

eventuală pivotare. 

Evaluările existente apreciază că varianta Hessenberg-Schur este cu 30 până la 

80 procente mai eficientă. Scrierea explicită a algoritmului Hessenberg-Schur este 

propusă cititorului ca exerciţiu. 

Evident, matricele S şi T pot suprascrie matricele A şi, respectiv, B după cum 

matricea Y a rezultatelor intermediare şi soluţia X pot suprascrie matricea C dar 

s-a preferat scrierea de mai sus pentru claritatea prezentării algoritmului. ✸ 

În cazul uzual, în care datele de intrare, i.e. matricele A, B şi C, sunt reale 

soluţia X este reală şi toate calculele se pot efectua într-o aritmetică reală. Pentru 

aceasta, în locul formei Schur complexe se utilizează reducerea la forma Schur reală. 

Ne propunem mai întâi să rezolvăm ecuaţia Sylvester 

SY −YT = C, (4.215) 

în care matricele S ∈ IR m×m şi T ∈ IR n×n au structuri cvasi-superior triunghiulare 

(i.e. cu blocurile diagonale de ordin cel mult 2) 

⎡ ⎤ ⎡ ⎤ 

S 11 S 12 ··· S 1p T 11 T 12 ··· T 1q 

0 S 22 ··· S 2p 

S = ⎢ . . 

⎣ 

. 

. . .. 

. ⎥ 

. ⎦ , T = 0 T 22 ··· T 2q 

⎢ . . 

⎣ 

. 

. . .. 

. ⎥ 

. ⎦ , (4.216) 

0 0 ··· S pp 0 0 ··· T qq 

iar C ∈ IR m×n . Algoritmul corespunzător acestei situaţii structurale este cunoscut 

sub denumirea de algoritmul Bartels-Stewart [4]. 

Procedura urmăreşte cu fidelitate ideile din algoritmul 4.19, cu singura deosebire 

că în locul unor scalari apar blocuri i × j cu i,j ∈ {1,2}. Partiţionăm 

matricea necunoscutelor Y = [Y ij ] i=1:p,j=1:q şi matricea termenilor liberi C = 

= [C ij ] i=1:p,j=1:q conform cu partiţiile (4.216) ale matricelor S şi T.


În acest fel, corespondentele relaţiilor (4.212) sunt ecuaţiile bloc 

S ii Y ij −Y ij T jj = ˜C 

∑j−1 

ij + T kj Y ik − 

k=1 

q∑ 

k=i+1 

S ik Y kj i = 1 : p, j = 1 : q, (4.217) 

i.e. ecuaţii Sylvester având matricele S ii şi T jj de dimensiuni 1×1 sau 2×2 care, 

scrise explicit, reprezintă sisteme liniare determinate de ordin 1, 2 sau 4. Termenii 

liberi ai acestor sisteme, i.e. matricele din membrul drept al relaţiilor (4.218), sunt 

calculabili dacă rezolvarea acestor sisteme se face în ordinea j = 1,2,...,q, i = 

= p,p−1,...,1. 


Algoritmul 4.21 (BS – Algoritmul Bartels-Stewart) (Date matricele 

cvasi-superior triunghiulare S ∈ IR m×m , B ∈ IR n×n cu blocurile 

indexate ca în (4.216), astfel încât λ(S) ∩λ(T) = ∅ şi matricea termenilor 

liberi C ∈ IR m×n , partiţionată conform cu partiţilile matricelor 

S şi T, algoritmul calculează soluţia Y ∈ IR m×n a ecuaţiei Sylvester 

SY −YT = C.) 

1. Pentru j = 1 : q 


1. Pentru i = 1 : p 

1. C ij = C ij + ∑ j−1 

k=1 Y ikT kj . 

2. Pentru i = p : −1 : 1 

1. Dacă i 

1. C ij = C ij − ∑ p 

k=i+1 S ikY kj . 

2. Se rezolvă ecuaţia Sylvester S ii Y ij − Y ij T jj = C ij (prin 

scrierea explicită şi utilizarea, e.g. a eliminării gaussiene) 

Comentarii. Sintaxa de apel, cu care a algoritmul 4.21 va fi utilizat în continuare, 

este 

Y = BS(S,T,C). 

ComplexitateaalgoritmuluiesteO(n 3 ), comparabilăcurezolvareaecuaţieiSylvester 

triunghiulare cu algoritmul4.19. Concret numărul asimptotic de operaţii aritmetice 

ce se efectuează este N op = 1 2 (m2 n + mn 2 ). De asemenea, proprietăţile numerice 

sunt similare cu cele ale algoritmului 4.19, fiind dependente esenţial de nivelul de 

separare al spectrelor celor două matrice S şi T. 

✸ 

Revenim la rezolvarea ecuaţiei Sylvester (4.203) având matricele de date A, B 

şi C reale. Fie U T AU = S şi V T BV = T formele Schur reale ale matricelor A, 

respectiv B, unde matricele U ∈ IR m×m şi V ∈ IR n×n sunt ortogonale. Introducând 

A = USU T şi B = VTV T în (4.203) obţinem ecuaţia 

care poate fi scrisă în forma (4.215) 

SU T XV −U T XVT = U T CV, (4.218) 

SY −YT = ˜C, (4.219)


unde 

Y = U T XV, ˜C = U T CV. (4.220) 

După calculul matricei Y cu algoritmul Bartels-Stewart, matricea necunoscută iniţială 

se determină cu relaţia 

X = UYV T . (4.221) 

Obţinem următorul algoritm. 

Algoritmul 4.22 (SYLVr – Rezolvarea ecuaţiei Sylvester reale) 

(Date matricele A∈IR m×m , B∈IR n×n , C ∈ IR m×n , cu λ(A)∩λ(B) = ∅, 

şi toleranţa tol, algoritmul calculează soluţia X ∈ IR m×n a ecuaţiei 

Sylvester continue AX −XB = C prin reducerea matricelor A şi B la 

forma Schur reală cu algoritmul QR2 şi utilizarea algoritmului Bartels- 

Stewart. Se presupune că algoritmul QR2 se termină normal în ambele 

cazuri.) 

1. [S, U ] = QR2(A,I m ,tol, ′ da ′ ) 

2. [T, V ] = QR2(A,I n ,tol, ′ da ′ ) 

3. C ← ˜C = U T CV 

4. Y = BS(S,T,C) 

5. X = UYV T 

Comentarii. Sintaxa de apel, cu care algoritmul 4.22 va fi utilizat în continuare, 

este 

X = SYLVr(A,B,C). 

Pentru alte aspecte, cum sunt aprecierea complexităţii şi memorarea economică, 

vezi comentariile de la algoritmul 4.20. 

✸ 

Observaţia 4.7 Condiţia (4.204), de existenţă şi unicitate a soluţiei ecuaţiei 

Sylvester (4.203), sugerează ideea că soluţia este cu atât mai ”robustă” cu cât 

spectrele matricelor A şi B sunt mai bine ”separate”. Măsura separării spectrelor 

matricelor A şi B este dată de scalarul 

‖AV −VB‖ F 

sep(A,B) = min 

(4.222) 

V≠0 ‖V‖ F 

(pentru mai multe detalii vezi §4.10). Concret, se poate arăta [54] că soluţia X a 

ecuaţiei Sylvester (4.203) satisface condiţia 

‖X‖ F ≤ ‖C‖ F 

sep(A,B) . (4.223) 

Deci, dacă separarea matricelor A şi B este redusă, atunci este posibil ca norma 

Frobenius a soluţiei să fie mare. 

✸


4.7.2 Descompunerea bloc-diagonală 

Posibilitatea reducerii, prin transformări de asemănare, a unei matrice bloc-triunghiulare 

la o matrice bloc-diagonală are la bază următoarea lemă. 

Lema 4.5 Fie o matrice T ∈ IC n×n 2×2 superior bloc-triunghiulară 

[ ] 

T11 T 

T = 12 

, T 

0 T 11 ∈ IC n1×n1 , T 22 ∈ IC n2×n2 , n 1 +n 2 = n. (4.224) 

22 

Dacă λ(T 11 ) ∩ λ(T 22 ) = ∅, atunci există o matrice nesingulară X ∈ IC n×n având 

structura 

[ ] 

In1 X 

X = 12 

, (4.225) 

0 I n2 


D = X −1 TX = 

Demonstraţie. Este simplu de constatat că 

[ ] 

X −1 In1 −X 

= 12 

0 I n2 

şi, în consecinţă, 

D = X −1 TX = 

[ ] 

T11 0 

. (4.226) 

0 T 22 

(4.227) 

[ ] 

T11 T 11 X 12 −X 12 T 22 +T 12 

. (4.228) 

0 T 22 

Conform teoremei 4.16, în condiţiile lemei, ecuaţia matriceală Sylvester continuă 

T 11 X 12 −X 12 T 22 +T 12 = 0 (4.229) 

admite o soluţie X 12 unic determinată. Utilizând această soluţie în definirea matricei 

X aserţiunea lemei este probată evident. 

✸ 

Lema 4.5 se generalizează imediat în următorul rezultat. 

Teorema 4.17 Dacă matricea T ∈ IC n×n are o structură q × q superior bloc-triunghiulară 

⎡ ⎤ 

T 11 T 12 ··· T 1q 

0 T 22 ··· T 2q 

q∑ 

T = ⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ , T ii ∈ IC ni×ni , n i = n, (4.230) 

i=1 

0 0 ··· T qq 

şi satisface condiţiile 

λ(T ii )∩λ(T jj ) = ∅, ∀i ≠ j, (4.231) 

atunci există o matrice nesingulară X ∈ IC n×n având structura 

⎡ ⎤ 

I n1 X 12 ··· X 1q 

0 I n2 ··· X 2q 

X = ⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ , (4.232) 

0 0 ··· I nq



⎡ 

D = X −1 TX = ⎢ 

⎣ 

⎤ 

T 11 0 ··· 0 

0 T 22 ··· 0 

. 

. . .. 

⎥ 

. ⎦ . (4.233) 

0 0 ··· T qq 

Demonstraţie. Dovadase obţine imediat prinaplicarearepetată alemei 4.5pentru 

a proba existenţa şi pentru a calcula submatricele X ij care definesc matricea de 

transformare X. Procedura are q −1 paşi. 

Pasul 1 ◦ . Fie partiţia 

T = 

⎡ 

[ ] 

T11 ˜T12 

, unde ˜T12 = [ ] ⎢ 

T 12 ··· T 1q , ˜T22 = ⎣ 

0 ˜T22 

⎤ 

T 22 ··· T 2q 

. 

. .. . 0 ··· T qq 

Din (4.231) rezultă λ(T 11 )∩λ(˜T 22 ) = ∅. Prin urmare, conform lemei 4.5, transformarea 

definită de T ← T (1) = X1 −1 TX 1 cu 

[ ] 

In1 ˜X12 

X 1 = , 

0 I n−n1 

unde ˜X 12 este soluţia ecuaţiei Sylvester 

T 11 ˜X12 − ˜X 12˜T22 + ˜T 12 = 0 

asigură anularea blocurilor extradiagonale de pe prima bloc-linie a matricei T. 

Pasul k ◦ . Presupunem că la primii k − 1 paşi am realizat bloc-diagonalizarea 

din primele bloc linii, i.e. 

T ← T (k−1) = X −1 

k−1···X−1 2 X−1 1 TX 1X 2···X k−1 = 

⎡ 

⎣ 

⎤ 

˜T 11 0 0 

0 T kk 

˜Tk,k+1 ⎦, 

0 0 ˜Tk+1,k+1 

⎥ 

⎦. 

unde 

˜T 11 = 

⎡ 

⎢ 

⎣ 

⎤ 

T 11 ··· 0 

. 

. .. . 

⎥ 

⎦, ˜Tk,k+1 = [ ] 

T k,k+1 ··· T kq , 

0 ··· T k−1,k−1 

˜T k+1,k+1 = 

⎡ 

⎢ 

⎣ 

T k+1,k+1 

⎤ 

··· T k+1,q 

. 

. .. . 

⎥ 

⎦. 

0 ··· T qq 

Din aceleaşi motive ca la pasul 1 ◦ , dacă ˜X k,k+1 este soluţia ecuaţiei Sylvester 

T kk ˜Xk,k+1 − ˜X k,k+1 ˜Tk+1,k+1 + ˜T k,k+1 = 0, (4.234)


atunci matricea 

unde 

⎡ 

X k = ⎣ 

T ← T (k) = X −1 

k T(k−1) X k , (4.235) 

⎤ 

Iñ1 0 0 

0 I nk 

˜Xk,k+1 ⎦, ñ 1 = 

0 0 I n−ñ1−n k 

k−1 

∑ 

n i , (4.236) 

asigură anularea blocurilor extradiagonale de pe bloc-linia k. Prin urmare, procedura 

iniţiată la pasul 1 ◦ poate fi continuată astfel încât, după q −1 paşi, matricea 

T ← T (q−1) = X −1 

q−1···X−1 2 X−1 1 TX 1X 2···X q−1 = X −1 TX (4.237) 

este bloc-diagonală, unde 

i=1 

X = X 1 X 2···X q−1 (4.238) 

este o matrice unitar bloc superior triunghiulară (ca produs de matrice unitar bloc 

superior triunghiulare). Demonstraţia este completă. 

✸ 

Conform demonstraţiei de mai sus, schema de calcul pentru bloc-diagonalizarea 

unei matrice bloc superior triunghiulare 42 , care satisface condiţiile (4.231), este 

următoarea: 

1. X = I n 

2. Pentru k = 1 : q −1 

1. Se calculează soluţia ˜X k,k+1 a ecuaţiei Sylvester (4.234). 

2. Se anulează blocurile extradiagonale de pe bloc-linia k pe baza 

relaţiei (4.235). 

3. X = XX k unde X k este definită de (4.236). 

Această schemă de calcul se poate detalia prin rezolvarea ecuaţiei Sylvester (4.234) 

pe blocuri. Într-adevăr, fie partiţia 

˜X k,k+1 = [ X k,k+1 ··· X kq 

] 

, 

conformă cu partiţia lui ˜T k,k+1 . Atunci ecuaţia (4.234) se reduce la setul de ecuaţii 

Sylvester 

T kk X kj −X kj T jj = 

∑j−1 

l=k+1 

X kl T lj −T kj , j = k +1 : q, (4.239) 

(unde, pentru j = k + 1 suma se consideră nulă) care pot fi rezolvate în ordinea 

impusă j = k +1,k +2,...,q. Acumularea transformărilor, se poate face şi ea pe 

măsură ce se calculează blocurile. Întrucât bloc-diagonalizarea urmează, de obicei, 

reducerii la forma bloc-triunghiulară şi unei eventuale ordonări a blocurilor diagonale 

(e.g. calculul formei Schur ordonate), pentru a nu reduce generalitatea vom 

considera că matricea iniţială de transformare este Q, posibil diferită de matricea 

unitate. Astfel, acumularea transformărilor constă în calculul Q ← QX. 

Rezultă următoarea schemă de calcul. 

42 Pentru diagonalizarea matricelor bloc inferior triunghiulare se aplică această procedură matricei 

transpuse, după care se transpune rezultatul.


BD 1. Pentru k = 1 : q −1 

1. Pentru j = k +1 : q 

1. Se rezolvă ecuaţia Sylvester T kk X kj −X kj T jj = −T kj 

2. T kj = 0 

3. Dacă k < q −1 atunci 

1. Pentru l = j +1 : q 

1. T kl = T kl −X kj T jl 

2. Pentru i = 1 : q 

1. Q ij = Q ij +Q ik X kj 

Algoritmul de implementare al schemei de calcul BD arată astfel. 

Algoritmul 4.23 (BDc – Diagonalizarea bloc a unei matrice bloc 

superior triunghiulare) (Date matricea bloc superior triunghiulară T ∈ 

∈ IC n×n , având blocurile diagonale T ii ∈ IC ni×ni , i = 1 : q, astfel încât 

λ(T ii )∩λ(T jj ) = ∅, ∀i ≠ j, matricea de transformare iniţială Q ∈ IC n×n 

şi vectorul nd = [n 1 n 2 ... n q ] al ordinelor blocurilor diagonale, algoritmul 

calculează matricea unitar bloc triunghiulară X ∈ IC m×n astfel 

încât T ← X −1 TX este bloc-diagonală T = diag(T 11 ,T 22 ,...,T qq ) şi 

acumulează transformărileactualizând matricea Q: Q ← QX. Matricea 

X nu se formează explicit.) 

1. r 1 = 1 

2. s 1 = n 1 

3. Pentru k = 1 : q −1 

1. r k+1 = r k +n k 

2. s k+1 = s k +n k+1 

4. Pentru k = 1 : q −1 

1. Pentru j = k +1 : q 

1. Y = SYLV(T(r k :s k ,r k :s k ),T(r j :s j ,r j :s j ), 

−T(r k :s k ,r j :s j )) 

2. T(r k :s k ,r j :s j ) = 0 

3. Dacă k < q −1 atunci 

1. Pentru l = j +1 : q 

1. T(r k :s k ,r l :s l ) = T(r k :s k ,r l :s l )−YT(r j :s j ,r l :s l ) 

4. Q(:,r j :s j ) = Q(:,r j :s j )+Q(:,r k :s k )Y 

Comentarii. Sintaxa de apel pentru algoritmul 4.23 este 

[T,Q] = BD(T,Q,nd). 

Pentru simplificarea scrierii algoritmului s-au introdus vectorii de indici iniţiali (r) 

şi finali (s) ai blocurilor, i.e. astfel încât T ij = T(r i : s i ,r j : s j ). Întrucât matricea 

X nu se formează explicit (în afara cazului când Q iniţial este I n ) pentru soluţiile 

X kj ale ecuaţiilor Sylvester s-a utilizat aceeaşi variabilă matriceală Y.


Versiunea pentru date iniţiale reale – s-o numim BDr – este absolut similară, 

singura diferenţă constând în utilizarea algoritmului SYLVr pentru rezolvarea 

ecuaţiilor Sylvester implicate. 

Complexitatea algoritmului este O(n 3 ) numărul concret de operaţii fiind dependent 

de structura blocurilor diagonale. Dacă blocurile diagonale sunt toate 1×1, 

atunci în cazul real N op = 2 3 n3 flopi, iar în cazul complex numărul echivalent de 

flopi reali este de patru ori mai mare. 

✸ 

Observaţia 4.8 În majoritateaaplicaţiilorcalitateaformeiboc-diagonalecalculate 

de algoritmul BD este apreciată prin condiţionarea κ(X) = ‖X‖·‖X −1 ‖ a matricei 

de transformare X. Dată o matrice T în formă Schur (reală), se poate formula 

problema unei ordonări prealabile a acesteia şi apoi a fixării blocurilor diagonale 

astfel încât să se obţină o condiţionare cât mai bună a matricei de transformare 

X. Considerăm, spre exemplificare, cazul a numai două blocuri diagonale. Din 

structura (4.225) şi (4.227) a matricelor X şi X −1 avem 

κ F (X) = ‖X‖ F ·‖X −1 ‖ F = n+‖X 12 ‖ 2 F. 

Prin urmare, condiţionarea matricei X este cu atât mai bună cu cât norma soluţiei 

X 12 a ecuaţiei Sylvester (4.229) este mai mică, i.e. conform observaţiei 4.7, separareaspectrelorblocurilorT 

11 şiT 22 estemaimare. Revenindlaproblemaformulată 

mai sus, ordonarea formei Schur şi fixarea blocurilor diagonale trebuie făcută astfel 

încât spectrele blocurilor diagonale să fie cât mai bine separate. ✸ 

4.7.3 Aspecte numerice privitoare la calculul 

formei canonice Jordan 

În cazul general, cea mai simplă structură care poate fi obţinută, prin transformări 

de asemănare corespunzătoare, este aşa numita formă canonică Jordan definită în 

teorema următoare. 

Teorema 4.18 Oricare ar fi matricea A ∈ IC n×n există o matrice nesingulară T ∈ 

∈ IC n×n astfel încât 

J = T −1 AT = diag(J 1 , J 2 , ..., J q ), (4.240) 

unde blocurile diagonale J k se numesc celule Jordan şi sunt fie scalari J k = λ k , fie 

au structura ⎡ 

⎤ 

λ k 1 ··· 0 0 

. 0 λ .. k 0 0 

J k = 

. 

⎢ . . .. . .. . 

∈ IC n k×n k 

. (4.241) 

⎥ 

⎣ 0 0 ··· λ k 1 ⎦ 

0 0 ··· 0 λ k 

Unei valori proprii multiple îi pot corespunde una sau mai multe celule Jordan. 

Numărul şi dimensiunile celulelor Jordan asociate fiecărei valori proprii sunt unic 

determinate, dar ordonarea blocurilor în (4.240) poate fi arbitrară.


Demonstraţie. Demonstraţii complete pot fi găsite în lucrările clasice de algebră 

liniară sau analiză matriceală, cum sunt, de exemplu, [I], [II]. ✸ 

DeşiformacanonicăJordanjoacăunrolesenţialînanalizamatriceală,conţinând 

maximum de informaţie structurală privitor la o matrice dată, totuşi rolul ei în calculul 

numeric este mult diminuat de sensibilitatea structurii Jordan la perturbaţii 

numerice în elementele matricei iniţiale, perturbaţii inerente datorită erorilor de 

reprezentare a informaţiei numerice într-un format virgulă mobilă. De asemenea, 

încercările de a calcula forma canonică Jordan a unei matrice presupuse ca având 

o reprezentare exactă, într-un mediu de calcul aproximativ, prezintă dificultăţi majore 

datorită influenţelor structurale, posibil decisive, ale erorilor de rotunjire. Din 

păcate (sau din fericire) nu s-a putut degaja un concept de formă canonică Jordan 

”aproximativă” sau, mai bine zis, acest rol poate fi jucat de o structură diagonală, 

întrucât oricât de aproape (în sensul unei norme matriceale consistente) de o matricecu 

o structurăJordanoricâtde complexăsegăsescmatricecu structuraJordan 

cea mai simplă, i.e. diagonală. 

Trebuie subliniat însă că, practic în toate aplicaţiile, forma canonică Jordan 

poate fi suplinită cu succes de către forma Schur, al cărei calcul se poate efectua cu 

o înaltă acurateţe. 

Privind acum determinarea formei canonice Jordan ca o provocare la adresa 

calculului numeric, ne propunem să scoatem în evidenţă, la un nivel mai puţin 

formal, natura dificultăţilor ce apar într-o astfel de întreprindere. 

Înprimulrândesteevidentfaptulcăoabordareproceduralănaturalăaconstrucţiei 

formei canonice Jordan a unei matrice A ∈ IC n×n presupune ca o primă etapă, 

decisivă, calculul formei formei Schur ordonate şi, pe această bază, a formei blocdiagonale 

(prezentate în secţiunile precedente) în care fiecare bloc diagonal corespunde 

unei valori proprii distincte a matricei iniţiale şi, prin urmare, are ordinul 

dat de multiplicitatea algebrică a valorii proprii respective. De asemenea, amintim 

că, în cazul complex, blocurile diagonale sunt matrice superior triunghiulare. 

În consecinţă, problema se reduce, de fapt, la calculul formei canonice Jordan a 

unui bloc diagonal al formei bloc diagonale, i.e. a unei matrice (utilizăm din nou 

notaţiile generice) A ∈ IC n×n de forma 

A = λI n +N, (4.242) 

unde N ∈ IC n×n este o matrice strict superior triunghiulară. Mai mult, întrucât 

T −1 AT = λI n + T −1 NT, este suficient să construim forma canonică Jordan a 

matricei strict superior triunghiulare N. 

Fie 

J = T −1 NT = diag(J 1 , J 2 , ..., J q ), (4.243) 

forma canonică Jordan a matricei N, unde celulele Jordan J k sunt definite, în acest 

caz, de ⎡ ⎤ 

0 1 ··· 0 0 

. 0 0 .. 0 0 

J k = 

. . . 

⎢ . . .. . .. 

. . 

∈ IC n k×n k 

. (4.244) 

⎥ 

⎣ 0 0 ··· 0 1 ⎦ 

0 0 ··· 0 0


O primă dificultate majoră este determinarea ordinelor n k , k = 1 : q, ale celulelor. 

O modalitate de a face acest lucru pleacă de la următoarele observaţii: a) J l k = 0 

pentru toţi l ≥ n k şi b) dimKerJ l k = l, pentru l < n k. Cum 

J l = T −1 N l T = diag(J l 1, J l 2, ..., J l q), (4.245) 

şi 

q∑ 

dimKerJ l = dimKerN l = dimKerJi, l (4.246) 

i=1 

rezultă că, dacă putem calcula m l 

def 

= dimKerN l pentru l ∈ 1 : n 43 , atunci dimensiunile 

n i ale celulelor Jordan pot fi determinate din (4.246) pe baza următoarelor 

constatări: 

a) numărul celulelor Jordan de ordin l sau mai mare este δ l = m l − m l−1 (se 

consideră m 0 = 0), întrucât o dată ce l a atins valoarea n i , J l i a devenit nulă, 

i.e. dimKerJ l i a atins valoarea maximă n i şi nu mai contribuie la variaţia sumei la 

trecerea la valoarea următoare a lui l; 

b) numărul celulelor Jordan de ordin l este dat de ν l = δ l −δ l+1 (se consideră 

δ lmax+1 = 0). 

Exemplul 4.5 Fie n = 8 ordinul matricei strict superior triunghiulare N. O 

situaţie structurală posibilă ce poate fi dedusă din determinarea dimKerN l , pentru 

toate valorile de interes ale lui l, este rezumată întabelul 4.6. Deci structura Jordan 

a matricei N are o celulă scalară, două celule de ordinul 2 şi o celulă de ordinul 3. 

✸ 

l 1 2 3 

m l = dimKerN l 4 7 8 

δ l = m l −m l−1 4 3 1 

ν l = δ l −δ l+1 1 2 1 

Tabelul 4.6: Determinarea dimensiunii celulelor Jordan pentru o matrice strict 

superior triunghiulară de ordinul 8 

Pentru aplicarea celor arătate mai sus este necesar un mijloc fiabil de determinare 

a dimensiunilor subspaţiilor implicate sau, echivalent, de calcul al rangului 

unor matrice. Aici este de fapt punctul critic al procedurii, întrucât deciziile de 

rang exact într-un mediu de calcul aproximativ sunt dificile, dacă nu imposibile, 

iar conceptul de rang numeric (i.e. într-un sens, de rang aproximativ, v. cap. 5), 

singurul instrument de care putem dispune în condiţiile precizate, trebuie utilizat 

cu multă grijă într-o abordare structurală în care structura este foarte sensibilă la 

variaţiile elementelor. 

43 Evident, este suficient să ne rezumăm la l ≤ s, unde s este cel mai mic întreg pentru care 

N s = 0.


Pentru a încheia constructiv acest paragraf, vom considera ca fiind exact rangul 

oferit de instrumentele numerice existente şi, pentru a apela la proceduri deja 

familiare cititorului, vom folosi în acest scop triangularizarea unitară (ortogonală) 

completă 44 (v. cap. 3). Reamintim că, dată o matrice A ∈ IC m×n , procedura de 

triangularizare unitară completă presupune o triangularizare unitară cu pivotarea 

coloanelor care calculează matricea unitară Q ∈ IC m×m şi matricea (ortogonală) de 

permutare P ∈ IR n×n astfel încât 

Q H AP = R = 

[ 

R11 R 12 

0 0 

] 

, R 11 ∈ IC r×r , (4.247) 

unde R 11 este superior triunghiulară nesingulară (i.e. r este rangul matricei A), 

urmatădeanulareabloculuiR 12 printr-otransformareunitară(ortogonală)aplicată 

pe dreapta, obţinându-se 

Q H APV = Q H AZ = RV = 

[ 

R11 0 

0 0 

] 

, Z = PV. (4.248) 

În cele ce urmează, vom utiliza variante ale descompunerii (4.248) obţinute prin 

permutări suplimentare ale blocurilor. În acest scop vom introduce sintaxa de apel 

[R,Q,Z,r] = QRCij(A), 

unde ij marchează poziţia blocului triunghiular nesingular R 11 , indexat în continuare 

în funcţie de necesităţile contextului. Subliniem încă o dată că, deşi rangul 

calculat r este esenţial dependent de nivelul erorilor de calcul şi al toleranţelor 

practicate în procesul de triangularizare, în cele ce urmează acesta va fi considerat 

exact. 

Trecem la construcţia formei canonice Jordan a matricei strict superior triunghiulare 

(deci nilpotente) N ∈ IC n×n , şi vom presupune N ≠ 0 45 . Esenţa 

procedurii de construcţie a formei Jordan constă în următoarele etape. 

Etapa 1 ◦ rezidă în reducerea matricei N la o structură bloc supradiagonală. 

Pentru a obţine această structură aplicăm matricei N procedura de triangularizare 

unitară (ortogonală) completă [N 1 ,Q 1 ,Z 1 ,r 1 ] = QRC12(N). Rezultă 

cu R 1 ∈ IC r1×r1 nesingulară şi 

Q H 1 NZ 1 = R = 

m 1=δ 1 

r 1 

{}}{ {}}{ 

[ ] 

0 R1 }r1 

, (4.249) 

0 0 }δ 1 

m 1 = dimKerN = n−r 1 = δ 1 . (4.250) 

44 Un mijloc mai bun de evaluare a rangului este descompunerea valorilor singulare, tratată în 

capitolul 5. 

45 Dacă N = 0, atunci ea se află deja în formă canonică Jordan cu n celule de ordinul 1.


În continuare fie matricea N 1 , unitar asemenea cu N, definită de 

δ 1 

r 1 

{}}{ {}}{ 

[ ] 

N 1 = Z1 H NZ 1 = Z1 H 0 Q K1 }δ1 

1R = , (4.251) 

0 L 1 }r 1 

unde, evident, λ(L 1 ) ⊂ λ(N), i.e. blocul L 1 are toate valorile proprii nule, respectiv 

este nilpotent. Putem determinaacum m 2 = dimKerN 2 = dimKerN 2 1. Într-adevăr, 

m 2 = dimKerN 2 1 = dimKer [ 0 K1 L 1 

0 L 2 1 

[ 

K1 L 

= m 1 +dimKer 1 

L 2 1 

[ ] [ 

K1 L 1 K1 

] 

= 

] 

= m 1 +dimKerL 1 , (4.252) 

L 1 

] 

L 1 , iar matricea 

[ 

K1 

] 

întrucât 

L 2 = 

este monică. Dacă L 

1 

L 1 = 0 

1 

se trece la etapa a doua. Dacă L 1 ≠ 0 continuăm procesul iniţiat mai sus, prin 

aplicarea unor transformări similare matricei nilpotente L 1 , obţinând 

δ 2 

r 2 

{}}{ {}}{ 

[ ] 

0 ˆN 2 = ẐH 2 L K2 }δ2 

1Ẑ2 = , (4.253) 

0 L 2 }r 2 

[ ] 

K2 

cu matricea L 2 nilpotentă, matricea monică, m 

L 2 = m 1 +δ 2 şi δ 2 = r 1 −r 2 . 

2 

Considerând matricea de transformare unitară 

[ ] 

Im1 0 

Z 2 = , (4.254) 

0 Ẑ 2 

obţinem 

δ 2 r 2 

{}}{ {}}{ {}}{ 

⎡ ⎤ ⎡ 

0 K 1 Ẑ 2 

Ñ 2 = Z2 H N 1 Z 2 = Z2 H Z1 H NZ 1 Z 2 = ⎣ 0 K ⎦ 

0 2 

= ⎣ 0 K ⎤ 

12 K 13 

0 0 K 23 

⎦ }δ 1 

}δ 2 , 

0 L 2 

0 0 L 2 }r 2 

[ ] 

(4.255) 

K23 

în care matricele K 12 şi sunt monice. În această fază putem anula blocul 

L 2 

K 13 printr-o transformare de asemănare (neunitară) definită de o matrice de transformare 

de tipul 

[ ] 

Iδ1 S 

T 2 = , (4.256) 

0 I r1 

δ 1


unde S ∈ IC δ1×r1 este o soluţie a ecuaţiei matriceale 46 

[ ] 

K23 

S = K 

L 13 . (4.257) 

2 

Cu această transformare rezultă 

N 2 = T2 

−1 Ñ 2 T 2 = T2 −1 Z2 H Z1 H NZ 1 Z 2 T 2 = 

δ 1 

δ 2 r 2 

{}}{ {}}{ {}}{ 

⎡ 

⎣ 0 K ⎤ 

12 0 

0 0 K 23 

0 0 L 2 

⎦ }δ 1 

}δ 2 

}r 2 

, (4.258) 

Acest proces se desfăşoară într-un număr s de paşi, unde s este primul întreg 

pentrucareL s =0, obţinându-se, înfinalulacesteietape, omatriceavândostructură 

bloc supradiagonală 

K = N s = T −1 

s Z H s ...T−1 2 Z H 2 ZH 1 NZ 1Z 2 T 2 ...Z s T s = 

= 

δ 1 δ 2 δ 3 δ s 

{}}{ {}}{ {}}{ ··· {}}{ 

⎡ 

⎤ 

0 K 12 0 ··· 0 

0 0 K 23 ··· 0 

. . . .. . .. . 

⎢ 

⎣ 

. ⎥ 

0 0 0 .. Ks−1,s ⎦ 

0 0 0 ··· 0 

}δ 1 

}δ 2 

. , (4.259) 

}δ s 

}δ s−1 

cu toate blocurile K i−1,i , i = 2 : s, monice. Din dimensiunile δ l ×δ l ale blocurilor 

diagonale se pot deduce, după cum s-a arătat mai sus, numărul ν l = δ l − δ l+1 , 

l = 1 : s, al celulelor Jordan de ordinul l. 

Etapa 2 ◦ arecaobiect introducereazerourilor înblocurilesupradiagonaleK i−1,i . 

Pentru claritate, descriem modalitatea în care acest obiectiv poate fi atins în cazul 

particular s = 3. Considerăm descompunerea unitară completă a blocului K 23 

[ ˜K 23 ,Q 23 ,Z 23 ,δ 3 ] = QRC21(K 23 ), cu care obţinem 

[ ] 

˜K 23 = Q H 0 }δ2 −δ 

23K 23 Z 23 = 

3 = ν 2 

, (4.260) 

R 23 }δ 3 = ν 3 

cu R 23 ∈ IC ν3×ν3 nesingulară. Acum, cu transformarea de asemănare definită de 

matricea 

⎡ ⎤ 

I δ1 0 0 

T 23 = ⎣ 0 Q 23 0 ⎦, (4.261) 

0 0 Z 23 R23 

−1 

[ ] 

46 K23 

Ecuaţia (4.257) are întotdeauna (cel puţin) o soluţie S întrucât matricea sistemului 

L 2 

este monică. [ O soluţie ] poate [ fi] 

calculată cu mijloacele descrise în capitolele [ 2 şi] 

3. De exemplu, 

dacă Q H K23 R K23 

= este triangularizarea unitară a matricei , atunci S = 

L 2 0 

L 2 

= [ R −1 K 13 Y ] Q H , cu Y ∈ IC δ 1×δ 2 arbitrară, este o astfel de soluţie. Pentru Y = 0 se obţine 

soluţia normală, i.e. de normă Frobenius minimă.


rezultă 

˜M = T23 −1 KT 23 = ⎢ 

⎣ 

⎡ 

⎤ 

0 K 12 Q 23 [ 0 ] 

0ν2 

0 0 

I δ3 

0 0 0 

⎥ 

⎦ . (4.262) 

Continuând în acelaşi mod, considerăm descompunerea unitară completă a blocului 

K 12 actualizat [ ˜K 12 ,Q 12 ,Z 12 ,δ 2 ] = QRC21(K 12 Q 23 ) şi transformarea de asemănare 

definită de matricea 

⎡ ⎤ 

Q 12 0 0 

T 12 = ⎣ 0 Z 12 R12 −1 0 ⎦. (4.263) 

0 0 I δ3 

Rezultă 

⎡ [ ] ⎤ 

0ν1 

0 0 

M = T12 −1 ˜MT I δ2 [ ] 

12 = 

⎢ 0ν2 

⎣ 0 0 ⎥ 

I δ3 

⎦ . (4.264) 

0 0 0 

În cazul general, procesul descris mai sus, poate fi sintetizat în următoarea 

schemă de calcul. 

Pentru i = s : −1 : 2 

1. [ ˜K i−1,i ,Q[ i−1,i ,Z i−1,i ] ,δ i ] = QRC21(K i−1,i ) 

0νi−1 

2. K i−1,i ← 

I δi 

3. Dacă i > 2 atunci 

1. K i−2,i−1 ← K i−2,i−1 Q i−1,i . 

Observaţia 4.9 Punerea în evidenţă a matricelor unitate din structura creată cu 

schema de calcul are în vedere obţinerea formei canonice Jordan uzuale. Ţinând 

seama însă de faptul că esenţa structurală a formei Jordan rezidă în dimensiunile 

celulelorJordan, sepoateoferiun plusde informaţie dacă înloculmatricelorunitate 

se lasă matricele diagonale construite cu elementele diagonale ale matricelor R i−1,i 

(sau cu valorile singulare (v. cap. 5) ale matricelor K i−1,i curente). În acest fel 

se poate pune în evidenţă o eventuală fragilitate numerică a unor celule datorată 

valorilor ”prea mici” ale unora dintre elementele diagonale amintite. ✸ 

Etapa 3 ◦ constă în transformări de asemănare tip permutare pentru a pune 

în lumină celulele Jordan de dimensiuni corespunzătoare şi pentru eventuala lor 

ordonare. Lăsăm în seama cititorului această sarcină. 

În concluzie, parcurgând cele trei etape, se obţine forma canonică Jordan J 0 a 

matricei strict superior triunghiulare N. Forma canonică Jordan a matricei iniţiale 

A din (4.242) este J = λI n +J 0 . 

Matricea nesingulară care defineşte transformarea de asemănare ce evidenţiază 

forma canonică Jordan se obţine cumulând toate transformările efectuate pe parcursul 

procedurii. 

Rezumând cele prezentate mai sus, avem următoarea schiţă a unei posibile proceduri 

de calcul a formei canonice Jordan.


J 

1. Se calculează forma Schur (complexă) utilizând algoritmul QR. 

2. Se ordonează forma Schur astfel încât valorile proprii apreciate 

ca fiind egale să fie grupate. 

3. Se calculează forma bloc-diagonală astfel încât fiecărui bloc să-i 

corespundă o valoare proprie distinctă. 

4. Se calculează forma canonică Jordan a fiecărui bloc diagonal 

conform indicaţiilor din prezenta secţiune. 

Subliniem în final complexitatea sarcinii de a calcula forma canonică Jordan, 

dependenţacritică astructurii obţinute de delicatedecizii de rangce trebuie luate la 

pasul 4, precum şi posibile condiţionări nesatisfăcătoare sau instabilităţi numerice 

în rezolvarea ecuaţiilor matriceale Sylvester din pasul 3, mai ales în situaţia în 

care separarea valorilor proprii considerate distincte este insuficientă. De aceea, 

în aplicaţiile de calcul numeric, se evită utilizarea formei canonice Jordan. Aşa 

cum s-a precizat, din fericire, forma Schur, mult mai robustă, este suficientă pentru 

rezolvarea practic a tuturor problemelor de interes aplicativ. 

4.8 Algoritmul QR simetric 

Matricele reale simetrice A = A T ∈ IR n×n apar în numeroase aplicaţii specifice. În 

particular, problema generală a celor mai mici pătrate presupune rezolvarea (mai 

mult sau mai puţin explicită a) sistemului normal de ecuaţii a cărui matrice este 

simetrică. Maimult,cazulsimetricesteimportantpentrucalcululvalorilorsingulare 

ale unei matrice, problemă ce apare în toate aplicaţiile ce fac apel la conceptul de 

rang matriceal. 

Din punct de vedere procedural, exploatarea simetriei în determinarea valorilor 

şi vectorilor proprii conduce la dezvoltări elegante şi la importante simplificări ale 

calculelor. Algoritmul QR simetric rămâne un instrument fundamental pentru 

calculul întregului spectru al unei matrice simetrice. Totuşi, spre deosebire de cazul 

general, în care algoritmul QR nu are rival, în cazul simetric, în situaţii specifice, 

există soluţii alternative viabile, cele mai importante fiind prezentate în §4.9. 

Sursa importantelor facilităţi de calcul care apar în cazul simetric se află în 

rezultatulfundamental datde teorema4.2 47 , conformcăreiaoricematricesimetrică 

A ∈ IR n×n este ortogonal diagonalizabilă, i.e. există o matrice ortogonală Q ∈ 

IR n×n astfel încât 

Q T AQ = Λ = diag(λ 1 ,λ 2 ,...,λ n ), (4.265) 

adică toate matricele simetrice reale sunt simple, au un spectru real λ(A) ∈ IR, iar 

direcţiile proprii, definite de coloanele matricei Q din (4.265), sunt ortogonale două 

câte două. 

În continuare vom trece în revistă principalele aspecte ale algoritmului QR simetric. 

Atât pentru acest algoritm, cât şi pentru metodele alternative menţionate, 

47 Rezultatele stabilite în continuare pentru matricele reale simetrice rămân valabile, cu mici 

adaptări, pentru matricele complexe A ∈ IC n×n hermitice. Formularea exactă a unor rezultate 

şi prezentarea aspectelor algoritmice specifice fac obiectul paragrafului §4.8.5 precum şi al unor 

exerciţii.

4.8. ALGORITMUL QR SIMETRIC 315 

seobţine un sporesenţialde eficienţăprin parcurgereaprealabilăafazeidirecte aalgoritmului 

QR, i.e. reducerea matricei date la forma superior Hessenberg. Datorită 

conservării simetriei la transformările ortogonale de asemănare, structura superior 

Hessenberg obţinută este, simultan, inferior Hessenberg, i.e. devine o structură 

tridiagonală. 

4.8.1 Reducerea la forma tridiagonală 

Baza teoretică a posibilităţii de reducere la forma tridiagonală a unei matrice simetrice 

este dată de teorema 4.14, care, în noul context, are următorul enunţ. 

Teorema 4.19 Oricare ar fi matricea simetrică A ∈ IR n×n , există o matrice ortogonală 

Q ∈ IR n×n astfel încât matricea 

T = Q T AQ (4.266) 

este tridiagonală, i.e. t ij = 0, pentru toţi i, j, cu |i−j| > 1. 

Demonstraţie. Demonstraţiasereduce laobservaţiade mai suscă, înconformitate 

cu teorema 4.14, există o matrice ortogonală Q astfel încât matricea T not 

= H = 

= Q T AQ este superior Hessenberg şi la faptul că această matrice este simetrică 

T T = Q T A T Q = Q T AQ = T. Prin urmare T este, simultan, inferior Hessenberg, 

i.e. este o matrice tridiagonală. 

✸ 

Pentruaelaboraunalgoritmperformant, caresăexploatezeeventualelefacilităţi 

calculatorii induse de conservarea simetriei, reamintim schema de calcul care stă la 

baza reducerii la forma Hessenberg, aceeaşi cu schema de calcul pentru reducerea 

la forma tridiagonală. 

TQ 1. Pentru k = 1 : n−2 

1. Se calculează un reflector elementar U k+1 astfel încât 

(U k+1 A)(k +2 : n,k) = 0. 

2. A ← (U k+1 A)U k+1 % Se anulează A(k +2 : n,k) şi, simultan, 

datorită conservării simetriei, se anulează 

A(k,k +2 : n). 

În urma efectuării calculelor de mai sus matricea A este suprascrisă cu matricea 

unde, evident, 

A ← T = Q T AQ = U n−1···U 3 U 2 AU 2 U 3···U n−1 , (4.267) 

Q = U 2 U 3 ...U n−1 . (4.268) 

Considerăm acum pasul curent k al procesului de tridiagonalizare descris mai sus 

şi fie 

A ← T (k) = U k···U 3 U 2 AU 2 U 3···U k = ⎢ 

⎣ 

⎡ 

k−1 

{}}{ 

1 

{}}{ 

n−k 

{}}{ 

T (k) 

11 T (k) 

12 0 

T (k) 

21 T (k) 

22 T (k) 

23 

0 T (k) 

32 T (k) 

33 

⎤ 

}k −1 

⎥ 

⎦ }1 

}n−k 

(4.269)


matricea obţinută după primii k−1 paşi, partiţionată convenabil, în care T (k) 

11 este 

tridiagonală, simetrică, iar 

T (k) 

21 = (T(k) 12 )T = [0 0 ··· 0 t (k) 

k,k−1 ]. 

Având în vedere faptul că reflectorul elementar U k+1 are structura 

[ ] 

Ik 0 

U k+1 = , (4.270) 

0 Ū k+1 

unde 

A ← T (k+1) = U k+1 T (k) U k+1 = 

Ū k+1 = I n−k − ūk+1ū T k+1 

β k+1 

, ū k+1 ∈ IR n−k , (4.271) 

este un reflector elementar de ordin n − k şi indice 1, transformările efectuate la 

pasul k au ca efect 

⎡ 

⎤ 

T (k) 

11 T (k) 

12 0 

Cum 

⎢ 

⎣ 

T (k) 

21 T (k) 

22 T (k) 

23 Ūk+1 

0 Ū k+1 T (k) 

32 

Ū k+1 T (k) 

33 Ūk+1 

T (k) 

23 Ūk+1 = (Ūk+1T (k) 

32 )T = [−σ 0 0 ··· 0], 

⎥ 

⎦ . (4.272) 

cu σ = sgn(T (k) 

32 (1,1))‖T(k) 32 ‖ 48 , rămâne să efectuăm în mod eficient calculul matricei 

simetrice 

A(k +1 : n,k +1 : n) ← T (k+1) (k) 

33 = Ūk+1T 33 Ūk+1. (4.273) 

Considerăm necesar să precizăm aici faptul că performanţele deosebite privind 

memoria utilizată şi eficienţa calculatorie din cazul simetric se datoresc unei judicioase 

exploatări a proprietăţii de simetrie. Astfel, o memorare economică a unei 

matrice simetrice se face reţinând numai elementele din triunghiul său inferior sau 

superior. De asemenea, când se cunoaşte faptul că rezultatul unei procesări este 

o matrice simetrică, se calculează, evident, numai elementele sale din triunghiul 

inferior sau superior. 

În consecinţă, în (4.273) vom calcula, de exemplu, numai elementele din triunghiulinferioralmatriceiT 

(k+1) 

33 . De asemenea,ţinândseamade(4.271)şinotând, 

pentru simplificarea scrierii, 

relaţia (4.273) devine 

ū k+1 

not 

= ū, β not 

= β k+1 , 

T (k+1) 

33 = (I n−k − ūūT 

β )T(k) 33 (I n−k − ūūT 

β ) = 

48 Pentru calculul reflectorilor şi semnificaţia notaţiilor utilizate, vezi capitolul 3.


Notând 

obţinem 

= T (k) 

33 − ūūT 

β T(k) 

33 −T(k) 33 

ūū T 

β + ūūT T (k) 

33 ūūT 

β 2 . (4.274) 

v = T(k) 33 ū ∈ IR n−k (4.275) 

β 

T (k+1) 

33 = T (k) 

33 −ūvT −vū T +ūūT vū T 

β 

Introducând acum notaţia 

(4.276) devine 

= T (k) 

33 −ū(vT −ūT v 

2β ūT )−(v−ūT v 

2β ū)ūT . (4.276) 

w = v − ūT v ū, (4.277) 

2β 

T (k+1) 

33 = T (k) 

33 −ūwT −wū T , (4.278) 

relaţie care, împreunăcu (4.275)şi (4.277), va fi folosităpentru calculul triunghiului 

inferior al matricei A(k +1 : n,k +1 : n) ←− T (k+1) (k) 

33 = Ūk+1T 33 Ūk+1. 

Forma tridiagonală simetrică obţinută constituie punctul de plecare pentru diverse 

tehnici iterative de calcul a valorilor proprii. De aceea, în cele ce urmează, 

vom considera că matricea tridiagonală A ← T = T T ∈ IR n×n este memorată numai 

prin elementele sale semnificative, date de componentele vectorilor f ∈ IR n şi 

g ∈ IR n−1 conform scrierii 

⎡ 

A ← T = 

⎢ 

⎣ 

⎤ 

f 1 g 1 0 ··· 0 0 

g 1 f 2 g 2 ··· 0 0 

. 

0 g 2 f .. 3 0 0 

. 

. . .. . .. . .. . 

. ⎥ 

0 0 0 .. fn−1 g n−1 

⎦ 

0 0 0 0 g n−1 f n 

Aplicarea ideilor menţionate mai sus conduce la următorul algoritm. 

. (4.279) 

Algoritmul 4.24 (TQ– Reducerea la forma tridiagonală) 

(Date matricea simetrică A ∈ IR n×n şi matricea de transformare iniţială 

Q ∈ IR n×n , algoritmul calculează secvenţa de reflectori U 2 ,U 3 ,···,U n−1 

astfelîncâtmatriceaA ← T = U n−1···U 3 U 2 AU 2 U 3···U n−1 areostructură 

tridiagonală. Se consideră că A este dată numai prin triunghiul său 

inferior în care sunt efectuate calculele curente. Algoritmul extrage vectorii 

f ∈ IR n şi g ∈ IR n−1 , conform (4.279), care definesc matricea 

tridiagonală rezultată. Opţional se actualizează matricea de transformare 

Q ← QU 2 U 3···U n−1 . Opţiunea se exprimă prin intermediul unei 

variabile logice opt, de tipul şir de caractere, care poate lua valorile 

’da’ sau ’nu’. Dacă nu se doreşte actualizarea, matricea Q rămâne 

nemodificată.)


1. Pentru k = 1 : n−2 

1. % Calculul reflectorului elementar Ūk+1 

1. [A(k +1 : n,k),ū,β] = Hr(A(k +1 : n,k)) 

2. % Calculul A ← (U k+1 A)U k+1 numai în triunghiul inferior 

1. Pentru i = 1 : n−k −1 

1. l = k +i 

A(l,k+1: l)ū(1:i)+A(l+1: n,l)ū(i+1: n−k) 

2. v i = 

2. v n−k = 

A(n, k +1 : n)ū 

β 

3. ρ = ūT v 

2β 

4. w = v −ρū 

5. Pentru j = 1 : n−k 

1. Pentru i = j : n−k 

1. A(k +i,k+j) ← A(k +i,k+j)−ū i w j −w i ū j 

3. % Acumularea transformărilor 


1. Q(:,k +1 : n) = Hrd(Q(:,k +1 : n),ū,β) 

2. % Extragerea vectorilor f şi g 

1. f 1 = A(1,1) 

2. Pentru i = 1 : n−1 

1. g i = A(i+1,i) 

2. f i+1 = A(i+1, i+1). 

Comentarii. Sintaxa de apel a algoritmului TQ va fi 

[f,g,Q] = TQ(A,Q,opt). 

Utilizarea relaţiei de calcul (4.276) reduce efortul de calcul la mai puţin de jumătate 

în raport cu cazul nesimetric. Într-adevăr, calculul vectorilor v şi w la pasul curent 

k necesită N 1 (k) ≈ (n−k) 2 flopi şi, respectiv N 2 (k) ≈ (n−k) flopi. Cum determinarea 

elementelor definitorii ale reflectorilor necesită, de asemenea, N 3 (k) ≈ 

≈ (n−k) flopi, rezultă că numărul asimptotic de flopi necesari pentru calculul 

tridiagonalizării este 

n−2 

∑ 

N op ≈ N 1 (k) ≈ 2 3 n3 , 

k=1 

faţă de 5 3 n3 flopi necesari pentru reducerea la forma superior Hessenberg în cazul 

nesimetric. Acumularea transformărilor, i.e. calculul explicit al matricei de transformare 

Q din (4.274), implică efectuarea a N ′ op ≈ 2 3 n3 flopi suplimentari 49 . Volu- 

49 Dacă matricea Q iniţială este I n, se poate obţine o reducere a numărului de operaţii încalculul 

acumulării transformărilor dacă se memorează (economic) elementele definitorii ale reflectorilor şi 

acumularea se face în afara ciclului principal, în ordine inversă, cu exploatarea structurii de zerouri 

a matricei Q curente. 

β


mul de memorie este M ≈ 3n 2 /2 locaţii, necesar pentru memorarea elementelor 

triunghiului inferior al matricei A şi a elementelor matricei Q 50 . 

Algoritmul TQ este numeric stabil, i.e. matricea tridiagonală calculată într-o 

aritmetică în virgulă mobilă este o matrice exact ortogonal asemenea cu o matrice 

uşor perturbată A + E, unde matricea de perturbaţie E satisface condiţia 

‖E‖ ≤ p(n)ε M ‖A‖, cu p(n) o funcţie cu creştere ”modestă” de dimensiunea n a 

problemei. 

✸ 

Observaţia 4.10 Spre deosebire de cazul nesimetric în care reducerea la forma 

superior Hessenberg se putea face, suficient de performant, şi prin transformări 

de asemănare neortogonale, aici astfel de transformări alterează simetria şi, prin 

urmare, nu sunt recomandate. 

✸ 

4.8.2 Faza iterativă a algoritmului QR simetric 

Etapa iterativă a algoritmului QR simetric beneficiază de importante simplificări 

calculatorii care se datorează, în principal, conservării simetriei matricei iniţiale la 

transformări ortogonale de asemănare şi constau în: 

– conservarea structurii tridiagonale la transformările implicate de iteraţiile 

QR; în consecinţă toate transformările aferente şirului QR se pot desfăsura în 

locaţiile de memorie ale vectorului f al elementelor diagonale şi ale vectorului g al 

elementelor subdiagonale ale matricei tridiagonale curente (v. (4.279)); 

– valorile proprii ale unei matrice simetrice reale fiind reale nu sunt necesare 

deplasări complexe şi, prin urmare, nu este necesară strategia paşilor dubli. 

Vom folosi aceste observaţii în vederea elaborării unui algoritm QR simetric cât 

mai performant. 

A. Algoritmul QR simetric cu deplasare explicită 

Presupunem matricea simetrică tridiagonală T ∈ IR n×n dată prin vectorii f şi g din 

(4.279). Pentru claritateaexpunerii vom utiliza şi indexareaobişnuită a elementelor 

matricei T urmând ca algoritmul să fie scris exclusiv în raport cu elementele vectorilor 

f şi g. 

Algoritmul QR simetric cu deplasare explicită construieşte un şir de matrice 

tridiagonale, ortogonal asemenea 

T = T 1 ,T 2 ,···,T k ,T k+1 ,··· (4.280) 

pe baza relaţiei de recurenţă 

{ 

T −µIn = QR 

T ← T ′ = RQ+µI n 

, (4.281) 

unde T semnifică matricea curentă din şirul (4.280), iar indicele superior ′ marchează 

matricea succesor. Deplasarea µ se poate alege ca în cazul nesimetric 

µ = t nn = f n (4.282) 

50 Asigurăm cititorul că unele licenţe minore, cum este utilizarea explicită a doi vectori (v şi 

w) când sunt suficiente locaţiile de memorie ale unuia singur, servesc exclusiv clarităţii prezentării 

algoritmului.


sau, şi mai eficient, egală cu valoarea proprie, întotdeauna reală, cea mai apropiată 

de t nn , a blocului 2×2 din colţul din dreapta jos al matricei curente T 

[ ] 

fn−1 g 

T(n−1 : n, n−1 : n) = n−1 

. (4.283) 

g n−1 f n 

Deplasarea din cea de a doua variantă, numită deplasare Wilkinson, are expresia 

(verificaţi!) 

µ = 1 √ 

2 (f n−1 +f n −sgn(f n−1 −f n ) (f n−1 −f n ) 2 +4gn−1 2 ) (4.284) 

şi se calculează economic şi fiabil cu relaţiile 

α = f n−1 −f n 

, β = gn−1 2 2 

, µ = f β 

n − 

α+(sgnα) √ α 2 +β . (4.285) 

Se poate arăta [VI] că, pentru oricare din deplasările (4.282) sau (4.284), în partea 

”finală” a procesului iterativ se obţine o convergenţă cubică a şirului QR simetric 

(4.280) către o structură diagonală. Există, totuşi, unele argumente de natură 

euristică în favoarea deplasării Wilkinson. 

Avându-se în vedere structura tridiagonală a tuturor matricelor şirului QR simetric(4.280),pentrufactorizareaQRdin(4.281)serecomandăutilizarearotaţiilor. 

Este uşor de constatat că matricea superior triunghiulară R a acestei factorizări va 

avea numai două supradiagonale nenule. Mai mult, pentru necesităţile de calcul ale 

matricei succesor, conform (4.281), cea de a doua supradiagonală nici nu trebuie 

calculată. În consecinţă, pentru memorarea elementelor utile sunt suficienţi doi 

vectori de dimensiuni n şi n−1 care pot fi vectorul f al elementelor diagonale ale 

matricei T şi un vector suplimentar pe care îl notăm cu h. Cu aceste precizări, un 

pas simplu QR simetric cu deplasare explicită (fără acumularea transformărilor) 

constă în efectuarea următoarelor calcule. 

Algoritmul 4.25 (IT QRsim – Un pas QR simetric cu deplasare 

Wilkinson explicită) (Dată o matrice simetrică tridiagonală ireductibilă 

T ∈ IR n×n prin vectorul f ∈ IR n al elementelor diagonale şi vectorul 

g ∈ IR n−1 al elementelor subdiagonale, algoritmul calculează vectorii 

definitorii f şi g ai matricei succesor din şirul QR simetric. Toate 

calculele se efectuează pe loc, în locaţiile de memorie ale elementelor 

vectorilor f şi g. Algoritmul furnizează, de asemenea, vectorii c şi s ale 

elementelor ce definesc rotaţiile utilizate.) 

1. % Calculul deplasării Wilkinson 

1. α = f n−1 −f n 

, β = g 2 

2 

n−1, µ = f n − 

2. % T ← T −µI n 


1. f i ← f i −µ 

β 

α+(sgnα) √ α 2 +β


3. % Calculul factorizării QR a matricei T fără calculul explicit al 

matricei Q. 

1. h 1 = g 1 

2. Pentru i = 1 : n−1 

1. [ 

[ 

fi 

g i 

] 

,c i ,s i ] = Gr( 

2. τ = h i 

3. h i = c i h i −s i f i+1 

4. f i+1 = s i τ +c i f i+1 

5. Dacă i < n−1 

1. h i+1 = c i g i+1 

4. % Calculul produsului RQ 

1. Pentru i = 1 : n−1 

1. f i = c i f i −s i h i 

2. g i = −s i f i+1 

3. f i+1 = c i f i+1 

5. % T ← T +µI n 


1. f i ← f i +µ 

[ 

fi 

g i 

] 

) 

Comentarii. Pentru apelul algoritmului de implementare a unui pas QR simetric 

cu deplasare explicită vom utiliza sintaxa 

[f,g,c,s] = IT QRsim(f,g). 

Matricea de transformare curentă este dată de 

Q = P 12 P 23···P n−1,n , (4.286) 

algoritmul furnizând elementele definitorii pentru cele n−1 rotaţii utilizate pentru 

o eventuală acumulare a transformărilor (care se face numai în caz de necesitate). 

În forma de mai sus, execuţia unui pas QR simetric cu deplasare explicită necesită 

un număr N op ≈ 20n flopi la care se adaugă n−1 extrageri de radical. ✸ 

Exemplul 4.6 Considerăm matricea tridiagonală simetrică 

⎡ 

T = ⎣ 1 1 0 

⎤ 

1 2 1 ⎦ 

0 1 1 

definită de vectorii f = [1 2 1] T şi g = [1 1] T şi având valorile proprii exacte 

λ(T) = {0,1,3}. Iterarea brută (i.e. fără supravegherea şi anularea elementelor 

neglijabile) a algoritmului IT QRsim conduce la evoluţia elementelor vectorilor 

g şi f prezentată în tabelele 4.7 şi 4.8. Se confirmă anularea rapidă a ultimului


k 

g (k) 

1 g (k) 

2 

0 1.00000000000000 1.00000000000000 

1 0.85065080835204 −0.52573111211913 

2 0.25379174838439 0.06711070517530 

3 0.08564664424607 −0.00000629541717 

4 0.02859558021545 0.00000000000000 

5 0.00953359280112 −0.00000000000000 

6 0.00317792845516 0.00000000000000 

7 0.00105931186244 0 

. 

. 

. 

10 0.00003923378367 0 

. 

. 

. 

15 0.00000016145590 0 

. 

. 

. 

25 0.00000000000273 0 

Tabelul 4.7: Date numerice privind evoluţia elementelor vectorului g din exemplul 

4.5. 

k 

f (k) 

1 f (k) 

2 f (k) 

3 

0 1.00000000000000 2.00000000000000 1.00000000000000 

1 2.61803398874990 1.00000000000000 0.38196601125011 

2 2.96739091997935 1.02821618974253 0.00447471825954 

3 2.99632557546692 1.00367442449350 0.00000000003958 

4 2.99959106278125 1.00040893721875 0.00000000000000 

5 2.99995455427149 1.00004544572851 0.00000000000000 

. 

. 

. 

. 

10 2.99999999923036 1.00000000076964 0.00000000000000 

. 

. 

. 

. 

15 2.99999999999999 1.00000000000001 0.00000000000000 

16 3.00000000000000 1.00000000000000 0.00000000000000 

. 

. 

. 

. 

25 3.00000000000000 1.00000000000000 0.00000000000000 

Tabelul 4.8: Date numerice privind evoluţia elementelor vectorului f din exemplul 

4.5.


element al vectorului g (convergenţă cubică!) şi evoluţia întregii matrice T către o 

structură diagonală. 

✸ 

La fel ca şi în cazul nesimetric, diminuarea modulului elementelor vectorului g 

are loc are loc mai rapid la cele două ”capete” (cel mai rapid în zona terminală, 

vezi tabelul 4.7). În cadrul unui algoritm global, iterarea schemei de calcul de mai 

sus se completează cu anularea efectivă a elementelor extradiagonale ale matricei 

curente T, i.e. ale vectorului g, atunci când acestea devin inferioare, în modul, unei 

toleranţe precizate. Prin urmare, pasul QR simetric de mai sus se ajustează la 

dimensiunea curentă a problemei, pe măsură ce se pun în evidenţă valorile proprii 

calculate. O modalitate concretă de gestionare a valorilor proprii calculate va fi 

prezentată în cadrul algoritmului QR simetric cu deplasare implicită. Un algoritm 

de calcul, bazat pe iterarea pasului QR simetric de mai sus, se termină, evident, în 

momentul în care toate elementele vectorului g au fost declarate nule. 

B. Un pas QR simetric cu deplasare implicită 

Considerăm important să subliniem de la început faptul că, spre deosebire de cazul 

real nesimetric, aici utilizarea variantei cu deplasare implicită nu aduce un spor de 

eficienţă faţă de varianta cu deplasare explicită, astfel încât preferinţa pentru deplasarea 

implicită poate fi justificată numai prin dorinţa asigurăriiunei omogenităţi 

a tratării tuturor problemelor de calcul al valorilor proprii ale matricelor reale. 

Varianta cu deplasare implicită a algoritmului QR simetric are la bază teorema 

4.15 conform căreia transformarea ortogonală de asemănare definită de un pas QR 

simetric cu deplasare explicită pentru o matrice tridiagonală ireductibilă (i.e. cu 

toate elementele subdiagonale nenule) 

T ← T ′ = Q T TQ (4.287) 

este esenţial determinată, în sensul observaţiei 4.6, de prima coloană a matricei 

de transformare Q. Similar cazului deplasării explicite, vom considera matricea 

ortogonală de transformare Q sub forma secvenţei de rotaţii plane (4.286). Întrucât 

P j,j+1 e 1 = e 1 , j = 2 : n − 1, prima coloană a matricei Q este prima coloană a 

matricei P 12 , i.e. 

⎡ ⎤ 

c 1 

−s 1 

⎢ 0 ⎥ 

q 1 = Qe 1 = P 12 e 1 = 

⎢ 

⎣ 

. 

0 

. (4.288) 

⎥ 

⎦ 

La fel ca în cazul nesimetric, un pas QR simetric cu deplasare implicită va consta 

din următoarele transformări. 

1. Se calculează prima coloană q 1 a matricei de transformare Q din 

pasul QR simetric cu deplasare explicită. 

2. Se determină rotaţia P 12 ce satisface (4.288). 

3. Se calculează matricea T ← P T 12 TP 12 în care este alterată structura 

tridiagonală în poziţiile (3,1) şi (1,3) dar se conservă simetria.


4. Se reface structura tridiagonală prin transformări ortogonale de 

asemănare utilizând o secvenţă de rotaţii plane (o adaptare a algoritmului 

de tridiagonalizare TQ). 

În acest fel, se obţine o matrice succesor ortogonal asemenea cu matricea iniţială, 

tridiagonală, simetrică şi cu prima coloană a matricei de transformare identică cu 

prima coloană a matricei de transformare din cadrul pasului QR simetric cu deplasare 

explicită. Aşa cum am menţionat mai sus, conform teoremei 4.15, dacă 

matricea T este ireductibilă, i.e. vectorul g are toate elementele nenule, atunci matricea 

succesor T ← T ′ este aceeaşi (v. obs. 4.6) cu matricea succesor din cadrul 

pasului QR cu deplasare explicită. 

Pentruascrieefectivalgoritmul,vomaduceuneleprecizăriprivitoarelapunctele 

din schema de calcul de mai sus. 

1. Dacă vectorul g are toate elementele nenule, atunci deplasarea µ dată de 

relaţia (4.284) nu este valoare proprie a lui T (demonstraţi!) şi, prin urmare, matricea 

T −µI n şi matricea superior triunghiulară R din (4.281) sunt nesingulare. În 

consecinţă, din egalarea primelor coloane ale primei relaţii din (4.281), obţinem 

Numim, şi aici, vectorul 

⎡ 

q 1 = 1 

r 11 ⎢ 

⎣ 

w = 

t 11 −µ 

t 21 

0 

. 

0 

⎤ ⎡ 

= 1 

⎥ r 

⎦ 11 ⎢ 

⎣ 

f 1 −µ 

g 1 

0 

. 

0 

⎤ 

. (4.289) 

⎥ 

⎦ 

[ ] 

f1 −µ 

∈ IR 2 (4.290) 

g 1 

vector de deplasare implicită aferent unui pas simplu QR simetric. 

2. Din (4.288) şi (4.290) rezultă că elementele definitorii c 1 şi s 1 ale rotaţiei P 12 

pot fi furnizate de funcţia Gr (vezi tabelul 4.3) aplicată vectorului w. 

3. Se vede imediat că (P T 12 TP 12)(3,1) = (P T 12 TP 12)(1,3) = −s 1 g 2 ≠ 0, i.e. 

aplicarea transformării ortogonale definite de P 12 alterează structura tridiagonală 

a matricei T în poziţiile menţionate. 

4. Pentru refacerea structurii tridiagonale - un invariant al şirului QR simetric 

- se aplică algoritmul TQ adaptat corespunzător pentru asigurarea unei eficienţe 

maxime. Concret, se utilizează o secvenţă de rotaţii care elimină elementele nenule 

din afara structurii tridiagonale prin deplasarea lor de-a lungul unor trasee paralele 

cu diagonala principală conform următoarei scheme de calcul. 

1. Pentru k = 2 : n−1 

1. Se calculează rotaţia P k,k+1 astfel încât (Pk,k+1 T T)(k +1,k −1) = 0. 

2. T ← Pk,k+1 T T % Se anulează elementul (k+1,k−1) şi se alterează 

(pentru k < n−1) zeroul din poziţia (k,k+2). 

3. T ← TP k,k+1 % Se anulează automat (datorită simetriei) elementul 

(k −1,k +1) şi se alterează (pentru k < n−1) 

zeroul din poziţia (k+2,k).


Pentru exemplificare prezentăm evoluţia structurală a matricei T în cazul 

n=5. La fel ca în diagramele structurale precedente, şi aici semnul ”+” marchează 

elementul nul alterat iar ”∅” elementul anulat la pasul curent. Încadrările indică 

liniile sau coloanele afectate la pasul curent. 

⎡ 

T←P12 T T = ⎢ 

⎣ 

⎡ 

T←P23 T T = ⎢ 

⎣ 

⎡ 

T ←P34 T T = ⎢ 

⎣ 

⎡ 

T←P45 T T = ⎢ 

⎣ 

× × + 0 0 

× × × 0 0 

0 × × × 0 

0 0 × × × 

0 0 0 × × 

× × × 0 0 

× × × + 0 

∅ × × × 0 

0 0 × × × 

0 0 0 × × 

× × 0 0 0 

× × × × 0 

0 × × × + 

0 ∅ × × × 

0 0 0 × × 

× × 0 0 0 

× × × 0 0 

0 × × × × 

0 0 × × × 

0 0 ∅ × × 

, 

⎤ 

⎡ 

⎥ 

, T←TP 12 = 

⎢ 

⎦ ⎣ 

⎤ 

⎡ 

, T←TP 23 = 

⎥ ⎢ 

⎦ ⎣ 

⎤ 

⎡ 

, T←TP 34 = 

⎥ ⎢ 

⎦ ⎣ 

⎤ 

⎡ 

, T←TP 45 = 

⎥ ⎢ 

⎦ ⎣ 

× × 

× × 

+ × 

0 0 

0 0 

× 

× 

0 

0 

0 

× × 

× × 

0 × 

0 0 

0 0 

× ∅ 

× × 

× × 

+ × 

0 0 

× × 0 

× × × 

0 × × 

0 0 × 

0 0 0 

× 0 0 

× 0 0 

× × 0 

× × × 

0 × × 

0 0 

× ∅ 

× × 

× × 

+ × 

0 0 

× 0 

× 0 

× × 

× × 

0 

0 

× 

× 

× 

0 0 

0 0 

× ∅ 

× × 

× × 

Calculul elementelor definitorii c k şi s k ale rotaţiei P k,k+1 se face cu procedura 

Gr (v. tabelul 4.3), iar pentru calculul economic al produselor Pk,k+1 T T si ¸ TP k,k+1 

se renunţă la utilizareaprocedurilorGrs şi Grd pentru a exploataeficient structura 

tridiagonală şi simetria matricei T. 

Cu aceste precizări putem prezenta algoritmul de implementare al unui pas QR 

simetric cu deplasare Wilkinson implicită. 

Algoritmul 4.26 (IT QRsim – Un pas QR simetric cu deplasare 

Wilkinson implicită) (Dată omatricesimetricătridiagonalăireductibilă 

T ∈ IR n×n prin vectorul f ∈ IR n al elementelor diagonale şi vectorul 

g ∈ IR n−1 al elementelor subdiagonale, algoritmul calculează vectorii 

definitorii f şi g ai matricei succesor din şirul QR simetric. Toate 

calculele se efectuează pe loc, în locaţiile de memorie ale elementelor 

vectorilor f şi g. Pentru elementul ”rătăcitor”, care afectează temporar 

structura tridiagonală se utilizează o variabilă scalară locală τ. Algoritmul 

furnizează, de asemenea, vectorii c şi s ale căror elemente definesc 

rotaţiile utilizate.) 

⎤ 

⎥ 

⎦ 

⎤ 

⎥ 

⎦ 

⎤ 

⎥ 

⎦ 

⎤ 

. 

⎥ 

⎦



1. α = f n−1 −f n 

, β = g 2 

2 

n−1, µ = f n − 

β 

α+(sgnα) √ α 2 +β 

2. % Calculul şi aplicarea rotaţiilor P 12 şi P k,k+1 , k = 2 : n−1. 

1. Pentru k = 1 : n−1 

1. Dacă k = 1 atunci 

1. w = [f 1 −µ g 1 ] T 

2. [w,c 1 ,s 1 ] = Gr(w) 

altfel [ ] [ 

gk−1 gk−1 

1. [ ,c 

τ k ,s k ] = Gr( 

τ 

2. µ 1 = c 2 k , µ 2 = c k s k , µ 3 = s 2 k 

3. α = 2µ 2 g k 

4. τ 1 = µ 1 f k +µ 3 f 2 −α, τ 2 = µ 2 (f k −f k+1 )+(µ 1 −µ 3 )g k 

5. f k+1 = µ 1 f k+1 +µ 3 f k +α 

6. f k = τ 1 , g k = τ 2 

7. Dacă k < n−1 atunci 

1. τ = −s k g k+1 % elementul ”rătăcitor” 

2. g k+1 = c k g k+1 

Comentarii. Având în vedere echivalenţa performanţelor algoritmilor, cu deplasare 

explicită şi implicită, de implementare a unui pas QR simetric, utilizăm 

aceeaşi sintaxă de apel, i.e. 

[f,g,c,s] = IT QRsim(f,g). 

Complexitatea unei iteraţii QR simetrice cu deplasare implicită este O(n), pentru 

execuţia algoritmului 4.26 fiind necesari N op ≈ 20n flopi, la care se adaugă cele 

n−1 extrageri de radical. Si aici, algoritmul oferă, prin vectorii c şi s, informaţia 

necesară pentru o eventuală actualizare a matricei de transformare. ✸ 

Exemplul 4.7 Invităm cititorul să reia datele de intrare din exemplul precedent şi 

să itereze pasul QR simetric cu deplasare implicită de mai sus. Va avea satisfacţia 

să constate că elementele calculate ale vectorului g coincid în primele 15 cifre semnificative, 

iar cele ale vectorului f în primele 14 cifre semnificative cu cele produse 

de iterarea pasului QR cu deplasare explicită. 

✸ 

] 

) 

C. Algoritmul QR simetric pentru matrice reale simetrice 

Algoritmul QR simetric se obţine prin iterarea algoritmului 4.26, anularea efectivă 

a elementelor nediagonale devenite neglijabile şi exploatarea structurală a acestor 

anulări în vederea obţinerii unei eficienţe maxime. Pentru deciziile de anulare efectivă 

a elementelor extradiagonale şi monitorizarea evoluţiei structurale a matricelor


tridiagonale din şirul QR simetric vom urma ideile folosite la algoritmul QR nesimetric. 

Astfel, condiţia de anulare a elementelor extradiagonale, i.e. a elementelor 

vectorului g, este 

|g k | ≤ tol(|f k |+|f k+1 |), (4.291) 

unde scalarul realtol defineşte nivelul de toleranţă şi are, uzual, un ordin de mărime 

comparabil cu eroarea de reprezentare din formatul virgulă mobilă al maşinii ţintă. 

De asemenea, pentru gestionarea evoluţiei structurale, la fiecare iteraţie, după anularea 

elementelor vectorului g care satisfac condiţia (4.291), se va determina cel mai 

mic întreg p şi cel mai mare întreg q astfel încât matricea tridiagonală curentă din 

şirul QR simetric să aibă structura 

⎡ 

T = ⎣ T ⎤ 

11 0 0 

0 T 22 0 ⎦, (4.292) 

0 0 T 33 

cu T 11 ∈ IR p×p , T 22 ∈ IR (n−p−q)×(n−p−q) tridiagonală ireductibilă şi T 33 ∈ IR q×q 

diagonală, i.e. g(p+1 : n−q) aretoate elementele nenule, iar g(n−q+1: n−1) = 0. 

În acest fel, iteraţia QR se va aplica de fapt blocului T 22 

echivalentă cu aplicarea transformării (4.287) cu 

T 22 ← T ′ 22 = QT 22 T 22Q 22 , (4.293) 

Q = diag(I p ,Q 22 ,I q ). (4.294) 

AlgoritmulQRsimetricsetermină înmomentul încareseanuleazătoateelementele 

vectoruluig,i.e. q devinen−1. Cuprecizăriledemaisus,putemprezentaalgoritmul 

QR simetric. 

Algoritmul 4.27 (QRsim– Algoritmul QR simetric cu deplasări 

Wilkinson implicite) (Date o matrice simetrică A ∈ IR n×n , o matrice 

ortogonală Q ∈ IR n×n şi un nivel de toleranţă tol pentru anularea elementelor 

extradiagonale, algoritmul calculează vectorul f ∈ IR n al valorilor 

proprii ale matricei A şi, opţional, actualizează matricea de transformare 

ortogonală Q. Opţiunea se exprimă prin intermediul variabilei 

logice opt care poate lua valorile ’da’ sau ’nu’. Dacă nu se doreşte 

acumularea transformărilor, matricea Q se returnează nemodificată.) 

1. % Reducerea la forma tridiagonală 

1. [f,g,Q] =TQ(A,Q) 


1. p = 0, q = 0 


1. % Anularea elementelor neglijabile 

Pentru i = p+1 : n−q −1 

1. Dacă |g i | ≤ tol(|f i |+|f i+1 | atunci g i = 0



Cât timp g n−q−1 = 0 

1. q ← q +1 

3. % Terminarea algoritmului 

Dacă q = n−1 atunci return 


1. p = n−q −1 

2. Cât timp g p ≠ 0 

1. p ← p−1 

5. [f(p+1 : n−q),g(p+1 : n−q −1),c,s] = 

=IT QRsim(f(p+1 : n−q),g(p+1 : n−q −1)) 

6. Dacă opt=’da’ atunci 

1. Pentru i = 1 : n−p−q 

1. Q(:, p+i:p+i+1)= Grd(Q(:, p+i:p+i+1),c i ,s i ) 

Comentarii. Sintaxa de apel a algoritmului QR simetric este 

[f,Q] = QRsim(A,Q,tol,opt). 

Algoritmul QR simetric reprezintă cel mai bun instrument numeric de calcul al 

întregului spectru al unei matrice simetrice reale. Dacă nu se acumulează transformările, 

algoritmul este foarte rapid, numărul de flopi necesar pentru calculul 

tuturor valorilor proprii fiind estimat, în medie, la N op = 4n 3 /3 fără acumularea 

transformărilor şi la N op = 9n 3 dacă transformările se acumulează. Pentru 

o toleranţă de ordinul ε M valorile proprii calculate sunt valori proprii exacte 

pentru o matrice simetrică foarte apropiată, algoritmul având o bună stabilitate 

numerică. Mai mult, spre deosebire de cazul nesimetric, aici se poate 

afirma că eroarea absolută pentru fiecare valoare proprie calculată este mică, i.e. 

|λ i −f i | ≈ tol‖A‖ 2 . Dacă se doreşte calculul vectorilor proprii, atunci se utilizează 

apelul [f,Q] = QRsim(A,I n ,tol, ′ da ′ ). În această situaţie x j = Q(:,j) este un 

vectorpropriucalculat asociatvaloriipropriiλ j ≈ f j . Acurateţeavectoruluipropriu 

calculat este dependentă de separarea valorii proprii asociate de restul spectrului. 

Algoritmul asigură o foarte bună ortogonalitate a vectorilor proprii calculaţi. Pentru 

detalii suplimentare asupra stabilităţii numerice a se vedea §4.11. ✸ 

4.8.3 Algoritmul QR pentru matrice hermitice 

Fie C = A + iB cu A,B ∈ IR n×n o matrice hermitică, i.e. C H = C, ceea ce 

implică simetria matricei A şi antisimetria matricei B. Deci A T = A şi B T = −B. 

Aşa cum s-a arătat în secţiunea 4.1 matricele hermitice au spectrul real şi sunt 

unitar diagonalizabile. Pentru calculul valorilor proprii ale unei matrice hermitice 

cu algoritmul QR, în practica numerică se întâlnesc două abordări. 

I. Fie λ ∈ λ(C) şi x = u+iv, cu u,v ∈ IR n , un vector propriu asociat. Atunci 

{ Au−Bv = λu, 

Cx = λx ⇔ 

(4.295) 

Bu+Av = λv,

4.9. METODE ALTERNATIVE 329 

egalităţile din dreapta scriindu-se compact în forma 

[ ][ ] [ ] [ ][ ] 

A −B u u A −B −v 

= λ sau 

B A v v B A u 

[ ] 

u 

Vectorii şi 

v 

[ 

−v 

u 

[ 

−v 

= λ 

u 

] 

, fiind ortogonali, sunt liniar independenţi. 

] 

. (4.296) 

În consecinţă, 

[ ] 

dacă λ(C) = {λ 1 ,λ 2 ,...,λ n }, atunci matricea simetrică reală F def A −B 

= 

B A 

are spectrul λ(F) = {λ 1 ,λ 1 ,λ 2 ,λ 2 ,...,λ n ,λ n }, iar dacă w ∈ IR 2n este un vector 

propriu al matricei F asociat valorii proprii λ k , atunci x = w(1 : n)+iw(n+1 : 2n) 

sau y = −w(n+1 : 2n)+iw(1 : n) este un vector propriu 51 al matricei C asociat 

aceleiaşi valori proprii. 

Din cele de mai sus rezultă esenţa calculatorie a primei abordări care constă în 

aplicarea algoritmului QR simetric matricei F. Utilizarea exclusivă a aritmeticii 

reale face această soluţie deosebit de atractivă. Scrierea algoritmului este imediată 

şi este lăsată în sarcina cititorului. 

II. Cea de a doua modalitate de calcul al valorilor proprii ale unei matrice hermitice 

utilizată în practica numerică (de exemplu, în LAPACK [XV]) utilizează 

o aritmetică în numere complexe numai în faza directă a algoritmului QR, i.e. 

în faza de reducere la forma tridiagonală. Este posibil ca matricea tridiagonală 

rezultată să fie reală astfel încât faza iterativă apelează exclusiv la o aritmetică 

reală, procedurile utilizate în faza iterativă fiind cele descrise în această secţiune. 

Posibilitatea obţinerii, prin transformări unitare de asemănare a unei matrice tridiagonale 

reale este condiţionată de utilizarea unor reflectori complecşi nehermitici 

(v. cap. 3). Într-adevăr, dat un vector complex x ∈ ICn se poate calcula un astfel 

de reflector Ũ1 ∈ IC n×n care să asigure ŨH 1 x = ρe 1 cu ρ un număr real. Notând 

cu U k 

def 

= 

[ 

Ik−1 0 

0 Ũ 1 

] 

, unde Ũ1 ∈ IC (n−k+1)×(n−k+1) este un reflector de tipul 

menţionat, dacă U 2 este astfel calculat încât (U2 H C)(3 : n,1) = 0, atunci matricea 

C ← C 1 = U2 H CU 2 este hermitică şi tridiagonală în prima linie şi prima 

coloană. Cum o matrice hermitică are elementele diagonale reale, rezultă că blocul 

C 1 (1 : 2,1 : 2) este real. Continuând acest proces, în final matricea 

C ← C n−2 = U H n−1...U H 3 U H 2 CU 2 U 3 ...U n−1 (4.297) 

va fi tridiagonală, simetrică şi reală. Scrierea efectivă a algoritmului face obiectul 

exerciţiului 4.58. 

4.9 Alte metode de calcul al valorilor proprii 

pentru matrice simetrice 

Algoritmul QR simetric rămâne un instrument fundamental pentru calculul întregului 

spectru al unei matrice simetrice. Totuşi, spre deosebire de cazul general, 

51 De observat că y = ix, i.e. vectorii x şi y sunt coliniari în IC n .


nesimetric, în care algoritmul QR s-a impus definitiv ca fiind fără rival, în cazul 

simetric există soluţii alternative, cu performanţe comparabile cu cele ale algoritmului 

QR. Utilizarea tehnicilor alternative este recomandată mai ales în situaţii 

particulare. Menţionăm, în acest sens, problemele de calcul al unui grup restrâns 

de valori proprii sau implementări pe maşini cu arhitecturi specifice, e.g. calculatoarele 

paralele cu memorie distribuită. 

Vom prezenta mai întâi unele tehnici de calcul al unei valori proprii sau al 

unui grup redus de valori proprii, cum sunt iterarea câtului Rayleigh sau metoda 

bisecţiei, iar apoi metodele de tip Jacobi, consacrate calculului întregului spectru. 

Pentru metodele ale căror iteraţii conservă structura tridiagonală simetrică, vom 

presupune parcursă etapa directă, de reducere la forma tridiagonală cu ajutorul 

algoritmului TQ. În consecinţă, în aceste situaţii, matricea tridiagonală simetrică 

T ∈ IR n×n se va considera dată prin vectorul f ∈ IR n al elementelor diagonale şi 

vectorul g ∈ IR n−1 al elementelor sub- şi supradiagonale. 

4.9.1 Metoda câtului Rayleigh 

Aşa cum s-avăzutla metodaputerii inverse, de calcul iterativalunui vectorpropriu 

(vezisecţiunea4.3), fiindcunoscutăaproximaţia ˆx ≠ 0avectoruluipropriuxasociat 

valorii proprii λ a unei matrice T ∈ IR n×n , câtul Rayleigh al vectorului ˆx în raport 

cu matricea T, definit prin 

µ = r(ˆx) = ˆxT Tˆx 

, (4.298) 

ˆx Tˆx 

constituie cea mai bună aproximaţie, în sens CMMP, a valorii proprii λ. Aplicând 

acumunpasalmetodeiputeriiinversecudeplasareaµ,obţinemoaproximaţieşimai 

bună pentru vectorul propriu asociat lui λ şi, pe baza câtului Rayleigh din (4.298), 

o aproximaţie superioară pentru însuşi λ. Altfel spus, adaptând algoritmul 4.2, de 

implementare a metodei puterii inverse cu deplasare Rayleigh, la cazul matricelor 

simetrice se obţine un mijloc performant de calcul al unei valori proprii (în general, 

fără posibilităţi de selecţie a acesteia) şi al unui vector propriu asociat. Invităm 

cititorul să facă această adaptare prin exploatarea simetriei în rezolvarea sistemului 

liniar ce defineşte o iteraţie a metodei puterii inverse. Precizăm că o prealabilă 

reducere la forma tridiagonală nu se justifică decât dacă se urmăreşte calculul, 

pe această cale, al mai multor valori şi vectori proprii. În [VI] se afirmă (şi se 

demonstrează într-un caz particular) convergenţa globală şi asimptotic cubică (i.e. 

extrem de rapidă) a algoritmului şi se evidenţiază conexiunea cu algoritmul QR 

simetric care, într-o formă implicită, uzează de această tehnică. 

4.9.2 Metoda bisecţiei 

Metoda bisecţiei (sau metoda Givens [IV]) este utilizată pentru determinarea unei 

valori proprii sau a unui grup relativ redus de valori proprii 52 . 

Fie matricea tridiagonală simetrică T ∈ IR n×n definită prin vectorul f ∈ IR n 

al elementelor diagonale şi vectorul g ∈ IR n−1 al elementelor extradiagonale. Pre- 

52 Se apreciază că metoda poate fi considerată eficientă pentru determinarea a cel mult 40% din 

valorile proprii ale unei matrice.


supunem, de asemenea, că toate elementele vectorului g sunt nenule 53 . În esenţă, 

pentru calculul unei valori proprii, metoda bisecţiei constă în localizarea acesteia 

într-un interval [α, β] şi reducerea acestui interval, prin înjumătăţire succesivă, cu 

păstrarea valorii proprii în interval. În acest fel, după t înjumătăţiri lungimea intervalului 

devine δ = β −α 

2 t şi, în consecinţă, într-o aritmetică exactă, se poate obţine 

orice precizie dorită. 

Pentru determinarea intervalului iniţial [α, β] putem utiliza teorema discurilor 

lui Gershgorin, de localizare a întregului spectru, conform căreia λ(T) este situat 

în reuniunea intervalelor 

n⋃ { 

I = λ ∈ IR |λ−fi | ≤ |g i−1 |+|g i | } , (4.299) 

i=1 

unde, pentru simplificarea scrierii, am introdus numerele g 0 = 0 şi g n = 0. Evident, 

avem 

⎧ 

α = min (f i −|g i−1 |−|g i |), 

⎪⎨ 

i ∈ 1 : n 

I ⊆ [α,β], unde 

(4.300) 

β = max (f i +|g i−1 |+|g i |). 

⎪⎩ 

i ∈ 1 : n 

În continuare, intervalul [α,β], cu α şi β din (4.300), va servi drept iniţializare 

pentru orice demers de calcul al valorilor proprii prin metoda bisecţiei. Lăsând cititorului 

sarcina codificării relaţiei (4.300), de calcul a scalarilor α şi β, ne mărginim 

să precizăm sintaxa de apel a procedurii respective 

[α, β] = Int(f,g). 

Prezentăm, în continuare, câteva rezultate care ne vor permite să decidem dacă 

o valoare proprie sau un grup de valori proprii se află sau nu se află situate într-un 

[k] def 

interval dat. Fie T = T(1 : k,1 : k) submatricea lider principală de ordinul k a 

[k] def [k−1] def 

matricei T definită, evident, de vectorii f = f(1 : k) şi g = g(1 : k − 1). 

Definim polinoamele 

p 0 (λ) = 1, 

p 1 (λ) = det(T [1] −λI 1 ) = f 1 −λ, 

p k (λ) = det(T [k] −λI k ), k = 2 : n 

(4.301) 

((−1) k p k (λ) sunt polinoamele caracteristice ale submatricelor T [k] ). 

Pentru k > 2 avem 

⎡ 

⎤ 

0 

T 

p k (λ) = det 

[k−1] −λI k−1 . 

⎢ 

⎣ 

g k−1 

⎥ 

⎦ = 

0 ··· g k−1 f k −λ 

53 Altfel, problema se sparge în două sau mai multe probleme de dimensiune mai mică.


⎡ 

= det 

⎢ 

⎣ 

T [k−2] −λI k−2 . . 

0 0 

g k−2 0 

0 ··· g k−2 

0 ··· 0 

f k−1 −λ g k−1 

g k−1 f k −λ 

⎤ 

, (4.302) 

⎥ 

⎦ 

relaţie din care, prin dezvoltare după elementele ultimei linii sau ultimei coloane, 

obţinem 

p k (λ) = (f k −λ)p k−1 (λ)−g 2 k−1 p k−2(λ). (4.303) 

Relaţia (4.303), împreună cu iniţializările p 0 (λ) = 1, p 1 (λ) = f 1 − λ din (4.301), 

permit calculul recurent al polinoamelor p k (λ), k=2:n, şi, pentru o valoare fixată µ 

a lui λ, valorile acestorpolinoame în punctul µ. Polinoamelep k (λ), k=0:n, definite 

mai sus, formează aşa numitul şir Sturm asociat matricei tridiagonale simetrice 

ireductibile T. 

Notăm cu λ [k] 

i , i = 1 : k, valorile proprii ale matricei T [k] (care sunt, simultan, 

zerourile polinoamelor p k (λ)) pe care le vom presupune ordonate crescător, i.e. 54 

λ [k] 

1 < λ [k] 

2 < ... < λ [k] 

k . (4.304) 

Metoda bisecţiei are la bază următoarele rezultate clasice. 

Teorema 4.20 Dacă vectorul g are toate elementele nenule, i.e. matricea tridiagonală, 

simetrică T, definită de vectorii f şi g, este ireductibilă, atunci valorile 

proprii ale matricei T [k−1] separă strict valorile proprii ale matricei T [k] , i.e. 

λ [k] 

1 < λ [k−1] 

1 < λ [k] 

2 < λ [k−1] 

2 < ... < λ [k] 

k−1 < λ[k−1] k−1 < λ[k] k 

(4.305) 

pentru toţi k ∈ 2 : n. 

Demonstraţie. Conform teoremei 4.5 inegalităţile (4.305) au loc într-o formă 

nestrictă. Vom arăta că, în condiţiile teoremei, egalităţile nu pot avea loc. Presupunem, 

prin absurd, că există i astfel încât λ [k] 

i = λ [k−1] def 

i = γ sau λ [k−1] 

i = 

= λ [k] def 

i+1 

= γ. În ambele cazuri polinoamele p k şi p k−1 au pe γ rădăcină comună. 

Cum toţi g j sunt nenuli, din relaţiile de recurenţă (4.303)rezultăp k (γ) = p k−1 (γ) = 

= ... = p 1 (γ) = p 0 (γ) = 0 ceea ce este în contradicţie cu faptul că p 0 (γ) = 1. ✸ 

Teorema 4.21 Numărul valorilor proprii ale matricei tridiagonale, simetrice, ireductibile 

T ∈ IR n×n , mai mici decât un număr fixat µ ∈ IR este egal cu numărul 

ν(µ) al schimbărilor de semn din mulţimea numerică ordonată 55 

p(µ) = {p 0 (µ), p 1 (µ), ..., p n (µ)}, (4.306) 

unde p k (λ), k = 0 : n, este şirul Sturm asociat matricei T. 

54 O matrice tridiagonală simetrică ireductibilă nu are valori proprii multiple (exerciţiul 4.63). 

Evident, dacă T este ireductibilă, atunci toate submatricele T [k] sunt ireductibile. 

55 În cazurile în care unele din elementele mulţimii sunt nule (fapt puţin probabil în calculele 

efectuate într-o aritmetică aproximativă), convenim că o pereche ordonată (γ,δ) se consideră 

schimbare de semn dacă γ ≠ 0, δ = 0 şi nu se consideră schimbare de semn dacă γ = 0, δ ≠ 0. 

Într-un astfel de caz ν(µ) este numărul de valori proprii mai mici sau egale cu µ. Două zerouri 

consecutive în secvenţa numerică p(µ) nu sunt posibile.


Demonstraţie. Vom considera numai cazul generic în care toţi p k (µ) sunt nenuli, 

lăsând în sarcina cititorului să analizeze cazurile în care unele valori p k (µ) sunt 

nule. Pentru demonstraţie vom utiliza inducţia după n. Fie ν n (µ) numărul valorilor 

proprii mai mici decât µ şi σ n (µ) numărul schimbărilor de semn din şirul (4.306). 

Se verifică imediat că ν 1 (µ) = σ 1 (µ). Presupunem că ν k−1 (µ) = σ k−1 (µ) def 

= l. În 

ipoteza ordonării crescătoare a valorilor proprii ale submatricelor T [k] rezultă că µ 

este situat în intervalul deschis (λ [k−1] 

l 

,λ [k−1] 

l+1 

). Acum, datorită separării stricte a 

valorilor proprii ale submatricei T [k] de către valorile proprii ale lui T [k−1] (teorema 

4.20), sunt posibile următoarele două situaţii 

a) µ ∈ (λ [k] 

l 

,λ [k] 

l+1 

) sau b) µ ∈ (λ[k] 

l+1 ,λ[k] l+2 

). (4.307) 

În cazul a) avem ν k (µ) = l, iar în cazul b), evident, ν k (µ) = l + 1. Rămâne să 

arătăm că în cazul a) perechea (p k−1 (µ),p k (µ)) nu este schimbare de semn, iar în 

cazul b) este schimbare de semn. Conform (4.301) putem scrie 

k−1 

∏ 

p k−1 (µ) = (λ [k−1] 

i −µ), p k (µ) = 

i=1 

k∏ 

i=1 

(λ [k] 

i −µ). (4.308) 

Având învederesituarealuiµînraportcuvalorilepropriialecelordouăsubmatrice, 

este evident faptul că sgn(λ [k−1] 

i − µ) = sgn(λ [k] 

i − µ) pentru i = 1 : l precum şi 

faptul că sgn(λ [k−1] 

i 

−µ) = sgn(λ [k] 

i+1 

−µ) pentru i = l+1 : k −1. Rezultă 

sgn(p k (µ)) = sgn(p k−1 (µ))sgn(λ l+1 −µ), (4.309) 

de unde obţinem, evident, situaţia necesară a semnelor în cazurile a) şi b). Inducţia 

este completă. 

✸ 

Exemplul 4.8 Considerăm matricea tridiagonală T, de ordinul 3, din exemplele 

numerice 4.6 şi 4.7, definită de vectorii f = [1 2 1] T şi f = [1 1] T . Spectrul 

matricei T este λ(T) = {0, 1, 3}, iar şirul Sturm asociat 

p 0 (λ) = 1, p 1 (λ) = −λ+1, p 2 (λ) = λ 2 −3λ+1, p 3 (λ) = −λ 3 +4λ 2 −3λ. 

Valorile { proprii 

√ 

ale submatricelor lider principale sunt λ(T [1] ) = {1} şi λ(T [2] ) = 

= 3− 5 3+ √ } 

5 

, , verificându-se imediat şirurile de inegalităţi din (4.305). 

2 2 

Avem, de asemenea, 

p(1) = {1, 0, −1, 0}, p(2) = {1, −1, 2, 1}, 

i.e. fiecaredinmulţimile p(1)şip(2)arecâtedouăschimbăridesemncarecorespund 

cu numerele de valori proprii ale matricei T mai mici sau egale cu 1, respectiv mai 

mici decât 2. 

✸ 

Utilizarea teoremei 4.21 ridică probleme dificile în practică [X] datorită frecventelor 

depăşiriinferioareşi superioare înformatvirgulămobilă de către valorilep k (µ) 

pentru k apropiaţi de n, chiar pentru un ordin n modest. Acest fenomen apare mai


ales când matricea are valori proprii apropiate şi nu poate fi evitat printr-o scalare 

prealabilă a matricei T iniţiale. 

Pentru depăşirea acestor dificultăţi, în [X] se recomandă utilizarea mulţimii 

numerice 

q(µ) = {q 1 (µ), q 1 (µ), ..., q n (µ)}, unde q i (µ) = p i(µ) 

, i = 1 : n, (4.310) 

p i−1 (µ) 

ale cărei elemente pot fi calculate cu relaţia recurentă 

q i (µ) = f k −µ− g2 i−1 

q i−1 (µ) , i = 2 : n, q 1(µ) = f 1 −µ. (4.311) 

Pentru situaţiile în care q k−1 = 0 (sau, în general, când apar depăşiri inferioare) se 

recomandă calculul lui q k (µ) cu formula 

q i (µ) = f i −µ− |g i−1| 

ε M 

, (4.312) 

unde ε M este epsilon maşină al calculatorului utilizat. 

Evident, numărul de schimbăride semn al mulţimii p(µ) din (4.306)şi, simultan, 

numărul ν(µ) al valorilor proprii ale matricei T mai mici decât µ, este egal cu 

numărul de elemente negative al mulţimii q(µ). Mai mult, numărul ν [α,β] al valorilor 

proprii ale matricei T situate în intervalul [α, β], este dat de relaţia 

ν [α,β] = ν(β)−ν(α). (4.313) 

Calculul lui ν(µ) pentru un număr µ dat se face cu următoarea procedură. 

ν(µ) 1. ν = 0 

2. q = f 1 −µ 

3. Dacă q < 0 atunci ν = 1 


1. Dacă |q| > ε M atunci q ← f i −µ− g2 i−1 

q 

altfel q ← f i −µ− |g i−1| 

ε M 

2. Dacă q < 0 atunci ν ← ν +1 

În continuare, vom utiliza procedura de mai sus cu sintaxa de apel 

ν = ν(f,g,µ). 

Vom considera acum problema determinării unei singure valori proprii, mai 

precis a valorii proprii λ k , k ∈ 1 : n, din spectrul matricei T, presupus ordonat 

crescător, respectiv 

λ 1 < λ 2 < ... < λ k < ... < λ n , (4.314) 

unde egalităţile nu sunt posibile întrucât T este ireductibilă (vezi exerciţiul 4.63). 

Metodabisecţieipentrucalcululvaloriipropriiλ k poatefirezumatăprinurmătoarea 

schemă de calcul.


BISECT k 

1. [α, β] = Int(f,g) 

2. Cât timp β −α > tol 

1. γ = α+β 

2 

2. ν = ν(f,g,γ) 

3. Dacă ν < k atunci α ← γ 

altfel β ← γ 

3. λ k = γ 

Este uşor de verificat faptul că această procedură evaluează corect, în limitele fixate 

de toleranţa tol, valoarea proprie λ k din (4.314). 

Pentru localizarea şi calculul unui grup contiguu de valori proprii ale matricei 

T din secvenţa (4.314), fie acesta λ k1 ,λ k1+1,...,λ k2 , k 2 ≥ k 1 , se aplică, în esenţă, 

de k 2 − k 1 + 1 ori procedura de mai sus, cu unele amendamente care conduc la 

obţinerea unui spor de eficienţă. Aceste amendamente urmăresc exploatarea intensivă 

a informaţiei obţinute în procesul iterativ de localizare a valorii proprii curente 

pentru reducerea intervalelor de separare a valorilor proprii care se calculează ulterior. 

Concret,vomrealizaoactualizare,lafiecareiteraţie, aextremităţilorinferioare 

ale intervalelor de localizare a valorilor proprii λ i , i = k 1 : k 2 . Pentru aceasta observăm 

că valoarea ν calculată la instrucţiunea 2.2 a procedurii de mai sus, permite 

aprecierea că, la iteraţia curentă de evaluare a valorii proprii λ k , un număr de k−ν 

valori proprii se găsesc în intervalul [γ,λ k ]. Prin urmare, dacă ν < k 1 atunci în 

intervalul [γ,λ k ] se găsesc valorile proprii λ i , i = k 1 : k−1, iar dacă ν ≥ k 1 atunci 

în acest interval se află valorile proprii λ i , i = ν+1 : k−1. Utilizarea informaţiilor 

de mai sus presupune: 

– calculul valorilor proprii în ordine inversă, i.e. în ordinea k = k 2 : −1 : k 1 ; 

– introducerea unui vector σ ∈ IR k2−k1+1 , al extremităţilor stângi ale intervalelor 

de localizare, ale cărui elemente vor fi actualizate, la fiecare iteraţie, pe baza 

observaţiilor de mai sus. 

Utilizând, pentru elementele vectorului σ, o indexare conformă cu cea a valorilor 

proprii (i.e. σ k , k = k 1 : k 2 , este extremitatea stângă a intervalului de localizare a 

valorii proprii λ k ), la o iteraţie curentă de calcul al lui λ k , actualizarea constă în 

atribuirile 

σ i = γ pentru i = 

{ 

k1 : k −1, dacă ν < k 1 

ν +1 : k −1, dacă ν ≥ k 1 . 

(4.315) 

Prezentăm direct algoritmul care implementează ideile de mai sus. 

Algoritmul 4.28 (BISECT – Calculul unui grup de valori proprii 

prin metoda bisecţiei) (Daţi vectorii f ∈ IR n şi g ∈ IR n−1 care definesc 

matricea tridiagonală, simetrică, ireductibilă T ∈ IR n×n precum 

şi întregii k 1 < k 2 ≤ n şi toleranţa tol, algoritmul calculează valorile 

proprii λ k , k ∈ k 1 : k 2 .) 

1. [α, β] = Int(f,g) 

2. % Iniţializarea vectorului extremităţilor stângi ale intervalelor de 

separare şi a extremităţii din dreapta pentru λ k2 .


1. Pentru i = k 1 : k 2 

1. σ i ← α 

2. λ k2 ← β 

3. % Calculul iterativ al grupului impus de valori proprii 

1. Pentru k = k 2 : −1 : k 1 

%Calcululvaloriipropriicurenteλ k şiactualizareaintervalelor 

de localizare pentru valorile proprii λ j , j = k −1 : −1 : k 1 

1. α ← σ k 

2. Cât timp β −α > tol 

1. γ = α+β 

2 

2. ν = ν(f,g,γ) 

3. Dacă ν < k atunci 

1. α ← γ 

2. Dacă ν < k 1 şi k > k 1 atunci 

1. Pentru i = k 1 : k −1 

1. σ i = γ 

altfel 

1. Pentru i = ν +1 : k −1 

1. σ i = γ 

altfel β ← γ 

3. λ k = γ 

4. β ← γ 

Comentarii. O sintaxă de utilizare naturală a algoritmului este 

λ = BISECT(f,g,k 1 ,k 2 ,tol), 

unde λ este vectorul valorilor proprii calculate. Deşi este dificil de stabilit o complexitate 

corectă a algoritmului datorită, în primul rând, caracterului său iterativ, 

practica a arătat că algoritmul BISECT, în varianta prezentată, este sensibil mai 

rapid decât aplicarea repetată a aceleiaşi metode pentru fiecare valoare proprie individuală, 

mai ales atunci când există valori proprii multiple sau apropiate. În [X] 

se afirmă că algoritmul poate fi utilizat şi pentru calculul valorilor proprii ale unei 

matrice tridiagonale nesimetrice T dacă elementele nediagonale satisfac condiţia 

t i,i+1 t i+1,i > 0. În acest scop se utilizează datele de intrare f i = t ii , i = 1 : n, şi 

g i = √ t i,i+1 t i+1,i , i = 1 : n−1. 

Acurateţea rezultatelor este considerată a fi foarte bună, calculul într-un format 

virgulă mobilă cu baza de numeraţie β şi un număr t de cifre al mantisei, conducând 

launnivelalerorilorabsolutedeordinulβ −t max(|λ min |,|λ max |), nivelcarenupoate 

fi redus prin creşterea numărului de iteraţii [X]. 

✸ 

4.9.3 Metode Jacobi 

Metodele tip Jacobi, de calcul al valorilor proprii ale unei matrice simetrice, sunt 

inferioare din punctul de vedere al eficienţei, apreciate prin numărul necesar de


operaţii în format virgulă mobilă, algoritmului QR simetric. Reînvierea interesului 

pentru metodele Jacobi se datorează modificării contextului arhitectural al echipamentelor 

de calcul de înaltă performanţă actuale, mai precis dezvoltării calculatoarelor 

paralele. Eficienţa unui algoritm paralel se evaluează pe principii diferite, 

avându-se în vedere efectuarea calculelor simultan de mai multe procesoare. În 

acest context, metodele Jacobi devin competitive datorităfaptului că au o structură 

granulară, bogată în acţiuni de calcul practic independente, care pot fi executate, 

în acelaşi timp, de procesoare diferite. Deşi prezentarea unor algoritmi paraleli nu 

face obiectul acestei lucrări, am considerat oportun să introducem metodele Jacobi, 

în variantele lor secvenţiale, ca punct de plecare, de altfel uzual, pentru dezvoltarea 

variantelor paralele. 

Fie A ∈ IR n×n o matrice simetrică, D A = diag(a 11 ,a 22 ,...,a nn ) şi B = A−D A 

matricea elementelor sale extradiagonale. Precizăm că transformările din cadrul 

metodelor Jacobi nu conservă structura tridiagonală astfel că etapa de reducere la 

această structură nu este necesară. 

În esenţă, metodele Jacobi construiesc, iterativ, un şir de matrice, ortogonal 

asemenea cu matricea iniţială, pe baza relaţiei de recurenţă 

A k+1 = J T k A kJ k , ,k = 1,2,..., A 1 = A, (4.316) 

unde J k sunt rotaţii plane, numite, în acest context, transformări Jacobi, astfel 

calculate încât să minimizeze norma Frobenius a matricei curente B k a elementelor 

extradiagonale. Acest şir este convergent, în general mai lent decât şirul QR, către 

formadiagonală, carepune înevidenţăvalorilepropriiale matriceiiniţiale. Calculul 

vectorilor proprii este posibil prin acumularea transformărilor. 

Pentru simplificarea notaţiilor şi pentru a evidenţia faptul că toate calculele se 

efectuează pe loc, în locaţiile de memorie ale tabloului A, introducem notaţiile 

şi 

A def 

= A k , A ′ def 

= A k+1 , B def 

= B k+1 = A k+1 −diag(A k+1 ), J def 

= J k 

A ← B ′ def 

= B k+1 . 

În vederea determinării rotaţiei plane J optimale, reamintim parametrii definitorii 

ai acesteia 

⎡ 

⎤ 

1 

. .. c s 

p 

. .. 

J(p,q,θ) = 

, p < q, c = cosθ, s = sinθ, 

−s c 

q 

⎢ 

⎣ 

. ⎥ .. ⎦ 

1 

p q 

(4.317) 

toate elementele extradiagonale nemarcate ale matricei J fiind nule. Pentru parametrii 

p şi q fixaţi, unghiul de rotaţie θ optimal este cel care minimizează norma


Frobenius a matricei B. Se poate arăta (v. exerciţiul 4.64) că valoarea optimală 

a lui θ este situată în intervalul [− π 4 , π 4 ) şi asigură anularea elementului a qp şi, 

simultan, datorită simetriei, a elementului a pq . În consecinţă, parametrii c şi s pot 

fi determinaţi din această condiţie, respectiv, din condiţia ca matricea 

D = 

[ ] [ 

d11 d 12 def c s 

= 

d 21 d 22 −s c 

] T [ ][ ] 

app a pq c s 

a qq −s c 

a qp 

(4.318) 

să fie diagonală. Prin calcul direct obţinem 

⎧ 

⎨ d 11 = a pp c 2 −2a qp cs+a qq s 2 

d 12 = (a pp −a qq )cs+a pq (c 2 −s 2 ) = d 21 

⎩ 

d 22 = a pp s 2 +2a qp cs+a qq c 2 . 

(4.319) 

Dacă a pq ≠ 0 (altfel J = I n ), atunci impunând d 12 = d 21 = 0, din (4.319) rezultă 

c 2 −s 2 

cs 

= a qq −a pp 

a qp 

. (4.320) 

Introducând, acum, notaţiile 

t = s c = tgθ, 

τ = a qq −a pp 

2a qp 

, (4.321) 

relaţia (4.320) se scrie sub forma unei ecuaţii de gradul 2 în t 

t 2 +2τt−1 = 0. (4.322) 

Rădăcina t a acestei ecuaţii care corespunde valorilor optimale ale parametrilor c şi 

s trebuie să asigure satisfacerea condiţiei |θ| < π 4 

, i.e. |t| < 1. Prin urmare, valorile 

optimale ale lui t, c şi s se calculează cu relaţiile 

t = 

sgnτ 

|τ|+ √ 1+τ 2, c = 1 

√ , s = ct. (4.323) 

1+t 

2 

După determinarea valorilor optimale ale parametrilor c şi s, calculul produsului 

A ← J T AJ se poate face economic ţinând seama de simetria rezultatului. Evident, 

în acest produs vor fi afectate numai liniile şi coloanele p şi q. La fel ca la algoritmul 

QR simetric, vom presupune că matricea A este memorată numai prin triunghiul 

ei inferior. În acest fel elementele afectate sunt cele evidenţiate în figura 4.9.3, iar 

relaţiile de calcul sunt deja familiare cititorului care a parcurs capitolul 3. Pentru 

o redactare mai concisă şi mai clară a algoritmilor de implementare a metodelor 

Jacobi vom scrie un algoritm pentru implementarea unui pas descris mai sus. 

Algoritmul 4.29 (IT J– Iteraţie Jacobi) (Date matricea simetrică 

A ∈ IR n×n , prin triunghiul său inferior, precum şi întregii 1 ≤ p < 

< q ≤ n, algoritmul calculeazăparametrii optimali c, s ai rotaţiei Jacobi 

şi suprascrie triunghiul inferior al matricei A cu triunghiul inferior al 

matricei succesor A ′ = J T AJ.)


❅ 

❅❅❅❅❅ 

❅ 

p 

 

O 

q 0 

p q 

Fig. 4.3: Elementele afectate de un pas al metodelor de tip Jacobi. 

1. Dacă a qp = 0 atunci 

1. c = 1, s = 0 

2. Return 

2. % Determinarea parametrilor rotaţiei Jacobi 

1. τ = a qq −a pp 

2a qp 

sgnτ 

2. t = 

|τ|+ √ 1+τ 2 

1 

3. c = √ , s = ct 

1+t 

2 

3. % Calculul A ← J T AJ numai în triunghiul inferior 

1. ρ = a pp c 2 −2a qp cs+a qq s 2 

2. a qq ← a pp s 2 +2a qp cs+a qq c 2 

3. a pp ← ρ, a qp ← 0 

4. Dacă p > 1 atunci 

1. Pentru j = 1 : p−1 

1. ρ = ca pj −sa qj 

2. a qj ← sa pj +ca qj 

3. a pj ← ρ 

5. Dacă p < q −1 atunci 

1. Pentru j = p+1 : q −1 

1. ρ = sa jp +ca qj 

2. a jp ← ca jp −sa qj 

3. a qj ← ρ. 

6. Dacă q < n atunci 

1. Pentru i = q +1 : n 

1. ρ = ca ip −sa iq 

2. a iq ← sa ip +ca iq 

3. a ip ← ρ


Comentarii. Sintaxa de apel a algoritmului IT J va fi 

[A,c,s] = IT J(A,p,q), 

iar complexitatea sa este O(n), fiind necesari numai N op ≈ 6n flopi. 

Parametrii p, q ai transformării Jacobi ce defineşte iteraţia curentă se pot determina 

aplicând strategii diverse. Oricare ar fi strategia aplicată, un element anulat 

la o iteraţie poate deveni nenul la iteraţiile ulterioare (acesta este cazul obişnuit), 

astfel că, aşa cum era de aşteptat, procesul de diagonalizare este, teoretic, infinit. 

Criteriile practice de terminare se referă la situaţiile în care toate elementele extradiagonaledevin, 

învaloareabsolută, neglijabile. Dintre criteriileuzuale de apreciere 

a acestui fapt amintim 

sau 

n max 

i,j∈1:n 

i≠j 

|a ij | < tol, (4.324) 

‖A−diag(A)‖ F < tol‖A‖ F , (4.325) 

unde scalarul pozitiv tol exprimă nivelul de toleranţă acceptat, şi are, în mod 

obişnuit, valori de ordinul de mărime al erorilor de reprezentare în formatul virgulă 

mobilă folosit. 

Prezentăm în continuare două strategii de alegere a parametrilor p şi q, care 

s-au impus în practica numerică, şi algoritmii de calcul corespunzători. 

Metoda Jacobi clasică 

În aşa numita metodă Jacobi clasică, parametrii p, q se determină astfel încât a pq să 

fie elementul extradiagonal de modul maxim al matricei curente. Intuitiv, o astfel 

de alegere ar trebui să asigure o viteză de convergenţă superioară, ceea ce nu este 

întotdeauna adevărat. Algoritmul corespunzător, cu criteriul de terminare de tipul 

(4.324), arată astfel. 

Algoritmul 4.30 (J clasic – Diagonalizare iterativă a unei matrice 

simetrice prin metoda Jacobi clasică) (Date matricea simetrică 

A ∈ IR n×n , prin triunghiul său inferior, matricea ortogonală Q ∈ IR n×n 

şi toleranţa tol < 1, algoritmul calculează valorile proprii ale matricei 

A prin diagonalizarea iterativă cu rotaţii Jacobi care anulează, la 

pasul curent, elementul extradiagonal de modul maxim. Acumularea 

transformărilorJacobi se efectuează opţional. Opţiunea se exprimă prin 

intermediul unei variabile logice opt care poate lua valorile ’da’ sau 

’nu’. Dacă opt = ′ nu ′ , matricea Q rămâne nemodificată.) 

1. µ = 1 

2. Cât timp nµ > tol 

1. µ = 0 


1. Pentru j = 1 : i−1 

✸


1. Dacă |a ij | > µ atunci 

1. µ = |a ij | 

2. p ← j 

3. q ← i 

3. [A,c,s] = IT J(A,q,p) 



1. ρ = cq ip −sq iq 

2. q iq ← sq ip +cq iq 

3. q ip ← ρ. 

Comentarii. Sintaxa de apel a algoritmului J clasic va fi 

[A,Q] = J clasic(A,Q,tol,opt), 

iar complexitatea sa, pentru n relativ mari poate fi apreciată statistic la O(n 3 ) şi 

la O(n 4 ) pentru n relativ reduse. 

✸ 

Metoda Jacobi ciclică 

Dezavantajul principal al metodei Jacobi clasice constă în necesitatea căutării, la 

fiecare iteraţie, a elementului extradiagonal de modul maxim, o operaţie de complexitate 

O(n 2 ) comparaţii, în timp ce complexitatea de calcul a unei iteraţii este 

de numai O(n). De aceea, pentru a se asigura o eficienţă sporită, metoda Jacobi ciclică 

evită efectuarea comparaţiilor prin anularea elementelor extradiagonale într-o 

ordine predeterminată. Având în vedere că elementele anulate pot deveni nenule 

într-o fază ulterioară a aceleiaşi iteraţii sau într-o iteraţie ulterioară, anulările se 

reiau, ciclic, până la satisfacerea criteriului de oprire a iteraţiilor. 

Presupunând că operăm exclusiv în triunghiul inferior al matricei A şi efectuăm 

anulările pe linii, în ordinea naturală, i.e. în cadrul unui ciclu, în ordinea (2,1), 

(3,1), (3,2), ...(n,1),...(n,n−1), obţinem următorul algoritm. 

Algoritmul 4.31 (J ciclic – Diagonalizare iterativă a unei matrice 

simetrice prin metoda Jacobi ciclică) (Date matricea simetrică A ∈ 

∈ IR n×n , prin triunghiul său inferior, matricea ortogonală Q ∈ IR n×n şi 

toleranţa tol < 1, algoritmul calculează valorile proprii ale matricei A 

prin diagonalizarea iterativă cu rotaţii Jacobi care anulează elementele 

extradiagonale ciclic, pe linii. Acumularea transformărilor se realizează 

opţional, pe baza opţiunii exprimate prin intermediul unei variabile logice 

opt, care poate lua valorile ’da’ sau ’nu’. Dacă opt = ′ nu ′ , matricea 

Q rămâne nemodificată.) 

1. σ = ∑ n 

i=2 

∑ i−1 

j=1 a2 ij 

2. ν A = √ 2σ+ ∑ n 

i=1 a2 ii , ν E = √ 2σ 

3. Cât timp ν E > tol ∗ν A 

1. Pentru q = 2 : n


1. Pentru p = 1 : q −1 

1. [A,c,s] = IT J(A,p,q) 



1. ρ = cq ip −sq iq 

2. q iq ← sq ip +cq iq 

3. q ip ← ρ 

√ 

3. ν E = 2 ∑ n ∑ i−1 

i=2 j=1 a2 ij 

Comentarii. Sintaxa de apel a algoritmului J ciclic va fi 

[A,Q] = J ciclic(A,Q,tol,opt), 

iar complexitatea sa poate fi apreciată, statistic, la O(n 3 ) dacă n este relativ mare. 

Pentrua mărieficienţa, există versiuni”cu prag”ale algoritmului J ciclic (v. [IV]) 

la care anularea elementelor extradiagonale are efectiv loc numai dacă modulul lor 

este superior unui anumit prag. O reducere progresivă a pragului pe parcursul 

procesului iterativ asigură conservarea şi chiar o îmbunătăţire a proprietăţilor de 

convergenţă. 

✸ 

Calculul vectorilor proprii prin intermediul metodelor tip Jacobi se realizează, 

în esenţă, prin acumularea transformărilor. Concret, coloanele matricei de transformare 

Q obţinute în urma apelului [A,Q] = J clasic(A,I n , ′ da ′ ) sau, respectiv, al 

apelului [A,Q] = J ciclic(A,I n , ′ da ′ ), sunt vectorii proprii ai matricei A iniţiale, 

mai precis coloana Q(:,j) este vector propriu asociat valorii proprii a jj din forma 

finală a matricei A. 

Analiza proprietăţilor de convergenţă [IV] a metodei clasice Jacobi a condus 

la concluzia că în faza iniţială convergenţa poate fi considerată ca liniară, dar pe 

măsură ce numărul iteraţiilor creşte şi elementele extradiagonale scad în modul, 

convergenţa devine pătratică. Metoda Jacobi ciclică are o convergenţă pătratică. 

Deşi viteza de convergenţă a metodelor tip Jacobi este inferioară celorlalte 

metode de calcul al valorilorproprii ale matricelor simetrice (a se vedea convergenţa 

asimptotic cubică a algoritmului QR simetric sau a metodei bisecţiei) totuşi, pentru 

matrice de dimensiuni mai modeste aceste metode se pot dovedi, datorită simplităţii 

lor, atractive. Metodele Jacobi reprezintă însăo alternativă viabilă la implementarea 

pe echipamentele de calcul paralel, unde un grad superior de paralelism 

poate compensa viteza mai redusă de convergenţă. 

4.10 Condiţionarea valorilor şi vectorilor proprii 

Precizia rezultatelor unui calcul cu datele iniţiale afectate de erori, cum sunt erorile 

de reprezentare în format virgulă mobilă, este esenţial influenţată de sensibilitatea 

acestor rezultate la variaţii în datele iniţiale sau, altfel spus, de condiţionarea problemei 

respective (vezi cap. 0). Aprecierea condiţionării se face în ipoteza unor 

calcule exacte, deci este independentă de modul efectiv de calcul. În continuare

4.10. CONDIŢIONARE 343 

ne propunem să abordăm câteva aspecte ale problemei sensibilităţii valorilor şi 

vectorilor proprii la perturbaţii ale elementelor matricei. 

Apreciereacondiţionăriiseface,deobicei,prinstabilireaunormarginisuperioare 

pentru variaţiile valorilor şi vectorilor proprii în raport cu variaţiile elementelor 

matricei date. Chiar dacă aceste margini sunt, de cele mai multe ori, supraevaluate, 

eleoferăoimaginefoarteutilăasupraunorsituaţiicritice, încareerorilerezultatelor 

ies de sub control. Stabilirea evaluărilor privind sensibilitatea valorilor şi vectorilor 

proprii se bazeazăpe proprietăţile de continuitate ale acestora înraportcu variaţiile 

elementelor matricei. Întrucât aceste proprietăţi capătă un aspect complicat în 

cazulvalorilorpropriimultiple, nevommărginidemersulteoreticînprincipalasupra 

matricelor cu valori proprii distincte, atrăgând de la început atenţia asupra faptului 

că valorile proprii multiple sunt semnificativ mai rău condiţionate decât cele simple. 

De asemenea, vom tratadistinct cazul matricelorhermitice (în cazul real, simetrice) 

care prezintă calităţi cu totul remarcabile din acest punct de vedere. 

Proprietăţile de netezime ale dependenţelor valorilor proprii simple şi ale vectorilor 

proprii asociaţi se pot exprima în felul următor [IV]. Fie matricea A ∈ IC n×n 

şi o matrice de perturbaţie E = ǫG, cu ǫ ∈ IR şi G ∈ IC n×n având ‖G‖ = 1, arbitrară 

dar fixată 56 . Dacă λ ∈ λ(A) este o valoare proprie simplă şi x ∈ IC n un 

vector propriu asociat, de normă euclidiană unitară (i.e. ‖x‖ = 1), atunci există o 

valoare proprie λ(ǫ) ∈ λ(A+E) a matricei perturbate F = A+E = A+ǫG cu un 

vector propriu asociat x(ǫ) (de asemenea de normă euclidiană unitară) care admit 

următoarele dezvoltări în serii de puteri în raport cu ǫ: 

λ(ǫ) = λ+α 1 ǫ+α 2 ǫ 2 +... , 

x(ǫ) = x+z 1 ǫ +z 2 ǫ 2 +... , 

(4.326) 

convergente într-o vecinătate a punctului ǫ = 0. Evident, avem λ(0) = λ, x(0) = x, 

iar λ(ǫ) şi x(ǫ) sunt funcţii continue şi derivabile în domeniul de convegenţă, în 

particular lim ǫ→0 λ(ǫ) = λ şi lim ǫ→0 x(ǫ) = x. Întrucât, în general, în dezvoltările 

de mai sus, α 1 ≠ 0 şi z 1 ≠ 0, o primă evaluare a dependenţei valorilorproprii simple 

şi a vectorilor proprii asociaţi de perturbaţiile din elementele matricei este dată de 

|λ(ǫ)−λ| = O(ǫ), 

‖x(ǫ)−x‖ = O(ǫ), 

(4.327) 

utilă în aprecierea condiţionării în cazul practic al perturbaţiilor ”mici”, i.e. al 

celor pentru care ǫ 2 este ”neglijabil” în raport cu ǫ. Evaluările calitative (4.327) se 

pot aprecia cantitativ prin |α 1 | şi, respectiv, prin ‖z 1 ‖ (sau margini superioare ale 

acestora), care pot servi drept numere de condiţionare pentru valoarea proprie λ şi 

vectorul propriu asociat x. 

4.10.1 Condiţionarea valorilor şi vectorilor proprii 

pentru matrice generale (nehermitice) 

A. Condiţionarea valorilor proprii 

Fie A ∈ IC n×n , λ ∈ λ(A) o valoare proprie simplă a matricei A şi x,y ∈ IC n vectori 

proprii la dreapta, respectiv la stânga, de normă euclidiană unitară, asociaţi valorii 

56 Dacă nu se menţionează altfel, norma matriceală ‖·‖ este norma spectrală, i.e. ‖·‖ 2 .


proprii λ, i.e. avem Ax = λx şi, respectiv, y H A = λy H . Considerăm, ca mai 

sus, matricea perturbată F = A+E, cu E = ǫG, şi λ(ǫ), x(ǫ) definite în (4.326). 

Derivând, în raport cu ǫ, relaţia de definiţie 

şi făcând ǫ = 0 obţinem 

Gx+Az 1 = α 1 x+λz 1 , unde α 1 = dλ(ǫ) 

dǫ 

(A+ǫG)x(ǫ) = λ(ǫ)x(ǫ) (4.328) 

∣ , z 1 = dx(ǫ) 

ǫ=0 

dǫ ∣ . (4.329) 

ǫ=0 

Dar, întrucât λ este o valoare proprie simplă, avem y H x ≠ 0 (v. exerciţiul 4.9). 

Prin urmare, înmulţind relaţia (4.329) la stânga cu y H , obţinem 


y H Gx+y H Az 1 = α 1 y H x+λy H z 1 , 

|α 1 | = |yH Gx| 

|y H x| 

≤ ‖y‖·‖G‖·‖x‖ 

|y H x| 

= 1 

|y H x| . (4.330) 

Numărul 

def 

κ λ = 1 

|y H x| = max 

G ∈ IC n×n 

‖G‖ = 1 

|α 1 | (4.331) 

(maximul fiind atins pentru G = xy H ) defineşte sensibilitatea sau numărul de 

condiţionare al valorii proprii simple λ. În literatura de specialitate (v. [IV], 

[VI], [XV] ) se utilizează însă curent inversul numărului de condiţionare, i.e. aşa 

numitul ”parametru s” definit de 

s λ 

def 

= |y H x|. (4.332) 

Evident, cu cât κ λ este mai mare (s λ este mai mic) condiţionarea valorii proprii 

simple este mai rea, erorile din datele iniţiale putând fi amplificate de până la κ λ 

ori. Din punct de vedere geometric, în cazul real numărul s λ reprezintă cosinusul 

unghiului ascuţit dintre direcţiile vectorilor proprii la stânga şi la dreapta asociaţi 

valorii proprii simple λ. Cazul cel mai favorabil apare atunci când vectorii proprii 

la stânga şi la dreapta sunt aceiaşi (e.g. matricele normale au toate valorile proprii 

perfect condiţionate, v. teorema 4.1). 

Este evident faptul că sensibilitatea unei valori proprii, definită de parametrul 

s sau de condiţionarea κ, se referă la erorile absolute introduse de perturbaţiile 

numerice în datele iniţiale. Prin urmare, erorile relative vor fi cu atât mai mari cu 

cât valorile proprii sunt mai mici în modul. 

FieQ ∈ IC n×n omatriceunitarăoarecare,B = Q H AQşiλ ∈ λ(A) = λ(B). Dacă 

x şi y sunt vectori proprii la dreapta şi, respectiv, la stânga, de normă unitară, ai 

matricei A, asociaţi valorii proprii λ, atunci ˜x = Q H x şi, respectiv, ỹ = Q H y sunt 

vectori proprii de normă unitară ai matricei B, asociaţi aceleiaşi valori proprii. Se


constată imediat că ˜s λ = |ỹ H˜x| = |y H x| = s λ , i.e. numerele de condiţionare ale 

valorilor proprii simple sunt invariante la transformări unitare de asemănare. 

[ ] 

λ1 β 

Exemplul 4.9 Fie A = ∈ IR 2×2 , cu λ 

0 λ 1 ≠ λ 2 . Atunci este uşor de 

2 

constatat că 

|λ 1 −λ 2 | 

s λ1 = s λ2 = √ 

β2 +(λ 1 −λ 2 ) 2, 

respectiv, 

κ λ1 = κ λ2 = 

√ 

1+ 

β 2 

(λ 1 −λ 2 ) 2. 

|β| 

Dacă |β| ≫ |λ 1 −λ 2 |, atunci κ λ1 = κ λ2 ≈ 

|λ 1 −λ 2 | . 

[ ] 

0.1 100 

În cazul numeric A = , avem κ 

0 0.2 

λ1 = κ λ2 ≈ 10 3 . Valorile proprii ale 

[ ] 

[ ] 

0.1 100 

0 0 

matricei perturbate F = A+ǫG = 

10 −6 , unde ǫ = 10 

0.2 

−6 şi G = 

1 0 

(cu ‖G‖ = 1), sunt ˆλ 1 = 0.0990098 şi ˆλ 2 = 0.2009902, i.e. o perturbare cu numai 

10 −6 a unui singur element al matricei iniţiale are ca efect modificări de ordinul a 

10 −3 ale celor două valori proprii, deci de aproximativ κ ≈ 1000 mai mari. 

Expresia de mai sus a numerelor de condiţionare sugerează o justificare a faptului, 

afirmat deja, că valorile proprii multiple au o condiţionare mai rea decât valorile 

proprii simple. 

✸ 

Atragem atenţia asupra faptului că, deşi exemplul de mai sus arată că sensibilitatea 

unei valori proprii poate fi influenţată decisiv de ”distanţa” de la ea pâna la 

restul spectrului, există situaţii de valoriproprii ”bine separate”de restul spectrului 

şi, înacelaşitimp, foarterăucondiţionate. Exemplecelebreînacestsensfacobiectul 

exerciţiilor 4.69 şi 4.70. 

Numereleκ λi (saus λi )definesccondiţionareavalorilorpropriiλ i aleuneimatrice 

înraportcuvariaţiimicidararbitrarealetuturorelementelormatricei,i.e. înraport 

cu perturbaţii nestructurate. Desigur, putem să formulăm problema condiţionării 

valorilorproprii înraportcu variaţia unui anumit element (v. exerciţiul 4.68)sau cu 

variaţiile elementelor dintr-un grup precizat structural (perturbaţii structurate). În 

continuare ne vom îndrepta însă atenţia într-o direcţie considerată mai importantă 

în aplicaţii şi anume a exprimăriisintetice a condiţionării unui grup de valoriproprii 

sau a întregului spectru în raport cu perturbaţii nestructurate. În acest scop pot 

fi utilizate teoremele de localizare a spectrului de valori proprii în planul complex 

(dintre care amintim teorema lui Gershgorin, vezi teorema 4.11, §4.1). O altă 

cale este de a defini condiţionarea întregului spectru printr-o normă a vectorului 

condiţionărilor valorilor proprii individuale, i.e. 

s Λ 

def 

= ‖s‖, κ Λ 

def 

= ‖κ‖, (4.333) 

unde 

s = [s λ1 s λ2 ··· s λn ] T , κ = [κ λ1 κ λ2 ··· κ λn ] T , (4.334)


definiţie care ar putea fi utilizată şi pentru un grup de valori proprii. 

Pentru definirea condiţionării unui grup de valori proprii vom urma totuşi o cale 

alternativăcaregeneralizeazăointerpretareinteresantăanumerelordecondiţionare 

individuale definite mai sus. În acest scop vom introduce şi utiliza conceptul de 

proiector spectral. Pentru simplitate, considerăm o matrice A ∈ IC n×n cu valori 

proprii distincte şi fie I = {i 1 ,i 2 ,...,i q } o mulţime ordonată (i.e. i 1 

... 

acum, U I ⊂ IC n subspaţiul A-invariant asociat setului de valori proprii λ I (A) şi 

V ⊂ IC n subspaţiulA-invariantcomplementar,asociatsetuluiλ J (A) = λ(A)\λ I (A). 

Întrucât avem IC n = U⊕V, pentru orice vector x ∈ IC n există vectorii u ∈ U şi v ∈ V, 

unic determinaţi, astfel încât x = u+v. Vectorul u se numeşte proiecţia vectorului 

x pe subspaţiul U paralelă cu subspaţiul V, iar vectorul v proiecţia vectorului x pe 

subspaţiul V paralelă cu subspaţiul U. Aplicaţia liniară P I : IC n → U se numeşte 

proiecţia spectrală asociată setului de valori proprii λ I (A), iar pentru o bază fixată 

a spaţiului IC n , matricea P I ∈ IC n×n asociată aplicaţiei P I se numeşte proiector 

spectral pe subspaţiul U. Evident, P I x = u, ∀x ∈ IC n şi PI 2 = P I. 

Fie, acum, o matrice U ∈ IC n×q ale cărei coloane formează o bază a subspaţiului 

U. Conform propoziţiei 4.1, avem AU = UB, unde B ∈ IC q×q este o restricţie a 

matricei A la subspaţiul A-invariant U şi λ(B) = λ I (A). Similar, fie V ∈ IC n×(n−q) 

o matrice ale cărei coloane formează o bază a subspaţiului V şi AV [ = VC. ] Evident, 

Y 

matriceaT = [U V ]este nesingulară. ConsiderămpartiţiaT −1 = a inversei 

Z 

matricei T, unde Y ∈ IC q×n şi Z ∈ IC (n−q)×n . Avem imediat YAU = B, YAV = 0, 

ZAU = 0 şi ZAV = C. Prin urmare, T −1 AT = diag(B,C). Mai mult, este simplu 

de văzut că matricele 

P I = UY, P J = VZ = I n −P I (4.335) 

sunt proiectorii spectrali pe subspaţiile A-invariante U şi, respectiv, V. 

Considerăm, în continuare, o valoare proprie simplă λ ∈ λ(A), un vector propriu 

la dreapta x şi un vector propriu la stânga y, ambii de norme euclidiene unitare, 

asociaţi valorii proprii λ. Subspaţiul A-invariant unidimensional U = Imx are drept 

complement subspaţiul A-invariant n −1 dimensional V = Kery H , iar P λ = xyH 

y H x 

este proiectorul spectral pe subspaţiul U. Avem următoarea exprimare posibilă a 

condiţionării valorii proprii λ. Întrucât ‖xyH ‖ = ‖x‖·‖y‖ (demonstraţi!), rezultă 

s λ = 1 

‖P λ ‖ , respectiv κ λ = ‖P λ ‖. (4.336) 

Aceste relaţii pot fi generalizate, în modul cel mai natural, la definirea condiţionării 

unor seturi de mai multe valori proprii. Fără a intra în detalii, vom defini 

parametrul s I şi condiţionarea κ I a unui set λ I ⊂ λ(A) de valori proprii prin 

s I = 1 

‖P I ‖ , respectiv κ I = ‖P I ‖, (4.337) 

unde P I este proiectorul spectral pe subspaţiul A-invariant asociat valorilor proprii 

λ I . La fel ca în cazul valorilor proprii individuale, s I şi κ I sunt invariante la transformări 

unitare (în cazul real, ortogonale) de asemănare. În consecinţă, evaluarea


condiţionării unui set λ I de valori proprii se poate face în felul următor. Fie 

[ ] 

S = Q H S11 S 

AQ = 12 

(4.338) 

0 S 22 

forma Schur ordonată a matricei A astfel încât λ I = λ(S 11 ), λ(S 11 )∩λ(S 22 ) = ∅ şi 

soluţia X ∈ IC q×(n−q) a ecuaţiei Sylvester 

S 11 X −XS 22 = S 12 . (4.339) 

Atunci, aşa[ cum s-a arătat ] în §4.7, transformarea de asemănare definită de matricea 

T = conduce la obţinerea matricei cu structură bloc-diagonală 

Iq −X 

0 I n−q 

T −1 ST = diag(S 11 ,S 22 ), iar proiectorul spectral pe subspaţiul S-invariant asociat 

valorilor proprii λ(S 11 ), conform (4.335), este 

[ ] 

P = T(:,1 : q)T −1 Iq X 

(1 : q, :) = . (4.340) 

0 0 

Rezultă 

s I = 1 

‖P‖ = 1 

√ 

1+‖X‖ 

2 , respectiv κ I = ‖P‖ = √ 1+‖X‖ 2 . (4.341) 

Avându-se în vedere dificultăţile legate de calculul normei spectrale, în pachetele 

profesionale de calcul al valorilor proprii 57 , se utilizează norme matriceale mai 

uşor de calculat. Astfel, în LAPACK [XV], în locul relaţiei (4.341) de calcul al 

parametrului s I se foloseşte expresia 

s I = 

1 

√ 

1+‖X‖ 

2 

F 

, (4.342) 

care, avându-se învedererelaţiadintre normaspectralăşi normaFrobenius, dăoestimarecarediferăde 

valoarearealăprintr-unfactorcelmult egalcu √ min(q,n−q). 

În finalul acestui paragraf prezentăm un rezultat important care permite definirea 

condiţionării spectrului unei matrice simple într-un context general. 

Teorema 4.22 (Bauer-Fike) Fie o matrice diagonalizabilă A ∈ IC n×n şi V o matrice 

nesingulară ale cărei coloane sunt vectori proprii ai matricei A, i.e. astfel încât 

V −1 AV = Λ = diag(λ 1 ,λ 2 ,...,λ n ). Dacă E ∈ IC n×n este o matrice de perturbaţie 

şi µ o valoare proprie a matricei perturbate µ ∈ λ(A+E), atunci 

e(µ) = min 

λ∈λ(A) |λ−µ| ≤ κ p(V)‖E‖ p 

, p = 1,2,∞, (4.343) 

unde κ p (V) = ‖V‖ p 

‖V −1 ‖ p 

este numărul de condiţionare la inversare al matricei 

V a vectorilor proprii. 

57 O dovadă certă de profesionalism este însăşi posibilitatea oferită utilizatorului de a-şi evalua 

condiţionarea problemelor sale de calcul şi, pe această cale, nivelul probabil al erorilor.


Demonstraţie. Dacă µ ∈ λ(A), atunci min λ∈λ(A) |λ − µ| = 0 şi, deci, (4.343) 

este, evident, satisfăcută. Dacă µ ∉ λ(A), atunci matricele µI n −A şi µI n −Λ sunt 

nesingulare, iarmatriceleµI n −A−E şiµI n −Λ−V −1 EV suntsingulare. Rezultă că 

matricea (µI n −Λ) −1 (µI n −Λ−V −1 EV) = I n −∆, unde ∆ = (µI n −Λ) −1 V −1 EV, 

este singulară, i.e. există un vector z, cu ‖z‖ = 1, astfel încât (I n −∆)z = 0. De 

aici, cu orice normă matriceală consistentă, obţinem 

1 = ‖z‖ = ‖∆z‖ ≤ ‖∆‖·‖z‖ = ‖∆‖. 

Pe de altă parte, oricare ar fi norma matriceală consistentă ‖·‖, care îndeplineşte 

condiţia 

‖diag(α 1 ,α 2 ,...,α n )‖ = max 

i=1:n (|α i|), 

(în particular ‖·‖ = ‖·‖ p 

, p = 1,2,∞) avem 

‖∆‖ ≤ ‖(µI n −Λ) −1 ‖·‖V −1 EV)‖ ≤ 

≤ max 

i=1:n |µ−λ i| −1 ‖V −1 ‖·‖E‖·‖V‖ = 

Din ultimele două relaţii rezultă 

1 ≤ 

i.e. (4.343) este adevărată, q.e.d. 

1 

min i=1:n |µ−λ i | κ(V)‖E‖, 

1 

min i=1:n |µ−λ i | κ(V)‖E‖. 

În primul rând remarcăm faptul că în demonstraţia teoremei Bauer-Fike nu s-a 

utilizat ipoteza unor perturbaţii ”mici”, i.e. rezultatul este valabilpentru oricenivel 

al perturbaţiilor. 

Interpretând e(µ) ca sensibilitate numerică a(număr de condiţionareal) valorii 

‖E‖ p 

proprii λ pentru care se realizeazăminimul din (4.343) rezultă, pe de o parte, faptul 

că numărul de condiţionarela inversareal matricei vectorilorproprii ai unei matrice 

simple este o margine superioară pentru numerele de condiţionare individuale ale 

fiecărei valori proprii. 

Pe de altă parte, putem considera max µ∈λ(A+E) e(µ) drept influenţa matricei de 

perturbaţie E asupra întreguluispectru a lui Aşi putem utiliza margineasuperioară 

e(µ) 

κ p (V) anumărului max µ∈λ(A+E) pentru apreciereasensibilităţii spectrului matricei 

simple A. Întrucât vectorii proprii sunt determinaţi până la înmulţirea cu un 

‖E‖ 

scalar nenul, pentru a elimina această nedeterminare, definirea condiţionării spectrului 

unei matrice diagonalizabile se poate face prin intermediul numărului 

κ (p) 

Λ 

(A) = min κ p (V), (4.344) 

V ∈V A 

unde V A este mulţimea tuturor matricelor de vectori proprii ai matricei A pentru 

care avem V −1 AV = Λ. 

✸


Pentru p = 2, această caracterizarea condiţionării spectrului de valori proprii al 

unei matrice simple este într-o conexiune strânsă cu cea introdusă în relaţia (4.333). 

Într-adevăr, dacă V ∈ V A , atunci x i = Ve i 

este un vector propriu la dreapta, 

‖Ve i ‖ 

de normă euclidiană unitară, asociat valorii proprii λ i , iar y i = (eT i V −1 ) H 

‖V −H este un 

e i ‖ 

vector propriu unitar la stânga asociat aceleiaşi valori proprii. Avem 

s λi = |y H i x i | = |eT i V −1 Ve i | 

‖V −H e i ‖·‖Ve i ‖ = 1 

‖Ve i ‖·‖V −H e i ‖ . 

Ţinând seama de faptul că ‖Ve i ‖ ≤ ‖V‖ · ‖e i ‖ = ‖V‖ şi, analog, ‖V −H e i ‖ ≤ 

≤ ‖V −1 ‖, rezultă 

s λi ≥ 1 

κ 2 (V) , respectiv κ λ i 

≤ κ 2 (V) 

pentru toţi i = 1 : n. Cum V ∈ V A era arbitrară, aceasta înseamnă 

Pe de altă parte, fie matricele X = [x 1 

‖κ‖ ∞ = max (κ λ i 

) ≤ κ (2) 

i=1:n 

Λ 

(A). (4.345) 

x 2 ··· x n ], având 

⎡ 

drept 

⎤ 

coloane 

y H 

vectori proprii la dreapta de normă euclidiană unitară şi Y = ⎢ 

⎣ 

2. 

y H 1 

y H n 

⎥, cu vectorii 

⎦ 

y i vectori proprii la stânga, de asemenea de normă euclidiană unitară. Atunci, 

ţinând seama de faptul că y H i x j = 0 pentru toţi i ≠ j (v. exerciţiul 4.8), avem 

YX = diag(s λ1 ,s λ2 ,...,s λn ). Prin urmare, matricea 

V = XD = Xdiag( √ κ λ1 , √ κ λ2 ,..., √ κ λn ) 

aparţine mulţimii V A şi V −1 = D −1 X −1 = DY. Rezultă 

n 

κ(V) = ‖V‖·‖V −1 ‖ ≤ ‖V‖ F ‖V −1 ‖ F = ‖XD‖ F ‖DY‖ F = ‖D‖ 2 F = ∑ 

κ λi = ‖κ‖ 1 . 

Reunind acest rezultat cu (4.345) putem scrie în concluzie 

i=1 

‖κ‖ ∞ ≤ κ (2) 

Λ (A) ≤ ‖κ‖ 1. (4.346) 

Având în vedere rolul determinant al structurii direcţiilor proprii asupra sensibilităţii 

valorilor proprii, este interesant de văzut în ce condiţii κ Λ (A) este minim. 

În acest sens avem următoarea propoziţie. 

Propoziţia 4.4 Valoarea minimă a numărului de condiţionare (4.342) pentru 

p = 2 este 1 şi este atinsă dacă matricea A este normală (în particular, hermitică 

sau unitară, iar în cazul real simetrică sau ortogonală).


Demonstraţie. Pentru orice matrice de vectori proprii V ∈ V A avem 

κ 2 (V) = ‖V‖·‖V −1 ‖ ≥ ‖VV −1 ‖ = 1. 

Prin urmare şi κ (2) 

Λ 

(A) ≥ 1. Dacă matricea A este normală, atunci este unitar 

diagonalizabilă, respectiv vectorii proprii sunt ortogonali, i.e. κ 2 (V) = 1 pentru 

toţi V ∈ V A . Rezultă κ (2) 

Λ 

(A) = 1. 

✸ 

Prin urmare spectrele matricelor normale sunt perfect condiţionate. 

O altă problemă foarte importantă este legată de existenţa mijloacelor de îmbunătăţire 

şi de conservare a condiţionării numerice a spectrului de valori proprii 

ale unei matrice date. Întrucât spectrul însuşi trebuie conservat, aceste mijloace se 

referălaexistenţaunortransformărideasemănareastfelîncâtmatriceaÃ = TAT−1 

să aibă κ Λ (Ã) ≤ κ Λ(A). În acest sens avem următorul rezultat. 

Propoziţia 4.5 Transformările unitare (în cazul real, ortogonale) de asemănare 

conservă numărul de condiţionare κ (2) 

Λ 

(A) al spectrului unei matrice. 

Demonstraţie. Conservarea numărului de condiţionare este urmare directă a 

conservării normei euclidiene la transformări unitare. Într-adevăr, fie Ã = UAUH 

unde U ∈ IC n×n este unitară, i.e. U H U = UU H = I n . Atunci, dacă V este o matrice 

arbitrarădevectoripropriiliniarindependenţiaimatriceiA, Ṽ = UV esteomatrice 

(nesingulară) de vectori proprii a matricei Ã. Prin urmare, κ 2 (Ṽ) = ‖Ṽ‖·‖Ṽ −1 ‖ = 

= ‖UV‖·‖V −1 U H ‖ = κ 2 (V) de unde rezultă şi conservarea numărului de condiţionare 

min V ∈VA κ 2 (V), q.e.d. 

✸ 

Implicaţiile importante ale propoziţiei de mai sus constau în utilizarea, practic 

exclusivă, a transformărilor unitare (ortogonale) de asemănare în toţi algoritmii 

de calcul al valorilor proprii (vezi secţiunile precedente). De asemenea, rezultă 

că o eventuală ameliorare a condiţionării spectrului de valori al unei matrice nu 

este posibilă decât prin recurgerea la transformări de asemănare neunitare, care să 

realizeze o ”apropiere” a matricei iniţiale de o matrice normală. Întrucât o matrice 

normală este caracterizată, printre altele, de faptul că este perfect echilibrată, i.e. 

are normele euclidiene ale liniilor şi coloanelorde acelaşi indice egale, procedurile de 

ameliorare a condiţionării spectrului unei matrice urmăresc o echilibrare a acesteia, 

aşa cum s-a prezentat în detaliu în secţiunea 4.4. 

B. Condiţionarea vectorilor proprii şi a subspaţiilor invariante 

La fel ca şi în cazul valorilor proprii, din motive de simplitate, ne vom mărgini la 

analiza condiţionării vectorilor proprii asociaţi valorilor proprii simple. De asemenea, 

precizăm de la început că subspaţiile invariante generate de vectori proprii rău 

condiţionaţipotaveaocondiţionaremult maibună. Acestaşiesteunuldin motivele 

principale pentru care în practica numerică nu se recomandă, în general, calculul 

explicit al vectorilor proprii, subspaţiile invariante de interes putând fi generate 

mult mai fiabil, de exemplu, de vectorii Schur. 

Fie matricea A ∈ IC n×n cu valorile proprii distincte λ k şi vectorii proprii asociaţi, 

de normă euclidiană unitară, x k , k = 1 : n. Considerăm matricea perturbată


F = A+E, cu E = ǫG, ‖G‖ = 1, şi λ k (ǫ), x k (ǫ) (cu ‖x k ‖ = 1) valorile şi vectorii 

proprii ai matricei perturbate, definiţi ca în (4.326). Adaptând notaţiile la noul 

context, relaţia (4.329) se poate scrie sub forma 

Gx k +Az (k) 

1 = α (k) 

1 x k +λ k z (k) 

1 , unde α(k) 1 = dλ k(ǫ) 

dǫ ∣ , z (k) 

1 = dx k(ǫ) 

ǫ=0 

dǫ ∣ . 

ǫ=0 

(4.347) 

Întrucât, în ipotezele acceptate, vectorii proprii x k , k = 1 : n, formează o bază 

a spaţiului IC n , putem scrie z (k) 

1 = ∑ n 

i=1 γ(k) i x i , relaţie care, introdusă în (4.347), 

conduce la 

n∑ 

i=1 

i≠k 

γ (k) 

i (λ k −λ i )x i = (G−α k I n )x k . (4.348) 

Înmulţind la stânga relaţia (4.347) cu y H i , unde y i este vectorul propriu la stânga 

asociat valorii proprii λ i , şi ţinând seama de faptul că y H j x i = 0 pentru j ≠ i şi 

y H i x i ≠ 0 (v. exerciţiile 4.8 şi 4.9) obţinem 

γ (k) 

i = 

yi HGx k 

(λ k −λ i )yi Hx , i = 1 : n, i ≠ k. (4.349) 

i 

Prinurmare,dezvoltareaînserie(4.326)conducelaurmătoareaevaluareainfluenţei 

perturbaţiei asupra vectorului propriu x k : 

n∑ yi H x k (ǫ) = x k +ǫ 

Gx k 

(λ k −λ i )yi Hx x i +O(ǫ 2 ). (4.350) 

i 

i=1 

i≠k 

În sensul celor precizate în preambulul acestei secţiuni, putem considera 

n∑ yi H κ xk = ‖ 

Gx k 

(λ k −λ i )yi Hx x i ‖ (4.351) 

i 

i=1 

i≠k 

drept număr de condiţionare al vectorului propriu x k . Relaţia (4.351) arată că 

sensibilitatea unui vector propriu este dependentă esenţial atât de sensibilităţile 

tuturor valorilor proprii cât şi de distanţa (”separarea”) valorii proprii asociate faţă 

de celelalte valori proprii. 

Exemplul [ 4.10] 

Reluăm matricea din exemplul precedent, respectiv considerăm 

λ1 β 

A = ∈ IR 2×2 cu λ 

0 λ 1 ≠ λ 2 şi notăm δ = λ 1 − λ 2 . Vectorii proprii, de 

2 

normă unitară, au expresiile (făcând abstracţie de semn) 

[ ] [ ] [ ] [ ] 

1 1 β 1 δ 0 

x 1 = , x 

0 2 = √ , y 

β2 +δ 2 −δ 1 = √ , y 

β2 +δ 2 β 2 = . 

1 

Prin urmare, relaţiile (4.351) se scriu în acest caz sub forma 

κ x1 = ‖ yT 2 Gx 1 

δy T 2 x 2 

x 2 ‖, κ x2 = ‖ yT 1 Gx 2 

δy1 Tx x 1 ‖. 

1


[ ] 1.01 0.01 

În cazul numeric A = , avem κ 

0 1 

λ1 = κ λ2 = √ 2, i.e. ambele 

valori proprii sunt foarte bine condiţionate. Vectorii proprii normaţi ai matricei 

neperturbate sunt 

[ ] 1 

x 1 = , x 

0 2 = 1 [ √ ] [ ] 2 

2 − √ 0.70710 

≈ . 

2 −0.70710 

[ ] 1.01 0.01 

Valorile proprii ale matricei perturbate F = A+ǫG = 

10 −3 , unde ǫ = 

[ ] 

1 

0 0 

= 10 −3 şi G = (cu ‖G‖ = 1), sunt 

1 0 

ˆλ 1 ≈ 1.0109 şi ˆλ 2 ≈ 0.99908, i.e. 

cu perturbări de ordinul de mărime al lui ǫ. În schimb, vectorii proprii normaţi ai 

matricei perturbate sunt 

ˆx 1 = x 1 (10 −3 ) ≈ 

[ 0.995830 

0.091226 

] 

[ 

, ˆx 2 = x 2 (10 −3 ) ≈ 

0.67549 

−0.73737 

Se observă influenţa mult mai puternică a perturbaţiei asupra vectorilor proprii 

decât asupra valorilor proprii. De exemplu, ˆx 2 are un element fără nici o cifră 

zecimală corectă deşi perturbaţia a modificat numai a treia cifră zecimală a unui 

element al matricei iniţiale. Aceasta se datoreşte faptului că vectorul propriu x 2 

este relativ rău condiţionat întrucât κ x2 = 100/ √ 2. 

✸ 

Exprimarea condiţionării vectorilor proprii şi, mai general, evaluarea erorilor în 

calculul vectorilor proprii prin expresii de genul ‖ˆx−x‖ nu este întotdeauna semnificativădatorităfaptului 

căvectoriiproprii,chiarnormaţi, nusuntunicdeterminaţi. 

De exemplu, dacă ˆx = −x, i.e. ˆx este un vectorpropriu exact, avem‖ˆx−x‖ = 2. De 

aceea, este preferabilă aprecierea influenţei perturbaţiilor asupra vectorilor proprii 

prin evaluarea diferenţei unghiulare dintre vectorul exact şi cel perturbat, definită 

prin 

|x Hˆx| 

θ(x,ˆx) = arccos 

‖x‖·‖ˆx‖ = arccos|xHˆx|, (4.352) 

ultima expresie fiind adevărată în cazul utilizării vectorilor normaţi ‖x‖ = ‖ˆx‖ = 1. 

Prin definiţie, unghiul θ(x,ˆx), introdus în relaţia (4.352), este unghiul ascuţit dintre 

direcţiile vectorilor x şi ˆx. 

Această abordare poate fi extinsă la exprimarea condiţionării subspaţiilor invariante. 

Fie două subspaţii U,V ⊂ IC n . Definim diferenţa unghiulară sau unghiul 

ascuţit dintre subspaţiile U şi V prin 

θ(U,V) = max 

u∈U 

u≠0 

] 

. 

minθ(u,v). (4.353) 

v∈V 

v≠0 

Evident, θ(U,V) = θ(V,U). Relaţia de definiţie (4.353) nu permite calculul unghiului 

dintre două subspaţii dar mijloace pentru a face acest lucru există 58 . Fiind dată 

o matrice A şi λ I ⊂ λ(A) un set de valori proprii ale acesteia, prin condiţionarea 

58 Orelaţiecareexprimă unghiuldintre două subspaţiişigeneralizează expresia (4.352)aunghiu-


subspaţiului A-invariant U asociat setului λ I vom înţelege variaţia unghiulară (sau 

o margine superioară a acesteia) a subspaţiului U raportată la nivelul perturbaţiilor 

în elementele matricei A. 

Condiţionarea subspaţiilor invariante este determinată în mod decisiv de localizarea 

valorilor proprii asociate. Este însă posibil ca un subspaţiu generat de 

vectori proprii rău condiţionaţi să aibă o condiţionare foarte bună dacă grupul 

corespunzător de valori proprii este bine separat de restul valorilor proprii. 

Pentru a aborda constructiv această problemă introducem câteva noţiuni noi. 

Vom defini mai întâi separarea dintre spectrele a două matrice A ∈ IC m×m şi B ∈ 

∈ IC n×n . În acest scop, fie aplicaţia liniară L : ICm×n → IC m×n definită de L(X) = 

= AX−XB. Distanţa (sau separarea) dintre spectrelematricelorAşi B se măsoară 

prin scalarul 

sep(A,B) def ‖L(X)‖ F 

= min 

X≠0 ‖X‖ F 

‖AX −XB‖ F 

= min . (4.354) 

X≠0 ‖X‖ F 

Întrucât cadrul propus al lucrării nu ne oferă mijloacele necesare prezentării pe larg 

a proprietăţilor parametruluide separaresep 59 , vom sugerasemnificaţia sa printr-o 

particularizare. Fie B = µ ∈ IC o matrice 1×1 şi A o matrice normală, i.e. unitar 

diagonalizabilă (v. teorema 4.1). Atunci, Q H AQ = Λ = diag(λ 1 ,λ 2 ,...,λ m ) cu Q 

o matrice unitară. Avem 

‖(A−µI n )x‖ F 

sep(A,B) = min 

x≠0 ‖x‖ F 

= min 

‖x‖=1 ‖(A−µI n)x‖ = 

= min 

‖z‖=1 ‖(Λ−µI n)z‖ = min 

i=1:m |λ i −µ|, 

i.e. sep(A,B) este efectiv o distanţă dintre µ şi spectrul matricei A. În acest 

context, dacă B este o matrice de ordinul n şi λ(B) = {µ 1 ,µ 2 ,...,µ n } definim 

distanţa absolută dintre spectrele matricelor A şi B prin 

gap(A,B) def 

= min 

i=1:m 

j=1:n 

lui dintre doi vectori (sau două subspaţii unidimensionale) este 

θ(U,V) = arccosσ min (U H V), 

|λ i −µ j | (4.355) 

unde σ min (·) este valoarea singulară minimă (v. cap. 5) a matricei argument, U este o matrice 

ale cărei coloane formează o bază ortogonală a subspaţiului U şi V este o matrice ale cărei coloane 

formează o bază ortogonală a subspaţiului V. O astfel de abordare permite introducerea conceptului 

de distanţă dintre subspaţii liniare prin dist(U,V) = √ 1−σ 2 min (UH V) = sinθ(U,V), concept 

util unei tratări cantitative a condiţionării subspaţiilor invariante. Pentru detalii recomandăm 

consultarea referinţei [VI]. 

59 O exprimare posibilă a separării matricelor A şi B, care permite calculul ei cel puţin în 

principiu, este 

sep(A,B) = σ min (I n ⊗A−B T ⊗I m), 

unde σ min (·) este valoarea singulară minimă (v. cap. 5) a matricei argument, iar Z = X ⊗Y este 

produsul Kronecker al matricelor X şi Y, i.e. matricea bloc [Z ij ] = [x ij Y].


şi distanţa relativă prin 

gaprel(A,B) def |λ i −µ j | 

= min 

i=1:m |λ i +µ j | . (4.356) 

j=1:n 

Proprietatea evidenţiată în cazul particular de mai sus se generalizează în mod 

naturalşijustificăutilizareaparametruluisep(A,B)camăsurăaseparăriispectrelor 

matricelor A şi B. În cazul general se pot face următoarele afirmaţii: 

• sep(A,B) = 0 dacă şi numai dacă matricele A şi B au cel puţin o valoare 

proprie comună; 

• sep(A,B) este ”mică” dacă şi numai dacă există o perturbare ”mică” a uneia 

dintrematricecarefacecaceledouămatricesăaibecel puţin ovaloareproprie 

comună; 

• dacămatriceleAşiB sunthermitice(încazulreal,simetrice),atuncisepararea 

coincide cu distanţa dintre spectre, i.e. sep(A,B) = gap(A,B); 

• dacă matricele A şi B nu sunt hermitice (în cazul real, simetrice), atunci 

sep(A,B) < gap(A,B) şi chiar poate fi mult inferioară lui gap(A,B); 

În pachetele profesionale de calcul numeric există proceduri de estimare rapidă 60 

a separării spectrelor. 

Revenind la problema condiţionării vectorilor proprii ai unei matrice A ∈ IC n×n 

şi a subspaţiilor sale invariante, precizăm că, la fel ca în cazul valorilor proprii, 

aceasta nu este afectată de transformări unitare de asemănare. Prin urmare, fără 

a reduce generalitatea, putem considera matricea iniţială direct în formă Schur, 

eventual ordonată în mod convenabil. Fie, aşadar, mulţimea de indici I ∈ 1:n şi 

setul λ I ⊂ λ(A) al valorilor proprii de interes. Considerăm matricea 

[ ] 

S = Q H S11 S 

AQ = 12 

∈ IC n×n , cu S 

0 S 11 ∈ IC q×q , λ(S 11 ) = λ I (4.357) 

22 

şi X I = ImQ(:,1 : q) subspaţiul A-invariant asociat setului de valori proprii λ I . 

Vom nota separarea spectrelor matricelor S 11 şi S 22 cu 

sep(S 11 ,S 22 ) not 

= sep I . 

Condiţionarea subspaţiului invariant X I , i.e. variaţia unghiulară a acestuia raportată 

la nivelul perturbaţiilor în matricea iniţială, se poate aprecia prin numărul 

de condiţionare 

def 

κ XI = 1 . (4.358) 

sep I 

60 Variantele rapide se obţin de obicei prin utilizarea unor norme matriceale care se calculează 

mai uşor (cum sunt ‖ · ‖ 1 sau ‖ ·‖ ∞). În acest fel se obţin estimări care diferă de valoarea reală 

printr-un factor cel mult egal cu √ mn, perfect acceptabil în practica numerică.


În particular, dacă I conţine un singur element, i.e. I = {i} numărul 

κ Xi 

def 

= 1 

sep i 

(4.359) 

exprimă condiţionarea vectorului propriu asociat valorii proprii λ i a matricei A. 

Pentru detalii recomandăm consultarea referinţelor bibliografice [IV], [VI], [VIII]. 

4.10.2 Condiţionarea valorilor şi vectorilor proprii 

pentru matrice hermitice 

A. Condiţionarea valorilor proprii 

Desigur, toate dezvoltările privitoare la condiţionarea valorilor proprii pentru matricele 

nehermitice rămân valabile şi pentru matricele hermitice, iar în cazul real, 

pentru matricele simetrice. Pe de altă parte matricele hermitice 61 prezintă numeroase 

particularităţi interesante şi din acest punct de vedere. 

În primul rând, conform teoremei 4.2, o matrice A ∈ IC n×n hermitică este unitar 

diagonalizabilă şi are spectrul real, i.e. există o matrice unitară Q ∈ IC n×n astfel 

încât Q H AQ = Λ = diag(λ 1 ,λ 2 ,...,λ n ) ∈ IR n×n . Rezultă că vectorul propriu 

x i = Q(:,i), de normă euclidiană unitară, satisface simultan relaţia x H i A = λ ix H i , 

i.e. este şi vector propriu la stânga asociat aceleiaşi valori proprii. Rezultă că 

numerele de condiţionare ale valorilor proprii λ i , definite de (4.331), sunt 

κ λi = 1 = 1 

s λi |x H i x = 1, i = 1 : n. (4.360) 

i| 

Prin urmare, valorile proprii ale matricelor hermitice (în cazul real, simetrice) sunt 

perfect condiţionate, variaţiile (absolute) ale valorilor proprii induse de perturbaţii 

în matricea iniţială nedepăşind nivelul acestor perturbaţii. 

[ ] 1.000 0.900 

Exemplul 4.11 Fie matricea simetrică A = ∈ IR 2×2 cu valorile 

proprii exacte λ 1 = 1.9[ şi λ 2 = 0.1. Valorile ] proprii ale matricelor [ simetrice ] 

1.001 0.900 

1.000 0.901 

0.900 1.000 

perturbate F 1 = A+ǫG 1 = , F 

0.900 1.001 2 = A+ǫG 2 = 

[ ] 

0.901 1.000 

1.001 0.900 

şi F 3 = A+ǫG 3 = , unde, de fiecare dată perturbaţiile sunt simetrice, 

ǫ = 10 −3 şi ‖G i ‖ = 1, sunt λ(F 1 ) = {1.901,0.101}, λ(F 2 ) = {1.901,0.101}, 

0.900 1.000 

λ(F 3 ) = {1.9005,0.1005}, în toate cazurile variaţiile absolute ale valorilor proprii 

nedepăşind valoarea lui ǫ. În schimb, variaţiile relative ale valorii proprii mai mici 

sunt de aproximativ 20 de ori (i.e raportul celor două valori proprii) mai mari decât 

variaţiile relative ale valorii proprii mai mari. 

Condiţionarea excelentă a valorilor proprii ale unei matrice simetrice se manifestă 

şi la perturbaţii nesimetrice (deşi nu se mai poate garanta [ că matricele ] perturbate 

au un spectru real). Astfel pentru F 4 = A+ǫG 4 = avem 1.000 0.901 

0.900 1.000 

λ(F 4 ) = {1.9005,0.0995}. 

✸ 

61 Majoritatea rezultatelor sunt adevărate pentru cazul mai general al matricelor normale.


Subliniem, în încheierea acestui paragraf, că alte evaluări utile ale efectelor 

perturbaţiilor în datele iniţiale sunt consecinţe directe ale teoremelor 4.6 şi 4.7. 

B. Condiţionarea vectorilor proprii şi a subspaţiilor invariante 

Deşi valorile proprii ale matricelor hermitice sunt perfect condiţionate nu acelaşi 

lucru se poate spune despre vectorii proprii şi subspaţiile invariante, a căror condiţionare 

este dependentă, la fel ca în cazul general, de separarea seturilor de valori 

proprii cărora le sunt asociate de restul spectrului matricei date. Singura particularitate, 

menţionată deja într-unul din paragrafele precedente, constă în faptul că 

parametrii de separare sep i , respectiv sep I , definite în (4.354), coincid cu distanţele 

dintre spectre gap i , respectivgap I , definite în (4.355)şi, în consecinţă, se calculează 

mult mai uşor. 

4.11 Stabilitatea numerică a algoritmului QR 

O problemă de calcul numeric rău condiţionată nu poate fi rezolvată bine într-un 

mediu de calcul aproximativ. În schimb, o problemă bine condiţionată poate fi 

rezolvată prost dacă nu se utilizează un algoritm corespunzător. Contribuţia unor 

algoritmi concreţi de calcul la nivelul erorilor din rezultate, un atribut esenţial al 

calităţii lor, este apreciată cu ajutorul conceptului de stabilitate numerică şi se face 

curent prin evaluarea acestei contribuţii în ”echivalent erori în datele iniţiale” (vezi 

cap. 0). În acest sens, amintim că un algoritm este considerat numeric stabil dacă 

rezultatele oferite de execuţia sa sunt rezultate exacte ale problemei cu date iniţiale 

ce diferăde datele realela nivelulerorilorde reprezentare,eventualmultiplicate cu o 

funcţie de dimensiunea problemei având o ”creştere modestă”. Garanţia ţinerii sub 

control a erorilor de calcul se poate da numai pentru probleme bine condiţionate, 

cu restricţia utilizării unor algoritmi numeric stabili. 

Pentru probleme de calcul netriviale, cum este calculul valorilor şi vectorilor 

proprii, analiza erorilorintroduse de calculul în virgulă mobilă este o sarcinăextrem 

de dificilă. Mai mult, stabilirea unor margini cât mai exacte ale erorilor (reduse la 

nivelul datelor iniţiale) nici nu are o relevanţă majoră. Aşa cum reiese dintr-o 

experienţă ce poate fi considerată semnificativă, un obiectiv mai important al analizei 

numerice îl constituie sesizarea unor situaţii de instabilitate numerică, situaţii 

în care utilizarea algoritmului respectiv trebuie interzisă. De aceea, în continuare 

ne propunem să prezentăm, fără demonstraţii sau justificări matematice profunde, 

rezultatele existente în literatura de specialitate referitoare la stabilitatea numerică 

a algoritmilor prezentaţi în acest capitol şi, în primul rând, a algoritmului QR. 

Rezultatul principal constă în faptul că algoritmul QR de calcul al valorilor şi 

vectorilor proprii ai unei matrice n×n reale sau complexe A este numeric stabil şi 

acest fapt se datorează esenţial utilizării exclusive a transformărilor unitare 62 (în 

cazul real, ortogonale). Concret, forma Schur (în cazul real, reală sau complexă) 

calculată Ŝ este o formă Schur exactă a unei matrice Â = A+E foarte apropiate 

62 Procedura de echilibrare, singura care nu utilizează transformări unitare, a fost astfel concepută 

încât toate calculele sunt exacte, deci nu apar probleme de stabilitate.

4.11. STABILITATE NUMERICĂ 357 

de matricea iniţială, i.e. 

Ŝ = Q H (A+E)Q, (4.361) 

unde Q este o matrice unitară şi E o matrice a erorilorraportatela datele de intrare 

ale algoritmului satisfăcând condiţia 

‖E‖ ≤ p(n)‖A‖ε M , (4.362) 

cu p(n) o funcţie de ordinul matricei, cu o creştere modestă 63 . 

Dacă se acumulează transformările, atunci matricea de transformare calculată 

ˆQ este aproape unitară în sensul că 

ˆQ H ˆQ = In +E, cu ‖E‖ ≤ p(n)‖A‖ε M . (4.363) 

Prin urmare, valorile proprii calculate cu algoritmul QR, ca şi vectorii proprii 

calculaţi sau subspaţiile invariante calculate sunt valori proprii exacte, vectori 

proprii exacţi sau subspaţii invariante exacte ale unor matrice foarte apropiate 

de matricea dată. Această înseamnă că nivelul erorilor în rezultate va fi redus 

dacă problema concretă respectivă este bine condiţionată, respectiv poate fi important 

în cazul unei condiţionări necorespunzătoare. Aşa cum s-a menţionat, pentru 

aprecierea erorilor din rezultate, pachetele profesionale de programe permit estimarea 

numerelor de condiţionare şi, pe această bază estimarea erorilor conform 

celor arătate în secţiunea precedentă. Considerăm util să prezentăm în finalul acestei 

secţiuni astfel de estimări ale erorilor de calcul al valorilor proprii, vectorilor 

proprii şi subspaţiilor invariante cu algoritmii propuşi în capitolul de faţă. Vom 

utiliza notaţia consacrată cu accentˆpentru valorile calculate. 

Matrice generale (nehermitice) 

• Valori proprii: 

• Vectori proprii: 

• Subspaţii invariante: 

|ˆλ i −λ i | ≤ κ λi p(n)‖A‖ε M . (4.364) 

θ(ˆx i ,x i ) ≤ p(n)‖A‖ Fε M 

sep i 

. (4.365) 

θ(ŜI,S I ) ≤ p(n)‖A‖ Fε M 

sep I 

. (4.366) 

Matrice hermitice (în cazul real, simetrice) 

• Valori proprii: 

|ˆλ i −λ i | ≤ κ λi p(n)‖A‖ε M . (4.367) 

63 Practic pentru toţi algoritmii prezentaţi în acest capitol, p(n) este o funcţie polinomială de un 

grad ”modest” (1, 2 sau, foarte rar, 3) de parametri ce definesc dimensiunea problemei. Expresiile 

existente, la un moment istoric dat, pentru p(n) sunt, în general, evaluări pesimiste şi cunoaşterea 

exactă a acestor expresii este lipsită de semnificaţie pentru practica numerică. În [XV] se afirmă 

că o apreciere de genul p(n) < 10n este adevărată în majoritatea situaţiilor practice pentru care 

se foloseşte formula de evaluare ”funcţie cu o creştere modestă”.


• Vectori proprii: 

• Subspaţii invariante: 

θ(ˆx i ,x i ) ≤ p(n)‖A‖ Fε M 

gap i 

. (4.368) 

θ(ŜI,S I ) ≤ p(n)‖A‖ Fε M 

gap I 

. (4.369) 

Pentru detalii recomandăm consultarea referinţelor bibliografice [XI], [XII], [XV]. 

4.12 Rutine LAPACK şi MATLAB 

LAPACK. Calculul valorilor şi vectorilor proprii ai unei matrice A este efectuat 

în LAPACK de câteva rutine driver, diferenţiate de tipul matricei (generală sau 

simetrică) şi de gradul de detaliere a rezultatelor. 

Pentru matrice generale există două categorii de rutine driver. 

1. Rutina xGEES calculează forma Schur a matricei A şi eventual vectorii Schur, 

folosindalgoritmulQR. FormaSchurpoate fi ordonată, însensul căosubmulţime 

a valorilor proprii, aleasă de utilizator, se va afla în colţul stânga-sus al 

formei Schur (ca în schema FSC ORD p ). 

Driverul expert xGEESX calculează în plus numerele de condiţie ale valorilor 


2. Rutina xGEEV calculează valorile şi eventual vectorii proprii ai matricei A. 

Rutina expert xGEEVX poate efectua suplimentar şi scalarea matricei (ca în 

algoritmii din secţiunea 4.7) sau calcula numerele de condiţie ale valorilor 


Pentru matricele simetrice, driverul simplu xyyEV (unde yy este SY, HE, SP, HP, 

SB, HB, ST; ultima notaţie este pentru matrice simetrice tridiagonale) calculează 

valorile şi, eventual, vectorii proprii, utilizând algoritmul QR simetric. 

Rutina expert xyyEVX poate calcula şi toate sau numai o submulţime a valorilor 

proprii şi, opţional, vectorii proprii corespunzători. 

Rutinele de calcul sunt mult mai numeroase, de aceea ne vom mărgini la 

prezentarea celor mai importante. 

Pentru matrice generale, diversele faze ale calculului sunt implementate astfel: 

• xGEHRD realizează reducerea unei matrice oarecare A la forma Hessenberg 

H prin transformări de asemănare ortogonale (ca în algoritmul HQc din 

secţiunea 4.4.1). 

• xHSEQR implementează faza iterativă a algoritmului QR, transformând H în 

forma Schur, cu acumularea opţională a transformărilor (şi deci obţinerea 

vectorilor Schur).

4.12. RUTINE LAPACK ŞI MATLAB 359 

• vectoriipropriiaimatriceiAsuntcalculaţifiecurutinaxTREVC,careutilizează 

forma Schur (problema este deci de a calcula vectorii proprii ai unei matrice 

(cvasi-)triunghiulare), fie cu rutina xHSEIN, care utilizează forma Hessenberg 

şimetodaputeriiinverse,foarteeficientăcândvalorilepropriisuntdisponibile, 

dar care funcţionează şi fără ca acestea să fi fost calculate. 

Alte rutine utile sunt următoarele: 

• xGEBALrealizeazăscalarea(echilibrarea)matriceiA; seutilizeazăînconjuncţie 

cu rutina complementarăxGEBAK,care reface vectorii proprii ai matricei A din 

cei ai matricei scalate (evident, valorile proprii sunt identice). 

• xTRSEN ordonează forma Schur prin aducerea în colţul stânga-sus a unei 

submulţimi de valori proprii descrise de utilizator. 

• xTREXC aduce o singură valoare proprie în poziţia dorită (această rutină trebuie 

apelată repetat pentru a realiza o permutare completă, ca în algoritmul 

FSR ORD). 

• xTRSYL rezolvă ecuaţia Sylvester cvasi-triunghiulară. 

• xTRSNA calculează numerele de condiţie ale valorilor proprii. 

Pentru matrice simetrice, etapele de calcul sunt implementate de 

• xyyTRDefectuează reducerea unei matrice simetrice (hermitice) la formă tridiagonală 

reală, prin transformări de asemănare ortogonale. 

• xSTEQR calculează valorile şi, opţional, vectorii proprii ai unei matrice tridiagonale, 

implementând faza iterativă a algoritmului QR simetric. Există încă 

alte câtevarutine cu aceeaşifuncţionalitate, darutilizând algoritmidiferiţi; de 

exemplu xSTEBZ implementează metoda bisecţiei (vezi algoritmul BISECT). 

• xSTEIN calculează vectorii proprii (eventual numai unii dintre aceştia) ai unei 

matrice tridiagonale, utilizând metoda puterii inverse. 

MATLAB. Valorile şi vectorii proprii ai unei matrice generale A pot fi calculate 

cu 

[V, D] = eig(A) 

V fiind matricea vectorilor proprii (posibil complecşi), iar D o matrice diagonală 

conţinând valorile proprii. Apelul simplu eig(A) returnează un vector conţinând 

valorile proprii. Funcţia eig implementează algoritmul QR. 

Reducerea la formă Hessenberg a matricei A se face cu funcţia hess, care acumulează 

opţional transformările. 

Forma Schur a matricei A şi, opţional, vectorii Schur, se obţin cu funcţia schur. 

Echilibrarea matricei A se realizează cu funcţia balance.


O funcţie pentru ordonarea formei Schur se găseşte în Control Toolbox 64 . 

Aceasta se numeşte schord şi implementează algoritmul FSC ORD, adică permută 

complet forma Schur. Funcţia utilizează numai forma Schur complexă, adică 

o matrice superior triunghiulară. În cazul real, trebuie apelate funcţiile rsf2csf şi 

csf2rsf pentru transformarea ortogonală a unei forme Schur reale într-una complexă 

(înainte de ordonare) şi invers (după aceea). 

Nu există nici o funcţie specială pentru matrice simetrice. 

4.13 Probleme 

P 4.1 Se consideră date matricele 

[ 

3 −3 2 

A = −1 5 −2 

−1 3 0 

] 

, B = 

[ −4 0 8 

−8 3 9 

−4 −1 9 

] 

. 

Folosind definiţiile, calculaţi valorile proprii ale celor douămatrice şi câte unvector propriu 

asociat fiecărei valori proprii. Sunt cele două matrice diagonalizabile Verificaţi. 

P 4.2 În cadrul capitolului, cazul real a fost tratat adesea ca un caz particular al cazului 

complex. În acest context, este IR n un subspaţiu liniar al spaţiului IC n Justificaţi 

răspunsul. 

[ ] 

A 0 

P 4.3 Fie matricele A ∈ IC m×m , B ∈ IC n×n şi matricea C = , suma directă a 

0 B 

matricelor A şi B. Demonstraţi că C este diagonalizabilă dacă şi numai dacă A şi B sunt 

diagonalizabile. 

P 4.4 [ Se consideră ] o matrice A ∈ IR n×n având structura bloc superior triunghiulară 

A1 A 12 

A = . Dacă matricele A 1 şi A 2 sunt diagonalizabile, este diagonalizabilă şi 

0 A 2 

matricea A Argumentaţi răspunsul. 

P 4.5 Fie matricele A ∈ IC m×n , B ∈ IC n×m . Demonstraţi că λ(AB) ⊆ λ(BA) dacă m ≤ n 

şi λ(BA) ⊆ λ(AB) dacă m ≥ n. În cazul, m ≠ n, care dintre valorile proprii ale matricei 

de ordin mai mare (dintre matricele AB şi BA) nu sunt valori proprii ale matricei de ordin 

mai mic 

P 4.6 Perechea de matrice (A,B) ∈ IC n×n ×IC n×n se numeşte diagonalizabilă (sau, echivalent, 

matricele Aşi B se numescsimultan diagonalizabile) dacăexistăomatrice nesingulară 

X ∈ IC n×n astfel încât X −1 (A,B)X def 

= (X −1 AX,X −1 BX) = (Λ A,Λ B), cu Λ A, Λ B diagonale. 

Demonstraţi: a) Dacă A este diagonalizabilă, atunci perechea (A,µI n) este 

diagonalizabilă pentru toţi µ ∈ IC. b) Dacă (A,B) este diagonalizabilă, atunci matricele 

A şi B comută. c) Presupunem că matricele A şi B sunt diagonalizabile. Atunci A şi B 

comută dacă şi numai dacă perechea (A,B) este diagonalizabilă. d) Daţi un exemplu de 

două matrice care comută şi care nu sunt simultan diagonalizabile. 

P 4.7 Dacă matricele A,B ∈ IC n×n comută, atunci au un vector propriu comun. 

64 Colecţiile de funcţii MATLAB dedicate unor domenii specializate şi nefăcând parte din setul 

de bază al limbajului poartă numele consacrat de toolbox.

4.13. PROBLEME 361 

P 4.8 Fie λ 1, λ 2 două valori proprii distincte ale unei matrice A ∈ IC n×n şi x 1 un vector 

propriu la dreapta asociat lui λ 1, iar y 2 un vector propriu la stânga asociat lui λ 2. Arătaţi 

că cei doi vectori sunt ortogonali, i.e. y H 2 x 1 = 0. 

P 4.9 Dacăλ ∈ λ(A), este ovaloare propriesimplă aunei matrice A ∈ IC n×n şi x, respectiv 

y, sunt vectori proprii la dreapta, respectiv la stânga, asociaţi lui λ, atunci y H x ≠ 0. Daţi 

un exemplu în care această condiţie nu este satisfăcută dacă λ nu este o valoare proprie 

simplă. 

P 4.10 Se consideră o matrice A ∈ IC n×n diagonalizabilă. Arătaţi că există vectorii 

proprii (la dreapta) x i, i = 1 : n, şi vectorii proprii la stânga y i, i = 1 : n, astfel încât 

A = ∑ n 

i=1 λixiyH i . 

P 4.11 Să se demostreze lema 4.4. 

P 4.12 Fie date o matrice A ∈ IC n×n şi un polinom p(λ) = λ n +p 1λ n−1 +...+p n−1λ+p n. 

Considerăm matricea 

P def 

= p(A) = A n +p 1A n−1 +...+p n−1A+p nI n. 

Să se arate că dacă λ i ∈ λ(A), atunci p(λ i) ∈ λ(P) şi dacă x i este un vector propriu al 

matricei A, asociat valorii proprii λ i, atunci el este şi vector propriu al matricei P asociat 

valorii proprii p(λ i). 

P 4.13 Fie date o matrice A ∈ IC n×n şi o funcţie raţională r(λ) = p(λ) . Definim matricele 

q(λ) 

P def 

= p(A), Q def 

= q(A) şi, dacă Q este nesingulară, R def 

= Q −1 P. Arătaţi că dacă λ i ∈ λ(A) 

şi x i este un vector propriu al matricei A asociat valorii proprii λ i, atunci r(λ i) ∈ λ(R), 

iar x i este şi vector propriu al matricei R asociat valorii proprii r(λ i). 

P 4.14 Fie omatricenesingulară A ∈ IC n×n . Dacă‖·‖este onormămatriceală consistentă, 

arătaţi că numărul de condiţionare la inversare κ(A) def 

= ‖A‖·‖A −1 ‖ satisface inegalitatea 

κ(A) ≥ max(|λi(A)|) 

min(|λ i(A)|) . 

P 4.15 a) O matrice patrată A se numeşte nilpotentă dacă există un număr natural k 

astfel încât A k = 0. Arătaţi că o matrice nilpotentă are toate valorile proprii nule. Daţi un 

exemplu de matrice nilpotentă nenulă. b) O matrice A ∈ IC n×n se numeşte idempotentă 

dacă A 2 = A. Arătaţi că o matrice idempotentă nu poate avea alte valori proprii în afară 

de 0 şi 1. Daţi un exemplu de matrice idempotentă nenulă şi diferită de matricea unitate. 

P 4.16 a) Câţi vectori proprii (la dreapta) liniar independenţi poate avea o celulă Jordan 

⎡ ⎤ 

λ 1 

λ 1 

J λ = ⎢ 

⎣ . 

⎥ .. 1 

⎦ 

de ordinul n Dar la stânga b) Arătaţi că o celulă Jordan 

λ 

de ordin n ≥ 2 nu poate fi diagonalizată prin transformări de asemănare. c) Calculaţi 

expresia analitică a matricei Jλ k unde J λ este o celulă Jordan de ordin n cu elementele 

diagonale egale cu λ. Există k ∈ IN ∗ astfel încât Jλ k să fie diagonalizabilă d) Calculaţi 

expresia analitică a matricei J −1 

λ 

, unde λ ≠ 0. Este J−1 

λ 

diagonalizabilă


P 4.17 Ce rang (i.e. numărul maxim de linii sau coloane liniar independente)poate avea o 

matrice superior Hessenberg H ∈ IC n×n ireductibilă (i.e. cu toate elementele subdiagonale 

nenule) Se poate diagonaliza o matrice superior Hessenberg ireductibilă cu valori proprii 

multiple Justificaţi răspunsul. 

P 4.18 Fie o matrice A ∈ IC n×n de forma 

⎡ 

−p 1 −p 2 ··· −p n−1 −p n 

1 0 ··· 0 0 

C = 

0 1 ··· 0 0 

⎢ 

⎣ 

. 

. 

. .. 

. .. 

. .. 

0 0 ··· 1 0 

⎤ 

⎥. 

⎦ 

a) Să se arate că polinomul caracteristic al matricei A este 

p(λ) = λ n +p 1λ n−1 +...+p n−1λ+p n. 

b) Să se arate că matricea C este nesingulară dacă şi numai dacă p n ≠ 0 şi în această 

situaţie să se calculeze matricea C −1 . Care este polinomul caracteristic al matricei C −1 

c) Presupunând că rădăcinile λ i, i = 1 : n, ale polinomului p(λ), sunt cunoscute, să se 

calculeze câte un set de vectori proprii pentru matricele C şi C T . d) Matricile C şi C T 

poartă numele de matrice companion ale polinomului p(λ). Puteţi preciza şi alte matrice 

care să justifice această denumire 

P 4.19 a) Calculaţi valorile şi vectorii proprii pentru o matrice de rotaţie. b) Calculaţi 

valorile şi vectorii proprii pentru un reflector elementar. 

P 4.20 Demonstraţi că o matrice normală triunghiulară este diagonală. În particular, o 

matrice hermitică (simetrică) sau unitară (ortogonală) triunghiulară este diagonală. 

P 4.21 Arătaţi că o matrice [ A ∈] 

IR 2×2 este normală dacă şi numai dacă este simetrică 

α β 

sau are structura A = . 

−β α 

P 4.22 Demonstraţi următorul rezultat important. O matrice reală A ∈ IR n×n este 

normală dacă şi numai dacă este ortogonal cvasi-diagonalizabilă, i.e. există o matrice ortogonală 

Q ∈ IR n×n astfel încât Q T AQ = diag(A 1,A 2,...,A p), unde A i sunt [ blocuri reale ] 

α i β i 

1×1 sau 2×2, cu blocurile 2×2 cu valori proprii complexe de forma A i = . 

−β i α i 

P 4.23 Se consideră o matrice arbitrară A ∈ IC n×n . Demonstraţi următoarele aserţiuni. 

a) Matricile F = A H +A, G = A H A, H = AA H sunt hermitice. b) Matricea K = A−A H 

este antihermitică. c) Matricea A poate fi descompusă, în mod unic, în suma A = B+C, 

unde B este hermitică (numită partea hermitică a lui A), iar C este antihermitică (numită 

partea antihermitică a lui A). d) Matricea A poate fi descompusă, în mod unic, în suma 

A = S +iT, unde S şi T sunt matrice hermitice. 

P 4.24 Fie A,B ∈ IC n×n două matrice hermitice şi C,D ∈ IC n×n două matrice antihermitice. 

Demonstraţi următoarele aserţiuni. a) Matricile F = αA + βB, cu α,β ∈ IR, 

G = A k , cu k ∈ IN ∗ , K = C 2k , şi, dacă A este nesingulară, L = A −1 sunt matrice hermitice. 

b) Matricile M = αC +βD, cu α,β ∈ IR, N = C 2k+1 şi, dacă C este nesingulară, 

P = C −1 sunt matrice antihermitice.


P 4.25 Demonstraţi că o matrice A ∈ IC n×n este normală dacă şi numai dacă partea sa 

hermitică (vezi problema 4.23) comută cu partea sa antihermitică. 

P 4.26 Arătaţi că o matrice A ∈ IC n×n este normală dacă şi numai dacă ‖Ax‖ 2 = ‖A H x‖ 2 

pentru toţi x ∈ IC n . 

P 4.27 Fie A ∈ IC n×n şi mulţimea de indici I = {i 1,i 2,...,i k }, cu i 1 

i j ∈ 1 : n. Matricea B = A(I,I) se numeşte submatrice principală a lui A. a) Dacă 

matricea A este hermitică (antihermitică), atunci şi B este hermitică (antihermitică). 

b) Dacă matricea A este normală, fără a fi hermitică sau antihermitică, este B normală 

P 4.28 Fie A ∈ IC n×n o matrice hermitică şi x ∈ IC n un vector nenul, arbitrar, fixat. 

Notăm µ = xH Ax 

câtul Rayleigh asociat lui x. Arătaţi că fiecare din intervalele (−∞,µ] 

x H x 

şi [µ,∞) conţin cel puţin o valoare proprie a matricei A. 

P 4.29 Fie o matrice hermitică A ∈ IC n×n . Se numeşte p-secţiune a lui A o matrice 

(hermitică) B = Q H AQ ∈ IC p×p , unde Q ∈ IC n×p este o matrice având coloanele ortogonale 

(i.e. satisface condiţia Q H Q = I p). Arătaţi că dacă spectrele λ(A) = {λ 1,λ 2,...,λ n} şi 

λ(B) = {µ 1,µ 2,...,µ p} sunt ordonate descrescător, atunci λ k ≥ µ k , k = 1 : p, precum şi 

µ p−k+1 ≥ λ n−k+1 , k = 1 : p. 

P 4.30 Fie A ∈ IC n×n o matrice hermitică. Arătaţi că A are o valoare proprie situată în 

intervalul [a 11 −µ,a 11 +µ], unde µ = ‖A(1,2:n)‖ 2. 

P 4.31 Daţi două exemple de matrice simetrice complexe, din care una să fie normală 

şi cealalta nu. Reţineţi din această situaţie că există o diferenţă esenţială între matricele 

simetrice reale şi matricele simetrice complexe 65 . 

P 4.32 Fie A ∈ IC n×n . Arătaţi că pentru orice scalar ǫ > 0 există o normă matriceală 

consistentă ‖·‖ (posibil dependentă de A şi ǫ) pe IC n×n astfel încât 

unde ρ(A) este raza spectrală a matricei A. 

‖A‖ ≤ ρ(A)+ǫ, 

P 4.33 O matrice A ∈ IC n×n se numeşte convergentă dacă lim k→∞ A k = 0. Demonstraţi 

că o matrice este convergentă dacă şi numai dacă ρ(A) < 1. 

P 4.34 Să se determine localizări pentru valorile proprii ale matricelor 

[ ] [ ] 

3 −2 1 0 1 −2 

A = 2 −4 0 , B = −1 4 1 , C = A+iB, 

−1 1 5 1 1 3 

utilizând teorema discurilor lui Gershgorin. 

P 4.35 Utilizând teorema discurilor lui Gershgorin, stabiliţi o margine superioară pentru 

raza spectrală a unei matrice. Comparaţi acest rezultat cu cel oferit de teorema 4.10. 

P 4.36 a) Fie A ∈ IR n×n şi omatrice diagonală de scalare D = diag(δ 1,δ 2,...,δ n), δ i > 0, 

i = 1 : n. Stabiliţi localizarea spectrului matricei A aplicând teorema discurilor Gershgorin 

matricei scalate B = D −1 AD. Poate scalarea să conducă la o localizare mai bună 

65 Pentru proprietăţile matricelor simetrice complexe se poate consulta [II].


b) Fie A ∈ IR 2×2 o matrice cu toate elementele pozitive. Să se determine matricea ˜D = 

= diag(˜δ 1,˜δ 2) astfel încât ‖˜D −1 A˜D‖ ∞ = min δ1 ,δ 2 ∈IR + 

‖D −1 AD‖ ∞, unde D = diag(δ 1,δ 2). 

Ce relaţie există între acest minim şi raza spectrală a matricei A Renunţând [ la condiţia ] 

2 2 

ca elementele matricei A să fie pozitive, arătaţi că pentru matricea A = avem 

−3 4 

ρ(A) < min δ1 ,δ 2 ∈IR + 

‖D −1 AD‖ ∞. 

[ ] −5 −8 8 

P 4.37 Se consideră matricea simetrică A = −8 7 −16 . Folosind teorema 

8 −16 7 

discurilor lui Gershgorin să se extragă maximum de informaţie privind localizarea valorilor 

proprii ale matricei A. Puteţi îmbunătăţi localizarea prin scalare 

P 4.38 Se spune că o matrice A ∈ IC n×n este (strict) diagonal dominantă dacă |a ii| ≥ r i 

(|a ii| > r i) pentru toţi i ∈ 1 : n, unde r i = ∑ n 

|a ij| sunt razele discurilor Gershgorin. 

a) Demonstraţi că omatrice strict diagonal dominantăeste nesingulară. b) Dacăomatrice 

strict diagonal dominantă are elementele diagonale reale şi pozitive atunci Reλ i(A) > 0 

pentru toţi i. c) Dacă A ∈ IC n×n strict diagonal dominantă este hermitică şi a ii > 0, 

i = 1 : n, atunci λ i(A) > 0 pentru toţi i. 

P 4.39 Demonstraţi inegalităţile 

a) |detA| ≤ 

n∏ 

i=1( n∑ 

j=1 

|a ij| 

) 

j=1 

j≠i 

, b) |detA| ≤ 

n∏ 

j=1( n∑ 

i=1 

|a ij| 

) 

. 

P 4.40 (Teorema lui Ostrovski) Fie A ∈ IC n×n . Notăm cu r i = ∑ n 

c i = ∑ n 

i=1 

i≠j 

j=1 

j≠i 

|a ij| şi, respectiv, 

|a ij|, razele discurilor Gershgorin pentru matricele A şi, respectiv, A T . De 

asemenea, fie α ∈ [0,1] fixat. Atunci λ(A) ⊆ D, unde D este reuniunea discurilor 

D = 

n⋃ 

D i, 

i=1 

D i = { } 

z ∈ IC | |z −a ii| ≤ ri α c 1−α 

i . 

P 4.41 (Teorema lui Brauer) Fie A ∈ IC n×n . Atunci λ(A) ⊆ D, unde D este reuniunea 

celor 1 (n−1)n ovaluri Cassini definite de 

2 

D = 

n⋃ 

i,j=1 

i≠j 

O i, 

O i = {z ∈ IC | |z −a ii||z −a jj| ≤ r ir j}, 

unde r i = ∑ n 

j=1 

j≠i 

|a ij|, i = 1 : n, sunt razele discurilor Gershgorin. 

P 4.42 Calculaţi forme Schur pentru matricele A = 

[ 

1 −2 

2 −3 

] 

, B = 

[ 

1 1 

−1 1 

C = A + iB. În cazul matricelor reale determinaţi atât formele Schur reale cât şi cele 

complexe. 

] 

,


P 4.43 Fie matricea A ∈ IC n×n şi U ∈ IC n×k o matrice cu coloanele ortogonale (i.e. 

U H U = I k ). Dacă funcţia f : IC k×k → IR + este definită de f(X) = ‖AU −UX‖ F, arătaţi 

că f admite un minim care se atinge pentru X = U H AU. Care este valoarea acestui 

minim 

P 4.44 Presupunem că matricea A ∈ IC n×n are valorile proprii distincte şi că B ∈ IC n×n 

comută cu A, i.e. AB = BA. Arătaţi că dacă Q H AQ = S este descompunerea Schur a lui 

A, atunci T = Q H BQ este superior triunghiulară. 

P 4.45 a) Dat un vector nenul x ∈ IC n , elaboraţi un algoritm de calcul al unui vector 

v ∈ IC n astfel încât v H x = 1. b) Presupunem că matricea A ∈ IC n×n are valorile proprii 

λ i, i = 1 : n, iar x i, i = 1 : n, sunt vectori proprii asociaţi. Fie un vector v ∈ IC n astfel 

încât v H x 1 = 1 şi matricea B = (I n − x 1v H )A. Arătaţi că λ(B) = {0,λ 2,...,λ n}, iar 

vectorii x B 1 = x 1, x B i = x i −(v H 1 x i)x 1 formează un set de vectori proprii ai matricei B. 

P 4.46 a) Fie doi vectori nenuli x,y ∈ IC n astfel încât y H x = 1. Demonstraţi existenţa 

şi stabiliţi un mod de calcul al matricelor X,Y ∈ IC n×n care satisfac condiţiile Xe 1 = x, 

Ye 1 = y şi Y H X = I n. b) Fie A ∈ IC n×n , λ o valoare proprie simplă a lui A şi x,y vectorii 

proprii la dreapta, respectiv la stânga, ai lui A asociaţi lui λ. Demonstraţi existenţa şi 

stabiliţi un mod [ de calcul ] al matricei X ∈ IC n×n care realizează o deflaţie diagonală, i.e. 

λ 0 

X −1 AX = . c) Presupunând că dispuneţi de o procedură de calcul al unui 

0 B 

vector propriu al unei matrice date, având sintaxa x = vp(A), elaboraţi un algoritm de 

diagonalizare a unei matrice A ∈ IC n×n simple. 

P 4.47 a) Care va fi rezultatul aplicării metodei puterii matricei A = 

[ ] 5 8 1 

0 1 2 

0 0 2 

b) Discutaţi, în raport cu parametrii reali α şi β, rezultatul aplicării metodei puterii 

[ ] α 1 1 

matricei B = 0 1 β 

0 1 1 

. 

P 4.48 Presupunem căîn locul condiţiei de terminare a iterării din algoritmii 4.1 şi 4.2, de 

implementare a metodei puterii şi, respectiv, a metodei puterii inverse, utilizaţi condiţia 

ca norma diferenţei dintre vectorii calculaţi la doi paşi consecutivi să devină inferioară 

unei toleranţe impuse, i.e. 

e k = ‖y (k) −y (k−1) ‖ < tol. 

Scrieţi, în limbajul de programare preferat, programe pentru implementarea algoritmilor 

menţionaţi şi testaţi-le pe mai multe exemple. Puteţi explica de ce o astfel de condiţie de 

trunchiere nu funcţionează întodeauna pentru şirurile de vectori a căror direcţie converge, 

totuşi, către o direcţie proprie Consideraţi atât cazul real cât şi cel complex. 

P 4.49 Presupunând că dispuneţi de o procedură de calcul al unui vector propriu al unei 

matrice A ∈ IC n×n date, procedură având sintaxa x = vp(A), elaboraţi un algoritm de 

calcul al unei formei Schur a matricei A. Ce relaţie există între vectorii proprii utilizaţi 

pentru calculul formei Schur şi cei ai matricei A 

P 4.50 Elaboraţi un algoritm pentru reducerea unei matrice A ∈ IR n×n la forma superior 

Hessenberg H = TAT −1 , unde T este o secvenţă de transformări elementare stabilizate 

M iP i, i = 2 : n−1 (de tipul celor utilizate, de exemplu, la eliminarea gaussiană).


P 4.51 Presupunem A ∈ IC n×n şi z ∈ IC n date. Elaboraţi un algoritm pentru calculul unei 

matrice unitare (în cazul real, ortogonale) Q astfel încât Q H AQ este superior Hessenberg 

şi Q H z este coliniar cu vectorul e 1. 

P 4.52 Fie H ∈ IR n×n o matrice superior Hessenberg. Scrieţi un algoritm care să testeze 

dacă H este în formă Schur reală. 

P 4.53 Elaboraţi un algoritm pentru calculul valorilor şi vectorilor proprii ai matricei 

A = I n +uv H , unde u,v ∈ IC n sunt vectori nenuli daţi. 

P 4.54 Se consideră dată o pereche (valoare proprie, vector propriu asociat)= (λ,x) reală 

a unei matrice H ∈ IR n×n superior Hessenberg. Elaboraţi un algoritm de calcul [ al unei ] 

λ f 

matrice ortogonale Q astfel încât matricea Q T HQsa aibă structuraQ T T 

HQ = , 

0 G 

unde matricea G ∈ IR (n−1)×(n−1) este în formă superior Hessenberg. 

P 4.55 Fie matricea superior Hessenberg H ∈ IR n×n şi următoarea procedură recurentă 

de calcul al matricei succesor H ← H ′ : 

1. Se aplică matricei H procedura de triangularizare prin eliminare gaussiană cu pivotare 

parţială M n−1P n−1...M 1P 1H = R, unde P k sunt matrice de permutare 

elementare, M k matrice inferior triunghiulare elementare, iar R este o matrice superior 

triunghiulară. 

2. H ← H ′ = RP 1M −1 

1 ...P n−11M −1 

n−1 , 

care defineşte o iteraţie a algoritmului LR modificat (un precursor al algoritmului QR). 

Arătaţi că matricea succesor H ′ a) are o structură superior Hessenberg şi b) este asemenea 

cu matricea H. 

P 4.56 Se consideră matricea bloc superior triunghiulară 

A = 

[ 

A11 A 12 A 13 

] 

0 A 22 A 23 , 

0 0 A 33 

cu A 22 ∈ IR 2×2 având valori proprii complexe şi distincte de valorile proprii ale matricelor 

A 11 şi A 33. Se cere să se calculeze un subspaţiu A-invariant real asociat valorilor proprii 

ale matricei A 22, i.e. vectorii liniar independenţi x 1,x 2 ∈ IR n care să formeze o bază a 

acestui subspaţiu. 

P 4.57 Calculaţi valorile şi vectorii proprii pentru matricele simetrice A, B şi pentru 

matricea hermitică C, unde 

A = 

[ 

1 2 

2 3 

] 

, B = 

[ 1 2 3 

2 4 5 

3 5 6 

Verificaţi că vectorii proprii sunt ortogonali. 

] 

, C = 

[ 

1 1+i −i 

1−i 2 −1−i 

i −1+i 3 

P 4.58 Fie o matrice hermitică A = A H ∈ IC n×n . Adaptaţi algoritmul TQ pentru 

tridiagonalizarea unitară a matricei A astfel încât matricea T = Q H AQ să fie tridiagonală, 

simetrică şi reală. 

] 

.


P 4.59 Adaptaţi algoritmul TQ pentru tridiagonalizarea prin transformări unitare (ortogonale) 

de asemănare a unei matrice antihermitice (antisimetrice) A ∈ IC n×n (A ∈ IR n×n ). 

[ ] 

P 4.60 a) Se consideră matricea H ∈ IR 2×2 not α γ 

cu valori proprii reale şi fie H k = 

ǫ β 

matricea curentă a şirului QR al matricii H. Utilizând deplasarea µ k = β calculaţi 

matricea succesor H k+1 . Ce se poate spune despre convergenţa şirului QR din examinarea 

expresiei elementului H k+1 (2,1) 

[ ] 

b) Se consideră matricea simetrică T ∈ IR 2×2 not α ǫ şi fie T k = matricea curentă a 

ǫ β 

şirului QR simetric al matricii T. Utilizând deplasarea µ k = β calculaţi matricea succesor 

T k+1 . Ce se poate spune despre convergenţa şirului QR simetric din examinarea expresiei 

elementelor extradiagonale T k+1 (1,2) = T k+1 (2,1) 

[ ] 

0 d 

P 4.61 a) Considerăm matricea simetrică A = , cu d ≠ 0. Calculaţi valorile 

d 0 

şi vectorii proprii[ ai matricei ] A. b) Fie matricea D = diag(d 1,d 2...,d n), unde d i ≠ d j, 

0 D 

∀i ≠ j, şi B = ∈ IR 2n×2n . Scrieţi un algoritm pentru calculul valorilor şi 

D 0 

vectorilor proprii ai matricei B. 

P 4.62 a) Fie T ∈ IR n×n o matrice tridiagonală, simetrică şi pozitiv definită. Scrieţi şi 

implementaţi următorul algoritm iterativ: 

1. Pentru k = 1,2,... 

1. Se calculează factorul Cholesky L al matricei T. 

2. T ← T ′ = L T L. 

Ce constataţi b) Arătaţi că în cazul n = 2 şi t 11 ≥ t 22 şirul matricelor T calculat de 

algoritmul de la punctul a) converge către Λ = diag(λ 1,λ 2), unde {λ 1,λ 2} = λ(T). 

P 4.63 a) Se consideră o matrice tridiagonală simetrică T ∈ IR n×n . Să se arate că dacă 

T are valori proprii multiple, atunci T nu poate fi ireductibilă. Mai mult, să se arate că 

dacă T are o valoare proprie cu ordinul de multiplicitate k ≥ 2, atunci are cel puţin k−1 

elemente subdiagonale (şi, corespunzător, cele simetrice supradiagonale) nule. b) Aplicaţi 

algoritmul TQ de reducere la forma tridiagonală unei matrice simetrice având o valoare 

proprie multiplă. Ce constataţi Puteţi da o justificare celor constatate 

P 4.64 Fie o matrice simetrică A ∈ IR n×n şi o iteraţie Jacobi A ← A ′ = J T AJ, unde 

J(p,q,θ) este o rotaţie plană de unghi θ în planul (p,q). Să se arate că, pentru întregii p şi 

q fixaţi, rotaţia care anulează elementele A(p,q) şi A(q,p) asigură minimizarea, în raport 

cu unghiul θ, a normei Frobenius a matricei elementelor extradiagonale ale matricei A ′ . 

[ ] 

α γ 

P 4.65 a) Fie date A = ∈ IR 2×2 , cu λ(A) = {λ 

γ β 

1,λ 2}, şi un scalar real δ. 

Arătaţi că, dacă δ ∈ [λ 1,λ 2], atunci există o rotaţie Jacobi reală J = 

[ 

c s 

−s c 

] 

astfel 

încât (J T AJ)(1,1) = δ. b) Considerăm matricea simetrică A ∈ IR n×n . Elaboraţi un 

algoritm de calcul al unei secvenţe de rotaţii Jacobi Q = J 1J 2..., astfel încât matricea 

B = Q T AQ să aibe toate elementele diagonale egale b 11 = b 22 = ... = b nn = 1 n tr(A) = 

= 1 n 

∑ n 

i=1 λi(A).


P 4.66 Elaboraţi algoritmi tip Jacobi pentru calculul valorilor proprii ale unei matrice 

antihermitice (antisimetrice). 

[ ] 

1+ǫ 1 

P 4.67 Fie matricea A = ∈ IR 2×2 , cu 0 < ǫ ≪ 1. Să se calculeze 

0 1−ǫ 

numărul de condiţionare al celor două valori proprii şi al spectrului matricei A. Ce se 

întâmplă dacă ǫ → 0 

P 4.68 Să se arate că sensibilitatea unei valori proprii simple λ k ∈ λ(A) în raport cu 

variaţiile elementului a ij = A(i,j) este dată de 

∂λ k 

= ȳk(i)x k (j) 

∂a ij yk Hx , 

k 

unde x k şi y k sunt vectori proprii la dreapta, respectiv la stânga, ai matricei A asociaţi 

valorii proprii λ k . 

P 4.69 Fie matricea bidiagonală A ∈ IR n×n 

⎡ 

⎤ 

n n 0 ··· 0 0 

0 n−1 n ··· 0 0 

. 0 0 n−2 .. 0 0 

A = 

⎢ 

. 

. 

. 

. 

. 

. 

. ⎥ 

⎣ 

⎦ 

0 0 0 ··· 2 n 

0 0 0 ··· 0 1 

Să se calculeze numărul de condiţie al valorii proprii λ k = k. Pentru n = 20 să se dea o 

evaluare a numărului de condiţie pentru valorile proprii λ 1 = 1 şi λ 20 = 20. Pentru acelaşi 

n = 20 să se calculeze, cu ajutorul funcţiei eig din MATLAB, valorile proprii ale matricei 

Ã care diferă de A numai prin elementul Ã(20,1) = 0.01. Ce constataţi 

P 4.70 Se consideră matricea superior Hessenberg A ∈ IR n×n 

⎡ 

⎤ 

n n−1 n−2 ··· 2 1 

n−1 n−1 n−2 ··· 2 1 

. 0 n−2 n−2 .. 2 1 

A = 

. 

. 

. .. . .. . .. 

. .. 

. 

⎢ 

⎥ 

⎣ 

. 

0 0 0 .. ⎦ 2 1 

0 0 0 ··· 1 1 

a) Arătaţi că detA = 1. b) Fie matricea perturbată F = A + E, unde E = ǫG, cu 

matricea G având un singur element nenul G(n,1) = 1. Arătaţi că detF = 1−(n−1)!ǫ. 

Evaluaţi detF pentru n = 20 şi ǫ = 10 −10 . c) Pentru n = 10, calculaţi cu ajutorul funcţiei 

eig din MATLAB, vectorii proprii la stânga şi la dreapta şi, pe această bază, numerele de 

condiţionare κ λmax şi κ λmin ale valorilor proprii maximă şi, respectiv, minimă ale matricei 

A. Ce constataţi 

P 4.71 a) Elaboraţi un algoritm performant de calcul al polinomului caracteristic al unei 

matrice. 

b) Elaboraţi un algoritm performant de rezolvare a ecuaţiilor algebrice, i.e. a ecuaţiilor 

de tipul p(λ) = 0 unde p este un polinom cu coeficenţi reali sau complecşi.

Capitolul 5 

Descompunerea valorilor 

singulare 

Descompunerea valorilor singulare (DVS) joacă un rol fundamental în evidenţierea 

proprietăţilor structurale legate nemijlocit de conceptul de rang matriceal. În contextul 

calcului numeric se impune o reevaluare a noţiunii de rang întrucât, datorită 

toleranţelor admise, definirea uzuală capătă un caracter ambiguu. În aceste 

circumstanţe, devine utilă introducerea conceptului de distanţă până la o matrice 

de rang imediat inferior şi a noţiunii pragmatice de rang numeric. 

Calculul DVS este intim legat de conceptul de ortogonalitate fiind bazat, în 

exclusivitate, pe utilizarea transformărilor unitare (ortogonale). Acest fapt induce 

calităţi numerice remarcabile tuturor procedurilor de rezolvare a problemelor ce 

apelează la DVS. 

În ceea ce priveşte aplicaţiile, în cadrul general al matricelor de rang nemaximal, 

DVS constituie cel mai bun mijloc numeric de rezolvare a numeroase probleme de 

metrică euclidiană cum sunt problema generală a celor mai mici pătrate, calculul 

bazelor ortogonale pentru subspaţii liniare etc. 


5.1.1 Valori singulare. Descompunerea valorilor singulare 

Având în vedere conexiunea intimă a descompunerii valorilorsingularecu conceptul 

de rang 1 , vom introduce mai întâi definiţia uzuală a noţiunii de rang matriceal. 

Fie A ∈ IC m×n 2 . 

1 Unele dintre noţiunile utilizate în continuare au fost definite, într-un context introductiv, în 

capitolul 1. Pentru confortul cititorului, preferăm reluarea acestora în cadrul extins şi specializat 

al capitolului de faţă. 

2 Vom considera cazul, mai general, al matricelor complexe. Particularizarea rezultatelor cu 

caracter teoretic pentru matrice reale este imediată reducându-se, practic în toate situaţiile, la 

înlocuirea operatorului hermitic (i.e. de transpunere şi conjugare) cu operatorul de transpunere. 

În dezvoltările algoritmice cazul matricelor reale va fi tratat distinct.

370 CAPITOLUL 5. DESCOMPUNEREA VALORILOR SINGULARE 

Definiţia 5.1 Rangul r al matricei A este numărul maxim de coloane liniar independente 

ale lui A, sau, echivalent, 

r = rangA = dim(ImA). (5.1) 

Se poate arăta (vezi cap. 1) că rangA = rangA T şi, astfel, orice matrice are 

acelaşi număr maxim de linii şi coloane liniar independente. Deci, rangul unei 

matrice A este dimensiunea maximă a unei submatrice nesingulare A(I,J), I = 

= {i 1 ,i 2 ,...,i r }, J = {j 1 ,j 2 ,...,j r } a lui A. 

În vederea elaborării unor proceduri fiabile de determinare numerică a rangului 

suntem interesaţi în definirea transformărilor matriceale pentru care rangul este un 

invariant. În acest sens introducem 

Definiţia 5.2 Două matrice A,B ∈ IC m×n se numesc echivalente dacă există matricele 

nesingulare S ∈ IC m×m şi T ∈ IC n×n astfel încât 

B = SAT. (5.2) 

Dacă matricele S şi T sunt unitare, atunci vom spune că A şi B sunt unitar echivalente. 

În cazul real este suficient să ne rezumăm la matrice de transformare reale. 

Într-o astfel de situaţie, dacă matricele S şi T sunt ortogonale vom spune că A şi 

B sunt ortogonal echivalente. 

În vederea determinării rangului unei matrice date vom urma o cale deja familiară 

din capitolele precedente, respectiv, vom calcula o matrice de acelaşi rang cu matricea 

dată la carerangul săpoată fi evaluat prin simplă inspecţie. Astfel de matrice 

sunt matricele cu structură diagonală la care rangul este, evident, egal cu numărul 

elementelor diagonale nenule. Din motive de fiabilitate numerică ne vom restrânge 

la utilizarea transformărilor unitare, respectiv ortogonale în cazul real. 

Avem următorul rezultat important. 

Teorema 5.1 (Descompunerea valorilor singulare - DVS) Dacă A ∈ IC m×n , 

atunci există matricele unitare U ∈ IC m×m şi V ∈ IC n×n astfel încât 

[ 

U H Σ1 0 

AV = Σ = 

0 0 

] 

, (5.3) 

unde 

Σ 1 = diag(σ 1 ,σ 2 ,...,σ r ) ∈ IR r×r , (5.4) 

cu 

σ 1 ≥ σ 2 ≥ ... ≥ σ r > 0. (5.5) 

Expresia 

A = UΣV H (5.6) 

defineşte descompunerea valorilor singulare a matricei A. Numerele nenegative σ i , 

i = 1 : p, p = min(m,n) (σ i = 0, i = r+1 : p) se numesc valori singulare ale 

matricei A. Coloanele matricei unitare U se numesc vectori singulari la stânga, iar 

coloanele lui V se numesc vectori singulari (la dreapta) ai matricei A. 

În cazul real se obţine acelaşi rezultat, cu matricele U şi V ortogonale, i.e. cu 

vectorii singulari reali.


Demonstraţie. Dacă A = 0, atunci (5.3)-(5.5) sunt satisfăcute de r = 0, U = I m , 

V = I n , Σ = 0. Dacă A ≠ 0, atunci ‖A‖ 2 ≠ 0 şi, folosind tehnica inducţiei finite, 

vom obţine matricea cu structura din (5.3) în r paşi. 

Pasul 1 ◦ . Conformdefiniţieinormeispectraleexistăunvectordenormăeuclidiană 

unitară v 1 ∈ IC n , pentru care ‖A‖ 2 = max ‖x‖2=1‖Ax‖ 2 = ‖Av 1 ‖ 2 şi fie u 1 ∈ IC m 

definit de u 1 = Av 1 

‖A‖ 2 

având, evident, ‖u 1 ‖ 2 = 1. Fie, acum, Û 1 ∈ IC m×(m−1) şi 

ˆV 1 ∈ IC n×(n−1) completări ale vectorilor u 1 şi v 1 până la matrice unitare 3 , i.e. astfel 

încât matricele U 1 = [ u 1 Û 1 

] 

, V1 = [ v 1 

ˆV1 

] 

să fie unitare. Atunci 

[ 

Σ (1) def u 

= U1 H AV H 

1 = 1 Av 1 u H 1 AˆV ] [ ] 

1 σ1 w 

Û1 HAv 1 Û1 HAˆV = 

H 

, 

1 0 B 1 

întrucât ÛH 1 Av 1 = ÛH 1 u 1‖A‖ 2 = 0 şi unde am utilizat notaţiile evidente 

σ 1 

def 

= u H 1 Av 1 = ‖A‖ 2 (5.7) 

şi w H def 

= u H 1 AˆV def 

1 , B 1 = ÛH 1 AˆV 1 . În continuare, întrucât transformările unitare 

conservă norma spectrală, avem ‖Σ (1) ‖ 2 = ‖A‖ 2 = σ 1 şi 

[ ]∥ σ1 ∥∥∥ 

2 

[ ]∥ ∥ Σ(1) = 

σ 

2 

1 +w H w ∥∥∥ 

2 

w ∥ = (σ 2 

B 1 w 

1 +w H w) 2 +‖B 1 w‖ 2 2 ≥ (σ1 2 +‖w‖ 2 2) 2 . 

2 

Pe de altă parte, datorită consistenţei normei spectrale, avem 

[ ]∥ σ1 ∥∥∥ 

2 

[ ]∥ ∥ Σ(1) ≤ ‖Σ 

w 

(1) ‖ 2 σ1 ∥∥∥ 

2 

2∥ 

= σ 

w 

1 2 (σ2 1 +‖w‖2 2 ). 

2 

Rezultă σ1 2 +‖w‖2 2 ≤ σ2 1 , i.e. ‖w‖ 2 = 0 sau w = 0. Deci 

[ ] 

Σ (1) = U1 H σ1 0 

AV 1 = 

0 B 1 

2 

2 

(5.8) 

şi obiectivul primului pas este atins. 

Pasul k ◦ . Presupunem că în primii k−1 paşi ai procedurii de diagonalizare am 

obţinut 

[ ] 

Σ (k−1) = U k−1···UH H (k−1) Σ 

2 UH 1 AV 1V 2···V k−1 = 1 0 

, 

0 B k−1 

unde Σ (k−1) 

1 = diag(σ 1 ,σ 2 ,...,σ k−1 ), cu σ 1 ≥ σ 2 ≥ ... ≥ σ k−1 > 0. Dacă B k−1 = 

0, atunci r = k − 1 şi procedura este încheiată. Dacă B k−1 ≠ 0, atunci – cu 

argumentele de la pasul 1 – există matricele unitare Ũk şi Ṽk astfel încât 

[ ] 

Ũk H σk 0 

B k−1 Ṽ k = , σ 

0 B k = ‖B k−1 ‖ 2 > 0. (5.9) 

k 

3 Pentru argumentarea existenţei acestor completări şi a modalităţilor de calcul, vezi observaţia 

4.3 din capitolul 4.


Definind matricele unitare U k = diag(I k−1 ,Ũk), V k = diag(I k−1 ,Ṽk) rezultă 

Σ (k) = U H k Σ(k−1) V k = 

[ ] 

(k) Σ 1 0 

, (5.10) 

0 B k 

cu Σ (k) 

1 = diag(σ 1 ,σ 2 ,...,σ k ). 

Pentru a încheia demonstraţia este suficient să arătăm că σ k ≤ σ k−1 . Din 

expresia (5.9), scrisă pentru pasul k −1, avem 

[ ]∥ σ k−1 = ‖B k−2 ‖ 2 = 

σk−1 0 ∥∥∥2 

∥ ≥ ‖B 

0 B k−1 ‖ 2 

= σ k . 

k−1 

În concluzie, procedura de diagonalizare poate fi iniţiată şi apoi continuată. 

Astfel, fie vom obţine B r = 0 pentru r < p, fie procedura se va incheia cu r = p = 

= min(m,n), i.e. 

unde 

Σ (r) = U H r ···UH 2 UH 1 AV 1V 2···V r = U H AV = 

[ 

Σ 

(r) 

1 0 

0 0 

] 

, (5.11) 

U = U 1 U 2 ...U r , V = V 1 V 2 ...V r (5.12) 

def 

sunt matrice unitare. Cu Σ 1 = Σ (r) 

1 şi Σ def 

= Σ (r) obţinem (5.3). Demonstraţia este 

completă. 

În cazul matricelor reale cursul demonstraţiei este identic cu menţiunea că în 

locul transformărilor complexe se utilizează transformări reale, i.e. ortogonale. ✸ 

Exemplul 5.1 Este uşor de verificat că matricea 

[ ] 

1.60 0.36 0.48 

A = 

−1.20 0.48 0.64 

admite o DVS A = UΣV T definită de 

[ 

U = 

0.8 0.6 

−0.6 0.8 

] [ 

2 0 0 

, Σ = 

0 1 0 

⎡ 

] 

, V = ⎣ 1 0 0 

0 0.6 0.8 

0 0.8 −0.6 

şi are, evident, valorile singulare σ 1 = 2 şi σ 2 = 1. Matricea B = A T are, la fel de 

evident, aceleaşi valori singulare şi B = VΣ T U T este o DVS a sa. Valorile singulare 

ale unei matrice reale au o interpretare interesantă în geometria spaţiului euclidian. 

Concret, valorile singulare nenule ale matricei A ∈ IR m×n sunt lungimile semiaxelor 

hiperelipsoidului E = AS ⊂ ImA ⊂ IR m unde S este hipersfera cu centrul în origine 

şi de rază unitară din IR n , i.e. 

E = {y ∈ IR m |y = Ax, x ∈ IR n , ‖x‖ 2 = 1}. 

În figura 5.1 sunt reprezentate elipsele E A şi E B pentru matricele A, de mai sus, şi 

⎤ 

⎦


✻x ✛ 

✬✩ ❍ σ 3 

1=2 

IR 3 ✲ 

❍❍❍❍❍❍❍❍❍❍❥ ✬ ImA ✩= IR 2 

1 

✟ ✟✯ σ ✻ 2 =1 

0 

x 

✲ 1 

−→ ❄ 

 

 

x ✫✪ 

E A 

2 ✫ 

 

 

 

✪ 

✠ 

✁ ✁✁✁✁✁✁✁✁✕ y 1 

✻y 3 

✻x 2 ☞ 

☞ 

✬✩ 

IR 2 

✛σ 1 =2✲ 

★ ✥ 

1 

✟ ✟✯ x 

✲ 

☞ ☞☞ 

✁☛ ✁✕✁ σ 2=1 

☞ ☞☞ 

1 

y 

−→ 

✲ 1 

0 

 

✫✪ ✧ 

✦ 

 

☞ ☞☞☞☞☞ E B 

ImA T ⊂ IR 3 

 

☞ ☞☞☞☞☞ 

y 2 ✠ 

y 2 

Fig. 5.1: O interpretare geometrică a valorilor singulare 

B = A T . De remarcat faptul că E A include şi punctele interioare ale elipsei în timp 

ce E B cuprinde numai punctele de pe frontieră. 

✸ 

Fie o matrice A ∈ IC m×n cu rangA = r şi DVS A = UΣV H . În continuare vom 

utilizaintensivurmătoarelenotaţiicedefinescpartiţiialematricelordetransformare 

U şi V induse de structura matricei Σ. 

def 

U 1 = U(:,1:r), 

def 

U 2 = U(:,r+1:m), 

def 

V 1 = V(:,1:r), 

def 

V 2 = V(:,r+1:n). 

Prezentăm două consecinţe imediate ale teoremei 5.1. 

(5.13) 

Corolar 5.1 Orice matrice A ∈ IC m×n poate scrisă ca sumă de produse externe de 

vectori singulari ponderate cu valorile singulare, i.e. cu notaţiile (5.13) avem 

A = U 1 Σ 1 V H 

1 = 

r∑ 

σ j u j vj H , (5.14) 

j=1 

def 

unde matricele W j = u j vj H 

matricii A. 

, j = 1:r poartă numele de componente principale ale 

Corolar 5.2 Fie o matrice A ∈ IC m×n cu rangA = r. Atunci există matricele 

nesingulare S ∈ IC m×m şi T ∈ IC n×n astfel încât 

[ ] 

Ir 0 

SAT = , (5.15) 

0 0


i.e. orice matrice este echivalentă cu o matrice cu structura din (5.15). 


Fie A = U H ΣV DVS a matricei A şi matricele nesingulare P,R ∈ 

∈ IC r×r astfel încât PΣ 1 R = I r , e.g. P = R = Σ −1 2 

1 = diag(σ − 1 2 

1 ,σ −1 2 

2 ,...,σ −1 2 

r ). 

Atunci (5.15) este satisfăcută, de exemplu, de către matricele nesingulare S = 

= diag(P,I m−r )U H şi T = Vdiag(R,I n−r ). ✸ 

Vom nota cu σ(A) mulţimea valorilor singulare ale matricei A. Rescriind (5.3) 

în forma AV = UΣ sau A H U = VΣ T obţinem imediat relaţiile 

Av j = σ j u j , A H u j = σ j v j , j = 1 : p, p = min(m,n), (5.16) 

care indică o analogie cu definirea vectorilor proprii ale unei matrice pătrate şi 

constituie o justificare pentru denumirea de vectori singulari dată coloanelor u j , 

respectiv v j , ale matricelor U şi V care definesc DVS. Mai mult, vectorii singulari 

din (5.16) sunt efectiv vectori proprii ai unor matrice derivate din matricea A (vezi 

teorema următoare). De remarcat şi faptul că, deşi echivalenţa (5.15) apare ca o 

reducere completă dictată de necesităţile de evidenţiere a rangului unei matrice, 

echivalenţa unitară (ortogonală) care defineşte DVS oferă, prin valorile şi vectorii 

singulari, o informaţie mult mai bogată, utilă în numeroase evaluări cantitative. 

Demonstraţia prezentată pentru teorema 5.1 nu are un caracter constructiv 

întrucât calculul vectorului pentru care se realizează norma spectrală prezintă dificultăţi 

majore. Alegerea acestei demonstraţii se datorează ordonării naturale a valorilor 

singulare şi evidenţierii conexiunii strânse dintre valorile singulare şi norma 

spectrală. 

O modalitate de calcul al DVS este oferită de următorul rezultat. 

Teorema 5.2 Valorile singulare nenule ale matricei A ∈ IC m×n sunt rădăcinile 

pătrate (pozitive) ale valorilor proprii nenule ale matricelor hermitice pozitiv semidefinite 

B = A H A ∈ IC n×n sau C = AA H ∈ IC m×m , (5.17) 

i.e. dacă λ 1 ≥ λ 2 ≥ ··· ≥ λ r > 0, sunt cele r valori proprii nenule ale lui B (sau 

C), atunci 

σ i = √ λ i , i = 1 : r. (5.18) 

Mai mult, vectorii singulari la stânga u i = Ue i , i = 1:m, sunt vectori proprii ai 

matricei C, iar vectorii singulari (la dreapta) v j = Ve j , j = 1 : m, sunt vectori 

proprii ai matricei B. 

În cazul real, aserţiunile de mai sus sunt adevărate, cu menţiunea că matricele 

B şi C sunt simetrice pozitiv semidefinite. 

def 

Demonstraţie. Din (5.3) obţinem 

[ Σ 

B = A H A = VΣ T U H UΣV H = VΣ T ΣV H 2 

= V 1 0 

0 0 

[ Σ 

C = AA H = UΣV H VΣ T U H = UΣΣ T U H 2 

= U 1 0 

0 0 

] 

V H , 

] 

U H . 

(5.19)


Prin urmare, matricea B este unitar asemenea cu matricea diagonală S 1 = Σ T Σ = 

= diag(σ1 2,σ2 2 ,...,σ2 r,0,...,0), respectiv matricea C este unitar asemenea cu matricea 

diagonală S 2 = ΣΣ T = diag(σ1,σ 2 2,...,σ 2 r,0,...,0), 2 de unde rezultă imediat 

toate aserţiunile teoremei. 

✸ 

Un rezultat similar, care conexează valorile singulare ale unei matrice cu valorile 

proprii ale altei matrice, este prezentat în propoziţia următoare. 

Propoziţia 5.1 Fie matricea A ∈ IC m×n , p = min(m,n) şi σ 1 ,σ 2 ,...,σ p valorile 

singulare ale matricei A. Atunci valorile proprii ale matricei 

[ ] 0 A 

F = 

A H (5.20) 

0 

sunt σ 1 ,σ 2 ,...,σ p , −σ 1 ,−σ 2 ,...,−σ p şi |m−n| valori proprii nule. 

Demonstraţie. Considerăm cazul m ≥ n (cazul m < n se tratează absolut 

similar). Fie A = UΣV H DVS a matricei A, S def 

= Σ(1 : n,:), Ũ def 

= √ 1 2 

U(1 : n,:), 

Û def 

= U(n+1 : m,:)şi Ṽ def 

= 1 √ 

2 

V. Atunci, princalculdirect, seconstatăcămatricea 

este unitară şi că 

[ 

Q def Ũ − Ũ 

= Û 

Ṽ Ṽ 0 

G = Q H FQ = 

⎡ 

] 

∈ IC (m+n)×(m+n) (5.21) 

⎣ S 0 0 

0 −S 0 

0 0 0 

⎤ 

⎦. (5.22) 

Cum λ(F) = λ(G) şi S = diag(σ 1 ,σ 2 ,...,σ n ), propoziţia este demonstrată. 

Observaţia 5.1 Teorema 5.1 arată că orice matrice admite o DVS dar nu afirmă 

nimic despre unicitatea acestei descompuneri. Utilizând şi teorema 5.2 putem să 

facem câteva consideraţii asupra acestui aspect. 

În primul rând, valorile singulare ale unei matrice A ∈ IC m×n , fiind rădăcinile 

pătrate pozitive ale valorilor proprii ordonate ale matricelor A H A sau AA H , sunt 

unic determinate. 

În ceea ce priveşte unicitatea matricelor de transformare este suficient să ne 

mărginim la cazul 4 m ≤ n. 

Dacă cele m valori singulare sunt distincte, atunci sunt distincte şi valorile proprii 

ale matricei hermitice AA H . În această situaţie, coloanele matricei de transformare 

U, fiind vectori proprii de normă euclidiană unitară ai matricei AA H , sunt 

determinate până la multiplicarea cu numere complexe de modul unitar. Cu alte 

cuvinte, în condiţiile menţionate, matricea U este determinată până la o postmultiplicare 

cu o matrice diagonală m × m cu elementele diagonale de modul unitar, 

i.e. dacă avem două DVS 

A = U 1 ΣV H 

1 = U 2 ΣV H 

2 , 

4 Cazul matricelor cu m ≥ n se reduce la cel analizat dacă în locul matricei A se consideră 

matricea A H ∈ IC n×m . Dacă A = UΣV H este o DVS a lui A, atunci A H = VΣ T U H este o DVS 

a matricei A H . 

✸


atunci 

U 2 = U 1 D 

cu D = diag(e iθ1 ,e iθ2 ,...,e iθm ), θ j ∈ IR, j = 1:m. 

(În cazul real, cu matrice de transformare reale, matricea U este determinată, evident, 

până la semnul coloanelor sale.) 

Dacă m = n, A este nesingulară şi U este fixată, atunci matricea Σ este nesingulară 

şi V este unic determinată de V = Σ −1 U H A. 

Dacă m < n, atunci Σ are (cel puţin) ultimele n − m coloane nule şi, deci, 

ultimele n − m coloane ale matricei V sunt date de orice completare până la o 

matrice unitară a primelor m coloane, i.e. în mod sigur matricea V nu este unic 

determinată. 

✸ 

Încontinuareaacesteisecţiuniintroductiveprezentămunelegeneralizăriderivate 

din conceptul de valori singulare. 

5.1.2 Descompunerea polară 

Fie A ∈ IC m×n , rangA = r şi DVS (5.3) A = UΣV H a lui A. Utilizând notaţiile 

(5.13) şi introducând noile notaţii 

S = 

{ Σ(1 : n,:) dacă m ≥ n 

Σ(:,1 : m) dacă m ≤ n , 

putem să scriem 

{ Ũ = U(:,1 : n) dacă m ≥ n 

Ṽ = V(:,1 : m) dacă m ≤ n , 

(5.23) 

A = U 1 V H 

1 V 1 Σ 1 V H 

1 = WP 1 sau A = U 1 Σ 1 U H 1 U 1 V H 

1 = P 2 W, (5.24) 

unde 

şi 

W def 

= U 1 V H 

1 ∈ IC m×n , P 1 

def 

= V 1 Σ 1 V H 

1 ∈ IC n×n , P 2 

def 

= U 1 Σ 1 U H 1 ∈ IC m×m 

unde 

A = 

(5.25) 

{ ŨSV H = ŨV H VSV H = YP 1 dacă m ≥ n 

USṼ H = USU H UṼ H = P 2 Z dacă m ≤ n , (5.26) 

Y def 

= ŨV H ∈ IC m×n , Z def 

= UṼ H ∈ IC m×n . (5.27) 

Este uşor de constatat că matricele P 1 şi P 2 sunt hermitice şi pozitiv semidefinite cu 

rangP 1 = rangP 2 = rangA, Y este o matrice cu coloanele ortogonale (i.e. Y H Y = 

= I n ), Z este o matrice cu liniile ortogonale (i.e. ZZ H = I m ) şi, în consecinţă, 

matricele Y şi Z au norma spectrală unitară. În cazul real, evident, matricele W, 

P 1 , P 2 , Y şi Z pot fi reale. 

Putem introduce următoarea definiţie. 

Definiţia 5.3 Factorizarea 

A = 

{ YP1 dacă m ≥ n 

P 2 Z dacă m ≤ n 

(5.28)


unde matricele P 1 , P 2 , Y şi Z sunt cele definite mai sus, se numeşte descompunerea 

polară 5 a matricei A. 

Fie matricele hermitice, pozitiv semidefinite B = A H A, C = AA H şi descompunerile 

lor spectrale B = VΛ B V H şi C = UΛ C U H , unde Λ B = diag(λ 1 ,λ 2 ,...,λ n ), 

Λ C = diag(λ 1 ,λ 2 ,...,λ m ), cu toţi λ i nenegativi. Definim B 1 def 

2 = VΛ 1 2 

B 

V H def 

= 

def 

= Vdiag( √ λ 1 , √ λ 2 ,..., √ λ n )V H şi, similar, C 1 def 2 = UΛ 1 2 

A 

U H . 

Se poatearăta(exerciţiu pentru cititor) cămatriceleP 1 şi P 2 din descompunerea 

polară sunt unic determinate de P 1 = (A H A) 1 2 

, respectiv de P 2 = (AA H ) 1 2 

, iar 

matricele Y şi Z sunt unic determinate dacă r = n, respectiv r = m. 

5.1.3 Descompunerea CS 

Înoperareanumericăcusubspaţiiliniaresedovedeşteafiextremdeutilăaşanumita 

descompunere CS 6 (DCS) a matricelor unitare (ortogonale) care, printre altele, 

permite introducereanoţiunii de distanţă dintre subspaţii în cazul multidimensional 

şi care are conexiuni naturale cu DVS. Introducem DCS prin următoarea teoremă. 

Teorema 5.3 Fie o matrice unitară Q ∈ IC n×n cu următoarea partiţie 

[ ] 

Q11 Q 

Q = 12 

, Q 

Q 21 Q 11 ∈ IC k×k , Q 22 ∈ IC l×l , k +l = n. (5.29) 

22 

Atunci există matricele unitare U 1 , V 1 ∈ IC k×k şi U 2 , V 2 ∈ IC l×l astfel încât 

⎧ ⎡ 

⎣ C S 0 

⎤ 

−S C 0 ⎦ pt. k ≤ l 

[ ] H [ ][ ] ⎪⎨ 

U1 0 Q11 Q 

W = 

12 V1 0 0 0 I l−k 

= ⎡ 

0 U 2 Q 21 Q 22 0 V 2 

⎣ I ⎤ 

k−l 0 0 

0 C S ⎦ pt. k > l 

⎪⎩ 

0 −S C 

(5.30) 

unde 

C = diag(c 1 ,c 2 ,...,c p ) ∈ IR p×p cu c 1 ≥ c 2 ≥ ... ≥ c p , 

S = diag(s 1 ,s 2 ,...,s p ) ∈ IR p×p cu s 1 ≤ s 2 ≤ ... ≤ s p , 

p = min(k,l) şi c 2 i +s2 i = 1, i = 1:p, i.e. c i şi s i pot fi scrise sub forma 

(5.31) 

c i = cosθ i , s i = sinθ i , cu 0 ≤ θ 1 ≤ θ 2 ≤ ... ≤ θ p ≤ π 2 . (5.32) 

Egalitatea (5.30) se numeşte descompunerea CS a matricei unitare Q. 

În cazul real, i.e. atunci când Q este ortogonală, matricele de transformare bloc 

diagonale pot fi reale, i.e. ortogonale. 

5 Denumirea de ”descompunere polară” este justificată de analogia cu reprezentarea polară 

z = ρe iθ a numerelor complexe, la care factorul ρ este nenegativ, iar factorul e iθ are modulul 

unitar. 

6 Denumirea CS provine de la iniţialele funcţiilor cosinus şi sinus, matricea ortogonală transformată 

având aspectul unei rotaţii generalizate (vezi mai departe).


Demonstraţie. Considerămcazulk ≤ l = n−k. FieQ 11 = U 1 CV1 H DVSablocului 

Q 11 unde C = diag(c 1 ,c 2 ,...,c k ) cu 1 ≥ c 1 ≥ c 2 ≥ ... ≥ c k ≥ 0, prima inegalitate 

datorându-se faptului că σ 1 (Q) = 1 şi c 1 = σ 1 (Q 11 ) ≤ σ 1 (Q) (vezi exerciţiul 5.7). 

Considerăm acum matricea 

˜Q = 

[ ] U 

H 

1 0 

Q 

0 I l 

[ ] [ 

V1 0 

= 

0 I l 

C U1 HQ ] 

12 

, 

Q 21 V 1 Q 22 

care este unitară ca produs de matrice unitare. Din egalitatea blocurilor 11 din 

relaţia ˜Q H ˜Q = In obţinem 

V H 

1 QH 21 Q 21V 1 = I k −C 2 def 

= S 2 = diag(s 2 1 ,s2 2 ,...,s2 k ), 

cu s 2 i = 1−c2 i , i = 1:k. Luând s i = √ 1−c 2 i , obţinem 0 ≤ s 1 ≤ s 2 ≤ ... ≤ s k ≤ 1. 

În continuare vom presupune că matricea S este nesingulară 7 . Fie acum matricea 

def 

U 21 = −Q 21 V 1 S −1 care are coloanele ortogonale (verificaţi!) şi U 22 o completare a 

def 

sa până la o matrice unitară, i.e. astfel încât matricea U 2 = [U 21 U 22 ] ∈ IC l×l să 

fie unitară (vezi şi observaţia 4.3). Avem 

[ ] 

U 

H 

U2 H Q 21 

21V 1 = Q 21 V 1 = 

U H 22 

[ 

−S −1 V H 

1 QH 21 Q 21V 1 

−U H 22 U 21S 

] 

= 

[ 

−S 

0 

] 

. 

Mai departe, matricea 

[ U 

H 

ˆQ = 1 0 

0 U2 

H 

⎡ 

] [ ] 

V1 0 

Q = ⎣ 

0 I l 

C U1 HQ ⎤ 

[ ] 12 

−S ⎦ 

U 

0 

2 H Q 22 

este unitară. Egalitatea blocurilor 22 din ˆQˆQ H = I n conduce la 

[ ] [ ] 

S 

U2 H Q 22Q H 22 U 2 

0 C 

2 

0 

2 = I l − = . 

0 0 0 I l−k 

În continuare vom presupune că matricea C este nesingulară 8 . Definim matricea 

V 2 prin 

[ ] 

def 

V 2 = Q H C 

22 U −1 

0 

2 

0 I l−k 

care, în virtutea ultimei relaţii de mai sus, este unitară şi 

[ ] C 0 

U2 H Q 22 V 2 = . 

0 I l−k 

7 Dacă S este singulară, atunci s 1 = s 2 = ... = s q = 0 pentru un q ≤ l şi corespunzător 

c 1 = c 2 = ... = c q = 1. În acest caz primele q linii şi coloane ale matricei ˜Q sunt e T 

i respectiv e i 

i = 1 : q care au deja structura din (5.30) şi pot fi separate (pentru detalii suplimentare se poate 

consulta şi demonstraţia teoremei ce urmează). Demonstraţia pentru restul matricei decurge ca 

mai sus. 

8 Dacă C este singulară, atunci c q = c q+1 = ... = c l = 0 pentru un q ≥ 1 şi corespunzător 

s q = s q+1 = ... = s l = 1. În acest caz se procedează similar cu modul prezentat în nota de picior 

precedentă.


În sfârşit, notând U def 

= diag(U 1 ,U 2 ), V def 

= diag(V 1 ,V 2 ) obţinem următoarea 

structură a matricei W 

⎡ 

W = U H QV = ⎣ C X Y ⎤ 

−S C 0 ⎦, 

0 0 I k−l 

unde [X Y ] def 

= U1 HQ 12V 2 . 

Rezultatul urmărit se obţine imediat din faptul că matricea W este unitară, din 

egalitatea W H W = I n rezultând X = S şi Y = 0. 

În cazulk > l = n−k se începecu descompunereavalorilorsingulareale blocului 

Q 22 , după care cursul demonstraţiei este similar cu cel de mai sus. 

În cazul real toate transformările unitare utilizate pot fi luate ortogonale, cursul 

demonstraţiei fiind identic. 

✸ 

5.1.4 Descompunerea valorilor singulare generalizate 

O generalizare posibilă a descompunerii valorilor singulare este diagonalizarea simultană 

a două matrice sau, echivalent, diagonalizarea unui fascicol matriceal, prin 

transformări de echivalenţă. Condiţiile în care acest demers este posibil sunt enunţate 

în teorema de mai jos. 

Teorema 5.4 Descompunerea valorilor singulare generalizate (DVSG). Fie matricele 

A ∈ IC m×n cu m ≥ n şi B ∈ IC p×n 9 astfel încât KerA∩KerB = {0}. Atunci 

există matricele unitare U ∈ IC m×m şi V ∈ IC p×p precum şi matricea nesingulară 

W ∈ IC n×n astfel încât 

⎧ [ ] 

[ ] ⎪⎨ S 

U H C pentru p ≥ n 

AW = , V H BW = 0 

(5.33) 

0 ⎪⎩ [ ] 0 S pentru p < n 

unde 

C = diag(c 1 ,c 2 ,...,c n ) ∈ IR n×n cu 1 ≥ c 1 ≥ c 2 ≥ ... ≥ c p ≥ 0, 

⎧ 

⎪⎨ 

diag(s 1 ,s 2 ,...,s n ) ∈ IR n×n cu 0 ≤ s 1 ≤ s 2 ≤ ... ≤ s n ≤ 1, pt. p ≥ n 

S = 

⎪⎩ 

diag(s n−p+1 ,s n−p+2 ,...,s n ) ∈ IR p×p 

cu 0 = s 1 = s 2 = ... = s n−p ≤ s n−p+1 ≤ ... ≤ s n ≤ 1, pt. p < n 

(5.34) 

cu c 2 i + s2 i = 1, i = 1:n 10 . Perechile (c i ,s i ), i = 1:n definesc valorile singulare 

generalizate ale perechii (A,B), mai exact perechile (c i ,s i ) cu s i = 0 definesc 

9 Teorema este enunţată pentru cazul a două matrice cu acelaşi număr de coloane. Se poate 

da şi o formulare pentru două matrice A şi B cu acelaşi număr de linii, formulare care se poate 

obţine aplicând enunţul de mai sus matricelor A H şi B H . Lăsăm detaliile în sarcina cititorului 

interesat. 

10 În cazul p < n avem c 1 = c 2 = ... = c n−p = 1 şi, de aceea, am introdus în (5.34), prin 

convenţie şi pentru comoditatea notaţiilor, numerele s 1 = s 2 = ... = s n−p = 0. De asemenea, 

în aceeaşi situaţie, vom conveni să extindem termenul de ”structură diagonală” pentru matricea 

[ 0 S] (în unele lucrări [VI], în cazul p < n, matricea V H BW are structura [S 0] cu S diagonală 

dar ”preţul” plătit este pierderea ordonării elementelor diagonale ale matricelor C şi S).


valorile singulare generalizate infinite, iar 

σ i = c i 

s i 

∈ IR, s i ≠ 0, (5.35) 

sunt valorile singulare generalizate finite. Coloanele w i ale matricei nesingulare W 

se numesc vectorisingularigeneralizaţi ai perechii (A,B) asociaţi valorilor singulare 

generalizate σ i . 

În cazul real, matricele de transformare pot fi alese reale, i.e. W reală nesingulară, 

iar U şi V ortogonale. 

Demonstraţie. Este uşor de constatat că ipoteza KerA∩KerB = {0} este echivalentă 

cu faptul că matricea 

[ ] 

F def A 

= ∈ IC (m+p)×n (5.36) 

B 

este monică (i.e. are coloanele liniar independente). Fie F = QR factorizarea QR 

a matricei F, unde Q ∈ IC (m+p)×n este o matrice având coloanele ortogonale (i.e. 

Q H Q = I n ), iar R ∈ IC n×n este superior triunghiulară şi, în virtutea monicităţii lui 

F, nesingulară. De asemenea, fie următoarea partiţie a matricei Q 

[ ] 

Q1 

Q = , Q 

Q 1 ∈ IC m×n , Q 2 ∈ IC p×n . 

2 

În continuare vom proceda similar cu demonstraţia teoremei 5.3 privitoare [ la] 

descompunerea 

CS. Fie Q 1 = U ˜CZ H o DVS a matricei Q 1 unde ˜C C 

= cu 

0 

C = diag(c 1 ,c 2 ,...,c n ) ∈ IR n×n şi, cu argumentele din demonstraţia teoremei citate, 

1 ≥ c 1 ≥ c 2 ≥ ... ≥ c n ≥ 0. Considerăm acum matricea 

[ ] [ ] 

U ˜Q = 

H 0 ˜C 

QZ = 

0 I p Q 2 Z 

care are, şi ea, coloanele ortogonale, i.e. ˜QH ˜Q = In , relaţie din care rezultă 

Z H Q H 2 Q 2 Z = I n −C 2 def 

= S 2 , (5.37) 

unde S 2 = diag(s 2 1 ,s2 2 ,...,s2 n ) cu s2 i = 1 − c 2 i , i = 1 : n. Alegând s i = √ 1−c 2 i 

rezultă S = diag(s 1 ,s 2 ,...,s n ) cu 0 ≤ s 1 ≤ s 2 ≤ ... ≤ s p ≤ 1. În continuare 

distingem două situaţii: 

a) Matricea S este nesingulară (condiţie posibilă numai dacă p ≥ n). În acest 

caz, din (5.37) avem S −1 Z H Q H 2 Q 2ZS −1 = I n , i.e. matricea V 1 = Q 2 ZS −1 ∈ IC p×n 

are coloanele ortogonale şi poate fi completată până la o matrice unitară, i.e. există 

matricea V 2 ∈ IC p×(p−n) astfel încât matricea V = [V 1 V 2 ] ∈ IC p×p este unitară. 

Rezultă 

˜S def 

= V H Q 2 Z = V H V 1 S = 

[ S 

0 

] 

,


relaţie cu care obţinem 

ˆQ = 

[ ] [ 

U 

H 

0 ˜C 

0 V H QZ = 

˜S 

] 

, (5.38) 

de unde 

[ A 

F = 

B 

] 

= QR = 

[ U 0 

0 V 

][ ˜C 

˜S 

] [ U ˜CZ 

Z H R = 

H R 

V ˜SZ H R 

] 

. (5.39) 

În final, datorită nesingularităţii matricei Z H R, din ultima relaţie se obţine diagonalizarea 

simultană urmărită a matricelor A şi B, i.e. U H AW = ˜C şi V H BW = ˜S 

unde W = R −1 Z. q.e.d. 

b) Dacă S este singulară (ceea ce se întâmplă întotdeuna dacă p < n) demonstraţia 

decurge asemănător. Elementele diagonale ale lui S din (5.37) fiind ordonate 

crescător, S este singulară numai dacă s 1 = ... = s l = 0 pentru un l ≥ 1, i.e. (5.37) 

se scrie 

Z H Q H 2 Q 2Z = I n −C 2 def 

= S 2 = 

[ ] 0 0 

0 Ŝ 2 

(5.40) 

cu Ŝ = diag(s l+1,s l+2 ,...,s n ) nesingulară. Notăm X = Q 2 Z ∈ IC p×n şi considerăm 

partiţiaX = [X 1 X 2 ]cuX 1 ∈ IC p×l , X 2 ∈ IC p×(n−l) . Din(5.40)avemX1 H X 1 = 0de 

unde rezultă X 1 = 0. De asemenea, avem X2 HX 2 = Ŝ2 , deci Ŝ−1 X2 HX2Ŝ−1 = I n−l , 

def 

i.e. matricea V 2 = X 2 Ŝ −1 ∈ IC p×(n−l) are coloanele ortogonale. Considerăm şi aici 

două situaţii. 

b1) În cazul p ≥ n, procedând ca mai sus, i.e. completând V 2 cu matricele 

V 1 ∈ IC p×l şi V 3 ∈ IC p×(p−n) până la o matrice unitară V = [V 1 V 2 V 3 ] 11 putem 

scrie 

˜S def 

= V H Q 2 Z=V H X=[0 V H X 2 ]= 

⎡ 

⎣ 0 V 1 H X 2 

0 V H 

2 X 2 

0 V H 

3 X 2 

⎤ 

⎡ 

⎦= ⎣ 

0 0 

0 Ŝ 

0 0 

⎤ 

[ S 

⎦= 

0 

] }n 

}p−n , 

relaţie cu care se obţine imediat (5.38) şi apoi, cu aceleaşi argumente, (5.33). q.e.d. 

b2) În cazul p < n avem, în mod necesar, l ≥ n−p sau n−l ≤ p şi, prin urmare, 

completând matricea cu coloanele ortogonale V 2 cu matricea V 1 ∈ IC p×(p−n+l) până 

la o matrice unitară V = [V 1 V 2 ] ∈ IC p×p , obţinem 

[ ] [ ] 

˜S def 

0 V 

= V H Q 2 Z=V H X=[0 V H H 

X 2 ]= 1 X 2 0 0 0 

0 V2 HX 

= = [ 0 S ] 

2 0 0 Ŝ 

unde, de această dată, IC p×p ∋ S = diag(s n−p+1 ,s n−p+2 ,...,s n ) cu 0 = s n−p+1 = 

= ... = s l < s l+1 ≤ s l+2 ≤ ... ≤ s n , q.e.d. În acest caz elementele s 1 = s 2 = 

= ... = s n−p = 0 convenţional introduse nu apar efectiv în structurile matricelor 

transformate dar participă la definirea valorilor singulare generalizate infinite. 

11 Dacă V 13 ∈ IC p×(p−n+l) este o completare a matricei V 2 până la o matrice unitară, calculată 

în modul uzual (vezi observaţia 4.3), atunci V 1 se obţine luând oricare l coloane ale matricei V 13 , 

iar V 3 este definită de celelalte p−n coloane.


Încazulreal,toatetransformărileparţialepotfialeserealeşi, înconsecinţă,toate 

rezultatele parţiale ca şi cele finale sunt reale. Cu această observaţie demonstraţia 

este completă. 

✸ 

Observaţia 5.2 DVSG poate fi definită şi în situaţia în care KerA∩KerB ≠ {0}, 

i.e. matricea F din (5.36) nu este monică. În acest caz, utilizând triangularizarea 

unitară cu pivotarea coloanelor (vezi cap. 3), obţinem 

[ ] 

A 

F = = Q [ R T ] P 

B 

T , 

unde Q ∈ IC (m+p)×k cu k < n are coloanele ortogonale, R ∈ IC k×k este superior 

triunghiulară nesingulară iar P ∈ IR n×n este o matrice de permutare. Aplicând 

teorema de mai sus matricei G = QR ∈ IC (m+p)×k , e.g. în cazul cu matricea S ∈ 

∈ IR k×k nesingulară, conform (5.39), obţinem 

G = QR = 

[ 

U ˜C 

V ˜S 

şi, deci, 

[ ] A 

=G [ I 

B k R −1 T ] [ ] U ˜C [ 

P T = 

V ˜S 

˜W−1 ˜W−1 R −1 T ] [ ] U[ ˜C 0] 

P T = 

V[ ˜S W −1 

0] 

[ ] ˜W−1 

unde W = P 

˜W−1 R −1 −1 

T 

este o matrice n×n nesingulară (M fiind o 

0 M 

matricenesingulară(n−k)×(n−k) arbitrară”decompletare”). Rezultăurmătoarea 

formă a relaţiei (5.33) 

[ ] [ ] 

U H C 0 

AW = , V 

0 0 

H S 0 

BW = , (5.41) 

0 0 

] 

˜W −1 

cele n−k coloane nule corespunzând subspaţiului KerA∩KerB. 

AmvăzutcăvalorilesingulareordinarealeuneimatriceAsuntrădăcinilepătrate 

alevalorilorpropriialematricelorhermiticepozitivsemidefiniteA H AsauAA H (vezi 

teorema 5.2). Se poate stabili o legătură similară şi între valorile singulare generalizate 

şi valorile proprii generalizate ale unui fascicol hermitic pozitiv semidefinit 

12 . Concret, avem următorul rezultat pe care îl formulăm utilizând noţiuni din 

capitolul următor şi, din acest motiv, demonstraţia este omisă. 

Teorema 5.5 Fie dată o pereche de matrice (A,B), A ∈ IC m×n , B ∈ IC p×n şi 

fascicolul matriceal hermitic pozitiv semidefinit F = {A H A − λB H B |λ ∈ IC} cu 

valorile proprii generalizate Λ = {λ 1 ,λ 2 ,...,λ n }, λ i ∈ IR + ordonate descrescător. 

Atunci numerele σ i = √ λ i sunt valorile singulare generalizate ale perechii (A,B). 

12 Un fascicol matriceal F = {G −λH | λ ∈ IC} definit de perechea (G,H) se numeşte hermitic 

(în cazul real, simetric), pozitiv semidefinit dacă matricele G şi H sunt hermitice (simetrice), iar 

matricea H şi pozitiv semidefinită. 

✸

5.2. PROBLEME DE CALCUL CONEXE 383 

Se constată imediat că valorile singulare generalizate ale perechii (A,I n ) sunt 

valorile singulare ordinare ale matricei A. 

Problema de calcul a acestui capitol este, în primul rând, determinarea valorilor 

singulare ale unei matrice date. Ca şi până acum, cazul matricelor reale va fi 

tratat distinct pentru a asigura maximum de eficienţă posibil. Determinarea vectorilor 

singulari revine la acumularea transformărilor şi apare ca necesară în multe 

aplicaţii. 

Observaţia 5.3 Teorema 5.2 sugerează o procedură de determinare a valorilor 

singulare ale unei matrice A folosind algoritmul QR simetric pentru calculul valorilor 

proprii e.g. ale matricei B = A H A. De asemenea, dacă se acumulează 

transformările din aplicarea algoritmului QR matricei B, se pot calcula matricele 

de transformare U şi V. Concret, matricea V este chiar matricea de transformare 

din descompunerea spectrală ordonată Λ = V H BV a matricei B, iar U se poate 

determina cu relaţiile (exerciţiu pentru cititor) 

U = [ U 1 U 2 ] cu U 1 = AV(:,1:r)Σ −1 

1 

şi U 2 o completare a lui U 1 până la o matrice unitară. Din punctul de vedere 

al calculului numeric singurul punct slab al unei astfel de proceduri este însuşi 

calculul efectiv al matricei B. Ideea adaptării algoritmului QR simetric astfel încât 

să se evite formarea matricei B a fost propusă în anul 1965 de către G.H.Golub şi 

W.Kahan [30] şi a condus la algoritmul DVS prezentat în secţiunea 5.3. ✸ 

5.2 Probleme de calcul conexe 

Considerăm util să prezentăm în continuare câteva rezultate fundamentale care fac 

din DVS un instrumentfoarteputernic de rezolvarenumericăa numeroaseprobleme 

de algebră liniară. În cazurile în care rezolvarea este directă schemele de calcul 

propuse se pot implementa ca atare şi, pentru a evita repetiţii supărătoare, nu mai 

sunt prezentaţi algoritmi formali. Pentru problemele mai dificile detalii practice şi 

aspecte numerice pot fi găsite în secţiunile 5.5 şi 5.6. 

5.2.1 Rangul matriceal 

După cum se ştie (v. şi cap. 1), două matrice echivalente au acelaşi rang 13 (o 

demonstraţie poate fi găsită în [I]). Având în vedere acest lucru din teorema 5.1 

rezultă imediat următorul rezultat. 

Propoziţia 5.2 Rangul unei matrice este egal cu numărul valorilor sale singulare 

nenule. 

13 Este adevărată şi reciproca, i.e. două matrice de aceleaşi dimensiuni care au acelaşi rang sunt 

echivalente.


5.2.2 Norme matriceale 

Valorile singulare permit definirea unei clase interesante de norme matriceale unitar 

(ortogonal) invariante. 

Propoziţia 5.3 Fie A ∈ IC m×n şi σ(A) = {σ 1 ,σ 2 ,···,σ r } valorile sale singulare 

nenule. Atunci 

( r∑ 

) 1 

p 

def 

|A| p = σ p i , p = 1,2,... (5.42) 

i=1 

sunt norme matriceale numite p-norme Schatten. p-normele Schatten sunt invariante 

la transformări unitare, i.e. 

oricare ar fi matricele unitare W ∈ IC m×m şi Z ∈ IC n×n . 

Demonstraţie. Vezi [II]. 

|WAZ| p = |A| p , (5.43) 

Următoareapropoziţierelevălegăturăstrânsădintrep-normeleSchattenşiunele 

norme matriceale uzuale. 

Propoziţia 5.4 Fie matricea A ∈ IC m×n şi σ 1 ,σ 2 ,···,σ r valorile sale singulare 

nenule. Avem 

def 

|A| 1 = σ 1 +σ 2 +···+σ r = ‖A‖ tr , (5.44) 

√ 

|A| 2 = σ1 2 +σ2 2 +···+σ2 r = ‖A‖ F , (5.45) 

|A| ∞ = σ 1 = ‖A‖ 2 , (5.46) 

i.e. norma urmă este definită de suma valorilor singulare, norma Frobenius este 

egală cu rădăcina pătrată a sumei pătratelor valorilor singulare, iar norma spectrală 

a unei matrice coincide cu valoarea singulară maximă. 

Demonstraţie. Relaţia(5.45)rezultăimediatdin (5.3)având învedereconservarea 

normei Frobenius la transformările unitare (ortogonale). Expresia (5.46) a normei 

spectrale rezultă din însăşi demonstraţia teoremei 5.1 (vezi (5.7)), q.e.d. ✸ 

✸ 

5.2.3 Numere de condiţionare 

Dacă matricea A este pătrată (n×n) şi nesingulară obţinem evaluări imediate ale 

numărului de condiţionarela inversare înraportcu normele matricealeuzuale. Întradevăr, 

este uşor de văzut din (5.3) că valorile singulare ale matricei inverse sunt 

inversele valorilor singulare ale lui A, i.e. dacă σ(A) = {σ 1 ,σ 2 ,···,σ n }, atunci 

σ(A −1 ) = {σn −1 ,σn−1 −1 ,···,σ−1 1 

Prinurmare,‖A −1 ‖ tr = σ1 −1 +σ−1 2 +···+σ−1 n , ‖A −1 ‖ F = 

}. (5.47) 

√ 

σ1 −2 +σ2 −2 +···+σn 

−2 

şi ‖A −1 ‖ 2 = 1/σ n , iar numărul de condiţionare la inversare al matricei A are expresiile 

κ tr (A) def 

= ‖A‖ tr ‖A −1 ‖ tr = (σ 1 +σ 2 +···+σ n )(σ −1 

1 +σ −1 

2 +···+σ −1 

n ), (5.48)


√ 

κ F (A) def 

= ‖A‖ F ‖A −1 ‖ F = (σ1 2 +σ2 2 +···+σ2 n)(σ1 −2 +σ2 −2 +···+σn −2 ), (5.49) 


5.2.4 Pseudoinversa 

κ 2 (A) def 

= ‖A‖ 2 ‖A −1 ‖ 2 = σ 1 

σ n 

. (5.50) 

În continuare vom defini într-un cadru general pseudoinversa unei matrice. Deşi, 

în general, calculul explicit al pseudoinversei este evitat în aplicaţii, vom prezenta 

totuşi exprimarea ei cu ajutorul DVS, exprimare care oferă calea cea mai avantajoasă 

pentru un eventual calcul al acesteia. 

Definiţia 5.4 Fie A ∈ IC m×n . O matrice X ∈ IC n×m care satisface următoarele 

patru condiţii Moore-Penrose 14 ⎧⎪ ⎨ 

⎪ ⎩ 

AXA = A 

XAX = X 

(AX) H = AX 

(XA) H = XA 

(5.51) 

se numeşte pseudoinversa matricei A. 

Avem următoarea teoremă de existenţă şi unicitate. 

Teorema 5.6 Orice matrice A ∈ IC m×n admite o pseudoinversă unică. Dacă A = 

= UΣV H este DVS a matricei A, atunci pseudoinversa sa este 

unde 

Σ + = 

este pseudoinversa matricei Σ. 

A + = VΣ + U H , (5.52) 

[ 

Σ 

−1 

1 0 

0 0 

] 

∈ IR n×m (5.53) 

Demonstraţie. Existenţa psedoinversei se demonstrează arătând mai întâi că 

(5.53) satisface cele patru condiţii din (5.51) şi apoi că acestea sunt satisfăcute şi de 

către matricea A + definită în (5.52) (exerciţiu pentru cititor). Pentru demonstraţia 

unicităţii, fie X,Y ∈ IC n×m două pseudoinverse ale matricei A şi D = X −Y. Din 

(5.51) rezultă ⎧⎪ ADA = 0, ⎨ 

DAD +DAY +YAD = D, 

⎪ (AD) H = AD, ⎩ 

(DA) H = DA. 

14 Cele patru condiţii Moore-Penrose sunt echivalente cu următoarele trei (vezi [II]) 

{ AXA = A 

X = PA H = A H R 

unde P şiRsunt două matrice oarecare. Ultimeledouă condiţiiexprimăfaptul că liniileşi coloanele 

pseudoinversei sunt combinaţii liniare ale liniilor, respectiv ale coloanelor matricei A H .


Utilizând prima din relaţiile de mai sus, din penultima obţinem (AD) H AD = 

= ADAD = 0, i.e. AD = 0. Similar, din prima şi ultima relaţie obţinem DA = 0. 

Prin urmare satisfacerea celei de a doua din relaţiile de mai sus implică D = 0, i.e. 

X = Y. 

✸ 

Propoziţia ce urmează oferă o caracterizare interesantă a pseudoinversei. 

Propoziţia 5.5 Fie A ∈ IC m×n . Pseudoinversa X = A + este unica soluţie matriceală 

de normă Frobenius minimă a problemei 

min 

X∈IC n×m‖AX −I m‖ F . (5.54) 

Demonstraţie. ÎntrucâtnormaFrobenius nu este alteratăde transformăriunitare, 

avem 

r F (X) def 

= ‖AX −I m ‖ F = ‖U H AVV H X −U H ‖ F = ‖ΣV H X −U H ‖ F = 

[ ][ ] ∥ [ ]∥ ‖ΣV H XU−I m ‖ F = 

Σ1 0 Y11 Y ∥∥∥F 12 

∥ 

−I 

0 0 Y 21 Y m = 

Σ1 Y 11 −I r Σ 1 Y ∥∥∥F 12 

22 

∥ 

, 

0 I m−r 

undeY def 

= V H XU ∈ IC n×m şipartiţialuiY esteconformăcupartiţialuiΣ. Evident, 

r F (X)esteminimăatuncicândatât‖Σ 1 Y 12 ‖ F câtşi‖Σ 1 Y 11 −I r ‖ F suntminime, i.e., 

pentru Y 12 = 0 şi Y 11 = Σ −1 

1 . Deci, toate matricele X ∈ IRn×m care minimizează 

r F (X) sunt de forma 

[ Dar‖X‖ F = 

Σ 

−1 

∥ 

1 0 

Y 12 

X = VYU H = V 

[ ] 

Σ 

−1 

1 0 

U H . 

Y 21 Y 22 

]∥ ∥∥∥F 

esteminimăpentruY 

Y 21 = 0,Y 22 = 0. Înconsecinţă, 

22 

soluţia de normă Frobenius minimă pentru problema (5.54) este matricea X = 

= VΣ + U H = A + . ✸ 

Din rezultatele de mai sus rezultă că valorile singulare nenule ale pseudoinversei 

sunt inversele valorilor singulare nenule ale matricei iniţiale, vectorii singulari la 

stânga, respectiv la dreapta ai pseudoinversei sunt vectorii singulari la dreapta, 

respectiv la stânga, ai matricei iniţiale asociaţi valorilor singulare corespondente. 

Drept consecinţă, obţinem următoarea DVS pentru pseudoinversa matricei A 

A + = U 1 Σ −1 

1 V H 

1 = 

r∑ 

j=1 

unde u j , v j sunt coloanele j ale matricelor U şi, respectiv, V. 

5.2.5 Subspaţii liniare. Baze ortogonale 

v j u H j 

σ j 

, (5.55) 

Considerăm important să evidenţiem faptul că se pot construi baze ortogonale ale 

subspaţiilor fundamentale definite de o matrice arbitrară folosind vectorii săi singulari 

15 . 

15 În capitolul 3 a fost prezentată o metodă alternativă de construcţie a bazelor ortogonale ale 

subspaţiilor fundamentale definite de o matrice, metodă bazată pe utilizarea factorizării QR cu


Propoziţia 5.6 Fie A ∈ IC m×n având rangA = r şi Σ = UAV H descompunerea 

valorilor sale singulare. Atunci 

i) Primele r coloane ale matricei unitare U formează o bază ortogonală a 

subspaţiului imagine al lui A, iar ultimele m − r coloane ale lui U formează o 

bază ortogonală a subspaţiului nucleu a lui A H , i.e. cu notaţiile (5.13) avem 

ImU 1 = ImA, ImU 2 = KerA H . (5.56) 

ii) Primele r coloane ale matricei unitare V formează o bază ortogonală a subspaţiului 

imagine al lui A H , iar ultimele n − r coloane ale lui V formează o bază 

ortogonală a subspaţiului nucleu a lui A, i.e. cu notaţiile (5.13) avem 

ImV 1 = ImA H , ImV 2 = KerA. (5.57) 

În cazul real toate aserţiunile rămân adevărate dacă operatorul hermitic este înlocuit 

cu operatorul de transpunere. 

Demonstraţie. i) Din DVS a matricei A avem A = U 1 Σ 1 V1 H . Cum matricea 

Σ 1 V1 H este epică obţinem ImA = ImU 1 . Evident, coloanele matricei U 2 formează o 

bazăortogonalăacomplementuluiortogonalînIC n alluiImU 1 =ImAcareesteacelaşi 

subspaţiu cu KerA H . ii) Se repetă raţionamentul de mai sus pentru matricea 

A H = VΣ T U H . 

✸ 

Pentru scopuri mnemotehnice, în figura 5.2 sunt reprezentate, într-o formă convenţională, 

relaţiile dintre subspaţiile liniare definite de o matrice m×n. 

✬ ✩ 

✬ ✩ 

A IC m 

✬ ✩ 

ImA H = ❅ ❅❘ 

A 

ImV 1 

❍ 

❅■ ❍❍❍❍❍❥ 

✬✫ 

❛ ✪ 

ImA = ImU 

❅ 

1 

0 ❅ 

❍❨ 

✩ ✫✬ 

❛ ✩✪ 

❅ A H 

❍ 

❍ 

0 

❍ 

KerA = ImV 2 ❍ 

❍ A H 

✫ 

IC n 

✫ 

✪ 

✪ 

KerA H = 

ImU 2 

✫ ✪ 

Fig. 5.2: Subspaţiile liniare fundamentale definite de o matrice A ∈ IC m×n şi relaţiile 

dintre ele 

pivotarea coloanelor. Deşi, din punct de vedere numeric, metoda bazată pe DVS este considerată 

superioară, în majoritatea aplicaţiilor metoda bazată pe factorizarea QR cu pivotarea coloanelor 

este la fel de sigură fiind, în acelaşi timp, mai eficientă.


5.2.6 Proiectori ortogonali 

DVS oferă pe lângă baze ortogonale şi posibilitatea de calcul a proiectorilor ortogonali 

pe subspaţiile fundamentale definite de o matrice dată. Deşi noţiunea de 

proiector ortogonal a mai fost introdusă şi utilizată în capitolele 1 şi 3, pentru 

comoditatea cititorului, reluăm problema în contextul DVS. 

Definiţia 5.5 Fie S ⊂ IC n un subspaţiu liniar şi T = S ⊥ complementul său ortogonal 

în IC n . O matrice P ∈ IC n×n care satisface condiţiile 

{ y = Px ∈ S 

z = x−y ∈ T , ∀x ∈ ICn (5.58) 

se numeşte matrice de proiecţie ortogonală sau proiector ortogonal pe S. 

Vectorii y = Px şi z = x−y se numesc proiecţiile ortogonale ale vectorului x 

pe S şi, respectiv, pe T . 

Definiţia de mai sus se particularizează în mod natural la subspaţii liniare din 

spaţiul vectorial IR n . 

Existenţa, unicitatea şi principalele proprietăţi ale proiectorilor ortogonali sunt 

prezentate sub forma unei teoreme. 

Teorema 5.7 Oricare ar fi subspaţiul S ⊂ IC n proiectorul ortogonal P există şi este 

unic determinat. Dacă vectorii v 1 ,v 2 ,...,v k formează o bază ortogonală a lui S, 

atunci proiectorul ortogonal are expresia 

P = VV H , 

V def 

= [v 1 v 2 ··· v k ] ∈ IC n×k . (5.59) 

Matricea de proiecţie ortogonală P este hermitică (simetrică în cazul real), idempotentă 

şi coloanele ei generează subspaţiul S, i.e. 

P H = P, P 2 = P, ImP = S. (5.60) 

Demonstraţie. Existenţa. Dacă S = {0}, atunci P = 0. Pentru un subspaţiu cu 

dimS = k ≥ 1 există o bază ortogonală. Vom arăta că matricea P definită de (5.59) 

este un proiector ortogonal pe S. Într-adevăr, y = Px = VVH x = Vw ∈ ImV = S 

pentru toţi x ∈ IC n şi dacă z = x − y, atunci z H V = x H V − x H VV H V = 0, i.e. 

z ⊥ S sau, echivalent, z ∈ S ⊥ . Unicitatea. Fie P 1 şi P 2 doi proiectori ortogonali 

pe acelaşi subspaţiu S. Atunci avem 

‖(P 1 −P 2 )x‖ 2 2 = (P 1 x) H (x−P 2 x)+(P 2 x) H (x−P 1 x) = 0, ∀x ∈ IC n 

întrucât, conform (5.58), S ∋ P 1 x ⊥ (x−P 2 x) ∈ S ⊥ şi S ∋ P 2 x ⊥ (x−P 1 x) ∈ S ⊥ . 

Obţinem (P 1 −P 2 )x = 0, ∀x ∈ IC n şi, considerând n vectori liniar independenţi x, 

rezultă P 1 = P 2 . 

În continuare, primele două relaţii (5.60) rezultă imediat din expresia (5.59) a 

unui proiector ortogonal. Vom arăta acum că ImP = S oricare ar fi proiectorul 

ortogonal pe S. Avem Px ∈ S, i.e. ImP ⊂ S. Reciproc, conform (5.58), pentru 

toţi y ∈ IC n avemPy ∈ S şi z = y−Py ∈ S ⊥ . Dacăy ∈ S, atunci avemşi y−Py ∈ S


i.e. z ∈ S ∩S ⊥ = {0}. Deci z = 0 sau y = Py, i.e. y ∈ ImP. Prin urmare rezultă 

S ⊂ ImP şi, datorită incluziunii precedente, ImP = S. 

✸ 

Conform acestei teoreme, pentru toate matricele V ∈ IC n×k ale căror coloane 

formează baze ortogonale ale aceluiaşi subspaţiu, matricele VV H sunt aceleaşi. 

Proiectorul ortogonal pe IC n este P = I n . Proiectorul ortogonal pe un subspaţiu 

unidimensional S = Imv, unde v este un vector nenul din IC n , este P = vvH 

v H v . 

Fie A ∈ IC m×n , A = UΣV H şi subspaţiile fundamentale ImA,KerA H din IC m , 

ImA H ,KerA din IC n . Aşa cum am văzut în paragraful precedent, coloanele matricelor 

U şi V formează baze ortogonale pentru toate aceste subspaţii. Utilizând 

notaţiile(5.13)şirelaţiile(5.56), (5.57), (5.59)obţinem pentru proiectoriiortogonali 

pe cele patru subspaţii menţionate următoarele expresii 

P 1 = U 1 U1 H = AA + −proiector ortogonal pe ImA, 

P 2 = U 2 U2 H = I m −AA + −proiector ortogonal pe KerA H , 

P 3 = V 1 V1 H = A + A −proiector ortogonal pe ImA H , 

P 4 = V 2 V2 H = I n −A + A −proiector ortogonal pe KerA, 

(5.61) 

unde A + este pseudoinversa matricei A. Demonstrarea egalităţilor secunde din 

expresiile de mai sus se propune ca exerciţiu pentru cititor. 

Exemplul 5.2 Considerăm matricea 

⎡ ⎤ 

0.9600 1.2800 

A = ⎣ 0.6912 0.9216 ⎦ 

0.2016 0.2688 

care admite o DVS A = UΣV T definită de 

⎡ 

⎤ ⎡ 

0.8000 −0.3600 −0.4800 

U = ⎣ 0.5760 0.6848 0.4464 ⎦, Σ = ⎣ 2 0 ⎤ 

] 

0.6000 −0.8000 

0 0 ⎦, V =[ 

0.8000 0.6000 

0.1680 −0.6336 0.7552 0 0 

şi are, evident, valorile singulare σ(A) = {2,0}. Notând cu u j = U(:,j), j = 

= 1:3, şi v j = V(:,j), j = 1:2, coloanele matricelor U şi, respectiv, V cele patru 

subspaţii definite cu ajutorul matricei A sunt (vezi fig. 5.3) ImA = Imu 1 , KerA T = 

= Im[u 2 u 3 ], din IR 3 , respectiv ImA T = Imv 1 , KerA = Imv 2 , din IR 2 . Cei patru 

proiectori ortogonali sunt 

⎡ 

P 1 = u 1 u T 1 = ⎣ 

P 2 = [u 2 u 3 ][ u 

T 

2 

u T 3 

P 3 = v 1 v T 1 = [ 0.3600 0.4800 

0.4800 0.6400 

⎡ 

] 

= ⎣ 

0.6400 0.4608 0.1344 

0.4608 0.3318 0.0968 

0.1344 0.0968 0.0282 

⎤ 

⎦, 

0.3600 −0.4608 −0.1344 

−0.4608 0.6682 −0.0968 

−0.1344 −0.0968 0.9718 

] 

, P 4 = v 2 v T 2 = [ 

⎤ 

⎦, 

0.6400 −0.4800 

−0.4800 0.3600 

] 

.


✻y 3 ❆ ✻ 

P 2 y ❆❆❆❆❆❆❆❆ 

❍ 

❍ IR m IR n 

❍ 

❍ 

KerA 

P 3 x 

❍ 

❍ ❩ 

y 

❍ 

u 3 ❆❑ 

❆ 

❩6 

 

✂ 

v ❩ ❩❩❩❩❩❩❩❩❩❩❩ 1 

x 

❍ 

❩ 

❆ 

y 

✲ 

❩✓ ✓✓✼ 

1 

x 

✲ 1 

❆ ✟✂ ✂✂✂✂✂✍ ✂ 

v 

✓ 

2 

✟ 

✟ 

 

✟✟✟✟✟✟✯ ✂ 

❍ ❍❍❥ 

✟ 

✟ 

0 ❍❍❍❍❍❍❍❍ ❍❍❍❍❥ u 

✂ 1 

0 

❆ ✂ 

 

✓ ✓✓✓✓✓✓✓✓ ✓ ✓✓✓✓✼ ✓ 

✑ ✑✑✑✑✸❩ ✓ 

❩ ✓ ❩7 ✓ 

✟ 

✟ ❆ ✠ u 2 

✂ 

P 4 x 

✟✙ ❆ P 1 y ImA 

y 2 

❆ 

ImA T 

❆ 

KerA T 

✓ ✓✓✓ 

❆ 

❆ 

x 2 

Fig. 5.3: Subspaţii liniare şi proiecţii ortogonale 

(Precizăm că, în majoritatea aplicaţiilor, proiectorii sunt utilizaţi în forma factorizată 

din (5.61).) 

În figura 5.3 sunt prezentate acţiunile acestor proiectori ortogonali asupra a doi 

vectori arbitrari y şi x din IR 3 şi, respectiv, IR 2 . 

✸ 

5.2.7 Operaţii cu subspaţii liniare 

În aplicaţiile cu suport geometricaparede multe ori necesitateade a calculasubspaţii 

liniare derivate din subspaţii existente cu ajutorul operaţiilor uzuale. Natural, 

DVS poate fi de un real folos în astfel de situaţii. În continuare, vom considera 

că subspaţiile date aparţin spaţiului liniar IC m 16 şi sunt cunoscute prin baze (nu 

neapărat ortogonale) ale acestora, iar vectorii din baze se scriu sub forma unor 

coloane de matrice omonime, i.e. X = ImX, Y = ImY 17 etc. Subspaţiile rezultat 

vor fi calculate prin determinarea unor baze ortogonale ale acestora. Aşa cum s-a 

mai precizat, aspectele numerice legate de utilizarea calculului aproximativ vor fi 

discutate într-o altă secţiune a acestui capitol aici admiţând ipoteza posibilităţii 

unui calcul exact. 

A. Incluziune şi egalitate. Fie X = ImX şi Y = ImY două subspaţii liniare 

din IC n cu dimX ≤ dimY. Este uşor de văzut că incluziunea X ⊆ Y are loc dacă şi 

numai dacă 

rangY = rang[X Y ] (5.62) 

şi, prin urmare incluziunea poate fi testată pe această bază calculând DVS a matricelor 

Y şi [X Y ]. O cale alternativă, mai economică, se bazează pe faptul că 

16 Pentru subspaţii din IR m se procedează absolut similar. 

17 Matricele X, Y nu sunt neapărat monice, i.e. pe lângă vectorii din bază pot conţine drept 

coloane şi combinaţii liniare ale acestora.


X ⊆ Y atunci şi numai atunci când coloanele matricei X aparţin lui Y. Numeric, 

apartenenţa unui vector la un subspaţiu se poate constata verificând coincidenţa 

vectorului respectiv cu proiecţia sa ortogonală pe acel subspaţiu. În consecinţă, 

testul incluziunii X ⊆ Y se poate face cu următoarea schemă de calcul. 

X ⊆ Y 

1. Se calculează DVS Y = UΣV H a matricei Y şi fie r = rangY 

2. Dacă ‖U 1 U H 1 X −X‖ = 0, unde U 1 = U(:,1:r), atunci X ⊆ Y 

Egalitatea a două subspaţii X = ImX şi Y = ImY se testează e.g. aplicând de două 

ori schema de mai sus pentru verificarea incluziunilor X ⊆ Y şi Y ⊆ X. 

B. Suma a două subspaţii liniare. Subspaţiul sumă al subspaţiilor X = 

= ImX, Y = ImY din IC n se defineşte prin 

S def 

= X +Y = {s ∈ IC n | s = x+y, x ∈ X, y ∈ Y} (5.63) 

şi, este simplu de constatat, poate fi scris sub forma 

S = ImS, unde S = [X Y ]. (5.64) 

Înconsecinţă, dacăS = UΣV H esteDVSaluiS, atuncir = rangS estedimensiunea 

spaţiului sumă, iar coloanele matricei U 1 = U(:,1:r) formează o bază ortogonală 

a lui S. Evident, procedura poate fi extinsă pentru calculul sumei a mai multor 

subspaţii liniare. Celelalte coloane ale matricei U şi coloanele matricei V definesc 

subspaţiievidenţiateîntr-unparagrafanterior. Deexemplu, coloanelematriceiU 2 = 

= U(:,r+1 : m) formează o bază ortogonală a subspaţiului T = S ⊥ = X ⊥ ∩Y ⊥ . 

C. Intersecţia. Subspaţiul intersecţie 

T def 

= X ∩Y = {t ∈ IC n | t ∈ X & t ∈ Y } (5.65) 

a subspaţiilor X = ImX, Y = ImY din IC n se poate calcula plecând de la ultima 

observaţie din aliniatul precedent, i.e. utilizând relaţia 

ceea ce presupune calculul a trei DVS conform schemei 

T = X ∩Y = (X ⊥ +Y ⊥ ) ⊥ (5.66) 

X ∩Y – v1 

1. Se calculează o bază B X pentru X ⊥ = KerX H , folosind DVS a matricei X 

2. Se calculează o bază B Y pentru Y ⊥ = KerY H , folosind DVS a matricei Y 

3. Se calculează baza căutată a subspaţiului T = X ∩Y, utilizând DVS a 

matricei [B X B Y ] 

O procedură alternativă, mai economică, se bazează pe DVS S = [X Y ] = UΣV H 

a matricei S din (5.64) din care rezultă 

[X Y ]V(:,r+1 : n x +n y ) = XV 2X +YV 2Y = 0,


unde r este rangul lui S, cu n x , n y s-a notat numărul de coloane al matricelor X, 

respectiv Y, V 2X = V(1:n x ,r+1 : n x +n y ) şi V 2Y = V(n x +1:n x +n y ,r+1 : n x +n y ). 

Avem 

T = X ∩Y = ImXV 2X = ImYV 2Y . (5.67) 

Într-adevăr, e.g. dacă t ∈ ImXV 2X , atunci pentru un anumit vector u avem t = 

= XV 2X u = −YV 2Y u, respectiv, cu notaţii evidente, t = Xw = Yz, i.e. t ∈ T . 

Reciproc, dacă t ∈ T , atunci [ t ] = Xw = −Yz pentru anumiţi [ vectori ] w şi z, de 

w V2X 

unde Xw + Yz = 0, i.e. ∈ KerS = ImV 

z 

2 cu V 2 = . Prin urmare, 

[ ] 

V 2Y 

w 

= V 

z 2 u pentru un anumit u, i.e. w = V 2X u şi z = V 2Y u, de unde rezultă 

t ∈ ImXV 2X şi t ∈ ImYV 2Y . Deci, (5.67) este adevărată şi poate fi utilizată pentru 

calculul unei baze ortogonale a subspaţiului intersecţie conform următoarei scheme 

de calcul. 

X ∩Y – v2 

1. Se calculează DVS S = UΣV H a matricei S = [X Y ] 

2. Se calculează DVS T = Ũ˜ΣṼ H a matricei T = XV 2X sau T = YV 2Y 

Notăm cu ρ rangul matricei T. Baza ortogonală căutată a subspaţiului 

intersecţie T este Ũ(:,1:ρ) 

D. Aplicaţii liniare. Fie o aplicaţie liniară A : IC n → IC m . Pentru baze 

fixate, aplicaţiei A i se asociază matricea A ∈ IC m×n astfel încât corespondenţei 

x ↦→ y = A(x) i se asociază relaţia numerică y = Ax. Fie acum un subspaţiu liniar 

X din IC n . Atunci mulţimea 

Y = AX = {y ∈ IC m | y = Ax, x ∈ X } (5.68) 

esteunsubspaţiuliniardinIC m numitsubspaţiul imaginealuiX prinaplicaţialiniară 

definită de A. Problema este următoarea: date matricea A şi matricea X ∈ IC n×k 

astfel încât X = ImX, se cere calculul unei baze ortogonalea subspaţiului Y = AX. 

Este uşor de văzut că 

Y = AImX = ImAX, (5.69) 

de unde rezultă imediat faptul că o bază ortogonală a subspaţiului Y este dată 

de coloanele matricei U 1 = U(:,1 : r y ) din DVS a matricei Y = AX = UΣV H , 

unde r y este rangul lui Y. Rezultate numerice mai bune se obţin [XIX] dacă mai 

întâi se determină o bază ortogonală Ũ1 a lui X şi apoi se ţine seama de faptul că 

Y = ImAŨ1. Schema de calcul este următoarea. 

Y = AX 

1. Se calculează DVS X = Ũ˜ΣṼ H . Fie r x rangul lui X 

2. Se calculează B = AŨ(:,1:r x) 

3. Se calculează DVS B = UΣV H . Dacă r y este rangul lui B, atunci baza 

căutată a subspaţiului Y este dată de coloanele matricei U 1 = U(:,1:r y )

5.3. ALGORITMUL DVS 393 

5.3 Algoritmul DVS 

După cum s-a precizat, valorile singulare ale matricei A ∈ IC m×n sunt rădăcinile 

pătrate nenegative ale valorilor proprii ale uneia dintre matricele hermitice pozitiv 

semidefiniteB = A H AsauC = AA H (veziteorema5.2). Maimult, existăconexiuni 

importante [ dintre ] DVS a[ matricei A] 

şi forma Schur a matricelor hermitice F = 

0 A 

H 0 A 

= sau G = 

A 0 A H (vezi propoziţia 5.1). Natural, în cazul real, 

0 

conjugarea nu are nici un efect, astfel că matricele B = A T A, C = AA T sunt 

simetrice, pozitiv semidefinite, iar matricele F şi G simetrice. 

Teorema 5.2 sugerează o posibilitate de calcul a valorilor singulare ale unei matrice 

A calculând valorile proprii ale uneia dintre matricele B, C, F sau G, cu 

ajutorul algoritmului QR simetric. Într-o astfel de abordare, determinarea matricelor 

unitare (în cazul real, ortogonale) U şi V se poate face conform indicaţiilor 

din observaţia 5.3. 

Totuşi, calculul explicit al matricelor B sau C poate conduce la o pierdere de 

informaţie, după cum se poate vedea din exemplul următor. 

Exemplul 5.3 Fie matricea 

⎡ 

A = ⎣ 

1 1 

0.001 0 

0 0.001 

având valorile singulare σ(A) = { √ 2.000001,0.001}. Avem 

[ ] 1.000001 1 

B = A T A = 

. 

1 1.000001 

Într-un format virgulă mobilă având mantisa cu mai puţin de 7 cifre zecimale, 

matricea B este reprezentată prin 

[ ] 1 1 ˆB = , 

1 1 

având spectrul λ(ˆB) = {2,0}, valorile singulare calculate prin procedura sugerată 

mai sus fiind σ(A) = { √ 2,0}, i.e. o evaluare cu o precizie mult inferioară celei de 

reprezentare. 

✸ 

O metodă mai performantă pentru calculul DVS – propusă de G.H. Golub şi 

W. Kahan [30] în 1965 şi cunoscută sub denumirea de algoritm DVS 18 – evită 

formarea explicită a matricelor B sau C, construind recurent un şir de matrice unitar 

(ortogonal) echivalente cu matricea A, convergent către o matrice diagonală. 

Calculul DVS al matricei diagonale limită este trivial după care, ordonând corespunzător 

elementele diagonale, se obţine matricea Σ ce defineşte DVS a matricei 

iniţiale. Matricele U şi V se calculează prin acumularea transformărilor. Ideea de 

18 În literatura de specialitate de limbă engleză acronimul utilizat este SVD (Singular Value 

Decomposition). 

⎤ 

⎦,


bază a algoritmului DVS constă în faptul că matricele A k , k = 1,2,... ale şirului 

DVS auproprietateacămatriceleB k = A H k A k (în cazulrealB k = A T k A k) formează 

şirul QR hermitic (simetric) corespunzător, asociat matricei B. De aceea, se spune 

că algoritmul DVS este o variantă ”mascată” a algoritmului QR simetric. 

Algoritmul DVS are două etape. 

1. Prima etapă constă în reducerea matricei A, prin transformări unitare (ortogonale) 

de echivalenţă, la o formă superior bidiagonală J astfel încât matricea 

tridiagonală T = J H J să coincidă cu cea produsă de prima etapă a algoritmului 

QR simetric aplicat lui B. 

2. Etapa a doua constă în reducerea iterativă a matricei J la forma diagonală 

prin anularea asimptotică a elementelor supradiagonale prin transformări unitare 

(ortogonale) bilaterale ce corespund paşilor algoritmului QR simetric cu deplasare 

implicită aplicaţi lui B. 

Vom prezenta în continuare detaliile acestui algoritm. 

5.3.1 Reducerea la forma bidiagonală 

Baza teoretică a primei etape a algoritmului DVS este dată de următorul rezultat. 

Teorema 5.8 Fie o matrice A ∈ IC m×n . Există matricele unitare U ∈ IC m×m şi 

V ∈ IC n×n astfel încât matricea 

J = U H AV ∈ IC m×n (5.70) 

este superior bidiagonală, i.e. J(i,j) = 0, ∀i > j şi ∀j > i+1. 

În cazul real, matricele U şi V pot fi reale (i.e. ortogonale) şi, prin urmare, şi 

matricea bidiagonală J este, în acest caz, reală. 

Demonstraţie. Vom da o demonstraţie constructivă, arătând cum se calculează 

efectiv matricele unitare U şi V din (5.70). Pentru fixarea ideilor, presupunem că 

m ≥ n 19 , în care caz procedura are p = min(m−1,n) paşi. 

Pasul 1 ◦ . În primul rând, există reflectorul (complex) U 1, de ordinul m, astfel 

încât (U1 HA)(2 : m,1) = 0. După aplicarea reflectorului U 1, există reflectorul 

V 2 , de ordinul n şi indice 2 (i.e. având structura V 2 = diag(1,Ṽ2)) astfel încât 

((U1 HA)V 2)(1,3:n) = 0. Datorită structurii menţionate a reflectorului V 2 , postmultiplicarea 

cu acesta nu alterează zerourile create în prima coloană. Prin urmare, 

def 

matricea A ← A 1 = U1 HAV 2 este superior bidiagonală în prima coloană şi prima 

linie. 

Pasul k ◦ def 

. Presupunem că, după primii k − 1 paşi, matricea A ← A k−1 = 

def 

= Uk−1 H ...UH 1 AV 2...V k este superior bidiagonală în primele k − 1 coloane şi 

primele k − 1 linii. Acum, există reflectorul (complex) U k = diag(I k−1 ,Ũk) astfel 

încât (Uk HA k−1)(k +1 : m,k) = 0. După aplicarea reflectorului U k , ne folosim 

de existenţa reflectorului V k+1 pentru anularea elementelor (k,k+2 : n), i.e. astfel 

încât ((Uk HA k−1)V k+1 )(k,k+2 : n) = 0. Este uşor de văzut că structura reflectorilor 

19 Dacă m < n se poate calcula DVS a matricei G = A H . Dacă G = UΣV H , atunci DVS a 

matricei A este, evident, A = VΣ T U H .


utilizaţi la acest pas asigură conservarea zerourilor create la paşii precedenţi şi, prin 

urmare, procesul de bidiagonalizare, iniţiat la pasul 1 ◦ , poate fi continuat. 

În final, după p paşi, matricea A este suprascrisă de matricea bidiagonală 

A ← J def 

= A p = U H p ···U H 2 U H 1 AV 2 V 3···V n−1 = U H AV. (5.71) 

Matricele unitare de transformare U şi V au, evident, expresiile 


U = U 1 U 2···U p , V = V 2 V 3···V n−1 . (5.72) 

În demonstraţia teoremei 5.8 s-a scos în evidenţă faptul că întregul proces de 

diagonalizaresepoateefectuapeloc, înlocaţiiledememoriealeelementelormatricei 

A. Mai mult, aşa cum se va vedea mai departe, locaţiile elementelor matricei A 

pot servi pentru memorarea elementelor definitorii ale matricelor de transformare 

utilizate. De asemenea, avându-se în vedere faptul că procesul iterativ conservă 

structura superior bidiagonală, în continuare vom memora matricea bidiagonală J 

numai prin vectorii f ∈ IC n al elementelor diagonale şi g ∈ IC n−1 al elementelor 

supradiagonale (în cazul m ≥ n considerat) conform scrierii 

⎡ 

J = U H AV = 

⎢ 

⎣ 

⎤ 

f 1 g 1 

f 2 g 2 

. .. . .. 

. .. gn−1 

. (5.73) 

f n ⎥ 

⎦ 

✸ 

Algoritmul de bidiagonalizare, prezentat în continuare, reproduce fidel ideile 

demonstraţiei teoremei 5.8. Vom utiliza reflectori hermitici, caz în care matricea 

bidiagonală care se obţine este, în general, complexă. Pentru un plus de claritate 

prezentăm mai întâi o schemă de calcul. 

JQ 

1. p = min(m−1,n) 

2. Pentru k = 1 : p 

1. Se calculează reflectorul U k astfel încât 

(Uk H A)(k +1 : m,k) = 0. 

2. A ← Uk HA 

3. Dacă k < n−1, atunci 

1. Se calculează reflectorul V k+1 astfel încât 

(AV k+1 )(k,k +2 : n) = 0. 

2. A ← AV k+1 

3. Dacă se doreşte calculul matricei U, atunci 

1. U ← I m 

2. Pentru k = p : −1 : 1 

1. U ← U k U


4. Dacă se doreşte calculul matricei V, atunci 

3. V ← I n 

4. Pentru k = n−2 : −1 : 1 

1. V ← V k+1 V 

Utilizând procedurile din tabelul 4.3 (vezi cap. 4), algoritmul corespunzător 

schemei de calcul de mai sus se scrie astfel. 

Algoritmul 5.1 (JQc – Reducerea la forma bidiagonală) (Dată matricea 

A ∈ IC m×n , cu m ≥ n, algoritmul calculează reflectorii hermitici 

U k , k = 1 : p, p = min(m−1,n), şiV k , k = 2 : n−1, astfel încâtmatricea 

J = U H p ...UH 1 AV 2...V n−1 = U H AV este bidiagonală. Matricea J este 

obţinută prin vectorii f ∈ IC n şi g ∈ IC n−1 ai elementelor sale diagonale, 

respectiv supradiagonale. Opţional, se acumulează matricele unitare de 

transformare U şi/sau V. Opţiunea se exprimă cu ajutorul variabilelor 

logiceopt 1 şiopt 2 carepotluavalorile’da’sau’nu’. Dacănusedoreşte 

acumularea, atunci pentru matricea respectivă se returnează matricea 

unitate de dimensiune corespunzătoare.) 

1. p = min(m−1,n) 

2. Pentru k = 1 : p 

1. [c,A(k : m,k),β k ] = Hc(A(k : m,k)) 

2. f k = c 1 

3. Dacă k < n atunci 

1. A(k : m,k +1 : n) = 

= Hcs(A(k : m,k),β k ,A(k : m,k +1 : n)) 


1. [c,v,γ k+1 ] = Hc((A(k,k +1 : n)) T ) 

2. A(k,k +1 : n) = v T 

3. g k = c 1 

4. A(k +1 : m,k +1 : n) = 

= Hcd(A(k : m,k +1 : n),v,γ k+1 ) 

5. g n−1 = A(n−1,n) 

3. Dacă m = n atunci 

1. f n = A(n,n) 

4. U = I m , V = I n 

5. Dacă opt 1 = ′ da ′ atunci 

1. Pentru k = p : −1 : 1 

1. U(k : m,k : m) = Hcs(A(k : m,k),β k ,U(k : m,k : m)) 


1. Pentru k = n−2 : −1 : 1 

1. V(k +1 : n,k +1 : n) = 

= Hcs((A(k,k+1 : n)) T ,γ k+1 ,V(k +1 : n,k +1 : n))


Comentarii. Semnalăm, în primul rând, faptul că vectorul ũ k ce defineşte reflectorul 

hermitic Ũk (din structurareflectorului U k ) este memorat înlocaţiile (k : m,k) 

ale matricei A. Pentru a fi posibil acest lucru, în afara elementelor (k +1 : m,k), 

anulate la pasul curent k de către U k , este utilizată şi locaţia (k,k), ceea ce presupune 

salvarea prealabilă a elementului diagonal calculat a kk 

def 

= f k . Similar, 

vectorul ṽ k+1 definitoriu pentru reflectorul Ṽk+1 = I n−k − ṽk+1ṽk+1 

H , este memorat 

γ k+1 

def 

în locaţiile (k,k +1 : n) după ce, în prealabil, a fost salvat elementul a k,k+1 = g k . 

Pentru a face posibil acest lucru fără modificarea procedurilor utilizate a fost introdus 

un vector de lucru c. De asemenea, pentru a nu introduce o nouă procedură 

de calcul a unui reflector care să anuleze componentele (2 : n) ale unui vector linie 

n-dimensional, s-a utilizat un vector de lucru v. 

Sintaxa de utilizare a algoritmului de mai sus este 

[f,g,U,V ] = JQc(A,opt 1 ,opt 2 ). 

În cazul datelor iniţiale reale, toate matricele de transformare sunt reale, i.e. ortogonale, 

iar algoritmul de mai sus se adapteazăprin simpla substituire a procedurilor 

pentru date complexe cu cele pentru date reale (concret, se înlocuieşte sigla c din 

numele procedurilor cu sigla r). De aceeea ne mărginim să prezentăm pentru acest 

caz numai sintaxa de utilizare 

[f,g,U,V ] = JQr(A,opt 1 ,opt 2 ). 

Efortul de calcul asimptotic implicat de execuţia variantei reale, fără acumularea 

transformărilor, este N op = 4mn 2 − 4 3 n3 flopi, iar în cazul complex, dacă avem 

în vedere echivalările operaţiilor cu numere complexe cu cele cu numere reale (v. 

cap. 4), de câteva ori mai mare. Tot în varianta reală, pentru calculul matricei de 

transformare U, sunt necesare N ′ op = 4m 2 n− 4 3 n3 flopi, respectiv, pentru calculul 

matricei de transformare V se execută N op ′′ = 4 3 n3 flopi suplimentari. De reţinut 

ordinea inversăde acumulareatransformărilorcare este mai economică, exploatând 

”umplerea” progresivă a matricelor de transformare. 

✸ 

Observaţia 5.4 În cazul în care m ≫ n este posibilă o uşoară îmbunătăţire a 

eficienţei dacă înaintea aplicării algoritmului JQ are loc o prealabilă triangularizare 

unitară(ortogonală)amatriceiA. Concret, procedura,numită”R-bidiagonalizare”, 

este următoarea. 

[ ] 

RJQ 1. Se efectuează triangularizarea unitară Q H R1 

A = R = , 

0 

cu R 1 o matrice n×n superior triunghiulară. 

2. [f,g,Ũ,V ] = JQ(R 1,opt 1 ,opt 2 ) 


1. U = Qdiag(Ũ,I m−n).


Complexitatea acestei proceduri este apreciată, pentru date reale, la Nop R ≈ 2mn2 + 

+2n 3 , fără acumularea transformărilor. Rezultă N op − Nop R = 2n 2 (m − 5 3n), i.e. 

R-bidiagonalizarea devine asimptotic mai eficientă dacă m > 5 3n. Consideraţii 

similare asupra complexităţii se pot face şi pentru diverse variante de acumulare a 

transformărilor (vezi [VI]). 

✸ 

Observaţia 5.5 Utilizând reflectori complecşi nehermitici (vezi cap. 3) adecvat 

calculaţi, este posibilă reducerea unei matrice complexe la o matrice bidiagonală 

reală prin transformăriunitare de echivalenţă. Această versiune a algoritmului JQc 

permite utilizarea exclusivă a unei aritmetici reale în faza iterativă a algoritmului 

DVS şi este folosită, de exemplu, în pachetul de programe LAPACK. Detaliile 

algoritmului fac obiectul exerciţiului 5.15. 

✸ 

5.3.2 Faza iterativă a algoritmului DVS 

Faza iterativă construieşte un şir de matrice 

J = J 1 , J 2 , ···, J k , ··· (5.74) 

[ ] 

Σ1 0 

convergent către matricea diagonală reală Σ= , Σ 

0 0 1 =diag(σ 1 ,σ 2 ,...,σ r ), 

astfel încât şirul matriceal 

T 1 = J H 1 J 1 , T 2 = J H 2 J 2 , ..., T k = J H k J k , ... (5.75) 

este şirul QR simetric cu deplasare implicită convergent către forma Schur 

[ ] Σ 

2 

S = 1 0 

∈ R 

0 0 

n×n (5.76) 

a matricei tridiagonale hermitice (simetrice) T = T 1 . 

A. Un pas DVS 

Presupunem, în continuare, că matricea superior bidiagonală J ∈ IC m×n este dată 

prin vectorii f ∈ IC n şi g ∈ IC n−1 conform (5.73). Având în vedere faptul că transformările 

ce definesc un pas QR conservă structura tridiagonală a matricelor T k , 

anticipăm afirmând că un pas DVS va conserva structura bidiagonală astfel încât 

toate calculele (mai puţin acumularea transformărilor) pot avea loc în locaţiile de 

memorie ale vectorilor f şi g. 

Vom determina transformările vectorilor f şi g aferente unui pas DVS prin 

transferarea către aceştia a aplicării unui pas al algoritmului QR simetric cu deplasare 

implicită matricei tridiagonale 

T def 

= T k = J H k J k 

def 

= J H J. (5.77) 

În primul rând, aplicabilitatea variantei cu deplasare implicită este condiţionată 

de ireductibilitatea matricei T (sau, mai bine zis, iteraţia se aplică numai părţii 

ireductibile a matricei T). Ţinând seama de faptul că 

t i,i+1 = ¯f i g i , t i+1,i = f i ḡ i , i = 1 : n−1, (5.78)


condiţia de ireductibilitate devine 

f i ≠ 0, g i ≠ 0, i = 1 : n−1. (5.79) 

În conformitate cu cele prezentate în capitolul precedent (vezi secţiunea 4.8), 

un pas QR simetric cu deplasare implicită presupune transformările prezentate 

mai jos. Prezentăm, în paralel, efectele acestor transformări la nivelul vectorilor f 

şi g care definesc matricea bidiagonală J, evidenţiind astfel ideile unui pas DVS 

Golub-Kahan. 

1. Calculul deplasării 

µ = t nn = |g n−1 | 2 +|f n | 2 (5.80) 

sau, mai bine, al deplasării Wilkinson, care este valoarea proprie a matricei 

[ 

|gn−2 | 

T(n−1 : n,n−1 : n) = 

2 +|f n−1 | 2 ¯f ] [ ] 

n−1 g n−1 not α β 

f n−1 ḡ n−1 |g n−1 | 2 +|f n | 2 = ¯β γ 

(5.81) 

cea mai apropiată de t nn . Concret, această deplasare are expresia 

µ = γ +δ −sgn(δ) √ δ 2 +|β| 2 , δ = α−γ , (5.82) 

2 

şi se calculează economic şi fiabil cu relaţiile 

δ = |g n−2| 2 +|f n−1 | 2 −|g n−1 | 2 −|f n | 2 

, η = |f n−1 | 2 |g n−1 | 2 , 

2 

µ = |g n−1 | 2 +|f n | 2 + 

În cazul real, particularizările se obţin imediat. 

η 

δ +sgn(δ) √ δ 2 +η . (5.83) 

2. Se calculează matricea unitară U 1 astfel încât prima sa coloană U 1 e 1 să coincidă 

cu prima coloană a matricei de transformare care defineşte un pas QR simetric 

cu deplasare explicită, i.e. 

⎡ 

U 1 e 1 = ρ 

⎢ 

⎣ 

t 11 −µ 

t 21 

0 

. 

0 

⎤ 

⎡ 

= ρ 

⎥ ⎢ 

⎦ ⎣ 

|f 1 | 2 −µ 

f 1 ḡ 1 

0 

. 

0 

⎤ 

, (5.84) 

⎥ 

⎦ 

unde ρ esteun factorscalarde normare. Introducândvectorul de deplasare implicită 

aferent unui pas DVS 

[ ] [ ] 

w def t11 −µ |f1 | 

= = 

2 −µ 

, (5.85) 

t 21 f 1 ḡ 1


matricea U 1 poate fi o rotaţie (complexă) P 12 = diag(˜P 12 ,I m−2 ) astfel încât 

[ ] 

˜P 12w H ∗ 

= . (5.86) 

0 

3. Calculul matricei T ← C = P H 12 TP 12, care altera structura tridiagonală în 

poziţiile (3,1) şi (1,3), se transferă în calculul matricei 

K = JP 12 (5.87) 

care evidenţiază o alterare a matricei superior bidiagonale în poziţia (2,1). 

4. Aplicarea algoritmului TQ matricei C, pentru refacerea structurii tridiagonale 

a matricei C se transferă, în cadrul unui pas DVS, în aplicarea unui algoritm 

JQ adaptat pentru refacereastructurii superior bidiagonalea matricei J prin transformări 

unitare bilaterale 

J ← J ′ = U H n−1U H n−2···U H 1 KV 2···V n−1 , (5.88) 

unde U k , V k pot fi rotaţii (complexe) sau reflectori (complecşi). Schema de calcul 

este următoarea. 

1. Pentru k = 1 : n−1 

def 

1. Se calculează rotaţia U k = P k,k+1 astfel încât 

(Uk H K)(k +1,k) = 0 

2. K ← Uk H K % Se anulează elementul (k +1,k) şi 

% se alterează zeroul din poziţia (k,k +2) 

3. Dacă k < n−1 

def 

1. Se calculează rotaţia V k+1 = P k+1,k+2 astfel încât 

(KV k+1 )(k,k +2) = 0. 

2. K ← KV k+1 % Se anulează elementul (k,k +2) şi 

% se alterează zeroul din poziţia (k +2,k +1) 

Pentru a exemplifica adaptarea algoritmului JQ la situaţia structurală caracteristică 

unei iteraţii DVS cu deplasare implicită, considerăm cazul dimensional 

m = 5, n = 3. Ca şi până acum, încadrările indică liniile sau coloanele afectate, 

” + ” zerourile alterate, iar ”∅” elementele anulate, toate referindu-se la transformarea 

curentă. 

⎡ 

J = 

⎢ 

⎣ 

⎡ 

J ← U1 H J = ⎢ 

⎣ 

× × 0 

0 × × 

0 0 × 

0 0 0 

0 0 0 

× × + 

∅ × × 

0 0 × 

0 0 0 

0 0 0 

⎤ 

⎡ 

⎥ 

⎦ , J ← JP 12 = 

⎢ 

⎣ 

⎤ 

⎡ 

, J ← JV 2 = 

⎥ ⎢ 

⎦ ⎣ 

× × 

+ × 

0 0 

0 0 

0 0 

× 

0 

0 

0 

0 

0 

× 

× 

0 

0 

× ∅ 

× × 

+ × 

0 0 

0 0 

⎤ 

, 

⎥ 

⎦ 

⎤ 

, 

⎥ 

⎦


⎡ 

J ← U2 H J = 

⎢ 

⎣ 

× × 0 

0 × × 

0 ∅ × 

0 0 0 

0 0 0 

Matricea succesor K = J ′ este bidiagonală şi 

⎤ 

. 

⎥ 

⎦ 

şi 

T ′ = J ′H J ′ = (U H n−1···UH 1 JP 12V 2···V n−1 ) H U H n−1···UH 1 JP 12V 2···V n−1 = 

= V H n−1···V H 

2 P H 12J H U 1···U n−1 U H n−1···U H 1 JP 12 V 2···V n−1 = Q H J H JQ (5.89) 

Qe 1 = P 12 V 2···V n−1 e 1 = P 12 e 1 (5.90) 

este aceeaşi cu cea corespunzătoare pasului QR simetric implicit pentru matricea 

tridiagonală T. 

În consecinţă, matricea J k = J, care defineşte şirul DVS este astfel calculată 

încât matricea T k = J H k J k defineşte şirul QR pentru matricea hermitică B = A H A 

şi, prin urmare, este convergent la forma diagonală. 

În conformitate cu cele prezentate mai sus, o iteraţie DVS este implementată 

de următorul algoritm. 

Algoritmul 5.2 (IT DVSc – Un pas DVS Golub-Kahan) (Daţi 

vectorii f ∈ IC n şi g ∈ IC n−1 care definesc matricea bidiagonală (5.73) 

şi matricele unitare U ∈ IC m×m şi V ∈ IC n×n , algoritmul calculează 

matricea succesor J ← J ′ = Q H JQ din şirul DVS, mai exact, noii 

vectori f ′ şi g ′ care suprascriu vectorii f şi g. Opţional, se actualizează 

matricele U şi/sau V. Opţiunea se exprimă prin intermediul variabilelor 

logice opt 1 şi opt 2 , care pot lua valorile logice ’da’ şi ’nu’. Dacă nu se 

doreşte actualizarea, matricele U şi/sau V se returnează nemodificate.) 


1. δ = (|g n−2 | 2 +|f n−1 | 2 −|g n−1 | 2 −|f n | 2 )/2 

2. η = |f n−1 | 2 |g n−1 | 2 

3. µ = |g n−1 | 2 +|f n | 2 η 

+ 

δ +sgn(δ) √ δ 2 +η 

[ ] 

|f1 | 

2. w = 

2 −µ 

f 1 ḡ 1 

3. [w,c,s] = Gc(w) 

4. % Se calculează J ← JP 12 . Fie τ elementul nenul care alterează 

structura bidiagonală 

1. α ← f 1 c−g 1¯s 

2. g 1 ← f 1 s+g 1 c 

3. f 1 ← α 

4. τ ← −f 2¯s


5. f 2 ← f 2 c 


1. V(:,1 : 2) = Gcd(V(:,1 : 2),c,s) 

6. % Reducerea la forma bidiagonală 

Pentru k = 1 : n−1 

[ ] [ ] 

fk fk 

1. [ ,c,s] = Gc( ) 

τ τ 

2. α ← cg k −sf k+1 

3. f k+1 ← ¯sg k +cf k+1 

4. g k ← α 


1. τ ← −sg k+1 

2. g k+1 ← cg k+1 


1. U(:,k : k +1) = Gcd(U(:,k : k +1),c,s) 


1. [v,c,s] = Gc( 

[ 

gk 

τ 

] 

) 

2. g k = v 1 

3. α ← f k+1 c−g k+1¯s 

4. g k+1 ← f k+1 s+g k+1 c 

5. f k+1 ← α 

6. τ ← −f k+2¯s 

7. f k+2 ← f k+2 c 


1. V(:,k +1 : k +2) = Gcd(V(:,k +1 : k +2),c,s) 

Comentarii. Sintaxa de apel utilizată în continuare va fi în cazul complex 

şi 

[f,g,U,V ] = IT DVSc(f,g,U,V,opt 1 ,opt 2 ) 

[f,g,U,V ] = IT DVSr(f,g,U,V,opt 1 ,opt 2 ) 

în cazul real, care se obţine prin înlocuirea procedurilor complexe apelate cu corespondentele 

lor reale şi renunţarea la operaţia de conjugare. Numărul de operaţii 

necesar pentru execuţia unui pas DVS real este N op ≃ 2n √ + 30n dacă nu se 

acumulează transformările, N op ′ ≃ 6mn operaţii sunt necesare pentru acumularea 

matricei U şi, respectiv, N op ′′ ≃ 6n 2 pentru acumularea matricei V. ✸ 

Observaţia 5.6 În cadrul algoritmului DVS, iteraţia DVS curentă, implementă 

de algoritmul de mai sus, va acţiona numai asupra unei părţi a matricei bidiagonale 

(aşa numitul bloc diagonal ireductibil). Această acţiune are ca efect modificarea 

la fiecare iteraţie numai a anumitor coloane a matricelor de transformare U şi V.


Având în vedere acest fapt, suntem interesaţi să accceptăm ca parametri de intrare 

şide ieşirepentrualgoritmulIT DVSc matriceU şi V cuun numărde liniisuperior 

celui precizat în preambulul algoritmului. Utilizarea în instrucţiunile 5.1, 6.6.1 şi 

6.7.8.1 a simbolului ”:” cu semnificaţia de ”toate liniile” face ca să nu fie necesare 

nici un fel de modificări ale algoritmului. Acelaşi mecanism de simbolizare permite 

o codificare directă a algoritmului în MATLAB. Pentru alte limbaje de programare 

se vor face precizările de indexare ce se impun. 

✸ 

B. Algoritmul DVS 

Algoritmul DVS constă din paşii iterativi Golub-Kahan aplicaţi părţii ireductibile 

a matricei bidiagonale J, anularea elementelor diagonale şi supradiagonale devenite 

neglijabile, conform unui criteriu acceptat, şi reducerea, pe această bază, a dimensiunii 

problemei de diagonalizare, până la epuizare. În final, după un număr finit 

20 

de paşi, se obţine o matrice diagonală a cărei DVS se obţine imediat. În legătură cu 

moduldegestionarestructuralăamatriceicurenteaşiruluiDVS facemurmătoarele 

precizări. 

1. Pentru deciziile de anulare a elementelor supradiagonale se poate utiliza 

următorul criteriu 

Dacă |g i | ≤ tol(|f i |+|f i+1 |) atunci g i = 0. (5.91) 

2. Tratarea situaţiilor în care condiţiile de ireductibilitate (5.79) ale matricei 

T = J H J nu sunt satisfăcute se face diferenţiat în funcţie de faptul că elementul 

nul se află pe supradiagonală sau pe diagonală. În continuare, referirile le facem la 

matricea bidiagonală J iniţială definită de vectorii f ∈ IC n şi g ∈ IC n−1 . 

– Dacă este nul un element terminal al vectorului g, i.e. g 1 = 0 sau g n−1 = 0, 

atunci problema se reduce, evident, la o problemă de dimensiune inferioară cu o 

unitate. Dacă ambele elemente terminale menţionate sunt nule, atunci dimensiunea 

problemei reduse este n−2. 

– Dacă există un singur element supradiagonalneterminal nul, i.e. g i = 0 pentru 

un i ∈ 2 : n−2, atunci matricea J se scrie sub forma 

[ ] 

J1 0 

J = , J 

0 J 1 ∈ IC i×i , J 2 ∈ IC (n−i)×(n−i) , (5.92) 

2 

cu matricele J H 1 J 1 şi J H 2 J 2 tridiagonale ireductibile, i.e. problema se sparge în 

două probleme de aceeaşi natură dar de dimensiuni mai mici. Dacă sunt mai multe 

elemente supradiagonale nule, atunci problema îşi reduce, similar, dimensiunea sau 

se sparge în două sau mai multe probleme de dimensiuni mai mici. 

– Dacă există un singur element diagonal nul, i.e. f i = 0 pentru un i ∈ 1 : n−1, 

atunci existăoprocedurăcare, prin transformăriunitare (e.g. osecvenţăde rotaţii), 

anulează şi elementul supradiagonal de pe aceeaşi linie, creând astfel posibilitatea 

divizării problemei ca în (5.92). Schema de calcul este următoarea. 

20 Datorită deciziilor de anulare efectivă a elementelor neglijabile.


TZD 

% Tratarea zerourilor diagonale. 

1. Pentru j = i+1 : n 

1. Se calculează rotaţia ”modificată” P ij astfel încât 

(P H 

ij 

2. J ← P H 

ij 

J)(i,j) = 0. 

J % Se anulează elementul (i,j) şi, pentru j < n, 

este alterat zeroul din poziţia (i,j +1). 

3. Dacă se doreşte acumularea transformărilor, atunci 

U ← UP ij . 

Exemplificăm modul de acţiune al procedurii de mai sus pentru cazul dimensional 

cu n = 4 şi cu zeroul diagonal în poziţia (2,2). 

⎡ 

J ← P 23 J = ⎢ 

⎣ 

J = 

× × 0 0 

0 0 ∅ + 

0 0 × × 

0 0 0 × 

⎡ 

⎢ 

⎣ 

× × 0 0 

0 0 × 0 

0 0 × × 

0 0 0 × 

⎤ 

⎤ 

⎥ 

⎦ , 

⎡ 

⎥ 

⎦ , J ← P 24J = 

⎢ 

⎣ 

× × 0 0 

0 0 0 ∅ 

0 0 × × 

0 0 0 × 

În vederea scrierii mai concise a algoritmului DVS vom introduce un algoritm 

auxiliar de tratare a zerourilor diagonale, care implementează schema de calcul 

TZD . Pentru scrierea lui avem nevoie de o procedură de calcul a unei rotaţii 

”modificate”. Concret, rotaţia (complexă) ”modificată” pe care o vom utiliza este 

o matrice unitară de ordinul 2 cu structura cunoscută 

[ ] c s 

P = , cu c ∈ IR, s ∈ IC, c 

−¯s c 

2 +|s| 2 = 1, (5.93) 

care, pentru un vector z ∈ IC 2 dat asigură 

⎤ 

⎥ 

⎦ . 

(P H z)(1) = 0. (5.94) 

Făcândapellarezultatelestabilite încapitolul3, nuestegreudevăzutcărelaţiilede 

calculalescalarilorcşis, careasigurăsatisfacereacondiţiei(5.94),sunturmătoarele. 

⎧ 

⎧ 

1, dacă z ⎪⎨ 1 = 0, 

0, dacă z ⎪⎨ 

1 = 0, 

c = 

0, dacă z 1 ≠ 0, z 2 = 0, 

s = 

1, dacă z 1 ≠ 0, z 2 = 0, 

⎪⎩ |z 2 | 

r , dacă z z 

1 ≠ 0, z 2 ≠ 0, 

⎪⎩ 1¯z 2 

|z 2 |r , dacă z 1 ≠ 0, z 2 ≠ 0, 

r = √ |z 1 | 2 +|z 2 | 2 , (P H z)(2) = rz 2 

|z 2 | . 

(5.95) 

Calculul elementelor definitorii de mai sus va fi însoţit de calculul z ← P H z astfel 

încât sintaxa propusă pentru această procedură este 

[y,c,s] = Gcm(z),


suprascrierea(internăa)lui z realizându-secuapelul[z,c,s] = Gcm(z). Particularizarea 

pentru date reale este propusă cititorului, aici mărginindu-ne să introducem 

numai sintaxa de utilizare 

[y,c,s] = Grm(z). 


Algoritmul 5.3 (TZDc – Tratarea zerourilor diagonale) (Date 

matricea superior bidiagonală J ∈ IC m×n cu m ≥ n, prin vectorii f şi g 

al elementelor diagonale, respectiv supradiagonale, şi matricea unitară 

U ∈ IC m×m , precum şi întregul i ∈ 1 : n − 1 ce indică poziţia ultimului 

element diagonal nul, algoritmul calculează rotaţiile (complexe) P i,j , 

j = i+1 : n, astfel încât matricea J ← Pi,n H ...PH i,i+1J rămâne bidiagonală, 

iar elementul g i devine nul. Calculele principale se efectuează 

în locaţiile de memorie ale elementelor vectorilor f şi g. Opţional, se 

actualizează matricea unitară de transformare U. Opţiunea se exprimă 

cu ajutorul variabilei logice opt, care poate lua valorile ’da’ sau ’nu’. 

Dacănusedoreşteactualizarea,matriceaU sereturneazănemodificată.) 

1. τ = g i 

2. g i = 0 

3. Pentru j = i+1 : n 

1. z = [τ f j ] T 

2. [z,c,s] = Gcm(z) 

3. f j = z 2 

4. Dacă j < n atunci 

1. τ = −sg j 

2. g j ← cg j 


1. Pentru l = 1 : m 

1. α = u li c−u lj¯s 

2. u lj ← u li s+u lj c 

3. u li = α. 

Comentarii. În algoritmul de mai sus variabila scalară τ a fost utilizată pentru 

memorarea elementului alterant temporar al structurii bidiagonale, iar variabila 

auxiliară scalară α pentru calculul produsului U ← UP ij . Algoritmul nu verifică 

faptul că f i = 0 sau că nu există j > i astfel ca f j = 0. Este clar faptul că dacă nu 

sunt îndeplinite condiţiile din preambulul algoritmului, acesta nu realizează scopul 

pentru care a fost elaborat. 

Sintaxa de apel a algoritmului este, evident, 

[f,g,U ] = TZDc(f,g,i,U,opt). 

Complexitatea algoritmului este O(n−i) fără acumularea transformărilor şi O(mn) 

cu acumulareaacestora. Se poate apreciacăalgoritmulare, îngeneral, o contribuţie 

modestă la complexitatea algoritmului DVS.


În cazul datelor reale, algoritmul se particularizează fără dificultate, utilizând 

procedura de calcul a unei rotaţii modificate reale, menţionată mai sus. Ca atare, 

ne mărginim la precizarea sintaxei de apel: 

[f,g,U ] = TZDr(f,g,i,U,opt). 

În ambele situaţii, utilizându-se exclusiv transformări unitare, respectiv ortogonale, 

precizia rezultatelor nu este afectată semnificativ. 

✸ 

3. La fiecare iteraţie, după deciziile de anulare a elementelor supradiagonale 

neglijabile şi după tratarea elementelor diagonale nule, se determină parametrii 

structurali p şi q astfel încât matricea J curentă să poată fi scrisă sub forma 

J = 

p 

{}}{ n−p−q 

{}}{ 

⎡ 

⎢ 

⎣ 

q 

{}}{ 

⎤ 

J 11 0 0 

0 J 22 0 

0 0 J 33 

0 0 0 

⎥ 

⎦ 

}p 

}n−p−q 

}q 

}m−n 

(5.96) 

unde p este cel mai mic întreg, iar q cel mai mare întreg astfel încât blocul J 33 

este diagonal, iar blocul bidiagonal J 22 este ireductibil, i.e. are toate elementele 

supradiagonale nenule şi toate elementele diagonale (mai puţin, eventual, ultimul), 

de asemenea, nenule. În termenii vectorilorf şi g, prin careeste memoratămatricea 

J, condiţiile de mai sus devin 

g(n−q+1: n−1) = 0, g i ≠ 0, i = p+1 : n−q, f i ≠ 0, i = p+1 : n−q−1. 

(5.97) 

Evident, iteraţia DVS curentă se aplică numai blocului ireductibil J 22 , i.e. 

J 22 ← J ′ 22 = U H 22J 22 V 22 (5.98) 

care este echivalentă cu următoareatransformareunitară bilaterală aplicată intregii 

matrice J 

J ← J ′ = diag(I p ,U 22 ,I m−p−q ) H Jdiag(I p ,V 22 ,I n−p−q ). (5.99) 

Dacă blocul ireductibil J 22 are dimensiunea 2×2 atunci devine mai eficient calculul 

direct al DVS a acestuia. Având în vedere faptul că în acest caz matricea 2 × 2 

este şi triunghiulară propunem cititorului scrierea unei proceduri care să realizeze 

acest lucru (caz particular al exerciţiului 5.2). Aici ne vom mărgini la specificarea 

sintaxei de apel a acestei proceduri care va fi utilizată 

[f,g,U,V ] = DVS 2(f,g) 

unde, evident, f este un vector cu două elemente, iar g este un scalar anulat de 

procedură. 

4. Procesul de diagonalizare se termină în momentul în care au fost anulate 

toate elementele supradiagonale, i.e. toate componentele vectorului g, sau, altfel 

spus, când parametrul structural q ia valoarea n−1.


5. Dupăîncheiereaprocesuluidediagonalizare,elementelediagonalealematricei 

limită J ← J ∞ , i.e. componentele vectorului f, sunt, în general, complexe. Pentru 

a obţine o matrice diagonală reală cu elementele diagonale nenegative se aplică o 

transformare de echivalenţă unitară definită de 

J ← ˜DJ sau J ← JD, (5.100) 

unde ˜D = diag(D,I m−n ) cu 21 

⎧ 

⎨ 

D = diag(d 1 ,d 2 ,...,d n ), d i = 

⎩ 

1, dacă f i = 0 

¯f i 

|f i | , dacă f i ≠ 0. 

(5.101) 

După această transformare elementele diagonale ale matricei J, i.e. elementele 

vectorului f sunt valorile singulare ale matricei iniţiale. 

6. Prin definiţie, în DVS, valorile singulare apar ordonate descrescător. De 

aceea, în finalul algoritmului DVS se realizează ordonarea elementelor diagonale 

utilizând o secvenţă de permutări elementare bilaterale (i.e. diagonale), definită de 

matricele de permutare U P = diag(P,I m−n ), V P = P şi un algoritm de ordonare 

a listelor. Având în vedere faptul că ordonarea are o pondere puţin semnificativă 

în economia algoritmului DVS, vom utiliza un algoritm popular de sortare, anume 

algoritmul bubblesort, şi, din aceleaşi motive de concizie a formulării algoritmului 

DVS, vom prezenta un algoritm separat de ordonare. 

Algoritmul 5.4 (DVS ORD – Ordonarea valorilor singulare) 

(Date matricea diagonală J, prin vectorul f ∈ IR n al elementelor diagonale, 

şi matricele unitare U ∈ IC m×m şi V ∈ IC n×n , algoritmul realizează 

ordonarea în sens descrescător a elementelor vectorului f, folosind algoritmul 

de sortare bubblesort. Opţional, se actualizează matricele 

unitare de transformare U şi/sau V, prin permutarea coprespunzătoare 

a coloanelor acestora. Opţiunea se exprimă cu ajutorul variabilelor logice 

opt 1 şi opt 2 care pot lua valorile ’da’ sau ’nu’. Dacă nu se doreşte 

actualizarea, matricele U şi/sau V se returnează nemodificate.) 

1. ord = ′ nu ′ 

2. i = 1 

3. Cât timp ord = ′ nu ′ şi i < n 

1. ord = ′ da ′ 

2. Pentru j = n−1 : −1 : i 

1. Dacă f j < f j+1 atunci 

1. f j+1 ↔ f j 

21 În cazul real, matricea diagonală J ∞ este reală, dar poate avea elemente diagonale negative. 

Evident, în această situaţie utilizăm transformarea de echivalenţă ortogonală definită de matricea 

D având 

{ 1, dacă fi ≥ 0, 

d i = 

−1, dacă f i < 0.



1. U(:,j) ↔ U(:,j +1) 


1. V(:,j) ↔ V(:,j +1) 

4. ord = ′ nu ′ 

3. i ← i+1. 

Comentarii. Variabila logică ord reprezintă starea procesului de ordonare şi este 

familiară celor care utilizează curent algoritmul de sortare menţionat. Sintaxa de 

apel a algoritmului va fi 

[f,U,V ] = DVS ORD(f,U,V,opt 1 ,opt 2 ). 

Evident, nuseefectueazăoperaţii aritmetice. Numărulmaximposibil decomparaţii 

este 1 2n(n−1). Desigur, se pot folosi algoritmi de sortare mai sofisticaţi dar câştigul 

nu este semnificativ pentru matrice de dimensiuni curente. ✸ 

Avându-se în vedere faptul că matricele de permutare sunt ortogonale, matricea 

finală 

⎡ ⎤ 

ˆσ 1 0 ··· 0 

0 ˆσ 2 ··· 0 

ˆΣ def 

. 

= diag(P T ,I m−n )JP = 

. . .. . 

0 0 ··· ˆσ n 

(5.102) 

⎢ . . . . ⎥ 

⎣ . . . . ⎦ 

0 0 ··· 0 

împreună, cu matricele unitare Û = Udiag(P,I m−n), ˆV = VP definesc DVS calculată 

a matricei iniţiale. 

Cu toate precizările de mai sus şi utilizând algoritmii auxiliari introduşi, putem 

prezenta algoritmul DVS în integralitatea lui. 

Algoritmul 5.5 (DVSc – Descompunerea valorilor singulare) 

(Date matricea A ∈ IC m×n cu m ≥ n şi nivelul de toleranţă tol, algoritmul 

calculează valorile singulare ale matricei A care sunt elementele 

vectorului f ∈ IR n şi opţional matricele de transformare U ∈ IC m×m 

şi/sau V ∈ IC n×n , care definesc DVS a matricei A. Opţiunea se exprimă 

cu ajutorul variabilelor logice opt 1 şi opt 2 care pot lua valorile ’da’ sau 

’nu’. Dacănu se doreşteacumularea,atunci pentru matricearespectivă 

se returnează matricea unitate de dimensiune corespunzătoare.) 

1. % Cazul matricelor coloană 

Dacă n = 1 atunci 

1. [A,u,β] = Hc(A) 

2. f = |A(1,1)| 

3. U = I m , V = 1 

4. Dacă opt 1 = ′ da ′ şi β ≠ 0 atunci 

U = I m − u·uH 

β


5. Dacă opt 2 = ′ da ′ şi β ≠ 0 atunci 

V = Ā(1,1) 

f 

6. Return 

2. % Reducerea la forma bidiagonală 

[f,g,U,V ] = JQc(A,opt 1 ,opt 2 ) 


1. p = 0, q = 0 

2. Cât timp q < n−1 

1. Pentru i = 1 : n−q −1 

1. Dacă |g i | ≤ tol(|f i |+|f i+1 |) atunci 

g i ← 0 

2. % Determinarea parametrului q 

1. Cât timp g(n−q −1) = 0 

q ← q +1 

2. Dacă q = n−1 atunci break 

3. % Terminarea fazei iterative 

1. Dacă q = n−1 atunci break 

4. % Determinarea parametrului p 

1. p = n−q −1 

2. Cât timp g(p) = 0 

1. p ← p−1 


5. k = p+1, l = n−q 

6. % Tratarea unui zero diagonal (dacă există) 

1. j = 0 

2. Pentru i = l−1 : −1 : k 

1. Dacă f i = 0 atunci 

1. j = i−k +1 

2. break 

3. Dacă j > 0 

1. [f(k : l),g(k : l−1),Z] = 

= TZDc(f(k : l),g(k : l−1),j,I l−k+1 ,opt 1 ) 


U(:,k : l) ← U(:,k : l)Z 

altfel 


Dacă k < l−1 atunci 

[f(k : l),g(k : l−1),U(:,k : l),V(:,k : l)] = 

= IT DVSc(f(k : l),g(k : l−1),U(:,k : l), 

V(:,k : l),opt 1 ,opt 2 ) 

altfel


1. [f(k : l),g(k : l−1),Y,Z] = 

= DVS 2(f(k : l),g(k : l−1)) 


U(:,k : l) ← U(:,k : l)Y 


V(:,k : l) ← V(:,k : l)Z 

4. % Calculul valorilor singulare ale matricei diagonale obţinute în 

faza iterativă 



1. Dacă f j ≠ 0 atunci 

1. d = ¯f j 

|f j | 

2. V(: ,j) = V(:,j)d 

2. f j = |f j | 

5. % Ordonarea valorilor singulare 

1. [f,U,V ] = DVS ORD(f,U,V,opt 1 ,opt 2 ) 

Comentarii. Comentariile incluse pun în evidenţă ideile care au stat la baza elaborării 

algoritmului. Din punct de vedere tehnic semnalăm utilizarea instrucţiunii 

break de abandonare a execuţiei ciclurilor de tip pentru sau de tip cât timp. 

O sintaxă de apel naturală a algoritmului DVSc este, evident, 

[f,U,V ] = DVSc(A,tol,opt 1 ,opt 2 ). 

Algoritmul DVSc calculează DVS şi pentru matrice reale 22 deşi pentru date reale 

este mai economică o versiune ”reală” a algoritmului, care se obţine simplu prin 

utilizarea corespondentelor reale ale procedurilor implicate. 

De asemenea, din raţiuni de concizie şi claritate, în cele ce urmează vom utiliza 

şi sintaxa (poate chiar mai semnificativă) 

[U,Σ,V ] = DVSc(A,opt 1 ,opt 2 ), 

care presupune unele ajustări minore ale algoritmului de mai sus, cum sunt introducerea 

unei toleranţe implicite (de obicei de nivelul lui ε M ‖A‖) şi formarea matricei 

diagonale Σ ∈ IR m×n din definiţia DVS ale cărei elemente diagonale sunt elementele 

vectorului f. Ordinea modificată a parametrilor de ieşire sugerează formula DVS. 

Complexitatea estimată a algoritmului DVS, conform [VI], este dată în tabelul 

5.1 pentru varianta reală cu date de intrare matrice reale m×n şi diverse tipuri de 

opţiuni. De asemenea, rezultatele sunt date pentru două versiuni ale algoritmului: 

prima versiune utilizează algoritmul de bidiagonalizare JQr (ca mai sus), iar cea 

de a doua algoritmul de R-bidiagonalizare (v. obs. 5.4). 

✸ 

22 Din acest motiv, în referirile ulterioare vom renunţa la caracterul c din siglă.


opt 1 opt 2 N op N op 

versiunea 1 versiunea 2 

’nu’ ’nu’ 4mn 2 − 4 3 n3 2mn 2 +2n 3 

’da’ ’nu’ 4m 2 n+8mn 2 4m 2 n+13n 3 

’nu’ ’da’ 4mn 2 +8n 3 2mn 2 +11n 3 

’da’ ’da’ 4m 2 n+8mn 2 +8n 3 4m 2 n+22n 3 

Tabelul 5.1: Complexitatea algoritmului DVS 

5.4 Condiţionarea valorilor singulare 

În această secţiune vom aborda câteva aspecte privind sensibilitatea valorilor singulare 

şi a vectorilor singulari la perturbaţii numerice în matricea iniţială. În acest 

scop se vor dovedi utile rezultatele preliminare stabilite în continuare. Ca şi până 

acum,rezultateleşidemonstraţiilevorfiprezentatepentrucazul,maigeneral,almatricelor 

complexe, particularizarea pentru matricele reale (care se reduce, în esenţă, 

la înlocuirea mulţimii IC cu mulţimea IR şi a operatorului hermitic H cu operatorul 

de transpunere T ) fiind lăsată în sarcina cititorului. 

5.4.1 Rezultate preliminare 

Fie matricea A ∈ IC n×n . Valorile singulare ale matricei A[ fiind nemijlocit ] legate 

0 A 

de valorile proprii ale matricelor hermitice A H A, AA H H 

sau multe din 

A 0 

rezultatele stabilite în secţiunea §4.1, referitoare la proprietăţile spectrale ale matricelor 

hermitice (în cazul real, simetrice) îşi găsesc un corespondent direct şi imediat 

în proprietăţile valorilor singulare. Fie V un subspaţiu liniar al lui IC n şi S 

mulţimea vectorilor de normă euclidiană unitară din IC n , i.e. sfera de rază unitară 

centrată în origine. Notăm cu V S = V ∩S, i.e. mulţimea vectorilor de normă unitară 

din subspaţiul V. Reamintim că intotdeauna valorile singulare ale unei matrice 

sunt indexate în sens descrescător. 

În primul rând, teoremei 4.3 îi corespunde următorul rezultat. 

Teorema 5.9 Fie A ∈ IC n×n şi σ(A) = {σ 1 ,σ 2 ,...,σ p }, p = min(m,n), mulţimea 

valorilor sale singulare. Atunci avem 

unde ‖ · ‖ def 

= ‖ · ‖ 2 . 

σ max = max 

x ∈ S ‖Ax‖, 

σ min = min ‖Ax‖, (5.103) 

x ∈ S



B = A H A. 

Rezultatele sunt urmare directă aplicării teoremei 4.3 matricei 

✸ 

În al doilea rând, avem următoarea caracterizare minimax a valorilor singulare 

care îşi are originea în teorema Courant-Fisher (v. §4.1). 

Teorema 5.10 Fie A ∈ IC n×n şi σ(A) = {σ 1 ,σ 2 ,...,σ p }, p = min(m,n), mulţimea 

valorilor sale singulare. Atunci pentru toţi k ∈ 1 : p avem 

σ k = max 

dimV = k 

min ‖Ax‖ = min 

x ∈ V S dimV = n−k 


= ‖ · ‖ 2 este norma euclidiană în IC n . 

max ‖Ax‖, (5.104) 

x ∈ V S 

Demonstraţie. Considerăm matricea hermitică B = A H A. Pentru orice vector 

x ∈ IC n avem x H Bx = ‖Ax‖ 2 şi, presupunând că valorile proprii ale matricei B sunt 

ordonate descrescător, λ k (B) = σk 2 . Cu aceste precizări, caracterizările minimax 

(5.104) rezultă imediat din aplicarea teoremei Courant-Fisher matricei B. ✸ 

Corespondentul teoremei de separare 4.5 are următorul enunţ. 

Teorema 5.11 (Teorema de separare a valorilor singulare) Fie A ∈ IC n×n . Notăm 

def 

def 

A k = A(:,1 : k) sau A k = A(1 : k, :). Atunci valorile singulare ale matricei A k 

separă valorile singulare ale matricei A k+1 , i.e. 

σ 1 (A k+1 ) ≥ σ 1 (A k ) ≥ σ 2 (A k+1 ) ≥ ... ≥ σ k (A k+1 ) ≥ σ k (A k ) ≥ σ k+1 (A k+1 ), 

(5.105) 

pentru toţi k ∈ 1 : p−1, p = min(m,n). 

Demonstraţie. Presupunem mai întâi că A k este matricea formată din primele k 

coloane ale matricei A. Atunci submatricea lider principală de ordinul k a matricei 

B = A H [k] def 

A este dată de B = B(1:k,1:k) = A H k A k şi separarea (5.105) rezultă 

din aplicarea directă a teoremei 4.5 matricei B. Dacă A k este matricea formată din 

primele k linii ale matricei A, atunci inegalităţile (5.105) se obţin aplicând teorema 

4.5 matricei C = AA H . ✸ 

Una din observaţiile imediate care rezultă din teorema 5.11 este aceea că adăugarea 

unei coloane sau unei linii la o matrice dată are ca efect creşterea valorii 

singulare maxime (i.e. a normei spectrale) şi scăderea valorii singulare minime. 

O relaţie dintre valorile singulare a două matrice şi valorile singulare ale sumei 

lor, dată în teorema următoare, este utilă în aprecierea influenţei perturbaţiilor 

numerice în elementele unei matrice asupra valorilor sale singulare. 

Teorema 5.12 Fie matricele A,E ∈ IC n×n . Atunci, cu notaţii evidente, avem 

pentru toţi k ∈ 1 : min(m,n). 

σ k (A)−σ 1 (E) ≤ σ k (A+E) ≤ σ k (A)+σ 1 (E) (5.106)


Demonstraţie. [ ] Aplicând [ teorema ] 4.7 (v. §4.1) matricelor hermitice B = 

0 A 

H 0 E 

H 

= şi F = , în ipoteza că valorile proprii sunt ordonate 

A 0 E 0 

descrescător, avem 

λ k (B)+λ m+n (F) ≤ λ k (B +F) ≤ λ k (B)+λ 1 (F). (5.107) 

Dar, conform propoziţiei 5.1, avem λ k (B) = σ k (A), k = 1 : min(m,n), λ 1 (F) = 

= σ 1 (E) şi λ m+n (F) = −σ 1 (E), i.e. relaţia (5.107) este de fapt una şi aceeaşi cu 

(5.106). Teorema este demonstrată. ✸ 

În sfârşit, prezentăm corespondentul pentru valorile singulare al teoremei 4.8 

(Wielandt-Hoffmann). 

Teorema 5.13 Dacă A,E ∈ IC m×n şi p = min(m,n), atunci 

p∑ 

(σ j (A+E)−σ j (E)) 2 ≤ ‖E‖ 2 F , (5.108) 

j=1 

unde ‖E‖ F este norma Frobenius a matricei E. 

Demonstraţie. [ Aplicând ] teorema[ Wielandt-Hofmann ] (v. §4.1) matricelor hermitice 

B = şi F = şi ţinând seama de relaţia dintre 

0 A 

H 0 E 

H 

A 0 E 0 

valorile proprii ale matricelor B şi F şi valorile singulare ale matricelor A şi E (v. 

propoziţia 5.1) se obţine rezultatul dorit. 

✸ 

5.4.2 Condiţionarea valorilor singulare 

Rezultatele prezentate mai sus permit aprecierea condiţionării valorilor singulare. 

În primul rând, având în vedere faptul că valorile singulare ale unei matrice A ∈ 

∈ IC n×n sunt rădăcinile pătrate ale valorilor proprii ale matricelor hermitice A H A 

sau AA H , iar acestea din urmă sunt perfect condiţionate (v. §4.10), rezultă că şi 

valorile singulare sunt perfect condiţionate, i.e. putem considera că numerele de 

condiţionare ale valorilor singulare sunt egale cu unitatea. 

Rezultatul principal care susţine afirmaţia de mai sus este dat de teorema 5.12. 

Într-adevăr, inegalităţile (5.106) pot fi scrise sub forma 

|σ k (A+E)−σ k (A)| ≤ σ 1 (E) = ‖E‖, (5.109) 

unde, evident ‖E‖ = σ 1 (E) este norma spectrală a lui E. Dacă privim matricea E 

ca o matrice de perturbaţii (sau de incertitudine) în datele iniţiale, atunci marginea 

(5.109) arată că, în ipoteza unui calcul exact, variaţiile absolute ale valorilor singulare 

induse de variaţiile în elementele matricei nu depăşesc norma spectrală a 

matricei de perturbare. Desigur, dacă ne referim la variaţiile relative, valorile singulare 

mari sunt avantajate, în timp ce valorile singulare mici pot să sufere variaţii 

relative mari.


De asemenea, cum era de aşteptat, condiţionarea întregului ansamblu de valori 

singulare, privită ca o normă a vectorului condiţionărilor valorilor singulare, este 

cea mai bună posibilă. În sprijinul acestei afirmaţii vine şi teorema 5.13 care arată 

că norma euclidiană a vectorului variaţiilor absolute ale valorilor singulare este 

inferioară normei Frobenius a matricei variaţiilor elementelor matricei iniţiale. 

[ ] 

1.60 0.36 0.48 

Exemplul 5.4 Fie matricea A = 

∈ IR 2×3 ale cărei valori 

−1.20 0.48 0.64 

singulare exacte sunt σ 1 [ = 2 şi σ 2 = 1. Valorile ] singulare ale matricei [ perturbate ] 

1.60 0.36 0.481 

0 0 1 

F = A+E = A+ǫG = 

, unde ǫ = 10 

−1.20 0.48 0.64 

−3 , G = 

0 0 0 

(cu ‖G‖ = ‖G‖ F = 1), sunt ˆσ 1 ≈ 2.0000002, ˆσ 2 ≈ 1.0004800. Se observă că 

nici variaţiile absolute ale valorilor singulare individuale, nici norma euclidiană a 

vectorului lor √ (ˆσ 1 −σ 1 ) 2 +(ˆσ 2 −σ 2 ) 2 ≈ 0.48·10 −4 nu depăşesc valoarea lui ǫ. ✸ 

Condiţionarea excelentă a valorilor singulare este unul din argumentele fundamentale 

ale utilizării lor pentru rezolvarea numerică a unei multitudini de probleme 

aplicative de algebră liniară. 

5.4.3 Condiţionarea vectorilor singulari 

Similar cazului matricelor hermitice (v. §4.10), perfecta condiţionare a valorilor 

singulare nu implică în mod necesar buna condiţionare a vectorilor singulari şi a 

subspaţiilor generate de aceştia. 

Fie A ∈ IC m×n şi A = U H ΣV descompunerea valorilor sale singulare. Aprecierea 

condiţionării vectorilor singulari, i.e a coloanelor matricelor unitare de transformare 

U şi V, se face prin evaluarea diferenţei unghiulare dintre vectorul exact şi cel 

perturbat, definită prin 

θ(u i ,û i ) = arccos|u H i û i |, i = 1 : m θ(v j ,ˆv j ) = arccos|v H j ˆv j |, j = 1 : n, 

(5.110) 

raportată la norma variaţiei matricei date. 

Această abordare poate fi extinsă la exprimarea condiţionării subspaţiilor generate 

de vectori singulari care este apreciată prin variaţia unghiulară (v. §4.10) 

a subspaţiilor respective. Concret, fiind dată o matrice A şi σ I ⊂ σ(A) un set de 

valori singulare ale acesteia, prin condiţionarea subspaţiului U, generat de vectorii 

singulari asociaţi setului λ I , vom înţelege variaţia unghiulară (sau o margine superioară 

a acesteia) a subspaţiului U raportată la nivelul perturbaţiilor în elementele 

matricei A. 

Condiţionarea subspaţiilor generate de vectori singulari este determinată în 

mod decisiv de localizarea valorilor singulare asociate. Este posibil, şi aici, ca un 

subspaţiu generat de vectori singulari rău condiţionaţi să aibă o condiţionare foarte 

bună dacă grupul corespunzător de valori singulare este bine separat de celelalte. 

În contextul DVS, vom nota separarea unei valori singulare individuale σ i şi, 

respectiv a setului de valori singulare σ I , de celelalte valori singulare ale aceleiaşi

5.5. STABILITATEA ALGORITMULUI DVS 415 

matrice, prin 

gap i 

def 

= min(σ i−1 −σ i ,σ i −σ i+1 ), gap I 

def 

şi corespondentele lor relative, prin 

def |σ i −σ j | 

relgap i = min , 

j∈1:p σ i +σ j 

j≠i 

= min|σ i −σ j | (5.111) 

i∈I 

j∉I 

def |σ i −σ j | 

relgap I = min , (5.112) 

i∈I σ i +σ j 

j∉I 

unde p = min(m,n). 

Condiţionarea subspaţiului U I , i.e. variaţia unghiulară a acestuia raportată 

la nivelul perturbaţiilor în matricea iniţială, se poate aprecia prin numărul de 

condiţionare 

def 

κ UI = 1 

(5.113) 

gap I 

şi, în particular, condiţionarea unui vector singular prin numărul 

κ ui 

def 

= 1 

gap i 

. (5.114) 

Pentru detalii recomandăm consultarea referinţelor bibliografice [IV], [VI], [VIII]. 

5.5 Stabilitatea numerică a algoritmului DVS 

Analiza erorilor introduse de algoritmul DVS a condus la aprecierea că acesta 

reprezintă un mijloc foarte fiabil de calcul al valorilor singulare şi al vectorilor 

singulari. Altfel spus, algoritmul DVS este un algoritm numeric stabil [VI], [XV], 

i.e. se poate arăta că tripletul (Û, ˆΣ, ˆV), care defineşte DVS calculată, este o DVS 

exactă pentru o matrice foarte ”apropiată” de matricea dată. În termeni formali, 

[ ˆΣ1 

dacă A ∈ IC m×n şi, prin urmare, Û ∈ IC m×m , ˆV ∈ IC n×n , ˆΣ = sau 

0 

ˆΣ = 

= [ ˆΣ1 0 ] , cu ˆΣ 1 = {ˆσ 1 ,ˆσ 2 ,...,ˆσ p }, p = min(m,n), atunci există matricele 

unitare Ũ ∈ ICm×m , Ṽ ∈ ICn×n , astfel încât, notând 

∆U def 

def 

= Ũ −Û, ∆A = ŨˆΣṼ H −A, ∆V def 

= Ũ − ˆV, (5.115) 

sunt satisfăcute inegalităţile 

‖∆U‖ ≤ p(m,n)ε M , ‖∆A‖ ≤ p(m,n)‖A‖ε M , ‖∆V‖ ≤ p(m,n)ε M , 

(5.116) 

unde, ca şi până acum, ‖ · ‖ def 

= ‖ · ‖ 2 este norma spectrală, p(m,n) este o notaţie 

generică pentru o funcţie cu ”o creştere modestă” 23 iar ε M este epsilon maşină 

definind precizia de reprezentare a formatului virgulă mobilă utilizat. 

23 Aşa cum s-a precizat şi în capitolul 4, practic pentru toţi algoritmii prezentaţi în acest 

capitol, p(m,n) sau p(n) este o funcţie polinomială de un grad ”modest” (1, 2 sau, foarte rar, 

3) de parametri ce definesc dimensiunea problemei. În [XV] se afirmă că o apreciere de genul 

p(n) < 10n sau p(m,n) < 10max(m,n) este adevărată în majoritatea situaţiilor practice pentru 

care se foloseşte formula de evaluare ”funcţie cu o creştere modestă”. 

]


Combinând excelenta condiţionare a valorilor singulare cu stabilitatea numerică 

a algoritmului DVS, se poate afirma ca descompunerea valorilor singulare este cel 

mai bun mijloc de a calcula invarianţii unei matrice la transformările de echivalenţă 

(cum este rangul). Concret valorile singulare calculate ˆσ i satisfac inegalităţile 

|ˆσ i −σ i | ≤ p(m,n)‖A‖ε M = p(m,n)σ 1 ε M . (5.117) 

Deci, pentru toate valorile singulare avem aceeaşi margine de eroare absolută, ceea 

ce înseamnă că valorile singulare mari vor avea erori relative mici. 

Pentru vectorii singulari şi subspaţiile generate de aceştia, erorile raportate la 

matricea iniţială pot fi amplificate de numerele de condiţionare, astfel că putem 

scrie 

θ(u i ,û i ) ≤ p(m,n)‖A‖ε M 

gap i 

, θ(U I ,ÛI) ≤ p(m,n)‖A‖ε M 

gap I 

. (5.118) 

În sfârşit, menţionăm că cea mai mare acumulare a erorilor are loc în faza de reducere 

la forma bidiagonală, faza iterativă a algoritmului DVS având o contribuţie 

modestă în acest sens. Prin urmare, pentru matricele bidiagonale, chiar erorile relative 

ale tuturor valorilor singulare sunt mărginite de un multiplu modest al erorilor 

de reprezentare. Pentru amănunte, vezi [XV]. 

5.6 Aplicaţiile DVS 

În prima secţiune a acestui capitol au fost introduse o serie de concepte şi probleme 

decalcul numericconexe, problemeacărorrezolvarese poatefaceperformant 

apelând la DVS a unormatrice. Cu aceastăocazieau fost prezentate şi demonstrate 

rezultate matematice care sugerează unele modalităţi de calcul. În secţiunea de 

faţă ne propunem să revenim asupra acestor probleme în vederea dezvoltării unor 

proceduri de calcul fiabile, pentru relevarea unor aspecte numerice semnificative 

precum şi pentru extinderea unor rezultate în contextul utilizării algoritmului DVS 

pentru calculul valorilor singulare. 

5.6.1 Trunchierea DVS calculate. Calculul rangului. 

Rangul numeric 

În conformitate cu propoziţia 5.2, rangul unei matrice este dat de numărul valorilor 

sale singulare nenule 24 . Acest rezultat fundamental are o utilitate redusă în 

aplicaţiile curente încare matricele de date sunt, în general, rezultatul unor evaluări 

aproximative, iar utilizarea calculatorului pentru determinarea valorilor singulare 

este însoţită de erori. În astfel de situaţii, generic, toate valorile singulare calculate 

sunt, în sens strict, nenule. Prin urmare, generic, în urma procesării în medii de 

calcul aproximativ, toate matricele devin de rang maximal şi, datorită acestui fapt, 

24 O alternativă viabilă, cu un efort de calcul mai redus, pentru rezolvarea problemelor de rang 

este dată de triangularizarea unitară (ortogonală) cu pivotarea coloanelor (vezi cap. 3.). Din 

punctul de vedere al calităţilor numerice DVS constituie însă metoda cea mai bună (vezi exemplul 

din acest paragraf).

5.6. APLICAŢIILE DVS 417 

problema determinării rangului rămâne fără obiect. De aceea, pentru aplicaţii, este 

necesară o modalitate coerentă de apreciere a valorilor singulare neglijabile. Rangul 

rezultat după deciziile de neglijare, în conformitate cu criterii bine precizate, 

a valorilor singulare ”mici” va fi numit ”rangul numeric” al matricei iniţiale. Mai 

precis avem următoarea definiţie. 

Definiţia 5.6 Fie A ∈ IC m×n şi A = UΣV H DVS a matricei A. Rangul numeric 

al matricei A pentru o toleranţa ǫ fixată este definit de 

˜r = rang(A,ǫ) = 

min 

‖A−X‖ ≤ ǫ 

X ∈ IC m×n rangX, (5.119) 

i.e. este cel mai mic dintre rangurile tuturor matricelor de aceleaşi dimensiuni aflate 

la o distanţă – definită de norma spectrală – de matricea A mai mică decât toleranţa 

admisă 25 . 

DVS este un mijloc extrem de sigur de determinare a rangului numeric în sensul 

definiţiei de mai sus. În sprijinul acestei afirmaţii avem următoarea teoremă. 

Teorema 5.14 Dacă A = UΣV H este DVS a matricei A ∈ IC m×n , k < r = rangA 

şi 

k∑ 

def 

A k = σ j u j vj H , (5.120) 

atunci 

j=1 

min ‖A−X‖ = ‖A−A k ‖ = σ k+1 . (5.121) 

rangX = k 

X ∈ IC m×n 

Demonstraţie. Precizăm mai întâi faptul că, atât în enunţul teoremei cât şi 

în cele ce urmează, utilizăm în exclusivitate norma spectrală. Din (5.120) rezultă 

∑ 

U H A k V = diag(σ 1 ,σ 2 ,...,σ k ,0,...,0), de unde rangA k = k. Rezultă A − A k = 

r 

j=k+1 σ ju j vj H, deundeavemUH (A−A k )V = diag(0,...,0,σ k+1 ,...,σ r ,0,...,0) 

şi, prin urmare, ‖A−A k ‖ = σ k+1 . 

Fie acum o matrice m × n (complexă) X de rang k, altfel arbitrară. Fie, de 

asemenea, subspaţiile liniare ¯X = KerX, ¯V = ImV(:,1:k+1) şi W = ¯X ⋂ ¯V din 

IC n . Întrucât dim ¯X = n − k şi dim¯V = k + 1 avem dimW ≥ 1. Există deci un 

vector unitar w ∈ W. Avem pe de o parte Xw = 0, iar pe de altă parte există 

z ∈ IC k+1 cu ‖z‖ 2 = 1 astfel încât w = V(:,1 : k+1)z = ∑ k+1 

i=1 z iv i . Obţinem 

Aw = ∑ k+1 

i=1 z iAv i = ∑ k+1 

i=1 z iσ i u i . Rezultă 

‖A−X‖ def 

= max ‖(A−X)x‖ ≥ ‖(A−X)w‖ = ‖Aw‖ = √ k+1 ∑ 

|z i | 2 σi 2. 

‖x‖ = 1 

i=1 

25 În ceea ce priveşte nivelul toleranţelor practicate, acesta depinde de contextul aplicativ. De 

exemplu, dacă matricea provine din date experimentale cu un nivel cunoscut al erorilor de măsură, 

atunci nu are nici un sens ca ǫ să fie inferior acestui nivel. Dacă matricea iniţială se consideră 

exactă, atunci se recomandă ǫ ≈ ε M ‖A‖, unde ε M este epsilon maşină al formatului virgulă mobilă 

al maşinii pe care se efectuează calculele.


Deoarece vectorul z are norma unitară, i.e. ∑ k+1 

i=1 |z i| 2 = 1, pentru expresia de sub 

radical avem evaluarea 

k+1 

∑ 

k∑ 

|z i | 2 σi 2 = σ2 k+1 + |z i | 2 (σi 2 −σ2 k+1 ) ≥ σ2 k+1 . 

i=1 

i=1 

Din ultimele două relaţii rezultă ‖A−X‖ 2 ≥ σk+1 2 pentru orice matrice X ∈ ICm×n 

de rangk şi, cum am văzut mai sus că margineainferioarăpoate fi atinsă, că (5.121) 

este adevărată. 

✸ 

Prin urmare, σ k+1 este cea mai mică distanţă, în sensul normei spectrale, dintre 

matricea A şi toate matricele m×n de rang k. În particular, cea mai mică distanţă 

dintre o matrice A ∈ IC n×n nesingulară şi toate matricele singulare este dată de 

valoarea singulară minimă σ n a lui A. 

Exemplul 5.5 Considerăm important şi util, în contextul acestui paragraf, să 

reluăm un exemplu prezentat în capitolul 2, exemplu menit să ilustreze faptul că 

unele criterii, încă uzitate, pentru aprecierea ”apropierii” unei matrice de o matrice 

singulară (cum ar fi valoarea determinantului sau cel mai mic dintre modulele valorilor 

proprii), dau informaţii false şi că singurul criteriu corespunzător este dat de 

valoarea singulară minimă. Fie matricea Toeplitz superior triunghiulară 

⎡ 

⎤ 

1 −1 ··· −1 −1 

0 1 ··· −1 −1 

A = 

. 

⎢ . . .. . . 

∈ IR n×n 

⎥ 

⎣ 0 0 ··· 1 −1 ⎦ 

0 0 ··· 0 1 

având, evident, detA = 1 şi toate valorile proprii egale cu 1, deci min|λ i (A)| = 1, 

independent de dimensiunea matricei. Prin urmare, ambele criteriiamintite maisus 

indică ”indubitabil” faptul că matricea A este suficient de ”departe” de o matrice 

singulară şi că, aparent, este bine condiţionată la inversare. Faptul că, cel puţin în 

cazul de faţă, aparenţele înşeală se poate constata imediat considerând matricea 

⎡ 

⎤ 

1 −1 ··· −1 −1 

0 1 ··· −1 −1 

Ã = 

. 

⎢ . . .. . . 

∈ IR n×n 

⎥ 

⎣ 0 0 ··· 1 −1 ⎦ 

− 1 

2 

0 ··· 0 1 

n−2 

care este (demonstraţi!) singulară. Cum ‖A − Ã‖ = 1 

2 n−2 ≥ σ n (A) rezultă că 

matricea A se apropie exponenţial de o matrice singulară odată cu creşterea dimensiunii. 

Numărul de condiţionare la inversare creşte şi el exponenţial cu dimensiunea 

matricei. De exemplu, utilizând ‖ · ‖ ∞ , numărul de condiţionare are expresia 

κ ∞ = n2 n−1 . Pe de altă parte, matrice având valori proprii foarte mici şi, ca


urmare, şi determinanţi aşijderea, pot avea o condiţionare foarte bună. Pentru 

detalii, vezi capitolul 2. 

✸ 

Una dintre consecinţele conceptuale importante ale teoremei 5.14 este faptul că 

matricele m×n de rang maximal formează o mulţime deschisă şi densă în IC m×n , i.e. 

generic, toate matricele sunt de rang maximal. De aceea, în problemele de calcul 

numeric care fac apel la noţiunea de rang, utilizarea noţiunii de rang numeric este 

indispensabilă. 

Prezentăm încontinuareun corolaral teoremei 5.14. În contextul lucrării, rezultatul 

are o utilitate practică evidentă. 

Corolar 5.3 Dacă matricea A ∈ IC m×n are rangul numeric ˜r = rang(A,ǫ), atunci 

unde p = min(m,n). 

σ 1 ≥ σ 2 ≥ ... ≥ σ˜r > ǫ ≥ σ˜r+1 ... ≥ σ p , (5.122) 

Demonstraţie. Dacă σ˜r+1 > ǫ rezultă rang(A,ǫ) > ˜r, iar dacă σ˜r ≤ ǫ, atunci 

rang(A,ǫ) < ˜r. Deci, σ˜r > ǫ ≥ σ˜r+1 . 

✸ 

Observaţia 5.7 Practic toate aplicaţiile care utilizează DVS a unei matrice, fac 

apel la rangul acesteia. În contextul calculatoriu al lucrării, în continuare vom presupune 

că este vorba implicit de rangul numeric. În consecinţă, vom presupune 

că s-au neglijat, prin anulare efectivă, valorile singulare inferioare toleranţei precizate 

şi vom renunţa la notaţii speciale care diferenţiază rangul numeric de rangul 

matematic. 

✸ 

Deşi, având în vedere corolarul 5.3 şi observaţia 5.7, scrierea unui algoritm pentru 

determinarea rangului numeric al unei matrice nu prezintă nici o dificultate, 

totuşi, ţinând seama de importanţa aplicativă a problemei, considerăm necesară 

îndeplinirea acestei formalităţi. 

Algoritmul 5.6 (Rang DVS – Calculul rangului numeric) (Date 

matricea A ∈ IC m×n şi toleranţa tol > 0, algoritmul calculează rangul 

numeric r = rang(A,tol) al matricei A.) 

1. p = min(m,n) 

2. [U,Σ,V] = DVS(A, ′ nu ′ , ′ nu ′ ) 

3. r = 0 

4. Cât timp Σ r+1,r+1 ≥ tol 

1. r ← r +1 

2. Dacă r = p atunci break 


r = Rang DVS(A,tol). 

În aplicaţiile caresunt prezentate încontinuarese vorivi situaţii în careeste necesar 

atât calculul rangului cât şi calculul explicit al DVS a matricei A. Pentru a evita 

un calcul dublu al aceleiaşi DVS, se va utiliza secvenţa de apeluri


1. [U,Σ,V] = DVS(A,opt1,opt2) 

2. r = Rang DVS(Σ,tol) 

la instrucţiunea 2 matricea argument fiind diagonal˘ nu se mai calculează în fapt 

nici o DVS. 

Complexitatea algoritmului este dată, în cazul general, de complexitatea algoritmului 

DVS fără acumularea transformărilor. 

✸ 

Observaţia 5.8 În definirea şi calculul rangului numeric a fost utilizată, în exclusivitate, 

norma spectrală. În unele lucrări [VI], pentru dezvoltareaaceloraşiidei, se 

preferă utilizarea normei Frobenius, rezultatele fiind întru totul similare. În această 

observaţie prezentăm rezultatul corespunzător teoremei 5.14, care ne va fi util şi în 

rezolvarea problemei celor mai mici pătrate totală. 

Teorema 5.15 Dacă Σ = UAV H este DVS a matricei A ∈ IC m×n , k < r = rangA 

26 şi A k este matricea definită în (5.120), atunci 

r∑ 

min ‖A−X‖ 2 F = ‖A−A k‖ 2 F = σi 2 . (5.123) 

rangX=k 

i=k+1 

X∈IC m×n 

Mai mult A k este unica matrice de rang k pentru care acest minim este atins. 

Demonstraţie. Fie X ∈ IC m×n [ o matrice ] de rang k arbitrară şi X = Ũ˜ΣṼ H 

DVS a matricei X, unde ˜Σ 

˜Σ11 0 

= ∈ IR m×n cu 

0 0 

˜Σ 11 = diag(˜σ 1 ,˜σ 2 ,...,˜σ k ). 

[ ] 

Notăm B = ŨH AṼ = B11 B 12 

cu B 

B 21 B 11 ∈ IC k×k . Fie σ(B 11 ) = {γ 1 ,γ 2 ,...,γ k }. 

22 

Evident, σ(A) = σ(B) şi, din teorema 5.11, de separarea valorilorsingulare, rezultă 

imediat σ i ≥ γ i , i = 1 : k. Rezultă ‖B 11 ‖ 2 F = ∑ k 

i=1 γ2 i ≤ ∑ k 

i=1 σ2 i . Avem, în 

consecinţă, următoarele evaluări: 

‖A−X‖ 2 F = ‖B − ˜Σ‖ 

k∑ 

2 

F = ‖B‖2 F + |b jj − ˜σ j | 2 − 

j=1 

≥ ‖B‖ 2 F −‖B 11 ‖ 2 F ≥ ‖B‖ 2 F − 

k∑ 

|b jj | 2 ≥ 

j=1 

k∑ 

σi 2 = 

i=1 

r∑ 

i=k+1 

Pe de altă parte este evidentă egalitatea ‖A−A k ‖ 2 F = ∑ r 

i=k+1 σ2 i , i.e. minimul 

este atins pentru X = A k . Vom arăta acum că X = A k este singura matrice de 

rang k astfel încât ‖A−X‖ 2 F = ∑ r 

i=k+1 σ2 i . Cu notaţiile utilizate mai sus rezultă 

k∑ 

σj 2 + 

j=1 

k∑ 

|b jj − ˜σ j | 2 − 

j=1 

k∑ 

|b jj | 2 = 0 

j=1 

26 Aici, la fel ca în teorema 5.14, r este rangul matematic. 

σ 2 i.


şi 

de unde obţinem 

k∑ 

σj 2 ≥ 

j=1 

k∑ 

γj 2 = ‖B 11 ‖ 2 F ≥ 

j=1 

k∑ 

|b jj | 2 , 

j=1 

b jj = ˜σ j , j = 1 : k. 

Rezultă B 11 = ˜Σ 11 , de unde unicitatea se obţine imediat. 

În lumina teoremei 5.15 putem defini rangul numeric r F , în sensul normei matriceale 

Frobenius, ca fiind ce mai mic întreg k pentru care 

min(m,n) 

∑ 

i=k+1 

σ 2 i < ǫ, 

unde ǫ este o toleranţă precizată. Şi această definire a noţiunii de rang numeric este 

utilă mai ales în contextul calculului numeric, situaţie în care σ i , din relaţia de mai 

sus, sunt valorile singulare calculate ale matricei A. 

✸ 

5.6.2 Problema generală a celor mai mici pătrate 

Considerăm sistemul liniar 

Ax = b (5.124) 

în cadrul general în care matricea A ∈ IC m×n nu este de rang maximal 27 (i.e. 

r = rangA < min(m,n)), cu b ∈ IC m arbitrar. Formulăm problema rezolvării în 

sens CMMP a acestui sistem, respectiv de calcul a vectorului x ∗ ∈ IC n de normă 

euclidiană minimă care minimizează norma euclidiană a reziduului r(A,b) = b−Ax, 

i.e. 

‖x ∗ ‖ = min 

‖b−Ax‖ = minim 

x ∈ IC n ‖x‖, (5.125) 

numită pseudosoluţie normală a sistemului (5.124). Avem următorul rezultat. 

Propoziţia 5.7 Sistemul liniar (5.124) admite o pseudosoluţie normală unic determinată. 

Dacă A = UΣV H este DVS a matricei A, atunci această pseudosoluţie 

normală are expresia 

r∑ 

x ∗ = A + u H j 

b = 

b v j . (5.126) 

σ j 

[ 

d 

Demonstraţie. Fie d = U H ′ 

b = 

j=1 

] 

d ′′ , y = V H x = 

d ′′ = d(r+1 : m) şi y ′ = y(1:r), y ′′ = y(r+1 : n). Avem 

‖b−Ax‖ 2 = ‖b−UΣV H x‖ 2 = ‖d−Σy‖ 2 = 

27 Pentru sistemele de rang maximal vezi capitolul 3. 

✸ 

[ 

y 

′ 

y ′′ ] 

unde d ′ = d(1:r), 

√ 

‖d ′ −Σ 1 y ′ ‖ 2 2 +‖d′′ ‖ 2 2


care este, evident, minimă pentru y ′ = Σ −1 

1 d′ şi y ′′ arbitrar. Dintre toţi vectorii y 

care minimizează reziduul de mai sus, cel de normă euclidiană minimă corespunde 

lui y ′′ = 0. Cum ‖x‖ 2 = ‖y‖ 2 , rezultă că vectorul de normă euclidiană minimă care 

minimizează reziduul ‖b−Ax‖ 2 este 

x ∗ = V 

[ 

Σ 

−1 

1 d′ 

0 

] 

= V 

[ 

Σ 

−1 

1 0 

0 0 

] 

d = VΣ + U H b = A + b, 

ultima egalitate din (5.126)obţinându-seutilizând (5.55). Unicitatea pseudosoluţiei 

normale rezultă din unicitatea pseudoinversei. 

✸ 

Propoziţia 5.7 conduce la următorul algoritm. 

Algoritmul 5.7 (CMMP – Rezolvarea problemei generale CMMP) 

(Date matricea A ∈ IC m×n , vectorul b ∈ IC m şi toleranţa tol > 0, algoritmul 

calculează (pseudo)soluţia x = x ∗ ∈ IC n , în sens CMMP, de normă 

euclidiană minimă, a sistemului liniar Ax = b.) 

1. [U,Σ,V] = DVS(A, ′ da ′ , ′ da ′ ) 


3. x = 0 

4. Pentru j = 1 : r 

1. δ = (U(:,j)) H b 

2. δ = δ σ j 

3. x = x+δV(:,j) 


x = CMMP(A,b,tol), 

iar complexitatea sa este determinată de complexitatea algoritmului DVS cu acumularea 

transformărilor. 

Algoritmulprezentatestenumericstabil, detaliiprivindacurateţeasoluţieiproblemei 

CMMP calculată mai sus putând fi găsite în [VI]. 

✸ 

5.6.3 Problema celor mai mici pătrate totală 

Vom formula şi rezolva în cele ce urmează o generalizare a problemei clasice a celor 

mai mici pătrate (CMMP). Pentru a da o justificare formulării acestei generalizări, 

să observăm că problema CMMP, de minimizare a normei euclidiene a reziduului 

r = Ax − b, unde matricea A ∈ IC m×n şi vectorul b ∈ IC n sunt date 28 , poate fi 

reformulată în modul următor. Putem privi reziduul r din egalitatea Ax = b+r ca 

o ”perturbare” a vectorului de date b sub restricţia ca b+r = Ax pentru un anumit 

28 Toate rezultatele rămân valabile şi în cazul real. S-a preferat considerarea datelor complexe 

pentru asigurarea omogenităţii tratării materialului din acest capitol.


x, i.e. (b+r) ∈ ImA. În aceste condiţii problema CMMP este de a determina acel 

reziduu r ∗ ∈ IC m pentru care avem 

‖r ∗ ‖ = 

min ‖r‖, (5.127) 

(b+r) ∈ ImA 


= ‖ · ‖ 2 este norma euclidiană din IC m . În această interpretare, dacă 

r ∗ este o soluţie a problemei de minimizare (5.127), atunci orice soluţie x ∗ ∈ IC n a 

sistemului Ax = b+r ∗ este (pseudo)soluţie CMMP a sistemului liniar Ax = b. 

Un prim pas spre generalizare se poate face impunând o ponderare a pătratelor 

din expresia‖r‖ = ( ∑ m 

i=1 |r i| 2 ) 1 2 

, i.e. considerareaproblemeiminimizării reziduului 

”ponderat” ‖Cr‖ = ( ∑ m 

i=1 |c ir i | 2 ) 1 2 

, unde C = diag(c 1 ,c 2 ,...,c m ) ∈ IC m×m este o 

matrice nesingulară, i.e. problema (5.127) devine 

‖Cr ∗ ‖ = 

min 

(b+r) ∈ ImA ‖Cr‖, r ∈ ICm . (5.128) 

Al doilea pas de generalizare poate fi făcut considerând şi perturbaţii la nivelul 

elementelor matricei A, respectiv considerând sistemul liniar (A + E)x = b + r 

şi impunând minimizarea normei Frobenius a reziduului cumulat G def 

= [ E r ] ∈ 

∈ IC m×(n+1) . Introducând şi matricele diagonalenesingulareC=diag(c 1 ,c 2 ,...,c m ) 

şi D = diag(d 1 ,d 2 ,...,d n+1 ) de ”ponderare” pe linii, respectiv pe coloane, a matricei 

G, problema de minimizare devine 

‖CG ∗ D‖ F 

= 

min 

(b+r) ∈ Im(A+E) ‖CGD‖ F, E ∈ IC m×n , r ∈ IC m , (5.129) 

fiindcunoscutăsubdenumireadeproblemacelor mai mici pătrate totală(CMMPT). 

Dacă (E ∗ ,r ∗ ) este o soluţie a problemei de minimizare (5.129), atunci orice soluţie 

x ∗ a sistemului (A+E ∗ )x = b+r ∗ se numeşte (pseudo)soluţie, în sens CMMPT, a 

sistemului Ax = b. 

Observaţia 5.9 Problema CMMPT (5.129) poate fi echivalată cu o problemă de 

minimizare a unei funcţii reale de n variabile, fără restricţii suplimentare. Pentru 

simplitate, considerăm cazul real. Privind x ∈ IR n ca un parametru vectorial, 

problema (5.129) poate fi formulată, într-oprimă fază, ca o problemă de minimizare 

cu legături: să se calculeze matricea G ∗ ∈ IR m×(n+1) astfel încât 

[ ] 

‖CG ∗ D‖ 2 x 

F = min 

G ∈ IR m×(n+1)‖CGD‖2 F , cu legăturile (G+[A b]) = 0. 

−1 

Fie 

[ 

h(G,λ) = ‖CGD‖ 2 x 

F +λT (G+[A b]) 

−1 

] 

(5.130) 

(5.131) 

funcţia lui Lagrange asociată problemei de extrem cu legături (5.131). Pentru calculul 

extremului impunem condiţiile clasice 

∂h(G,λ) 

∂g ij 

= 0, i = 1 : m, j = 1 : n+1, (5.132)


(unde, evident, g ij = G(i,j)) care conduc imediat la exprimarea elementelor matricei 

G în funcţie de multiplicatorii Lagrange λ i = λ(i) 

g ij 

def 

= e ij = −λ ix j 

2c 2 i d2 j 

, i = 1 : m, j = 1 : n, g i,n+1 

def 

= r i = 

λ i 

2c 2 i d2 n+1 

, i = 1 : m. 

(5.133) 

Impunând satisfacerealegăturilorobţinem valoareamultiplicatorilorLagrangecorespunzătoare 

punctului de extrem 

λ ∗ = 

2(Ax−b) 

x T ˜D −2 x+d −2 , ˜D = diag(d1 ,d 2 ,...,d n ). (5.134) 

n+1 

Pentru un vector x fixat, valoarea optimă G ∗ (x) = [E ∗ (x) r ∗ (x)] se obţine înlocuind 

λ ∗ i în relaţiile (5.133). Obţinem 

E ∗ (x) = − 1 2 C−2 λ ∗ x T ˜D−2 , 

r ∗ (x) = 1 2 C−2 λ ∗ d −2 

n+1 . (5.135) 

Utilizând, acum, egalitatea ‖yz T ‖ F = ‖y‖·‖z‖, adevărată pentru orice vectori y şi 

z (demonstraţi!), obţinem valoarea minimă (pentru un x fixat) a criteriului (5.130) 

f(x) def 

= ‖CG ∗ (x)D‖ 2 F = ‖CE∗ (x)˜D‖ 2 F +‖Cr∗ (x)d n+1 ‖ 2 F = 

= 1 4 

∑ m 

i=1 c−2 

i (a T i x−b i) 2 

∑ n 

i=1 x2 i d−2 i +d −2 , (5.136) 

n+1 

unde a T i = A(i, :) este linia i a matricei A. Evident, punctul de minim x ∗ ∈ IR n al 

funcţiei f este (pseudo)soluţia problemei CMMPT (5.129). Deşi această observaţie 

nu oferă o alternativă viabilă de calcul, totuşi este utilă pentru interpretarea unor 

rezultate. 

✸ 

Observaţia 5.10 Observaţia 5.9 oferă posibilitatea unei interpretări geometrice a 

problemei CMMPT. Fie subspaţiul liniar 

{ [ ] 

} 

a 

P x = a ∈ IR n , b ∈ IR, a 

b 

T x = b ⊂ IR n+1 

definit pentru fiecare parametru vectorial x ∈ IR n . Utilizând aceeaşi procedură 

clasică, de calcul a extremelor cu legături, se arată (exerciţiu pentru cititor) [ ] că 

def 

a 

distanţa, în sensul normei ‖z‖ D = ‖Dz‖, dintre un punct arbitrar z = ∈ 

b 

∈ IR n+1 şi cel mai apropiat punct din subspaţiul P x este 

δ(z,P x ) = 

|a T x−b| 

√ ∑n 

. 

i=1 x2 i d−2 i +d −2 

n+1 

În consecinţă, conform observaţiei 5.9, soluţia x ∗ a problemei CMMPT (5.129) 

determină acel subspaţiu P x ∗ pentru care suma ponderată a distanţelor (în sensul


[ (A(i,:)) 

T 

normei ‖ · ‖ D ) de la punctele z = 

b(i) 

apropiate ale lui P x ∗ (vezi (5.136)) este minimă. 

] 

∈ IR n+1 la punctele cele mai 

✸ 

A treia treaptă de generalizare o introducem considerând un membru drept 

multiplu, i.e. formulând problema CMMPT pentru sistemul liniar matriceal AX = 

= B cu B ∈ IC m×p , respectiv problema de minimizare 

‖CG ∗ D‖ = min 

(B +R) ⊆ Im(A+E) ‖CGD‖ F, E ∈ IC m×n , R ∈ IC m×p , G = [E R], 

(5.137) 

unde matricele A ∈ IC m×n , B ∈ IC m×p , cu m ≥ n+p, precum şi matricele diagonale 

nesingulare C ∈ IC m×m şi D ∈ IC (n+p)×(n+p) sunt date. La fel ca şi până acum, 

dacă (E ∗ ,R ∗ ) este o soluţie a problemei de minimizare (5.137), atunci orice matrice 

X ∗ ∈ IC n×p care satisface sistemul liniar matriceal (A+E ∗ )X = B+R ∗ va fi numită 

(pseudo)soluţia, în sens CMMPT, a sistemului AX = B. 

Pentru a formula mai concis rezultatul referitor la existenţa şi unicitatea soluţiei 

problemelor de minimizare ce definesc CMMPT, vom introduce unele notaţii şi vom 

stabili un rezultat preliminar. Fie 

H def 

= C[ A B ]D = 

n p 

{}}{ {}}{ 

[ ] 

H1 H 2 

(5.138) 

şi H = UΣV H DVS a matricei H, cu următoarele partiţii ale matricelor U, V şi Σ 

impuse de structura lui H 

U = 

n 

p 

{}}{ m−n−p 

{}}{ {}}{ 

[ ] 

U1 U 2 U 3 

, V = 

n p 

{}}{ {}}{ 

[ ] 

V11 V 12 }n 

V 21 V 22 }p 

Σ = 

n 

p 

{}}{ {}}{ 

⎡ 

⎣ Σ ⎤ 

1 0 

0 Σ 2 

⎦ }n 

}p , 

0 0 }m−n−p 

Introducem următoarea lemă. 

Σ 1 = diag(σ 1 ,σ 2 ,...,σ n ) 

Σ 2 = diag(σ n+1 ,σ n+2 ,...,σ n+p ). (5.139) 

Lema 5.1 Dacă σ n (H 1 ) > σ n+1 , atunci 

1 ◦ . Matricea V 22 din (5.139) este nesingulară. 

2 ◦ . Cu notaţiile din (5.139), avem inegalitatea strictă 

σ n > σ n+1 . (5.140) 

Demonstraţie. 1 ◦ . Presupunem că matricea V 22 este singulară. Atunci există un 

vector z ∈ IC p nenul, pe care îl putem considera de normă euclidiană [ ] unitară, astfel 

def V12 

încât V 22 z = 0. Mai departe, din faptul că matricea V 2 = are coloanele 

V 22 

ortogonale, i.e. V2 H V 2 = I p , obţinem ‖V 2 z‖ = ‖V 12 z‖ = 1. Pe de altă parte din


DVS a matricei H, cu partiţiile din (5.139), avem U 2 Σ 2 = H 1 V 12 +H 2 V 22 . Acum, 

ţinând seama de consistenţa normei spectrale, putem scrie următoarea secvenţă de 

inegalităţi 

σ n+1 = ‖Σ 2 ‖ = ‖U 2 ‖·‖Σ 2 ‖ ≥ ‖U 2 Σ 2 ‖ = ‖H 1 V 12 +H 2 V 22 ‖ = 

= max 

‖y‖=1 ‖(H 1V 12 +H 2 V 22 )y‖ ≥ ‖H 1 V 12 z‖ ≥ min 

‖w‖=1 ‖H 1w‖ = σ n (H 1 ), 

ceea ce contrazice ipoteza lemei. Deci V 22 este nesingulară. 

2 ◦ . Conform teoremei 5.11 (de separare a valorilor singulare) avem 

σ n = σ n (H) ≥ σ n (H [n+p−1] ) ≥ ... ≥ σ n (H [n] ) def 

= σ n (H 1 ), (5.141) 

de unde, în ipoteza lemei, rezultă σ n ≥ σ n (H 1 ) > σ n+1 , obţinându-se inegalitatea 

strictă din enunţ. 

✸ 

Formulăm acum teorema de existenţă şi unicitate a soluţiei problemei CMMPT. 

Teorema 5.16 Utilizând notaţiile (5.138), (5.139), dacă σ n (H 1 ) > σ n+1 , atunci 

matricea G ∗ def 

= [ E ∗ R ∗ ] definită de 

G ∗ = [ E ∗ R ∗ ] = −C −1 U 2 Σ 2 [ V H 

12 V H 

22 ]D−1 (5.142) 

este o soluţie a problemei de minimizare CMMPT (5.137). 

În plus, dacă notăm 

D 1 = diag(d 1 ,d 2 ,...,d n ), D 2 = diag(d n+1 ,d n+2 ,...,d n+p ), (5.143) 

atunci matricea 

X ∗ = −D 1 V 12 V22 −1 D−1 2 (5.144) 

există şi este unica soluţie a sistemului 

(A+E ∗ )X = B +R ∗ , (5.145) 

i.e. este unica (pseudo)soluţie, în sens CMMPT, a sistemului liniar AX = B. 

Demonstraţie. Condiţia (B +R) ⊆ Im(A+E) este echivalentă cu existenţa unei 

matrice X ∈ IC n×p astfel încât (A + E)X = B + R. Cu notaţiile din (5.137) şi 

(5.138), ultima relaţie poate fi scrisă în următoarele forme echivalente 

([ ] ) [ ] 

[ ] 

X A B +G = 0 ⇔ (H +CGD)D −1 X 

= 0. (5.146) 

−I p −I p 

[ ] 

X 

Întrucât matricea este monică, din (5.146) rezultă rang(H +CGD) ≤ n. 

−I p 

NotândF def 

= CGD, încontinuareaplicămteorema5.15matricei−F = H−(H+F). 

Obţinem 

n+p 

min ‖F‖ 2 F = ∑ 

σi 2 , (5.147) 

rang(H+F)≤n 

i=n+1


minimul atingându-se pentru 

Rezultă 

(H +F) ∗ = 

n∑ 

j=1 

σ j u j v H j = U 1 Σ 1 

[ 

V11 

V 21 

] H 

. (5.148) 

F ∗ = U 1 Σ 1 

[ 

V11 

V 21 

] H 

−H = −U 2 Σ 2 

[ 

V21 

V 22 

] H 

, (5.149) 

de unde se obţine imediat (5.142). Mai mult, conform lemei 5.1, în condiţiile teoremei 

aveminegalitateastrictă σ n > σ n+1 , ceeace asigurăunicitateamatricei G = G ∗ 

care minimizează expresia (5.137). 

În finalul demonstraţiei vom arăta că X ∗ din (5.144) este unica soluţie a sistemului 

(A+E ∗ )X = B +R ∗ care, conform (5.146), poate fi scris şi sub forma 

(H +CG ∗ D)D −1 [ X 

−I p 

] 

= 0. (5.150) 

Pentru aceasta, din expresia (5.142) a matricei G ∗ şi DVS a matricei H rezultă 

H +CG ∗ [ ] 

D = U 1 Σ 1 V 

H 

11 V21 

H , (5.151) 

de unde, datorită monicităţii matricei U 1 Σ 1 , rezultă 

Ker(H +CG ∗ D) = Ker [ V11 H V21 

H 

] 

= Im 

[ 

V12 

V 22 

] 

. (5.152) 

Prin urmare, din (5.150) şi (5.143) rezultă că orice soluţie X satisface relaţiile 

[ ] [ ] { 

D −1 X V12 D 

−1 

= Y ⇒ 

1 X = V 12Y 

−I p V 22 D2 −1 (5.153) 

= V 22 Y. 

Deci, în virtutea lemei 5.1, avem Y = −V22 −1 D−1 2 . În concluzie, în mod necesar, din 

(5.153) rezultă că unica (pseudo)soluţie, în sens CMMPT, este 

i.e. (5.144). Teorema este demonstrată. 

X = D 1 V 12 Y = −D 1 V 12 V −1 

22 D−1 2 = X ∗ , 

Prezentăm în continuare o modalitate de calcul a soluţiei problemei CMMPT 

care derivă nemijlocit din demonstraţia teoremei 5.16. 

Algoritmul 5.8 (CMMPT – Soluţia problemei CMMPT) (Se dau 

matricele A ∈ IC m×n , B ∈ IC m×p , cu m ≥ n+p, precum şi matricele diagonalenesingulareC 

= diag(c 1 ,c 2 ,...,c m ) ∈ IC m×m şi D=diag(D 1 ,D 2 ) 

∈ IC (n+p)×(n+p) , unde D 1 = diag(d 1 ,d 2 ,...,d n ), D 2 = diag(d n+1 , d n+2 , 

..., d n+p ). Algoritmul calculează soluţia (dacă există a) problemei 

CMMPT, definite de cvartetul (A,B,C,D), i.e. calculează matricele 

E = E ∗ ∈ IC m×n şi R = R ∗ ∈ IC m×p care sunt soluţia problemei de minimizare 

(5.137) precum şi soluţia X ∗ a sistemului liniar (A+E ∗ )X = 

= B + R ∗ . Dacă soluţia nu există sau nu este unică se tipăreşte un 

mesaj, iar elementele tripletului (E ∗ ,R ∗ ,X ∗ ) rămân vide.) 

✸


1. E = [ ], R = [ ], X = [ ] 

2. H = C[A B]D 

3. [U,Σ,V] = DVS(H, ′ da ′ , ′ da ′ ) 

4. [P,Γ,Q] = DVS(H(:,1 : n), ′ nu ′ , ′ nu ′ ) 

5. Dacă γ n ≤ σ n+1 atunci 

1. Tipăreşte(’Problema nu admite soluţie!’) 

2. Return 

6. Dacă σ n = σ n+1 atunci 

1. Tipăreşte(’Problema nu admite o soluţie unică!’) 

2. Return 

7. Se rezolvă sistemul matriceal 

X(D 2 V(n+1 : n+p,n+1 : n+p)) = −D 1 V(1 : n,n+1 : n+p) 

8. E ∗ = −C −1 U 2 Σ 2 V H 

1 , unde U 2 = U(:,n+1 : n+p), 

Σ 2 = Σ(n+1 : n+p,n+1 : n+p), V 12 = V(1 : n,n+1 : n+p) 

12D −1 

9. R ∗ = −C −1 U 2 Σ 2 V H 

22D −1 

2 , unde V 22 = V(n+1 : n+p,n+1: n+p). 


[X,E,R] = CMMPT(A,B,C,D). 

În cadrul algoritmului s-au folosit notaţiile evidente σ i = Σ(i,i) şi γ i = Γ(i,i). 

Pentru date de intrare (A,B,C,D) reale algoritmul funcţionează ca atare întrucât 

operatorul hermitic se reduce la cel de transpunere. Evident, într-un astfel de 

caz se utilizează, în exclusivitate, o aritmetică reală. Singura problemă critică 

este rezolvarea sistemului liniar matriceal de la instrucţiunea 7 care poate fi rău 

condiţionat dacă valorile singulare σ n (H(:,1 : n)) şi σ n+1 nu sunt bine separate. 

Inversarea matricelor diagonale nu ridică probleme numerice (şi nici nu trebuie 

efectuată explicit). Complexitatea algoritmului este determinată, în primul rând, 

de complexitatea calculului DVS. 

✸ 

Dacă σ n = σ n+1 , CMMPT poate avea soluţii multiple şi, într-un astfel de caz, 

cutuma CMMP este de a calcula soluţia de normă minimă. Vom numi această 

soluţie CMMPT normală (CMMPTN). Avându-se în vedere expresia (5.154) a 

soluţiilor, o normă adecvată este ‖ · ‖ D definită de ‖Z‖ D = ‖D1 −1 ZD 2‖ cu care 

avem 

‖X‖ 2 D = ‖V 12 V22 −1 ‖2 = λ max (V22 −H V12V H 12 V22 −1 ) = 

= λ max (V22 −H (I p −V22V H 22 )V22 −1 ) = 1−σ2 min (V 22) 

σmin 2 (V , (5.154) 

22) 

ceea ce indică faptul că a minimiza ‖X‖ D este echivalent cu maximizarea celei mai 

mici valori singularea submatricei V 22 . Un algoritmpentru cazul importantşi uzual 

p = 1, i.e. al problemei (5.129), poate fi găsit în [VI].


5.6.4 Probleme CMMP cu restricţii 

În cadrulparagrafeloranterioarerelativelarezolvareaproblemelorde minimizarede 

tipul celor mai mici pătrate, (pseudo)soluţia era căutată în tot spaţiul IC n , respectiv 

IR n încazuldatelorreale. Înceleceurmeazăvomrestrângeariadecăutareasoluţiei 

minimizante la un domeniu nevid X ⊂ IC n care nu coincide cu tot spaţiul. Deşi majoritatea 

aplicaţiilor de această natură operează cu date reale, pentru omogenitatea 

tratării vom considera, ca şi până acum, cazul, mai general, al datelor complexe. 

Cititorul interesat nu va întâmpina, cu siguranţă, nici un fel de dificultăţi la particularizarea 

rezultatelor şi a algoritmilor pentru cazul datelor reale. 

Într-o formulare generală, problema celor mai mici pătrate cu restricţii are 

următorul enunţ. Date matricea A ∈ IC m×n , cu m > n, vectorul b ∈ IC m şi mulţimea 

nevidă X ⊂ IC n , să se determine vectorul x ∗ ∈ X (dacă există) astfel încât 

‖r ∗ ‖ def 

= ‖Ax ∗ −b‖ = min ‖Ax−b‖, (5.155) 

x ∈ X 

unde, ca în toate problemele de tip CMMP, ‖·‖ este norma euclidiană. 

Diversele probleme CMMP cu restricţii diferă, natural, prin tipurile de mulţimi 

X. În continuare vom considera câteva cazuri frecvent întâlnite în aplicaţii. 

Problema CMMP cu restricţii liniare tip egalitate 

Restricţiile liniare tip egalitate pot fi descrise prin 

X = {x|x ∈ IC n , Cx = d}, (5.156) 

unde C ∈ IC p×n , p < n, este o matrice epică 29 şi d ∈ IC p . 

Problema CMMP (5.155), (5.156) poate fi rezolvată prin reducerea la rezolvarea 

unei probleme CMMP fără restricţii în modul următor. Fie factorizarea QR a 

matricei monice C H , i.e. 

[ ] 

C H R1 

= Q = Q 

0 1 R 1 , (5.157) 

unde R 1 ∈ IC p×p este superior triunghiulară nesingulară, Q ∈ IC n×n este unitară şi 

Q 1 = Q(:,1 : p). Condiţia Cx = d devine echivalentă cu R1 HQH 1 x = d, i.e. 

Q H 1 x = (RH 1 )−1 d def 

= y ∗ . (5.158) 

Pe de altă parte, considerând partiţia Q = [Q 1 Q 2 ], avem 

[ ] 

r def 

= Ax−b = AQQ H Q 

H 

x−b = [AQ 1 AQ 2 ] 1 x 

Q H 2 x −b = A 1 y+A 2 z−b = A 2 z−˜b 

(5.159) 

29 Dacă C nu este epică, i.e. r = rangC < p, atunci restricţiile pot fi rescrise în forma ˜Cx = ˜d, 

unde ˜C ∈ IC r×n este epică. Într-adevăr, dacă C = U 1Σ 1 V1 H este dezvoltarea DVS a matricei C, 

atunci ˜C poate fi Σ1 V1 H, în care caz ˜d = U1 H d. Dacă p = n, atunci C este nesingulară, i.e. X are 

un singur element, şi problema de minimizare devine trivială.


unde am utilizat notaţiile 

A 1 = AQ 1 , A 2 = AQ 2 , y = Q H 1 x, z = QH 2 x, ˜b = b−A1 y. 

Acum, întrucât restricţiile sunt echivalente cu fixarea vectorului y conform (5.158), 

problema CMMP cu restricţiile (5.156) s-a redus la problema minimizării normei 

reziduului (5.159) în raport cu z, fără alte restricţii. Altfel spus, dacă z ∗ este soluţia 

problemei CMMP fără restricţii 

‖r ∗ ‖ def 

= ‖A 2 z ∗ −˜b ∗ ‖ = min 

z ∈ IC n−p‖A 2z −˜b ∗ def 

‖, unde ˜b∗ = b−A 1 y ∗ , (5.160) 

atunci, evident, 

[ ] y 

x ∗ ∗ 

= Q 

z ∗ 

este soluţia problemei CMMP cu restricţii (5.155), (5.156). 

Rezultă următorul algoritm de calcul. 

Algoritmul 5.9 (CMMP RLE – Soluţia problemei CMMP cu 

restricţii liniare tip egalitate) (Se consideră date matricea monică A ∈ 

∈ IC m×n , cu m > n, şi vectorul b ∈ IC m , care definesc problema CMMP, 

precum şi matricea epică C ∈ IC p×n , cu p < n, şi vectorul d ∈ IC p , care 

definesc restricţiile (5.156). De asemenea se consideră dată toleranţa tol 

care este parametru de intrare pentru algoritmul CMMP fără restricţii. 

Algoritmul calculează soluţia x = x ∗ a problemei CMMP cu restricţii 

(5.155), (5.156).) 

1. [Q,R] = FQR(C H ) 

2. Se rezolvă sistemul inferior triunghiular nesingular 

(R(1 : p, :)) H y = d 

3. b ← b−AQ(:,1:p)y 

4. z = CMMP(AQ(:,p+1:n), b,tol) 

[ ] 

y 

5. x = Q . 

z 

Comentarii. Apelul acestui algoritm are sintaxa 

x = CMMP RLE(A,b,C,d,tol). 

(5.161) 

Pentru algoritmul de factorizare QR a se vedea capitolul 3. De asemenea, dacă se 

ştie a priori faptul că matricea A este monică, atunci rezolvarea problemei CMMP 

fără restricţii se poate face cu mijloacele din capitolul 3. Dacă matricea A nu este 

monică, se impune utilizarea factorizării QR cu pivotarea coloanelor sau a DVS. 

Algoritmul este numeric stabil iar complexitatea sa este O(n 3 ). ✸ 

Observaţia 5.11 Problema CMMP cu restricţii liniare tip inegalitate se tratează 

utilizând proceduri specifice de programare pătratică şi nu este abordată în această 

lucrare. 

✸


Problema CMMP cu restricţii pătratice 

Restricţiile pătratice întâlnite în practica problemelor CMMP sunt, în general, de 

tip inegalitate având forma 

X = {x|x ∈ IC n , ‖Bx−d‖ ≤ γ}, (5.162) 

unde B ∈ IC p×n , d ∈ IC p , γ ≥ 0 este un scalar real, iar ‖·‖ este norma euclidiană. 

Evident, dacă γ = 0, atunci restricţiile pătratice (5.162) devin restricţii liniare de 

tip egalitate, tratate în paragraful precedent. 

Pentru date reale mulţimea X este un (hiper)elipsoid în IR n . Particularizările 

curente ale restricţiilor (5.162) se obţin pentru d = 0 (în care caz elipsoidul este 

centrat în origine) sau pentru B = I n (elipsoidul devine o sferă plină, i.e. o bilă). 

În sfârşit, o categorie importantă o reprezintă restricţiile pătratice de tip egalitate 

care se obţin înlocuind în (5.162) relaţia de inegalitate cu o relaţie de egalitate şi 

considerând γ > 0. 

Vom aborda rezolvarea problemei CMMP, definite de (5.155), (5.162), mai întâi 

în cazul general, iar apoi în cazul particular al unei bile. 

Fie problema CMMP (5.155), (5.162). Având în vedere faptul că sunt implicate 

două matrice, A şi B, apare ca naturală abordarea problemei prin încercarea 

de diagonalizare simultană a celor două matrice. Instrumentul adecvat este descompunerea 

valorilor singulare generalizate (DVSG, v. §5.1). Pesupunem KerA∩ 

KerB = {0} 30 , şi, pentru fixarea ideilor şi notaţiilor, p ≥ n. În conformitate cu 

teorema 5.4, există matricele unitare U ∈ IC m×m , V ∈ IC p×p şi matricea nesingulară 

W ∈ IC n×n astfel încât 

[ ] 

U H C1 

AW = C = , C 1 = diag(c 1 ,c 2 ,...,c n ) ∈ IR n×n , 

V H BW = S = 

0 

[ 

S1 

0 

] 

, S 1 = diag(s 1 ,s 2 ,...,s n ) ∈ IR n×n , 

(5.163) 

unde valorile singulare generalizate (c i ,s i ) satisfac condiţiile c 2 i +s2 i 

şi sunt ordonate conform 

1 ≥ c 1 ≥ c 2 ≥ ... ≥ c n ≥ 0, 

0 ≤ s 1 ≤ s 2 ≤ ... ≤ s n ≤ 1. 

= 1, i = 1 : n, 

(5.164) 

Ţinând seama de faptul că transformările unitare conservă norma euclidiană şi 

notând 

W −1 x def 

= y (5.165) 

norma reziduului asociat problemei CMMP şi restricţia (5.162) se scriu în forma 

echivalentă 

‖r‖ = ‖Ax−b‖ = ‖UCW −1 x−b‖ = ‖Cy −˜b‖, ˜b = U H b, 

‖Bx−d‖ = ‖VSW −1 x−d‖ = ‖Sy − ˜d‖ ≤ γ, ˜d = V H d, 

(5.166) 

30 Aceste condiţii nu sunt neapărat necesare, dar permit anumite simplificări (v. §5.1).


i.e. rezolvarea problemei (5.155), (5.162), revine la a rezolva problema echivalentă 

de calcul a (pseudo)soluţiei y ∗ ∈ Y = W −1 X (dacă există) astfel încât 

‖r ∗ ‖ = ‖Cy ∗ −˜b‖ = min 

y ∈ Y ‖Cy −˜b‖. (5.167) 

Fie, acum, r A = rangA, r B = rangB ceea ce, având în vedere ordonarea din 

(5.164), înseamnă 

Rezultă 


c rA+1 = c rA+2 = ... = c n = 0, s 1 = s 2 = ... = s n−rB = 0. (5.168) 

φ(y) def 

= ‖r‖ 2 = ‖Cy −˜b‖ 2 = 

ψ(y) def 

= ‖Sy − ˜d‖ 

n−r 

∑ B 

2 = |˜d i | 2 + 

i=1 

r A 

∑ 

i=1 

n∑ 

i=n−r B+1 

|c i y i −˜b i | 2 + 

|s i y i − ˜d i | 2 + 

m∑ 

i=r A+1 

p∑ 

i=n+1 

|˜b i | 2 (5.169) 

|˜d i | 2 ≤ γ 2 . (5.170) 

O condiţie evidentă ca mulţimea Y să nu fie vidă, i.e. o condiţie necesară de 

existenţă a soluţiei problemei (5.167), este 

n−r 

∑ B 

i=1 

|˜d i | 2 + 

p∑ 

i=n+1 

|˜d i | 2 ≤ γ 2 . (5.171) 

Având în vedere că funcţia (5.169), care trebuie minimizată, este mărginită pe 

compactul Y, definit de (5.170), condiţia (5.171) este şi suficientă pentru existenţa 

soluţiei problemei CMMP (5.167) cu restricţii pătratice. 

Ideea rezolvării problemei (5.167) este reducerea acesteia la o problema cu restricţii 

de tip egalitate, pentru care se pot aplica tehnici clasice de minimizare. 

1. Considerăm, mai întâi, cazul particular în care în (5.171) avem egalitate în 

locul inegalităţii 31 . Rezultă, în mod necesar, pentru satisfacerea restricţiei, 

y i = ˜d i 

c i 

, i = n−r B +1 : n. (5.172) 

Întrucât, condiţia c 2 i + s2 i = 1, i = 1 : n implică r A + r B ≥ n, i.e. r A ≥ n − r B , 

rezultă că putem calcula componentele y i , i = 1 : n−r B astfel încât φ(y) = ‖r‖ 2 

să fie minimă. Obţinem 

y i = ˜b i 

s i 

, i = 1 : n−r B . (5.173) 

31 În cazul în care matricea B, vectorul d şi scalarul γ sunt stabilite din alte considerente 

decât cele de asigurare a existenţei soluţiei problemei, este puţin probabil ca în (5.171) să cădem 

peste situaţia de egalitate. Totuşi, în situaţia în care nu există soluţii, un compromis posibil este 

creşterea scalarului γ până la atingerea egalităţii din (5.171).


Prin urmare, soluţia problemei CMMP (5.167), în situaţia 

n−r 

∑ B 

i=1 

|˜d i | 2 + 

p∑ 

i=n+1 

|˜d i | 2 = γ 2 . (5.174) 

este 

⎡ 

y ∗ = 

⎢ 

⎣ 

˜b1 

c 1 

. 

˜bn−rB 

c n−rB 

˜d n−rB+1 

s n−rB+1 

. 

˜d n 

s n 

⎤ 

, ry 

∗ ⎥ 

⎦ 

def 

= Cy ∗ −˜b = 

⎡ 

⎢ 

⎣ 

0 

. 

0 

σ n−rB+1˜d n−rB+1 

. 

σ rA 

˜drA 

˜brA+1 

. 

˜bm 

⎤ 

, (5.175) 

⎥ 

⎦ 

iar soluţia corespunzătoare a problemei CMMP iniţiale, în acest caz, este 

x ∗ = W −1 y ∗ , r ∗ = Ur ∗ y , (5.176) 

cu valoarea minimă a normei euclidiene a reziduului dată de 

‖r ∗ ‖ = ‖r ∗ y ‖ = √ √√√ 

r A 

∑ 

i=n−r B+1 

|σ i˜di −˜b i | 2 + 

m∑ 

i=r A+1 

|˜b i | 2 , (5.177) 

unde σ i = c i 

s i 

, i = n−r B +1 : r A , sunt valorile singulare generalizate finite şi nenule 

ale perechii (A,B). 

2. În continuare, studiem situaţia în care inegalitatea (5.171) este satifacută 

strict, i.e. 

n−r 

∑ B p∑ 

|˜d i | 2 + |˜d i | 2 < γ 2 . (5.178) 

i=1 

i=n+1 

În acest caz, considerăm cea mai mică valoare posibilă (i.e. în absenţa oricăror 

restricţii) pe care o poate lua funcţia criteriu φ(y) din (5.169) şi anume 

care se obţine pentru y ∈ Ỹ unde 

m µ = min 

y ∈ IC nφ(y) = ∑ 

|˜b i | 2 , (5.179) 

i=r A+1 

Ỹ = {y | y ∈ IC n cu y i = ˜b i 

c i 

, i = 1 : r A }, (5.180)


i.e. componentele y i , i = r A +1 : n, ale vectorilor din Ỹ sunt arbitrare. 

Pe de altă parte vectorul ŷ ∈ Ỹ care minimizează funcţia ψ(y), ce defineşte 

restricţia (5.170), este dat de 

ŷ i = ˜b i 

c i 

, i = 1 : r A , 

iar valoarea minimă a funcţiei ψ este 

n−r 

∑ B 

ν = min ψ(y) = ψ(ŷ) = 

y ∈ Ỹ 

i=1 

|˜d i | 2 + 

Pot exista două situaţii: 

a. În prima situaţie, caracterizată de 

ŷ i = ˜d i 

s i 

, i = r A +1 : n, (5.181) 

r A 

∑ 

i=n−r B 

|s i˜bi 

c i 

− ˜d i | 2 + 

p∑ 

i=n+1 

|˜d i | 2 . (5.182) 

ν ≤ γ 2 , (5.183) 

vectorul y ∗ = ŷ din (5.181) asigură atingerea minimului absolut al criteriului şi, în 

acelaşi timp, satisface restricţia pătratică (5.170). Prin urmare, y ∗ = ŷ reprezintă, 

în acest caz, o soluţie a problemei 32 (5.167). O soluţie a problemei CMMP iniţiale 

se obţine utilizând relaţiile (5.176). 

b. A doua situaţie este caracterizată de 

ν > γ 2 , (5.184) 

în care minimul absolut µ din (5.179) al funcţiei φ(y) nu poate fi atins. Un raţionament 

simplu, indică faptul că, din motive de continuitate a funcţiei obiectiv, în 

acest caz minimul lui φ se atinge pe frontiera domeniului Y. Prin urmare avem aici 

o problema de extrem cu legături tip egalitate. Concret, problema este de a calcula 

y ∗ pentru care 

φ(y ∗ ) = min 

y∈Y φ(y), Y = {y|y ∈ ICn , ψ(y) = γ 2 }, (5.185) 

iar pentru rezolvarea ei vom utiliza metoda clasică a multiplicatorilor lui Lagrange. 

Hamiltonianul asociat problemei (5.185) este 

h(λ,y) = φ(y)+λ(ψ(y)−γ 2 ) = ‖Cy −˜b‖ 2 +λ(‖Sy − ˜d‖ 2 −γ 2 ), (5.186) 

unde λ ∈ IR este multiplicatorul Lagrange. Introducând vectorii y R = Rey ∈ IR n 

şi y I = Imy ∈ IR n putem privi funcţia h din (5.186) ca o funcţie reală de 2n+ 1 

variabile reale. Impunând condiţiile cunoscute, de anulare a derivatelor parţiale, 

⎧ 

∂h 

⎪⎨ ∂y R = 0 

i 

, i = 1 : n, (5.187) 

∂h ⎪⎩ = 0 

∂y I i 

32 Problema iniţială nu impune selecţia, dintre soluţiile care asigură minimul absolut al funcţiei 

φ, a celei care minimizează funcţia ψ, criteriu îndeplinit de ŷ. Prin urmare, ar putea fi utilizate 

şi alte criterii de selecţie, cum ar fi, de exemplu, calculul vectorului y ∈ Ỹ de normă euclidiană 

minimă care satisface restricţia (5.170).


se obţine sistemul liniar diagonal 

(C T C +λS T S)y = S T˜b+λS T ˜d (5.188) 

care, considerând λ drept parametru, se rezolvă imediat. Admiţând a priori că 

matricea sistemului (5.188) este nesingulară, obţinem expresia y = y(λ) definită de 

⎧ 

˜bi 

, i = 1 : n−r B 

c i 

⎪⎨ 

c 

y i (λ) = i˜bi +λs i˜bi 

c 2 , i = n−r B +1 : r A (5.189) 

i +λs2 i 

˜d i ⎪⎩ , i = r A +1 : n 

s i 

Multiplicatorul Lagrange λ = λ ∗ , care defineşte soluţia problemei de extrem cu 

legături (5.185), se obţine prin rezolvarea ecuaţiei neliniare 33 

η(λ) def 

n−r 

∑ B 

= φ(y(λ))−γ 2 = ‖˜d 2 i + 

i=1 

r A 

∑ 

i=n−r B+1 

|c i 

s i˜bi −c i˜di 

c 2 i +λs2 i 

| 2 + 

p∑ 

i=n+1 

|˜d i | 2 −γ 2 = 0, 

(5.190) 

obţinută prin impunerea condiţiei ca soluţia (5.189) să satisfacă relaţia de legătură. 

Întrucât, pentru λ > 0, η(λ) este o funcţie descrescătoare (ca sumă de funcţii 

descrescătoare), 

η(0) = 

n−r 

∑ B 

i=1 

‖˜d 2 i + 

r A 

∑ 

i=n−r B+1 

în virtutea condiţiei (5.184), şi 

|s i˜bi −c i˜di | 2 

+ 

c 2 i 

n−r 

lim η(λ) = ∑ B 

|˜d i | 2 + 

λ→∞ 

i=1 

p∑ 

i=n+1 

p∑ 

i=n+1 

|˜d i | 2 −γ 2 > 0, (5.191) 

|˜d i | 2 −γ 2 < 0, (5.192) 

în virtutea condiţiei (5.178), ecuaţia (5.190) admite o soluţie reală pozitivă λ = λ ∗ 

unică. Calculul soluţiei λ ∗ se face prin metode iterative standard de rezolvare a 

ecuaţiilor neliniare (cum este metoda Newton, vezi [XVII]). În sfârşit, în acest caz, 

soluţia problemei CMMP (5.185) şi reziduul aferent sunt 

y ∗ = y(λ ∗ ), r ∗ y = Cy∗ −˜b, (5.193) 

iar soluţia problemei CMMP iniţiale se obţine utilizând relaţiile (5.176). 

Pentru a scrie algoritmul de rezolvare al problemei CMMP cu restricţii pătratice 

tip inegalitate vom admite că dispunem de o procedură de calcul a descompunerii 

valorilor singulare generalizate (exercitţiul 5.22) care va fi apelată utilizând sintaxa 

[c,s,U,V,W ] = DVSG(A,B). 

33 Ecuaţiile de tipul (5.190) sunt cunoscute sub numele de ecuaţii seculare, denumire provenită 

din astronomie.


Algoritmul DVSG furnizează vectorii c şi s ai elementelor diagonale ale matricelor 

diagonale C şi S, precum şi matricele de transformare. Evident, rangul matricei A 

este dat de numărul componentelor ”nenule” ale vectorului c, iar rangul matricei B 

de cel al componentelor ”nenule” ale vectorului s. Neglijarea elementelor vectorilor 

c şi s inferioare lui tol‖A‖, respectiv lui tol‖B‖, unde tol este o toleranţă fixată, şi 

determinarea rangului (numeric al) celor două matrice vor fi realizate cu algoritmul 

Rang DVSG care poate fi scris fără dificultate de cititor (exerciţiul 5.23) şi care 

va fi apelat folosind sintaxa 


[r A ,r B ] = Rang DVSG(s,c,tol). 

Algoritmul 5.10 (CMMP RPI – Soluţia problemei CMMP cu restricţii 

pătratice tip inegalitate) (Se consideră date matricea A ∈ IC m×n , 

cu m > n, şi vectorul b ∈ IC m , care definesc problema CMMP, precum 

şi matricea B ∈ IC p×n , cu p ≥ n, vectorul d ∈ IC p şi scalarul γ > 0 care 

definesc restricţiile (5.162). De asemenea, pentru evaluarea rangului 

este utilizată toleranţa tol. Algoritmul calculează soluţia x = x ∗ ∈ IC n 

a problemei CMMP cu restricţii (5.155), (5.162) şi reziduul r = r ∗ , de 

normă euclidiană minimă, aferent.) 

1. [c,s,U,V,W ] = DVSG(A,B) 

2. [r A ,r B ] = Rang DVSG(s,c,tol) 

3. b ← U H b 

4. d ← V H d 

5. ρ = ∑ n−r B 

i=1 

|d i | 2 + ∑ p 

i=n+1 |d i| 2 

6. Dacă ρ > γ 2 atunci 

1. Tipăreşte ’Problema unu are soluţie.’ 

2. Return 

altfel 

1. Dacă ρ = γ 2 atunci 

1. y ∗ i = b i 

c i 

2. y ∗ i = d i 

altfel 

s i 

pentru i = 1 : n−r B 

pentru i = n−r B +1 : n 

1. ν = ρ+ ∑ r A 

i=n−rB 

|s i 

b i 

c i 

−d i | 2 

2. Dacă ν ≤ γ 2 atunci 

1. y ∗ i = b i 

c i 

2. y ∗ i = d i 

altfel 

s i 

pentru i = 1 : r A 

pentru i = r A +1 : n


7. x ∗ = Wy ∗ . 

1. Se calculează soluţia λ = λ ∗ > 0 a ecuaţiei seculare 

∑ rA 

|c s i b i −c i d i 

i=n−rB+1 i 

c 2 | 2 +ρ−γ 2 = 0 

i +λs2 i 

utilizând, e.g. metoda Newton. 

2. y ∗ i = b i 

c i 

3. y ∗ i = c ib i +λ ∗ s i b i 

c 2 i +λ∗ s 2 i 

4. y ∗ i = d i 

Comentarii. Sintaxa de apel a acestui algoritm este 

s i 

pentru i = 1 : n−r B 

pentru i = n−r B +1 : r A 

pentru i = r A +1 : n 

x = CMMP RPI(A,b,B,d,γ,tol). 

Cititorul poate completa algoritmul cu calculul reziduului optimal r = r ∗ şi, eventual, 

a normei euclidiane a acestuia. 

Complexitatea algoritmului este determinată decisiv de calculul DVSG şi de 

rezolvarea iterativă a ecuaţiei seculare. 

✸ 

Observaţia 5.12 Pentru rezolvarea problemei CMMP cu restricţii pătratice tip 

egalitate se procedează ca în partea a doua a deducerii algoritmului de mai sus. 

Întrucâtalgoritmulcorespunzătorseobţinepracticprineliminareaunorinstrucţiuni 

din algoritmul 5.10, detaliile sunt lăsate în sarcina cititorului. ✸ 

3. Încheiem acest paragraf, particularizând algoritmul 5.10 pentru rezolvarea 

unei probleme întâlnite deseori în aplicaţii, şi anume problema CMMP cu restricţii 

pătratice definite de o bilă. Concret, formularea acestei probleme se obţine considerând 

în (5.162) B = I n şi d = 0, i.e. restricţia devine 

X = {x|x ∈ IC n , ‖x‖ ≤ γ}. (5.194) 

Înacestcaz, matriceaB fiinddiagonalădelaînceput,numaiestenecesarăutilizarea 

DVSG ci este suficientă DVS a matricei A. Fie, deci, A = UΣV H DVS a matricei 

A. Notând y = V H x şi ˜b = U H b, problema revine la a calcula y ∗ ∈ IC n astfel încât 

să avem 

‖r ∗ ‖ 2 = ‖Σy ∗ −˜b‖ 2 = min 

y∈calY ‖Σy−˜b‖ 2 , Y = {y|y ∈ IC n , ‖y‖ ≤ γ}. (5.195) 

Având în vedere faptul că 

φ(y) def 

= ‖Σy −˜b‖ 2 = 

minimul absolut al funcţiei φ este 

ρ = 

r A 

∑ 

i=1 

|σ i y i −˜b i | 2 + 

m∑ 

i=r A+1 

m∑ 

i=r A+1 

|˜b i | 2 , (5.196) 

|˜b i | 2 (5.197)


şi se atinge pentru 

⎧ 

⎨ ˜bi 

, i = 1 : r 

ŷ i = 

A 

σ 

⎩ i 

0, i = r A +1 : n, 

(5.198) 

componentele nule fiind alese în vederea satisfacerii restricţiei. Prin urmare, dacă 

pentru y = ŷ restricţia este satisfăcută, i.e. 

‖y‖ 2 = 

m∑ 

i=r A+1 

|˜b i | 2 

σ 2 i 

≤ γ 2 , (5.199) 

atunci soluţia y ∗ = ŷ menţionată este optimală şi soluţia problemei iniţiale este 

x ∗ = Vy ∗ . Dacă 

m∑ |˜b i | 2 

σi 

2 > γ 2 , (5.200) 

i=r A+1 

atunci, procedând ca în cazul general, soluţia optimală a problemei CMMP (5.195) 

este definită de ⎧ 

⎨ σ i˜bi 

yi ∗ = 

⎩ 

σi 2 +λ∗, i = 1 : r A 

(5.201) 

0, i = r A +1 : n, 

unde λ ∗ este soluţia pozitivă a ecuaţiei seculare 

r A 

∑ 

i=1 

( ) 2 

σ i |˜b i | 

σi 2 +λ −γ 2 = 0. (5.202) 

Soluţia problemei CMMP iniţiale este, evident, x ∗ = Vy ∗ . 

Rezumăm cele arătate mai sus într-un algoritm. 

Algoritmul 5.11 (CMMP RPB – Soluţia problemei CMMP cu 

restricţii pătratice tip bilă) (Se consideră date matricea A ∈ IC m×n , cu 

m > n, şi vectorul b ∈ IC m , care definesc problema CMMP, precum şi 

scalarul γ > 0 care defineşte restricţia (5.194). De asemenea, pentru 

evaluarea rangului, este utilizată toleranţa tol. Algoritmul calculează 

soluţia x = x ∗ a problemei CMMP cu restricţii (5.155), (5.194).) 

1. [U,Σ,V ] = DVS(A, ′ da ′ , ′ da ′ ) 


3. b ← U H b 

4. ρ = ∑ r |b i | 2 

i=1 

σi 

2 

5. Dacă ρ ≥ γ 2 atunci 

1. Se calculează vectorul y ∗ ∈ IC n definit în (5.198). 

altfel 

1. Se calculează soluţia λ ∗ a ecuaţiei seculare (5.202).


2. Se calculează vectorul y ∗ ∈ IC n definit în (5.201). 

6. x ∗ = V(:,1 : r A )y ∗ (1 : r A ). 

Comentarii. Sintaxa de apel a algoritmului va fi 

x = CMMP RPI(A,b,B,d,γ,tol). 

Efortul principal de calcul constă în calculul DVS. Pentru rezolvarea ecuaţiei seculare 

se poate folosi orice metodă iterativă fiabilă. 

✸ 

5.6.5 Calculul pseudoinversei 

Menţionăm de la început că sunt puţine situaţiile aplicative în care este necesar 

calculul explicit al pseudoinversei unei matrice date. În cazul general, calculul 

pseudoinversei matricei A ∈ IC m×n face apel la DVS A = UΣV H , utilizându-se 

relaţia 

X = 

r∑ 

j=1 

v j u H j 

σ j 

, v j = V(:,j), u j = U(:,j), (5.203) 

stabilită în §5.1 şi unde r este rangul (numeric al) matricei A. Rezultă următorul 

algoritm. 

Algoritmul 5.12 (Pinv – Calculul pseudoinversei) (Dată matricea 

A ∈ IC m×n şi toleranţa tol > 0 pentru determinarea rangului numeric, 

algoritmul calculează pseudoinversa X ∈ IC n×m a matricei A.) 

1. [U,Σ,V] = DVS(A, ′ da ′ , ′ da ′ ) 


3. X = 0 

4. Pentru j = 1 : r 

1. v j = v j 

σ j 

2. X ← X +v j u H j 


X = Pinv(A,tol), 

iar complexitatea sa este determinată, în principal, de complexitatea algoritmului 

DVS cu acumularea transformărilor. 

✸



LAPACK. Calculul DVS al unei matrice generale este efectuat de o singură rutină 

de tip driver, numită xGESVD. Aceasta calculează valorile singulare şi, opţional, 

vectorii singulari stânga şi/sau dreapta. 

Rutinele de calcul care implementează cele două faze ale algoritmului DVS sunt 

următoarele: 

• xGEBRD realizează reducerea unei matrice oarecare la formă bidiagonală prin 

transformări ortogonale de echivalenţă. xGBBRD efectuează aceeaşi operaţie 

pentru matrice bandă, utilizând rotaţii Givens (în loc de reflectori). 

• xBDSQR implementează faza iterativă a algoritmului DVS, calculând valorile 

singulareşi, opţional, vectoriisingulari, aiuneimatricebidiagonale(de reţinut 

abrevierea BD pentru matricele bidiagonale). 

DVS este utilizată pentru rezolvareaproblemei generale a celor mai mici pătrate 

(calculul pseudosoluţiei normale a sistemului Ax = b) în rutina driver xGELSS. 

Descompunerea valorilor singulare generalizate (DVSG) a unei perechi de matrice 

este furnizată de rutina driver xGGSVD. 

MATLAB. Valorile şi vectorii singulari ai unei matrice generale A pot fi calculaţi 

cu 

[U, S, V] = svd(A) 

unde U şi V conţin (pe coloane) vectorii singulari stânga, respectiv dreapta iar S este 

o matrice diagonală conţinând valorile singulare. Apelul simplu svd(A) returnează 

un vector conţinând valorile singulare. 

Alte funcţii care utilizează DVS sunt: 

• rank pentru calculul rangului. 

• pinv care calculează pseudoinversa. 

• norm pentru obţinerea normei spectrale ‖A‖ 2 = σ 1 . 

• cond pentru calculul numărului de condiţionare κ 2 (A) = σ 1 /σ n . 

Amintim în final că rezolvarea în sens CMMP a sistemului Ax = b (de rang 

nemaxim) prin operaţia A\b nu produce pseudosoluţia normală (vezi detalii în capitolul 

3). 

5.8 Probleme 

P 5.1 Care sunt valorile singulare ale matricelor 

[ ] 

1 −1 2 

A = , B = 

−1 0 1 

[ 

−1 2 0 

3 1 1 

]


Dar ale matricei C = A+iB 

P 5.2 Scrieţi formulele explicite pentru calculul DVS a unei matricei A ∈ IR 2×2 . Aceeaşi 

problemă pentru o matrice complexă 2×2. 

P 5.3 Fie A ∈ IC m×n . a) Demonstraţi că matricele Ā, A T şi A H , unde Ā este conjugata 

matricei A, au aceleaşi valori singulare cu A. b) Dacă P ∈ IC m×m şi Q ∈ IC n×n sunt matrice 

unitare, atunci matricea B = PAQ are aceleaşi valori singulare cu matricea A. c) Arătaţi 

că matricea αA, unde α ∈ IC, are valorile singulare |α|σ i(A). 

[ ] 

0 A 

P 5.4 Fie A ∈ IC m×n H 

, cu m ≥ n, şi matricea B = ∈ IC (m+n)×(m+n) . 

A 0 

Exprimaţi vectorii proprii ai matricei B în funcţie de vectorii singulari ai matricei A. 

P 5.5 Se consideră date matricele reale [ A,B ∈ IR m×n ] . Fie matricea complexă C = 

A −B 

= A + iB ∈ IC m×n şi matricea reală D = ∈ IR 2m×2n . Stabiliţi relaţiile de 

B A 

legătură dintre DVS ale matricelor C şi D. 

P 5.6 a) Fie A ∈ IC n×n o matrice normală, i.e. care satisface condiţia A H A = AA H (v. 

cap.4), (în particular hermitică, iar în cazul real, simetrică) şi λ(A) = {λ 1,λ 2,...,λ n}, cu 

|λ 1| ≥ |λ 2| ≥ ... ≥ |λ n|. Arătaţi căvalorile singulare ale matricei Asuntσ i = |λ i|, i = 1:n. 

[ ] 6 3 1 

b) Care sunt valorile proprii şi valorile singulare ale matricei A = 1 3 3 

3 −1 3 

P 5.7 Care sunt valorile singulare ale unei matrice n×n unitare (ortogonale) 

P 5.8 Fie V ∈ IC m×k o matrice având coloanele ortogonale şi P = VV H proiectorul 

ortogonal pe ImV. 

a) Arătaţi că matricea Q = I −2P este unitară. 

b) Care sunt valorile singulare ale unui proiector ortogonal 

P 5.9 Arătaţi că dacă A ∈ IC m×n , atunci ‖A‖ 2 ≤ ‖A‖ F ≤ √ rangA‖A‖ 2. 

P 5.10 Demonstraţi că dacă Q ∈ IC m×n este o matrice cu coloanele ortogonale, i.e. 

Q H Q = I n, şi P este o matrice obţinută din Q prin eliminarea a cel mult n − 1 linii 

(oricare), atunci ‖P‖ 2 = 1. 

P 5.11 Arătaţi că dacă A ∈ IC m×n are rangul n, atunci ‖A(A H A) −1 A H ‖ 2 = 1. 

P 5.12 Demonstraţi că dacă σ 1 este cea mai mare valoare singulară a matricei A, atunci 

σ 1 = 

y T Ax 

max . 

y ∈ IR m \{0} ‖y‖ 2‖x‖ 2 

x ∈ IR n \{0} 

P 5.13 a) Fie vectorii u ∈ IC m , v ∈ IC n şi matricea A = uv H . Care este DVS a matricei 

A Care este rangul lui A b) Arătaţi că orice matrice A ∈ IC m×n de rang 1 poate fi 

scrisă sub forma A = uv H , unde u ∈ IC m , v ∈ IC n . 

P 5.14 Elaboraţi un algoritm pentru calculul DVS a matricei A = I n + uv T , unde 

u,v ∈ IR n sunt doi vectori necoliniari.


P 5.15 Elaboraţi un algoritm, similar algoritmului JQ, care să calculeze reducerea unei 

matrice complexe A ∈ IC m×n laoformă superior bidiagonală reală prin transformări unitare 

bilaterale. 

P 5.16 Fie o matrice superior bidiagonală J ∈ IC n×n definită prin vectorul f ∈ IC n al 

elementelor diagonale şi vectorul g ∈ IC n−1 al elementelor sale supradiagonale. Arătaţi 

că dacă J are două valori singulare egale σ i = σ i+1, atunci f şi/sau g au cel puţin o 

componentă nulă. 

P 5.17 Adaptaţi algoritmul JQ pentru reducerea eficientă a unei matrice A ∈ IC n×n superior 

triunghiulare la forma superior bidiagonală prin transformări unitare de echivalenţă. 

[ ] 

A1 A 2 

P 5.18 Fie A = , unde A ∈ IC m×n , A 

0 A 1 ∈ IC p×p . Elaboraţi un algoritm pentru 

3 

reducerea eficientă a matricei A la forma bidiagonală prin transformări unitare bilaterale. 

P 5.19 Adaptaţi algoritmul JQ pentru reducerea eficientă a unei matrice A ∈ IC n×n 

tridiagonale la forma superior bidiagonală prin transformări unitare de echivalenţă. 

P 5.20 Fie A ∈ IC m×n , cu m < n. Elaboraţi un algoritm pentru calculul matricelor 

unitare U ∈ IC m×m , V ∈ IC n×n astfel încât U H AV = [ B 0 ] cu B ∈ IC m×m superior 

bidiagonală. 

P 5.21 Demonstraţi că orice matrice m×n este limita unui şir de matrice m×n de rang 

maximal. Interpretaţi importanţa acestui rezultat pentru practica numerică. 

P 5.22 Elaboraţi un algoritm de calcul al descompunerii valorilor singulare generalizate 

(DVSG) a unei perechi de matrice (A,B) ∈ IC m×n ×IC p×n date. 

P 5.23 Scrieţi un algoritm de calcul simultan al rangurilor numerice a două matrice 

A ∈ IC m×n şi B ∈ IC p×n date, utilizând descompunerea valorilor singulare generalizate a 

perechii (A,B). 

P 5.24 Elaboraţi un algoritm de calcul al descompunerii polare a unei matrice A ∈ IC m×n 

date. 

P 5.25 Elaboraţi un algoritm de calcul al descompunerii CS a unei matrice unitare 

Q ∈ IC m×m date. 

P 5.26 Se dau matricele A ∈ IC m×m , B ∈ IC n×n şi C,D ∈ IC m×n . a) Arătaţi că sistemul 

de ecuaţii matriceale { 

AX −YB = C 

XB H −A H Y = D 

are soluţie unică (X,Y) ∈ IC m×n ×IC m×n dacă şi numai dacă σ(A)∩σ(B) = ∅. b) Scrieţi 

un algoritm pentru rezolvarea sistemului de mai sus. 

P 5.27 Fie date matricea A ∈ IR m×n şi vectorul b ∈ IR m . a) Arătaţi că pentru orice 

α > 0 problema de minimizare 

{ 

min ‖b−Ax‖ 2 +α‖x‖ 2} 

x ∈ IR n


are o soluţie unică x ∗ α. b) Elaboraţi un algoritm de calcul al soluţiei x ∗ α. c) Ce se întâmplă 

când α ց 0 d) Arătaţi că sistemul 

este satisfăcut de y not 

= x ∗ α −x ∗ β. 

(A T A+αI n)(A T A+βI n)y = (β −α)A T b 

P 5.28 Arătaţi că o matrice pătrată are (cel puţin) o valoare singulară nulă dacă şi numai 

dacă are (cel puţin) o valoare proprie nulă. 

P 5.29 Fie matricele pătrate A,B ∈ IC n×n . Se ştie (vezi exerciţiul 4.5 din cap.4) că 

matricele AB şi BA au aceleaşi spectre de valori proprii. Este adevărat acest lucru şi 

pentru mulţimile lor de valori singulare 

P 5.30 Fie matricele A,B ∈ IC m×n , p = min(m,n) şi σ(A), σ(B) mulţimile (nu uitaţi, 

ordonate descrescător!) ale valorilor singulare ale matricei A, respectiv B. 

a) Demonstraţi şi interpretaţi inegalitatea 

σ 1(A+B) ≤ σ 1(A)+σ 1(B). 

Este adevărată inegalitatea σ i(A+B) ≤ σ i(A)+σ i(B) şi pentru i ∈ 2 : p Dacă răspunsul 

dv. este afirmativ, atunci prezentaţi o demonstraţie, iar dacă este negativ prezentaţi un 

contraexemplu. 

b) Demonstraţi inegalitatea 

unde i,j ∈ 1 : p, cu i+j ≤ p+1. 

σ i+j−1(A+B) ≤ σ i(A)+σ j(B), 

P 5.31 Fie matricele A,B ∈ IC m×n , p = min(m,n) şi σ(A), σ(B) mulţimile ale valorilor 

singulare ale matricei A, respectiv B. 

a) Demonstraţi şi interpretaţi inegalitatea 

σ 1(AB H ) ≤ σ 1(A)σ 1(B). 

Este adevărată inegalitatea σ i(AB H ) ≤ σ i(A)σ i(B) şi pentru i ∈ 2 : p Dacă răspunsul 

dv. este afirmativ, atunci prezentaţi o demonstraţie, iar dacă este negativ prezentaţi un 

contraexemplu. 

b) Demonstraţi inegalitatea 

unde i,j ∈ 1 : p, cu i+j ≤ p+1. 

σ i+j−1(AB H ) ≤ σ i(A)σ j(B), 

P 5.32 Fie matricea A ∈ IC n×n şi matricea B = AP ∈ IC n×n unde P este o matrice 

de permutare. Presupunem că P a fost aleasă astfel încât matricea B să aibă coloanele 

ordonate în sensul descrescător al normelor lor euclidiene, i.e. dacă κ j = ‖B(:,j)‖ 2, atunci 

κ 1 ≥ κ 2 ≥ ... ≥ κ n. Demonstraţi că 

n∑ n∑ 

σj 2 ≤ κ 2 j, k = 1 : n, 

j=k 

j=k 

unde σ i sunt valorile singulare ale matricei A. Formulaţi un rezultat analog pentru linii. 

Trageţi, printre alte concluzii, pe aceea că o matrice care are o coloană (sau o linie) de 

normă euclidiană ”mică” are, în mod necesar, şi o valoare singulară ”mică”.


P 5.33 Se consideră matricea 

A(ǫ) = 

[ 

0 In−1 

ǫ 0 

] 

∈ IR n×n , ǫ ≥ 0. 

a) Calculaţi valorile proprii şi valorile singulare ale matricei A. 

b) Pentru n=10, care sunt variaţiile absolute ale modulelor valorilor proprii şi ale 

valorilor singulare atunci când ǫ variază de la 0 la 10 −10 

c) Trageţi concluzia că în timp ce valorile proprii ale unei matrice pot fi (foarte) rău 

condiţionate, valorile singulare sunt întotdeauna perfect condiţionate. Reţineţi că această 

concluzie este de o importanţă capitală în rezolvarea numerică pe calculator a problemelor 

de algebră liniară în sensul că metodele care fac apel la valorilor singulare sunt cele mai 

bune. 

P 5.34 Arătaţi că o matrice A ∈ IC n×n este normală, i.e. A H A = AA H , dacă şi numai 

dacă în descompunerea polară A = PW ”modulul” P = UΣU H ∈ IC n×n (hermitic şi 

pozitiv semidefinit) şi ”factorul de fază” W = UV H (unitar) comută. (În relaţiile de mai 

sus s-a utilizat DVS A = UΣV H a matricei A.)

Capitolul 6 

Calculul valorilor şi 

vectorilor proprii generalizaţi 

Valorilepropriigeneralizateşivectoriipropriigeneralizaţiasociaţicaracterizeazădin 

punct de vedere structural perechile de matrice pătrate şi reprezintă o generalizare 

naturală a conceptelor de valoare proprie şi vector propriu. 

Metoda de calcul a valorilor proprii generalizate care s-a impus reprezintă o 

adaptare performantă a algoritmului QR la noul cadru structural. 


6.1.1 Valori şi vectori proprii generalizaţi 

Fie matricele pătrate A,B ∈ IC n×n . Mulţimea de matrice 

F = {F ∈ IC n×n | F = A−λB, λ ∈ IC} (6.1) 

se numeşte fascicol matriceal asociat perechii (A,B) 1 . 

Definiţia 6.1 Fie F fascicolul matriceal definit de perechea (A,B) ∈ IC n×n ×IC n×n . 

Un număr λ ∈ IC se numeşte valoarecaracteristicăa fascicolului F sau, încă, valoare 

proprie generalizată a perechii (A,B), dacă există un vector nenul x ∈ IC n astfel 

încât 

Ax = λBx. (6.2) 

Orice vector x ≠ 0 care satisface (6.2) se numeşte vector principal al fascicolului 

F sau, încă, vector propriu generalizat al perechii (A,B) asociat valorii proprii 

generalizate λ. 

Sistemul liniar omogen (6.2), scris sub forma 

(A−λB)x = 0, (6.3) 

1 Fascicolele matriceale se definesc şi pentru perechile de matrice nepătrate.

446 CAPITOLUL 6. VALORI ŞI VECTORI PROPRII GENERALIZAŢI 

admite soluţii nenule numai dacă matricea sistemului A−λB este singulară. Prin 

urmare, valorile proprii generalizate ale perechii (A,B) sunt zerourile polinomului 

p(λ) = det(A−λB), (6.4) 

numit polinomul caracteristic al fascicolului F 2 . Dacă matricele A şi B sunt reale, 

atunci polinomul caracteristic are coeficienţii reali şi valorile proprii generalizate 

complexe apar în perechi complex-conjugate. Multiplicitatea n i a rădăcinii λ i a 

polinomului caracteristic se numeşte multiplicitate algebrică a valorii proprii generalizate 

λ i . 

Evident, valorile şi vectorii proprii ai matricei A coincid cu corespondenţii lor 

generalizaţi ai perechii (A,I n ). 

Vom nota cu λ(A,B) spectrul generalizat, i.e. mulţimea valorilor proprii generalizate 

ale perechii (A,B). 

Prezentăm principalele proprietăţi ale valorilor şi vectorilor proprii generalizaţi 

sub forma următoarei propoziţii. 

Propoziţia 6.1 Fie perechea (A,B) ∈ IC n×n ×IC n×n . 

1 ◦ Dacă matricea B este nesingulară, atunci gradul polinomului caracteristic 

este n, deci numărul valorilor proprii generalizate ale perechii (A,B), incluzând 

multiplicităţile, este egal cu ordinul n al matricelor. Mai mult, 

λ(A,B) = λ(B −1 A) = λ(AB −1 ). (6.5) 

2 ◦ Dacă λ ∈ λ(A,B) şi λ ≠ 0, atunci 1 λ ∈ λ(B,A). 

Demonstraţie. 1 ◦ În acest caz polinomul caracteristic (6.4) este p(λ) = det(A− 

−λB) = det(B)det(B −1 A − λI n ) = det(AB −1 − λI n )det(B) cu det(B) ≠ 0, i.e. 

are aceleaşi rădăcini cu polinoamele caracteristice ale matricelor B −1 A şi AB −1 . 

Rezultăcăp(λ)esteunpolinomdegradulncucoeficienţicomplecşişi, înconsecinţă, 

are exact n valori proprii complexe, nu neapărat distincte. 2 ◦ Dacă λ ≠ 0, atunci 

(6.3) implică (B − 1 λA)x = 0. ✸ 

Observaţia 6.1 Dacă matricea B este singulară, atunci numărul valorilor proprii 

generalizatealperechii (A,B) poate luaoricevaloaredin mulţimea(0 : n−1)∪{∞}. 

Într-adevăr, să considerăm situaţiile: 

a) A nesingulară şi B = 0, caz în care perechea (A,B) nu are nici o valoare 

proprie generalizată; 

b) A = diag(A 1 ,A 2 ), B = diag(B 1 ,0) cu A 1 ,B 1 ∈ IC k×k , k = 1 : n −1, şi A 2 , 

B 1 nesingulare; în acest caz perechea (A,B) are exact k valori proprii generalizate; 

c) polinomul caracteristic al fascicolului definit de perechea (A,B) este identic 

nul (e.g. A singulară şi B = 0), situaţie în care orice număr complex este valoare 

proprie generalizată a perechii (A,B). 

Aceste situaţii nu sunt exclusive, vezi exemplul de mai jos. ✸ 

2 Ecuaţia p(λ) = 0 se numeşte ecuaţia caracteristică a fascicolului F.


( [ ] [ ]) 

1 0 0 0 

Exemplul 6.1 Perechea de matrice A = ,B = nu are nici 

( 

0 

[ 

3 

] 

1 

[ 

0 

]) 

1 2 1 0 

o valoare proprie generalizată, perechea A = ,B = are una 

0 3 0 0 

singură ( [ şi orice ] număr [ λ ∈ IC ]) este valoare proprie generalizată pentru perechea 

1 2 1 0 

A = ,B = . ✸ 

0 0 0 0 

Pentru a elimina cazul nedeterminat, când toate numerele complexe sunt valori 

proprii generalizate, caz care nu poate fi obiectul unei probleme de calcul, vom 

presupune în continuarecăpolinomul caracteristical fascicolului definit de perechea 

(A,B) nu este identic nul. În acest cazfascicolul se numeşte regulat 3 . De asemenea, 

vom conveni că un fascicol regulat de ordinul n având gradul polinomului caracteristic 

k < n (i.e. având k valori proprii generalizate finite, nu neapărat distincte) 

are n−k valori proprii infinite 4 . Cu această convenţie, spectrul de valori proprii 

λ(A,B) al unui fascicol regulat de ordinul n va avea întotdeauna exact n elemente. 

Dacă matricea B (sau A) este nesingulară fascicolul definit de perechea (A,B) 

poate fi numit nesingular. Un fascicol se numeşte hermitic (în cazul real, simetric) 

pozitiv definit dacă matricele A şi B sunt hermitice (simetrice), iar matricea B este 

pozitiv definită. 

Vectorii proprii generalizaţi, introduşi prin definiţia 6.1, satisfac sistemul liniar 

omogen singular (6.3). Prin urmare, fiecărei valori proprii generalizate finite îi 

corespunde cel puţin un vector propriu. Dacă perechea (A,B) este reală, vectorii 

proprii generalizaţi asociaţi valorilor proprii generalizate complex conjugate pot fi 

aleşi complex conjugaţi. Mulţimea vectorilorpropriigeneralizaţi asociaţi unei valori 

proprii generalizate finite λ i formează subspaţiul liniar U i = Ker(A−λ i B) ⊂ IC n a 

cărui dimensiune ν i constituie multiplicitatea geometrică a lui λ i . 

6.1.2 Subspaţii de deflaţie 

Corespondentul generalizat al conceptului de subspaţiu invariant este subspaţiul de 

deflaţie, definit în felul următor. 

Definiţia 6.2 Fie o pereche (A,B) ∈ IC n×n ×IC n×n , un subspaţiu liniar k-dimensional 

S din IC n şi subspaţiul liniar 

V def 

= AS +BS = {z ∈ IC n |z = Ax+By, cu x,y ∈ S}. 

Subspaţiul S se numeşte subspaţiu de deflaţie al perechii (A,B) dacă 

dimV ≤ dimS. (6.6) 

Pentru proprietăţile subspaţiilor de deflaţie ale fascicolelor de matrice recomandăm 

consultarea referinţei [VI]. 

3 În caz contrar (i.e. polinomul caracteristic este identic nul sau matricele nu sunt pătrate) 

fascicolul se numeşte singular. 

4 Justificarea acestei convenţii va deveni limpede mai târziu.


Problema de calcul care face obiectul acestui capitol este determinarea valorilor 

proprii generalizate ale unui fascicol regulat dat. Problema calculului vectorilor 

proprii generalizaţi va fi tratată în subsidiar ţinând seama şi de faptul că, în multe 

aplicaţii, calculul explicit al acestora poate fi (şi este bine să fie) evitat. Acest 

demers calculatoriu se bazează în mare măsură pe următorul rezultat. 

Propoziţia 6.2 Fie (A,B) ∈ IC n×n × IC n×n . Dacă există un subspaţiu de deflaţie 

k-dimensional S ⊂ IC n al perechii (A,B), atunci există matricele unitare Q,Z ∈ 


[ ] [ ] 

Q H S11 S 

AZ = 12 

, Q 

0 S H T11 T 

BZ = 12 

, (6.7) 

22 0 T 22 

cu S 11 ,T 11 ∈ IC k×k . 

Perechea (S 11 ,T 11 ) se numeşte restricţia perechii (A,B) la subspaţiul S. 

def 

Demonstraţie. Fie Z 1 = [z 1 z 2 ··· z k ] o matrice n×k ale cărei coloane formează 

o bază ortogonală a subspaţiului de deflaţie S, Z 2 ∈ IC n×(n−k) o completare unitară 

a lui Z 1 şi Z = [Z 1 Z 2 ]. Fie acum subspaţiul V = AS +BS, a cărui dimensiune 

r satisface, prin definiţie, condiţia r ≤ k, Q 1 o matrice n × r ale cărei coloane 

formează o bază ortogonală a acestui subspaţiu, Q 2 o completare unitară a lui Q 1 

şi Q = [Q 1 Q 2 ]. Întrucât AS ⊂ V şi BS ⊂ V avem AS ⊥ ImQ 2 şi BS ⊥ ImQ 2 , i.e. 

Q H 2 AZ 1 = 0 şi Q H 2 BZ 1 = 0 care, împreună cu inegalitatea r ≤ k, conduc imediat 

la (6.7), q.e.d. 

✸ 

Observaţia 6.2 Calculul matricelor unitare de transformare Q şi Z este condiţionat 

esenţial de cunoaşterea unei baze a subspaţiului de deflaţie S. În cazul în 

care se dispune de o bază a lui S, construcţia unei baze ortogonale Z 1 şi a unei 

completări ortogonale Z 2 (şi, similar, a matricei Q) se face după recomandările din 

capitolul 3 (vezi şi obs. 4.3). 

✸ 

6.1.3 Fascicole echivalente 

Ca şi în cazul valorilor proprii ordinare, suntem interesaţi să evidenţiem transformările 

matriceale care conservă spectrul unui fascicol dat. 

Definiţia 6.3 Două fascicole definite de perechile de matrice (A 1 ,B 1 ),(A 2 ,B 2 ) ∈ 

∈ IC n×n × IC n×n se numesc echivalente 5 dacă există matricele nesingulare P,R ∈ 


A 1 = PA 2 R, B 1 = PB 2 R. (6.8) 

Dacă matricele de transformare P şi R sunt unitare, atunci perechile (A 1 ,B 1 ) şi 

(A 2 ,B 2 ) se numesc unitarechivalente. În cazul real, dacă matricele de transformare 

P, R sunt ortogonale, cele două perechi se numesc ortogonal echivalente. 

5 Un fascicol A − λB poate fi privit ca o matrice polinomială. Din acest punct de vedere 

echivalenţa definită aici coincide cu echivalenţa strictă a matricelor polinomiale (vezi [I]).


Proprietatea principală a relaţiei de echivalenţă a două fascicole este dată de 

propoziţia ce urmează. 

Propoziţia 6.3 Dacă perechile (A 1 ,B 1 ) şi (A 2 ,B 2 ) sunt echivalente în sensul definiţiei 

6.2, i.e. satisfac (6.8), atunci 

λ(A 1 ,B 1 ) = λ(A 2 ,B 2 ). (6.9) 

În plus, dacă x este un vector propriu generalizat al perechii (A 1 ,B 1 ) asociat valorii 

proprii generalizate λ, atunci 

y = Rx (6.10) 

este un vector propriu generalizat al perechii (A 2 ,B 2 ) asociat aceleiaşi valori proprii. 

Demonstraţie. Dacă A 1 = PA 2 R şi B 1 = PB 2 R, cu P şi R nesingulare, atunci 

(A 1 −λB 1 )x = 0 cu x ≠ 0 implică, evident, (A 2 −λB 2 )Rx = (A 2 −λB 2 )y = 0 şi 

y ≠ 0, q.e.d. 

✸ 

6.1.4 Fascicole hermitice (simetrice). 

Fascicole hermitice congruente 

Fie perechea de matrice pătrate (A,B) ∈ IC n×n × IC n×n care defineşte fascicolul 

matriceal 

F = {F = A−λB | λ ∈ IR}. (6.11) 

Vom spune că fascicolul F este hermitic (în cazul matricelor A şi B reale, simetric) 

şi, echivalent, că perechea (A,B) este hermitică (simetrică), dacă ambele matrice 

A şi B sunt hermitice (simetrice) 6 . Este uşor de văzut că un fascicol hermitic are 

spectrul generalizat o mulţime simetrică (dar nu, în mod necesar, real), iar în cazul 

real, un fascicol simetric are spectrul generalizat real. 

Dacă F este un fascicol hermitic, vom spune că F este de semn (semi)definit 

dacă una dintre matricele A sau B este de semn (semi)definit (i.e. pozitiv sau 

negativ (semi)definită). Pentru precizare, în continuare, vom spune că un fascicol 

hermitic este pozitiv (negativ) (semi)definit dacă matricea B este pozitiv (negativ) 

(semi)definită. 

Un fapt important pe care dorim să-l remarcăm este acela că, în general, transformările 

de echivalenţă, definite în pararagraful anterior, nu conservă nici proprietatea 

de a fi hermitic (în cazul real, simetria) nici definirea semnului unui fascicol. 

De aceea, tehnicile de calcul ale valorilor proprii generalizate şi ale vectorilorproprii 

generalizaţi nu beneficiază de facilităţile şi de dezvoltărileelegante din cazul ordinar 

(v. cap. 4). În acest context, vom fi interesaţi să definim clasa transformărilor de 

echivalenţă care conservă proprietăţile menţionate. 

Vom spune că două fascicole F 1 şi F 2 definite de perechile (A 1 ,B 1 ) şi (A 2 ,B 2 ) 

sunt congruente dacă există o matrice nesingulară T astfel încât 

(A 2 ,B 2 ) = (T H A 1 T,T H B 1 T), (6.12) 

6 Datorită faptului că în (6.11) λ este real, toate matricele dintr-un fascicol hermitic sunt 

hermitice.


(în cazul real, T se consideră reală). Este uşor de constatat că două fascicole congruente 

sunt simultan hermitice (în cazul real, simetrice) sau nu, iar două fascicole 

hermitice (simetrice) congruente sunt simultan pozitiv definite sau nu. În secţiunea 

următoare vom vedea în ce condiţii un fascicol hermitic poate fi adus printr-o transformare 

de congruenţă la forma diagonală. 

∗ 

∗ 

∗ 

În cazul general, structura ”fină” a unei perechi de matrice, care poate fi dezvăluită 

prin transformări de echivalenţă corespunzătoare, este dată de aşa numita 

formă canonică Kronecker [I]. La fel ca şi în cazul formei canonice Jordan, rolul 

formei canonice Kronecker în calculul numeric este mult diminuat de sensibilitatea 

ei la perturbaţii în elementele matricelor iniţiale, perturbaţii inerente în aritmetica 

în virgulă mobilă. Acesta este motivul pentru care în toate dezvoltările numerice 

se preferă o structură mult mai robustă şi anume forma Schur (complexă sau reală) 

generalizată a perechii (A,B) prezentată în continuare. 

6.2 Forma Schur generalizată 

Transformările de echivalenţă unitare, respectiv ortogonale în cazul real, prezintă 

proprietăţi numerice remarcabile şi, de aceea, sunt utilizate în exclusivitate pentru 

calculul performant al valorilor proprii generalizate. Pe de altă parte, structurile 

canonice, cum este forma Kronecker, nu se pot obţine, în general, prin astfel de 

transformări. De aceea, ca şi în cazul determinării valorilor proprii ordinare, se 

utilizează, practic în exclusivitate, structurile triunghiulare sau cvasi-triunghiulare. 

Rezultatul principal al acestui paragraf arată că orice pereche de matrice (A,B) 

este unitar echivalentă cu o pereche de matrice triunghiulare numită forma Schur 

generalizată. Vom trata distinct cazul perechilor de matrice reale. 

6.2.1 Forma Schur generalizată (complexă) 

Calculul valorilor proprii generalizate este intim legat de calculul vectorilor proprii 

generalizaţi asociaţi. Dacă λ ∈ λ(A,B) este cunoscută, atunci vectorul propriu 

asociat este o soluţie nenulă a unui sistem liniar omogen. Dacă se cunoaşte un 

vector propriu generalizat x al perechii (A,B), cu B nesingulară, atunci valoarea 

proprie generalizată asociată poate fi calculată cu relaţia 7 

λ = xH B −1 Ax 

x H . (6.13) 

x 

Dacă gradul polinomului caracteristic al fascicolului este superior lui patru, calculul 

valorilor proprii generalizate, în absenţa cunoaşterii vectorilor proprii asociaţi, este, 

7 O altă relaţie ce poate fi utilizată pentru calculul unei valori proprii generalizate finite a unui 

fascicol regulat este λ = xH B H Ax 

x H B H , care exprimă faptul că λ este soluţia în sensul celor mai mici 

Bx 

patrate a sistemului λBx = Ax (vezi şi exerciţiul 6.7).

6.2. FORMA SCHUR GENERALIZATĂ 451 

în mod necesar, un proces (iterativ) infinit, aceeaşi situaţie apărând şi la calculul 

vectorilor proprii generalizaţi fără a se cunoaşte valorile proprii asociate. Există 

şi aici metode corespondente pentru metodele puterii şi puterii inverse de calcul 

iterativ al unui vector propriu generalizat pe care le propunem spre elaborare cititorului 

(v. exerciţiul 6.6). Pentru asigurarea eficienţei acestor procese iterative este 

esenţială exploatarea rezultatelor structurale parţiale care se face prin reducerea 

corespunzătoare a dimensiunii problemei. Baza teoretică a acestor reduceri este 

dată de propoziţia 6.2. 

Pentru k = 1 propoziţia 6.2 se particularizează într-un corespondent ”generalizat”allemei 

dedeflaţieunitară4.2. Aplicareaconsecventăaacesteiane conducela 

următorul rezultat important a cărui demonstraţie, fiind similară cu demonstraţia 

teoremei 4.12, este lăsată în sarcina cititorului. 

Teorema 6.1 (Forma Schur generalizată) Oricare ar fi perechea (A,B) ∈ IC n×n × 

×IC n×n există matricele unitare Q,Z ∈ IC n×n astfel încât 

Q H AZ = S, Q H BZ = T, (6.14) 

unde matricele S, T sunt superior triunghiulare. Perechile de elemente diagonale 

(s ii ,t ii ) cu t ii ≠ 0 ale matricelor S şi T determină valorile proprii generalizate 

(finite) 

λ i = s ii 

t ii 

(6.15) 

ale perechii (A,B). Cele n perechi de elemente diagonale pot fi dispuse în orice 

ordine predeterminată. 

Perechea (S,T) se numeşte forma Schur generalizată (FSG) a perechii (A,B), 

iar coloanele q i , respectiv z i , ale matricelor de transformare Q şi Z se numesc 

vectori Schur generalizaţi ai perechii (A,B) la stânga, respectiv la dreapta, asociaţi 

FSG (S,T). 

Dacă matricea B este nesingulară, atunci şi T este nesingulară, i.e. t ii ≠ 0 

pentru toţi i ∈ 1:n. Dacă B este singulară, perechilor (s ii ,t ii ) cu s ii ≠ 0 şi t ii = 0 

le corespund valorile proprii generalizate pe care am convenit să le considerăm 

infinite. Justificarea acestei convenţii este, acum, evidentă dacă avem în vedere 

(6.15). Pentru fascicoleleregulate, considerateaici, nu este posibil să avemsimultan 

s ii = 0 şi t ii = 0 pentru nici un i. 

În practică, pentru a se evita introducerea valorilor infinite, se recomandă definirea 

valorilor proprii generalizate prin intermediul perechilor (s ii ,t ii ). În multe 

aplicaţii acestea pot fi utilizate fără a efectua explicit împărţirea din (6.15). 

Fie, acum, S 11 = S(1:k,1:k), T 11 = T(1:k,1:k) submatricele lider principale 

de ordinul k ∈ 1 : n ale matricelor superior triunghiulare S şi T din (6.14) care 

definesc FSG a perechii (A,B). Dacă notăm Q 1 = Q(:,1:k) şi Z 1 = Z(:,1:k), 

atunci din (6.14) avem 

AZ 1 = Q 1 S 11 , BZ 1 = Q 1 T 11 . 

FiesubspaţiulS = ImZ 1 ⊂ IC n . ÎntrucâtdinrelaţiiledemaisusrezultăAS ⊂ ImQ 1, 

BS ⊂ ImQ 1 avem 

V = AS +BS ⊂ ImQ 1 .


Deci, dimV ≤ k, adică S este un subspaţiu de deflaţie k-dimensional al perechii 

(A,B). Cu alte cuvinte, primele k coloane ale matricei de transformare Z, i.e. 

primii k vectori Schur la dreapta ai perechii (A,B), formează o bază ortogonală a 

subspaţiului de deflaţie k-dimensional asociat valorilor proprii generalizate definite 

de perechile (s ii ,t ii ), i = 1 : k. În acest mod, prin ordonarea corespunzătoare a 

elementelor diagonale ale matricelor S şi T, se pot construi baze ortogonale pentru 

subspaţiide deflaţieasociateunorgrupuriimpuse devaloripropriigeneralizate(vezi 

secţiunea 6.4). 

6.2.2 Forma Schur reală generalizată 

În cazul în care matricele A, B sunt reale se obţine un spor important de eficienţă 

dacă se utilizează în exclusivitate o aritmetică reală. Corespondentul generalizat al 

formei Schur reale este introdus prin următoarea teoremă pe care o prezentăm fără 

demonstraţie. 

Teorema 6.2 (Forma Schur reală generalizată) Oricare ar fi perechea (A,B) ∈ 

∈ IR n×n ×IR n×n există matricele ortogonale Q,Z ∈ IR n×n astfel încât 

Q T AZ = S, Q T BZ = T, (6.16) 

unde matricea S este în formă Schur reală iar matricea T este superior triunghiulară. 

Perechile de blocuri diagonale (S ii ,T ii ), i = 1:p, de dimensiuni 1×1 sau 2×2 

ale matricelor S şi T determină valorile proprii generalizate ale perechii (A,B), mai 

precis dacă blocul diagonal i al lui S are ordinul n i , atunci ∑ p 

i=1 n i = n şi 

λ(A,B) = ∪ p i=1 λ(S ii,T ii ). (6.17) 

Perechile de blocuri diagonale pot fi dispuse în orice ordine predeterminată. 

Perechea (S,T) se numeşte forma Schur reală generalizată (FSRG) a perechii 

(A,B), iar coloanele q i , respectiv z i , ale matricelor ortogonale de transformare Q 

şi Z se numesc vectori Schur generalizaţi ai perechii (A,B) la stânga, respectiv la 

dreapta, asociaţi FSRG. 

Conform(6.17), dacădispunemdeFSRGauneiperechi(A,B), calcululvalorilor 

proprii generalizate se reduce la rezolvarea ecuaţiilor algebrice 

det(S ii −λT ii ) = 0, i = 1:p, (6.18) 

de grad cel mult doi. 

Toate consideraţiile făcute în legătură cu FSG au un corespondent transparent 

pentru FSRG. De exemplu, dacă dimensiunea cumulată a primelor l blocuri diagonale 

ale matricei S este k, atunci primele k coloane ale matricei ortogonalede transformare 

Z formează o bază ortogonală a unui subspaţiu de deflaţie k-dimensional 

(din IR n ) al perechii (A,B) asociat ”primelor” k valori proprii generalizate. 

Din cele de mai sus rezultă că problema de calcul a valorilor proprii generalizate 

se reduce, în esenţă, la obţinerea formei Schur (reale) generalizate. Cum acest lucru 

nu este posibil, în cazul general, printr-o secvenţă finită de operaţii elementare, 

calculul va fi bazat, în mod necesar, pe trunchierea unui proces infinit, similar 

algoritmuluiQR.Înformasaceamaiperformantăaceastăprocedurăestecunoscută 

sub numele de algoritm QZ şi este prezentată în secţiunea ce urmează.

6.2. FORMA SCHUR GENERALIZATĂ 453 

6.2.3 Forma diagonală a fascicolelor hermitice 

pozitiv definite 

În cazul fascicolelorhermitice (în cazul real, simetrice) vom fi interesaţi de condiţiile 

în caretransformărilede congruenţă pot fi utilizate pentru reducereala forma Schur 

generalizată. Dacă o astfel de posibilitate există, atunci, având în vedere că rezultatul 

este o formă Schur generalizată hermitică, rezultă că ambele matrice sunt diagonale. 

Vom numi această structură formă diagonală generalizată. Aceste condiţii 

sunt prezentate în teorema următoare. Ţinând seama de faptul că rezultatul nu 

este o generalizare directă a unui rezultat similar din cazul ordinar, prezentăm şi 

demonstraţia. 

Teorema 6.3 (Forma diagonală generalizată) Fie un fascicol hermitic definit de 

perechea (A,B) ∈ IC n×n ×IC n×n şi matricea (hermitică) 

C(µ) = µA+(1−µ)B, µ ∈ IR. (6.19) 

Dacă există un scalar µ ∈ [0, 1], astfel încât matricea C(µ) este pozitiv semidefinită, 

i.e. x H C(µ)x ≥ 0, ∀x ∈ IC, şi 

KerC(µ) = KerA∩KerB, (6.20) 

atunci există o matrice nesingulară T ∈ IC n×n astfel încât perechea congruentă 

(F,G) = (T H AT,T H BT) (6.21) 

are matricele F şi G diagonale, i.e. este în formă diagonală generalizată. 

În cazul real, toate matricele implicate sunt reale. 

Demonstraţie. Fie µ ∈ [0, 1] astfel încât matricea C(µ) este pozitiv semidefinită 

şi este satisfăcută condiţia (6.20). Întrucât matricea C(µ) este hermitică şi pozitiv 

semidefinită, forma Schur a lui C(µ) este diagonală cu elementele diagonale reale 

şi nenegative care pot fi ordonate. Altfel spus, există o matrice unitară U 1 ∈ IC n×n 


[ ] D 0 

U1 H C(µ)U 1 = , D = diag(d 

0 0 

1 ,d 2 ,...,d k ), d i > 0, i = 1 : k. (6.22) 

√ 

Fie ∆ = D 1 2 = diag( d1 , √ d 2 ,..., √ [ ] 

∆ 0 

d k ), ∆ 1 = şi matricea nesingulară 

T 1 = U 1 ∆ −1 

1 . Considerăm transformarea de 

0 I n−k 

congruenţă 

şi matricea 

C 1 (µ) = T H 1 C(µ)T 1 = ∆ −1 

1 UH 1 C(µ)U 1∆ −1 

1 = 

În continuare avem, evident, 

(A 1 ,B 1 ) = (T H 1 AT 1,T H 1 BT 1) (6.23) 

[ 

Ik 0 

0 0 

] 

= µA 1 +(1−µ)B 1 . (6.24) 

KerC(µ) = KerA∩KerB ⇔ KerC 1 (µ) = KerA 1 ∩KerB 1 . (6.25)


Cum x ∈ KerC 1 (µ) implică în mod necesar x(1 : k) = 0, rezultă că KerC 1 (µ) = 

= ImE, unde E = [e k+1 ,e k+2 ,...,e n ]. Dar KerC 1 (µ) ⊂ KerA 1 . Deci A 1 E = 0, i.e. 

A 1 (:,k +1 : n) = 0, şi cum A 1 este hermitică, rezultă că are următoarea structură 

(din exact aceleaşi motive această structură o are şi matricea B) 

A 1 = 

[ 

A11 0 

0 0 

Din (6.24) rezultă 

] 

, B 1 = 

[ 

B11 0 

0 0 

] 

, A 11 ,B 11 ∈ IC k×k . (6.26) 

µA 11 +(1−µ)B 11 = I k . (6.27) 

Distingem două situaţii: 

a) Dacă µ = 0, atunci B 11 = I k şi considerăm forma Schur (diagonală) 

F 11 = Q H 11A 11 Q 11 = diag(f 1 ,f 2 ,...,f k ) 

a blocului A 11 . Luând matricea unitară Q = diag(Q 11 ,I n−k ) şi definind matricea 

de transformare T = T 1 Q, avem 

F = T H AT = Q H A 1 Q = diag(F 11 ,0), G = T H BT = Q H B 1 Q = diag(I k ,0), 

(6.28) 

i.e. forma diagonală generalizată a perechii iniţiale. 

b) Dacă µ ≠ 0, atunci considerăm forma Schur (diagonală) 

G 11 = Q H 11 B 11Q 11 = diag(g 1 ,g 2 ,...,g k ) 

a blocului B 11 . Luând din nou matricea unitară Q = diag(Q 11 ,I n−k ) şi definind 

matricea de transformare T = T 1 Q, avem 

F = T H AT = 1 µ TH (C(µ)−(1−µ)B)T = 

= 1 µ 

([ 

Ik 0 

0 0 

] [ 

G11 0 

−(1−µ) 

0 0 

]) 

= 

(6.29) 

unde 

= diag(f 1 ,f 2 ,...,f k ,0,...,0), 

G = T H BT = Q H B 1 Q = diag(g 1 ,g 2 ,...,g k ,0,...,0), 

f i = 1 µ − 1−µ 

µ g i. 

Am obţinut şi în acest caz forma diagonală generalizată a perechii iniţiale. 

În cazul real demonstratia este identică, cu menţiunea că toate matricele care 

apar sunt reale. Teorema este demonstrată. 

✸ 

În aplicatii, de cele mai multe ori, apar fascicole hermitice (simetrice) de semn 

definit. Evident, într-unastfeldecaz,condiţiileteoremeidemaisussuntîndeplinite: 

dacă B este pozitiv definită, atunci pentru µ = 0, iar dacă A este pozitiv definită, 

atunci pentru µ = 1. Deci fascicolele hermitice pozitiv definite sunt întotdeauna 

generalizat diagonalizabile.

6.3. ALGORITMUL QZ 455 

6.3 Algoritmul QZ 

Algoritmul QZ, elaborat de C.B. Moler şi G.W. Stewart în anul 1973 [44], este, în 

esenţă,oprocedurădedeflaţieiterativăcareconstruieşte(recurent)unşirdeperechi 

de matrice unitar echivalente cu perechea iniţială, şir care, în condiţii precizate, este 

convergent către forma Schur generalizată. În cazul real se poate impune exclusiv o 

aritmetică reală pe baza unei strategii a paşilor dubli. În această situaţie termenii 

şirului sunt perechi ortogonal echivalente, iar limita sa este o formă Schur reală 

generalizată a perechii iniţiale. 

Algoritmul QZ este organizat, ca şi algoritmul QR, în două faze: 

a) Faza a I-a, de reducere, prin calcul direct, a perechii (A,B) iniţiale la o 

pereche unitar echivalentă (H,T) având matricea H în formă superior Hessenberg 

şimatriceaT înformăsuperiortriunghiulară,structuraceamaiapropiatădeFSGce 

poatefiobţinutăprintr-uncalculfinit. Vomnumiperechea(H,T)formă Hessenberg 

generalizată a lui (A,B). 

b) Faza a II-a, de deflaţie iterativă, prin care elementele subdiagonale ale 

matricei superior Hessenberg H sunt anulate asimptotic (simultan cu conservarea 

structurii superior triunghiulare a matricei T), utilizând transformări unitare de 

echivalenţă. 

Într-o caracterizaresintetică, algoritmul QZ aplicat perechii (A,B) (cu B nesingulară) 

poate fi considerat drept o variantă ”mascată” a algoritmului QR aplicat 

matricei AB −1 şi de aici rezultă remarcabilele sale performanţe numerice şi de 

convergenţă. 

6.3.1 Reducerea la forma Hessenberg generalizată 

Corespondentul generalizat al teoremei 4.8 are următoarea formulare. 

Teorema 6.4 Oricare ar fi perechea (A,B) ∈ IC n×n ×IC n×n , ce defineşte un fascicol 

regulat, există matricele unitare Q,Z ∈ IC n×n , calculabile printr-o secvenţă finită de 

operaţii aritmetice, astfel încât perechea 

(H,T) = (Q H AZ,Q H BZ) (6.30) 

are matricea H superior Hessenberg şi matricea T superior triunghiulară. Dacă 

matricele A, B sunt reale, atunci şi matricele H şi T sunt reale, iar matricele de 

transformare Q şi Z sunt ortogonale. 

Demonstraţie. Vom da o demonstraţie constructivă explicită în vederea elaborării 

unui algoritm performant. În primul rând, există o matrice unitară Q ∈ ICn×n astfel 

încât matricea B ← T = Q H B este superior triunghiulară (vezi capitolul 3), i.e. 

perechea unitar echivalentă 

(A,B) ← (Ã,T) = (QH AZ,Q H BZ), 

cu Z = I n , are matricea Ã densă şi T superior triunghiulară. În continuare vom 

aduce matricea A la forma superior Hessenberg păstrând structura superior triunghiulară 

a matricei B. Procedura are n−2 paşi.


Pasul 1 ◦ . În cadrul pasului iniţial vom anula elementele A(3:n,1) din prima 

coloană a matricei A, în ordinea n:−1:3, prin transformări unitare de echivalenţă 

definite de două secvenţe de rotaţii (complexe) conform schemei de calcul 

HT-1 

1. Pentru i = n:−1:3 

1. Se determină rotaţia Q (1) 

i−1,i astfel încât ((Q(1) i−1,i )H A)(i,1) = 0 

2. A ← (Q (1) 

i−1,i )H A 

3. B ← (Q (1) 

i−1,i )H B % Se alterează zeroul din poziţia (i,i−1) a 

matricei superior triunghiulare B 

4. Q ← QQ (1) 

i−1,i 

5. Se determină rotaţia Z (1) 

i−1,i 

6. A ← AZ (1) 

i−1,i 

7. B ← BZ (1) 

i−1,i 

8. Z ← ZZ (1) 

i−1,i 

astfel încât (BZ(1) i−1,i )(i,i−1) = 0 

Întrucât premultiplicarea unei matrice cu o rotaţie din planul (i−1,i) afectează numai 

liniile i−1şi i, execuţia instrucţiunii 1.3 areca efect o posibilă alterare 8 a structurii 

superior triunghiulare a matricei B prin alterarea zeroului din poziţia (i,i−1). 

Refacerea structurii superior triunghiulare a lui B se realizează la instrucţiunea 1.6 

prin postmultiplicarea matricei B cu o rotaţie calculată corespunzător la instrucţiunea 

1.5. Postmultiplicarea cu o rotaţie plană din planul (i−1,i), afectând numai 

coloanele i−1 şi i, nu are nici un efect (întrucât i > 2) asupra zerourilor create în 

prima coloană a matricei A 9 . În acest fel, pe măsura creării zerourilor din prima 

coloană a lui A, elementul alterant al structurii superior triunghiulare a lui B se 

deplasează pe o traiectorie subdiagonală ascendentă până la părăsirea matricei din 

poziţia(3,2)dupăcumsepoatevedeaşidinurmătoareaexemplificarepentrun = 4. 

În diagramele structurale de mai jos zeroul nou creat a fost marcat cu ∅, elementul 

alterant cu +, iar încadrările indică liniile şi coloanele afectate la pasul respectiv. 

⎡ 

(A,B) = ( ⎢ 

⎣ 

× × × × 

× × × × 

× × × × 

× × × × 

⎤ 

⎥ 

⎦ , 

⎡ 

⎢ 

⎣ 

× × × × 

0 × × × 

0 0 × × 

0 0 0 × 

⎤ 

⎥ 

⎦ ), 

(A,B) ← ((Q (1) 

34 )H A,(Q (1) 

34 )H B) = ( ⎢ 

⎣ 

⎡ 

× × × × 

× × × × 

× × × × 

∅ × × × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × × × 

0 × × × 

0 0 × × 

0 0 + × 

⎤ 

⎥ 

⎦ ), 

8 Alterarea are efectiv loc dacă elementul diagonal (i−1,i−1) al matricei curente B este nenul, 

care este cazul obişnuit. 

9 De observat că încercarea de anulare a elementului (2,1) a lui A este sortită eşecului întrucât 

postmultiplicarea cu rotaţia Z (1) 

1,2 poate altera toate zerourile create în prima coloană.


⎡ 

(A,B) ← (AZ (1) 

34 ,BZ(1) 34 ) = ( ⎢ 

⎣ 

× × 

× × 

× × 

0 × 

× × 

× × 

× × 

× × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × 

0 × 

0 0 

0 0 

× × 

× × 

× × 

∅ × 

⎤ 

⎥ 

⎦ ), 

(A,B) ← ((Q (1) 

23 )H A,(Q (1) 

23 )H B) = ( ⎢ 

⎣ 

⎡ 

× × × × 

× × × × 

∅ × × × 

0 × × × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × × × 

0 × × × 

0 + × × 

0 0 0 × 

⎤ 

⎥ 

⎦ ), 

⎡ 

(A,B) ← (AZ (1) 

23 ,BZ(1) 23 ) = ( ⎢ 

⎣ 

× 

× 

0 

0 

× × 

× × 

× × 

× × 

× 

× 

× 

× 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× 

0 

0 

0 

× × 

× × 

∅ × 

0 0 

× 

× 

× 

× 

⎤ 

⎥ 

⎦ ). 

Cumulând transformările din acest exemplu se obţine 

(A,B) ← ((Q (1) 

23 )H (Q (1) 

34 )H AZ (1) 

34 Z(1) 23 ,(Q(1) 23 )H (Q (1) 

34 )H BZ (1) 

34 Z(1) 23 ) def 

= 

def 

= ((Q (1) ) H AZ (1) ,(Q (1) ) H BZ (1) ). 

Prin urmare, schema de calcul de mai sus produce matricele 

A ← A (1) = (Q (1) 

23 )H ···(Q (1) 

n−2,n−1 )H (Q (1) 

n−1,n )H AZ (1) 

n−1,n Z(1) n−2,n−1···Z(1) 

def 

23 = 

def 

= (Q (1) ) H AZ (1) , (6.31) 

B ← B (1) = (Q (1) 

23 )H ···(Q (1) 

n−2,n−1 )H (Q (1) 

n−1,n )H BZ (1) 

n−1,n Z(1) n−2,n−1···Z(1) 

def 

23 = 

def 

= (Q (1) ) H BZ (1) , (6.32) 

cu A (1) (3:n,1) = 0 şi B (1) superior triunghiulară, realizându-se astfel obiectivul 

pasului 1. Evident, matricele unitare de transformare 

Q (1) def 

= Q (1) 

n−1,n Q(1) n−2,n−1···Q(1) 23 , Z(1) def 

= Z (1) 

n−1,n Z(1) n−2,n−1···Z(1) 23 (6.33) 

cumulează cele două secvenţe de rotaţii utilizate la pasul 1. 

Pasul k ◦ . Presupunem că în cadrul primilor k − 1 paşi am obţinut o pereche 

(A (k−1) ,B (k−1) ) – ce suprascrie (A,B) – cu A (k−1) având o structură superior 

Hessenberg în primele k −1 coloane şi B (k−1) superior triunghiulară: 

A ← A (k−1) def 

= (Q (k−1) ) H ···(Q (2) ) H (Q (1) ) H AZ (1) Z (2)···Z (k−1) , (6.34) 

B ← B (k−1) def 

= (Q (k−1) ) H ···(Q (2) ) H (Q (1) ) H BZ (1) Z (2)···Z (k−1) . (6.35) 

Este uşor de văzut că adaptând schema de calcul de la pasul 1, i.e. efectuând


HT-k 1. Pentru i = n:−1:k +2 

se obţin matricele 

1. Se determină rotaţia Q (k) 

i−1,i astfel încât ((Q(k) i−1,i )H A)(i,k) = 0 

2. A ← (Q (k) 

i−1,i )H A 

3. B ← (Q (k) 

i−1,i )H B % Se alterează zeroul din poziţia (i,i−1) 

a matricei superior triunghiulare B 

4. Q ← QQ (k) 

i−1,i 

5. Se determină rotaţia Z (k) 

i−1,i 

6. A ← AZ (k) 

i−1,i 

7. B ← BZ (k) 

i−1,i 

8. Z ← ZZ (k) 

i−1,i 

astfel încât (BZ(k) i−1,i )(i,i−1) = 0 

A←A (k) =(Q (k) (k) 

k+1,k+2 

)H···(Q n−2,n−1 )H (Q (k) 

n−1,n )H A (k−1) Z (k) 

n−1,n Z(k) n−2,n−1···Z(k) k+1,k+2 

şi 

def 

= (Q (k) ) H A (k−1) Z (k) (6.36) 

B←B (k) =(Q (k) (k) 

k+1,k+2 

)H···(Q n−2,n−1 )H (Q (k) 

n−1,n )H B (k−1) Z (k) 

n−1,n Z(k) n−2,n−1···Z(k) k+1,k+2 

def 

= (Q (k) ) H B (k−1) Z (k) (6.37) 

cu A (k) (k+2 : n,k) = 0, cu structura primelor k−1 coloane ale matricei A (k−1) 

rămasă nealterată şi cu B (k) superior triunghiulară, realizându-se astfel obiectivul 

pasului k. Evident, matricele unitare de transformare 

Q (k) def 

= Q (k) 

n−1,n Q(k) n−2,n−1···Q(k) k+1,k+2 , 

Z(k) def 

= Z (k) 

n−1,n Z(k) n−2,n−1···Z(k) k+1,k+2 

(6.38) 

cumulează cele două secvenţe de rotaţii utilizate la pasul k. 

În concluzie, pasul 1 de mai sus permite iniţierea procedurii de reducere a 

perechii (A,B) la forma Hessenberg generalizată, iar pasul k arată că această reducere 

poate fi continuată. După n−2 paşi se obţine rezultatul dorit, i.e. 

A ← H = (Q (n−2) ) H ···(Q (2) ) H (Q (1) ) H AZ (1) Z (2)···Z (n−2) def 

= Q H AZ, (6.39) 

B ← T = (Q (n−2) ) H ···(Q (2) ) H (Q (1) ) H BZ (1) Z (2)···Z (n−2) def 

= Q H BZ (6.40) 

cu H superior Hessenberg şi T superior triunghiulară, i.e. cu perechea (H,T) în 

forma Hessenberrg generalizată. Evident, matricele unitare de transformare 

Q def 

= Q (1) Q (2)···Q (n−2) , Z def 

= Z (1) Z (2)···Z (n−2) (6.41) 

cumulează toate transformările efectuate.


În cazul real toate rotaţiile sunt reale şi, aplicate unor matrice iniţiale reale, conduc 

la o pereche rezultat reală. De asemenea, matricele de transformare cumulate 

sunt reale ca produse de matrice reale. 

Caracterul finit al calculului este evident. Demonstraţia este completă. ✸ 

Demonstraţia teoremei de mai sus conduce imediat la următoarea structură a 

algoritmului de reducere a unei perechi (A,B) la forma Hessenberg generalizată. 

HT 1. Se calculează triangularizarea unitară a matricei B, i.e. matricea unitară 

Q şi B ← Q H B astfel încât noul B este superior triunghiular 

2. A ← Q H A 

3. Pentru k = 1 : n−2 

1. Se execută procedura HT-k 

Pentruscriereaformalăaalgoritmuluivomutilizaoprocedurădetriangularizare 

unitarăauneimatricecomplexeutilizândreflectorihermitici, prezentatăîncapitolul 

3. Pentru scopurile noastre, sintaxa de apel a acestei proceduri va fi 10 

[B,U,b] = TUN(B), 

i.e. procedura suprascrie matricea argument B cu rezultatul triangularizării şi 

livrează, în matricea U ∈ IC n×(n−1) şi vectorul b ∈ IR n−1 , elementele definitorii 

ale reflectorilor complecşi hermitici U k = I n − 1 

b(k) U(:,k)(U(:,k))H utilizaţi. (Precizăm 

că U(1 : k−1,k) = 0, k = 2 : n−1.) De asemenea, vom folosi procedurile din 

tabelul 4.3 (vezi capitolul 4), la care vomadăugaoprocedură suplimentarănecesară 

pentru procesările legate de anularea elementelor alterante ale structurii superior 

triunghiulare a matricei B şi anume [ procedura ] Gcm pentru calculul unei rotaţii 

c s 

complexe bidimensionale Z 12 = ”modificate” care aplicată pe dreapta 

−¯s c 

unui vector linie a ∈ IC 1×2 anulează primul element al lui a. Vom numi această 

transformare rotaţie (complexă) ”modificată”. Este simplu de văzut că elementele 

definitorii ale acestei rotaţii sunt 

⎧ 

1, dacă a 1 = 0, 

⎪⎨ 

0, dacă a 1 ≠ 0, a 2 = 0, 

c = 

⎪⎩ |a 2 | 

r , dacă a 1 ≠ 0, a 2 ≠ 0, 

⎧ 

⎪⎨ 

s = 

⎪⎩ 

0, dacă a 1 = 0, 

1, dacă a 1 ≠ 0, a 2 = 0, 

ā 1 a 2 

|a 2 |r , dacă a 1 ≠ 0, a 2 ≠ 0. 

√ 

(6.42) 

|a 1 | 2 +|a 2 | 2 . Calculul elementelor definitorii pentru rotaţia de mai sus 

unde r = 

va fi însoţit de calculul a ← d = aZ 12 , astfel încât sintaxa propusă pentru această 

procedură este 

[d,c,s] = Gcm(a) 

10 Corespondentul real este procedura de triangularizare ortogonală pe care, în consens, o vom 

numi TOR. Atragem atenţia că, din dorinţa de a asigura o claritate maximă, aici s-au făcut 

unele rabaturi la eficienţă, cum ar fi memorarea vectorilor Householder într-o matrice distinctă. 

De aceea, sintaxa şi denumirile generice folosite diferă de cele din capitolul 3. Implementările de 

performanţă maximă vor trebui să respecte însă toate recomandările explicit formulate în capitolul 

3.


suprascrierea(internăa) lui a realizându-secu apelul [a,c,s] = Gcm(a). Cu aceste 

precizări obţinem următorul algoritm. 

Algoritmul 6.1 (HTQZc – Reducerea la forma Hessenberg generalizată) 

(Dată o pereche (A,B) ∈ IC n×n × IC n×n , precum şi matricele 

unitare Q,Z ∈ IC n×n , algoritmul calculează perechea unitar echivalentă 

(A,B) ← (H,T) = (˜Q H A˜Z, ˜Q H B ˜Z) având forma superior Hessenberg 

generalizată. Opţional se acumulează matricele unitare de transformare 

Q ← Q˜Q,Z ← Z ˜Z. Opţiunea se exprimă prin intermediul unei variabile 

logiceoptdetipulşirdecaracterecepoateluavalorile ′ da ′ sau ′ nu ′ . Dacă 

opt = ′ nu ′ , algoritmul returnează matricele Q şi Z nemodificate.) 

1. [B,U,b] = TUN(B) 

2. Pentru k = 1 : n−1 

1. A(k : n,:) = Hcs(U(k : n,k),b(k),A(k : n,:)) 


1. Pentru k = n−1 : −1 : 1 

1. Q(:,k : n) = Hcd(Q(:,k : n),U(k : n,k),b(k)) 

4. Pentru k = 1 : n−2 

1. Pentru i = n : −1 : k+2 

1. [A(i−1 : i,k),c,s] = Gc(A(i−1 : i,k)) 

2. A(i−1 : i,k+1 : n) = Gcs(c,s,A(i−1 : i,k+1 : n)) 

3. B(i−1 : i,i−1 : n) = Gcs(c,s,B(i−1 : i,i−1 : n)) 


Q(:,i−1: i) = Gcd(Q(:,i−1 : i),c,s) 

5. [B(i,i−1: i),c,s] = Gcm(B(i,i−1 : i)) 

6. A(:,i−1 : i) = Gcd(A(:,i−1 : i),c,s) 

7. B(1 : i−1,i−1: i) = Gcd(B(1 : i−1,i−1: i),c,s) 


Z(:,i−1: i) = Gcd(Z(:,i−1 : i),c,s) 

Comentarii. În acest capitol, pentru apelul algoritmului HTQZc va fi utilizată 

sintaxa 

[H,T,Q,Z] = HTQZc(A,B,Q,Z,opt). 

Similar cu cele prezentate la calculul valorilor proprii ordinare din capitolul 4, acumularea 

transformărilor se face întotdeauna prin înmulţirea la dreapta cu matricea 

de transformare curentă, i.e. utilizând procedurile Hcd sau Gcd. Totuşi, dacă 

iniţial Q este matricea unitate (e.g. în situaţiile în care perechea (A,B) nu provine 

din prelucrări anterioare), atunci se obţine un spor important de eficienţă dacă 

instrucţiunea 3 se înlocuieşte cu instruţiunea 


1. Pentru k = n−1 : −1 : 1 

1. Q(k : n,k : n) = Hcs(U(k : n,k),b(k),Q(k : n,k : n))


i.e. acumularea relectorilor se face în ordine inversă, realizănd o ”umplere progresivă” 

a matricei Q (vezi şi comentariile la algoritmul HQc din capitolul 4). 

În cazul real, atât matricele rezultat (A,B) ← (H,T) = (Q T AZ,Q T BZ) cât şi 

matricele de transformare Q, Z vor fi reale. Această particularizare este imediată 

prin înlocuirea procedurilor de transformare complexe utilizate cu corespondentele 

lor reale. Ca să marcăm diferenţa, sintaxa de apel va fi 

[H,T,Q,Z] = HTQZr(A,B,Q,Z,opt). 

Complexitatea algoritmului este O(n 3 ), execuţia sa implicând, în cazul real, 

N op ≈ 8n 3 operaţii în format virgulă mobilă. Acumularea matricelor de transformare 

necesită N ′ op ≈ 4n 3 operaţii suplimentare pentru Q şi N ′ op ≈ 3n 3 operaţii 

suplimentare pentru Z. 

Algoritmul HTQZ este numeric stabil, i.e. forma Hessenberg generalizată calculată 

într-o aritmetică în virgulă mobilă este o pereche exact unitar (ortogonal) 

echivalentă cu o pereche uşor perturbată (A+E,B+F), unde matricele de perturbare 

E şi F satisfac condiţiile ‖E‖ ≤ p(n)ε M ‖A‖ şi ‖F‖ ≤ p(n)ε M ‖B‖ cu p(n) o 

funcţie cu o creştere ”modestă” de dimensunea n a problemei (v. şi §6.5, §6.6). ✸ 

6.3.2 Evidenţierea valorilor proprii generalizate infinite 

Fie perechea (H,T) ∈ IC n×n ×IC n×n în formă Hessenberg generalizată, obţinută e.g. 

cu algoritmul HTQZc, care defineşte un fascicol regulat. Dacă T este singulară, 

i.e. T are (cel puţin) un element diagonal nul, atunci perechea (H,T) are (cel 

puţin) o valoare proprie generalizată infinită. Într-un astfel de caz, valorile proprii 

generalizate infinite pot fi evidenţiate folosind o secvenţă finită de transformări de 

echivalenţă unitare (în cazul real, ortogonale), simultan cu conservarea formei Hessenberg 

generalizate. Concret, există matricele unitare ˆQ şi Ẑ astfel încât matricele 

perechii (H,T) ← (Ĥ, ˆT) H H 

= (ˆQ HẐ, ˆQ TẐ) au structura 

[ ] 

H11 H 

H = 12 

, T = 

0 H 22 

[ ] 

T11 T 12 

, (6.43) 

0 T 22 

cu perechea (H 11 ,T 11 ) în formă superior Hessenberg generalizată având T 11 nesingulară, 

H 22 superior triunghiulară nesingulară şi T 22 strict superior triunghiulară, 

i.e. cu toate elementele diagonale nule (toate submatricele de aceiaşi indici au 

aceleaşi dimensiuni). Evident, valorile proprii generalizate ale perechii (H 11 ,T 11 ) 

sunt valorile proprii generalizate finite ale perechii iniţiale, în timp ce valorile proprii 

generalizate ale perechii (H 22 ,T 22 ) sunt valorile proprii generalizate infinite ale 

acesteia. 

Detaliile de construcţie a structurii (6.43) sunt următoarele. 

Presupunem mai întâi că matricea T are un singur element diagonal nul. Acesta 

poate fi ”deplasat” în poziţia (n,n), simultan cu conservarea formei Hessenberg 

generalizate a perechii (H,T) şi cu anularea elementului (n,n−1) al matricei H, 

prin aplicarea unei transformări unitare de echivalenţă sub forma unei secvenţe de 

rotaţii. Concret, dacă t kk = 0, k ∈ 2:n−1 11 , este zeroul urmărit, atunci scopul 

este atins executând schema de calcul 

11 Dacă zeroul se află deja în ultima poziţie diagonală se execută numai instrucţiunea 2 din


DZ-k,n 

% Deplasarea zeroului diagonal al matricei T din poziţia (k,k) în poziţia (n,n) 

1. Dacă k < n 

1. Pentru i = k+1 : n 

1. Se determină rotaţia Q (kn) 

i−1,i 

astfel încât ((Q(kn) 

i−1,i )H T)(i,i) = 0 

2. H ← (Q (kn) 

i−1,i )H H % Se alterează zeroul din poziţia (i,i−2) a lui H 

3. T ← (Q (kn) 

i−1,i )H T 

4. Se determină rotaţia Z (kn) 

i−2,i−1 astfel încât (HZ(kn) i−2,i−1 )(i,i−2) = 0 

5. H ← HZ (kn) 

i−2,i−1 

6. T ← TZ (k) 

i−2,i−1 

2. % Ultima rotaţie: 

1. Se determină rotaţia Z (kn) 

n−1,n astfel încât (HZ(kn) n−1,n )(n−1,n) = 0 

2. H ← HZ (kn) 

n−1,n 

3. T ← TZ (kn) 

n−1,n 

Această schemă se completează corespunzător cu eventuala actualizare a matricelor 

de transformare. Pentru a dezvălui mai clar mecanismul schemei de calcul 

de mai sus considerăm un exemplu cu n = 4 şi k = 2. În diagramele structurale de 

mai jos am marcat cu ∅ anulările curente de elemente şi cu + alterările temporare 

de zerouri. Încadrările marchează liniile şi coloanele afectate în etapa respectivă. 

⎡ 

(H,T) = ( ⎢ 

⎣ 

× × × × 

× × × × 

0 × × × 

0 0 × × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × × × 

0 0 × × 

0 0 × × 

0 0 0 × 

⎤ 

⎥ 

⎦ ), 

(H,T)←((Q (24) 

23 )H H,(Q (24) 

23 )H T) = ( ⎢ 

⎣ 

⎡ 

× × × × 

× × × × 

+ × × × 

0 0 × × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × × × 

0 0 × × 

0 0 ∅ × 

0 0 0 × 

⎤ 

⎥ 

⎦ ), 

⎡ 

(H,T) ← (HZ (24) 

12 ,TZ(24) 12 ) = ( ⎢ 

⎣ 

× × 

× × 

∅ × 

0 0 

× × 

× × 

× × 

× × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × 

0 0 

0 0 

0 0 

× × 

× × 

0 × 

0 × 

⎤ 

⎥ 

⎦ ), 

schema de calcul DZ-k,n pentru anularea elementului H(n − 1,n). Dacă zeroul se află în 

poziţia (1,1) deplasarea sa în poziţia (n,n) are un început atipic a cărui prezentare ar fi complicat 

schema de calcul. Cititorul interesat poate desprinde acest caz din algoritmul 6.2, prezentat mai 

departe.


(H,T)←((Q (24) 

34 )H H,(Q (24) 

34 )H T) = ( ⎢ 

⎣ 

⎡ 

× × × × 

× × × × 

0 × × × 

0 + × × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × × × 

0 0 × × 

0 0 0 × 

0 0 0 ∅ 

⎤ 

⎥ 

⎦ ), 

⎡ 

(H,T) ← (HZ (24) 

23 ,TZ(24) 23 ) = ( ⎢ 

⎣ 

× 

× 

0 

0 

× × 

× × 

× × 

∅ × 

× 

× 

× 

× 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× 

0 

0 

0 

× × 

+ × 

0 0 

0 0 

× 

× 

× 

0 

⎤ 

⎥ 

⎦ ) 

⎡ 

(H,T) ← (HZ (24) 

34 ,TZ(24) 34 ) = ( ⎢ 

⎣ 

× × 

× × 

0 × 

0 0 

× × 

× × 

× × 

∅ × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × 

0 × 

0 0 

0 0 

× × 

× × 

+ × 

0 0 

⎤ 

⎥ 

⎦ ). 

Prin urmare, în exemplul considerat, deplasareazeroului din poziţia (2,2) în poziţia 

(4,4) a matricei T se realizează cu secvenţa 

(H,T) ← ((Q (24) 

34 )H (Q (24) 

23 )H HZ (24) 

12 Z(24) 23 Z(24) 34 ,(Q(24) 34 )H (Q (24) 

23 )H TZ (24) 

12 Z(24) 23 Z(24) 34 ) 

def 

= ((Q (24) ) H HZ (24) ,(Q (24) ) H TZ (24) ). 

În cazul general, deplasarea unui zero din poziţia (k,k), k ∈ 2:n−1, în poziţia 

(n,n) se face cu secvenţa 

H ← (Q (kn) 

n−1,n )H ···(Q (kn) 

k+1,k+2 )H (Q (kn) 

k,k+1 )H HZ (kn) 

k−1,k Z(kn) k,k+1···Z(kn) n−2,n−1 Z(kn) n−1,n 

def 

= (Q (kn) ) H HZ (kn) , (6.44) 

T ← (Q (kn) 

n−1,n )H ···(Q (kn) 

k+1,k+2 )H (Q (kn) 

k,k+1 )H TZ (kn) 

k−1,k Z(kn) k,k+1···Z(kn) n−2,n−1 Z(kn) n−1,n 

def 

= (Q (kn) ) H TZ (kn) . (6.45) 

Dacă matricea superiortriunghiulară T are un singur zero diagonal, atunci după 

deplasarea sa pe ultima poziţie diagonală 12 perechea (H,T) transformată va avea 

structura [ ] [ ] 

˜H h ˜T t 

H = , T = , (6.46) 

0 h nn 0 0 

cu perechea ( ˜H, ˜T) în formă Hessenberg generalizatăşi cu ˜T nesingulară. Fascicolul 

iniţial este regulat dacă şi numai dacă în (6.46) h nn ≠ 0. În acest caz procedura a 

pus în evidenţă o valoare proprie generalizată infinită. 

12 Vezi nota de picior precedentă.


Dacă matricea T are mai multe zerouri diagonale, acestea pot fi deplasate succesiv 

în colţul din dreapta jos al lui T prin aplicarea repetată a schemei de calcul 

DZ-k,n adaptate la necesităţile curente în forma DZ-i,j . Procedura este 

următoarea 13 . 

DZ 

% Deplasarea zerourilor diagonale ale matricei T în colţul din dreapta jos 

1. i = n, j = n 

2. Cât timp i > 0 

1. Dacă T(i,i) = 0 atunci 

1. Execută DZ-i,j 

2. j ← j −1 

3. i ← j −1 

altfel 

1. i ← i−1 

Dupăexecuţiaproceduriidemaisusperechea(H,T)transformatăvaaveastructura 

(6.43). Fascicolul iniţial este regulat dacă şi numai dacă H 22 este nesingulară. 

Într-un astfel de caz, numărul valorilor proprii generalizate infinite este dat de ordinul 

blocurilor H 22 şi T 22 . 

Prezentăm algoritmul care implementează schema de calcul DZ . 

Algoritmul 6.2 (DZc – Deplasarea zerourilor diagonale.) 

(Date o pereche (H,T) ∈ IC n×n × IC n×n în formă Hessenberg generalizată 

şi matricele unitare Q,Z ∈ IC n×n , algoritmul suprascrie perechea 

(H,T) cu o pereche echivalentă, tot în formă Hessenberg generalizată, 

dar având toate zerourile diagonale ale matricei T situate în colţul din 

dreapta jos. Opţional, se actualizează matricele unitare de transformare 

Q,Z ∈ IC n×n . Opţiunea se exprimă prin intermediul unei variabile logice 

opt de tipul şir de caractere ce poate lua valorile ′ da ′ sau ′ nu ′ . Dacă 

opt = ′ nu ′ , algoritmul returnează matricele Q şi Z nemodificate.) 

1. i = n, j = n 

2. Cât timp i > 0 

1. Dacă T(i,i) = 0 atunci 

1. Dacă i < j atunci 

1. Pentru l = i+1 : j 

1. [T(l−1:l,l),c,s]= Gc(T(l−1:l,l)) 

2. k = max(l−2,1) 

3. H(l−1:l,k:n) = Gcs(c,s,H(l−1:l,k:n)) 


T(l−1:l,l+1: n) = Gcs(c,s,T(l−1:l,l+1:n)) 

13 După deplasarea unui zero diagonal în ultima poziţie diagonală curentă este posibil ca structura 

zerourilor diagonale ”încă nedeplasate” să se modifice, e.g. numărul lor să scadă. De aceeea 

după deplasarea tuturor zerourilor diagonale în colţul din dreapta jos este posibil ca numărul lor 

să fie diferit de numărul iniţial al zerourilor diagonale ale matricei T. De asemenea, aşa cum s-a 

precizat, pentru aspectele specifice ale tratării zerourilor din poziţiile diagonale terminale, cititorul 

este invitat să consulte algoritmul formal.



Q(:,l−1:l) = Gcd(Q(:,l−1:l),c,s) 

6. [H(l,k:k+1),c,s] = Gcm(H(l,k:k+1)) 

7. H(1:l−1,k:k+1) = Gcd(H(1:l−1,k:k+1),c,s) 

8. Dacă l = 2 atunci 

H(3,k:k+1) = Gcd(H(3,k:k+1),c,s) 

9. T(1:l−1,k:k+1) = Gcd(T(1:l−1,k:k+1),c,s) 


Z(:,k:k+1) = Gcd(Z(:,k:k+1),c,s) 


1. % Ultima rotaţie din secvenţa curentă: 

1. (H(j,j−1:j),c,s) = Gcm(H(j,j−1:j)) 

2. H(1:j−1,j−1:j) = Gcd(H(1:j−1,j−1:j),c,s) 

3. T(1:j−1,j−1:j) = Gcd(T(1:j−1,j−1:j),c,s) 


Z(:,j−1:j) = Gcd(Z(:,j−1:j),c,s) 

3. j ← j −1 

4. i ← j 

altfel 

1. i ← i−1 

Comentarii. Sintaxa cu care algoritmul de mai sus va fi apelat este 

[H,T,Q,Z] = DZc(H,T,Q,Z,opt). 

Complexitatea algoritmului este cel mult O(n 3 ), numărul efectiv de operaţii fiind 

decisiv influenţat de numărul şi dispunerea zerourilor diagonale ale matricei T. 

Utilizând exclusiv transformări unitare (ortogonale), algoritmul DZc este numeric 

stabil. 

În cazul real se utilizează exact aceleaşi secvenţe de rotaţii, de data aceasta 

reale, ceea ce are ca efect obţinerea ca rezultat a unei perechi transformate reale, 

iar efortul de calcul este sensibil diminuat. Pentru a distinge cazul real vom utiliza 

sintaxa 

[H,T,Q,Z] = DZr(H,T,Q,Z,opt). 

Formal, varianta reală a algoritmului se obţine înlocuind în numele procedurilor 

utilizate sigla c cu sigla r. 

✸ 

6.3.3 Faza iterativă a algoritmului QZ 

Etapa iterativă a algoritmului QZ construieşte un şir de perechi de matrice unitar 

(ortogonal)echivalenteconvergentcătreformaSchur(reală)generalizată. În esenţă, 

încazul încarematriceaB estenesingulară,iteraţiile QZreprezintăoimplementare 

specifică a iteraţiilor QR pentru matricea C = AB −1 . Concret, perechea curentă 

(A k ,B k ) a şirului QZ este astfel calculată încât matricea C k = A k B −1 

k 

sa fie matricea 

curentă a şirului QR pentru matricea C. Aşa cum s-a mai precizat, eficienţa


fazei iterative a algoritmului QZ este determinant asigurată de reducerea preliminară 

a perechii (A,B) la forma Hessenberg generalizată folosind algoritmii HTQZc 

sau HTQZr şi de conservareaacestei structuri de iteraţiile QZ. Pentruasublinia în 

mod imperativ acest lucru, în continuare vom presupune această reducere efectuată 

şivomfolosinotaţiagenerică(H,T)pentruperecheacurentă,deşi,natural,oriceimplementare 

îngrijită utilizează suprascrierea perechii (A,B) iniţiale. De asemenea, 

pentru situaţiile în care matricea B (i.e. T) este singulară vom presupune efectuată 

şi evidenţierea valorilor proprii generalizate infinite cu ajutorul algoritmului DZc 

sau DZr. 

Nu vom mai dezvolta aici variantele cu deplasare explicită ci ne vom limita la 

variantele profesionale cu deplasare implicită cu pas simplu pentru cazul datelor 

complexe, respectiv cu pas dublu pentru cazul datelor reale. 

Fie dată perechea (H,T) ∈ IC n×n × IC n×n în formă Hessenberg generalizată şi 

presupunem că matricea T este nesingulară. Având în vedere observaţia de mai sus, 

privitoarela substratul conceptual al iteraţiilor QZ, pentru implementarea unui pas 

QRcudeplasareimplicităpentrumatriceaG = HT −1 avemnevoie, pentruautiliza 

teorema 4.15, ca matricea superior Hessenberg G să fie ireductibilă (i.e. cu toate 

elementele subdiagonale nenule). Este uşor de văzut (v. exerciţiul 6.8) că această 

condiţie este îndeplinită dacă şi numai dacă H este ireductibilă. În acest context, 

vom spune că perechea (H,T) se află în formă Hessenberg generalizată ireductibilă 

dacă H este ireductibilă şi T este nesingulară. 

Pentru a evidenţia ”părţile” ireductibile 14 ale perechii (H,T) vom partiţiona 

matriceleH şi T înacordcu zerourilesubdiagonalealematricei superiorHessenberg 

H. Astfel, dacă H are un singur zero subdiagonal în poziţia (k + 1,k), atunci 

considerând partiţia 

[ ] [ ] 

H11 H 

H = 12 T11 T 

, T = 12 

, (6.47) 

0 H 22 0 T 22 

avem perechile (H 11 ,T 11 ) ∈ IC k×k ×IC k×k şi (H 22 ,T 22 ) ∈ IC (n−k)×(n−k) ×IC (n−k)×(n−k) 

în formă Hessenberg generalizată ireductibilă cărora li se pot aplica iteraţiile QZ în 

varianta cu deplasare implicită. Cum, evident, 

λ(H,T) = λ(H 11 ,T 11 )∪λ(H 22 ,T 22 ) (6.48) 

rezultă că problema iniţială a calculului valorilor proprii generalizate se reduce la 

rezolvarea a două probleme de aceeaşi natură, dar de dimensiuni mai mici. Analog 

se procedează când matricea H are mai multe zerouri subdiagonale. Gestionarea 

acestor zerouri şi aplicarea tehnicii iterative cu deplasare implicită numai părţilor 

ireductibile va fi prezentată în cadrul formei finale a algoritmului QZ. 

Încadrulacestuiparagrafvomconsideradatăperechea(H,T), cu T nesingulară, 

în formă Hessenberg generalizată ireductibilă şi vom stabili algoritmul de calcul al 

perechiisuccesoralperechiicurentedinşirulQZ.Vomtratadistinct situaţiadatelor 

complexe şi a celor reale. 

Reamintim că ideea de bază a iteraţiei QZ constă într-o implementare specifică 

a iteraţiei QR cu deplasare implicită pentru matricea G = HT −1 şi anume în 

14 Cazul real se tratează identic.


construcţia şirului de perechi (H k ,T k ) astfel încât matricea G k = H k T −1 

k 

să fie 

matricea corespunzătoare a şirului QR pentru matricea G. Principalul avantaj 

de natură numerică al acestei abordări constă în evitarea inversării matricei T k şi 

eliminarea, datorită acestui fapt, a unei posibile instabilităţi numerice cauzate de o 

condiţionare necorespunzătoare a lui T k . 

Precizăm de la început două consecinţe ale faptului că iteraţiile QZ reprezintă o 

formă mascată a iteraţiilor QR (pentru a căror motivare recomandăm consultarea 

capitolului 4): 

a) conservarea formei Hessenberg generalizate pe parcursul procesului iterativ; 

b) excelente proprietăţi de convergenţă către forma Schur (reală) generalizată. 

A. Un pas QZ pentru perechi complexe 

Conform celor prezentate în capitolul 4, un pas simplu QR cu deplasare implicită 

pentru matricea G k = H k T −1 

k 

realizează următoarea secvenţă de calcule. 

1. Secalculeazăprimacoloanăq (k) 

1 amatriceiQ k cedefineştetransformarea 

unitară aferentă unui pas simplu QR cu deplasare explicită. 

2. Se determină o matrice unitară P astfel încât prima coloană a lui 

P să fie q (k) 

1 , i.e. Pe 1 = q (k) 

1 . 

3. Se calculează matricea F = P H G k P (a cărei structură nu mai este 


4. Se aplicăalgoritmulHQde reducereamatriceiF la formasuperior 

Hessenberg rezultând matricea succesor G k+1 = H k+1 T −1 

k+1 . 

Fie, pentrusimplificareanotaţiilor,(H k ,T k ) not 

= (H,T)perecheacurentăaşirului 

QZ, presupusă ireductibilă, (H k+1 ,T k+1 ) not 

= (H ′ ,T ′ ) perechea succesor precum şi 

G = HT −1 , G ′ = H ′ (T ′ ) −1 . Urmând etapele din schema de calcul de mai sus vom 

transfera transformările matricei G perechii (H,T). Avem următoarele particularităţi. 

1. Expresia deplasării curente µ = g nn în raport cu elementele matricelor H şi 

T este 

µ = h n,n 

− h n,n−1t n−1,n 

. (6.49) 

t n,n t n−1,n−1 t n,n 

Dacă µ ∉ λ(G), i.e. G−µI n este nesingulară, atunci prima coloană a matricei 

not 

de transformare Q k = Q este 

⎡ ⎤ 

h 11 

⎢ −µ 

t 11 

⎥ 

q 1 = Qe 1 = ρ 

⎢ 

⎣ 

h 21 

t 11 

0 

. 

0 

, (6.50) 

⎥ 

⎦


unde ρ este un factor real de normare. Vom numi vectorul 

⎡ ⎤ 

h 11 

−µ 

t 11 

w = 

⎢ 

⎣ 

h 21 

t 11 

⎥ 

⎦ , (6.51) 

alelementelornenulealevectoruluiq 1 /ρvector de deplasare implicităasociatpasului 

simplu QZ. 

2. Matricea unitară P de la instrucţiunea 2 a schemei de calcul de mai sus este, 

cel mai simplu, o rotaţie (complexă), având structura 

[ ] ˜P 0 

P = 

(6.52) 

0 I n−2 

cu ˜P ∈ IC 2×2 astfel calculată încât 

˜P H w = νe 1 . (6.53) 

3. Este uşor de văzut că aplicarea transformării de asemănare de la punctul 2 

al schemei de calcul de mai sus este echivalentă cu aplicarea rotaţiei P H ambelor 

matrice din perechea (H,T). Într-adevăr, dacă ( ˜H, ˜T) = (P H H,P H T), atunci 

˜H ˜T −1 = P H HT −1 P = P H GP. Alterareastructurii superiorHessenberg a matricei 

G în poziţia (3,1) se transferă în alterarea structurală a perechii (H,T). Concret, 

datorită structurii (6.52) a lui P, matricea ˜H rămâne superior Hessenberg, pe când 

˜T are un element nenul suplimentar în poziţia (2,1). 

4. Refacereastructurii Hessenberggeneralizateaperechii ( ˜H, ˜T) printr-otransformare 

unitară de echivalenţă poate fi asimilată cu refacerea formei Hessenberg a 

matricei ˜G. Într-adevăr,dacă (H′ ,T ′ ) = (˜Q H ˜HZ, ˜QH ˜TZ) este în formăHessenberg 

generalizată, atunci G ′ = H ′ T ′ −1 = ˜Q H ˜HZZ 

H ˜T−1 ˜Q = ˜QH ˜H ˜T−1 ˜Q = ˜QH ˜G˜Q este 

o matrice superior Hessenberg (ca produs dintre o matrice superior Hessenberg şi 

o matrice superior triunghiulară). Concret, readucerea perechii alterate la forma 

Hessenberg generalizată se face utilizând algoritmul HTQZ adaptat, pentru asigurarea 

eficienţei necesare, la situaţia structurală prezentă. Detaliile sunt precizate 

prin următoarea schemă de calcul. 

HTQZ1 

1. Pentru k = 2:n 

1. Se calculează rotaţia modificată Z k−1,k astfel încât 

(TZ k−1,k )(k,k−1) = 0 

2. H ← HZ k−1,k % Apare un element nenul în poziţia (k+1,k−1) 

a lui H (pentru k < n) 

3. T ← TZ k−1,k % Se anulează elementul T(k,k−1) 


1. Se calculează rotaţia Q k,k+1 astfel încât (Q H k,k+1 H)(k+1,k−1) = 0 

2. H ← Q H k,k+1H % Se anulează elementul H(k+1,k−1) 

3. T ← Q H k,k+1T % Apare un element nenul în poziţia (k+1,k) a lui T


Această schemă realizează deplasarea elementelor alterante ale structurilor matricelor 

H şi T de-a lungul unor trasee paralele cu diagonala principală până la 

eliminarea lor din matricele respective utilizând în acest scop două secvenţe de 

rotaţii. 

Pentru exemplificare prezentăm evoluţia structurală a perechii (H,T) în cazul 

n = 4. Ca şi în exemplele anterioare, încadrările marchează liniile şi coloanele 

afectate de operaţia curentă. 

⎡ 

(H,T) ← (P H H,P H T) = ( ⎢ 

⎣ 

× × × × 

× × × × 

0 × × × 

0 0 × × 

⎤ 

⎥ 

⎦ , 

⎡ 

⎢ 

⎣ 

× × × × 

+ × × × 

0 0 × × 

0 0 0 × 

⎤ 

⎥ 

⎦ ), 

⎡ 

(H,T) ← (HZ 12 ,TZ 12 ) = ( ⎢ 

⎣ 

× × 

× × 

+ × 

0 0 

× × 

× × 

× × 

× × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × 

∅ × 

0 0 

0 0 

× × 

× × 

× × 

0 × 

⎤ 

⎥ 

⎦ ), 

⎡ 

(H,T) ← (Q H 23 H,QH 23 T) = ( ⎢ 

⎣ 

× × × × 

× × × × 

∅ × × × 

0 0 × × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

0 × × × 

0 × × × 

0 + × × 

0 0 0 × 

⎤ 

⎥ 

⎦ ), 

⎡ 

(H,T) ← (HZ 23 ,HZ 23 ) = ( ⎢ 

⎣ 

× 

× 

0 

0 

× × 

× × 

× × 

+ × 

× 

× 

× 

× 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× 

0 

0 

0 

× × 

× × 

∅ × 

0 0 

× 

× 

× 

× 

⎤ 

⎥ 

⎦ ), 

⎡ 

(H,T) ← (Q H 34 H,QH 34 T) = ( ⎢ 

⎣ 

× × × × 

× × × × 

0 × × × 

0 ∅ × × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × × × 

0 × × × 

0 0 × × 

0 0 + × 

⎤ 

⎥ 

⎦ ), 

⎡ 

(H,T) ← (HZ 34 ,TZ 34 ) = ( ⎢ 

⎣ 

× × 

× × 

0 × 

0 0 

× × 

× × 

× × 

× × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × 

0 × 

0 0 

0 0 

× × 

× × 

× × 

∅ × 

⎤ 

⎥ 

⎦ ). 

Aplicarea rotaţiei P H care asigură prima coloană impusă a matricei de transformare 

corespunzătoare pasului QR curent pentru matricea HT −1 şi apoi refacerea 

structurii Hessenberg generalizate cu ajutorul variantei adaptate a algoritmului


HTQZ, dată de schema de calcul de mai sus, conduc la obţinerea perechii succesor 

{ 

H ← H ′ = Q H n−1,n···QH 23 PH HZ 12 Z 23···Z n−1,n , 

(6.54) 

T ← T ′ = Q H n−1,n···Q H 23P H TZ 12 Z 23···Z n−1,n , 

din şirul QZ. Perechea (H ′ ,T ′ ) suprascrie perechea (H,T), i.e. toate calculele aferente 

unui pas simplu QZ cu deplasare implicită se desfăşoară pe loc, în tablourile 

H şi T. 

Din motive de organizare judicioasă a algoritmului QZ şi, mai ales, a algoritmului 

de ordonare a formei Schur generalizate (vezi secţiunea 6.4) vom scrie o 

procedură distinctă pentru calculul vectorului de deplasare implicită. 


pentru un pas simplu QZ) (Date o pereche (H,T) ∈ IC n×n × IC n×n în 

formă Hessenberg generalizată cu T nesingulară, algoritmul calculează 

vectorul w ∈ IC 2 de deplasare implicită pentru un pas simplu QZ.) 

1. µ = h n,n 

− h n,n−1t n−1,n 

t n,n t n−1,n−1 t n,n 

⎡ ⎤ 

h 11 

−µ 

2. w = ⎢ t 11 ⎥ 

⎣ h 21 

⎦ 

t 11 


iar complexitatea sa este, evident, O(1). 

w = VD1(H,T), 

Cu aceste precizări putem prezenta algoritmul de implementare al unui pas 

simplu QZ cu deplasare implicită. Sunt utilizate proceduri cuprinse în tabelul 4.3 

şi procedura Gcm, de calcul al unei rotaţii modificate, introdusă în acest capitol. 

Algoritmul 6.4 (IT QZ1 - Un pas simplu QZ cu deplasare implicită) 

(Date o pereche (H,T) ∈ IC n×n × IC n×n în formă Hessenberg 

generalizată ireductibilă, matricele unitare Q,Z ∈ IC n×n şi vectorul de 

deplasare implicită w ∈ IC 2 , algoritmul suprascrie perechea (H,T) cu 

perecheasuccesor(H ′ ,T ′ ) = (Q H k HZ k,Q H k TZ k) dinşirul QZ.Opţional, 

se actualizează matricele unitare de transformare Q şi Z. Opţiunea se 

exprimă cu ajutorul variabilei logice opt de tipul şir de caractere care 

poate lua valorile ′ da ′ sau ′ nu ′ . Dacă opt = ′ nu ′ , algoritmul returnează 

matricele Q şi Z nemodificate.) 

1. [w,c,s] = Gc(w) 

2. H(1:2,:) = Gcs(c,s,H(1:2,:)) 

3. T(1:2,:) = Gcs(c,s,T(1:2,:)) 


1. Q(:,1:2) = Gcd(Q(:,1:2),c,s) 

✸


5. Pentru k = 2 : n 

1. [T(k,k−1 : k),c,s] = Gcm(T(k,k−1 : k)) 

2. l = min(k+1,n) 

3. H(1:l,k−1 : k) = Gcd(H(1:l,k−1 : k),c,s) 

4. T(1 : k−1,k−1 : k) = Gcd(T(1 : k−1,k−1 : k),c,s) 


1. Z(:,k−1 : k) = Gcd(Z(:,k−1 : k),c,s) 


1. [H(k : k+1,k−1),c,s] = Gc(H(k : k+1,k−1)) 

2. H(k : k+1,k : n) = Gcs(c,s,H(k : k+1,k : n)) 

3. T(k : k+1,k : n) = Gcs(c,s,T(k : k+1,k : n)) 


1. Q(:,k : k+1) = Gcd(Q(:,k : k+1),c,s) 


[H,T,Q,Z] = IT QZc(H,T,Q,Z,w,opt). 

Complexitateaunuipassimplu QZesteO(n 2 ). Concret, pentru execuţiaalgoritmului 

6.3 sunt necesari N op ≈ 12n 2 flopi fără acumularea transformărilor, N op ′ ≈ 12n2 

flopi suplimentari pentru acumulareatransformărilor,la care se adaugăcele 2(n−1) 

extrageri de radical. 

✸ 

B. Algoritmul QZ pentru matrice complexe 

Provenind din adaptarea algoritmului QR algoritmul QZ utilizează toate ideile 

acestuia pentru exploatarea evoluţiei structurale a elementelor şirului QZ. Concret, 

algoritmul QZ pentru matrice complexe se obţine prin iterarea pasului simplu QZ, 

anularea efectivă a elementelor subdiagonale ale matricei H devenite neglijabile şi, 

pe această bază, reducerea succesivă a dimensiunii problemei până la obţinerea 

rezultatului dorit. 

Pentru deciziile de anulare a elementelor subdiagonale ale matricei H se utilizează 

criteriul cunoscut de la algoritmul QR 

|h k+1,k | < tol(|h kk |+|h k+1,k+1 |), (6.55) 

unde scalarul pozitiv tol defineşte nivelul de toleranţă şi are, uzual, un ordin de 

mărimecomparabilcueroareadereprezentaredinformatulvirgulămobilăalmaşinii 

ţintă. 

De asemenea, pentru monitorizarea evoluţiei structurale a matricelor din şirul 

QZ,lafiecareiteraţie, dupăanulareaelementelorsubdiagonalecaresatisfaccondiţia 

(6.55), se va determina cel mai mic întreg p şi cel mai mare întreg q astfel încât 

perechea curentă (H,T) să aibă structura 

⎡ 

H = ⎣ H ⎤ 

11 H 12 H 13 

0 H 22 H 23 

⎦ }p ⎡ 

}n−p−q , T = ⎣ T ⎤ 

11 T 12 T 13 

0 T 22 T 23 

⎦ }p 

}n−p−q , 

0 0 H 33 }q 0 0 T 33 }q 

(6.56)


cu perechea (H 22 ,T 22 ) ∈ IC (n−p−q)×(n−p−q) ×IC (n−p−q)×(n−p−q) în formă Hessenberg 

generalizată ireductibilă şi H 33 ,T 33 ∈ IR q×q superior triunghiulare. Astfel, iteraţia 

QZ (complexă) se va aplica, de fapt, numai perechii (H 22 ,T 22 ) 

(H 22 ,T 22 ) ← (H ′ 22 ,T′ 22 ) = (QH 22 H 22Z 22 ,Q H 22 T 22Z 22 ), (6.57) 

echivalentă cu aplicarea asupra perechii de matrice (H,T) a transformării de echivalenţă 

unitare 

Q = diag(I p ,Q 22 ,I q ), Z = diag(I p ,Z 22 ,I q ). (6.58) 

Această transformare afectează celelalte blocuri ale matricelor H, T din (6.56) în 

felul următor: 

⎡ 

⎤ ⎡ 

⎤ 

H 11 H 12 Z 22 H 13 T 11 T 12 Z 22 T 13 

H ′ ⎢ 

= ⎣ 0 Q H 22 H 22Z 22 Q H 22 H ⎥ 

23 ⎦, T ′ ⎢ 

= ⎣ 0 Q H 22 T 22Z 22 Q H 22 T ⎥ 

23 ⎦. 

0 0 H 33 0 0 T 33 

(6.59) 

Algoritmul QZ se termină în momentul în care se anulează toate elementele 

subdiagonale ale matricei H, i.e. q devine n − 1. Utilizând, pentru claritate, sintaxele 

de apel menţionate ale algoritmilor 6.1–6.4, algoritmul QZ cu pas simplu, cu 

deplasare implicită, se scrie astfel. 

Algoritmul 6.5 (QZ1 – Algoritmul QZ cu paşi simpli şi deplasări 

implicite) (Date un fascicol matriceal definit de perechea (A,B)∈IC n×n × 

×IC n×n , matricele unitare Q,Z ∈ IC n×n şi un nivel de toleranţă tol 

pentru anularea elementelor subdiagonale, algoritmul calculează forma 

Schurgeneralizată(A,B) ← (S,T)=(Q H AZ,Q H BZ) a perechii (A,B). 

Toate calculele se efectuează pe loc, în locaţiile de memorie ale tablourilor 

A şi B. Opţional, se acumulează transformările prin actualizarea 

matricelor Q şi Z. Opţiunea se exprimă cu ajutorul variabilei logice opt 

de tipul şir de caractere care poate lua valorile ′ da ′ sau ′ nu ′ . Dacă nu 

se doreşte acumularea, matricele Q şi Z se returnează nemodificate.) 

1. % Reducerea la forma Hessenberg generalizată 

1. [A,B,Q,Z] =HTQZc(A,B,Q,Z,opt) 

2. % Deplasarea zerourilor diagonale ale matricei B şi evidenţierea 

valorilor proprii infinite. 

1. [A,B,Q,Z] =DZc(A,B,Q,Z,opt) 


1. p = 0, q = 0, cont it = 0 




1. Dacă |a i+1,i | ≤ tol(|a ii |+|a i+1,i+1 |) atunci a i+1,i = 0



Cât timp a n−q,n−q−1 = 0 

1. q ← q +1 


3. % Terminarea algoritmului 

Dacă q = n−1 atunci return. 


1. p = n−q −1 


1. p ← p−1 



1. k = p+1, l = n−q 

2. w = VD1(A(k:l,k:l),B(k:l,k:l)) 

3. [A(k:l,k:l),B(k:l,k:l),Q c ,Z c ] = 

IT QZc(A(k:l,k:l),B(k:l,k:l),I l−p ,I l−p ,w,opt) 

4. Dacă q > 0 atunci 

1. A(k:l,l+1:n) = Q c A(k:l,l+1:n) 

2. B(k:l,l+1:n) = Q c B(k:l,l+1:n) 

5. Dacă p > 0 atunci 

1. A(1:p,k:l) = A(1:p,k:l,)Z c 

2. B(1:p,k:l) = B(1:p,k:l)Z c 

5. % Acumularea transformărilor 


1. Q(:,k : l) = Q(:,k : l)Q c 

2. Z(:,k : l) = Z(:,k : l)Z c 



1. Tipăreşte ’S-au atins 30 de iteraţii fără să se 

poată anula un element subdiagonal. 

Este posibil ca pentru aceste date 

algoritmul QZ să nu fie convergent.’ 

2. Return 


programelor profesionale de calcul al valorilor proprii generalizate ale unui fascicol 

matriceal complex. Utilizarea lui pentru calculul formei Schur generalizate a unui 

fascicolrealeste posibilă 15 , dareste maipuţineficientă înraportcuvariantaspecial 

elaborată pentru acest caz şi prezentată mai jos. 

15 Pentru probleme de mică dimensiune diferenţa de eficienţă nu este decisivă astfel că acest 

algoritm poate fi folosit cu succes. Atragem însă atenţia că procedura Gc de calcul a unei rotaţii 

complexe cu relaţiile (6.42), aplicată unui vector real, calculează de fapt o rotaţie reală astfel încât, 

pentru date reale, acest algoritm va lucra exclusiv cu numere reale privite ca numere complexe 

şi nu va fi capabil să reducă perechile de blocuri diagonale 2 × 2. Pentru a depăşi acest impas 

se poate proceda, de exemplu, la identificarea situaţiei şi monitorizarea blocurilor diagonale ca în 

algoritmul special destinat cazului real (vezi mai departe).


Sintaxa de apel este 

[S,T,Q,Z] = QZ1(A,B,Q,Z,tol,opt), 

perechea (S,T) în FSG putând suprascrie (intern) perechea (A,B). 

La fel ca în cazul algoritmului QR, există date de intrare pentru care algoritmul 

nu este convergent, deşi acest lucru se întâmplă extrem de rar în practică. Aici, 

după30deiteraţiifărăprogresulparametruluistructuralq sedeclarăeşeculdeşimai 

există şanse de convergenţă printr-o modificare empirică a vectorului de deplasare 

(v. cap. 4). 

Printre rafinările posibile care nu au fost incluse este opţiunea de a fi calculată 

numai una din matricele de transformare (de obicei Z, ale cărei prime coloane 

reprezintă o bază pentru spaţiul de deflaţie asociat primelor valori proprii generalizate, 

vezi secţiunea următoare). De asemenea, din raţiuni de claritateaprezentării, 

s-a preferat acumularea transformărilor în cadrul unei iteraţii în matricele de transformare 

”curente” Q c şi Z c şi apoi aplicarea lor celorlalte blocuri afectate şi matricelor 

de transformare Q şi Z sub forma unor înmulţiri cu matrice dense fapt care 

poate conduce la o anumită reducere (totuşi puţin semnificativă) a eficienţei. 

Datorită procesului iterativ, complexitatea algoritmului depinde de datele de 

intrare. Viteza de convergenţă a procesului iterativ este similară cu cea a algoritmului 

QR. Evaluările experimentale converg către aprecierea că, în medie, două 

iteraţii sunt suficiente pentru a pune în evidenţă o valoare proprie generalizată. În 

această situaţie, pentru fascicole de ordin superior (e.g. n > 100) se poate aprecia 

că algoritmul QZ are o complexitate O(n 3 ). Evaluări mai fine sunt date la varianta 

reală. 

Utilizarea exclusivă a transformărilor unitare conferă algoritmului QZ1 o foarte 

bună stabilitate numerică. Se arată că forma Schur generalizată (S,T) calculată 

este forma Schur generalizată exactă a unei perechi foarte apropiate de perechea 

(A,B) dată. Concret, avem 

S = ˜Q H (A+E)˜Z, 

T = ˜Q H (B +F)˜Z, 

unde ˜Q, ˜Z sunt matrice riguros unitare, iar matricele de perturbaţie E şi F satisfac 

condiţiile 

‖E‖ 2 

≈ ε M ‖A‖ 2 

, ‖F‖ 2 

≈ ε M ‖B‖ 2 

, 

cu ǫ precizia maşinii ţintă. Pentru consideraţii suplimentare vezi secţiunea 6.5. ✸ 

C. Un pas QZ pentru matrice reale 

În cazul perechilor (H,T) reale un spor important de eficienţă se obţine utilizând o 

aritmetică realăcare impune utilizarea une strategii a paşilor dubli. În conformitate 

cu cele arătate în capitolul 4, un pas dublu QR cu deplasare implicită pentru 

matricea G k = H k T −1 

k 

constă în efectuarea următoarelor operaţii: 

1. Se calculează prima coloană q (k) 

1 a matricei Q k ce defineşte transformarea 

ortogonală aferentă unui pas dublu QR cu deplasare explicită.


2. Se determină o matrice ortogonală U astfel încât prima coloană a 

lui U T să fie q (k) 

1 , i.e. UT e 1 = q (k) 

1 . 

3. Se calculează matricea F = U T G k U (a cărei structură nu mai este 


4. Se aplicăalgoritmulHQde reducereamatriceiF la formasuperior 

Hessenberg rezultând matricea succesor G k+2 = H k+2 T −1 

k+2 . 

Dacă matricea superior Hessenberg G k este ireductibilă, atunci, conform teoremei 

4.9, rezultatul G k+2 al aplicării schemei de calcul de mai sus va fi esenţial 

acelaşi cu cel dat de un pas dublu QR cu deplasare explicită. Notăm şi aici, 

pentru simplificare, (H k ,T k ) not 

= (H,T) perechea curentă a şirului QZ, presupusă 

ireductibilă, (H k+2 ,T k+2 ) not 

= (H ′ ,T ′ ) perechea succesor în cazul utilizării pasului 

dublu precum şi G = HT −1 , G ′ = H ′ (T ′ ) −1 . Urmând etapele din schema de calcul 

de mai sus vom transfera transformările matricei G perechii (H,T). Mai mult, 

exploatând corespunzător avantajele structurale date de forma Hessenberg generalizată 

a perechilor iniţială şi finală, complexitatea pasului dublu va fi O(n 2 ), ceea ce 

în economia întregului algoritm este esenţial, reducând complexitatea algoritmului 

QZ cu deplasare implicită la cea a variantei cu deplasare explicită şi asigurând, 

în acelaşi timp, posibilitatea utilizării exclusive a aritmeticii reale. Detaliile sunt 

prezentate în continuare. 

1. Dacă notăm cu µ 1 şi µ 2 valorile proprii (posibil complexe) ale matricei 

G(n−1 : n,n−1 : n), atunci în expresia primei coloane a matricei de transformare 

Q k 

not 

= Q acestea apar sub forma sumei şi produsului (întotdeauna reale). Ţinânduse 

seama de structura Hessenberg a matricelor G şi H, vom calcula elementele 

blocului matriceal X = G(n−1 : n,n−2 : n) ∈ IR 2×3 ca soluţie a sistemului 

triunghiular 

XT(n−2: n,n−2 : n) = H(n−1 : n,n−2 : n), 

care se rezolvă recurent, pe linii (exerciţiu pentru cititor) 

⎧ 

x 11 = h n−1,n−2 

t n−2,n−2 

⎪⎨ 

x 12 = h n−1,n−1 −t n−2,n−1 x 11 

t n−1,n−1 

x 13 = h n−1,n −t n−2,n x 11 −t n−1,n x 12 

t n,n 

x 21 = 0 

x 22 = h n,n−1 

t n−1,n−1 

(6.60) 

⎪⎩ 

x 23 = h nn −t n−1,n x 22 

t n,n 

, 

după care valorile căutate ale sumei şi produsului se obţin imediat 

{ 

σ def 

= µ 1 +µ 2 = x 12 +x 23 , 

π def 

= µ 1 µ 2 = x 12 x 23 −x 13 x 22 . 

(6.61)


Dacă µ 1 ,µ 2 ∉ λ(G), i.e. matricea M = (G − µ 1 I n )(G − µ 2 I n ) = G 2 − σG + πI n 

not 

este nesingulară, atunci prima coloană a matricei de transformare Q k = Q (încă 

un exerciţiu pentru cititor) este 

⎡ 

h 11 

( h 11 

− h 21t 12 

−σ)+ h ⎤ 

21h 12 

+π 

t 11 t 11 t 11 t 22 t 11 t 22 h 21 

( h 11 

+ h 22 

− h 21t 12 

−σ) 

t 11 t 11 t 22 t 11 t 22 q 1 = Qe 1 = ρ 

h 21 h 32 

, (6.62) 

t 11 t 22 

0 

⎢ 

⎥ 

⎣ . ⎦ 

0 

unde ρ este un factor real de normare. Elementele nenule w = q 1 (1 : 3)/ρ ale lui 

q 1 /ρ, i.e. ⎡ 

h 11 

( h 11 

− h 21t 12 

−σ)+ h ⎤ 

21h 12 

+π 

t 11 t 11 t 11 t 22 t 11 t 22 h 21 

w = 

( h 11 

+ h 22 

− h 21t 12 

−σ) 

, (6.63) 

t 

⎢ 11 t 11 t 22 t 11 t 22 ⎥ 

⎣ h 21 h 32 

⎦ 

t 11 t 22 

definesc vectorul de deplasare implicită asociat pasului dublu QZ. 

2. Matricea ortogonală U de la instrucţiunea 2 a schemei de calcul de mai sus 

este, cel mai recomandat, un reflector (real) având structura 

[ ] 

Ũ 0 

U = , (6.64) 

0 I n−3 

cu Ũ ∈ IR3×3 reflectorul care asigură 

Ũw = νe 1 , ν ∈ IR. (6.65) 

3. Se constată şi aici imediat că aplicarea transformării de asemănare de la 

punctul 3 al schemei de calcul de mai sus este echivalentă cu aplicarea transformării 

U = U T ambelor matrice din perechea (H,T). Într-adevăr, dacă ( ˜H, ˜T) = 

= (U T H,U T T), atunci ˜H ˜T−1 = U T HT −1 U = U T GU = ˜G. Alterarea structurii 

superior Hessenberg a matricei G în poziţiile (3,1), (4,1), (4,2) se transferă în alterarea 

structurală a perechii (H,T). Concret, datorită structurii (6.64) a lui U, 

structura matricei ˜H va diferi de o structură superior Hessenberg prin elementul 

nenul din poziţia (3,1) iar structura matricei ˜T va diferi de o structură superior 

triunghiulară prin elementele nenule din poziţiile (2,1), (3,1) şi (3,2). 

4. Restaurarea structurii Hessenberg generalizate a perechii ( ˜H, ˜T) printr-o 

transformareortogonalădeechivalenţăpoatefiasimilatăcurefacereaformeiHessenberg 

a matricei ˜G. Motivaţia este aceeaşi cu cea de la iteraţia QZ complexă. Concret, 

readucerea perechii alterate la forma Hessenberg generalizată se face cu algoritmul 

HTQZ adaptat, pentru asigurareaeficienţei necesare, la situaţia structurală


actuală. Pentru adaptarea algoritmului HTQZ vom utiliza reflectori ”modificaţi” 

pe care îi definim prin expresia cunoscută 

V = I n − vvT 

β , β = 1 2 ‖v‖2 , 

unde vectorul v se calculează astfel încât să se asigure anularea primelor n−1 

elemente ale unui vector a ∈ IR n dat 16 , i.e. (Va)(1 : n−1) = 0 (şi, întrucât 

reflectorul este o matrice simetrică, (a T V)(1 : n−1) = 0). Conform celor prezentate 

în capitolul 3, nu este greu de văzut că elementele definitorii ale acestui reflector şi 

suprascrierea vectorului a cu Va se calculează economic cu schema: 

HM 

1. σ = sgn(a n )‖a‖ 

2. v i = a i , i = 1 : n−1 

3. v n = a n +σ 

4. β = a n σ 

5. a i = 0, i = 1 : n−1 

6. a n = −σ 

Vom introduce o procedură cu sintaxa 

[d,v,β] = Hrm(a) 

pentru calculul reflectorilor modificaţi de ordin dat de dimensiunea vectorului a 

şi calculul vectorului d = Va sau d = aV după cum vectorul argument este un 

vector coloană sau un vector linie. Suprascrierea (internă) a lui a cu d se face cu 

apelul [a,v,β] = Hrm(a). Procedurile de premultiplicare şi postmultiplicare a unei 

matrice cu un reflector modificat sunt identice cu cele care operează cu reflectorii 

nemodificaţi, i.e. vom folosi procedurile Hrs şi Hrd din tabelul 4.3. De asemenea, 

dacă U ∈ IR p×p este un reflector (modificat) vom nota 

U (p) 

k 

= 

⎡ 

⎣ I k−1 0 0 

0 U 0 

⎤ 

⎦ 

0 0 I n−p−k+1 

care este, la rândul său, un reflector de ordinul n pe care îl vom numi reflector 

(modificat) de ordin n şi indici (k,p). 

Cu aceste precizări putem prezenta detaliile adaptării algoritmului HTQZ prin 

următoarea schemă de calcul. 

HTQZ2 

1. Pentru k = 1 : n−3 

1. Se calculează reflectorul modificat Z (3) 

k 


(TZ (3) 

k 

)(k+2,k : k+1)=0 

2. H ← HZ (3) 

k 

% Apar două elemente nenule în poziţiile (k+3,k : k+1) 

16 Prin reflectori ”nemodificaţi” vom întelege pe parcursul acestui capitol reflectorii care aplicaţi 

unui vector n-dimensional anulează ultimele n−1 componente ale acestuia.


3. T ← TZ (3) 

k 

% Se anulează elementele T(k+2,k : k+1) 


k 

astfel încât (TZ (2) 

k )(k+1,k)=0 

5. H ← HZ (2) 

k 

6. T ← TZ (2) 

k 

% Se anulează elementul T(k+1,k) 

7. Se calculează reflectorul Q (3) 

k+1 

astfel încât (Q(3) 

k+1H)(k+2 : k+3,k) = 0 

8. H ← Q (3) 

k+1H % Se anulează elementele H(k+2 : k+3,k) 

9. T ← Q (3) 

k+1T % Apar elemente nenule în poziţiile (k+3,k+1) 

şi (k+3,k+1 : k+2) 

2. % Ultimele transformări 


n−2 astfel încât 

(TZ (3) 

n−2 )(n,n−2 : n−1) = 0 

2. H ← HZ (3) 

n−2 

3. T ← TZ (3) 

n−2 

% Se anulează elementele T(n,n−2: n−1) 


n−2 

5. H ← HZ (2) 

n−2 

6. T ← TZ (2) 

n−2 

astfel încât (TZ(2) n−2 )(n−1,n−2)= 0 

% Se anulează elementul T(n−1,n−2) 

astfel încât (Q(2) n−1 H)(n,n−2) = 0 

H % Se anulează elementul H(n,n−2) 

% Apare un element nenul în poziţia (n,n−1) a lui T 

7. Se calculează reflectorul Q (2) 

n−1 

8. H ← Q (2) 

n−1 

9. T ← Q (2) 

n−1 T 


n−1 

11. H ← HZ (2) 

n−1 

12. T ← TZ (2) 

n−1 

% Se anulează elementul T(n,n−1) 

astfel încât (TZ(2) n−2 )(n,n−1)=0 

Această schemă realizează deplasarea elementelor alterante ale structurilor matricelor 

H şi T de-a lungul unor trasee paralele cu diagonala principală până la 

eliminarea lor din matricele respective, utilizând în acest scop secvenţe de reflectori. 

Pentru exemplificare prezentăm prima parte a evoluţiei structurale a perechii 

(H,T) în cazul n = 5. 

⎡ 

(H,T) ← (UH,UT) = ( 

⎢ 

⎣ 

× × × × × 

× × × × × 

+ × × × × 

0 0 × × × 

0 0 0 × × 

⎤ ⎡ 

⎥ 

⎦ , ⎢ 

⎣ 

× × × × × 

+ × × × × 

+ + × × × 

0 0 0 × × 

0 0 0 0 × 

⎤ 

⎥ 

⎦ ), 

(H,T)←(HZ (3) 

1 ,TZ(3) 

⎡ 

1 )=( ⎢ 

⎣ 

× × × 

× × × 

+ × × 

+ + × 

0 0 0 

× × 

× × 

× × 

× × 

× × 

⎤ ⎡ 

, 

⎥ ⎢ 

⎦ ⎣ 

× × × 

+ × × 

∅ ∅ × 

0 0 0 

0 0 0 

× × 

× × 

× × 

× × 

0 × 

⎤ 

), 

⎥ 

⎦


(H,T)←(HZ (2) 

1 ,TZ(2) 

⎡ 

1 )=( ⎢ 

⎣ 

× × 

× × 

+ × 

+ + 

0 0 

× × × 

× × × 

× × × 

× × × 

× × × 

0 × × 

⎤ ⎡ 

, 

⎥ ⎢ 

⎦ ⎣ 

× × 

∅ × 

0 0 

0 0 

0 0 

× × × 

× × × 

× × × 

0 × × 

0 0 × 

⎤ 

), 

⎥ 

⎦ 

(H,T)←(Q (3) 

2 H,Q(3) 

⎡ 

2 T)=( ⎢ 

⎣ 

× × × × × 

× × × × × 

∅ × × × × 

∅ + × × × 

0 0 0 × × 

⎤ ⎡ 

, 

⎥ ⎢ 

⎦ ⎣ 

× × × × × 

0 × × × × 

0 + × × × 

0 + + × × 

0 0 0 0 × 

⎤ 

), 

⎥ 

⎦ 

etc. Se observă că s-a obţinut deplasarea cu o poziţie spre dreapta jos a celor două 

grupuri de elemente alterante, proces care poate fi continuat până la eliminarea lor. 

Aplicarea reflectorului U = U T care asigură prima coloană impusă a matricei 

de transformare corespunzătoare pasului QR curent pentru matricea HT −1 şi apoi 

refacerea structurii Hessenberg generalizate cu ajutorul variantei adaptate a algoritmului 

HTQZ, dată de schema de calcul de mai sus, conduc la obţinerea perechii 

succesor 

H ← H ′ = Q (2) 

n−1 Q(3) n−2···Q(3) 1 UHZ(3) 1 Z(2) 1 ···Z (3) 

n−2 Z(2) n−2 Z(2) n−1 

T ← T ′ = Q (2) 

n−1 Q(3) n−2···Q(3) 1 UTZ(3) 1 Z(2) 1 ···Z (3) 

n−2 Z(2) n−2 Z(2) n−1 

(6.66) 

dinşirulQZ.PrimacoloanăamatriceiU nuesteafectatădemultiplicarealadreapta 

cu matricea Q (3) 

1 ···Q (3) 

n−2 Q(2) n−1 . 

Ţinând seama de (6.61), (6.63) calculul economic al vectorului de deplasare 

implicită se poate face cu următorul algoritm. 


pentru un pas dublu QZ) (Date o pereche (H,T) ∈ IR n×n × IR n×n în 

formă Hessenberg generalizată cu T nesingulară algoritmul calculează 

vectorul w ∈ R 3 de deplasare implicită pentru un pas dublu QZ.) 

1. Se calculează σ şi π cu relaţia (6.61). 

2. α = h 11 

, β = h 22 

, γ = h 21 

, δ = γ , η = α−δt 12 −σ 

t 11 t 22 t 11 t 22 

⎡ 

3. w = ⎣ αη +δh ⎤ 

12 +π 

γ(β +η) ⎦ 

δh 32 

Comentarii. Sintaxa de apel a a acestui algoritm va fi 

w = VD2(H,T), 

iar complexitatea sa rămâne, evident, O(1). 

✸


Suntem în măsură să prezentăm acum algoritmul formal de implementare a 

unui pas dublu QZ cu deplasare implicită. Sunt utilizate procedurile de calcul 

al reflectorilor cuprinse în tabelul 4.3, la care se adaugă procedurile introduse în 

această secţiune. 

Algoritmul 6.7 (IT QZ2 – Un pas dublu QZ cu deplasare implicită) 

(Date o pereche (H,T) ∈ IR n×n × IR n×n în formă Hessenberg 

generalizată ireductibilă, vectorul de deplasare implicită w ∈ IR 3 

şi matricele ortogonale Q,Z ∈ IR n×n , algoritmul suprascrie perechea 

(H,T) cu perechea succesor (H ′ ,T ′ ) = (Q T k HZ k,Q T k TZ k) din şirul QZ. 

Opţional, se actualizează matricele de transformare Q şi Z. Opţiunea 

se exprimă cu ajutorul variabilei logice opt de tipul şir de caractere care 

poate lua valorile ′ da ′ sau ′ nu ′ . Dacă opt = ′ nu ′ , algoritmul returnează 

matricele Q şi Z nemodificate.) 

1. [w,u,β] = Hr(w) 

2. H(1:3,:) = Hrs(u,β,H(1:3,:)) 

3. T(1:3,:) = Hrs(u,β,T(1:3,:)) 

4. Dacă opt = ′ da ′ atunci Q(:,1:3) = Hrd(Q(:,1:3),u,β) 

5. % Refacerea structurii superior Hessenberg generalizate 

Pentru k = 1 : n−3 

1. [T(k+2,k : k+2),u,β] = Hrm(T(k+2,k : k+2)) 

2. H(1 : k+3,k : k+2) = Hrd(H(1 : k+3,k : k+2),u,β) 

3. T(1 : k+1,k : k+2) = Hrd(T(1 : k+1,k : k+2),u,β) 


Z(:,k : k+2) = Hrd(Z(:,k : k+2),u,β) 

5. [T(k+1,k : k+1),u,β] = Hrm(T(k+1,k : k+1)) 

6. H(1 : k+3,k : k+1) = Hrd(H(1 : k+3,k : k+1),u,β) 

7. T(1 : k,k : k+1) = Hrd(T(1 : k,k : k+1),u,β) 


Z(:,k : k+1) = Hrd(Z(:,k : k+1),u,β) 

9. [H(k+1 : k+3,k),u,β] = Hr(H(k+1 : k+3,k)) 

10. H(k+1 : k+3,k+1 : n) = Hrs(u,β,H(k+1 : k+3,k+1 : n)) 

11. T(k+1 : k+3,k+1 : n) = Hrs(u,β,T(k+1 : k+3,k+1 : n)) 


Q(:,k+1 : k+3) = Hrd(Q(:,k+1 : k+3),u,β) 

6. % Ultimele transformări 

1. [T(n,n−2: n),u,β] = Hrm(T(n,n−2: n)) 

2. H(:,n−2: n) = Hrd(H(:,n−2 : n),u,β) 

3. T(1 : n−1,n−2: n) = Hrd(T(1 : n−1,n−2: n),u,β) 


Z(:,n−2: n) = Hrd(Z(:,n−2 : n),u,β) 

5. [T(n−1,n−2: n−1),u,β] = Hrm(T(n−1,n−2: n−1))


6. H(:,n−2: n−1) = Hrd(H(:,n−2 : n−1),u,β) 

7. T(1 : n−2,n−2: n−1) = Hrd(T(1 : n−2,n−2: n−1),u,β) 


Z(:,n−2: n−1) = Hrd(Z(:,n−2 : n−1),u,β) 

9. [H(n−1 : n,n−2),u,β] = Hr(H(n−1 : n,n−2)) 

10. H(n−1 : n,n−1 : n) = Hrs(u,β,H(n−1 : n,n−1 : n)) 

11. T(n−1: n,n−1 : n) = Hrs(u,β,T(n−1: n,n−1 : n)) 


Q(:,n−1: n) = Hrd(Q(:,n−1 : n),u,β) 

13. [T(n,n−1: n),u,β] = Hrm(T(n,n−1: n)) 

14. H(:,n−1: n) = Hrd(H(:,n−1 : n),u,β) 

15. T(1 : n−1,n−1: n) = Hrd(T(1 : n−1,n−1: n),u,β) 


Z(:,n−1: n) = Hrd(Z(:,n−1 : n),u,β) 


[H,T,Q,Z] = IT QZ2(H,T,Q,Z,w,opt). 

ComplexitateaunuipasdubluQZînimplementareademaisusesteO(n 2 ). Concret, 

pentru execuţia algoritmului 6.7 sunt necesari N op ≈ 32n 2 flopi fără acumularea 

transformărilor,N op ′ ≈ 20n2 pentru calculul matricei Z, N op ′′ ≈ 12n2 pentru calculul 

matricei Q, la care se adaugă cele 2(n−1) extrageri de radical. ✸ 

D. Algoritmul QZ pentru matrice reale 

Algoritmul QZ pentru matrice reale reproduce structura algoritmului omonim pentru 

matrice complexe cu următoarele aspecte specifice: 

a) în faza iterativă monitorizarea structurii matricei H are loc cu evidenţierea 

blocurilor diagonale 2×2; 

b) faza iterativă a algoritmului QZ se termină în momentul în care ordinul 

submatricii H 22 scade la cel mult 2, i.e. q devine mai mare decât n−3. 

c) după terminarea fazei iterative, algoritmul se completează cu reducerea la 

forma superior triunghiulară a perechilor de blocuri diagonale 2×2 care au valori 

proprii generalizate reale. 

Rezolvarea problemelor ridicate de primele două aspecte este imediată. În ceea 

ce priveştepunctul c), triangularizareaperechilorde blocuri diagonale2×2cu valori 

proprii reale se face în felul următor. 

Fie perechea ( ˜H, ˜T) ∈ IR 2×2 ×IR 2×2 cu ˜h 21 ≠ 0 şi valorile proprii generalizate 

reale λ 1 şi λ 2 . Atunci 

[ ] 

λ1˜t 22 −˜h 22 

v = 

(6.67) 

˜h 21 

este un vector propriu generalizat asociat lui λ 1 , i.e. ˜H v = λ1 ˜T v şi S = Imv 

este un subspaţiu de deflaţie al fascicolului ( ˜H, ˜T). Matricele ˜Q şi ˜Z care definesc


transformarea ortogonală de echivalenţă ce aduce perechea ( ˜H, ˜T) la forma Schur 

generalizată se pot construi procedând ca în demonstraţia propoziţiei 6.2. Concret, 

(vezi exerciţiul 6.9), ˜Z este reflectorul care asigură (˜Zv)(2) = 0, iar apoi ˜Q este 

reflectorul care asigură (˜Q T (˜T ˜Z(:,1))(2) = 0. 

Dacă blocul diagonal ce trebuie triangularizat se află pe liniile şi coloanele k şi 

k+1, atunci rezultatul dorit se obţine aplicând perechii (H,T), de ordinul n, transformarea 

ortogonală de echivalenţă definită de matricele Q = diag(I k−1 , ˜Q,I n−k−1 ) 

şi diag(I k−1 , ˜Z,I n−k−1 ). 

În vedereaunei scrierimai concise a algoritmuluiQZ prezentămaici un algoritm 

preliminar care procesează perechea bloc-diagonală 2×2 aflată în poziţia (k,k+1). 

Algoritmul 6.8 (TRID2g -Triangularizarea unei perechi de blocuri 

diagonale 2×2) (Date o pereche (S,T) ∈ IR n×n ×IR n×n , cu S în formă 

cvasi-superior triunghiulară şi T superior triunghiulară nesingulară şi 

întregul k ∈ 1:n−1, algoritmul testează dacă perechea de blocuri diagonale 

(S(k: k+1,k: k+1),T(k: k+1,k: k+1)) are valorile proprii generalizate 

reale şi, în caz afirmativ, calculează triangularizarea ortogonală 

a perechii bloc-diagonale vizate, rezultatul suprascriind perechea (S,T). 

De asemenea, algoritmul returnează elementele definitorii (u Q ,β Q ) şi 

(u Z ,β Z ) ale celor doi reflectori calculaţi. În caz contrar perechea (S,T) 

rămâne nemodificată şi, pentru identificarea acestei situaţii, se returnează 

β Z = 0.) 

1. β Z = 0 

2. α = t k,k t k+1,k+1 , β = s k,k t k+1,k+1 + s k+1,k+1 t k,k − s k+1,k t k,k+1 , 

γ = s k,k s k+1,k+1 −s k,k+1 s k+1,k , ∆ = β 2 −4αγ 

3. Dacă ∆ ≥ 0 atunci 

1. λ 1 = (β +sgn(β) √ ∆)/2α 

[ ] 

λ1 t k+1,k+1 −s k+1,k+1 

2. v = 

s k+1,k 

3. [v,u Z ,β Z ] = Hr(v) 

4. S(1 : k+1,k:k+1) = Hrd(S(1 : k+1,k:k+1),u Z ,β Z ) 

5. T(1 : k+1,k:k+1) = Hrd(T(1 : k+1,k:k+1),u Z ,β Z ) 

6. [T(k:k+1,k),u Q ,β Q ] = Hr(T(k:k+1,k)) 

7. S(k:k+1,k:n) = Hrs(u Q ,β Q ,S(k: k+1,k:n)) 

8. S(k+1,k) = 0 % zeroul calculat se setează la un zero efectiv 

9. T(k:k+1,k+1:n) = Hrs(u Q ,β Q ,T(k: k+1,k+1:n)) 


iar complexitatea sa este O(n). 

[S,T,u Q ,β Q ,u Z ,β Z ] = TRID2g(S,T,k), 

Cu acesteprecizărişi ţinând seamade aspectelecomune cu cazulcomplexputem 

scrie algoritmul QZ standard cu pas dublu, cu deplasare implicită, pentru calculul 

formei Schur reale generalizate. 

✸


Algoritmul 6.9 (QZ2 – Algoritmul QZ cu paşi dubli şi deplasări 

implicite) (Dateunfascicolmatricealdefinit deperechea(A,B)∈IR n×n × 

×IR n×n , matricele ortogonale Q,Z ∈ IR n×n şi un nivel de toleranţă tol 

pentru anularea elementelor subdiagonale, algoritmul calculează forma 

Schur reală generalizată (A,B) ← (S,T) = (˜Q T A˜Z, ˜Q T B ˜Z) a perechii 

(A,B). Toate calculele se efectuează pe loc, în locaţiile de memorie 

ale tablourilor A şi B. Opţional, se acumuleză transformările prin actualizarea 

matricelor Q ← Q˜Q şi Z ← Z ˜Z. Opţiunea se exprimă cu 

ajutorul variabilei logice opt de tipul şir de caractere care poate lua 

valorile ′ da ′ sau ′ nu ′ . Dacă nu se doreşte acumularea transformărilor, 

matricele Q şi Z se returnează nemodificate.) 

1. % Reducerea la forma Hessenberg generalizată 

1. [A,B,Q,Z] =HTQZr(A,B,Q,Z,opt) 

2. % Deplasarea zerourilor diagonale ale matricei B şi evidenţierea 

valorilor proprii infinite. 

1. [A,B,Q,Z] =DZr(A,B,Q,Z,opt) 


1. p = 0, q = 0, cont it = 0. 




1. Dacă |a i+1,i | ≤ tol(|a ii |+|a i+1,i+1 |) atunci a i+1,i = 0 


1. continuă = ′ da ′ 

2. Cât timp continuă = ′ da ′ 


2. Dacă a n−q,n−q−1 = 0 atunci 

1. q ← q +1 


altfel 

1. Dacă a n−q−1,n−q−2 = 0 

atunci 

1. q ← q +2 


altfel continuă = ′ nu ′ . 

3. % Terminarea normală a fazei iterative 

Dacă q ≥ n−2 atunci break 


1. p = n−q −1 


1. p ← p−1 

2. Dacă p = 0 atunci break



1. k = p+1, l = n−q 

2. w = VD2(A(k:l,k:l),B(k:l,k:l)) 

3. [A(k:l,k:l),B(k:l,k:l),Q c ,Z c ] = 

IT QZ2(A(k:l,k:l),B(k:l,k:l),I l−p ,I l−p ,w,opt) 

4. 1. Dacă q > 0 atunci 

1. A(k:l,l+1:n) = Q c A(k:l,l+1:n) 

2. B(k:l,l+1:n) = Q c B(k:l,l+1:n) 

5. 1. Dacă p > 0 atunci 

1. A(1:p,k:l) = A(1:p,k:l)Z c 

2. B(1:p,k:l) = B(1:p,k:l)Z c 



1. Q(:,k : l) = Q(:,k : l)Q c 

2. Z(:,k : l) = Z(:,k : l)Z c 


1. Dacă cont it > 30 

atunci 

1. Tipăreşte ’S-au consumat 30 iteraţii QZ pentru 

evidenţierea unui bloc diagonal fără a se atinge 


de intrare, algoritmul QZ să nu fie convergent.’ 

2. Return 

4. % Triangularizarea blocurilor 2 × 2 cu valori proprii generalizate 

reale 

1. k = 1 

2. Cât timp k < n 

1. Dacă a k+1,k = 0 atunci k ← k +1 

altfel 

1. [A,B,u Q ,β Q ,u Z ,β Z ] =TRID2g(A,B,k) 

2. Dacă opt=’da’ şi β Z ≠ 0 atunci 

1. Q(:,k:k+1) = Hrd(Q(:,k:k+1),u Q ,β Q ) 

2. Z(:,k:k+1) = Hrd(Z(:,k:k+1),u Z ,β Z ) 

3. k ← k +2 


programelor profesionale de calcul al valorilor proprii generalizate ale unui fascicol 

matriceal real. Precizările referitoare la aspectele de organizare a algoritmului 

făcute la variantacomplexă rămân valabile. În acest sens s-au pastrat identificatorii 

variabilelor cu aceeaşi semnificaţie. 

Sintaxa de apel este 

[S,T,Q,Z] = QZ2(A,B,Q,Z,tol,opt),


perechea (S,T) în FSG putând suprascrie (intern) perechea (A,B). 

La fel ca în cazul algoritmului QR, există date de intrare pentru care algoritmul 

nuesteconvergent,deşiacestlucruse întâmplăextremderar înpractică. Aici, după 

30 de iteraţii fără progresul parametrului structural q se declară eşecul algoritmului 

deşi mai există şanse de convergenţă printr-o modificare empirică a vectorului de 

deplasare după un număr precizat de iteraţii, e.g. 10 sau 20 (v. cap. 4). 

Acceptând evaluarea conform căreia sunt suficiente, în medie, două iteraţii pentru 

a pune în evidenţă o valoare proprie generalizată, algoritmul necesită un număr 

de N A op = 30n 3 flopi fără acumularea transformărilor, N Q op = 16n 3 flopi suplimentari 

pentru calculul lui Q şi N Z op = 20n 3 flopi pentru acumularea lui Z. Putem, deci, 

considera că pentru fascicole de ordin superior (e.g. n > 100) algoritmul QZ are o 

complexitate O(n 3 ). 

Şi aici, utilizareaexclusivăatransformărilorortogonaleconferăalgoritmuluiQZ 

o foarte bună stabilitate numerică. Concret, perechea calculată (S,T) satisface 

S = ˜Q T (A+E)˜Z, 

T = ˜Q T (B +F)˜Z, 

unde ˜Q, ˜Z sunt matrice riguros ortogonale, iar matricele de perturbaţie E şi F 

satisfac condiţiile 

‖E‖ 2 

≈ ε M ‖A‖ 2 

, ‖F‖ 2 

≈ ε M ‖B‖ 2 

. 

Pentru consideraţii suplimentare vezi secţiunea 6.5. 

✸ 

∗ 

∗ 

∗ 

Încheiem acestparagrafcu regretullipsei de spaţiu tipograficpentru prezentarea 

algoritmilor de calcul al formei diagonale generalizate a fascicolelor hermitice (în 

cazulreal,simetrice)pozitiv definite. Pentruintroducerea înproblemărecomandăm 

rezolvarea exerciţiului 6.10, iar pentru detalii şi indicaţii bibliografice suplimentare 

consultarea lucrării [VI]. 

6.3.4 Calculul vectorilor proprii generalizaţi 

Considerămimportantsăprecizămdela începutcă înmulteaplicaţiivectoriiproprii 

generalizaţi pot fi înlocuiţi cu succes de către vectorii Schur corespunzători, i.e. de 

către coloanele matricelor de transformare Z şi Q. 

Dacă se doreşte totuşi determinarea explicită a vectorilor proprii generalizaţi 

aceştia pot fi calculaţi, după execuţia algoritmului QZ corespunzător, în două 

modalităţi: 

a) prin rezolvarea sistemelor liniare singulare corespunzătoare; 

b) prin câteva iteraţii (teoretic, într-o singură iteraţie) ale metodei puterii inverse 

generalizate. 

Prezentăm succint prima variantă pentru cazul complex (pentru cazul real vezi 

exerciţiul 6.11). Un vector propriu generalizat x k ∈ IC n , asociat valorii proprii generalizate 

finite λ k = s kk /t kk este un vector nenul care satisface sistemul singular 

Ax k = λ k Bx k . (6.68)


Ţinând seama de faptul că (A,B) = (QSZ H ,QTZ H ), vectorul x k se calculează cu 

relaţia 

x k = Zy, (6.69) 

unde y este o soluţie nenulă a sistemului singular triunghiular 

t kk Sy = s kk Ty. (6.70) 

Dacă λ k este o valoare proprie distinctă, atunci soluţiile nenule ale sistemului (6.70) 

au structura 

y = [ỹ T α0 ...0] T , ỹ ∈ IC k−1 , (6.71) 

unde α este un scalar nenul altfel arbitrar, e.g. α = 1. Cu această alegere a lui α 

din (6.70) rezultă că ỹ este soluţia sistemului triunghiular nesingular 

(t kk S(1 : k−1,1 : k−1)−s kk T(1 : k−1,1 : k−1))ỹ = s kk T(1 : k−1,k)−t kk S(1 : k−1,k). 

(6.72) 

Cu ỹ astfel obţinut vectorul propriu generalizat x k se obţine din (6.69) cu relaţia 

x k = Z(:,1 : k−1)ỹ +Z(:,k). (6.73) 

În situaţia încarevaloareaproprienu este distinctă, calculul se poateprocedafie 

extinzând ideile din situaţia corespunzătoare din cazul calculului vectorilor proprii 

ordinari, fie apelând la o ”grupare” a valorilor proprii generalizate identice prin 

tehnici de ordonare care fac obiectul secţiunii următoare. 

6.4 Forma Schur generalizată ordonată. 

Calculul subspaţiilor de deflaţie 

Conceptul de subspaţiu de deflaţie a fost introdus prin definiţia 6.2 şi folosit pentru 

a demonstra posibilitatea reducerii unei perechi (A,B) ∈ IC n×n × IC n×n , prin 

transformări de echivalenţă, la forma Schur generalizată. 

Reciproc, fie un fascicol regulat, definit de o pereche (A,B) ∈ IC n×n ×IC n×n şi 

forma sa Schur generalizată (S,T) cu următoarele partiţii ale matricelor S şi T 

k n−k 

k n−k 

{}}{ {}}{ 

{}}{ {}}{ 

[ ] [ ] 

S = Q H S11 S 

AZ = 12 }k 

0 S 22 }n−k , T = T11 T QH BZ = 12 }k 

0 T 22 }n−k . 

(6.74) 

Fie, de asemenea, partiţiile corespondente ale matricelor unitare de transformare 

Q = 

k n−k 

{}}{ {}}{ 

[ ] 

Q1 Q 2 

, Z = 

k n−k 

{}}{ {}}{ 

[ ] 

Z1 Z 2 

. (6.75) 

Dacă, acum, considerăm S = ImZ 1 , atunci V 1 

def 

= AS = Im(AZ 1 ) = Im(QSZ H Z 1 ) 

de unde, ţinând seama de relaţiile (6.74), (6.75), precum şi de faptul că Z H 1 Z 1 = I k ,

6.4. CALCULUL SUBSPAŢIILOR DE DEFLAŢIE 487 

Z2 HZ 1 = 0, rezultă 

[ ][ 

S11 S 

V 1 = Im([Q 1 Q 2 ] 12 Z 

H 

1 

0 S 22 Z2 

H 

] 

Z 1 ) = Im(Q 1 S 11 ) ⊆ ImQ 1 , 

cu egalitate în ultima relaţie dacă şi numai dacă S 11 este nesingulară. În acest din 

urmă caz coloanele lui Q 1 formează o bază unitară a lui V 1 . Absolut analog avem 

def 

V 2 = BS = Im(BZ 1 ) = Im(QTZ H Z 1 ) de unde rezultă 

V 2 = Im(Q 1 T 11 ) ⊆ ImQ 1 , 

cu egalitate în ultima relaţie dacă şi numai dacă T 11 este nesingulară. 

În consecinţă, 

V def 

= AS +BS = V 1 +V 2 ⊆ ImQ 1 . (6.76) 

cu egalitate în ultima relaţie dacă una din matricele S 11 sau T 11 este nesingulară. 

În toate situaţiile avem 

dimV ≤ dimS (6.77) 

ceea ce înseamnă, conform definiţiei 6.2, că S = ImZ 1 este un un subspaţiu de 

deflaţie al fascicolului matriceal definit de perechea (A,B), subspaţiu pe care îl asociem, 

în mod natural, cu setul de valori proprii generalizate λ(S 11 ,T 11 ) ⊂ λ(A,B). 

În cazul real, toate consideraţiile de mai sus rămân valabile cu singurul amendament 

că subspaţiile de deflaţie reale ale unui fascicol real se asociază întotdeauna 

unor seturi simetrice de valori proprii generalizate 17 fapt indus de posibilitatea 

unor partiţii de forma (6.74) unde, de data aceasta, S este în formă Schur reală. 

Ţinând seama de cele de mai sus, un subspaţiu de deflaţie al unui fascicol (A,B) 

este complet definit de un set de valori proprii generalizate, iar calculul său (i.e. 

calculul unei baze ortogonale) se reduce, în definitiv, la obţinerea unei forme Schur 

generalizate (S,T) = (Q H AZ,Q H BZ) în care setul de valori proprii precizat coincide 

cu spectrul de valori proprii al subfascicolului lider principal de dimensiune 

corespunzătoare. O dată obţinută această formă Schur, baza căutată este dată de 

primele coloane ale matricei Z. Prin urmare, după aplicarea algoritmului QZ şi 

obţinerea unei prime forme Schur, în care perechile diagonale nu au o ordine predeterminată, 

calculul unui subspaţiu de deflaţie se reduce la ordonarea perechilor 

diagonale (i.e. aducerea în primele poziţii diagonale a valorilor proprii vizate), prin 

transformări unitare de echivalenţă, şi actualizarea matricei de transformare Z. 

La fel ca în cazul valorilor proprii ordinare, mecanismul de ordonare a formei 

Schur generalizate se va baza pe procedurile de permutare a doua perechi (de 

blocuri, în cazul real) diagonale adiacente. 

6.4.1 Ordonarea formei Schur generalizate (complexe) 

Vom considera mai întâi cazul complex. Fie un fascicol matriceal de ordinul doi 

(S,T) ∈ IC 2×2 ×IC 2×2 în formă Schur generalizată cu valorile proprii distincte, i.e. 

17 Reamintim că prin set simetric înţelegem o mulţime numerică în care elementele complexe 

apar în perechi complex conjugate.


s 11 t 22 ≠ s 22 t 11 . Continuând analogia cu problema valorilor proprii ordinare, fie 

x 2 un vector propriu generalizat unitar al fascicolului (S,T) asociat valorii proprii 

λ 2 = (s 22 ,t 22 ), i.e. un vector care satisface condiţiile 

t 22 Sx 2 = s 22 Tx 2 , x 2 ≠ 0. (6.78) 

De asemenea, fie w ∈ IC 2 un vector ortogonal cu x 2 şi matricea unitară de transformare 

Z = [x 2 w]. Concret, vectorul propriu generalizat din (6.78) are expresia 

[ ] 

s22 t 

x 2 = ρy, cu y = 12 −s 12 t 22 

, (6.79) 

s 11 t 22 −s 22 t 11 

unde ρ ∈ IR este un factor scalar de normare, iar matricea unitară Z poate fi rotaţia 

(complexă) care realizează (Z H y)(2) = 0. 

Dacă Q ∈ IC 2×2 este o matrice unitară astfel încât 

(Q H SZ)(2,1) = 0 sau (Q H TZ)(2,1) = 0, (6.80) 

atunci obţinem (exerciţiu pentru cititor) 

S ′ = Q H SZ = 

[ ] 

s22 × 

, T = Q 

0 s H TZ = 

11 

[ ] 

t22 × 

, (6.81) 

0 t 11 

unde cu × s-au notat elementele lipsite de semnificaţie. S-a realizat astfel permutarea 

celor două valori proprii generalizate. Alegerea uneia din cele două alternative 

de calcul a matricei Q se face din considerente de asigurare a unei stabilităţi 

numerice maxime a algoritmului de ordonare. În [VI] se arată că decizia trebuie 

luată în raport cu modulele elementelor s 22 şi t 22 . Dacă |s 22 | ≥ |t 22 |, atunci Q va fi 

rotaţia care anulează al doilea element al primei coloane a matricei SZ, iar în caz 

contrar rotaţia care anulează al doilea element al primei coloane a matricei TZ. 

Pentru un fascicol de ordinul n, permutarea valorilor proprii adiacente (s kk ,t kk ) 

şi (s k+1,k+1 ,t k+1,k+1 ) ale formei Schur generalizate (S,T) ∈ IC n×n ×IC n×n se realizează 

folosind transformarea unitară de echivalenţă (S ′ ,T ′ ) = (Q H SZ,Q H TZ) cu 

Q = diag(I k−1 , ˜Q,I n−k−1 ), Z = diag(I k−1 , ˜Z,I n−k−1 ), (6.82) 

unde transformarea definită de matricele de ordinul doi ˜Q şi ˜Z asigură permutarea 

valorilor proprii ale perechii (S(k : k +1,k : k +1),T(k : k +1,k : k +1)). 

Rezumând cele prezentate mai sus, rezultă următoarea schemă de calcul: 

PG11c 1. Dacă s kk t k+1,k+1 ≠ s k+1,k+1 t kk [ atunci 

] 

sk+1,k+1 t 

1. Se calculează vectorul y = k,k+1 −s k,k+1 t k+1,k+1 

s kk t k+1,k+1 −s k+1,k+1 t kk 

2. Se calculează rotaţia Z 12 astfel încât (Z12y)(2) H = 0 

3. S ← Sdiag(I k−1 ,Z 12 ,I n−k−1 ) 

4. T ← T diag(I k−1 ,Z 12 ,I n−k−1 ) 

5. Z ← Zdiag(I k−1 ,Z 12 ,I n−k−1 ) 

6. Dacă |t k+1,k+1 | ≥ |s k+1,k+1 | atunci y = S(k : k +1,k) 

altfel y = T(k : k +1,k)


7. Se calculează rotaţia Q 12 astfel încât (Q H 12 y)(2) = 0 

8. S ← diag(I k−1 ,Q H 12 ,I n−k−1)S 

9. T ← diag(I k−1 ,Q H 12,I n−k−1 )T 

10. Q ← Qdiag(I k−1 ,Q 12 ,I n−k−1 ) 

iar algoritmul corespunzător, bazat pe utilizarea procedurilor devenite familiare 

pentru cititor, este 

Algoritmul 6.10 (PG11c – Permutarea a două valori proprii generalizate 

adiacente) (Date o pereche (S,T) ∈ IC n×n ×IC n×n în formă 

Schur generalizată, matricele unitare Q,Z∈IC n×n şi întregul k∈1:n−1, 

algoritmul suprascrie perechea de matrice (S,T) cu perechea (S ′ ,T ′ ) = 

= (˜Q H S ˜Z, ˜Q H T ˜Z) care realizează permutarea valorilor proprii generalizate 

definite de perechile (s kk ,t kk ), (s k+1,k+1 ,t k+1,k+1 ) şi actualizează 

matricele de transformare Q şi Z.) 

1. Dacă s kk t k+1,k+1 ≠ s k+1,k+1 t kk atunci 

[ ] 

sk+1,k+1 t 

1. y = k,k+1 −s k,k+1 t k+1,k+1 

s kk t k+1,k+1 −s k+1,k+1 t kk 

2. [y,c,s] = Gc(y) 

3. S(1 : k +1,k : k +1) = Gcd(S(1 : k +1,k : k +1),c,s) 

4. T(1 : k +1,k : k +1) = Gcd(T(1 : k +1,k : k +1),c,s) 

5. Z(:,k : k +1) = Gcd(Z(:,k : k +1),c,s) 

6. Dacă |t k+1,k+1 | ≥ |s k+1,k+1 | atunci 

1. y = S(k : k +1) 

altfel 

1. y = T(k : k +1,k) 

7. [y,c,s] = Gc(y) 

8. S(k : k +1,k +1 : n) = Gcs(c,s,S(k : k +1,k +1 : n)) 

9. s k+1,k = 0 % zeroul calculat este setat efectiv 

10. T(k : k +1,k : n) = Gcs(c,s,T(k : k +1,k : n)) 

11. t k+1,k = 0 % zeroul calculat este setat efectiv 

12. Q(:,k : k +1) = Gcd(Q(:,k : k +1,c,s)) 


[S,T,Q,Z] = PG11c(S,T,Q,Z,k). 

Complexitatea unei permutări a două valori proprii generalizate vecine este 24n 

fiind independentă de k. 

✸ 

Din momentul în care dispunem de procedura de permutare a două valori proprii 

învecinate, algoritmulpropriu-zisde ordonarea formei Schur generalizate(complexe) 

se reduce, în esenţă, la un algoritm de sortare al unei mulţimi ordonate bazat 

pe interschimbarea elementelor adiacente. Procedând ca în cazul formei Schur ordinare, 

prezentăm o variantă care dispune valorile proprii ale unei forme Schur


generalizate (S,T) ale fascicolului (A,B) în ordinea impusă de permutarea dată 

π = {i 1 ,i 2 ,...,i n } în sensul că perechea diagonală aflată iniţial în poziţia (k,k) va 

fi plasată în final în poziţia (i k ,i k ) (vezi şi comentariul la algoritmul ce urmează). 

Prin actualizarea matricei unitare de transformare Z se calculează şi baze ortogonale 

pentru subspaţiile de deflaţie asociate unor grupuri impuse de valori proprii 

generalizate. Concret, coloanele matricei actualizate Z(:,1 : k) formează o bază 

ortogonală a subspaţiului de deflaţie S k asociat setului de valori proprii Λ k = 

= {λ i = (s ii ,t ii )|i = 1 : k}} (în numerotarea finală). Actualizarea matricei 

unitare de transformare Q nu este necesară. Dacă se efectuează totuşi, atunci 

coloanele matricei actualizate Q(:,1:k) formează o bază ortogonală a subspaţiului 

V k = AS k +BS k în situaţia în care dimV k = dimS k = k. 

Algoritmul 6.11 (FSG ORD – Ordonarea formei Schur generalizate 

(complexe)) (Date o pereche (S,T) ∈ IC n×n × IC n×n în formă 

Schur generalizată, matricele unitare Q,Z ∈ IC n×n şi permutarea π = 

= {i 1 ,i 2 ,...,i n }, algoritmul suprascrie perechea (S,T) cu perechea unitar 

echivalentă (S ′ ,T ′ ) = (˜Q H S ˜Z, ˜Q H T ˜Z) care are (s ′ i k ,i k 

,t ′ i k ,i k 

) = 

= (s kk ,t kk ), k = 1 : n şi actualizează matricele de transformare Q 

şi Z.) 

1. Pentru k = 1 : (n−1) 


2. l = k 

3. Pentru j = (k +1) : n 


1. l = j 

2. mută=’da’ 


1. Pentru j = (l−1) : −1 : k 

1. [S,T,Q,Z] = PG11c(S,T,Q,Z,j) 

2. i j ↔ i j+1 

Comentarii. Sintaxa naturală de apel a algoritmului prezentat este 

[S,T,Q,Z] = FSG ORD(S,T,Q,Z,π). 

Complexitatea unei ordonări este dictată esenţial de natura permutării. Cazurile 

limită sunt permutarea identică pentru care nu se face nici o operaţie aritmetică şi 

inversiunea pentru care se efectuează 1 2n(n−1) apelări ale procedurii PG11c care 

conduc la o complexitate de O(n 3 ). 

Algoritmul de mai sus realizează o ordonare totală a perechilor diagonale. Dacă 

se urmăreşte exclusiv construcţia unei baze unitare pentru un subspaţiu de deflaţie 

k-dimensional (k < n) este suficientă o ordonare parţială constând în aducerea, pe 

căile cele mai ”scurte”, a valorilor proprii generalizate vizate în primele k poziţii diagonale. 

De asemenea, se renunţă la actualizarea matricei Q. Propunem cititorului 

o astfel de adaptare a algoritmului.


De multe ori este mai comod ca în locul permutării π să utilizăm permutarea 

inversă σ = π −1 = {j 1 ,j 2 ,...,j n }. În acest caz, algoritmul suprascrie perechea 

(S,T) cu perechea unitar echivalentă (S,T) ← (S ′ ,T ′ ) = (˜Q H S ˜Z, ˜Q H T ˜Z) care are 

(s ′ kk ,t′ kk ) = (s j k ,j k 

,t jk ,j k 

) şi o variantă a sa arată astfel. 

1. Pentru k = 1 : n−1 

1. Dacă k ≠ j k atunci 

1. Pentru i = (j k −1) : −1 : k 

1. [S,T,Q,Z] = PG11c(S,T,Q,Z,i) 

2. Pentru i = (k +1) : n 

1. Dacă j i < j k atunci j i = j i +1. 

După execuţia acestui algoritm coloanele matricei actualizate Z(:,1:k) formează 

o bază ortogonală a subspaţiului de deflaţie S k asociat setului de valori proprii 

Λ k = {λ i = (s ii ,t ii )|i ∈ {j 1 ,j 2 ,...,j k }} (în numerotarea iniţială). ✸ 

6.4.2 Ordonarea formei Schur reale generalizate 

În cazul real forma Schur generalizată (S,T) ∈ IR n×n ×IR n×n a fascicolului definit 

de (A,B) ∈ IR n×n × IR n×n are matricea S în formă Schur reală, iar matricea T 

superior triunghiulară. Vom considera partiţiile bloc ale matricelor S şi T dictate 

de dimensiunile l k ×l k cu l k ∈ {1,2}, k = 1 : p, ale blocurilor diagonale ale lui S: 

⎡ ⎤ ⎡ ⎤ 

S 11 S 12 ··· S 1p T 11 T 12 ··· T 1p 

0 S 22 ··· S 1p 

S = ⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ , T = 0 T 22 ··· T 1p 

⎢ 

⎣ 

. 

. . .. 

⎥ 

. ⎦ . (6.83) 

0 0 ··· S pp 0 0 ··· T pp 

Problema calculului subspaţiilor de deflaţie reale asociate unor seturi simetrice de 

valoripropriigeneralizaterevinelaordonareacorespunzătoareablocurilordiagonale 

ale formei Schur reale generalizate. În acest scop este necesar să ştim să permutăm 

două perechi de blocuri adiacente. Permutarea a două perechi de blocuri vecine 

1 × 1 se face cu algoritmul PG11c cu singura menţiune că toate transformările 

utilizatesuntreale(cureducereacorespunzătoareanumăruluideoperaţii). Întrucât 

scrierea variantei reale a algoritmului se rezumă la înlocuirea siglei c cu sigla r în 

identificatorii procedurilor, ne mărginim să introducem sintaxa de utilizare 

[S,T,Q,Z] = PG11r(S,T,Q,Z,k). 

Rămânesăarătămcumsepotpermuta, printransformăriortogonaledeechivalenţă, 

două perechi de blocuri diagonale vecine din care cel puţin una din perechi are 

blocurile de ordinul 2. 

Considerăm acum perechea de matrice de ordin 3 sau 4, partiţionate identic, 

S = 

[ ] 

S11 S 12 

, T = 

0 S 22 

[ 

T11 T 12 

0 T 22 

] 

, (6.84)


unde, prin urmare, cel puţin unul din blocurile diagonale S 11 (T 11 ), S 22 (T 22 ) este 

2×2. În principiu, putem aplica ideile utilizate la elaborarea algoritmului PG11 

i.e. calculul unei baze ortogonale a subspaţiului de deflaţie asociat valorilor proprii 

generalizate ale perechii (S 22 ,T 22 ) şi aplicarea propoziţiei 6.2. Propunem cititorului 

implementarea acestor idei. Aici vom urma o cale echivalentă care utilizează 

algoritmul QZ cu deplasare implicită. Având în vedere faptul că perechea (S,T) 

din (6.84) este deja în formă Schur reală generalizată rezultă că putem determina 

deplasarea (în formă implicită) exactă care, utilizată în algoritmul QZ2 pune în 

evidenţă, în poziţia (2,2) perechea cu valorile proprii dorite, în cazul nostru, în 

vederea permutării, cu valorile proprii ale perechii (S 11 ,T 11 ). Cunoaşterea exactă a 

deplasării face ca, teoretic, să fie suficientă o singură iteraţie QZ pentru obţinerea 

rezultatului dorit. În practică, dacă nivelul de toleranţă practicat este de ordinul 

de mărime al erorilor de rotunjire, este posibil să fie necesare câteva (două-trei) 

iteraţii pentru a putea considera elementele blocului 21 neglijabile. De asemenea, 

întrucât algoritmul QZ2 cu deplasări implicite efectuează calculele aferente unei 

iteraţii numai asupra perechilor în formă Hessenberg generalizată ireductibilă este 

necesar mai întâi un pas QZ artificial care să altereze structura Schur reală generalizată 

a perechii (S,T). În consecinţă, toate cele trei tipuri de permutare se vor 

supune următoarei scheme de calcul. 

PGkl 

1. Se determină elementele definitorii exacte pentru vectorul w de deplasare 

implicită (i.e. valoarea proprie generalizată dacă prima pereche de blocuri 

este 1×1, respectiv suma s şi produsul p ale valorilor proprii generalizate 

în cazul când prima pereche de blocuri este 2×2). 

2. Se execută un pas QZ cu un vector de deplasare implicită fixat aleator 

(e.g. alegerea w = [1 1 1] T dă bune rezultate). 

3. Se aplică algoritmul QZ cu deplasarea implicită exactă (i.e. calculată cu 

elementele de la punctul 1). 

Pentru fascicolul de ordinul n (6.82), permutarea blocurilor adiacente (S kk ,T kk ) 

şi (S k+1,k+1 ,T k+1,k+1 ) ale formei Schur reale generalizate (S,T) ∈ IR n×n ×IR n×n se 

obţine folosind transformarea ortogonală de echivalenţă (S ′ ,T ′ ) = (Q T SZ,Q T TZ) 

definită de 

Q = diag(I r , ˜Q,I s ), Z = diag(I r , ˜Z,I s ), (6.85) 

unde transformarea definită de matricele ˜Q şi ˜Z, de ordinul 2, 3 sau 4, asigură 

permutarea blocurilor diagonale ale perechii 

[ ] [ ] 

Skk S ˜S = k,k+1 Tkk T 

, ˜T = k,k+1 

, (6.86) 

0 S k+1,k+1 0 T k+1,k+1 

şi unde r este ordinul cumulat al blocurilor diagonale 1 : (k −1), iar s este ordinul 

cumulat al blocurilor diagonale (k +2) : p. 

Vomimplementaschemadecalculdemaisus într-unalgoritmcarevatratatoate 

cazurile. Pentru aceasta vom utiliza rezultatele stabilite şi procedurile elaborate în 

acest capitol. Pentru o înţelegere mai lesnicioasă a algoritmului facem următoarele 

precizări:


– pentru relaţiile de calcul al vectorilor de deplasare implicită (exactă) recomandăm 

consultarea algoritmilor Vd1 şi Vd2; 

– pentru o prezentare mai clară a algoritmulor, actualizarea blocurilor nediagonale 

de pe bloc-liniile şi bloc-coloanele afectate în etapa curentă, conform relaţiei 

(6.85), se va face utilizând matricele de transformare locală ˜Q şi ˜Z în formă nefactorizată. 

Obţinem următorul algoritm. 

Algoritmul 6.12 (PGr – Permutarea a două perechi diagonale adiacente) 

(Date o pereche (S,T) ∈ IR n×n × IR n×n în formă Schur reală 

generalizată, întregull carereprezintândpoziţiadiagonalăaelementului 

11 al primului bloc diagonal şi ordinele i ş j ale celor două blocuri diagonale 

adiacente precum ş toleranţa tol pentru neglijarea elementelor subdiagonale, 

algoritmul suprascrie perechea (S,T) cu perechea (S ′ ,T ′ ) = 

= (˜Q T S ˜Z, ˜Q T T ˜Z), realizând permutarea perechii de blocuri diagonale 

(S kk ,T kk ) cu perechea de blocuri diagonale (S k+1,k+1 ,T k+1,k+1 ). De 

asemenea, se actualizează matricele de transformare Q şi Z.) 

1. % Cazul a două perechi de blocuri 1×1 

Dacă i = 1 şi j = 1 atunci 

1. [S,T,Q,Z] = PG11r(S,T,Q,Z,l) 

2. Return 

2. % Cazul perechilor de blocuri 1×1, 2×2 

Dacă i = 1 şi j = 2 atunci 

1. q = l+2 

2. µ = s ql,l 

t l,l 

3. w = [1 1 1] T 

4. [S(l : q,l : q),T(l : q,l : q), ˜Q, ˜Z] = 

= IT QZ2(S(l : q,l : q),T(l : q,l : q),I 3 ,I 3 ,w, ′ da ′ ) 

5. Cât timp |s l+2,l+1 | ≥ tol(|s l+1,l+1 |+|s l+2,l+2 |) 

1. w exact = [ s l,l 

−µ s l+1,l 

0 ] T 

t l,l t l,l 

2. [S(l : q,l : q),T(l : q,l : q), ˜Q, ˜Z] = 

= IT QZ2(S(l : q,l : q),T(l : q,l : q), ˜Q, ˜Z,w exact , ′ da ′ ) 

6. S(l+2,l+1)= 0 % anularea efectivă a elementului neglijabil 

7. Dacă l > 1 atunci 

1. S(1 : l−1,l : q) = S(1 : l−1,l : q)˜Z 

2. T(1 : l−1,l : q) = T(1 : l−1,l : q)˜Z 

8. Dacă l < n−2 atunci 

1. S(l : q,q +1 : n) = ˜Q T S(l : q,q +1 : n) 

2. T(l : q,q +1 : n) = ˜Q T T(l : q,q +1 : n) 

9. Q(:,l : q) = Q(:,l : q)˜Q 

10. Z(:,l : q) = Z(:,l : q)˜Z


11. Return 

3. % Cazul primei perechi de blocuri 2×2 

Dacă i = 2 şi j < 3 atunci 

1. q = l+i+j −1 

2. σ = s l+1,l+1t l,l +s l,l t l+1,l+1 −s l+1,l t l,l+1 

t l,l t l+1,l+1 

3. π = s l,ls l+1,l+1 −s l+1,l s l,l+1 

t l,l t l+1,l+1 

4. w = [1 1 1] T 

5. [S(l : q,l : q),T(l : q,l : q), ˜Q, ˜Z] = 

= IT QZ2(S(l : q,l : q),T(l : q,l : q),I q−l+1 ,I q−l+1 ,w, ′ da ′ ) 

6. r = l+j 

7. Cât timp |s r,r−1 | ≥ tol(|s r−1,r−1 |+|s r,r |) 

1. α = s ll 

, β = s l+1,l+1 

, γ = s l+1,l 

, 

t ll t l+1,l+1 t ll 

γ 

δ = , η = α−δt l,l+1 −σ. 

t l+1,l+1 

⎡ 

2. w exact = ⎣ αη +δs ⎤ 

l,l+1 +π 

γ(β +η) ⎦ 

δs l+2,l+1 

3. [S(l : q,l : q),T(l : q,l : q), ˜Q, ˜Z] = 

= IT QZ2(S(l : q,l : q),T(l : q,l : q), ˜Q, ˜Z,w exact , ′ da ′ ) 

8. S(r,r−1) = 0 % anularea efectivă a elementului neglijabil 

9. Dacă l > 1 atunci 

1. S(1 : l−1,l : q) = S(1 : l−1,l : q)˜Z 

2. T(1 : l−1,l : q) = T(1 : l−1,l : q)˜Z 

10. Dacă q < n atunci 

1. S(l : q,q +1 : n) = ˜Q T S(l : q,q +1 : n) 

2. T(l : q,q +1 : n) = ˜Q T T(l : q,q +1 : n) 

11. Q(:,l : q) = Q(:,l : q)˜Q 

12. Z(:,l : q) = Z(:,l : q)˜Z 


[S,T,Q,Z] = PGr(S,T,Q,Z,l,i,j,tol). 

Complexitatea unei permutări a două perechi de blocuri adiacente este O(n), fiind 

practic independentă de poziţia lor, dar dependentă de dimensiunile blocurilor diagonale 

ale matricii S. 

✸ 

Cu această procedură de permutare a două perechi adiacente algoritmul de ordonare 

a formei Schur reale generalizate este, în esenţă, identic cu cel de ordonare 

a formei Schur complexe generalizate şi este prezentat în continuare. Facem şi aici, 

pentru o înţelegere mai comodă a algoritmului, următoarele precizări:


– structura (i.e. ordinul) blocurilor diagonale ale matricei S a FSRG va fi memorată 

în vectorul strbl; 

– pentru localizarea blocurilor diagonale ale matricei S a FSRG vom utiliza 

vectorul lcbl care va conţine poziţiile elementelor (1,1) ale acestora; 

– pentru a simplifica la maxim monitorizarea elementelor nule de pe subdiagonala 

matricei S, nu vom apela formal la algoritmul QZ2 ci vom adopta ideile 

acestuia la situaţa structurală concretă. 

Se obţine următorul algoritm. 

Algoritmul 6.13 (FSRG ORD – Ordonarea formei Schur reale 

generalizate) (Date o pereche (S,T) ∈ IR n×n ×IR n×n în formă Schur generalizată 

(6.83), cu T nesingulară, matricele ortogonale Q,Z ∈ IR n×n , 

permutarea π = {i 1 ,i 2 ,...,i p } şi toleranţa tol pentru neglijarea elementelor 

subdiagonale, algoritmul suprascrie perechea (S,T) cu perechea 

ortogonal echivalentă (S ′ ,T ′ ) = (˜Q T S ˜Z, ˜Q T T ˜Z) având (S i ′ k i k 

,T i ′ 

k i k 

) = 

(S kk ,T kk ) şi actualizează matricele ortogonale de transformare Q şi Z.) 

1. % Determinarea numărului, a structurii şi localizării blocurilor diagonale 

ale matricei S. 

1. p = 0, j = 1 

2. Cât timp j < n 

1. p ← p+1 

2. Dacă s j+1,j = 0 atunci 

1. strbl(p) = 1 

2. j ← j +1 

3. Dacă j = n atunci 

1. p ← p+1 

2. strbl(p) = 1 

altfel 

1. strbl(p) = 2 

2. j ← j +2 

2. Pentru k = 1 : (p−1) 


2. l = k 

3. Pentru j = (k +1) : p 


1. l = j 



1. Pentru j = (l−1) : −1 : k 

1. lcbl(1) = 1 


1. lcbl(i) = lcbl(i−1)+strbl(i−1)


3. [S,T,Q,Z] = 

= PGr(S,T,Q,Z,lcbl(j),strbl(j),strbl(j +1),tol) 

4. i j ↔ i j+1 

5. strbl(j) ↔ strbl(j +1) 

Comentarii. Sintaxa de apel a algoritmului de mai sus este 

[S,T,Q,Z] = FSRG ORD(S,T,Q,Z,π,tol). 

La fel ca în cazul complex, volumul de calcul necesar pentru ordonare este dictată 

esenţial de natura permutării. Cazul cel mai defavorabil apare când permutarea 

este o inversiune şi toate blocurile sunt 2×2 şi are o complexitate de O(n 3 ). 

Şi aici, dacă se urmăreşte exclusiv construcţia unei baze unitare pentru un 

subspaţiu de deflaţie asociat unui set simetric de valori proprii generalizate definite 

de k blocuri diagonale (k < p), este suficientă o ordonare parţială. Se recomandă, 

de asemenea, renunţarea la actualizarea matricei Q. 

Încazul încaresepreferăutilizareapermutăriiinverseσ = π −1 = {j 1 ,j 2 ,...,j p } 

se poate utiliza o schemă de calcul similară cu cea prezentată în comentariile la 

algoritmul 6.10. Scrierea explicită a acestei variante de algoritm de ordonare este 

propusă cititorului. 

✸ 

6.5 Condiţionarea valorilor proprii generalizate 

şi a vectorilor proprii generalizaţi 

Sensibilitatea valorilor proprii generalizate la variaţii în datele iniţiale, sau altfel 

spus condiţionarea lor numerică, se poate aprecia foarte uşor în forma Schur generalizată. 

În ipotezaplauzibilăcăformaSchurgeneralizată(S,T)estepuţin sensibilă 

la perturbaţii în elementele matricelor perechii (A,B) rezultă că o valoare proprie 

generalizată λ i = s ii /t ii este cu atât mai rău condiţionată cu cât t ii este mai mic. 

Totuşi, dacă privim valorile proprii generalizate ca perechi (s ii ,t ii ), fără să considerăm 

necesară efectuarea împărţirii, această afirmaţie nu mai poate fi susţinută. 

Din acest motiv, în apreciereacondiţionării numerice a valorilor proprii generalizate 

se recomandă o tratare simetrică a perechii (A,B) în sensul că trebuie considerate 

simultan ambele fascicole F = A − λB şi G = B − λA. Unei valori proprii rău 

condiţionate a fascicolului F îi corespunde o valoare proprie inversă a lui G care 

poatefifoartebinecondiţionată. De aceeea, în[VI], pentru apreciereacondiţionării 

valorilor proprii generalizate se propune utilizarea metricii cordale definită pentru 

IR prin distanţa 18 |α−β| 

chord(α,β) = √ √ ∀α,β ∈ IR. 

1+α 

2 

1+β2, 18 Distanţei cordale i se pot da următoarele interpretări. 

1. Fie θ α = arctgα şi θ β = arctgβ. Atunci, este uşor de arătat că chord(α,β) = |sin(θ α −θ β )|. 

Prin urmare, printre altele, 0 ≤ chord(α,β) < 1. 

2. În cazul complex, dacă πα, π β sunt proiecţiile lui α, respectiv β pe sfera Riemann, atunci 

chord(α,β) este jumătate din distanţa euclidiană (i.e. lungimea coardei) dintre cele două proiecţii.

6.6. STABILITATEA ALGORITMULUI QZ 497 

Se poate arăta că dacă λ este o valoare proprie generalizată distinctă a fascicolului 

F şi ˆλ este valoarea proprie generalizată corespunzătoare a fascicolului perturbat 

ˆF = Â−λˆB cu ‖Â−A‖ 2 ≈ ‖ˆB −B‖ 2 

≈ ε, atunci 

chord(λ,ˆλ) ≤ 

ε 

(y H Ax) 2 +(y H Bx) 2 +O(ε2 ), 

undex,y ∈ IC n suntvectoripropriigeneralizaţiunitariladreapta,respectivlastânga 

ai fascicolului F, i.e. satisfac Ax = λBx, y H A = λy H B şi ‖x‖ = ‖y‖ = 1. Prin 

urmare, condiţionarea unei valori proprii generalizate individuale poate fi apreciată 

cu numărul 

1 

κ λ = 

(y H Ax) 2 +(y H Bx) 2. 

Din expresia de mai sus rezultă că se pot considera rău condiţionate numeric numai 

acele valori proprii generalizate pentru care expresia de la numitor (simetrică în 

raport cu A şi B) este mică. Situaţii de acest fel apar, de exemplu, când fascicolul 

F este ”apropiat” de un fascicol singular, i.e. în forma Schur generalizată există 

(cel puţin) o pereche (s ii ,t ii ) cu ambele valori foarte mici. În mod natural, într-un 

astfel de caz celelalte perechi (s ii ,t ii ) pot varia în limite foarte largi. (Amintim 

că dacă fascicolul este singular, i.e. există (s ii ,t ii ) = (0,0), atunci orice număr 

complex este valoare proprie generalizată a fascicolului iniţial ceea ce înseamnă că 

celelalte perechi diagonale ale formei Schur generalizate pot lua orice valori.) 

În ceea ce priveşte condiţionarea vectorilor proprii generalizaţi, aceasta este 

dependentă în bună măsură de separarea valorii proprii generalizate asociate de 

celelalte valori proprii. În aplicaţii, în general, se evită calculul vectorilor proprii 

generalizaţi, aceştia putând fi înlocuiţi cu succes de coloanele matricelor de transformare. 

6.6 Stabilitatea numerică a algoritmului QZ 

Aşa cum s-a mai menţionat şi în comentariile diverşilor algoritmi parţiali, utilizarea 

consecventă a transformărilor unitare (în cazul real, ortogonale) conferă procesului 

de calcul al formei Schur generalizate o foarte bună stabilitate numerică. În literatura 

de specialitate se arată că forma Schur generalizată calculată (Ŝ, ˆT), cu algoritmul 

QZ, a unei perechi de matrice (A,B) este forma Schur generalizată exactă 

a perechii (A,B) uşor perturbate, i.e. satisface relaţia 

(Ŝ, ˆT) = (ˆQ H (A+E)Ẑ, ˆQ H (B +F)Ẑ), 

unde E şi F sunt matrice de perturbaţie ce satisfac inegalităţile 

‖E‖ ≤ p(n)‖A‖ε M , ‖F‖ ≤ p(n)‖B‖ε M , 

iar ˆQ şi Ẑ sunt două matrice riguros unitare. În relaţiile de mai sus, p(n) este 

apreciat drept o funcţie cu o creştere ”modestă” de dimensiunea n a problemei, 

termen folosit curent pentru funcţii polinomiale de gradul 1, cel mult 2. 

În concluzie, valorile proprii generalizate bine condiţionate se calculează cu o 

înaltă acurateţe.



LAPACK. Calculul valorilor şi vectorilor proprii generalizaţi ai unei perechi de 

matrice (A,B) este efectuat în LAPACK de două rutine driver: 

1. xGEGS calculează forma Schur generalizată a perechii (A,B) şi eventual vectorii 

Schur, folosind algoritmul QZ. 

2. xGEGV calculează valorile şi eventual vectorii proprii generalizaţi ai perechii 

(A,B). 

Principalele rutinele de calcul implementează cele două faze ale algoritmului 

QZ; să notăm abrevierile utilizate pentru diverse tipuri de matrice interesante în 

această problemă: GG – pereche de matrice generale, HG – pereche în forma Hessenberg 

generalizată, TG – pereche în forma Schur generalizată. 

• xGGHRD realizează reducerea unei perechi generale (A,B) la forma Hessenberg 

generalizată (H,T) prin transformări de asemănare ortogonale. 

• xHGEQZ implementează faza iterativă a algoritmului QZ, transformând perechea 

(H,T) în forma Schur generalizată, cu acumularea opţională a transformărilor 

(şi deci obţinerea vectorilor Schur). 

Vectorii proprii generalizaţi ai unei perechi în formă Schur (A,B) sunt calculaţi 

de rutina xTGEVC. Aceeaşi rutină poate calcula vectorii proprii generalizaţi ai perechiiiniţiale(A,B), 

dacăprimeştecaargumentedeintrarevectoriiSchurgeneralizaţi 

calculaţi de rutinele de mai sus. 

Rutina xGGBAL realizează scalarea (echilibrarea) perechii (A,B). Alte rutine, 

similare cu cele pentru valori proprii, sunt actualmente în curs de elaborare. 

MATLAB. Valorile şi vectorii proprii generalizaţi ai unei perechi (A,B) pot 

fi calculate cu aceeaşi funcţie ca valorile proprii (diferenţa e făcută de numărul 

argumentelor de intrare): 

[V, D] = eig(A, B) 

V fiind matricea vectorilor proprii generalizaţi, iar D o matrice diagonală conţinând 

valorile proprii generalizate (astfel încât AV = BVD). Apelul simplu eig(A,B) 

returneazăun vectorconţinândvalorilepropriigeneralizate. Funcţiaimplementează 

algoritmul QZ. 

6.8 Probleme 

P 6.1 Se consideră fascicolul matriceal F = A−λB, unde 

[ ] 2 4 5 

[ 1 1 1 

A = 2 5 8 , B = 1 α 2 

2 3 2 1 2−α β 

] 

,


cu α, β parametri reali. 

a) Discutaţi în raport cu α, β numărul valorilor proprii generalizate finite ale fascicolului 

F. 

b) Dacă F este un fascicol regulat calculaţi un vector propriu generalizat x al fascicolului 

F independent de α, β; determinaţi parametrii α, β astfel încât x T Bx = 0 şi B 

este nesingulară. 

c) În cazul α = 2, β = 1, calculaţi o bază ortonormală pentru un subspaţiu de deflaţie 

de dimensiune 2 al fascicolului F în IR 3 . 

[ ] 

P 6.2 Considerăm perechea (A,B) ∈ IR n×n ×IR n×n şi fie U T Σ1 0 

BV = Σ cu Σ = , 

0 0 

Σ 1 = diag(σ 1,σ 2,···,σ r) şi r = rang(B) ≥ 1 descompunerea valorilor singulare a matricei 

B. Arătaţi că dacă fascicolul A − λB nu are nici o valoare proprie generalizată finită, 

atunci matricea (U(:,r +1 : n)) T AV(:,r+1 : n) este singulară. 

P 6.3 Ce proprietăţi au valorile proprii generalizate ale unei perechi (A,B) ∈ IC n×n × 

×IC n×n cu matricele A şi B unitare (în cazul real, ortogonale) 

P 6.4 Fie perechea (A,B) ∈ IC n×n ×IC n×n cu B nesingulară. Să se arate că λ ∈ λ(A,B) 

dacă şi numai dacă λ−µ ∈ λ(B,B(A−µB) −1 B) pentru µ ∉ λ(A,B). 

P 6.5 Scrieţi un algoritm de reducere a unei perechi reale (A,B) ∈ IR n×n × IR n×n la 

forma Hessenberg generalizată prin transformări ortogonale de echivalenţă. 

P 6.6 Elaboraţi un algoritm care să calculeze iterativ un vector propriu generalizat al 

perechii (A,B) ∈ IC n×n ×IC n×n cu B nesingulară adaptând metoda puterii pentru matricea 

F = B −1 A sau matricea G = AB −1 fără a calcula explicit matricele F sau G. Aceeaşi 

cerinţă pentru adaptarea metodei puterii inverse. 

P 6.7 Fie dat un vector propriu generalizat x ∈ IC n al unui fascicol regulat definit de 

perechea (A,B) ∈ IC n×n × IC n×n . Să se arate că Bx ≠ 0 şi că funcţia f : IC → IR, 

f(λ) = 1 2 ‖Ax−λBx‖2 2 îşi atinge valoare minimă în valoarea proprie λ ∈ λ(A,B) asociată 

lui x dată de expresia λ = xH B H Ax 

x H B H Bx ∈ λ(A,B). 

P 6.8 Fie (H,T) ∈ IC n×n × IC n×n în formă Hessenberg generalizată cu T nesingulară. 

Arătaţi că matricea superior Hessenberg G = HT −1 este ireductibilă dacă şi numai dacă 

matricea H este ireductibilă. 

P 6.9 Sedăunfascicol real deordinul2definitdeperechea(H,T) ∈ IR 2×2 ×IR 2×2 înformă 

Hessenbergireductibilăcuvaloriproprii generalizate reale. Săse scrie unalgoritm decalcul 

al matricelor ortogonale Q,Z ∈ IR 2×2 astfel încât perechea ( ˜H, ˜T) = (Q T HZ,Q T TZ) să 

fie în formă Schur. 

P 6.10 Fie perechea (A,B) ∈ IR n×n × IR n×n cu A, B simetrice şi, în plus, B pozitiv 

definită. Să se arate că toate valorile proprii generalizate ale perechii (A,B) sunt reale. 

Este adevărată această aserţiune şi dacă B nu este pozitiv definită 

Elaboraţi un algoritm de calcul al valorilor proprii generalizate ale fascicolului (A,B) 

care să exploateze simetria celor două matrice. 

P 6.11 Se dă o pereche (S,T) ∈ IR n×n ×IR n×n în formă Schur reală generalizată. Se cer 

algoritmii de calcul pentru


a) un vector propriu generalizat asociat valorii proprii generalizate reale distincte λ k = 

= s kk /t kk ; 

b) o pereche de vectori proprii generalizaţi complex conjugaţi asociaţi unei perechi de 

valori proprii generalizate complex conjugate date de o pereche diagonală 2×2 situată pe 

liniile şi coloanele (k,k +1). 

P 6.12 Se consideră dată o pereche (S,T) ∈ IC n×n × IC n×n în formă Schur generalizată 

având în poziţiile diagonale consecutive k, k + 1 o valoare proprie generalizată 

dublă λ k = s kk /t kk = λ k+1 = s k+1,k+1 /t k+1,k+1 . În ce condiţii există doi vectori proprii 

generalizaţi liniar independenţi asociaţi acestei valori proprii duble Considerând aceste 

condiţii îndeplinite, scrieţi un algoritm de calcul pentru calculul a doi astfel de vectori 

proprii.

Indicaţii, răspunsuri, soluţii 

Cap. 0. Concepte fundamentale ale calculului numeric 

P0.1 Rezultatul depinde de ordinea de calcul; avem y 1 = (x 1 + x 2) + x 3 = 0 şi 

y 2 = x 1 +(x 2 +x 3) = 0.001. Rezultatul exact este y 2 (eroare relativă egală cu 0). Pentru 

y 1, eroarea relativă este |0−0.001|/0.001 = 1 (adică 100%). 

P0.2 Rezultatul calculat este ŷ = fl(fl(x 1 +x 2)+x 3) = fl((x 1+x 2)(1+ρ 1)+x 3) = 

= [(x 1+x 2)(1+ρ 1)+x 3](1+ρ 2), cu |ρ 1|,|ρ 2| ≤ µβ −t , şi µ de ordinul unităţii. Rezultă că: 

|y −ŷ| 

|y| 

≤ 

( 

1+ 

) 

|x1 +x2| 

µβ −t . 

|x 1 +x 2 +x 3| 

P0.3 Presupunem că datele de intrare sunt afectate de erori, şi deci (a+∆a,b+∆b) 

este utilizat în loc de (a,b). Rezultatul va fi x+∆x. Din (x+∆x)(a+∆a) = (b+∆b), 

neglijând ∆a∆x, rezultă că ∆x/x = −∆a/a−∆b/b. Deci, problema este întotdeauna bine 

condiţionată (erori relative mici ale intrării implică erori relative mici ale ieşirii). 

Deoarece ˆx = fl(−b/a) = (−b/a)(1 + ρ) = −b(1 + ρ)/a = −ˆb/a, cu |ρ| ≤ µβ −t , 

algoritmul este numeric stabil. (ˆb este aproape de b). 

P0.4 Problema moşteneşte proasta condiţionare a sumei (de exemplu, când |a 1 +a 2| 

e mic şi |a 1|, |a 2| sunt mari). ”Algoritmul” x = −(b 1 +b 2)/(a 1 +a 2) este stabil. 

P0.5 Următorul număr în virgulă mobilă este x = 0.100...01·β 1 ; deci, x−1 = β −t+1 

(eroarea de reprezentare maximă pentru rotunjirea prin trunchiere). 

P0.6 ε r ≤ 0.5β −t+1 . 

P0.7 Varianta 1: (x⊗x)⊖(y ⊗y) = [x 2 (1+ρ 1)+y 2 (1+ρ 2)](1+ρ), cu ρ 1,ρ 2,ρ de 

ordinul erorii de reprezentare u. Atunci eroarea relativă 

ε r1 ≈ ρ+ ρ1x2 −ρ 2y 2 

x 2 −y 2 

poate fi mare atunci când x 2 şi y 2 au valori apropiate. 

Varianta 2: (x⊖y)⊗(x⊕y) = [(x−y)(1+σ 1)][(x+y)(1+σ 2)](1+σ), cu σ 1,σ 2,σ 

de ordinul de mărime al lui u. Eroarea relativă este acum (u 2 ≪ u) 

ε r2 ≈ σ 1 +σ 2 +σ ≤ 3u. 

Varianta 1 reprezintă un algoritm cu potenţiale instabilităţi numerice; varianta 2 este 

un algoritm stabil.

502 INDICAŢII, RĂSPUNSURI, SOLUŢII 

Cap. 1. Algoritmi elementari de calcul numeric 

P1.4 Pentru norma 1, un exemplu este x = e 1, y = e 2. Pentru norma ∞, putem lua 

x = e 1 + e 2 şi y = e 2. În norma 2, egalitatea este imposibilă pentru vectori necoliniari 

(suma lungimii a două laturi ale unui triunghi este mai mare decât lungimea celei de-a 

treia); la fel în normele p ≠ 1,∞. 

P1.5 Pentru n = 2, x = 

[ 

x1 

x 2 

] 

, y = 

[ 

y1 

y 2 

] 

, α = x 1y 1+x 2y 2. fl(x iy i) = x iy i(1+σ i), 

cu |σ i| ≤ ε M. Atunci ˆα = [x 1y 1(1 + σ 1) + x 2y 2(1 + σ 2)](1 + σ) şi eroarea absolută este 

|ˆα−α| = |x 1y 1σ 1 +x 2y 2σ 2 +O(ε M)| ≤ 2ε M|y| T |x|+O(ε M). 

P1.6 Deoarece dorim a T j a k+1 = 0, ∀j ∈ 1 : k, iar vectorii a 1, ..., a k sunt ortogonali, 

atunci 0 = a T j a k+1 = ∑ k 

α i=1 ika T j a i+a T j b k+1 = α jk a T j a j+a T j b k+1 şi deci scalarii α jk sunt 

unic determinaţi prin α jk = −(a T j b k+1 )/(‖a j‖ 2 2). 

P1.7 Coloanele (sau liniile) nenule ale matricei A sunt vectori coliniari. 

P1.8 Se calculează (AB)C sau A(BC) după cum n 1n 2n 3+n 1n 3n 4 mai mic, respectiv 

mai mare decât n 2n 3n 4 +n 1n 2n 4. 

P1.9 ‖A‖ 2 ≥ ‖Ae j‖ 2 = ( ∑ m 

l=1 a2 lj) 1/2 ≥ |a ij| pentru orice i, j. Pentru a doua parte, 

din (1.29) avem ‖A‖ 2 ≤ ‖A‖ F şi evident ‖A‖ F ≤ max √ mn|a ij|. 

P1.10 Din definiţia normei 2 avem 

( m 

) 1/2 

∑ n∑ 

‖A‖ 2 = max ‖Ax‖ 2 = max ( a ijx j) 2 . (7.1) 

‖x‖=1 ‖x‖=1 

Din inegalitatea Cauchy-Buniakowski-Schwarz, ţinând seama că ‖x‖ 2 = 1, avem 

( ∑ n 

j=1 aijxj)2 ≤ ∑ n 

j=1 a2 ij. Înlocuind în (7.1), este imediată inegalitatea ‖A‖2 ≤ ‖A‖F. 

Luând acum vectorul x cu componentele egale, x i = 1/ √ n, din (7.1) se obţine 

‖A‖ 2 ≥ (1/ √ n)‖A‖ F. 

Luând în (7.1) x = e j, se obţine ‖A‖ 2 ≥ (1/ √ m)‖A‖ 1. 

Pentruunvectorxoarecare suntîndepliniterelaţiile ‖x‖ 2 ≤ ‖x‖ 1 şi‖x‖ 2 ≥ (1/ √ n)‖x‖ 1. 

Atunci 

‖A‖ 2 = sup ‖Ax‖2 ‖Ax‖ 1 

≤ sup 

‖x‖ 2 (1/ √ = √ n‖A‖ 1. 

n)‖x‖ 1 

O matrice A cu toate elementele egale cu 1 are ‖A‖ F = ‖A‖ 2 = √ mn. O matrice 

B cu b 1j = 1 şi restul elementelor nule are ‖B‖ 2 = √ n, ‖B‖ 1 = 1 şi ‖B‖ ∞ = n, deci 

‖B‖ 2 = √ n‖B‖ 1 = (1/ √ n)‖B‖ ∞. 

P1.11 Dacă B ∈ IR p×r , fără a afecta generalitatea putem considera B = A(1 : p,1 : r). 

Fie C = A(1 : m,1 : r). Este evident că dacă Z este mulţimea vectorilor din IR n de normă 

unitate având ultimele n−r componente nule, atunci 

i=1 

j=1 

‖A‖ = max ‖Ax‖ ≥ max‖Az‖ = ‖C‖. 

‖x‖=1 z∈Z 

Pentru x ∈ IR r , notând y = Cx ∈ IR m şi y ′ = y(1 : p) = Bx, este evident că ‖y‖ ≥ ‖y ′ ‖, 

deci ‖C‖ ≥ ‖B‖. 

P1.12 Produsul scalar a doi vectori y, z de normă dată este maxim când vectorii sunt 

coliniari (vezidinnouinegalitatea Cauchy-Buniakowski-Schwarz)şi atunci|y T z| = ‖y‖‖z‖. 

Cu z = Ax şi definiţia normei 2 rezultă prima inegalitate, din care se deduc imediat 

celelalte. 

P1.13Aesteinversabilă, deciImA = IR n . ‖A −1 ‖A 

‖ = sup −1 x‖ ‖A 

x≠0 = sup −1 Ay‖ 

‖x‖ y≠0 . 

‖Ay‖ 

Deci, 1/‖A −1 ‖Ay‖ 

‖ = inf y≠0 = min ‖y‖ ‖x‖=1‖Ax‖.

INDICAŢII, RĂSPUNSURI, SOLUŢII 503 

P1.14 L 2 are prima supradiagonală nulă, L 3 primele două etc. 

P1.15 Notând C = AB, avem c ij = ∑ n 

a k=1 ikb kj . a ik şi b kj pot fi simultan nenule 

dacă mulţimile i − p : i + p şi j − q : j + q au cel puţin un element comun, adică dacă 

i+p > j −q sau i−p < j +q, ceea ce e echivalent cu |i−j| < p+q, deci C este matrice 

bandă de lăţime p+q. 

P1.16 Indicaţie: rezultatul este o matrice nestructurată. 

P1.17 Ordinea de calcul va fi: Pentru i = n : −1 : 1, Pentru j = 1 : i. Sau: Pentru 

j = 1 : n, Pentru i = n : −1 : j. 

P1.18 Pentru matrice ortogonale, în general, nu. 

P1.19 Se adaptează algoritmul 1.20 la cazul matricelor superior triunghiulare, iar în 

instrucţiunea 1.4, în loc de UTRIS se apelează algoritmul de rezolvare de sisteme liniare. 

P1.20 O simplă substituţie este suficientă. Pentru deducerea expresiei lui N(n) se 

presupune N(n) = αn log7 + βn 2 ; coeficienţii α şi β se calculează prin identificare cu 

(1.38). Mai multe despre rezolvarea recurenţelor în [2]. 

P1.21 A fiind ortogonal diagonalizabilă, există U ortogonală astfel încât U T ΛU = A. 

Elementele diagonale ale lui Λ sunt pozitiv definite (vezi şi problema 1.30); fie D matricea 

diagonală cu d ii = √ λ i şi Q = U T DU, matrice simetrică (şi pozitiv definită); din motive 

evidente, se notează Q = √ A. 

Demonstraţia inegalităţii ‖x+y‖ A ≤ ‖x‖ A‖y‖ A se reduce la |x T Ay| ≤ ‖x‖ A‖y‖ A, care 

este inegalitatea Cauchy-Buniakowski-Schwarz, pentru vectorii Qx şi Qy. 

P1.22 Dacă A e singulară, atunci există x ≠ 0 astfel încât Ax = 0 şi deci x T Ax = 0, 

deci A nu e pozitiv definită; deci A e inversabilă. În plus, ImA = IRn , deci orice y ∈ IR n , 

există x ∈ IR n astfel încât y = Ax; atunci x T Ax = y T A −1 y > 0, deci A −1 > 0. 

P1.23 b. Fie A = [a 1 a 2 ... a n] ortogonală şi superior triunghiulară. Atunci, pentru 

prima coloană avem a 1 = ±e 1 şi 0 = a T 1a j = ±a 1j, pentru j > 1, etc. (Altfel: A T este 

inferior triunghiulară, iar A −1 este superior triunghiulară; cum ele sunt egale, A T este 

diagonală, deci şi A.) 

c. Fie A superior triunghiulară. Atunci, din AA T = A T A, pentru elementul (1,1) 

obţinem ∑ n 

j=1 a2 1j = a 2 11, deci toate elementele extradiagonale din prima linie sunt nule 

etc. 

P1.24 b. Adaptăm algoritmul LTRIS, de exemplu versiunea pe linii. Singura modificare 

e în instrucţiunea 2.1. 

1. x ← b 


1. Pentru j = max(1,i−p) : i−1 

1. x i ← x i −l ijx j 

2. x i ← x i/l ii 

P1.25 Pentru L inferior bidiagonală, inversa X este inferior triunghiulară. 


1. x jj ← 1/l jj 

2. Pentru i = j +1 : n 

1. x ij ← −l i,i−1x i−1,j/l ii 

P1.26 Varianta cu DOT este imediată din algoritmul 1.16 LINV. 

Pentru varianta cu Saxpy, e necesară o nouă formă a algoritmului, în care, o dată 

calculată o necunoscută x k , se actualizează toate sumele (1.44) pentru i > k. 


1. x k ← b k /l kk



1. Pentru i = k +1 : n 

1. b i ← b i −l ik x k 

Bucla Pentru i se poate înlocui cu operaţia 

b(k +1 : n) ← Saxpy(−x k ,L(k +1 : n,k),b(k +1,n)). 

P1.27 Notăm cu L(k) elementul aflat la adresa k în vectorul L în care se memorează 

compact matricea triunghiulară. (Considerăm L(1) primul element.) 

1. x ← b 

2. k ← 1 


1. Pentru j = 1 : i−1 

1. x i ← x i −L(k)x j 

2. k ← k +1 

2. x i ← x i/L(k) 

3. k ← k +1 

P1.28 b. Presupunând v = γu, γ ≠ 0, fie λ ∈ IC valoarea proprie pentru care 

A(u + iv) = λ(u + iv). Evident, Au = λu, deci λ ∈ IR, deci γ = 0. Aşadar v nu este 

coliniar cu u. 

Notând λ = α+iβ, cu α,β ∈ IR, egalitatea evidentă 

[ ] 

α −β 

A[u v] = [u v] 

β α 

arată că Au şi Av sunt combinaţii liniare de u şi v. 

P1.29 Din det(λI −A) = 0 şi relaţiile lui Viète. 

P1.30 Din Ax = λx rezultă x T Ax = λ‖x‖ 2 , deci λ > 0. 

Cap. 2. Rezolvarea sistemelor de ecuaţii liniare 

P2.1 Se folosesc matrice inferior triunghiulare elementare modificate, tot de forma 

M k = I −m k e T k, dar cu m k = [µ 1k ... µ k−1,k 0 ... 0] T . 

P2.2 Pentru GPP, se folosesc funcţiile xSWAP pentru interschimbarea a două linii 

(bucla1.3), xSCAL pentrucalculul multiplicatorilor (bucla1.4) şixAXPY pentru actualizările 

din bucla 1.5.1. 

P2.3 Este evident că, la primul pas al eliminării gaussiene, pivotul este a 11 şi 

|µ i1| = |a i1|/|a 11| < 1. Notând B = M 1A matricea transformată după primul pas al 

eliminării, să demonstrăm că submatricea B(2 : n,2 : n) este diagonal dominantă pe 

coloane (apoi, prin inducţie, problema este rezolvată). Ţinând seama că b ij = a ij −µ i1a 1j 

(pentru i,j ≥ 2), avem 

∑ 

|b ij| ≤ 

i=2,i≠j 

∑ 

|a ij|+|µ i1||a 1j| < |a |a11|−|aj1| 

jj|−|a 1j|+ |a 1j| < |a jj|−|µ j1||a 1j| < |b jj|. 

i=2,i≠j 

P2.4 a. Evident, µ ik = x i/x k , pentru i ≠ k. 

b. Algoritmul este similar cu cel de eliminare gaussiană, numai că operaţiile se 

desfăşoară permanent pe toate liniile. 

|a 11|


1. Pentru k = 1 : n−1 

1. Pentru i = 1 : n, i ≠ k 

1. a ik ← µ ik = a ik /a kk 

2. Pentru j = k +1 : n 

1. Pentru i = 1 : n, i ≠ k 

1. a ij ← a ij −a ik a kj 

N op ≈ n 3 , cu50% mai multdecâtîn eliminarea gaussiană, motivpentrucarealgoritmul 

Gauss-Jordan nu este utilizat în practică. 

c. Pivotul se caută la fel ca în eliminarea gaussiană, adică numai pe liniile k : n. 

P2.5Prezentămodemonstraţie doarpentrucazul Anesingulară. Demonstraţiapentru 

A singulară rămâne ca exerciţiu (netrivial). 

Presupunem că A are două factorizări LDU diferite: 

A = LDU = L ′ D ′ U ′ . (7.2) 

L, L ′ , U, U ′ sunt matrice triunghiulare unitate, deci nesingulare; mai mult, L −1 , (L ′ ) −1 , 

U −1 , (U ′ ) −1 au aceeaşi structură. A este nesingulară, deci astfel sunt şi D şi D ′ , iar 

matricele D −1 şi (D ′ ) −1 sunt diagonale. Atunci, din (7.2) rezultă 

(L ′ ) −1 L = D ′ U ′ U −1 D −1 , 

în care termenul din stânga este o matrice inferior triunghiulară unitate, iar cel din dreapta 

o matrice superior triunghiulară. Atunci (L ′ ) −1 L = I n, adică L = L ′ . Rezultă acum că 

U ′ U −1 = (D ′ ) −1 D. 

Termenul stâng este o matrice superior triunghiulară unitate, iar cel drept o matrice diagonală. 

Aceasta este posibil doar dacă ambii termeni sunt egali cu matricea unitate I n. 

În concluzie U = U ′ , D = D ′ . 

P2.6Presupunemcăexistăk < n, cel maimicastfelîncât A [k] estesingulară. Deoarece 

A [k] = L [k] D [k] U [k] , iar L [k] şi U [k] sunt nesingulare ca submatrice lider principale ale unor 

matrice triunghiulare unitate, rezultă că D [k] este singulară şi anume că d kk = 0 (deoarece 

D [k−1] este nesingulară). În acest caz, coloana k a matricei LD este nulă, deci elementele 

l ik , i > k, pot fi arbitrare. Analog, linia k a matricei DU este nulă, deci elementele u kj , 

j > k, pot fi arbitrare. Cum k < n, rezultă că factorizarea LDU nu este unică, ceea ce 

contrazice ipoteza. 

P2.7 În GPP multiplicatorii sunt subunitari. Permutările de linii lasă multiplicatorii 

în triunghiul inferior. 

P2.8 GPC se modifică la fel ca GPP. |u kk | ≥ |u kj |, j > k, deoarece, la pasul k, pivotul 

este mai mare (în modul) decât elementele aflate la dreapta sa, iar eliminarea gaussiană 

propriu-zisă nu modifică linia k. 

P2.9 Se modifică doar valoarea maximă a indicilor de coloană. 

1. Pentru k = 1 : r 

1. Se determină i k ∈ k : n a.î. |a ik k| = max i=k:n |a ik |. 

2. p(k) ← i k 

3. A(i k ,1 : r) ↔ A(k,1 : r) 

4. Pentru i = k +1 : n 

1. a ik ← a ik /a kk 

5. Pentru i = k +1 : n 

1. Pentru j = k +1 : r 

1. a ij ← a ij −a ik a kj


P2.10 În algoritmul CROUTbl se execută o factorizare Crout cu pivotare a blocului 

curent A(s : n,s : f), la nivel de element. Algoritmul va avea structura următoare: 

1. Pentru k = 1 : m 

1. s ← (k −1)r +1 

2. f ← kr 

3. A(s : n,s : f) ← A(s : n,s : f)−L(s : n,1 : s−1)·U(1 : s−1,s : f) 

4. Se calculează factorizarea LU Crout cu pivotare 

P ·A(s : n,s : f) = L(s : n,s : f)·U(s : f,s : f) 

5. Se aplică permutarea P blocului A(s : n,f +1 : n) 

6. Se rezolvă sistemul superior triunghiular Z ·U(s : f,s : f) = A(f+1 : n,s : f) 

7. A(s : f,f+1 : n) ← A(s : f,f+1 : n)−L(s : f,1 : s−1)·U(1 : s−1,f+1 : n) 

8. Se rezolvă sistemul inferior triunghiular L(s : f,s : f)·Z = A(s : f,f+1 : n) 

9. U(s : f,f +1 : n) ← Z (o bloc linie din U) 

P2.11 De exemplu, în algoritmul 2.7, se ia m = ⌈n/r⌉, iar f = min(kr,n). 

P2.12Transformările seaplicăsimultanînAşib, pelinii. Iatăalgoritmul fărăpivotare: 

1. Pentru k = 1 : n−1 

1. Pentru i = k +1 : n 

1. µ = a ik /a kk 

2. Pentru j = k +1 : n 

1. a ij ← a ij −µa kj 

3. b i ← b i −µb k 

2. x = UTRIS(A,b) 

P2.13 a. Este evident că multiplicatorii µ ij vor fi nuli pentru i > j +1. Eliminarea 

gaussiană va avea forma: 

1. Pentru k = 1 : n−1 

1. h k+1,k ← h k+1,k /h kk 

2. Pentru j = k +1 : n 

1. h k+1,j ← h k+1,j −h k+1,k h kj 

Vectorul b va fi modificat în concordanţă cu aceste valori particulare ale multiplicatorilor: 

1. Pentru k = 1 : n−1 

1. b k+1 ← b k+1 −h k+1,k b k 

Apoi trebuie rezolvat un sistem superior triunghiular. 

b. Indicaţie: pivotarea parţială nu afectează structura superior Hessenberg. c. Se 

observă că L este inferior bidiagonală. 

P2.14 a. Se rezolvă Hy = b ca în problema anterioară, apoi Rx = y. 

P2.15 a. Dacă b = c + id, unde c,d ∈ R n , sistemul poate fi scris A[y z] = [c d], cu 

y,z ∈ R n şi x = y+iz. Acesta constituie un caz particular al punctului b, pentru m = 2. 

b. ecuaţia matriceală AX = B constă în m sisteme liniare: Ax j = b j, pentru j = 1 : m 

(x j şi b j sunt coloanele j ale matricelor X, respectiv B). Utilizarea algoritmului: 

1. Pentru j = 1 : m 

1. Se rezolvă Ax j = b j utilizând S GPP 

nu este o idee bună deoarece numărul de operaţii este 2mn 3 /3. Este mai eficient a utiliza 

GPP o singură dată, pentru a triangulariza A, precum mai jos:


1. [M,U,p] = GPP(A) 

2. Pentru j = 1 : m 

1. Pentru s = 1 : n−1 

1. b sj ↔ b p(s),j 

1. Pentru i = s+1 : n 

1. b ij ← b ij −µ isb sj 

2. x j = UTRIS(U,b j) 

Numărul de operaţii este 2n 3 /3+O(mn 2 ). 

P2.16 În cazul utilizării GPP, sistemul iniţial AT y = c este echivalent cu sistemul 

inferior triunghiularR T z = c, undez = M −T 

n−1 Pn−1...M−T 1 

P 1y. Dupărezolvareaacestuia, 

se calculează y = P 1M1 T ...P n−1Mn−1z. 

T 

P2.17 Din nou, nu trebuie nici calculat A k (2kn 3 flopi), nici utilizat algoritmul bazat 

pe relaţia A(A k−1 x) = b, aplicat recursiv: 

1. Pentru j = 1 : k 

1. rezolvă Ax = b utilizând S GPP 

2. b ← x 

care necesită 2kn 3 /3 flopi. Din nou, GPP poate fi utilizat o singurădată pentrurezolvarea 

tuturor sistemelor din instrucţiunea 1.1 a schemei de mai sus. Se obţine: 

1. [M,U,p] = GPP(A) 

2. Pentru j = 1 : k 

1. Pentru s = 1 : n−1 

1. b s ↔ b p(s) 

1. Pentru i = s+1 : n 

1. b i ← b i −µ isb s 

2. b = UTRIS(U,b) 

3. x ← b 

Numărul de operaţii este de doar 2n 3 /3+O(kn 2 ). 

P2.18 Varianta 1: se calculează D = AB, apoi se aplică algoritmul precedent; cost 

suplimentar faţă de acesta: 2n 3 . 

Varianta 2: se aplică GPP ambelor matrice A şi B, apoi se adaptează algoritmul 

precedent, ”dublând” instrucţiunea 2. Cost suplimentar: 4n 3 /3+2kn 2 . Această variantă 

e recomandabilă, în general. 

P2.19 (a) implică 2n 3 /3 operaţii complexe, adică aproximativ 8n 3 /3 operaţii reale. 

(b) implică 2(2n) 3 /3 operaţii. 

P2.20 Notând X = A −1 şi x j coloana j a lui X, trebuie rezolvat doar sistemul 

LUx j = e j. Sistemul Ly = e j se rezolvă adaptând LTRIS (ca în LINV) iar sistemul 

Ux j = y se rezolvă cu UTRIS, oprind calculele atunci când x ij a fost obţinut. 

P2.22 a. Prin calcul direct, avem A +A −1 

+ = I. 

b. Se calculează ˜B = A −1 B, ˜C = CA −1 (cu 4n 2 r flopi). Se calculează D + cu 

2n 2 r + 2nr 2 flopi. Se rezolvă D +X = C ca în problema 2.15, cu 2r 3 /3 + 2nr 2 flopi. În 

sfârşit, A −1 

+ = A−1 −BX, cu un cost de încă 2n 2 r flopi. Presupunând r ≪ n, costul total 

este de O(rn 2 ). În cazul 1◦ , costul se reduce la jumătate. 

P2.23 a. Presupunem întâi că u 1 ≠ 0. Fie M = I −me T 1 o matrice inferior triunghiulară 

elementară astfel încât Mu = u 1e 1; evident, m i = u i/u 1, i = 2 : n. Considerăm 

matricea B = MAM −1 = I +Muv T M −1 = I +u 1e 1w T ; deoarece M −1 = I +me T 1, avem 

w T = v T M −1 = v T + (v T m)e T 1. În concluzie B este superior triunghiulară, cu b ii = 1, 

pentru i ≥ 2 şi deci detA = detB = b 11 = 1+u T v.


Dacă u 1 = 0 sau, în general, pentru o mai bună stabilitate numerică, se aplică întâi 

permutarea u ← Pu care aduce pe prima poziţie elementul de modul maxim din u. Deci, 

în loc de M se utilizează transformarea stabilizată MP. 

b. Sistemul Ax = b se transformă în B(Mx) = Mb. Se rezolvă By = Mb, apoi 

x = M −1 y. Dacă se ţine seama de forma specială a lui B, care are doar prima linie şi 

diagonala nenule, numărul de operaţii este O(n). 

P2.24 Multiplicatorii au toţi valoarea −1 (elementele diagonale nu se modifică, cu 

excepţia celui din dreapta jos) iar în ultima coloană avem a (k) 

in = 2a(k−1) in 

, pentru i ≥ k. 

Se obţine evident a (n) 

nn = 2 n−1 . 

P2.25 Avem 

cond(A) ≤ ‖|A−1 ||A||x|‖ ∞ 

‖|A||x|‖ ∞ 

‖|A||x|‖ ∞ 

‖|x|‖ ∞ 

≤ ‖A −1 ‖ ∞‖A‖ ∞. 

Am folosit definiţia normei ∞ şi egalitatea evidentă ‖|A|‖ ∞ = ‖A‖ ∞. 

P2.26 Elementele diagonale ale matricei D 1 sunt d i = 1/max j=1:n|a ij|. Astfel, 

liniile matricei B = D 1A au norma infinit egală cu 1, iar coloanele normă infinit inferioară 

lui 1 (evident, |b ij| ≤ 1). Elementele diagonale ale matricei D 2 se iau acum 

˜d j = 1/max i=1:n|b ij|. Notând C = BD 2, avem c ij ≤ 1 (ca şi pentru B), liniile lui C 

păstrează norma infinit unitate, iar coloanele au aceeaşi proprietate. 

Alegând d i şi ˜dj cele mai mici puteri ale lui β superioare valorilor 1/max j=1:n|a ij|, 

respectiv 1/max i=1:n|b ij|, obţinem evident normele infinit ale liniilor şi coloanelor lui C 

în intervalul [1/β, 1]. 

P2.27 a. Să presupunem că: 

Atunci 

˜L = 

[ 

L 0 

X L 

] 

, Ũ = 

[ 

U Y 

0 U 

[ ] 

B = ˜LŨ A LY 

= . 

XU XY +A 

Deci LY = 0 şi, deoarece A nesingulară implică L, U nesingulare, Y = 0; XU = R, deci 

X = RU −1 , şi X este superior triunghiulară. 

b. [ ][ ] [ ] { 

A 0 x1 d1 Ax1 = d 1 

= ⇒ 

R A x 2 d 2 Rx 1 +Ax 2 = d 2 

Se rezolvă întâi Ly = d 1, Ux 1 = y şi se obţine x 1 (în 2n 2 flopi). Se calculează apoi 

f = d 2−Rx 1 (n 2 flops); se rezolvă Ly = f, Ux 2 = y şi se obţine x 2 (în 2n 2 flopi). Totalul 

este de doar 5n 2 flopi. Schema de calcul prezentată poate fi aplicată pentru rezolvarea 

oricărui sistem bloc inferior triunghiular. 

P2.28 a. Se utilizează eliminarea gaussiană; a ij = 0, pentru i > j +n; multiplicatorii 

µ ij vor respecta aceeaşi relaţie. b. Se utilizează eliminarea gaussiană cu pivotare parţială, 

care nu va afecta structura matricei A. 

P2.29 a. 

1. Pentru s = 1 : n−1 

1. a s+1,s ← a s+1,s/a ss 

2. a s+1,s+1 ← a s+1,s+1, −a s+1,sa s,s+1 

P2.30 Se aplică o eliminare gaussiană pe dreapta (adică pe linii) pentru rezolvarea 

sistemului FE = C. Notăm p = n−s, deci F,C ∈ IR p×2 . 

] 

.


% permutarea coloanelor lui E şi C 

1. Dacă |e 12| > |e 11| atunci 

1. e 11 ↔ e 12, e 21 ↔ e 22 

2. Pentru i = 1 : p, c i1 ↔ c i2 

% eliminare gaussiană la dreapta 

2. µ = e 12/e 11 

3. e 22 ← e 22 −µe 21 


1. c i2 ← c i2 −µc i1 

% rezolvare sistem inferior triunghiular, la dreapta 


1. f i2 ← c 12/e 22 

2. f i1 ← (c i1 −f i2e 21)/e 11 

P2.31 Notând tot cu a ij elementele matricei P 1AP T 1 , prima relaţie se demonstrează 

ţinând seama că ã ij = a ij−(a i1/a 11)a j1 şi, în plus, |a i1| ≤ µ 0 şi |a 11| = µ 1 ≥ αµ 0. Aşadar 

max 

i,j 

|ã ij| ≤ |a 1 ij|+ 

α |aj1| ≤ (1+ 1 α )max |a ij|. 

i,j 

A doua relaţie se demonstrează în acelaşi stil, folosind formulele adecvate pentru ã ij. 

P2.32 Detaliem numai cazul s = 2. Pivotul se găseşte în poziţia (i k ,j k ) şi trebuie 

adus, la pasul curent k, în poziţia (k+1,k). Pentru aceasta sunt necesare două permutări 

de linii şi de coloane (orice permutare de linii este însoţită de una de coloane, şi reciproc, 

pentru a păstra simetria). Întâi se permută liniile şi coloanele k +1 şi i k, cu operaţiile: 

A(k +1,k +1) ↔ A(i k ,i k ) 

A(k +1,1 : k) ↔ A(i k ,1 : k) 

A(k +2 : i k −1,k +1) ↔ A(i k ,k +2 : i k −1) 

A(i k +1 : n,k +1) ↔ A(i k +1 : n,i k ). 

(Să notăm că pivotul a ajuns în poziţia (j k ,k+1).) Apoi se permută liniile şi coloanele k 

şi j k , cu operaţiile 

A(k,k) ↔ A(j k ,j k ) 

A(k,1 : k −1) ↔ A(j k ,1 : k −1) 

A(k +1 : j k −1,k) ↔ A(j k ,k +1 : j k −1) 

A(j k +1 : n,k) ↔ A(j k +1 : n,j k ). 

P2.33 Algoritmul Cholesky, varianta cu Saxpy, este următorul (L se scrie peste triunghiul 

inferior al lui A) 


1. a kk ← √ a kk 

2. Pentru i = k +1 : n 

1. a ik ← a ik /a kk 

3. Pentru j = k +1 : n 

1. Pentru i = j : n 

1. a ij ← a ij −a ik a jk 

Evident, bucla 1.3.1 se poate înlocui cu un apel la Saxpy. 

P2.34 Se respectă structura algoritmului la nivel de element, preluând ideile din algoritmul 

CROUTbl.


1. Pentru k = 1 : m 

1. s ← (k −1)r +1 

2. f ← kr 

3. A(s : f,s : f) ← A(s : f,s : f)−L(s : f,1 : s−1)·L T (1 : s−1,s : f) 

4. Utilizând CHOL, calculează factorizarea Cholesky 

A(s : f,s : f) = L(s : f,s : f)·L T (s : f,s : f) 

(blocul L(s : f,s : f) se memorează în triunghiul inferior al lui A(s : f,s : f)) 

5. A(f+1 : n,s : f) ← A(f+1 : n,s : f)−L(f+1 : n,1 : s−1)·L T (1 : s−1,s : f) 

6. Rezolvă sistemul superior triunghiular ZL T (s : f,s : f) = L(f +1 : n,s : f) 

7. L(f +1 : n,s : f) ← Z 

În instrucţiunea 1.3 se utilizează SYRK, în 1.5 GEMM iar în 1.6 TRSM. Transpunerea nu se 

efectuează explicit, ci se pasează rutinelor BLAS. 

P2.35 T = AA T nu este deja factorizarea Cholesky deoarece elementele diagonale ale 

lui A nu sunt neapărat pozitive. Fie T = LL T factorizarea Cholesky. Este natural să 

încercăm să demonstrăm că L este inferior bidiagonală. Pentru orice k ∈ 1 : n−1: 

t kk = a 2 k,k−1 +a 2 kk = l 2 k,k−1 +l 2 kk 

t k+1,k = a k+1,k a kk = l k+1,k l kk . 

De asemenea, este natural să încercăm să demonstrăm că |l ij| = |a ij|; pentru prima relaţie 

de mai sus, semnele nu contează; pentru a doua, dacă a kk este negativ, luăm l kk = −a kk 

şi l k+1,k = −a k+1,k . Algoritmul va fi: 


1. l kk ← |a kk | 


1. Dacă a kk < 0 atunci l k+1,k ← −a k+1,k 

altfel l k+1,k ← a k+1,k 

P2.36 Algoritmul CHOL pentru matrice bandă de lăţime r este 


1. α ← a kk − ∑ k−1 

j=max(1,k−r) l2 kj 

2. Dacă α ≤ 0 atunci 

1. Afişează(’A nu este pozitiv definită’) 

2. Stop 

3. a kk ← l kk = √ α 

4. Pentru i = k +1 : min(k +r,n) 

1. a ik ← l ik = 

( 

a ik − ∑ k−1 

j=max(1,i−r) lijl kj 

) 

/l kk 

P2.37 Se procedează analog cu algoritmul CHOL. Calculele decurg în ordine inversă, 

i.e. cu k = n : −1 : 1. 

P2.38 Calculând pe loc în A, un algoritm direct inspirat de CHOL este 


1. a kk ← d k = a kk − ∑ k−1 

j=1 l2 kjd j 

2. Pentru i = k +1 (: n 

1. a ik ← l ik = a ik − ∑ k−1 

lijl j=1 kjd j 

)/d k


Numărul de operaţii este însă sensibil mai mare decât pentru CHOL. Pentru a-l 

reduce, se elimină înmulţirea cu d j din 1.2.1 astfel 


1. Pentru j = 1 : k −1 

1. a kj ← l kj = a kj /d j 

2. a kk ← d k = a kk − ∑ k−1 

j=1 l2 kjd j 

3. Pentru i = k +1 : n 

1. a ik ← a ik − ∑ k−1 

lijl j=1 kj 

Cap. 3. Problema celor mai mici pătrate 

P3.3 Scriem ca de obicei Ux = x − νu, unde ν = u T x/β. Prin urmare trebuie să 

avem x − νu = ρy, deci putem lua u = x − ρy, unde modulul lui ρ e fixat prin condiţia 

‖Ux‖ = ‖x‖, iar semnul se alege în mod adecvat. 

P3.4 a. Amintim că U este o transformare involutivă, i.e. U 2 = I, prin urmare 

condiţia impusă este echivalentă cu ρUx = e 1, unde ρ = ‖x‖ ≠ 0. 

b. U este o transformare ortogonală, deci coloanele matricei U sunt vectori normaţi şi 

ortogonali doi câte doi în IR m . 

P3.5 a. Cu notaţiile din secţiunea 2.1, consideraţi transformarea elementară stabilizată 

T = M 1P 1 astfel încât (Tx) i = 0, i = 2 : m. Arătaţi că vectorii y j = T T e j, 

j = 2 : m, satisfac condiţia cerută. Ce se obţine dacă în locul lui T se consideră un 

reflector 

P3.6 Evident, funcţia ρ 2 (α) = ‖y −αx‖ 2 este un polinom de gradul 2 în α, 

ρ 2 (α) = α 2 ‖x‖ 2 −2αy T x+‖y‖ 2 , 

deci problema este elementară. Interpretarea geometrică devine transparentă dacă presupunem 

că ‖x‖ = 1. 

P3.7 a. detU = −1. 

b. Scriem Ux = λx şi obţinem (λ − 1)x = −2u(u T x), unde x ≠ 0. Prin urmare 

avem fie (i) λ = 1 şi u T x = 0, fie (ii) x = u şi λ = −1. În primul caz obţinem m − 1 

vectori proprii ortogonali (vezi problemele 3.4b sau 3.5b), deci λ = 1 este valoare proprie 

de multiplicitate (algebrică şi geometrică) m−1. Prin urmare λ = −1 este valoare proprie 

simplă. Descompunerea spectrală U = VΛV T se scrie cu uşurinţă. 

c. Utilizăm relaţia U 2 = I m. [ ] 

0 1 

P3.8 De exemplu, în cazul Π = putem lua u = [1 −1] T , β = 1/2. 

1 0 

P3.9 a. Dacă S = R T R este factorizarea Cholesky a lui S, atunci relaţia U T SU = S 

este echivalentă cu V T V = I m, unde V = RUR −1 . 

b. Consideraţi matricea U = I m − 2uu T S, unde ‖u‖ 2 S = 1, şi arătaţi că U este 

S-ortogonală şi S-simetrică. Algoritmii de tip 3.1 şi 3.2 se scriu în mod evident. 

P3.10 b. Condiţia este ‖x‖ J > 0, deci nu orice vector nenul din IR m poate fi adus 

la forma (3.200) utilizând J-reflectori. (Aceasta este o deosebire esenţială faţă de cazul 

euclidian uzual.) Vectorii cu ‖x‖ J < 0 pot fi aduşi la forma Ux = −σe p+1, iar vectorii 

izotropi (care satisfac (3.198)) rămân izotropi. Înplus, transformarea este rău condiţionată 

în vecinătatea conului (3.198). 

c. Partiţionând matricele S şi R conform cu J, putem scrie 

[ ] [ 

S11 S 12 R 

T 

S12 T = 11 0 

S 22 

R T 12 R T 22 

][ 

Ip 0 

0 −I q 

][ 

R11 R 12 

0 R 22 

] 

, (7.3)


de unde pe blocuri rezultă 

S 11 = R T 11R 11, 

S 12 = R T 11R 12, 

S 22 = R T 12R 12 −R T 22R 22. 

Din prima relaţie, R 11 poate fi determinat aplicând algoritmul de factorizare Cholesky 

dacă şi numai dacă 

S 11 > 0. (7.4) 

În acest caz, din a doua relaţie rezultă R 12 = R −T 

11 

S12, iar a treia devine 

S 22 −S T 12(R T 11R 11) −1 S 12 = −R T 22R 22. 

Prin urmare R 22 poate fi determinat (aplicând din nou algoritmul de factorizare Cholesky) 

dacă şi numai dacă 

not 

˜S 22 = S 22 −S12S T −1 

11 S 12 < 0. (7.5) 

(Prin definiţie, matricea ˜S 22 constituie complementul Schur al lui S 11 în S.) 

În al doilea caz trebuie să avem 

[ ] [ ][ ][ ] 

S11 S 12 L 

T 

S12 T = 11 L T 21 Ip 0 L11 0 

S 22 0 L T , (7.6) 

22 0 −I q L 21 L 22 

de unde, procedând analog obţinem condiţiile 

S 22 < 0, (7.7) 

˜S 11 

not 

= S 11 −S 12S −1 

22 S T 12 > 0. (7.8) 

În particular, dacă au loc condiţiile ”de punct şa” (7.4) şi (7.7), atunci şi celelalte două 

condiţii, (7.5) şi (7.8) sunt satisfăcute, deci ambele factorizări (7.3) şi (7.6) există şi pot 

fi calculate aplicând algoritmul de factorizare Cholesky blocurilor S 11, −˜S 22 şi respectiv 

−S 22, ˜S 11. 

d. Arătaţi întâi că A şi B trebuie să fie inversabile. 

P3.12 Rotaţia P ki modifică numai elementele de indici k şi i ale lui x. 

P3.14 a. Tinând seama de observaţia 3.2, putem utiliza secvenţele P = P 1m...P 13P 12 

sau P = P 12P 23...P m−1,m. 

b. Întâianulămcomponentele 2, 4, 6, ..., utilizândsecvenţaS(1) = P 12P 34P 56...; apoi 

anulăm componentele 3, 7, 11, ..., utilizând secvenţa S (2) = P 13P 57P 9,11...; mai departe 

se aplică S (3) = P 15P 9,13... etc. Transformarea căutată conţine m − 1 rotaţii, grupate 

în secvenţe de rotaţii disjuncte, i.e. P = S (p) ...S (2) S (1) , unde p ≤ log 2 m. Observaţi că 

rotaţiile ce compun o secvenţă pot fi aplicate în orice ordine (i.e. comută), dar că ordinea 

secvenţelor este predeterminată. 

P3.16 a. J = diag(1,−1). Prin urmare ‖Px‖ 2 J = ‖x‖ 2 J = x 2 1 −x 2 2. 

b. Ambele probleme sunt rău condiţionate în vecinătatea ”conului” x 1 = ±x 2. 

P3.17 Pentru orice transformare unitară U avem ‖Ux‖ = ‖x‖ = √ 7. 

a. Există două posibilităţi. Dacă Q = Q H este un reflector hermitic atunci obţinem 

⎧ 

⎪⎨ 

⎪⎩ 

σ = x1 1+i√ ‖x‖ = √ 7, 

|x 1| 2 

u 1 = 1+ 

√ 

2 2+i 

, u2 = 

7 1+i 

√ 

2 

7 , β = u1.


Dacă Q este un reflector complex, atunci 

⎧ 

⎨ σ = Re(x 1)‖x‖ = √ 7, 

2+i 

⎩ u 1 = 1, u 2 = 

1+ √ 7+i , τ = 1+√ 7+i 

√ . 

7 

P3.19 Fie Q ∈ IR n×n , ortogonală. Triangularizând ortogonal matricea Q, obţinem 

U n−1...U 2U 1Q = R, unde R este superior triunghiulară şi ortogonală, ca produs de 

matrice ortogonale. Aşadar R este diagonală; mai mult, normele coloanelor matricei Q se 

conservă prin înmulţirea cu reflectorii elementari, deci (alegând potrivit semnul) r ii = 1, 

adică R = I. Rezultă Q = U 1U 2...U n−1. 

P3.20 a. Se utilizează secvenţa de rotaţii Q T = P n,n+1...P 2nP 1n. 

b. u k = [0 ... 0 u kk u k+1,k 0 ... 0 u n+1,k ... u mk ] T (pentru A superior Hessenberg). 

c. u k = [0 ... 0 u kk 0 ... 0 u n+1,k ... u n+k,k 0 ... 0] T . 

P3.21 Pentruanualtera structuradezerouri, se anuleazăelementele a ik , i = n+1 : m, 

din blocul C, începând cu ultima coloană. Matricea R + rezultă inferior triunghiulară. 

P3.22 În cazul m > n, rotaţiile necesare pentru anularea elementelor subdiagonale 

pot fi grupate în cel mult m + n − 2 secvenţe de rotaţii disjuncte; de exemplu, în cazul 

m = 6, n = 5 avem m+n−2 = 9, iar gruparea se face astfel 

⎡ ⎤ 

× × × × × 

1 × × × × 

2 3 × × × 

. 

⎢ 3 4 5 × × ⎥ 

⎣ 4 5 6 7 × ⎦ 

5 6 7 8 9 

(Elementele marcate cu aceeaşi cifră sunt anulate de rotaţii disjuncte aprţinând aceleaişi 

secvenţe.) 

P3.23 a. Q T = P 12P 23...P n−1,n. 

b. Rotaţiile pot fi memorate printr-unsingur număr z, vezi procedura ROTG. Totuşi, 

poziţiile (i,i + 2), i = 1 : n −2, nu rămân nule, la fel ca în cazul eliminării gaussiene cu 

pivotare parţială. 

P3.24 Dacă b = ρe 1, atunci problema e banală, R + = R+ρe 1c T . De aici provine ideea 

de a anula ultimele n−1 componente ale lui b fără a altera prea mult structura lui R. Se 

vedeuşor căsecvenţade rotaţii (numaiîn această ordine !) P = P 12P 23...P n−1,n poate realiza 

acest obiectiv. Matricea PR este evident superior Hessenberg, deci 

H not 

= P(R + bc T ) = PR + ρe 1c T are aceeaşi structură. Mai departe se procedează ca 

în problema 3.23, i.e. R + = Q T H. 

P3.25 Cel mai simplu, partiţionăm B, C pe coloane şi scriem BC T = ∑ p 

j=1 bjcT j . 

Problema se reduce astfel la cea anterioară. 

P3.26 Scriem 

] 

P + = [A T R T C T ] 

[ 

RA 

C 

not 

= A T +A +, 

deci Q T A + = R +. 

P3.27 A + rezultă superior Hessenberg, vezi problema 3.23. 

P3.28 În cazul p < n, reflectorii Q j, j = p+1 : n, nu sunt activi. În cazul p > n, întâi 

se acumulează coloanele j = n+1 : p, apoi se aplică procedura GQR. 

P3.30 A doua, în care Q se ”umple” treptat. 

P3.31 a. Construcţia lui Y începe cu ultima coloană.


[ ] 

S si 

b. S + = , unde s 

0 β i = W T u i, β i = 1/τ i. Forma din text este preferabilă, 

i 

deoarece aplicarea transformării necesită numai înmulţiri de matrice. 

P3.38 Se partiţionează B în blocuri şi se utilizează informaţia din triunghiul strict 

inferior al lui A pentru a se forma bloc-reflectorii necesari. 

P3.40 A = Q ′ R ′ . 

P3.41 G = R ′T R ′ , deci α = y T y, cu y = (R ′ ) −T c. 

P3.44 Procesul de ortogonalizare începe cu ultima coloană a n = q nl nn. 

P3.46 a. Notând c = R T d, putem scrie 

[ ] 

not 

G + = G+C T C = [R T C T R 

] = A T 

C 

+A +, 

[ ] 

not 

d + = R T d+C T y = [R T C T d 

] = A +b +, 

y 

deci problema se reduce la rezolvarea în sensul CMMP a sistemului A +x = b +, unde A + 

este matricea din problema 3.20. 

b. Se aduce A + la forma superior triunghiulară Q T PA + = R + şi se aplică transformările 

membrului drept. 

P3.47 Se procedează ca în secţiunea 3.5.1. 

P3.48 Matricea B = A T + are structura din problema 3.20. Prin urmare, dacă VB = R, 

unde V = V m...V 2V 1, atunci evident A +Z = L, unde Z = V T şi L = R T . Reflectorii 

reali V k = I n −ν k νk T /β k sunt matrice simetrice. În cazul complex, considerat în text, am 

notat V k = Zk H , unde Z k = I −τ k ν k νk H şi τ k = 1/¯β k 

P3.49 a. O matrice epică A este inversabilă la dreapta, i.e. există A d astfel încât 

AA d = I m (de exemplu se poate lua A d = A + , unde A + = A T (AA T ) −1 ). Dacă (şi numai 

dacă) m = n, atunci A d = A −1 este unică. Dacă m < n, atunci mulţimea inverselor la 

dreapta este A d = A + +Z ′′ B, unde Z ′′ este o bază (nu neapărat ortogonală) a subspaţiului 

N = KerA, iar B este o matrice oarecare. 

b. P 2 = I m −AA + este proiectorul ortogonal pe S ⊥ = KerA T , deci are structura 

[ ] 

0 0 

P 2 = Q Q T , Q = [Q ′ Q ′′ ], 

0 I m−n 

unde Q T A = R. De asemenea, norma Frobenius este ortogonal invariantă. 

P3.50 a. Dacă A este monică şi Q T A = R, atunci A T este epică şi A T Q = R T . Prin 

urmare, notând y = Qv, sistemul A T y = c devine R T v = c. Mai departe se procedează ca 

în secţiunea 3.6.3. 

P3.51 În primul caz, dacă A este monică cu m > n, algoritmul are n etape. Pentru a 

anula elementele subdiagonale, acum se utilizează transformările elementare (stabilizate) 

M k , respectiv T k = M k P k (vezi secţiunea 2.1). Notând 

[ ] 

R 

′ 

MA = R = , M −1 = S = [S ′ S ′′ ], 

0 

putem scrie A = S ′ R ′ , unde R ′ este inversabilă, deci S ′ este o bază (neortogonală) a 

subspaţiului S = ImA, iar S ′′ este o completare (oarecare) a lui S ′ până [ la o] 

bază a lui 

d 

IR m ′ 

. Considerând sistemul supradeterminat Ax = b şi notând Mb = d = 

d ′′ , condiţia 

de compatibilitate este d ′′ = 0.


În al doilea caz, dacă A este epică cu m < n obţinem 

AN = L = [L ′ 0], N = [N ′ N ′′ ], 

unde N ′′ este o bază (neortogonală) a subspaţiului [ N = ] KerA. Considerând sistemul 

u 

′ 

subdeterminat Ax = b şi notând x = Nu = N 

u ′′ , obţinem sistemul echivalent 

L ′ u ′ = b. Prin urmare, o soluţie a sistemului Ax = b este 19 

x B = N 

[ 

(L ′ ) −1 b 

iar mulţimea tuturor soluţiilor este x = x B + N ′′ u ′′ , unde u ′′ ∈ IR n−m este un vector 

arbitrar. 

Pe scurt, analiza elementară a sistemelor liniare Ax = b cu m ≠ n poate fi făcută 

utilizând metoda eliminării [ gaussiene. ] 

Q 

H 

0 

P3.52 a. Fie S = 

0 (R ′ ) −H . Calculaţi SHS H şi găsiţi apoi permutarea 

potrivită. 

[ ] 

P2 (A + ) H 

b. Procedaţi direct, arătând că H 

A + −G −1 = I m+n, sau ţineţi seama de 

semnificaţia lui H în problema CMMP din secţiunea 3.5. 

P3.54 a. (A T SA+T)x ∗ = A T Sb. Ţineţi seama de problema 3.46. 

b. A trebuie să fie monică. Utilizând factorizarea Cholesky S = D1 T D 1 şi notând 

A ← D 1A, b ← D 1b, se obţine problema CMMP din secţiunea 3.5. 

P3.55 a. Notând cu λ ∈ IR m vectorul multiplicatorilor, funcţia lui Lagrange este 

L(x,λ) = 1 2 xT Gx−x T c+λ T (Ax−b). 

Anulând derivatele parţiale ale lui L, se obţin condiţiile 

0 

] 

, 

Gx ∗ −c+A T λ ∗ = 0, Ax ∗ = b. (7.9) 

În cazul G > 0, se utilizează factorizarea Cholesky G = R T R pentru a reduce problema la 

cea standard din secţiunea 3.6. 

b. Pentru a rezolva sistemul (7.9) se utilizează procedura de triangularizare ortogonală 

la dreapta AZ = [L 1 0], unde L 1 este inferior triunghiulară inversabilă. Notând 

[ ] 

x ∗ u1 

= Zu, u = 

u 2 

precum şi 

se obţine 

Z T GZ = 

⎧ 

⎨ 

⎩ 

[ ] [ ] 

H11 H 12 

H12 T , Z T d1 

c = , 

H 22 d 2 

H 11u 1 +H 12u 2 +L T 1λ ∗ = d 1 

H12u T 1 +H 22u 2 = d 2 

L 1u 1 = b. 

19 În terminologia specifică programării liniare, x B se numeşte soluţie de bază.


În cazul general, x ∗ este un punct de minim unic dacă şi numai dacă H 22 > 0. (Cum 

justificaţi această afirmaţie ) În consecinţă se poate utiliza factorizarea Cholesky 

H 22 = R2R T 2. 

P3.56 Se aplică algoritmul de triangularizare ortogonală Q T A = R. Notând 

Q T B = D, Q T b = d şi utilizând partiţii adecvate, sistemul de restricţii se scrie 

[ ] [ ] [ ] 

R1 D1 d1 

x+ y = , 

0 D 2 d 2 

unde R 1 este superior triunghiulară inversabilă, iar D 2 este epică. Prin urmare, există 

matricea Z ortogonală astfel încât D 2Z = [0 R 2], unde R 2 este superior triunghiulară 

inversabilă. Notând 

[ ] 

v1 

D 1Z = [S 1 S 2], y = Z , 

v 2 

se obţine 

[ 

R1 

0 

] 

x+ 

[ ][ ] [ ] 

S1 S 12 v1 d1 

= , 

0 R 2 v 2 d 2 

iar din condiţia de minim (în care v 2 este fixat) rezultă v 1 = 0. Soluţia problemei este: 

⎧ 

[ ] 

⎨ 

v 1 = 0, v 2 = R −1 

2 d 2, ⇒ y ∗ 0 

= Z 

v 2 

⎩ 

x ∗ = R −1 

1 (d 1 −S 12v 2). 

P3.57 Se utilizează factorizarea ortogonală CZ = [L 1 0]. Se notează x = Zu etc. 

P3.58 Următoarea procedură (LINPACK [XIII, pag. 8.7]) realizează permutarea 


1. π k ← −π k 


1. j = k 

1. Cât timp π j < 0 

1. π j ← −π j 

2. Dacă j ≠ k atunci 

1. x j ↔ x πj 

2. j ← π j 

Cap. 4. Calculul valorilor şi vectorilor proprii 

P4.1 Spectrele celor două matrice sunt aceleaşi λ(A) = λ(B) = {2,2,4}. Matricea A 

este diagonalizabilă dar B nu. 

P4.2 Nu. Dacă x ∈ IR n , x ≠ 0, şi γ = α+iβ, α,β ∈ IR, β ≠ 0, atunci γx ∉ IR n . 

P4.3 Implicaţia ”A, B diagonalizabile ⇒ C diagonalizabilă” este evidentă. Reciproc, 

dacă C este diagonalizabilă, fie X C ∈ IC (m+n)×(m+n) o matrice nesingulară de vectori 

proprii [ ai ] matricei C. Avem CX C = X CΛ, cu Λ diagonală. Considerând partiţia X C = 

XA 

= , (cu dimensiunile blocurilor, evidente) avem AX 

X A = X AΛ. În continuare, 

B 

rangX A = m (în caz contrar, X C nu ar fi nesingulară) şi, prin urmare, X A are m coloane 

liniar independente, care sunt vectori proprii ai matricei A. Deci, A este diagonalizabilă. 

Similar se arată că şi matricea B este diagonalizabilă. 

P4.4 În cazul general, răspunsul la întrebare este negativ. Într-adevăr, e.g. dacă 

A 1 = A 2 = λ ∈ IC şi A 12 ≠ 0 matricea A nu este diagonalizabilă. Există şi situaţii în


care răspunsul este afirmativ, cum este cazul în care λ(A 1) ∩ λ(A 2) = ∅. În această din 

urmă situaţie, fie X 1 şi X 2 matrice nesingulare [ de] 

vectori proprii pentru submatricele A 1 şi 

X1 X 12 

A 2. Atunci matricea (nesingulară) , unde X 

0 X 12 = YX 2 cu Y soluţia ecuaţiei 

2 

matriceale Sylvester A 1Y −YA 2 = −A 12 (v. §4.7), este o matrice de vectori proprii pentru 

matricea A, i.e. A este diagonalizabilă. [ ] [ ] 

AB 0 0 0 

P4.5 Arătaţi că matricele C = şi D = sunt asemenea (o 

B 0 B BA 

[ ] 

Im A 

matrice de transformare posibilă este T = ). Dacă m > n, din λ(C) = λ(D) 

0 I n 

rezultă că mulţimea λ(AB)\λ(BA) are toate elementele nule. 

P4.6 b) Dacă (A,B) = (XΛ AX −1 ,XΛ BX −1 ) atunci, ţinând seama de faptul că 

matricele diagonale comută, AB = BA rezultă prin calcul direct. c) Presupunem că 

AB = BA. Fie X −1 def 

AX = Λ A şi considerăm perechea (Ã, ˜B) = (Λ A,X −1 BX). Fără 

a reduce generalitatea, putem presupune că Λ A are valorile proprii multiple grupate, i.e. 

Λ A = diag(λ 1I n1 ,λ 2I n2 ,...,λ pI np ), cu λ i ≠ λ j pentru i ≠ j. Întrucât Ã˜B = ˜BÃ, 

rezultă ˜B = diag(˜B 1, ˜B 2,..., ˜B p). Dar, B fiind diagonalizabilă, rezultă că blocurile ˜B k 

sunt diagonalizabile şi, conform punctului a), perechea (λ k I nk , ˜B k ) este diagonalizabilă. 

Prin urmare, (Ã, ˜B) este diagonalizabilă, de unde şi (A,B) este [ diagonalizabilă. ] [ Pentru ] 

1 1 0 1 

reciprocă, vezi punctul b). d) De exemplu, matricele A = şi B = 

0 1 0 0 

comută, dar nu sunt (simultan) diagonalizabile. 

P4.7 Fie x un vector propriu al matricei A, asociat valorii proprii λ, şi p cel mai 

mare întreg pentru care vectorii x, Bx, ..., B p−1 x sunt liniar independenţi, i.e. pentru 

care matricea X p = [x Bx ··· B p−1 x] este monică. Atunci, subspaţiul X = ImX p este 

B-invariant şi, prin urmare, conţine un vector propriu y = X pz al matricei B. Dar 

AB = BA implică AB k = B k A. Rezultă Ay = AX pz = λX pz = λy, i.e. y este vector 

propriu al matricei A. 

P4.8 Arătaţi că λ 1y2 H x 1 = λ 2y2 H x 1. 

P4.9 Fără a reduce generalitatea, putem considera că ‖x‖ 2 = 1. Conform [ lemei 4.2 ] 

(deflaţie unitară), dacă matricea [x ˜X] λ b 

este unitară, atunci B = X H H 

AX = . 

0 C 

Acum, dacăy esteunvectorpropriulastângaal matricei A, atunciz = X H y este unvector 

propriu la stânga al lui B, i.e. z H B = λz H . Cum λ este o valoare proprie simplă, matricea 

λI n−1 − C este nesingulară. Rezultă z(2 : n) [ = (¯λI n−1 

] − C H ) −1 bz 1, cu z 1 = x H y ≠ 0 

0 1 

întrucât, în caz contrar, z = 0. Matricea A = nu este simplă, iar vectorii proprii 

0 0 

[ ] [ ] 

α 0 

sunt de forma x = şi y = , α,β ∈ IC, α ≠ 0, β ≠ 0, ceea ce implică y H x = 0. 

0 β 

P4.10 Conform problemelor 4.8 şi 4.9, yi H x j = 0 dacă i ≠ j şi putem scala vectorii 

proprii astfel încât yi H x i = 1. Deci, dacă X şi Y sunt cele două matrice de vectori proprii, 

atunci Y H X = I n. Rezultă A = XΛX −1 = XΛY H = ∑ n 

i=1 λixiyH i . 

P4.11 Din Ax = λx, x ≠ 0, rezultă imediat A k x = λ k x (inducţie), (A − µI n)x = 

= (λ−µ)x şi, dacă A este nesingulară (caz în care avem λ ≠ 0), 1 x = λ A−1 x. 

P4.12 AvemA k x = λ k xpentru toţi λ ∈ λ(A) şi xvector propriu asociat lui λ. Rezultă 

Px = p(A)x = p(λ)x. 

P4.13 Fie λ ∈ λ(A) şi x un vector propriu asociat. Atunci, conform problemei 4.12, 

Px = p(λ)x şi Qx = q(λ)x. Întrucât Q este nesingulară avem q(λ) ≠ 0 şi, prin urmare,


Q −1 x = 1 x. Rezultă Rx = r(λ)x. 

q(λ) 

P4.14 Dacă valorile proprii ale matricei A sunt numerotate în ordinea descrescătoare 

a modulelor, atunci avem ρ(A) = |λ 1|, ρ(A −1 ) = 1/|λ n|. Apoi se aplică teorema 4.10. 

P4.15 a) Pentru matricele nilpotente, λ ∈ λ(A) ⇒ λ k ∈ λ(0), i.e. λ k = 0, i.e. λ = 0. 

b) Pentru matricele idempotente, fie x cu ‖x‖ = 1, un vector propriu al matricei A asociat 

valorii proprii λ. Din x H A 2 x = x H Ax rezultă λ 2 = λ, i.e. λ ∈ {0,1}. 

P4.16 a) Câte unul singur în ambele cazuri. b) Dacă o celulă Jordan de ordin n ar fi 

diagonalizabilă, atunci ar avea n vectori proprii liniar independenţi ceea ce ar contrazice 

a). c) Avem J λ = λI n +J 0. Cum matricea unitate comută cu orice altă matrice, pentru 

calculul matricei Jλ k se poate utiliza formula binomului lui Newton, în care se ţine seama 

de faptul că J0 i este o matrice care are elementele de pe supradiagonala i egale cu unitatea, 

iar toate celelalte elemente sunt nule. Dacă λ ≠ 0, Jλ k nu este diagonalizabilă pentru nici 

un k ∈ IN ∗ . J0 k = 0, deci diagonală, pentru orice k ≥ n. d) Se rezolvă ecuaţia XJ λ = I n 

care, scrisă pe coloane, se reduce la rezolvarea sistemelor liniare λx 1 = e 1, x j−1+λx j = e j, 

j = 2 : n (în această ordine!). Nu. 

P4.17 Fie ˜H(λ) = H − λI n. Matricea ˜H 21(λ) def 

= ˜H (2:n,1:n−1) (λ) este nesingulară 

∀λ ∈ IC, deci rang ˜H(λ) ≥ n − 1, ∀λ ∈ IC. În particular, H = ˜H(0) şi, prin urmare, 

rangul lui H nu poate fi decât n sau n−1. Vectorii proprii x asociaţi unei valori proprii 

λ ∈ λ(H) trebuie să satisfacă ˜H(λ)x = 0, de unde rezultă x(1 : n−1) = v(λ)x n cu v(λ) = 

−1 

= ˜H 21 (λ) ˜H (2:n,n) (λ), i.e. toţi vectorii proprii asociaţi lui λ sunt de forma x = ρ[v T (λ) 1] T 

cu ρ ∈ IC \ {0} arbitrar, indiferent de ordinul de multiplicitate algebrică a lui λ. Deci, 

multiplicitatea geometrică a unei valori proprii a unei matrice Hessenberg ireductibile nu 

poate fi decât 1 şi, prin urmare, o astfel de matrice cu valori proprii multiple nu este 

diagonalizabilă. 

P4.18 a) Se calculează det(λI n − C), e.g. prin dezvoltare după elementele primei 

linii. b) C este nesingulară dacă şi numai dacă 0 ∉ λ(C), i.e. p(0) = p n ≠ 0. Pentru 

calculul inversei recomandăm rezolvarea ecuaţiei matriceale CX = I n pe blocuri definite 

convenabil sau considerarea unei permutări F = PC a liniilor astfel încât matricea F este 

inferior triunghiulară, apoi C −1 = F −1 P. c) Fie x un vector propriu al matricei C asociat 

valorii proprii λ. Considerând x n ≠ 0, e.g. x n = 1 rezultă x k = λ n−k . Obţinem o matrice 

a vectorilor proprii de tip Vendermonde care este nesingulară dacă şi numai dacă valorile 

proprii sunt distincte, singura situaţie în care C este diagonalizabilă. La acest ultim rezultat 

se ajunge şi observând că matricea C are o structură superior Hessenberg ireductibilă 

şi aplicând rezultatul problemei precedente. Pentru calculul unui vector propriu al matricei 

C T asociat aceleeaşi valori proprii, presupuneţi x 1 ≠ 0 şi rezolvaţi sistemul. Se obţine 

x k = λ k−1 +p 1λ k−2 +··· +p k−1 . d) Mai sunt două structuri cu coeficienţi polinomului 

pe ultima linie, respectiv, pe ultima coloană, în ordine inversă. 

P4.19 a) O matrice reală de rotaţie plană P jk (i.e. în planul (j,k)), de ordinul n, 

definită de scalarii c şi s are, evident, n − 2 valori proprii egale cu 1, celelalte două fiind 

λ j,k = c ± is. Putem lua e l drept vectori proprii asociaţi valorilor proprii λ l = 1. Dacă 

s ≠ 0, x j,k = e j ± ie k sunt vectori proprii asociaţi valorilor proprii complexe. b) Un 

reflector elementar real U = I n − 2uu T cu u ∈ IR n , ‖u‖ = 1, fiind simetric are toate 

valorile proprii reale şi fiind ortogonal are toate valorile proprii de modul 1. Deci valorile 

proprii sunt 1 sau −1. Fie acum un reflector elementar V astfel încât V T u = e 1. Avem 

V T UV = I n − 2e 1e T 1 = diag(−1,1,...,1), i.e. există o singură valoare proprie egală cu 

−1. Un set complet de vectori proprii este dat de coloanele lui V. 

P4.20 Presupunem că matricea normală A este triunghiulară. Avem A = UΛU H 

cu U unitară şi Λ diagonală. Atunci A H = U¯ΛU H . Rezultă a ij = λ iU(i,:)(Ū(j,:)) T şi 

ā ji = ¯λ iU(i,:)(Ū(j,:))T , unde λ i = Λ(i,i). Deci, dacă a ij = 0, atunci şi a ji = 0. Pentru


cazuri particulare de matrice normale, demonstraţia poate fi mai directă. De exemplu, 

dacă matricea unitară Q este, e.g. superior triunghiulară, atunci inversa ei Q −1 = Q H 

este simultan superior [ şi inferior ] triunghiulară, i.e. diagonală. 

α β 

P4.21 Fie A = . Din A T A = AA T rezultă β 2 = γ 2 . Dacă γ = β matricea 

γ δ 

este simetrică, iar dacă γ = −β rezultă δ = α. 

P4.22 Fie A normală şi S = Q H AQ o formă Schur reală a lui A, în care, fără a reduce 

generalitatea, putem presupune că valorile proprii reale (în număr de q) sunt situate în 

primele q poziţii diagonale. Deci S este normală şi are structura 

⎡ 

⎤ 

R A 1,q+1 ··· A 1p 

A q+1,q+1 ··· A q+1,p 

S = ⎢ 

⎣ . .. 

. ⎥ .. ⎦ , 

A pp 

cu R ∈ IR q×q superior triunghiulară. Din (S T S = SS T ) 11 rezultă R T R = RR T + 

+ ∑ p 

Bj, unde j=q+1 Bj = A1jAT 1j, j = q + 1 : p, sunt matrice simetrice, pozitiv semidefinite. 

Cum însă tr(R T R) = tr(RR T ), rezultă ∑ p 

trBj = 0. În continuare, din 

j=q+1 

faptul că λ i(B j) ≥ 0 pentru toţi i, rezultă trB j = ∑ λi(Bj) ≥ 0. Deci, trBj = 0 pentru 

i 

toţi j şi, prin urmare, λ i(B j) = 0 pentru toţi i şi j. Cum însă o matrice simetrică având 

toate valorile proprii nule este nulă (demonstraţi!) B j = 0 şi, de aici, A 1j = 0 pentru toţi 

j. Acum R T R = RR T , i.e. R este normală, şi cum este triunghiulară, este diagonală (v. 

problema 4.20). În continuare se procedează similar. Din (S T S = SS T ) q+1,q+1 rezultă 

A q+1,j = 0, j = q+2 : p şi că blocul 2 × 2 A q+1,q+1 este normal. Având valori proprii 

complexe, conform problemei 4.21, are structura din teoremă etc. Reciproca este imediată. 

P4.23 c) Fie B = 1 (A + 2 AH ) şi C = 1 (A − 2 AH ). Atunci A = B + C şi, conform 

punctelor a), b), B este hermitică iar C este antihermitică. Presupunem că avem şi A = 

= ˜B+ ˜C cu ˜B hermitică şi ˜C antihermitică. Atunci2B = A+A H = ˜B+ ˜C+ ˜B H + ˜C H = 2˜B. 

Deci B = ˜B. Analog, 2C = A−A H = 2˜C, i.e. C = ˜C. Deci descompunerea este unică. 

d) Se utilizează c) cu S = B şi T = −iC. 

P4.24 Se utilizează relaţiile din definiţii. 

P4.25 Se utilizează relaţiile din definiţii şi expresiile părţilor hermitică şi antihermitică 

(v. soluţia problemei 4.23). 

P4.26 Se consideră un set de n vectori liniar independenţi, e.g. ortogonali. 

P4.27 Fie P o matrice de permutare. Întrucât P este unitară, A este normală (hermitică, 

antihermitică, simetrică, antisimetrică) dacă şi numai dacă la fel este şi matricea 

C = P T AP. Putem alege P astfel încât B = C(1 : k,1 : k). a) Evident. b) Nu. De 

[ ] 6 3 1 

exemplu, matricea A = 1 3 3 este normală, dar B = A(1:2,1:2) nu este. 

3 −1 3 

P4.28 Conform teoremei 4.3, λ min(A) ≤ µ ≤ λ max(A). 

P4.29 Dacă B = Q H AQ ∈ IC p×p , unde Q H Q = I p, atunci aplicând matricei B teorema 

Courant-Fisher avem µ k = max dimV=k min x∈VS x H Q H AQx, unde V S este mulţimea 

vectorilor de normă euclidiană unitară din subspaţiul V ⊂ IC p . Acum, este uşor de constatat 

că Ṽ = {y ∈ IC n | y = Qx, x ∈ V} este un subspaţiu liniar al lui IC n , de aceeaşi 

dimensiune cu dimensiunea lui V (i.e. k) şi că mulţimea tuturor subspaţiilor Ṽ este 

numai o parte a mulţimii tuturor subspaţiilor de dimensiune k din IC n . Prin urmare, 

λ k = max dim Ṽ=k min x∈ṼS xH Ax ≥ µ k . Pentru cel de al doilea set de inegalităţi se utilizează 

cealaltă caracterizare minimax a valorilor proprii din teorema Courant-Fisher.


[ ] 

P4.30 Fie matricea hermitică B = U1 H a11 βe T 1 

AU 1 = = F + G, unde F = 

¯βe 1 C 

[ ] [ ] 

a11 0 0 βe 

T 

= , G = 1 

= F + G, obţinută după aplicarea primului pas al 

0 C ¯βe 1 0 

algoritmului de tridiagonalizare TQ. Evident µ = ‖A(1,2 : n‖ 2 = |β|, iar matricele F şi G 

sunt hermitice. Cum a 11 ∈ λ(F), iar λ min(G) = −µ şi λ max(G) = µ, conform teoremei 4.6 

rezultă exisţenţa unei valori proprii λ a lui B, i.e. alui A, astfel încât a 11−µ ≤ λ ≤ a 11+µ, 

q.e.d. 

[ ] [ ] 

1 i 1 i 

P4.31Deexemplu, matricele complexeA = şiB = suntsimetrice. 

i 1 i i 

A este normală, dar B nu. 

P4.32 Fie S = Q H AQ forma Schur a lui A şi M = max i=1:n−1 (|s ij|). Considerăm matricea 

diagonală D ∈ IR n×n de forma D = diag(1,δ,δ 2 ,...,δ n−1 ). Atunci ‖D −1 SD‖ ∞ = 

j=i+1:n 

= max ∑ n 

i=1:n(|λ i|+ 

j=i+1 |sij|δj−i ) ≤ max ∑ n 

i=1:n(|λ i|+M 

j=i+1 δj−i ) ≤ max i=1:n(|λ i|+ 

+M ∑ n−1 

j=1 δj ). Alegând δ astfel încât ∑ n−1 

j=1 δj ≤ M (arătaţi că se poate!) atunci se 

ǫ 

obţine inegalitatea ‖D −1 Q H AQD‖ ∞ ≤ ρ(λ)+ǫ. Este uşor de văzut că ‖·‖ : IC n×n → IR + 

definită de ‖X‖ = ‖D −1 Q H XQD‖ ∞ este o normă matriceală consistentă. 

P4.33Pentruorice matrice T ∈ IC n×n nesingulară şi B = T −1 AT avemB k = T −1 A k T. 

Prin urmare, A este convergentă dacă şi numai dacă este convergentă orice matrice asemenea 

cu A. Pentru matricele diagonalizabile rezultatul este imediat. În cazul general, se 

utilizează forma canonică Jordan arătând că un bloc Jordan J λ (vezi notaţia din problema 

4.16) este convergent dacă şi numai dacă |λ| < 1. 

P4.34 Pentru fiecare matrice şi transpusa ei se aplică teorema Gershgorin şi se intersectează 

domeniile astfel obţinute. 

P4.35 Punctul cel mai depărtat de originea planului complex al reuniunii discurilor 

Gergshgorin se află la distanţa δ = max i=1:n(|a ii| +r i) = max ∑ n 

i=1:n( |aij|) = ‖A‖∞. 

j=1 

Prin urmare ρ(A) ≤ ‖A‖ ∞. Aplicând acelaşi raţionament şi pentru matricea A T se obţine 

evaluarea ρ(A) ≤ min(‖A‖ 1,‖A‖ ∞), rezultat în deplină concordanţă cu teorema 4.10. 

P4.36 a) Se utilizează b ij = a ij 

δ j 

δ i 

. În principiu, da (v. punctul b)). b) Dacă A 

are toate elementele pozitive avem r = min D‖D −1 AD‖ ∞ = min τ>0(max(a 11+τa 12,a 22+ 

+ 1 τ a21)) (am notat τ = δ 2 

δ1 

). Se obţine r = ρ(A). c) r = 3+ √ 7 > √ 14 = ρ(A). 

P4.37 Din teorema discurilor Gershgorin se obţine λ(A) ⊂ D = [−21,31]. Da, de 

exemplu scalând cu D = diag(1,2,2) se obţine λ(A) ⊂ D ′ = [−13,27]. (Spectrul lui A 

este λ(A) = {−9,−9,27}). 

P4.38 a) 0 nu aparţine nici unui disc Gersgorin, deci 0 ∉ λ(A). b) Toate discurile 

Gershgorin sunt situate în IC + = {λ ∈ IC | Reλ > 0}. c) Caz particular al lui b). 

P4.39 a) Dacă A are (cel puţin) o linie nulă, atunci rezultatul este evident. În caz 

contrar, fie δ i = ∑ n 

|aij| > 0, i = 1 : n, şi D = diag(δ1,δ2,...,δn). Matricea B = j=1 D−1 A 

are ρ(B) ≤ ‖B‖ ∞ ≤ 1. Deci, |detB| = ∏ n 

|λi(B)| ≤ 1. Inegalitatea cerută se obţine din 

i=1 

|detA| = |detD|·|detB| ≤ |detD|. b) Se aplică a) pentru matricea A T . 

P4.40 Rezultatul generalizează teorema discurilor lui Gershgorin, care se obţine luând 

α = 1 (pentru A) sau α = 0 (pentru A T ). De aceea considerăm numai cazul α ∈ (0,1). 

Presupunem r i > 0, c i > 0, i = 1 : n (altfel există o linie sau o coloană cu toate elementele 

extradiagonale nule, care poate fi deplasată în prima poziţie printr-o transformare de


asemănare tip permutare). Vom utiliza inegalitatea Hölder, i.e. 

( 

n∑ n∑ 

) 1 

p 

( n∑ 

)1 

q 

|α i||β i| ≤ |α i| p |β i| q , unde p > 1, 

i=1 i=1 

i=1 

1 

p + 1 q = 1. 

Fie λ ∈ λ(A), x ≠ 0 un vector propriu asociat şi x i = x(i). De asemenea, fie p = 1 şi α 

q = 1 . Avem 1−α ∣ ∣∣∣∣∣∣ n∑ n∑ n∑ 

|λ−a ii||x i| = ∣ a ijx j ≤ |a ij||x j| = |a ij| α (|a ij| 1−α |x j|) ≤ 

i.e. 

sau 

≤ 

⎛ 

⎜ 

⎝ 

n∑ 

j=1 

j≠i 

|a ij| 

∣ 

j=1 

j≠i 

j=1 

j≠i 

⎞α⎛ 

⎟ ⎜ 

n∑ 

⎠ ⎝ (|a ij| 1−α |x j|) 1 

j=1 

j≠i 

|λ−a ii| 

r α i 

|x i| ≤ 

( |λ−aii| 

|x i| 

r α i 

1−α 

⎛ 

⎜ 

⎝ 

⎞ 

⎟ 

⎠ 

1−α 

= r α i 

n∑ 

|a ij||x j| 

j=1 

j≠i 

) 1 

1−α 

≤ 

j=1 

j≠i 

⎛ 

⎜ 

⎝ 

1 

1−α 

n∑ 

(|a ij| 1−α |x j|) 1 

j=1 

j≠i 

⎞ 

⎟ 

⎠ 

n∑ 

|a ij||x j| 

j=1 

j≠i 

Însumând ultimele inegalităţi în raport cu i obţinem 

i.e. 

n∑ 

( |λ−aii| 

i=1 

r α i 

) 1 

1−α 

k=1 

|x i| 

1 

1−α ≤ 

r α k 

n∑ 

i=1 

n∑ 

|a ij||x j| 

j=1 

j≠i 

1−α 

, 

1 

1−α. 

1 

1−α = 

( 

n∑ 

( ) ) 

1 

1−α |λ−akk | 

1 

c k − |x k | 1−α ≥ 0. 

n∑ 

c j |x j| 

j=1 

1−α 

⎞ 

⎟ 

⎠ 

1 

1−α, 

Evident, în ultima inegalitate, coeficienţii pentru |x k | 1−α nu pot fi toţi negativi. Prin 

urmare, există k astfel încât |λ−a kk | ≤ rkc α 1−α 

k 

, q.e.d. 

P4.41 Fie λ ∈ λ(A), x ≠ 0 un vector propriu asociat şi x i = x(i). De asemenea, fie 

|x p| = max i=1:n|x i|. Dacă x p este singura componentă nenulă a lui x, atunci λ = a pp şi, 

întrucât a ii ∈ D pentru toţi i ∈ 1 : n, rezultă λ ∈ D. Presupunem, în continuare, că x 

are cel puţin două componente nenule şi fie x q ≠ 0 cea de a două componentă, în ordinea 

descrescătoare a modulelor, i.e. |x p| ≥ |x q| ≥ |x i|, i = 1 : n. i ≠ p,q. Avem 

∣ ∣∣∣∣∣∣ n∑ n∑ 

|λ−a pp||x p| = 

a pjx j ≤ |a pj||x q| = r p|x q|, 

∣j=1 

j≠p 

j=1 

j≠p 

1 

1−α 

,


|x q| 

unde r p este raza discului Gershgorin asociat liniei p. Rezultă |λ−a pp| ≤ r p 

|x . Similar p| 

|x p| 

se arată |λ−a qq| ≤ r q . Obţinem |λ−app||λ−aqq| ≤ rprq, i.e. λ ∈ D, q.e.d. 

|x q| 

P4.42 Ambele valori proprii ale lui A sunt egale cu −1. Un vector propriu unitar 

asociat este x = (1/ √ [ ] 

1 

2) . Pentru obţinerea unei forme Schur se aplică deflaţia ortogonală 

în cazul real, respectiv deflaţia unitară în cazul complex sau pentru obţinerea 

1 

formelor Schur complexe ale unor matrice reale. De exemplu, luând Q = [x y], unde 

x T y = 0, obţinem y = ±(1/ √ [ ] 

1 

2) (de asemenea cu ‖y‖ = 1), de unde rezultă 

−1 

[ ] 

−1 ±4 

Q T AQ = . Să remarcăm faptul că deşi matricea A este defectivă (i.e. nu 

0 −1 

este simplă) forma Schur există şi se poate construi. Valorile proprii ale lui B nu sunt 

reale, deci o FSR a lui B este chiar B etc. 

P4.43Fie V ∈ IC n×(n−k) ocompletare aluiU pânălaomatrice unitară, [ i.e. astfelîncât ] 

U 

Q = [U V ] este unitară. Atunci f(X) = ‖Q H H AU −X 

(AU −UX)‖ F = ‖ 

V H ‖ F = 

AU 

√ 

= ‖U H AU −X‖ 2 F +‖V H AU‖ 2 F . Evident, minimul lui f este ‖V H AU‖ F şi se atinge 

pentru X = U H AU. 

P4.44 Prezentăm două soluţii: Soluţia 1. Fie S = U H AU o formă Schur a lui A. 

Notând T = U H BU, din AB = BA rezultă ST = TS, cu S superior triunghiulară cu 

elementele diagonale distincte. Din egalitatea primelor coloane a acestei relaţii rezultă 

sistemul liniar nesingular omogen (S(2:n,2:n)−s 11I n−1)T(2:n,1) = 0, de unde obţinem 

T(2:n,1) = 0, i.e. T este superior triunghiulară în prima coloană, etc. Soluţia 2. Dacă 

λ ∈ λ(A) şi Ax = λx, atunci BAx = λBx, A(Bx) = λ(Bx) şi, întrucât valorile proprii ale 

lui A sunt distincte, A are un set complet de vectori proprii liniar independenţi şi Bx = αx 

(Bx este un vector propriu atât pentru A cât şi pentru B). Întrucât procedura de deflaţie 

pentru reducerea la forma Schur utilizează vectori proprii, forma Schur a matricelor A şi 

B se obţine cu aceeaşi transformare de asemănare (argumente similare se pot aduce şi în 

cazul real). 

P4.45 a) Fie U 1 un reflector complex (hermitic, v. cap.3) astfel încât U1 H x = ρe 1, 

ρ ≠ 0. Atunci v = U1e1 este vectorul căutat. Pentru calculul său (i.e. al elementelor 

1¯ρ 

definitorii ale reflectorului) se poate utiliza procedura Hc şi relaţia de mai sus. b) Se 

verifică imediat că Bx 1 = 0 şi Bx B i = λ ix B i , i = 2 : n. Altfel, consideraţi o matrice unitară 

U astfel încât Ue 1 este coliniar cu x 1 şi calculaţi U H BU. 

P4.46 a) Prezentăm două soluţii. Soluţia 1 (geometrică). Fie ˜X complementul 

ortogonal al subspaţiului Imx şi Ỹ complementul ortogonal al subspaţiului Imy. Fie 

Ũ = ˜X ⋂ Ỹ şi V = ˜X + Ỹ. Întrucât dim ˜X = dimỸ = n − 1 şi dim(V) ≤ n, rezultă 

n − 1 ≥ dimŨ = dim ˜X + dimỸ − dimV ≥ n − 2, cazul generic fiind dimŨ = n − 2. 

Fie, în cazul generic, Ũ ∈ IC n×(n−2) o matrice ale cărei coloane formează o bază ortogonală 

pentru Ũ, ˜X = [x2 Ū ] ∈ IC n×(n−1) o matrice ale cărei coloane formează o bază 

ortogonală pentru ˜X şi Ỹ = [y 2 Ũ ] ∈ IC n×(n−1) o matrice ale cărei coloane formează 

o bază ortogonală pentru Ỹ. Definim matricele X = [x Ỹ ] şi Y = [y ˜X]. Avem 

⎡ 

y H ⎤ ⎡ ⎤ 

Y H X = ⎣ y2 

H ⎦ [ ] 1 0 0 

x x 2 Ũ = ⎣ 0 y2 H x 2 0 ⎦ . Arătaţi că x2 şi/sau y 2 pot 

Ũ H 0 0 I n−2 

fi scalaţi astfel încât y2 H x 2 = 1. Soluţia 2 (procedurală). Fie U 1 reflectorul pentru care


U H 1 y = αe 1. Notăm U H 1 X = Z = 

[ ] 

z11 Z 12 

, U1 H Y = W = 

Z 21 Z 22 

[ 

z11 

[ ] 

α W12 

. Din 

0 W 22 

] 

condiţiile Xe 1 = x şi Y H X = W H Z = I n, rezultă ecuaţiile = U 

Z 1x, W22Z H 22 = 

21 

= I n−1, W12z H 11 + W22Z H 21 = 0, care sunt satisfăcute, de exemplu, pentru Z 22 = I n−1, 

W 22 = I n−1, W 12 = − 1 

¯z 11 

Z21. H b) Dacă λ este o valoare proprie simplă a matricei A, conform 

problemei 4.9, vectorii proprii asociaţi x (la dreapta) şi y (la stânga) satisfac condiţia 

y H x ≠ 0 şi se pot scala astfel încât y H x = 1. Fie matricea X şi X −1 = Y H calculate ca la 

punctul a). Atunci X −1 AX = 

următorul. 

[ y 

H 

Ỹ H ] 

A [ x ˜X 

] = 

[ λ 0 

0 Ỹ H A ˜X 

1. Pentru k = 1 : n−1 

1. x = vp(A(k : n,k : n)) 

2. y = vp((A(k : n,k : n)) T ), y = ȳ 

3. x = x 

y H x 

4. Se calculează matricele ˜X şi Ỹ (v. punctul a)) 

5. A(k,k) = y H A(k : n,k : n)x 

6. A(k,k +1 : n) = 0, A(k +1 : n,k) = 0, 

7. A(k +1 : n,k +1 : n) ← Ỹ H A(k +1 : n,k +1 : n) ˜X. 

] 

. Algoritmul este 

P4.47 Pentru A, dacă vectorul iniţial are prima componentă nenulă, rezultatul este 

±e 1, întrucât A(±e 1) = 5(±e 1) şi λ(A) = {5,2,1}. Pentru B avem λ(B) = {α,1− √ β, 

1+ √ β}. Deci, B va avea o valoare proprie dominantă în următoarele situaţii: a) β ≤ 0 

şi |α| > √ 1−β şi b) β > 0 şi |α| ≠ 1+ √ [ ] 

β. 

[ ] 

−2 1 

1 

P4.48 Fie matricea A = şi un vector iniţial y (0) = . Atunci vectorul 

0 1 

0 

curent generat de metoda puterii va fi y (k) = Ak y (0) 

‖A k y (0) ‖ = (−1)k y (0) şi, prin urmare, 

e k = ‖y (k) −y (k−1) ‖ = ‖(−1) k y (0) −(−1) k−1 y (0) ‖ = 2 pentru toţi k deşi y (0) este un vector 

propriu asociat valorii proprii dominante λ 1 = −2 a matricei A (de reţinut că criteriul 

utilizat în algoritmii 4.1 şi 4.2 funcţionează întrucât 1 − |(y (k) ) T y (k−1) | = 0). Evident, 

situaţia de mai sus se datorează faptului că valoarea proprie dominantă este negativă şi, 

deşi vectorii din şir sunt orientaţi corespunzător ca direcţie, îşi schimbă sensul la fiecare 

pas. În cazul complex, vectorii proprii unitari sunt determinaţi până la o multiplicare 

cu un număr complex de modul unitar, i.e. e iφ cu φ ∈ IR şi, prin urmare, este posibil 

ca vectorii din şirul generat de metoda puterii să tindă către mulţimea vectorilor proprii 

unitari asociaţi valorii proprii dominante deşi diferenţa dintre doi vectori consecutivi să 

nu tindă către zero. Pentru metoda puterii inverse motivaţiile sunt aceleaşi. 

P4.49 Se aplică sistematic lema de deflaţie unitară. Rezultă următoarea schemă de 

calcul. 

1. Pentru k = 1 : n−1 

1. ˜x k = vp(A(k : n,k : n)) 

2. ˜x k = ˜x k 

‖˜x k ‖ 

3. Se determină o matrice unitară ˜Q k astfel încât ˜Q k e 1 = ˜x k 

4. A(k : n,k : n) = ˜Q H k A(k : n,k : n) 

5. A(:,k : n) = A(:,k : n)˜Q k .


Dacămatricea A are valorile proprii distincte, λ k = A(k,k), z k este soluţia sistemului liniar 

(A(1 : k−1,1 : k−1)−λ k I k−1 )z k = −A(1 : k−1,k : n)˜x k (unde A este matricea dată aflată 

în starea de dupăexecuţia pasului [ ] curent k din schema de mai sus) şi Q k = diag(I k−1 , ˜Q k ), 

zk 

atunci x k = Q 1Q 2...Q k−1 este vector propriu al matricei iniţiale asociat valorii 

˜x k 

proprii λ k . 

P4.50 Schema de calcul este similară celei care stă la baza algoritmului HQ: 

1. Pentru k = 1 : n−2 

1. Se determină i k astfel încât |a ik k| = max i=k+1:n (|a ik |) 

2. A(i k ,k : n) ↔ A(k +1,k : n) 

3. Se determină matricea inferior triunghiulară elementară M k+1 

astfel încât (M k+1 A)(k +2 : n,k) = 0 

4. A = M k+1 A 

5. A(:,k +1) ↔ A(:,i k ) 

6. A = AM −1 

k+1 . 

Schema este de două ori mai eficientă decât algoritmul HQ. 

P4.51 Ideea este următoarea: găsiţi un reflector elementar (hermitic) U 1, astfel încât 

U1 H z = ρe 1. Calculaţi A 1 = U1 H AU 1. Apoi, reduceţi A 1 la forma superior Hessenberg 

H = ˜Q H A 1 ˜Q folosind algoritmul HQ. Matricea Q = U1 ˜Q defineşte transformarea unitară 

dorită, întrucât Q H z = Un−1U H n−2...U H 2 H U1 H z = ρe 1. 

P4.52 Testaţi, parcurgând prima subdiagonală, că nu există blocuri diagonale de ordin 

mai mare decât 2 şi, apoi, că blocurile de ordinul 2 au valorile proprii complexe. 

P4.53 Dacă Q = Q H este reflectorul (hermitic) pentru care Q H u = ρe 1, atunci S = 

= Q H AQ = I n +ρe 1v H Q este superior triunghiulară şi λ 1 = s 11 = 1+ρv H q 1, unde q 1 = 

= Qe 1 = 1 u este prima coloană a lui Q. Deci ρ λ1 = 1+vH u. Celelalte n−1 valori proprii 

sunt λ i = s ii = 1, i = 2 : n. u este vector propriu asociat lui λ 1. Fie acum, Y reflectorul 

(hermitic) astfel încât Y H v = σe 1. Atunci SY(:,2:n) = Y(:,2:n), i.e. y j = Y(:,j), 

j = 2 : n, sunt vectori proprii ai matricei S, iar x j = Qy j sunt vectori proprii ai matricei 

A, asociaţi valorilor proprii egale cu 1. 

P4.54 Aplicând [ lema de ] deflaţie ortogonală, se calculează matricea ortogonală U astfel 

λ c 

încât U T T 

HU = . Fie acum matricea ortogonală V, de ordinul n−1, astfel încât 

0 B 

G = V T BV este superior Hessenberg (utilizaţi algoritmul HQr). Matricea căutată este 

Q = Udiag(1,V). 

P4.55 a) Secvenţa de pustmultiplicare a matricii superior triunghiulare R cu matricile 

P k şi M −1 

k 

afectează la pasul curent k numai coloanele k şi k+1, de unde rezultă imediat 

conservarea structurii superior Hessenberg. 

P4.56 Fără a reduce generalitatea, admitem ca restricţie a matricei A la subspaţiul 

A-invariant căutat chiar submatricea A 22. Fie, în această ipoteză, X def 

= [x 1 x 2] ∈ IR 

[ ] 

n×2 

X1 

şi considerăm partiţia X = X 2 , conformă cu dimensiunile blocurilor diagonale. Din 

X 3 

ecuaţia matricială AX = XA 22 rezultă X 3 = 0 ca unică soluţie a ecuaţiei Sylvester 

omogene A 33X 3 = X 3A 22. În continuare, X 2 este orice matrice reală nesingulară 2 × 2 

care comută cu A 22 (e.g. X 2 = I 2), iar X 1 se obţine rezolvând ecuaţia matriceală Sylvester 

A 11X 1 −X 1A 22 = −A 12X 2. 

P4.57 Avem λ 1(A) = 2 − √ 5, λ 2(A) = 2 + √ 5, iar doi vectori proprii asociaţi sunt 

x 1 = 

[ 

2 

1− √ 5 

] 

, x 2 = 

[ 

2 

1+ √ 5 

] 

. Cei doi vectori proprii sunt ortogonali întrucât


x T 1x 2 = 0. Pentru celelalte matrice puteţi utiliza calculatorul. 

P4.58 Se utilizează reflectori complecşi care aplicaţi unui vector complex asigură 

obţinerea unui vector real cu zerouri în poziţiile necesare (v. cap. 3). (În pachetul de 

programe LAPACK astfel de reflectori sunt folosiţi curent). 

P4.59 Matricea Q H AQ rămâne antihermitică (în cazul real, antisimetrică) oricare ar 

fi matricea unitară (ortogonală) Q. Prin urmare, în aplicarea procedurii de reducere la 

forma superior Hessenberg, matricele obţinute după fiecare pas al reducerii şi matricea 

finală sunt antihermitice (antisimetrice). O matrice superior Hessenberg antihermitică 

(antisimetrică) este tridiagonală. Exploataţi aceste observaţii structurale. 

−γǫ 2 

P4.60 a) Se obţine H k+1 (2,1) = 

(α−β) 2 +ǫ2, ceea ce indică o convergenţă pătratică 

la forma Schur. b) În cazul simetric se obţine T −ǫ 3 

k+1(2,1) = T k+1 (1,2) = 

(α−β) 2 +ǫ 2, 

ceea ce indică o convergenţă cubică la forma diagonală. 

P4.61 b) Arătăm mai întâi că există o matrice de permutare P (produs de [ matrice ] de 

0 

permutare elementare) astfel încât PBP T di 

= diag(D 1,...,D n), unde D i = . 

d i 0 

Pentru claritate, vom considera numai cazul când n este par. Mai întâi, calculăm o matrice 

asemenea cu B, aplicând matricele de permutare elementare P n+1,2n, P n+2,2n−1, ..., 

P 3n/2,3n/2+1 . Obţinem matricea C = Q T AQ care are elemente nenule numai pe diagonala 

secundară; mai precis, aceste elemente sunt situate din colţul din dreapta sus spre colţul 

din stânga jos în ordinea d 1, d 2, ..., d n, d n, ..., d 2, d 1. Atunci, aplicând permutările 

elementare P 2,2n, P 4,2n−2, ..., P n,n+2, C este adusă la o formă cu blocuri diagonale 2×2, 

i.e. diag(D 1,D 3,...,D 4,D 2). Permutarea acestor blocuri diagonale pentru a obţine forma 

diag(D 1,D 2,...,D n) poate fi realizată cu uşurinţă utilizând un algoritm de sortare. 

P4.62 a) Avem T ′ = L −1 TL, deci matricele şirului sunt asemenea şi, în anumite 

condiţii (vezi b)), [ şirul poate ] pune asimptotic în evidenţă valori proprii ale matricei T. 

α β 

b) Dacă T = , atunci T ′ are elementele α ′ = α + β2 

β γ 

, α β′ = α√ β αγ −β2 , 

γ ′ = γ− β2 . Tinând seama de faptul că λ1, λ2 suntinvarianţi ai şirului, convergenţa şirului 

α 

matriceal este echivalentă cu convergenţa şirului numeric (α k ) k∈IN definit de recurenţa 

α ′ = σ − κ , unde σ = λ1 +λ2 şi κ = λ1λ2 sunt constante. Arătaţi că acest din urmă şir 

α 

este monoton şi mărginit şi că limita sa este λ 1. 

P4.63 a) Presupunem că matricea tridiagonală simetrică reală T are o valoare proprie 

multiplă λ. Pentru precizarea ideilor, considerăm că ordinul de multiplicitate este 2. 

Atunci există doi vectori proprii ortogonali x şi y asociaţi valorii proprii λ, i.e. Tx = λx 

şi Ty = λy, cu y T x = 0. Presupunem că T este ireductibilă, i.e. toate elementele subşi 

supradiagonale [ sunt ] nenule. Considerăm matricea S = T −λI n cu următoarea partiţie 

S11 S 12 

S = cu blocul S 

S 21 S 12 ∈ IR (n−1)×(n−1) nesingular. Atunci rezultă x(2: n) = 

22 

= S −1 

12 

S11x(1). Întrucât x ≠ 0, rezultă x(1) ≠ 0. Absolut similar y(2:n) = S−1 

12 

S11y(1) cu 

y(1) ≠ 0. Rezultă că x şi y sunt coliniari ceea ce contrazice faptul că sunt ortogonali. Deci 

T nu poate fi ireductibilă. Dacă ordinul de multiplicitate este mai mare decât 2 atunci, 

conform celor de mai sus, există două elemente extradiagonale simetrice nule care ”sparg” 

matricea T în două matrice tridiagonale simetrice din care cel puţin una are o valoare 

proprie multiplă etc. b) Generic, se constată o grupare a elementelor extradiagonale nule 

înt-un bloc diagonal situat în colţul din dreapta jos. Explicaţia este următoarea: aplicarea 

bilaterală a reflectorilor care realizează tridiagonalizarea aduce pe poziţiile (k+1,k) valori 

egaleîn modulcunormadevector‖A(k+1 : n,k)‖, valoricare, pentruomatrice iniţialăfără


o structură particulară (în afara simetriei) sunt, în general, nenule. De aceea, elementele 

nule, obligatorii conform punctului a), apar la sfârşitul procesului de tridiagonalizare. 

[ P4.64 Transformările ] [ ortogonale ] [ conservă ][ norma Frobenius. ][ În consecinţă, ] matricele 

app a pq a 

′ 

pp a ′ pq c −s app a pq c s 

şi = 

au aceeaşi normă 

a qp a qq s c a qp a qq −s c 

a ′ qp 

a ′ qq 

Frobenius, i.e. a 2 pp + a 2 qq + 2a 2 pq = (a ′ pp) 2 + (a ′ qq) 2 + 2(a ′ pq) 2 . De asemenea, matricele 

A şi A ′ = J T AJ au aceeaşi normă Frobenius. Notând cu B, B ′ matricele elementelor 

extradiagonale ale matricelor A, respectiv A ′ , şi ţinând seama de faptul că A şi A ′ diferă 

numai în liniile şi coloanele p şi q, avem 

‖B ′ ‖ 2 F = ‖A ′ ‖ 2 F − 

n∑ 

(a ′ ii) 2 = ‖A‖ 2 F − 

i=1 

n∑ 

a 2 ii +a 2 pp +a 2 qq −(a ′ pp) 2 −(a ′ qq) 2 = 

i=1 

= ‖B‖ 2 −2a 2 pq +2(a ′ pq) 2 . 

Prin urmare ‖B ′ ‖ F este minimă dacă a ′ pq = a ′ qp = 0. 

P4.65 a) Dacă γ = 0 rezultatul este imediat. Dacă γ ≠ 0 ecuaţia (J T AJ) 11 

= 

= c 2 α − 2csγ + s 2 β = δ este echivalentă cu cos(2θ + φ) = 2δ−α−β sinφ = √ 2δ−α−β 

2γ 

(α−β) 2 +4γ 2, 

unde θ = arccosc este unghiul ce defineşte rotaţia, iar φ = arcctg α−β . Rezultă că θ există 

∣ 2γ dacă şi numai dacă ∣√ ∣∣ 2δ−α−β ≤ 1, i.e. δ ∈ [λ1,λ 

(α−β) 2 +4γ 2]. b) Se reduce mai întâi A la 

2 

forma tridiagonală, după care se utilizează rezultatul de la punctul a). 

P4.66 Utilizaţi faptul că matricele antihermitice (antisimetrice) rămân astfel la transformări 

unitare (ortogonale) de asemănare. 

√ 

1+4ǫ 

P4.67 κ λ1 = κ λ2 = 

2 

≈ 1 etc. 2ǫ 2ǫ 

P4.68 Considerând o matrice de perturbaţie E = ǫG, cu G = e ie T j şi observând că, în 

∂λ 

acest caz, k 

∂a ij 

= dλ k(ǫ) 

, rezultă expresia dorită. 

dǫ 

P4.69 Acesta este un exemplu celebru [IV] de matrice cu valori proprii bine separate 

şi, totuşi, foarte rău condiţionate. Vectorii proprii la dreapta, respectiv la stânga, asociaţi 

valorii proprii λ k = k, au expresiile x k = [ (−n)n−k 

(n−k)! 

respectiv, y k = [0 0 ··· 0 1 n n2 

2! 

··· 

n k−2 

(k−2)! 

(−n) n−k−1 

(n−k−1)! 

··· (−n)2 

2! 

(−n) 1 0 ··· 0] T ρ, 

n k−1 

(k−1)! ]T τ unde ρ şi τ sunt scalari nenuli arbitrari. 

Folosind, pentru simplitate, norma ‖·‖ ∞ rezultă κ k = ‖x k‖ ∞‖y k ‖ ∞ 

|y T k x k| 

= 

n n−1 

(n−k)!(k−1)! 

număr care, pentru un n semnificativ, este foarte mare. Pentru n = 20 avem κ 1 = κ 20 = 

= 2019 

19! . Folosind formula lui Stirling m! ≈ √ 2πmm m e −m pentru evaluarea factorialului, 

se obţine κ 1 = κ 20 ≈ 2019 e 19 

19 19√ 38π ≈ 4.329·107 . 

P4.70 Acesta este un alt exemplu celebru [IV] de matrice cu o condiţionare foarte 

diferenţiată a valorilor proprii: pentru un n semnificativ, valoarea proprie maximă este 

foarte bine condiţionată pe când valoarea proprie minimă este foarte rău condiţionată. 

a) Se aplică varianta ”simbolică” a eliminării gaussiene. b) Se repetă procedura de la 

punctul a). Pentru n = 20 şi ǫ = 10 −10 avem detF = 1−19!·10 −10 ≈ −1.216·10 7 faţă de 

1 pentru ǫ = 0. 

P4.71 a) Calculaţi valorile proprii λ i, apoi p(λ) = Π(λ−λ i). 

b)Această problemăpreocupăde câtevasecole pe matematicieni care au propus zeci de 

metode pentru rezolvarea ei. Ultima şi cea mai bună metodă constă în formarea explicită 

a unei matrice companion (v. problema 4.18) şi calculul valorilor sale proprii utilizând 

algoritmul QR.


Cap. 5 Descompunerea valorilor singulare 

P5.1 σ(A) = {4+ √ 5,4− √ 5}, σ(B) = {8+ √ 10,8− √ 10}, 

σ(C) = {12+ √ 10, 12− √ [ 10}. ] 

α β 

P5.2 Fie A = . Atunci 

γ δ 

√ √ 

1 

σ 1 = 

2 (α2 +β 2 +γ 2 +δ 2 + (α 2 −δ 2 ) 2 +(β 2 −γ 2 ) 2 +2(αβ +γδ) 2 +2(αγ +βδ) 2 ), 

şi aşa mai departe. 

P5.3 a) Utilizaţi faptul că dacă matricea Q este unitară, atunci şi matricele ¯Q, Q T 

şi Q H sunt unitare. b) Produsul a două matrice unitare este o matrice unitară. c) Fie 

A = UΣV H DVS a matricei A. Dacă α ≠ 0, atunci αA = Ũ|α| ΣV H , cu Ũ = α U |α| 

unitară. 

P5.4 Fie A = UΣV H DVS a matricei A. Presupunem m ≥ n, caz în care avem 

A = U 1Σ 1V H , unde U 1 = U(:,1 : n), Σ 1 = Σ(1 : n, :). Conform unei versiuni evidente 

a propoziţiei 

[ 

5.1 avem 

] 

B = QΛQ H , unde Λ = diag(Σ 1,−Σ 1,0 (m−n)×(m−n) ) şi 

V V 0 

Q = √ 1 √ 

2 

cu U 2 = U(:,n + 1 : m). Coloanele matricei Q sunt 

U 1 −U 1 2U2 

vectori proprii ai matricei B. 

P5.5 Fie C = A + iB = UΣV H def def 

DVS a matricei C şi U r = ReU, U i = ImU, 

def def 

V r = ReV, V i = ImV. Atunci 

[ ] 

A −B 

D = 

B A 

= 

[ 

Ur −U i 

U i U r 

][ 

Σ 0 

0 Σ 

][ ] 

Vr −V i 

, 

V i V r 

la care se adaugă permutările impuse de ordonarea valorilor singulare ale matricei D. 

P5.6 a) O matrice normală fiind unitar (ortogonal) diagonalizabilă, avem Q H AQ = 

= Λ = diag(λ 1,λ 2,...,λ n), cu Q unitară (ortogonală). Rezultă Q H A H AQ = Λ H Λ = 

= diag(|λ 1| 2 ,|λ 2| 2 ,...,|λ n| 2 ). b) Matricea A este normală. Avem λ 1 = 8, λ 2,3 = 2±i √ 6. 

Rezultă σ 1 = 8, σ 2,3 = |λ 2,3| = √ 10. Verificaţi, calculând valorile proprii ale matricei 

B = A T A. 

P5.7 Orice matrice ortogonală sau unitară are toate valorile singulare egale cu 1. 

P5.8 b) Utilizaţi DVS a matricei V pentru a obţine DVS a matricei P = VV H . Sunt 

k valori singulare egale cu 1, iar celelalte sunt nule. 

P5.9 ‖A‖ 2 F = ∑ r 

i=1 σ2 i ≤ rσ1, 2 unde r = rangA şi ‖A‖ 2 = σ 1. 

P5.10 O matrice de permutare este ortogonală (unitară), iar transformările unitare 

conservă normaspectrală. Astfel, fără a reduce generalitatea, putem presupunecăcele k ≤ 

≤ n−1 linii eliminate sunt ultimele k linii ale matricei Q, i.e. putem scrie Q = [P T R T ] T . 

Fie P = UCV H dezvoltarea DVS a matricei P, unde C = diag(c 1,c 2,...c n), cu c 1 ≥ 

≥ c 2 ≥ ... ≥ c n ≥ 0 valorile singulare ale matricei P. Dar Q H Q = P H P + R H R = I n. 

Rezultă √ R H R = I n −VC 2 V H = V(I n −C 2 )V H = VS 2 V H , unde S = diag(s 1,s 2,...s n), 

cu s i = 1−c 2 i 

valorile singulare ale matricei R ordonate crescător. Cum R are cel mult 

n−1 linii, rezultă s 1 = 0, i.e. c 1 = ‖P‖ 2 = 1. 

P5.11 Se utilizează DVS a matricei A. 

P5.12 Dacă A = UΣV T este DVS a lui A, atunci (U, V sunt matrice nesingulare): 

max 

y ∈ IR m \{0} 

x ∈ IR n \{0} 

y T Ax 

‖y‖ 2‖x‖ 2 

= 

max 

z ∈ IR m \{0} 

w ∈ IR n \{0} 

z T U T AVw 

‖Uz‖ 2‖Vw‖ 2 

= 

max 

z ∈ IR m \{0} 

w ∈ IR n \{0} 

z T Σw 

‖z‖ 2‖w‖ 2 

.


P5.13 a) Dacă U 1 ∈ IR m×m , V 1 ∈ IR n×n sunt reflectori elementari astfel încât U 1u = 

= ‖u‖e 1 ∈ IR m , şi V 1v = ‖v‖e 1 ∈ IR n , atunci: 

[ ] 

U1 T ‖u‖‖v‖ 0 

AV 1 = ∈ IR m×n . 

0 0 

Evident, rangA = 1 dacă u ≠ 0, v ≠ 0, şi zero altfel. b) Dacă rangA = 1, atunci 

dezvoltarea valorilor singulare se reduce la A = σ 1u 1v1 H . 

P5.14 Fie ¯w def 

= Q¯v⊥ū, unde Q este o matrice ortogonală (cum calculaţi matricea Q) 

şi w def 

= ¯w/‖¯w‖, u def 

= ū/‖ū‖. Calculaţi o matrice ortogonală C ∈ IR n×(n−2) astfel încât 

U = [u w C] şi V = [w u C] sunt ortogonale (folosiţi factorizarea QR a matricei [u w]). 

Atunci 

⎡ 

u T (I +ū¯v T )w u T (I +ū¯v T )u 0 

U T (I +ū¯v T )V = ⎣ w T (I +ū¯v T )w w T (I +ū¯v T )u 0 ⎦ = 

= 

0 0 I n−2 

⎤ 

[ ] 

uTū¯v T w 1+u T ū¯v T u 0 

1 0 0 

0 0 I n−2 

şi problema a fost redusă la cazul 2×2 (oricum, celelalte n−2 valori singulare ale lui A 

sunt egale cu 1). 

P5.15 Se aplică algoritmul JQ cu precizarea că reflectorii complecşi utilizaţi sunt de 

tipul celor care dau un rezultat real, e.g. pentru x ∈ IC n se obţine U H 1 x = ‖x‖e 1 ∈ IR n . 

P5.16 Matricea T = J H J este tridiagonală, hermitică şi are două valori proprii egale. 

Conform problemei 4.63 (v. cap.4) T este reductibilă, i.e. există i astfel încât T(i+1,i) = 

= ḡ if i = 0. Deci, g i = 0 sau/şi f i = 0. 

P5.17 Pentru a exploata structura superior triunghiulară, se utilizează o secvenţă de 

rotaţii ”modificate”, conform următoarei scheme de calcul: 

1. Pentru k = n : −1 : 3 

1. Pentru i = 1 : k −2 

1. Se calculează rotaţia modificată P i,i+1 astfel încât (P H i,i+1A)(i,k) = 0. 

2. A ← P H i,i+1A % Apare un element nenul în poziţia (i+1,i). 

3. Se calculează rotaţia modificată Q i,i+1 astfel încât (AQ i,i+1)(i+1,i) = 0. 

2. A ← AQ i,i+1. 

Pentru n = 4, primul pas al ciclului exterior se desfăşoară astfel: 

A ← P H 12A = 

A ← P H 23A = 

⎡ 

⎢ 

⎣ 

⎡ 

⎢ 

⎣ 

× × × ∅ 

+ × × × 

× × 

× 

× × × 0 

× × ∅ 

+ × × 

× 

⎤ 

⎥ 

⎦, A ← AQ 12 = 

⎤ 

⎥ 

⎦, A ← AQ 23 = 

⎡ 

⎢ 

⎣ 

⎡ 

⎢ 

⎣ 

× × × 0 

∅ × × × 

× × 

× 

× × × 0 

× × 0 

∅ × × 

× 

⎤ 

⎥ 

⎦, 

⎤ 

⎥ 

⎦.


P5.18 Utilizând transformări Householder sau Givens, se pot introduce zerouri conform 

modelului următor, dat pentru m = 7, n = 6, p = 3 (pentru precizare am folosit 

rotaţii): 

⎡ 

⎤ ⎡ 

⎤ 

A = 

⎢ 

⎣ 

× × × × × × 

× × × × × × 

× × × × × × 

× × × 

× × × 

× × × 

× × × 

A ← AQ 45Q 46 = 

⎢ 

⎣ 

, A ← P12P H 13A H = 

⎥ ⎢ 

⎦ ⎣ 

⎡ 

⎡ 

A ← P45P H 46P H 47A H = 

⎢ 

⎣ 

⎡ 

A ← AQ 23Q 24 = 

⎢ 

⎣ 

× × × × 0 0 

0 × × × × × 

0 × × × × × 

× × × 

× × × 

× × × 

× × × 

× × × × 0 0 

0 × × × × × 

0 × × × × × 

× × × 

0 × × 

0 × × 

0 × × 

× × 0 0 0 0 

0 × × × × × 

0 × × × × × 

+ + × × × 

0 × × 

0 × × 

0 × × 

× × × × × × 

0 × × × × × 

0 × × × × × 

× × × 

× × × 

× × × 

× × × 

După aceste transformări A este bidiagonală în prima linie şi prima colană. Se obţine o 

problemă similară, dar de dimensiunea (m−1)×(n−1); blocul patrat p×p este deplasat 

cu o poziţie diagonală. 

P5.19 Se aplică mai întâi o secvenţă de rotaţii pe stânga care aduce matricea la o 

formă superior triunghiulară (cu numai două supradiagonale de elemente nenule) după 

care se adaptează schema de calcul de la problema 5.17. 

P5.20 Mai întâi se reduce matricea A la forma superior bidiagonală cu algoritmul 

JQ. Apoi se anulează elementul din poziţia (m,n+1) cu o secvenţă de rotaţii aplicate pe 

dreaptaA ← AP m,m+1P m−1,m+1...P 1,m+1 care deplaseazăelementulalterantpeverticala 

coloanei m+1 până la eliminare. Exemplificăm procesul pentru m = 3, n = 5, 

] 

] 

[ × × 

A = × × 

× + 

[ × × + 

A ← AP 24 = × × ∅ 

× 

⎤ 

, 

⎥ 

⎦ 

⎤ 

, 

⎥ 

⎦ 

⎤ 

. 

⎥ 

⎦ 

[ × × 

, A ← AP 34 = × × + 

× ∅ 

] [ × × ∅ 

, A ← AP 34 = × × 

× 

] 

, 

. 

, 

⎥ 

⎦


P5.21 Fie A = UΣV H , Σ = diag(σ 1,σ 2,...,σ p), cu p = min(m,n), DVS a matricei 

A . Evident, există şirurile de numere reale (γ (k) 

i 

) k∈IN astfel încât lim k→∞γ (k) 

i 

= σ i şi 

γ (k) 

def 

i 

≠ 0 pentru toţi i şi k. Dacă Γ k = diag(γ (k) 

1 ,γ(k) 2 ,...,γ(k) 

def 

p ), şi A k = U Γ k V H , atunci 

toate matricele A k sunt de rang maximal şi lim k→∞ A k = A. Aceasta înseamnă că oricât 

de ”aproape” de orice matrice (inclusiv de matricea nulă) se află matrice de rang maximal. 

De aici necesitatea conceptului de rang numeric în orice problemă de calcul al rangului, 

afectată de erori. 

P5.22 Urmaţi demonstraţia teoremei 5.4. 

P5.23 Dacă(C,S) = (U H AW,V H BW)este DVSGaperechii de matrice (A,B)atunci 

r A = rang(A) = rang(C) şi r B = rang(B) = rang(S), i.e. r A este numărul elementelor 

diagonale nenule ale matricii C, iar r B este numărul elementelor diagonale nenule ale 

matricii S. Pentru determinarea rangului numeric se poate utiliza o toleranţa pentru 

neglijarea elementelor diagonale ”mici” ale matricilor C şi S (v. alg. Rang DVS). 

P5.24 Utilizaţi DVS şi definiţia 5.3. 

P5.25 Urmaţi demonstraţia teoremei 5.3. 

P5.26 a) Utilizând DVS A = U AΣ AVA H şi B = U BΣ BVB H sistemul matriceal dat 

devine echivalent cu sistemul 

{ 

Σ A ˜X − ỸΣ B = ˜C 

˜XΣ T B −Σ T AỸ = ˜D , 

unde ˜X = V H A XV B, Ỹ = U H A YU B, ˜C = U 

H 

A XV B, ˜D = V 

H 

A XU B, care la rândul său, se 

poate scrie explicit sub forma a mn sisteme de două ecuaţii cu două necunoscute 

[ 

σ 

(A) 

i 

σ (B) 

j 

−σ (B) 

j 

−σ (A) 

i 

] [ ] 

˜xij 

= 

ỹ ij 

[ 

˜cij 

] 

. ˜d ij 

P5.27 a) Utilizând DVS A = UΣV T şi ţinând seama de conservarea normei euclidiene, 

problema devine echivalentă cu problema de minimizare min y∈IR n{‖d − Σy‖2 + α‖y‖ 2 } 

(evident, mult mai simplă), unde d = U T b şi y = V T x. 

P5.28 0 ∈ λ(A) ⇔ detA = 0 ⇔ detA H A = 0 ⇔ 0 ∈ σ(A). 

[ ] [ ] 

0 1 0 0 

P5.29 Nu, e.g. pentru A = , B = . 

0 0 0 1 

P5.30 [ a) ] Inegalitatea [ triunghiului ] pentru norma spectrală. În general nu, luaţi e.g. 

1 0 0 0 

A = , B = . b) Consultaţi [II]. 

0 0 0 1 

P5.31 Proprietăţile sunt corespondentele multiplicative ale proprietăţilor aditive din 

problema[ precedentă. ] a) [ Condiţia] 

de consistenţă a normei spectrale. În general nu, luaţi 

1 1 1 0 

e.g. A = , B = . b) Consultaţi [II]. 

0 1 1 1 

P5.32 Consultaţi [II]. 

P5.33 a) det(λI n − A) = λ n − ǫ, i.e. |λ i| = ǫ 1 n , ∀i ∈ 1 : n. Valorile singulare sunt 

σ i = 1, i ∈ 1 : (n−1), σ n = ǫ. 

P5.34 Consultaţi [II], unde veţi găsi multe alte proprietăţi interesante ale descompunerii 

polare.


Cap. 6. Calculul valorilor proprii generalizate 

P6.1 a) Se observă că scăzând prima linie din celelalte două şi apoi adunând linia 

[ ] 2 4 5 

a doua la a treia obţinem perechea echivalentă Ā = PAR = 0 1 3 , ¯B = PBR = 

0 0 0 

[ ] 

[ ] 

1 1 1 

1 0 0 

= 0 α−1 2 , unde matricele de transformare sunt P = −1 1 0 şi R = I 3. 

0 0 β 

−2 1 1 

Ecuaţia caracteristică a fascicolului este (2−λ)(1−(α−1)λ)βλ = 0. Prin urmare, dacă 

β = 0, atunci fascicolul este singular, dacă β ≠ 0 şi α = 1, atunci λ(A,B) = {0,2}, iar 

1 

dacă β ≠ 0 şi α ≠ 1 avem λ(A,B) = {0,2, 

α−1 }. b) De exemplu, x = [1 0 0]T este un 

vector propriu generalizat asociat valorii proprii λ = 2, iar x T Bx = 1 ≠ 0 oricare ar fi α şi 

β. Pe de altă parte x = [7 −6 2] T este un vector propriu generalizat asociat valorii proprii 

λ = 0 şi x T Bx = 0 dacă 48α + 4β − 55 = 0; cum det(B) = (α − 1)β există o infinitate 

de valori pentru α şi β astfel încât x T Bx = 0 şi det(B) ≠ 0, e.g. pentru α = −1/48, 

β = 14. c) Primele două coloane ale matricei R, i.e. e 1, e 2, formează o bază ortogonală a 

subspaţiului de deflaţie bidimensional S al perechii (A,B) asociat valorilor proprii generalizate 

λ 1 = 2 şi λ 2 = 1 

α−1 = 1 întrucât subspaţiul V = AS +BS = Im(P−1 )(:,1 : 2) 

are dimensiunea 2. 

P6.2 Fie U 1 = U(:,1 : r), U 2 = U(:,r + 1 : n) şi, similar, V 1 = V(:,1 : r), 

V 2 = V(:,r+1:n). Notăm P = U T 1AV 1, Q = U T 1AV 2, R = U T 2AV 1 şi S = U T 2AV 2. Perechea 

(A,B) este echivalentă cu perechea (U T AV,Σ) i.e. ecuaţia caracteristică a fascicolului 

definit de perechea (A,B) este det(U T AV − λΣ) = 0. Dacă S este nesingulară, atunci 

ecuaţia caracteristică devine det(P − QS −1 R − λΣ 1) = 0 i.e. fascicolul are r ≥ 1 valori 

proprii generalizate finite. Deci S este singulară. 

P6.3 Matricele A,B fiind unitare, matricea AB −1 = AB H este şi ea unitară. Deci, 

toate valorile proprii generalizate sunt de modul unitar (în cazul real ±1). 

P6.4 Întrucât B şi A−µB sunt nesingulare avem succesiv λ(B,B(A−µB)−1 B) = 

= λ((A−µB)B −1 )) = λ(AB −1 −µI n) = λ(AB −1 )−µ = λ(A,B)−µ. 

P6.5 Se procedează exact ca la algoritmul HTQZc dar se utilizează în exclusivitate 

transformări reale. 

P6.6 Vectorii proprii generalizaţi ai perechii (A,B) coincid cu vectorii proprii ai 

matricei F = B −1 A. Metoda puterii pentru calculul iterativ al unui vector propriu al 

matricei F = B −1 A cu deplasarea curentă µ k utilizează iteraţia (vezi cap. 4) x k+1 = 

(F−µ k I n)x k , k = 1,2,... echivalentăcurezolvarea sistemuluiliniar Bx k+1 = (A−µ k B)x k , 

k = 1,2,.... Dacă y este un vector propriu al matricei G = AB −1 , atunci x = B −1 y 

este vector propriu al perechii (A,B). Iteraţia metodei puterii pentru matricea G este 

echivalentă cu rezolvarea aceluiaşi sistem liniar. Convergenţa metodei este condiţionată 

(pentru µ k = 0) de existenţa unei valori proprii generalizate dominante. 

Metoda puterii inverse pentru calculul iterativ al unui vector propriu al matricei F = 

= B −1 A cu deplasarea curentă µ k presupune rezolvarea la fiecare iteraţie a sistemului 

(vezi cap.4) (F −µ k I n)x k+1 = x k , k = 1,2,... echivalentă cu rezolvarea sistemului liniar 

(A−µ k B)x k+1 = Bx k , k = 1,2,.... În acest caz deplasarea recomandată este cea a câtului 

Rayleigh i.e. µ k = xH k Fx k 

x H k x . Schema de calcul este următoarea. 

k 

MPIG 1. Se alege aleator un vector x ∈ IC n de normă unitară. 

2. k = 1, eps = 1


3. Cât timp eps > tol 

1. Se calculează µ = x H B −1 Ax (i.e. se rezolvă Bz = Ax, apoi µ = x H z) 

2. Se rezolvă sistemul liniar (A−µB)y = Bx 

3. y = y/‖y‖ 

4. eps = |1−|x H y|| 

5. x = y 

6. k = k +1 

7. Dacă k > nr max iter 


realiza toleranţa impusă.’ 

2. Return 

unde eps, tol şi nr max iter au semnificaţii transparente. 

P6.7 Dacă Bx = 0, atunci şi Ax = 0, i.e. egalitatea Ax = λBx ar fi satifăcută pentru 

orice λ ∈ IC, i.e. fascicolul nu ar fi regulat. 

P6.8 Avem g i+1,i = h i+1,i/t ii, i = 1 : n−1. 

P6.9 Fie λ 1 ∈ λ(H,T) ⊂ IR. Atunci v = 

⎡ 

⎢ 

⎣ 

λ 1t 22 −h 22 

h 21 

⎤ 

⎥ 

⎦ este un vector propriu 

1 

generalizat asociat lui λ 1, i.e. Hv = λ 1Tv şi S = Imv este un subspaţiu de deflaţie al 

fascicolului (H,T). Atunci construim matricele Q şi Z procedând în felul următor. Fie 

z 1 = v/‖v‖, z 2 un vector de normă unitară ortogonal cu z 1 (construiţi-l!) şi matricea 

Z = [z 1 z 2]. Avem (HZ,TZ) = ([Hz 1 Hz 2],[Tz 1 Tz 2]) = ([λ 1Tz 1 Hz 2],[Tz 1 Tz 2]). 

Acum dacă Q este o matrice ortogonală de ordinul 2 (reflector sau rotaţie) astfel încât 

(Q T Tz 1)(2) = 0 vom avea ( ˜H, ˜T)(2,1) = (Q T HZ,Q T TZ)(2,1) = 0, i.e. ( ˜H, ˜T) este în 

formă Schur. Evident, ˜h 11/˜t 11 = λ 1. 

P6.10 Dacă L este factorul Cholesky al lui B, atunci λ(A,B) = λ(L −1 AL −T ) şi 

matricea L −1 AL −T fiind simetrică are spectrul real. Dacă B nu este pozitiv definită 

valorile proprii generalizate [ ] pot[ fi şi complexe ] după cum se poate constata din exemplul 

1 5 1 2 

următor 20 A = , B = . Dacăfactorul Cholesky L este binecondiţionat 

5 9 2 1 

numeric, atunci se calculează matricea C = L −1 AL −T exploatând corespunzător simetria 

rezultatului şi i se calculează valorile proprii folosind algoritmul QR simetric. Dacă L este 

rău condiţionată se aplică algoritmul QZ. Dinpăcate, în acest dinurmăcaz, transformările 

ortogonale de echivalenţă nu conservă simetria. 

P6.11 a) Se procedează ca în cazul complex, cu precizarea ca problema se reduce 

la rezolvarea unui sistem liniar omogen cvasi-superior triunghiular. b) Rezolvaţi mai întâi 

problema pentru perechea 2×2 (S(k : k +1,k : k +1),T(k : k +1,k : k +1). 

P6.12 Fie M = S(k : k + 1,k : k + 1) şi N = T(k : k + 1,k : k + 1) blocurile 

diagonale 2×2 de interes ale matricelor S şi T. Cei doi vectori proprii liniar independenţi 

există dacă şi numai dacă perechea (M,N) în FSG admite doi vectori proprii generalizaţi 

liniar independenţi. Dar m 11n 22 = m 22n 11, deci răspunsul este afirmativ numai dacă 

m 11n 12 = m 12n 11. 

20 Se poate arăta că oricare ar fi matricea C ∈ IR n×n diagonalizabilă există matricele simetrice 

A,B ∈ IR n×n cu B nesingulară astfel încât C = AB −1 [VI]. În consecinţă, oricare ar fi mulţimea 

simetrică (i.e. având elementele complexe în perechi complex conjugate) Λ de n numere există o 

pereche reală (A,B) cu matricele A, B simetrice astfel încât λ(A,B) = Λ.

Bibliografie 

[1] J.O. Aasen. On the Reduction of a Symmetric Matrix to Tridiagonal Form. 

BIT, 11:233–242, 1971. 

[2] A.V. Aho, J.E. Hopcroft, J.D. Ullman. The design and analysis of computer 

algorithms. Addison-Wesley, 1974. 

[3] S. Bannour, M.R. Azimi-Sadjadi. Principal Component Extraction Using Recursive 

Least Squares. IEEE Trans.Neur.Nets, 6:457–469, 1995. 

[4] R.H. Bartels, G.W. Stewart. A Solution of the Equation AX + XB = C. 

Commun. ACM, 15:820–826, 1972. 

[5] W. Barth, R.S. Martin, J.H. Wilkinson. Calculation of the Eigenvalues of 

a Symmetric Tridiagonal Matrix by the Method of Bisection. Numerische 

Mathematik, 9:249–256, 1967. 

[6] R. Bellman. Introducere în analiza matriceală. Ed. Tehnică, 1969. 

[7] C. Bischof, C. Van Loan. The WY Representation for Products of Householder 

Matrices. SIAM J. Sci. Stat. Comput., 8:s2–s13, 1987. 

[8] A. Björck. Solving Linear Least Squares Problems by Gram-Schmidt Orthogonalization. 

BIT, 7:1–21, 1967. 

[9] A. Björck. Numerical Methods for Least Squares Problems. SIAM, 1996. 

[10] H. Bowdler, R.S. Martin, C. Reinsch, J.H. Wilkinson. The QR and QL Algorithms 

for Symmetric Matrices. Numerische Mathematik, 11:293–306, 1968. 

[11] J.R. Bunch, L. Kaufmann. Some Stable Methods for Calculating Inertia and 

Solving Symmetric Systems. Mathematics of Computation, 31(137):163–179, 

January 1977. 

[12] J.R. Bunch, B. Parlett. Direct Methods for Solving Symmetric Indefinite Systems 

of Linear Equations. SIAM J. Numer. Anal., 8:639–655, 1971. 

[13] P.A. Businger, G.H. Golub. Linear Least Squares Solutions by Householder 

Transformations. Numerische Mathematik, 7:269–276, 1965.

534 BIBLIOGRAFIE 

[14] S.P. Chan, B.N. Parlett. Algorithm 517: a Program for Computing the Condition 

Numbers of Matrix Eigenvalues without Computing Eigenvectors. ACM 

Trans. Math. Soft., 3:186–203, 1977. 

[15] T.F. Chan. Rank-Revealing QR Factorizations. Lin. Alg. and its Applic., 

88/89:67–82, 1987. 

[16] A.K. Cline, C.B. Moler, G.W. Stewart, J.H. Wilkinson. An Estimate for the 

Condition Number of a Matrix. SIAM J.Numer.Anal., 16(2):368–375, April 

1979. 

[17] A.K. Cline, R.J. Plemmons. L 2 Solutions to Underdetermined Linear Systems. 

SIAM Review, 18:92–106, 1976. 

[18] J.J.M. Cuppen. A Divide and Conquer Method for the Symmetric Eigenproblem. 

Numerische Mathematik, 36:177–195, 1981. 

[19] J.Demmel, W.Kahan. AccurateSingularValuesofBidiagonalMatrices. SIAM 

J.Sci.Stat.Comput., 11(5):873–912, September 1990. 

[20] J.J. Dongarra, J. Du Croz, S. Hammarling, I. Duff. A Set of Level-3 Basic 

LinearAlgebraSubprograms. ACM Trans.Math.Software, 16:1–17,18–28,1990. 

[21] J.J. Dongarra, D.W. Walker. Software Libraries for Linear Algebra Computations 

on High Performance Computers. SIAM Review, 37:151–180, 1995. 

[22] B. Dumitrescu. Improving and Estimating the Accuracy of Strassen’s Algorithm. 

Numerische Mathematik, 79(4):485-499, 1998. 

[23] L. Elsner, J.G. Sun. Perturbation Theorems for the Generalized Eigenvalue 

Problem. Lin. Alg. and its Applic., 48:341–357, 1982. 

[24] G.E. Forsythe. Pitfalls in Computations or Why a Math Book is not Enough. 

Amer.Math.Monthly, 77:931–970, 1970. 

[25] G.E. Forsythe. Computer Methods for Mathematical Computations. Prentice- 

Hall, 1977. 

[26] J.G.F. Francis. The QR Transformation: a Unitary Analogue to the LR Transformation, 

Parts I and II. Comp. J., 4:265–272, 332–345, 1962. 

[27] W. Givens. Computation of Plane Unitary Rotations Transforming a General 

Matrix to Triangular form. SIAM J.App.Math., 6:26–50, 1958. 

[28] I.M. Glazman, I. Liubici. Analiză liniară pe spaţii finit-dimensionale. Ed. 

Ştiinţifică şi Enciclopedică, 1980. 

[29] D. Goldberg. What Every Computer Scientist Should Know About Floating- 

Point Arithmetic. ACM Comp.Surveys, 23(1):5–48, March 1991. 

[30] G.H. Golub, W. Kahan. Calculating the Singular Values and Pseudo-Inverse 

of a Matrix. SIAM J. Num. Anal. Ser. B 2, 205–224, 1965.

BIBLIOGRAFIE 535 

[31] S. Haykin. Adaptive Filter Theory. Prentice Hall, 1991. 

[32] N.J. Higham. The Accuracy of Floating Point Summation. SIAM J.Sci. Comput., 

14(4):783–799, July 1993. 

[33] N.J. Higham. Stability of the Diagonal Pivoting Method with PartialPivoting. 

SIAM J.Matrix Anal.Appl., 18(1):52–65, January 1997. 

[34] A.S. Householder. Unitary Triangularization of a Nonsymmetric Matrix. J. 

ACM, 5:339–342, 1958. 

[35] D. Jacobs, editor. The State of the Art in Numerical Analysis. Academic Press, 

1977. 

[36] B. Kȧgström, P. Ling, C. Van Loan. High Performance GEMM-Based Level- 

3 BLAS: Sample Routines for Double Precision Real Data. In M. Durand, 

F. El Dabaghi, editori, High Performance Computing II, pp. 269–281. Elsevier 

Science Publishers B.V., 1991. 

[37] T. Kato. Perturbation Theory for Linear Operators. Springer-Verlag, 1966. 

[38] V.C. Klema, A.J. Laub. The Singular Value Decomposition: Its Computation 

and Some Applications. IEEE Trans.Auto.Control, AC-25(2):164–180, April 

1980. 

[39] V.N. Kublanovskaya. On Some Algorithms for the Solution of the Complete 

Eigenvalue Problem. USSR Comp. Math. Phys., 3:637–657, 1961. 

[40] C.L. Lawson, R.J. Hanson, F.T Krogh, D.R. Kincaid. Basic Linear Algebra 

Subprograms for FORTRAN Usage. ACM Trans.Math.Software, 5:308–323, 

1979. 

[41] R.S. Martin, C. Reinsch, J.H. Wilkinson. Householder Tridiagonalization of a 

Symmetric Matrix. Numerische Mathematik, 11:181–195, 1968. 

[42] R.S. Martin, J.H. Wilkinson. Solution of Symmetric and Unsymmetric Band 

Equations and the Calculation of Eigenvalues of Band Matrices. Numerische 

Mathematik, 9:279–301, 1967. 

[43] R.S. Martin, J.H. Wilkinson. Reduction of the Symmetric Eigenproblem 

Ax = λBx and Related Problems to Standard Form. Numerische Mathematik, 

11:99–110, 1968. 

[44] C.B. Moler, G.W. Stewart. An Algorithm for Generalized Matrix Eigenvalue 

Problems. SIAM J. Numer. Anal., 10:241–256, 1973. 

[45] C.C. Paige. Computing the Generalized Singular Value Decomposition. SIAM 

J.Sci.Stat.Comput, 7(4):1126–1146, October 1986. 

[46] B.N. Parlett, C. Reinsch. Balancing a Matrix for Calculation of Eigenvalues 

and Eigenvectors. Numerische Mathematik, 13:292–304, 1969.

536 BIBLIOGRAFIE 

[47] C. Puglisi. Modification of the Householder Method Based on the Compact 

WY Representation. SIAM J. Sci. Stat. Comput., 13(3):723–726, May 1992. 

[48] H. Rutishauser. The Jacobi Method for Real Symmetric Matrices. Numerische 

Mathematik, 9:1–10, 1966. 

[49] R. Schreiber, B. Parlett. Block Reflectors: Theory and Computation. SIAM 

J. Numer.Anal., 25:189–205, 1989. 

[50] R.Schreiber,C.VanLoan. AStorage-efficientWYRepresentationforProducts 

of Householder Transformations. SIAM J. Sci. Stat. Comput., 10(1):53–57, 

January 1989. 

[51] R.D. Skeel. Scaling for Numerical Stability in Gaussian Elimination. J. ACM, 

26:494–526, 1979. 

[52] R.D. Skeel. Iterative Refinement Implies Numerical Stability for Gaussian 

Elimination. Math. Comp., 35:817–832, 1980. 

[53] G.W. Stewart. On the Sensitivity of the EigenvalueProblemAx = λBx. SIAM 

J. Numer. Anal., 9:669–686, 1972. 

[54] G.W. Stewart. Error and Perturbation Bounds for Subspaces Associated with 

Certain Eigenvalues Problems. SIAM Review, 15:727–764, 1973. 

[55] G.W. Stewart. Algorithm 406: HQR3 and EXCGNG: FORTRAN Subroutines 

for Calculating and Ordering the Eigenvalues of a Real Upper Hessenberg Matrix. 

ACM Trans. Math. Soft., 2:275–280, 1976. 

[56] G.W. Stewart. On the Asymptotic Behaviourof Scaled Singular Value and QR 

Decompositions. Math.Comp., 43:483–490, 1984. 

[57] G.W. Stewart. On the Early History of the Singular Value Decomposition. 

SIAM Review, 35(4):551–566, December 1993. 

[58] G.W. Stewart. Afternotes on Numerical Analysis. SIAM, 1996. 

[59] G.W. Stewart, R. Chapman. Fast Stable Kalman Filter Algorithms Utilizing 

the Square Root Procedure. SIAM J. Sci. Stat. Comput., 8:1815–1818, 1990. 

[60] V. Strassen. Gaussian elimination is not optimal. Numerische Mathematik, 

13:354–356, 1969. 

[61] M. Tertişco, P. Stoica. Identificarea şi estimarea parametrilor sistemelor. Ed. 

Academiei, 1980. 

[62] M.H. Verhaegen, P. Van Dooren. Numerical Aspects ofDifferent KalmanFilter 

Implementations. IEEE Trans.Auto.Control, AC-31:907–917, 1986. 

[63] S.J. Wright. A Collection of Problems for Which Gaussian Elimination with 

Partial Pivoting is Unstable. SIAM J.Sci.Comput., 14(1):231–238, January 

1993.

Index 

acurateţe, 13 

algoritmi la nivel de bloc 

eliminare gaussiană, 87 

factorizarea Crout, 90 

produs matriceal, 44 

rutine BLAS, 62 

sisteme triunghiulare, 56 

triangularizare ortogonală, 156 

algoritmul 

Bartels-Stewart, 301 

DVS, 393, 403 

QR, 239 

QR simetric, 314 

QZ, 455, 472 

Strassen, 45 

alternativa lui Fredholm, 297 

anulare catastrofală, 9 

bază, 22 

bază ortogonală, 152, 172, 386 

bloc, 42 

cât Rayleigh, 236, 330 

calculatoare 

cu memorie ierarhică, 17 

vectoriale, 17 

cifre semnificative, 7 

combinaţie liniară, 21 

componente principale, 373 

condiţionare, 11 

condiţionarea 

problemelor CMMP, 177 

sistemelor liniare, 97 

subspaţiilor invariante, 350 

valorilor proprii, 343 

valorilor singulare, 413 

vectorilor proprii, 350 

vectorilor singulari, 414 

congruenţă, 47 

convergenţă pătratică, 236 

deflaţie 

de permutare, 272 

iterativă, 455 

ortogonală, 230 

unitară, 228 

depăşire 

inferioară, 8 

superioară, 8 

deplasare, 244 

Rayleigh, 236 

Wilkinson, 320, 399 

descompunerea 

bloc-diagonală, 303 

CS, 377 

ortogonală completă, 197 

polară, 376 

spectrală, 296 

valorilor singulare, 369, 371 

valorilorsingularegeneralizate,379, 

431 

determinant, 53 

diferenţă unghiulară, 352, 414 

distanţă dintre spectre 

absolută, 354 

relativă, 354 

echilibrare, 104, 274 

ecuaţie caracteristică, 210 

a unui fascicol, 446 

ecuaţie matriceală Sylvester, 297 

eliminare gaussiană, 74 

la nivel de bloc, 87 

pentru matrice bandă, 106 

stabilitate numerică, 103 

epsilon maşină, 7

538 INDEX 

eroare 

înainte, 13 

înapoi, 13 

absolută, 2 

de reprezentare, 6 

de rotunjire, 7 

relativă, 2 

factor de creştere 

în eliminarea gaussiană, 102 

înfactorizareacvasi-diagonală,113 

în metoda puterii inverse, 285 

factorizare Cholesky, 114 

cu pivotare, 195 

cu semn, 202 

factorizare cvasi-diagonală, 110, 206 

factorizare LDU, 81 

factorizare LQ, 172 

factorizare LU, 81 

Crout, 82, 85 

Crout cu pivotare, 86 

Crout la nivel de bloc, 90 

Doolitle, 82 

factorizare QL, 162 

factorizare QR, 150 

factorizare RQ, 173 

fascicol matriceal, 445 

hermitic, 447, 449 

nesingular, 447 

pozitiv definit, 447, 449 

regulat, 447 

simetric, 447, 449 

singular, 447 

fascicole 

congruente, 450 

echivalente, 449 

ortogonal echivalente, 449 

unitar echivalente, 449 

flop, 15 

formă bidiagonală, 394 

formă bloc-diagonală, 296 

formă canonică Jordan, 215, 308 

formă canonică Kronecker, 450 

formă diagonală generalizată, 453 

formă Hessenberg, 239 

generalizată, 455 

generalizată ireductibilă, 466 

ireductibilă, 252 

formă Schur, 227, 229 

complexă, 230 


generalizată ordonată, 486 

ordonată, 287 

reală, 230, 232 

reală generalizată, 452 

reală ordonată, 290 

format virgulă mobilă, 4 

funcţie de rotunjire, 6 

gramian, 150, 172 

grup Poincaré, 202 

hiperelipsoid, 372, 431 

hipersferă, 372 

imagine, 29 

inerţia unei matrice, 223 

LAPACK 

rutine de calcul, 118 

rutine driver, 118 

lema proiecţiei ortogonale, 163 

liniar independenţă, 21 

mantisă, 4 

matrice 

antihermitică, 224 

antisimetrică, 47, 224 

asemenea, 60, 214 

bandă, 40 

bloc diagonală, 44 

bloc triunghiulară, 44 

complexă simetrică, 217 

congruente, 223 

cu spectru simplu, 214 

de permutare, 272 

de permutare elementară, 72 

de proiecţie ortogonală, 388 

diagonal dominantă, 119 

diagonală, 39 

diagonalizabilă, 214 

echilibrată, 274 

echivalente, 34, 35, 370 

epică, 31

INDEX 539 

hermitică, 49, 215 

Hessenberg, 40 

Hessenberg ireductibilă, 252, 291 

Hilbert, 99 

inferiortriunghiularăelementară, 

70 

inversabilă, 34 

ireductibilă, 274 

monică, 30 

normală, 46, 215 

ortogonal asemenea, 214 

ortogonal echivalente, 370 

ortogonală, 47, 215 

pozitiv definită, 47 

S-ortogonală, 201 

S-simetrică, 201 

simetrică, 46, 215, 314 

simplă, 60, 214 

spectru, 60 

strict triunghiulară, 39 

tridiagonală, 315 

triunghiulară, 39 

triunghiulară unitate, 39 

unitar asemenea, 214 

unitar echivalente, 370 

unitară, 49, 215 

Matrice companion, 362 

Matrice convergentă, 363 

Matrice diagonal dominantă, 364 

Matrice idempotentă, 361 

Matrice nilpotentă, 361 

Matrice simultan diagonalizabile, 360 

memorarecompactă(împachetată),41 

metoda 

bisecţiei, 330 

câtului Rayleigh, 330 

Jacobi ciclică, 341 

Jacobi clasică, 340 

puterii, 233, 499 

puterii cu deplasare, 235, 246 

puterii inverse, 235, 245, 499 

metode de rădăcină pătrată, 151 

Moore-Penrose 

condiţii, 207 

pseudoinversă, 198 

mulţime simetrică, 210 

multiplicatori (gaussieni), 70, 74 

multiplicitate 

algebrică, 210 

algebrică a unei valori proprii generalizate, 

446 

geometrică, 211 

geometrică a unei valori proprii 

generalizate, 447 

normă 

consistentă, 37 

euclidiană, 24 

Frobenius, 38 

indusă, 38 

urmă, 384 

nucleu, 29 

număr de condiţionare, 98, 384 

al unui subspaţiu invariant, 354 

al valorii proprii, 344 

estimare, 100 

pentru matrice nepătrate, 178 

rutine de calcul, 119 

ortogonalitate numerică, 28 

ortogonalizareGram-Schmidt,161,169 

Ovaluri Cassini, 364 

p-norme Schatten, 384 

p-secţiune a unei matrice hermitice, 

363 

Partea antihermitică a unei matrice, 

362 

Partea hermitică a unei matrice, 362 

partiţionare conformă, 43 

pas DVS, 401 

pas QR, 244 

dublu cu deplasare explicită, 251 

dublu cu deplasare implicită, 262 

simplucudeplasareexplicită, 250 

simplucudeplasareimplicită, 254 

pas QZ 

dublu, 480 

simplu, 470 

pivot, 74 

pivotare 

întriangularizareaortogonală,192

540 INDEX 

completă(îneliminareagaussiană), 

79 

completă(înfactorizareacvasi-diagonală), 

112 

parţială (în eliminarea gaussiană 

la nivel de bloc), 88 

parţială (în eliminarea gaussiană 

pentru matrice bandă), 108 

parţială(îneliminareagaussiană), 

76, 77 

parţială (în factorizarea Crout), 

86 

parţială(înfactorizareacvasi-diagonală), 

113 

parţială (în factorizarea LU), 83 

plan Lobacevski, 202 

polinom caracteristic, 210 

al unui fascicol, 446 

ponderea operaţiilor de nivel 3, 66 

precizie, 4 

dublă, 7 

simplă, 5, 7 

precondiţionare, 275 

problema CMMP 

cu restricţii liniare, 207 

cu restricţii pătratice, 431 

cu restrictii liniare, 429 


ponderată, 187, 207 

totală, 422 

problema generală CMMP, 197, 421 

produs 

exterior, 32, 35 

matrice-vector, 31 

matriceal, 32 

scalar, 24 

scalar matriceal, 37 

program principal (driver), 279 

proiecţie 

ortogonală, 167, 388 

spectrală, 346 

proiector, 48 

ortogonal, 152, 172, 388 

spectral, 346 

pseudoinversă, 163, 168, 385 

normală, 174, 198 

pseudosoluţie, 124, 163 

normală, 198, 421 

R-bidiagonalizare, 397 

rafinare iterativă, 105, 187 

rang, 30, 193, 369, 383 

numeric, 417 

rază spectrală, 210 

reflector, 126 

bloc, 158 

complex, 139 

hermitic, 139, 147 

J-reflector, 202 

modificat, 130, 162 

reprezentare W 2 T, 159 

reprezentare WY, 158 

restricţia 

unei matrice la un subspaţiu, 287 

unei matrice la un subspaţiu invariant, 

212 

uneiperechidematricelaunsubspaţiu 

de deflaţie, 448 

reziduu de normă minimă, 124 

rotaţie, 134 

complexă, 142 

hiperbolică, 203 

modificată, 404 

rotaţii disjuncte, 136 

secvenţă de rotaţii, 136 

rotaţie complexă, 460 

Saxpy, 23 

scalare, 104, 186 

schimbare de bază, 34 

secvenţă de rotaţii, 149 

separarea 

spectrelor a două matrice, 353 

valorilor singulare, 414 

sistem 

extins, 164 

normal, 164 

soluţie normală, 124, 174 

spaţiu Minkovski, 202 

spectru generalizat, 446 

spectrul unei matrice, 210 

stabilitate numerică, 13 

a algoritmului DVS, 415

INDEX 541 

a algoritmului QR, 356 

a eliminării gaussiene, 103 

a triangularizării ortogonale, 184 

submatrice 

bloc, 42 

lider principală, 42 

subspaţii liniare, 386 

(operaţii cu), 390 

subspaţiu, 22 

complement ortogonal, 26 

complementar, 22 

de deflaţie, 447, 486 

dimensiune, 22 

invariant, 61, 211, 286 

propriu, 211 

substituţie 

înainte, 54 

înapoi, 55 

şir QR, 244 

şir Sturm, 332 

teorema 

Bauer-Fike, 348 

Courant-Fisher, 219 

deseparareavalorilorproprii,221 

de separare a valorilor singulare, 

412 

Gershgorin, 226 

Wielandt-Hoffmann, 223 

Teorema lui Brauer, 364 

Teorema lui Ostrovski, 364 

transformare 

de asemănare, 60, 214 

de asemănare de permutare, 272 

de coordonate, 35 

elementară, 70 

involutivă, 126 

Jacobi, 337 

QR, 244 

triangularizare ortogonală, 147 

completă, 196 

cu pivotare, 192 

la dreapta, 171 


valoare proprie dominantă, 233 

valori singulare, 371 

generalizate, 380, 433 

variaţie unghiulară, 414 

varianta Hessenberg-Schur (de rezolvareaecuaţieiSylvester),300 

varianta Schur-Schur (de rezolvare a 

ecuaţiei Sylvester), 300 

vector 

de deplasare implicită, 399, 468, 

476, 479 

Gauss, 70 

Householder, 126 

propriu, 59, 210, 281 

propriu al formei Schur, 282 

propriu al unei matrice Hessenberg, 

284 

propriu generalizat, 485 

unitate, 20 

vector propriu 

generalizat, 445 

vectori Schur, 229, 232 

generalizaţi, 451, 452 

vectori singulari, 371 

generalizaţi, 380 

urmă, 28 

valoare proprie, 59, 210

Calculul valorilor si vectorilor proprii

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?