Autovalores do Laplaciano - Departamento de Matemática - UFMG

Notas de Aula 

Autovalores do Laplaciano 

Rodney Josué Biezuner 1 

Departamento de Matemática 

Instituto de Ciências Exatas (ICEx) 

Universidade Federal de Minas Gerais (UFMG) 

Notas de aula do curso Tópicos em Análise: Autovalores do Laplaciano do Programa 

de Pós-Graduação em Matemática, ministrado durante o segundo semestre do ano de 2006. 

16 de novembro de 2006 

1 E-mail: rodney@mat.ufmg.br; homepage: http://www.mat.ufmg.br/∼rodney.

Sumário 

1 Os Autovalores do Laplaciano 4 

1.1 Motivação para o Estudo dos Autovalores do Laplaciano . . . . . . . . . . . . . . . . . . . . . 4 

1.1.1 Método de Expansão em Autofunções . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 

1.1.2 Problema Isospectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 

1.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 

1.3 Princípio do Máximo Fraco: O Laplaciano não possui Autovalores Negativos . . . . . . . . . 10 

1.4 Métodos Variacionais para Autovalores de Operadores Lineares . . . . . . . . . . . . . . . . . 12 

1.5 Os Espaços de Sobolev W 1,2 e W 1,2 

0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

1.5.1 A Derivada Fraca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

1.5.2 Espaços de Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 

1.5.3 Propriedades dos Espaços de Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 

1.6 Existência e Unicidade de Soluções para o Laplaciano através do Método Variacional . . . . . 18 

1.6.1 Soluções Fracas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

1.6.2 Existência, Unicidade e Regularidade de Soluções Fracas . . . . . . . . . . . . . . . . . 18 

1.7 O Espectro do Laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 

1.7.1 Existência e Caracterização Variacional dos Autovalores do Laplaciano . . . . . . . . . 21 

1.7.2 Comparação de Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 

1.8 Conjunto Nodal e Domínios Nodais de uma Autofunção . . . . . . . . . . . . . . . . . . . . . 30 

1.8.1 Princípio do Máximo Forte: o Primeiro Autovalor do Laplaciano é Simples . . . . . . 30 

1.8.2 Conjunto Nodal e Domínios Nodais de Autofunções do Laplaciano . . . . . . . . . . . 32 

1.9 Multiplicidade dos Autovalores do Laplaciano . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 

2 Método de Diferenças Finitas 39 

2.1 O Caso Unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

2.1.1 Séries de Taylor e Diferenças Finitas em Uma Dimensão . . . . . . . . . . . . . . . . . 39 

2.1.2 Discretização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 

2.1.3 Resolução Numérica do Problema de Autovalor Unidimensional . . . . . . . . . . . . . 42 

2.2 O Caso Bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 

2.2.1 A Fórmula dos Cinco Pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

2.2.2 Existência e Unicidade da Solução Discreta – Autovalores do Problema Bidimensional 47 

2.2.3 Princípio do Máximo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 

2.2.4 Convergência da Solução Discreta para a Solução Clássica . . . . . . . . . . . . . . . . 51 

2.3 Discretizações de Ordem Superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

2.3.1 Caso Unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 

2.3.2 Caso Bidimensional: A Fórmula dos Nove Pontos Compacta . . . . . . . . . . . . . . 56 

2.4 Diferenças Finitas em Coordenadas Polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 

2.5 Domínios Arbitrários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 

2.6 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 

1


3 Existência e Unicidade de Soluções Discretas 69 

3.1 Normas Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 

3.2 Matrizes Diagonalmente Dominantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 

3.3 Teorema dos Discos de Gershgorin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 

3.4 Propriedade FC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 

3.5 Matrizes Irredutíveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 

3.6 Invertibilidade de Matrizes de Discretização . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 

3.6.1 Esquemas de Diferenças Finitas para o Intervalo e para o Retângulo . . . . . . . . . . 84 

3.6.2 Esquema de Coordenadas Polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 

3.6.3 Esquema de Shortley-Weller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 

4 Métodos Iterativos para a Resolução de Sistemas Lineares 86 

4.1 Métodos Iterativos Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 

4.1.1 Método de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 

4.1.2 Método de Gauss-Seidel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 

4.1.3 Método SOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 

4.1.4 Comparação da Velocidade de Convergência dos Três Métodos . . . . . . . . . . . . . 89 

4.1.5 Método de Jacobi Amortecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 

4.2 Análise de Convergência dos Métodos Iterativos Lineares . . . . . . . . . . . . . . . . . . . . . 91 

4.2.1 Convergência dos Métodos Iterativos Lineares . . . . . . . . . . . . . . . . . . . . . . . 92 

4.2.2 Velocidade de Convergência dos Métodos Iterativos Lineares . . . . . . . . . . . . . . 94 

4.2.3 Convergência para Matrizes Simétricas Positivas Definidas . . . . . . . . . . . . . . . . 96 

4.3 Convergência dos Métodos Iterativos Lineares para as Matrizes de Discretização . . . . . . . 97 

4.3.1 Convergência do Método de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 

4.3.2 Convergência do Método de Gauss-Seidel . . . . . . . . . . . . . . . . . . . . . . . . . 99 

4.3.3 Convergência do Método SOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 

4.3.4 Convergência do Método de Jacobi Amortecido . . . . . . . . . . . . . . . . . . . . . . 109 

4.3.5 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 

4.4 Método do Gradiente Conjugado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 

4.4.1 Métodos de Descida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 

4.4.2 Método da Descida Mais Acentuada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 

4.4.3 Método do Gradiente Conjugado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 

5 Métodos Multigrid 120 

5.1 Suavização de Erros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 

5.2 Operador Restrição e Operador Extensão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 

5.3 Ciclos V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 

5.4 Multigrid Completo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 

5.5 Convergência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 

5.6 Multigrid Adaptativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 

5.7 Multigrid Algébrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 

6 Método de Elementos Finitos 121 

6.1 O Caso Unidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 

6.1.1 Formulação Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 

6.1.2 Elementos Finitos Lineares por Partes . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 

6.2 O Caso Bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 

6.2.1 Formulação Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 

6.2.2 Triangulações e Elementos Finitos Lineares por Partes . . . . . . . . . . . . . . . . . . 125 

6.2.3 Interpretação Geométrica do Método de Elementos Finitos . . . . . . . . . . . . . . . 127 

6.3 Formulação Abstrata do Método dos Elementos Finitos . . . . . . . . . . . . . . . . . . . . . 127


7 Aproximação de Autovalores do Laplaciano 131 

7.1 Elementos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 

7.1.1 Resultados Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 

7.1.2 Convergência dos Autovalores Discretos para os Autovalores Contínuos . . . . . . . . 137 

7.1.3 Convergência das Autofunções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 

8 Métodos Numéricos para a Obtenção de Autovalores de Matrizes 140 

8.1 Método das Potências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 

8.1.1 Iteração Inversa e Iteração com Deslocamento . . . . . . . . . . . . . . . . . . . . . . . 141 

8.2 Iteração de Subespaços . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 

8.3 Método QR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 

8.3.1 O Algoritmo QR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 

8.3.2 Implementação Eficiente do Algoritmo QR . . . . . . . . . . . . . . . . . . . . . . . . 148 

8.4 Métodos para Matrizes Esparsas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 

8.4.1 Processo de Arnoldi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 

8.4.2 Representação Matricial do Processo de Arnoldi . . . . . . . . . . . . . . . . . . . . . 151 

8.4.3 Método de Lanczos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

Capítulo 1 

Os Autovalores do Laplaciano 

Seja Ω ⊂ R n um aberto limitado. O problema de autovalor para o laplaciano consiste em encontrar os valores 

λ tais que 

−∆u = λu em Ω (1.1) 

admite soluções não triviais, com alguma condição de fronteira imposta sobre u. A equação de autovalor do 

laplaciano também é conhecida como equação de Helmholtz. Nestas notas, consideraremos o problema de 

autovalor com condição de Dirichlet 

 

−∆u = λu em Ω, 

(1.2) 

u = 0 sobre ∂Ω, 

e o problema de autovalor com condição de Neumann 

⎧ 

⎨ 

⎩ 


∂u 

∂η 

= 0 sobre ∂Ω. 

O problema é tradicionalmente escrito nesta forma, com o sinal negativo multiplicando o laplaciano, porque 

assim todos os autovalores são não-negativos. No caso do problema de Dirichlet, este fato segue imediatamente 

do princípio do máximo. De fato, este implica que todos os autovalores, se existirem, devem ser 

positivos, como veremos neste capítulo. Por outro lado, zero é um autovalor no problema de Neumann, pois 

as funções constantes são autofunções associadas a este. 

1.1 Motivação para o Estudo dos Autovalores do Laplaciano 

1.1.1 Método de Expansão em Autofunções 

Vários problemas de equações diferenciais parciais podem ser resolvidos através do chamado método de 

expansão em autofunções do laplaciano. 

Considere o seguinte problema de Dirichlet para a equação da onda em um aberto limitado Ω ⊂ R n : 

⎧ 

⎪⎨ 

⎪⎩ 

utt = c 2 ∆u se x ∈ Ω e t > 0, 

u (x, 0) = f (x) se x ∈ Ω, 

ut (x, 0) = g (x) se x ∈ Ω, 

u (x, t) = 0 se x ∈ ∂Ω e t 0, 

onde c ∈ R, f ∈ C 2 Ω e g ∈ C 1 Ω . Se Ω ⊂ R 2 , então este problema modela as vibrações transversais 

de baixa amplitude de uma membrana fina fixada em um aro com o formato de ∂Ω: se ∂Ω é um retângulo, 

4 

(1.3)


estamos estudando as vibrações de uma membrana retangular; se ∂Ω é um círculo, o estudo é o de uma 

membrana circular (um tambor usual), e assim por diante. Este problema pode ser resolvido pelo método 

de separação de variáveis: supomos que a solução do problema pode ser escrita na forma 

u (x, t) = F (x) G (t) , x ∈ Ω e t 0. 

Substituindo esta expressão na equação da onda, obtemos 

Separando as variáveis, segue que 

F (x) G ′′ (t) = c 2 ∆F (x) G (t) . 

∆F (x) 

F (x) 

1 

= 

c2 G ′′ (t) 

= −λ 

G (t) 

onde λ ∈ R é alguma constante a ser determinada. Como em geral G (t) não é a função identicamente nula, 

a condição de fronteira implica que F (x) = 0 para x ∈ ∂Ω. Portanto, a função F satisfaz o problema de 

Dirichlet para a equação de Laplace 

−∆F (x) = λF (x) se x ∈ Ω, 

F (x) = 0 se x ∈ ∂Ω, 

ou seja, λ é um autovalor do laplaciano em Ω. Como veremos, os autovalores do laplaciano em Ω formam 

um conjunto enumerável {λn} n∈N e existe um conjunto associado de autofunções {Fn} n∈N que constitui uma 

base de Schauder (em outras palavras, um conjunto ortonormal completo) para L 2 (Ω). A solução geral para 

a equação diferencial ordinária 

G ′′ (t) = −λnc 2 G (t) 

é 

Logo, a solução do problema da onda é 

u (x, t) = 

Gn(t) = an cos λnt + bn sen λnt. 

∞ 

an cos λnt + bn sen 

λnt Fn (x) , 

n=1 

onde os coeficientes an, bn são determinados pelas condições iniciais (posição inicial e velocidade inicial da 

membrana): 

f (x) = 

g (x) = 

∞ 

anFn (x) , 

n=1 

∞ 

n=1 

bn 

λnFn (x) , 

ou seja, usando as relações de ortonormalidade das funções Fn, 

 

an = f(x)Fn (x) dx, 

Ω 

bn = 1 

 

√ f(x)Fn (x) dx. 

λn Ω 

Assim, no caso bidimensional, os autovalores do laplaciano correspondem às freqüências naturais de vibração 

de uma membrana, enquanto que as autofunções associadas correspondem aos modos naturais de vibração 

da membrana. Estas idéias se generalizam para fenômenos vibratórios em três ou mais dimensões.


O método de expansão em autofunções também pode ser usado para resolver o problema de Neumann 

da equação da onda ou outros problemas mais gerais. Nestes casos, devem ser buscados os autovalores do 

laplaciano de acordo com a condição de fronteira considerada. 

O método de expansão em autofunções também pode ser usado para resolver o problema do calor com 

as condições de fronteira apropriadas. Por exemplo, para o problema de Dirichlet 

a solução é dada por 

⎧ 

⎨ 

⎩ 

ut = K∆u se x ∈ Ω e t > 0, 

u (x, 0) = f (x) se x ∈ Ω, 

u (x, t) = 0 se x ∈ ∂Ω e t 0, 

u (x, t) = 

∞ 

n=1 

ane −√ λnKt Fn (x) , 

onde os coeficientes an são determinados pelas condição inicial (distribuição de temperaturas inicial na placa 

bidimensional ou no objeto tridimensional): 

isto é, 

1.1.2 Problema Isospectral 

f (x) = 

∞ 

anFn (x) , 

n=1 

 

an = f(x)Fn (x) dx. 

Ω 

Dada uma variedade Riemanniana compacta com fronteira (M, g), pode-se definir um operador laplaciano 

∆gu = div (∇u). Em coordenadas locais, ele é um operador elíptico. Como no caso de abertos de R n , o 

laplaciano em variedades possui uma seqüência de autovalores (o seu espectro). Dizemos que duas variedades 

Riemannianas são isospectrais se seus espectros coincidirem, contando multiplicidades. Uma questão natural 

é a seguinte: duas variedades Riemannianas isospectrais são isométricas? Se considerarmos variedades ndimensionais 

contida em R n sob a métrica euclidiana, duas variedades serem isométricas é equivalente a 

elas serem congruentes do ponto de vista da geometria euclidiana clássica. Esta questão para domínios 

planos foi colocada de maneira mais colorida por Bers e Kac em 1966 ([Kac]; o último atribui o problema 

a Bochner em meados dos anos 1950s) como “é possível escutar o formato de um tambor?”, já que no caso 

de domínios no plano os autovalores do laplaciano correspondem ao quadrado das freqüências naturais de 

vibração produzidas por uma membrana, como vimos na seção anterior. Pode-se traçar as origens desta 

especulação ao resultado obtido por Weyl em 1911 [Weyl] de que a área de um domínio plano é determinada 

pelo espectro do laplaciano; em particular, domínios com diferentes áreas nunca podem ter o mesmo espectro. 

Sabe-se também que o espectro determina o perímetro e o número de componentes conexas de um domínio 

plano (veja [Kac] para referências). Kac, usando a desigualdade perimétrica (perímetro(Ω) 4π área(Ω)) e 

o fato que a área e o perímetro são determinadas pelo espectro do laplaciano, conseguiu provar que se um 

domínio plano possui o mesmo espectro de um disco de raio r, então ele é congruente ao disco, mostrando 

que existem domínios que são determinados pelo espectro do laplaciano. 

No entanto, a resposta a este problema no caso geral é negativa: o formato de um tambor não é audível. 

No caso de variedades Riemannianas, Milnor já havia construído em 1964 [Milnor] um par de variedades 

isospectrais não-isométricas de dimensão 16; vários outros exemplos se seguiram, incluindo superfícies de 

Riemann (veja [GWW1] e [Protter], para referências) até que em 1980 Vignéras [Vigneras] obteve exemplos 

de variedades compactas isospectrais não-isométricas de qualquer dimensão n 2. Entretanto, a questão de 

Kac para domínios no plano permaneceu em aberta até 1992, quando Gordon, Webb e Wolpert ([GWW1]; 

veja [GWW2] para os detalhes completos), usando resultados de teoria de espaços de recobrimento e teoria 

dos grupos, obtiveram um par de domínios planos simplesmente conexos não-isométricos com os mesmos


espectros de Dirichlet e de Neumann. Os contra-exemplos que eles obtiveram têm o formato de uma região 

poligonal, não-convexa, e o método permite a obtenção de uma larga coleção de contra-exemplos. Os 

primeiros 54 autovalores do primeiro contra-exemplo de Gordon, Webb e Wolpert, que ficou conhecido como 

os tambores GWW, foram encontrados experimentalmente por Sridhar e Kudrolli [Sridhar-Kudrolli]; eles 

construíram cavidades de microondas com o formato da região poligonal e mediram ressonâncias em ondas 

magnéticas transversais, que obedecem a equação de Helmoltz. Posteriormente, vários autores calcularam 

autovalores e autofunções dos tambores GWW através de métodos numéricos; veja [Driscoll], [Heuveline] e 

as referências nestes artigos. 

Uma demonstração mais simples e versátil do resultado de Gordon, Webb e Wolpert, foi dada por Berard 

[Berard2], usando a chamada técnica de transplantação de autofunções, introduzida pelo próprio [Berard1]. 

Os domínios são construídos a partir de translações, rotações e reflexões de uma única forma, tal como um 

triângulo, sem sobreposições. Dada uma autofunção em um domínio, pode-se prescrever uma função sobre 

o outro domínio cujos valores sobre cada parte são combinações lineares dos valores da autofunção sobre 

várias das partes do primeiro domínio. As combinações são escolhidas de modo a satisfazer as condições 

de fronteira e igualar valores da função e suas derivadas nas interfaces entre as partes. O resultado é uma 

autofunção na segunda região tendo o mesmo autovalor. Para completar a prova de isospectralidade, basta 

mostrar que o procedimento é invertível. Usando esta técnica, Chapman [Chapman] obteve alguns exemplos 

que podem ser explicados em nível elementar através de dobraduras de papel e até mesmo um exemplo onde 

os autovalores do laplaciano podem ser calculados explicitamente (este exemplo consiste de dois domínios 

cada um com duas componentes conexas, um retângulo e um triângulo isósceles reto; veja Exemplo 4 na 

próxima seção). 

Todos os contra-exemplos dados nas referências acima são de domínios não-convexos ou com quinas. 

Watanabe ([Wat1], [Wat2]) determinou a existência de uma classe não-enumerável de domínios suaves que 

não é um disco (incluindo exemplos convexos e não-convexos) que são determinados pelos espectros de Dirichlet 

ou de Neumann do laplaciano. Outros exemplos de domínios determinados pelo espectro do laplaciano, 

com a propriedade adicional de serem analíticos reais e simétricos com respeito a reflexões em relação a um 

eixo horizontal e a um eixo vertical, foram dados por Zelditch [Zelditch]. A identificação de todas as classes 

de domínios que são determinados pelo espectro do laplaciano é um problema em aberto. 

1.2 Exemplos 

Exemplo 1. Os autovalores do laplaciano para o problema de Dirichlet no caso unidimensional 

−u ′′ = λu em [0, L] , 

são 

As autofunções correspondentes são 

 

u (0) = u (L) = 0, 

λn = n2π2 , n ∈ N. 

L2 un (x) = sen nπx 

L . 

Exemplo 2. Os autovalores do laplaciano para o problema de Dirichlet no retângulo R = [0, a] × [0, b] ⊂ R 2 

são 

− (uxx + uyy) = λu em R, 

u = 0 sobre ∂R, 

λnm = π 2 

2 n m2 

+ 

a2 b2 

, n, m ∈ N.



 

unm (x, y) = sen nπx 

a 

mπy 

sen . 

b 

Exemplo 3. Os autovalores do laplaciano para o problema de Dirichlet em um triângulo isósceles reto 

T ⊂ R 2 com lado menor de comprimento c 

− (uxx + uyy) = λu em T, 

u = 0 sobre ∂T, 

são 


 

λnm = π 2 

2 n m2 

+ 

c2 c2 

, n, m ∈ N. 

unm (x, y) = sen nπx 

c 

sen mπy 

c 

− sen mπx 

c 

sen nπy 

c . 

Exemplo 4. [Chapman] A partir dos Exemplos 2 e 3 podemos construir dois domínios planos isospectrais 

Ω1 e Ω2 que não são isométricos. De fato, cada Ωi é a união disjunta de um retângulo e um triângulo 

isósceles reto: 

Ω1 = R1 ∪ T1, 

Ω2 = R2 ∪ T2, 

onde R1 é um quadrado unitário, R2 é um retângulo de comprimento 2 e altura 1 e T1 e T2 são triângulos 

isósceles √ retos, os lados menores do primeiro tendo comprimento 2 e os do segundo com comprimento 

2. Os autovalores de um domínio que é a união disjunta de várias componentes conexas (incluindo 

as fronteiras de cada componente) é a união dos autovalores de cada componente, as autofunções do 

domínio sendo as funções que são iguais às autofunções em cada componente e zero nas demais. De 

acordo com os Exemplos 2 e 3, segue que os espectros dos domínios Ω1 e Ω2 são dados por 

ΛΩ1 = π 2 n 2 + m 2 

n,m∈N ∪ 

ΛΩ2 = 

 

π 2 

 

2 N 2 

+ M 

4 

N,M∈N 

 

π 2 

ΛΩ2 ⊂ ΛΩ1: Seja λ ∈ ΛΩ2 um autovalor da forma π2 2 N 2 + M 

2 

n = N 

2 

e m = M, obtendo N 2 

2 N 

min (N, 2M), produzindo 

 

2 n m2 

+ , 

4 4 n,m∈N 

 

∪ π 2 

 

2 2 N M 

+ . 

2 2 N,M∈N 

 

, N, M ∈ N. Se N é par, tomamos 

4 + M 2 = n 2 + m 2 ; se N é ímpar, escolhemos n = max (N, 2M), m = 

4 +M 2 = n2 

4 

+ m2 

4 . Se λ ∈ ΛΩ2 é um autovalor da forma π 2 

N, M ∈ N, escolhemos n = N + M e m = |N − M|, de modo que 

N 2 

2 

+ M 2 

2 

= n2 

4 

N 2 

+ m2 

4 . 

2 

+ M 2 

2 

ΛΩ1 ⊂ ΛΩ2: Se λ ∈ ΛΩ1 é um autovalor da forma π2 n2 + m2 , n, m ∈ N, escolhemos N = 2n 

e M = m, obtendo n2 + m2 2 N 

= 

4 + M 2 . Seja λ ∈ ΛΩ2 um autovalor da forma π2 

2 n m2 

+ , 

4 4 

 

,


n, m ∈ N. Se n é par, tomamos N = m e M = n 

n2 

, de modo que 

2 4 

tomamos N = n e M = m 

para produzir o mesmo resultado. 

2 

Portanto, 

ΛΩ1 = ΛΩ2 

+ m2 

4 

= N 2 

4 + M 2 ; se m é par, 

embora Ω1 e Ω2 não sejam congruentes. Observe que, como requer o resultado obtido por Weil 

(discutido na seção anterior), Ω1 e Ω2 possuem a mesma área igual a 2, o mesmo perímetro igual a 

8 + 2 √ 2 e obviamente o mesmo número de componentes conexas. 

Exemplo 5. Os autovalores do laplaciano para o problema de Dirichlet no paralelepípedo P = [0, a]×[0, b]× 

[0, c] ⊂ R 3 

− (uxx + uyy + uzz) = λu em P, 

u = 0 sobre ∂P, 

são 


 

λnmk = π 2 

2 n 

a 

b 

c 2 

m2 k2 

+ + 2 2 

unmk (x, y) = sen nπx 

a 

 

, n, m, k ∈ N. 

sen mπy 

b 

sen kπz 

c . 

Exemplo 6. Os autovalores do laplaciano para o problema de Dirichlet no disco D = x ∈ R 2 : x R 

são 

⎧ 

⎨ 

⎩ 

 

− urr + 1 

r ur + + 1 

 

uθθ = λu 

r2 se 0 < r < 1 e 0 < θ < 2π, 

u = 0 se r = R e 0 < θ < 2π, 

λnm = 

 

αn,m 

2 

, n = 0, 1, 2, . . . , m = 1, 2, . . . 

R 

onde αn,m é o m-ésimo zero positivo da função de Bessel do primeiro tipo Jn 


Jn(r) = 

u0m (r, θ) = J0 (λ0mr) , 

∞ 

k=0 

(−1) k 

k!(k + n)! 

 

r 

2k+n . 

2 

u 1 nm (r, θ) = cos nθJn (λnmr) e u 2 nm (r, θ) = sen nθJn (λnmr) . 

Note que para m = 1, 2, . . . temos duas autofunções distintas para um dado autovalor, isto é, tais 

autovalores têm multiplicidade pelo menos igual a 2. 

Exemplo 7. Os autovalores do laplaciano para o problema de Dirichlet na bola B = x ∈ R3 : x R 

⎧ 

⎨ 

⎩ 

são 

 

− urr + 2 

r ur + 1 

r2 

uθθ + cot θ uθ + csc2 

θuφφ 

 

= λu se 0 < r < 1, 0 < θ < 2π e 0 < φ < π 

u = 0 se r = R, 0 < θ < 2π e 0 < φ < π 

λnm = 

 

αn+ 1 

2 ,m 

2 , n = 0, 1, 2, . . . , m = 1, 2, . . . 

R


onde α 1 n+ 2 ,m é o m-ésimo zero positivo da função de Bessel do primeiro tipo J 1 n+ 2 

J 1 n+ (r) = 

2 

∞ 

k=0 

(−1) k 

k!Γ k + n + 1 

2 + 1 

À cada autovalor λnm correspondem 2n + 1 autofunções 

 

r 

1 2k+n+ 2 

. 

2 

u k nm (r, θ, φ) = jn (λnmr) Yn,k (θ, φ) , k = −n, −n + 1, . . . , −1, 0, 1, . . . , n − 1, n, 

onde jn é a função de Bessel esférica do primeiro tipo 

e Yn,k são as harmônicas esféricas 

Yn,k (θ, φ) = 

com P k n sendo a função de Legendre 

 

jn (r) = 

 

P 0 n (r) = 1 

2n d 

n! 

n 

drn 2 n 

r − 1 , 

P k n (r) = (−1) k 1 − r 2k/2 dk π 

2r J n+ 1 

2 (r), 

2n + 1 (n − k)! 

4π (n + k)! P k n (cos θ) e ikφ , 

dr k P 0 n (r) , se 0 k n, 

P k n (r) = (−1) k (n + k)! −k 

Pn (r) , se − n k < 0. 

(n − k)! 

1.3 Princípio do Máximo Fraco: O Laplaciano não possui Autovalores 

Negativos 

1.1 Lema. (Princípio do Máximo Fraco) Seja Ω ⊂ R n um aberto limitado. Seja u ∈ C 2 (Ω) ∩ C 0 (Ω). 

Se ∆u 0 em Ω, então 

Se ∆u 0 em Ω, então 

max u = max 

Ω ∂Ω u; 

min u = min 

Ω ∂Ω u. 

Em particular, se u satisfaz ∆u = 0 em Ω, então u atinge o seu máximo e o seu mínimo na fronteira 

de Ω. 

Prova: Sejam 

M = max u e m = max 

Ω 

∂Ω u 

e suponha por absurdo que m < M. Então existe um ponto x0 ∈ Ω\∂Ω tal que u (x0) = M. Defina a função 

v (x) = u (x) + 

M − m 

4d 2 

|x − x0| 2 ,


d = diam Ω. Se x ∈ ∂Ω, temos 

M − m 

v (x) m + 

4d2 d2 = 3 

4 

m + M 

4 

e como u (x0) = v (x0) = M, segue que o máximo de v também é assumido em um ponto de Ω\∂Ω, digamos 

em x. Mas, como x é um ponto de máximo para v, devemos ter 

∆v (x) 0, 

< M, 

enquanto que, pela definição de v e pelo fato de u satisfazer a equação de Laplace, para todo x temos 

∆v (x) = ∆u (x) + 

M − m 

2d 2 

M − m 

 

2d2 > 0, 

uma contradição. Isso mostra que u atinge o seu máximo em ∂Ω. 

Para provar a segunda afirmação, basta considerar −u e observar que min u = − max(−u). 

Defina a parte positiva e a parte negativa de uma função u respectivamente por 

u + = max(u, 0), 

u − = min(u, 0). 

1.2 Corolário. Seja Ω ⊂ R n um aberto limitado. Seja λ ∈ R, λ 0. Seja u ∈ C 2 (Ω) ∩ C 0 (Ω). 

Se −∆u − λu 0 em Ω, então 

Se −∆u − λu 0 em Ω, então 

max u max 

Ω ∂Ω u+ . 

min u min 

Ω ∂Ω u− . 

Em particular, se u satisfaz −∆u = λu em Ω, então 

max |u| = max 

Ω 

∂Ω |u| 

de modo que se o problema de Dirichlet 



possuir solução u ∈ C 2 (Ω) ∩ C 0 (Ω), então a solução é trivial. Conseqüentemente, o problema de 

Dirichlet para o laplaciano não possui autovalores negativos ou nulos. 

Prova. Assuma primeiro −∆u − λu 0 em Ω. Se u 0 em Ω, então o corolário vale trivialmente. Logo, 

podemos assumir que Ω + = {x ∈ Ω : u(x) > 0} = ∅. Como −λu 0 em Ω + , temos que ∆u 0 em Ω + . 

Segue do Princípio do Máximo Fraco que 

max 

Ω + 

u = max u. 

∂Ω + 

Mas u = 0 em ∂Ω + ∩ Ω, logo o máximo deve ser atingido em ∂Ω. O caso −∆u − λu 0 segue do primeiro 

considerando −u.


1.4 Métodos Variacionais para Autovalores de Operadores Lineares 

Nesta seção vamos rever os métodos variacionais para a obtenção de autovalores para operadores lineares 

definidos em espaços de dimensão finita providos de produto interno. A teoria será então generalizada mais 

tarde para obter a existência e algumas propriedades básicas dos autovalores do laplaciano. Em primeiro 

lugar, discutiremos o Princípio de Rayleigh, que afirma que o menor autovalor de um operador linear pode 

ser encontrado como o mínimo de um certo funcional, enquanto que o seu maior autovalor é o máximo deste 

mesmo funcional: 

1.3 Teorema. (Princípio de Rayleigh) Seja V um espaço vetorial com produto interno de dimensão n e 

T : V −→ V um operador linear auto-adjunto. Sejam λ1 . . . λn os autovalores de T , de modo que 

λ1 é o menor autovalor de T e λn é o maior autovalor de T . Então 

e 

λ1 = min 

x∈V 

x=0 

λn = max 

x∈V 

x=0 

〈T x, x〉 

2 = min 〈T x, x〉 (1.4) 

x 

x∈V 

x=1 

〈T x, x〉 

2 = max 〈T x, x〉 (1.5) 

x 

x∈V 

x=1 

Prova: Seja B = {v1, . . . , vn} uma base ortonormal de autovetores de T correspondentes aos autovalores 

λ1 . . . λn de T . Então, para todo x = n 

xivi ∈ V temos 

〈T x, x〉 = 

= 

= 

 

T 

n 

i=1 

xivi 

 

, 

n 

j=1 

n 

〈λixivi, xjvj〉 = 

i,j=1 

n 

i=1 

λix 2 i . 

Portanto, para todo x ∈ V , x = 0, vale 

λ1 x 2 = 

i=1 

xjvj 

 

n 

n 

= xiT vi, 

i=1 

n 

λixixj 〈vi, vj〉 

i,j=1 

n 

λ1x 2 i 〈T x, x〉 

i=1 

j=1 

xjvj 

 

n 

n 

= λixivi, 

i=1 

n 

λnx 2 i = λn x 2 

O mínimo é atingido em x = v1, ou em qualquer outro autovetor de T associado a λ1, e o máximo é atingido 

em x = vn, ou em qualquer outro autovetor de T associado a λn. 

O quociente 

〈T x, x〉 

x 2 

é chamado o quociente de Rayleigh. 

Os demais autovalores de T , λ2, . . . , λn−1, são pontos de sela e podem ser encontrado através de um 

princípio de minimax: 

1.4 Teorema. (Princípio de Minimax para Autovalores) Seja V um espaço vetorial com produto interno de 

dimensão n e T : V −→ V um operador linear auto-adjunto. Sejam λ1 . . . λn os autovalores de 

i=1 

j=1 

xjvj


T . Então, se Wj denota o conjunto dos subespaços de V de dimensão j, temos 

⎛ 

⎞ ⎛ 

λj = min ⎝ max 〈T x, x〉 ⎠ = min ⎝max 

〈T x, x〉 

W ∈Wj x∈W 

W ∈Wj x∈W x 

x=1 

x=0 

2 

⎞ 

⎠ . (1.6) 

ou, dualmente, 

λj = max 

W ∈Wj−1 

⎛ 

⎞ 

⎝ min 〈T x, x〉 ⎠ = max 

x⊥W 

x=1 

W ∈Wj−1 

⎛ 

⎝ min 

x⊥W 

x=0 

〈T x, x〉 

x 2 

⎞ 

⎠ . (1.7) 

Prova: Provemos primeiro (1.6). Seja W ⊂ V um subespaço de dimensão j. Primeiro mostraremos que 

max 〈T x, x〉 λj. 

x∈W 

x=1 

Seja B = {v1, . . . , vn} uma base ortonormal de autovetores de T correspondentes aos autovalores λ1, . . . , λn. 

Seja Z = 〈v1, . . . , vj−1〉. Como Z ⊥ = 〈vj, . . . , vn〉, temos 

de modo que 

n dim W + Z ⊥ = dim W + dim Z ⊥ − dim W ∩ Z ⊥ = j + n − (j − 1) − dim W ∩ Z ⊥ , 

dim W ∩ Z ⊥ 1 

e existe um vetor x ∈ W ∩ Z⊥ tal que x = 1. Escrevendo x = n 

xkvk, temos x = n 

 

n 

n 

〈T x, x〉 = xkT vk, 

= 

k=j 

n 

k=j 

λkx 2 k λj 

l=j 

n 

k=j 

xlvl 

k=j 

k=j 

 

n 

n 

= xkλkvk, 

x 2 k = λj. 

l=j 

xlvl 

 

= 

x 

k=j 

2 k 

n 

λkxkxl 〈vk, vl〉 

k,l=j 

= 1, donde 

Para completar a demonstração, devemos encontrar um subespaço W ⊂ V de dimensão j tal que 〈T x, x〉 

λj para todo x ∈ W com x = 1. Tomemos W = 〈v1, . . . , vj〉. Temos 

 

j 


= 

k=1 

j 

k=1 

λkx 2 k λj 

j 

l=1 

xlvl 

j 

k=1 

 

j 

= xkλkvk, 

x 2 k = λj. 

k=1 

j 

l=1 

xlvl 

 

= 

j 


O minimax é atingido em vj. 

Vamos agora provar o princípio dual (1.7). Seja W ⊂ V um subespaço de dimensão j − 1. Primeiro 

mostraremos que 

min 〈T x, x〉 λj. 

x⊥W 

x=1 

Como antes, B = {v1, . . . , vn} é uma base ortonormal de autovetores de T correspondentes aos autovalores 

λ1, . . . , λn. Seja Z = 〈v1, . . . , vj〉. Como W ⊥ tem dimensão n − (j − 1), temos 

n dim W ⊥ + Z = dim W ⊥ + dim Z − dim W ⊥ ∩ Z = n − (j − 1) + j − dim W ⊥ ∩ Z , 

k,l=1



dim W ⊥ ∩ Z 1 

e existe um vetor x ∈ Z tal que x ⊥ W e x = 1. Escrevendo x = j 

xkvk, temos x = j 

 

j 


= 

k=1 

j 

k=1 

λkx 2 k λj 

j 

l=1 

xlvl 

j 

k=1 

 

j 

= xkλkvk, 

x 2 k = λj. 

k=1 

j 

l=1 

k=1 

xlvl 

 

= 

x 

k=1 

2 k 

j 


k,l=1 

= 1, donde 

Para completar a demonstração, devemos encontrar um subespaço W ⊂ V de dimensão j − 1 tal que 

〈T x, x〉 λj para todo x ⊥ W com x = 1. Tomemos W = 〈v1, . . . , vj−1〉. Então W ⊥ = 〈vj, . . . , vn〉 e 

para todo x ∈ W ⊥ com x = 1 temos 

 

n 

n 

 

n 

n 

 

n 

〈T x, x〉 = xkT vk, = xkλkvk, = λkxkxl 〈vk, vl〉 

= 

k=j 

n 

k=j 

O maximin é atingido em vj. 

λkx 2 k λj 

l=j 

n 

k=j 

xlvl 

x 2 k = λj. 

1.5 Os Espaços de Sobolev W 1,2 e W 1,2 

0 

k=j 

Para generalizar os métodos variacionais discutidos na seção anterior para encontrar os autovalores do Laplaciano, 

é necessário definir um espaço de funções dotado de um produto interno adequado. Para domínios 

limitados, o espaço adequado para se trabalhar é o espaço de Sobolev. 

1.5.1 A Derivada Fraca 

Seja Ω um aberto de Rn . Suponha que u ∈ C1 (Ω) é uma função real continuamente diferenciável. Se 

ϕ ∈ C∞ 0 (Ω) é uma função suave com suporte compacto em Ω, segue da fórmula de integração por partes que 

 

u ∂ϕ 

 

dx = − 

∂xi 

∂u 

ϕ dx 

∂xi 

(1.8) 

Ω 

para i = 1, . . . , n. Não há termos de fronteira exatamente porque ϕ tem suporte compacto em Ω. 

Definição. Seja Ω ⊂ Rn um subconjunto aberto e u ∈ L1 loc (Ω). Dizemos que uma função vi ∈ L1 loc (Ω) é 

uma derivada fraca de u, se 

u 

Ω 

∂ϕ 

 

dx = − viϕ dx, (1.9) 

∂xi 

para toda ϕ ∈ C ∞ 0 (Ω). Se este for o caso, denotamos 

Ω 

Ω 

l=j 

xlvl 

k,l=j 

vi = ∂u 

. (1.10) 

∂xi 

Dizemos que u é fracamente diferenciável se todas as derivadas fracas de primeira ordem de u 

existirem. O espaço vetorial das funções fracamente diferenciáveis é denotado por W 1 (Ω).


Quando existe, vi é únicamente determinada a menos de conjuntos de medida nula. Claramente C 1 (Ω) ⊂ 

W 1 (Ω): o conceito de derivada fraca é uma extensão do conceito clássico de derivada que mantém a validade 

da fórmula de integração por partes. 

Exemplo 1. Sejam n = 1, Ω = (0, 2) e 

Então, se 

u(x) = 

v(x) = 

x se 0 < x 1, 

1 se 1 x < 2. 

1 se 0 < x 1, 

0 se 1 x < 2, 

temos u ′ (x) = v(x). De fato, dada ϕ ∈ C ∞ 0 ((0, 2)), temos 

 

2 

Exemplo 2. Sejam n = 1, Ω = (0, 2) e 

0 

uϕ ′ dx = 

u(x) = 

1 

0 

xϕ ′ dx + 

= ϕ(1) − 0 − 

= − 

2 

0 

vϕ dx. 

2 

1 

1 

0 

ϕ ′ dx 

ϕ dx + 0 − ϕ(1) 

x se 0 < x 1, 

2 se 1 x < 2. 

Então u não possui uma derivada fraca. Com efeito, suponha por absurdo que exista uma função 

v ∈ L1 loc ((0, 2)) satisfazendo 

para toda ϕ ∈ C ∞ 0 ((0, 2)). Então 

ou seja, 

− 

2 

0 

vϕ dx = 

1 

0 

= −ϕ(1) − 

2 

0 

xϕ ′ dx + 2 

1 

0 

ϕ(1) = 

uϕ ′ dx = − 

2 

1 

ϕ dx, 

1 

0 

2 

0 

vϕ dx, 

ϕ ′ dx = ϕ(1) − 0 − 

ϕ dx + 

2 

0 

vϕ dx. 

1 

0 

ϕ dx + 0 − 2ϕ(1) 

para toda ϕ ∈ C ∞ 0 ((0, 2)). Escolhendo uma seqüência de funções-teste (ϕm) ⊂ C ∞ 0 ((0, 2)) satisfazendo 

ϕm(1) = 1, 0 ϕm 1 e ϕm(x) → 0 para todo x = 1, obtemos através do teorema da convergência 

dominada de Lebesgue que 

uma contradição. 

1 = lim 

m→∞ ϕm(1) 

1 

= lim 

m→∞ 

0 

ϕm dx + 

2 

0 

 

vϕm dx = 0,


Estes exemplos não são acidentais. É possível provar que uma função real em uma variável real possui uma 

derivada fraca se e somente se ela for absolutamente contínua (a menos de modificações em conjuntos de 

medida nula); em particular, isso implica que ela é diferenciável no sentido clássico em quase todo ponto. No 

caso de funções de várias variáveis, pode-se provar que uma função u ∈ L1 loc (Ω) é fracamente diferenciável 

se e somente se ela é igual, a menos de um conjunto de medida nula, a uma função que (1) é absolutamente 

contínua em quase todos os segmentos em Ω paralelos aos eixos coordenados e (2) as derivadas parciais de 

u são localmente integráveis. Para maiores detalhes, veja [Biezuner]. 

1.5.2 Espaços de Sobolev 

Seja Ω um aberto de Rn . Definimos 

W 1,2 

(Ω) = u ∈ W 1 (Ω) : u ∈ L 2 (Ω) e ∂u 

∂xi 

W 1,2 (Ω) é claramente um espaço vetorial. Ele é munido da norma 

Definimos também 

uW 1,2 (Ω) = |u| 

Ω 

2 n 

 

+ 

i=1 

∈ L 2 

(Ω) para todo i = 1, . . . , n . (1.11) 

Ω 

 

 

 

∂u 

 

∂xi 

 

2 1/2 

W 1,2 

0 (Ω) = fecho de C ∞ 0 (Ω) em W 1,2 (Ω). 

. (1.12) 

Em ambos os espaços vetoriais normados W 1,2 (Ω) e W 1,2 

0 (Ω) definimos o produto interno 

 

〈u, v〉 = 

Ω 

uv + 

n 

 

i=1 

Ω 

∂u ∂v 

= 〈u, v〉 L2 (Ω) + 

∂xi ∂xi 

n 

 

∂u 

, 

∂xi 

∂v 

 

∂xi L2 . (1.13) 

(Ω) 

Desta forma, a norma definida acima é derivada deste produto interno. Ela também é equivalente à norma 

 

uW 1,2 (Ω) = 

|u| 

Ω 

2 

1/2 = u L 2 (Ω) + 

+ 

n 

i=1 

n 

 

 

 

∂u 

 

∂xi 

1.5.3 Propriedades dos Espaços de Sobolev 

i=1 

Ω 

i=1 

L 2 (Ω) 

 

 

 

∂u 

 

∂xi 

 

. 

2 1/2 

Assumiremos os resultados a seguir sem demonstração (veja [Biezuner] para a demonstração destes resultados). 

1.3 Teorema. W 1,2 (Ω) é um espaço de Hilbert. Em particular, W 1,2 

0 (Ω) também é um espaço de Hilbert. 

1.4 Teorema. C ∞ (Ω) ∩ W 1,2 (Ω) é denso em W 1,2 (Ω). Se Ω um aberto com fronteira de classe C 1 , então 

C ∞ (Ω) ∩ W 1,2 (Ω) é denso em W 1,2 (Ω). 

Os seguintes resultados caracterizam o espaço W 1,2 

0 (Ω): 

1.5 Teorema. Se u ∈ W 1,2 (Ω) satisfaz supp u ⊂⊂ Ω, então u ∈ W 1,2 

0 (Ω). 

Se Ω ⊂ Rn é um aberto com fronteira de classe C1 e se u ∈ W 1,2 (Ω) ∩ C(Ω), então u ∈ W 1,2 

0 (Ω) se e 

somente se u = 0 em ∂Ω.


As propriedades de imersão compacta dos espaços de Sobolev são as que lhe conferem a sua grande 

utilidade. Recordamos os conceitos de imersão contínua e imersão compacta: 

Definição. Seja E um subespaço vetorial normado de um espaço normado F (ou seja, a norma em E não 

precisa necessariamente ser a norma induzida de F ). Dizemos que a inclusão E ⊂ F é uma imersão 

(contínua) se a aplicação inclusão I : E → F definida por Ix = x for contínua. Denotamos este fato 

por 

E ↩→ F. 

Se, além disso, a aplicação inclusão for compacta, dizemos que a imersão E ↩→ F é compacta. 

Denotaremos a imersão compacta de um espaço vetorial normado E em um espaço vetorial normado 

F por 

E ↩ → F. 

Como a aplicação inclusão é linear, o fato de existir uma imersão E ↩→ F é equivalente à existência de uma 

constante C tal que 

xF C xE para todo x ∈ E. 

Em particular, se (xn) é uma seqüência de Cauchy em E, então (xn) também é uma seqüência de Cauchy 

em F ; logo, se xn → x em E, então xn → x em F também. É claro que se E tem a norma induzida de F , 

então a inclusão E ⊂ F é uma imersão, com C = 1. Quando existe uma imersão E ↩→ F , dizer que ela é 

compacta é equivalente a dizer que seqüências limitadas de (E, ·E ) possuem subseqüências convergentes 

em (F, ·F ). 

1.6 Teorema. (Teorema da Imersão de Sobolev) Seja Ω ⊂ R n um aberto. Então 

W 1,2 (Ω) ↩→ L 2 (Ω), 

W 1,2 

0 (Ω) ↩→ L 2 (Ω). 

Prova: Usando a norma equivalente introduzida acima, se E = W 1,2 (Ω) ou se E = W 1,2 

0 (Ω) temos 

 

u E = u L 2 (Ω) + 

n 

 

 

 

∂u 

 

∂xi 

i=1 

L 2 (Ω) 

u L 2 (Ω) . 

1.7 Teorema. (Teorema de Rellich–Kondrakhov) Seja Ω ⊂ R n um aberto limitado com fronteira de classe 

C 1 . Então 

W 1,2 (Ω) ↩ → L 2 (Ω) , 

Se trocarmos W 1,2 por W 1,2 

0 , o resultado é válido para abertos arbitrários. 

1.8 Teorema. (Desigualdade de Poincaré) Seja Ω ⊂ R n um aberto limitado. Então 

u L 2 (Ω) 

|Ω| 

ωn 

1/n 

∇u L 2 (Ω) . 

para todo u ∈ W 1,2 

0 (Ω) (aqui ωn é o volume da bola unitária em R n ). 

Observe que o Teorema 1.8 não é válido se trocamos W 1,2 

0 

por W 1,2 porque as funções constantes pertencem 

a W 1,2 e não satisfazem a desigualdade de Poincaré (pois têm derivada nula).


1.6 Existência e Unicidade de Soluções para o Laplaciano através 

do Método Variacional 

De agora em diante, Ω ⊂ R n será sempre um aberto limitado. 

1.6.1 Soluções Fracas 

Definição. Seja f ∈ L2 (Ω). Dizemos que u ∈ W 1,2 

0 (Ω) é uma solução fraca para o problema de Dirichlet 

 

∆u = f 

u = 0 

em Ω, 

sobre ∂Ω, 

(1.14) 

se 

 

∇u · ∇v = − 

Ω 

Ω 

fv para todo v ∈ W 1,2 

0 (Ω) . 

Se os dados do problema de Dirichlet (1.14) são suficientemente regulares e a solução fraca também é 

suficientemente regular, então ela é uma solução clássica: 

1.9 Proposição. (Soluções Fracas Regulares são Soluções Clássicas) Sejam f ∈ C 0 (Ω). Se existir uma 

solução fraca u ∈ C 2 (Ω) ∩ C 0 Ω para o problema 

então u é uma solução clássica. 

∆u = f em Ω, 


Prova: Pela Primeira Identidade de Green, para todo v ∈ C∞ 0 (Ω) temos 

 

 

∇u · ∇v = 

 

∂u 

v − 

∂ν 

 

(∆u) v = − (∆u) v. 

Ω 

∂Ω 

Daí e da definição de solução fraca segue que 

 

para todo v ∈ C ∞ 0 (Ω), ou seja, 

Ω 

Ω 

 

(∆u) v = 

Ω 

fv 

∆u = f em Ω. 

Além disso, como u ∈ W 1,2 

0 (Ω) ∩ C 0 Ω , segue da caracterização dos espaços W 1,2 

0 (Ω) que u = 0 em ∂Ω. 

1.6.2 Existência, Unicidade e Regularidade de Soluções Fracas 

Quando uma solução fraca existe ela é única: 

1.10 Proposição. (Unicidade da Solução Fraca) Seja f ∈ L 2 (Ω). Se existir uma solução fraca para o 

problema ∆u = f em Ω, 

então ela é única. 


Ω


Prova: O resultado segue imediatamente da estabilidade fraca da equação de Poisson, isto é, se u1, u2 ∈ 

W 1,2 (Ω) satisfazem 

∆u1 = f1, ∆u2 = f2 em Ω 

para f1, f2 ∈ L 2 (Ω), e 

então existe uma constante C = C (n, Ω) tal que 

u1 − u2 ∈ W 1,2 

0 (Ω) , 

u1 − u2 W 1,2 (Ω) C f1 − f2 L 2 (Ω) . (1.15) 

De fato, temos 

 

∇ (u1 − u2) · ∇v = − (f1 − f2) v, 

Ω 

Ω 

para todo v ∈ W 1,2 

0 (Ω), em particular para v = u1 − u2. Portanto segue da desigualdade de Poincaré que 

∇u1 − ∇u2 2 

L2 (Ω) = 

 

|∇ (u1 − u2)| 

Ω 

2 

 

= (f1 − f2) (u1 − u2) 

Ω 

donde 

f1 − f2 L 2 (Ω) u1 − u2 L 2 (Ω) 

C f1 − f2 L 2 (Ω) ∇u1 − ∇u2 L 2 (Ω) , 

∇u1 − ∇u2 L 2 (Ω) C f1 − f2 L 2 (Ω) . 

Novamente usando a desigualdade de Poincaré, isso é suficiente para estabelecer (1.15). 

No caso do problema de Dirichlet para a equação de Poisson, a existência de uma solução fraca é imediatamente 

estabelecida pelo equivalente ao princípio de Dirichlet visto no início do capítulo anterior: 

1.11 Teorema. (Existência da Solução Fraca) Sejam f ∈ L 2 (Ω). Então existe uma única solução fraca 

u ∈ W 1,2 

0 (Ω) para o problema 

∆u = f em Ω, 

u = 0 sobre ∂Ω. 

Prova: Considere o funcional de Dirichlet I : W 1,2 

0 (Ω) → R definido por 

I (v) = 1 

2 

 

Ω 

|∇v| 2 

dx + 

Ω 

fv. 

(1.16) 

Afirmamos que um ponto crítico u deste funcional é uma solução fraca de (1.16). De fato, se u é um ponto 

crítico de I, então a derivada direcional de I na direção de qualquer v ∈ W 1,2 

0 (Ω) é igual a 0, logo 

0 = d 

dt [I (u + tv)| 

d 1 

t=0 = |∇ (u + tv)| 

dt 2 Ω 

2 

 

 

+ f (u + tv) 

 

Ω 

t=0 

 

 

= ∇u · ∇v + fv 

Ω 

Ω 

para todo v. 

Para provar o teorema, basta então encontrar uma função u ∈ W 1,2 

0 (Ω) que minimiza I, isto é, u tal que 

I (u) = min 

v∈W 1,2 

 

1 

|∇v| 

0 (Ω) 2 Ω 

2 dx + 

 

Ω 

 

fv ,


pois um ponto de mínimo é um ponto crítico de um funcional diferenciável. Pela desigualdade de Poincaré, 

o funcional I é limitado por baixo, pois 

I (v) = 1 

2 ∇v2 L2 (Ω) + 

 

 

f (v − g) + fg 

Ω 

Ω 

1 

2 ∇v2 L2 (Ω) − 

 

 

 

 

 

f (v − g) 

 

Ω 

+ 

 

fg 

Ω 

1 

2 ∇v2 L2 (Ω) − fL2 (Ω) (v − g)L2 (Ω) + 

 

fg 

Ω 

1 

2 ∇v2 L2 (Ω) − C fL2 (Ω) ∇ (v − g)L2 (Ω) + 

 

fg 

Ω 

1 

2 ∇v2 

L 2 (Ω) − C f L 2 (Ω) ∇v L 2 (Ω) + 

fg − C fL2 (Ω) ∇gL2 (Ω) , 

Ω 

e a função real h (t) = t2 

−at+b é limitada por baixo para t ∈ R, quaisquer que sejam os valores de a, b ∈ R. 

2 

Podemos então definir 

I0 = inf 

v∈W 1,2 

I (u) . 

0 (Ω) 

Seja (um) m∈N uma seqüência minimizante para I, isto é, 

I (um) = 1 

 

|∇um| 

2 Ω 

2 

dx + fum → I0. 

Ω 

É fácil ver, que o funcional I é convexo. De fato, isto é uma conseqüência imediata da convexidade da função 

x ↦→ |x| 2 

 

I (tu + (1 − t) v) = |t∇u + (1 − t) ∇v| 

Ω 

2 

dx + f (tu + (1 − t) v) 

Ω 

 

t |∇u| 2 + (1 − t) |∇v| 2 

 

dx + t 

 

fu + (1 − t) fv 

Ω 

= tI (u) + (1 − t) I (v) . 

A convexidade da função x ↦→ |x| 2 por sua vez pode ser provada do seguinte modo: 

|tx + (1 − t) y| 2 − t |x| 2 − (1 − t) |y| 2 = t 2 − t |x| 2 

+ 2t (1 − t) x · y + (1 − t) 2 

− (1 − t) 

Logo, 

 

uk + ul 

I0 I 

2 

Ω 

= −t (1 − t) |x − y| 2 0. 

quando k, l → ∞. Por outro lado, temos 

 

1 

|∇ (uk − ul)| 

2 Ω 

2 

dx = |∇uk| 

Ω 

2 

dx + 

Ω 

 

= |∇uk| 2 

dx + 2 

Ω 

1 

2 I (uk) + 1 

2 I (ul) → I0 

|∇ul| 2 

 

dx − 2 

 

Ω 

∇ 

 

uk + ul 

2 

 

fuk + |∇ul| 

Ω 

Ω 

2 

dx + 2 

2 

dx − 4 

 

uk + ul 

f 

 

 

− 2 

 

Ω 

∇ 

 

uk + ul 

2 

Ω 

 

uk + ul 

= 2I (uk) + 2I (ul) − 4I 

, 

2 

2 

Ω 

ful 

Ω 

2 

dx 

|y| 2


donde concluímos que (∇um) é uma seqüência de Cauchy em L 2 (Ω). Pela desigualdade de Poincaré temos 

que 

uk − ul L 2 (Ω) C ∇uk − ∇ul L 2 (Ω) , 

logo (um) também é uma seqüência de Cauchy em L2 (Ω) e portanto (um) é uma seqüência de Cauchy em 

W 1,2 

0 (Ω), ou seja, existe u ∈ W 1,2 

0 (Ω) tal que um → u em W 1,2 

0 (Ω). Em particular, segue que I (u) = I0. 

Como um → u em L2 (Ω) e ∇um → ∇u em L2 (Ω), temos que 

 

1 

|∇um| 

2 Ω 

2 

dx + fum → 

Ω 

1 

 

|∇u| 

2 Ω 

2 

dx + fu, 

Ω 

e concluímos que u é o minimizador do funcional de Dirichlet I. 

Se a fronteira e os dados do problema são suficientemente regulares, pode-se provar que uma solução 

fraca é uma solução clássica (veja [Gilbarg-Trudinger] ou [Biezuner] para os detalhes): 

1.12 Teorema. Seja Ω ⊂ R n um aberto limitado com fronteira de classe C ∞ . Seja f ∈ C ∞ (Ω).. Se 

u ∈ W 1,2 

0 (Ω) é uma solução fraca de 

∆u = f em Ω, 

então u ∈ C ∞ Ω . 

1.7 O Espectro do Laplaciano 


1.7.1 Existência e Caracterização Variacional dos Autovalores do Laplaciano 

Para o problema de Dirichlet, o espaço natural para aplicar o método variacional é W 1,2 

0 (Ω), enquanto que 

para o problema de Neumann trabalharemos em W 1,2 (Ω). Examinaremos primeiro o problema de autovalor 

do laplaciano para condição de fronteira de Dirichlet. 

Definição. Dizemos que u ∈ W 1,2 

0 (Ω) é uma solução fraca para o problema de autovalor do laplaciano 

para condição de fronteira de Dirichlet 


se 

 

∇u · ∇v = λ 

Ω 


Aceitaremos o seguinte resultado de regularidade sem demonstração. 

Ω 

uv para todo v ∈ W 1,2 

0 (Ω) . (1.17) 

1.13 Teorema. Seja Ω ⊂ R n um aberto limitado com fronteira de classe C ∞ . Seja λ ∈ R. Se u ∈ W 1,2 

0 (Ω) 

é uma solução fraca de −∆u = λu em Ω, 

então u ∈ C ∞ Ω . 


1.14 Teorema. Seja Ω ⊂ R n um aberto limitado. Então o problema de autovalor 

−∆u = λu em Ω, u ∈ W 1,2 

0 (Ω) 

possui um número infinito enumerável de autovalores 

0 < λ1 λ2 . . . λj . . .


tais que 

λj → ∞, 

e autofunções {uj} que constituem um sistema ortonormal completo para L 2 (Ω), isto é, 

para todo v ∈ L 2 (Ω). Em particular, 

Além disso, para todo v ∈ W 1,2 

0 (Ω) vale 

v = 

v 2 

L 2 (Ω) = 

∇v 2 

L 2 (Ω) = 

∞ 

i=1 

∞ 

i=1 

∞ 

i=1 

αiui 

〈v, ui〉 2 

L 2 (Ω) . 

λi 〈v, ui〉 2 

L 2 (Ω) . 

Prova: Generalizando o princípio de Rayleigh, gostaríamos de obter o primeiro autovalor do laplaciano 

como o mínimo do funcional de Rayleigh: 

λ1 = inf 

u∈W 1,2 

0 (Ω)\{0} 

〈−∆u, u〉 L2 (Ω) 

u 2 

L2 . 

(Ω) 

No entanto, nossas funções estão em W 1,2 

0 (Ω) e em geral não possuem derivadas parcias de segunda ordem 

e portanto seus laplacianos não estão definidos. Porém, lembrando que C∞ 0 (Ω) é denso em W 1,2 

0 (Ω) e a 

primeira identidade de Green para funções em C∞ 0 (Ω) toma a forma 

 

〈−∆u, u〉 L2 (Ω) = 

Ω 

 

(−∆u) u = 

Ω 

 

〈∇u, ∇u〉 − 

consideramos o funcional I : W 1,2 

0 (Ω) \ {0} → R definido por 

Afirmamos que se 

I (u) = 

então existe u ∈ W 1,2 

0 (Ω), u = 0, tal que 

 

Ω |∇u|2 

 

Ω u2 = 〈∇u, ∇u〉 L2 (Ω) 

〈u, u〉 L2 (Ω) 

∂Ω 

u ∂u 

∂η = 〈∇u, ∇u〉 L 2 (Ω) 

L2 (Ω) 

u 2 

L2 (Ω) 

= ∇u2 

λ1 = inf 

u∈W 1,2 

I (u) , (1.18) 

0 (Ω)\{0} 

−∆u = λ1u, 

ou seja, λ1 é um autovalor do laplaciano. Para provar isso, observe em primeiro lugar que o funcional I 

é invariante por escala, no sentido de que I (αu) = I (u) para todo α = 0, logo podemos considerar uma 

seqüência minimizante (uk) ⊂ W 1,2 

0 (Ω) que satisfaz uk L 2 (Ω) = 1 para todo k. Em particular, 

∇uk 2 

L2 (Ω) → λ1, 

logo (uk) é uma seqüência limitada em W 1,2 

0 (Ω). Segue do Teorema de Rellich-Kondrakhov que, a menos 

de uma subseqüência, uk → u em L 2 (Ω) e, portanto, u L 2 (Ω) = 1, o que implica em particular que u = 0. 

Afirmamos que uk → u em W 1,2 

0 (Ω). De fato, valem as identidades 

∇ (uk − ul) 2 

L2 (Ω) + ∇ (uk + ul) 2 

L2 2 

(Ω) = 2 ∇ukL2 2 

(Ω) + 2 ∇ulL2 (Ω) , 

uk − ul 2 

L2 (Ω) + uk + ul 2 

L2 2 

(Ω) = 2 ukL2 2 

(Ω) + 2 ulL2 (Ω) = 4. 

.


A segunda identidade implica que uk + ul 2 

juntamente com a desigualdade 

que segue da definição de λ1, obtemos 

L 2 (Ω) 

→ 4 quando k, l → ∞. Usando a primeira identidade 

∇ (uk + ul) 2 

L 2 (Ω) λ1 uk + ul 2 

L 2 (Ω) , 

∇ (uk − ul) 2 

L2 2 

(Ω) 2 ∇ukL2 2 

(Ω) + 2 ∇ulL2 (Ω) − λ1 uk + ul 2 

L2 (Ω) → 0 

quando k, l → ∞, isto é, (∇uk) é uma seqüência de Cauchy em L 2 (Ω), o que prova a afirmação. Segue que 

λ1 = ∇u 2 

L 2 (Ω) 

e o Teorema de Poincaré implica que λ1 = 0. Vamos denotar u = u1. Para mostrar que u1 é uma solução 

fraca de −∆u1 = λ1u1, observe que para todo v ∈ W 1,2 

0 (Ω) fixado temos 

I (u1 + tv) = 〈∇ (u1 + tv) , ∇ (u1 + tv)〉 L 2 (Ω) 

〈(u1 + tv) , (u1 + tv)〉 L 2 (Ω) 

= ∇u1 2 

L2 (Ω) + 2t 〈∇u1, ∇v〉 L2 (Ω) + t2 ∇u1 2 

L2 (Ω) 

u1 2 

L2 (Ω) + 2t 〈u1, v〉 L2 (Ω) + t2 u1 2 

L2 (Ω) 

onde |t| é suficientemente pequeno para que o denominador nunca se anule. Como u1 é um mínimo para 

este funcional, segue que 

0 = dI 

 

 

(u + tv) 

dt 

t=0 

 

2 〈∇u1, ∇v〉 L2 (Ω) + 2t ∇u1 

= 

2 

L2 

(Ω) u1 + tv 2 

L2 (Ω) − 

 

2 〈u1, v〉 L2 (Ω) + 2t u1 2 

L2 

(Ω) ∇ (u1 + tv) 2 

L2 (Ω) 

u1 + tv 4 

L2 

 

 

 

 

(Ω) 

= 2 〈∇u1, ∇v〉 L 2 (Ω) u1 2 

L 2 (Ω) − 2 〈u1, v〉 L 2 (Ω) ∇u1 2 

L 2 (Ω) 

u1 + tv 4 

L 2 (Ω) 

= 2 〈∇u1, ∇v〉 L2 (Ω) − 2λ1 〈u1, v〉 L2 (Ω) 

u1 + tv 4 

L2 , 

(Ω) 

ou seja, 

∇u1 · ∇v = λ1 

Ω 


0 (Ω). 

Suponha como hipótese de indução que obtivemos (λ1, u1) , . . . , (λj−1, uj−1) satisfazendo 

e 

 

Ω 

ui ∈ W 1,2 

0 (Ω) , 

λ1 . . . λj−1, 

−∆u = λiu em Ω, 

〈ui, uk〉 L 2 (Ω) = δik 

para todos 1 i, k j. Definimos 

 

Hj = v ∈ W 1,2 

 

0 (Ω) : 〈v, ui〉 L2 (Ω) = 0 para i = 1, . . . , j − 1 . 

u1v 

t=0


Em outras palavras, Hj é o subespaço de Hilbert ortogonal ao subespaço de dimensão finita gerado pelas 

autofunções u1, . . . , uj−1. Defina 

λj = inf I (u) . 

u∈Hj 

Como o ínfimo está tomado sobre um espaço menor, segue que 

λj λj−1. 

O fato de que Hj é um subespaço fechado de W 1,2 

0 (Ω) permite repetir o mesmo argumento acima para obter 

uj ∈ Hj tal que ujL2 (Ω) = 1, λj = ∇uj 2 

L2 (Ω) . Também analogamente obtemos 

 

∇uj · ∇v = λj 

Ω 

para todo v ∈ Hj e a relação é trivialmente verdadeira para todo v ∈ W 1,2 

0 (Ω), já que uj é ortogonal ao 

subespaço gerado por u1, . . . , uj−1. Portanto uj é uma solução fraca de −∆u = λju em Ω. 

Para ver que λj → ∞, suponha por absurdo que λj → λ0. Então obtemos uma seqüência (uj) ⊂ W 1,2 

0 (Ω) 

de autofunções associadas aos autovalores λk tais que ujL2 (Ω) = 1 e 

 

Ω 

ujv 

∇uj 2 

L 2 (Ω) = λj → λ0. 

Em particular, podemos usar novamente o Teorema de Rellich-Kondrakhov para concluir que uj → u em 

L 2 (Ω). Mas isso é um absurdo, pois a seqüência (uj) é ortonormal em L 2 (Ω) e portanto satisfaz 

e 

uk − ul 2 

L2 2 

(Ω) = ukL2 2 

(Ω) + ulL2 (Ω) = 2. 

Falta apenas provar os resultados de expansão. Para v ∈ W 1,2 

0 (Ω), escreva 

Para todo i k temos 

〈wk, ui〉 = 

 

v − 

αi = 〈v, ui〉 L 2 (Ω) 

vk = 

k 

αiui, 

i=1 

wk = v − vk. 

k 

i=1 

αiui, ui 

Daí, como ui é solução fraca, para todo i k temos também 


Desta última identidade segue que 

 

= 〈v, ui〉 − αi = 0. 

〈∇wk, ∇ui〉 L 2 (Ω) = λi 〈wk, ui〉 L 2 (Ω) = 0, 

〈wk, wk〉 L 2 (Ω) = 〈v, v〉 L 2 (Ω) − 〈vk, vk〉 L 2 (Ω) , 

〈∇wk, ∇wk〉 L 2 (Ω) = 〈∇v, ∇v〉 L 2 (Ω) − 〈∇vk, ∇vk〉 L 2 (Ω) . 

〈∇wk, ∇wk〉 L 2 (Ω) 〈∇v, ∇v〉 L 2 (Ω) .


Por definição de λk, 

logo 

Em particular, concluímos que 

Para provar a segunda expansão, escreva 


Como 

segue que 

〈∇wk, ∇wk〉 L 2 (Ω) λk+1 〈wk, wk〉 L 2 (Ω) , 

wk 2 

L 2 (Ω) = 〈wk, wk〉 L 2 (Ω) 1 

∇vk 2 

L 2 (Ω) = 

v = lim vk + lim wk = 

∇vk = 

λk+1 

〈∇v, ∇v〉 L 2 (Ω) → 0. 

∞ 

αiui em L 2 (Ω) . (1.19) 

i=1 

k 

αi∇ui, 

i=1 

k 

α 2 i 〈∇ui, ∇ui〉 = 

i=1 

k 

α 2 i λi 〈ui, ui〉 = 

i=1 

k 

i=1 

〈∇wk, ∇wk〉 L 2 (Ω) + 〈∇vk, ∇vk〉 L 2 (Ω) = 〈∇v, ∇v〉 L 2 (Ω) , 

∇vk 2 

L2 (Ω) ∇v2 L2 (Ω) . 

Somando-se a isso o fato que os λi são não-negativos, concluímos que a série ∞ 

∇ (wk − wl) 2 

L 2 (Ω) = ∇ (vl − vk) 2 

L 2 (Ω) = 

l 

i=k+1 

λiα 2 i . 

λiα 

i=1 

2 i 

λiα 2 i 

converge, de modo que 

e portanto (∇wk) também é uma seqüência de Cauchy em L 2 (Ω), ou seja, (wk) converge em W 1,2 

0 (Ω). 

Conseqüentemente, em vista do resultado anterior, wk → 0 em W 1,2 

0 (Ω), logo 

∇v 2 

L2 2 

(Ω) = lim ∇vkL2 (Ω) + 2 lim 〈∇vk, ∇wk〉 + lim ∇wk 2 

L2 (Ω) = 

Segue que (uj) é uma seqüência ortonormal e o fecho do subespaço gerado por (uj) é um espaço de Hilbert 

contendo W 1,2 

0 (Ω) contido em L2 (Ω). Como W 1,2 

0 (Ω) = L2 (Ω), concluímos que {uj} é um sistema ortonormal 

completo para L2 (Ω). 

Observação 1. Segue deste teorema, em particular, que aquelas funções v em L2 (Ω) que não estão em 

W 1,2 

0 (Ω) podem ser caracterizadas pelo fato que ∞ i=1 λi 〈v, ui〉 L2 (Ω) diverge. 

Observação 2. Pelo Teorema 1.13, se ∂Ω for de classe C∞ , então as autofunções do problema de Dirichlet 

estão em C∞ Ω e são soluções clássicas. 

A demonstração do resultado equivalente para o problema de autovalor com condição de Neumann é 

análoga (veja [Jost]): 

1.15 Teorema. Seja Ω ⊂ R n um aberto limitado. Então o problema de autovalor 

−∆u = λu em Ω, u ∈ W 1,2 (Ω) 

∞ 

i=1 

λiα 2 i .


possui um número infinito enumerável de autovalores 

tais que 

e autofunções {uj} que satisfazem 

0 = λ0 λ1 λ2 . . . λj . . . 

∂u 

∂η 

λj → ∞, 

= 0 sobre ∂Ω 

e constituem um sistema ortonormal completo para L 2 (Ω), isto é, 

para todo v ∈ L 2 (Ω). Em particular, 

Além disso, para todo v ∈ W 1,2 (Ω) vale 

v = 

v 2 

L 2 (Ω) = 

∇v 2 

L 2 (Ω) = 

∞ 

i=1 

∞ 

i=1 

∞ 

i=1 

αiui 

〈v, ui〉 2 

L 2 (Ω) . 

λi 〈v, ui〉 2 

L 2 (Ω) . 

Na demonstração do Teorema 1.14 usamos o princípio de Rayleigh para obter o primeiro autovalor 

do laplaciano como o mínimo do funcional de Rayleigh. Como os autovalores do laplaciano formam uma 

seqüência infinita que cresce arbitrariamente em módulo, o funcional de Rayleigh para o laplaciano não 

possui um máximo. Entretanto, da mesma forma que no caso de operadores lineares em dimensão finita, 

podemos também derivar um princípio de minimax para obter os demais autovalores do laplaciano: 

1.16 Teorema. Seja Ω ⊂ R n um aberto limitado. Sejam 

0 < λ1 λ2 . . . λj . . . 

os autovalores do laplaciano com condição de Dirichlet: 

−∆u = λu em Ω, u ∈ W 1,2 

0 (Ω) . 

Então, se Lj denota o conjunto dos subespaços vetoriais de W 1,2 

0 (Ω) de dimensão j, temos 

ou, dualmente, 

λj = min 

L∈Lj 

λj = max 

L∈Lj−1 

⎛ 

⎝ max 

u∈L 

u=1 

⎛ 

⎝ min 

u⊥L 

u=1 

〈∇u, ∇u〉 L 2 (Ω) 

〈∇u, ∇u〉 L 2 (Ω) 

⎞ 

⎠ = min 

L∈Lj 

⎞ 

⎛ 

⎠ = max 

L∈Lj−1 

⎝max 

u∈L 

u=0 

⎛ 

⎝min 

u⊥L 

u=0 

〈∇u, ∇u〉 L 2 (Ω) 

u 2 

L 2 (Ω) 

〈∇u, ∇u〉 L 2 (Ω) 

u 2 

L 2 (Ω) 

⎞ 

⎠ (1.20) 

⎞ 

⎠ . (1.21) 

O resultado análogo vale para os autovalores do laplaciano com condição de Neumann trocando-se 

W 1,2 

0 (Ω) por W 1,2 (Ω) e λj por λj−1.


Prova: Vimos na demonstração do Teorema 1.13 que se L = 〈u1, . . . , uj−1〉 é o subespaço gerado pelas 

primeiras j − 1 autofunções u1, . . . , uj−1 do laplaciano, então 

λj = min 

u⊥L 

u=0 

〈∇u, ∇u〉 L2 (Ω) 

u 2 

L2 ; 

(Ω) 

de fato, o mínimo é realizado em u = uj. Por outro lado, se L ′ = 〈u1, . . . , uj〉 é o subespaço gerado pelas 

primeiras j autofunções u1, . . . , uj do laplaciano, também temos 

De fato, para todo ui com i < j vale 

enquanto que 

Portanto, se u = n 

aiui ∈ L ′ , temos 

i=1 

〈∇u, ∇u〉 L 2 (Ω) 

u 2 

L 2 (Ω) 

= 〈∇u, ∇u〉 L 2 (Ω) 

〈u, u〉 L 2 (Ω) 

= 

λj = max 

u∈L ′ 

u=0 

n 

λia2 i 〈ui, ui〉 L2 (Ω) 

i=1 

n 

a2 i 〈ui, ui〉 L2 (Ω) 

i=1 

〈∇ui, ∇ui〉 L 2 (Ω) 

ui 2 

L 2 (Ω) 

〈∇uj, ∇uj〉 L 2 (Ω) 

uj 2 

L 2 (Ω) 

〈∇u, ∇u〉 L2 (Ω) 

u 2 

L2 . 

(Ω) 

= λi λj, 

= λj. 

 

n 

ai∇ui, 

= 

i=1 

n 

 

ai∇ui 

 

n 

i=1 

 

aiui, 

i=1 

n 

aiui 

i=1 

i=1 

λj 

L 2 (Ω) 

L 2 (Ω) 

= 

n 

a2 i 〈ui, ui〉 L2 (Ω) 

n 

a2 i 〈ui, ui〉 L2 (Ω) 

= λj, 

i=1 

n 

a2 i 〈∇ui, ∇ui〉 L2 (Ω) 

i=1 

n 

a2 i 〈ui, ui〉 L2 (Ω) 

e o máximo é realizado em u = uj. 

Agora, para provar (1.20), seja L ′ ⊂ Lj outro subespaço de W 1,2 

0 (Ω) de dimensão j, digamos L ′ = 

〈v1, . . . , vj〉. Afirmamos que existe um vetor não nulo v = j 

aivi ∈ L ′ tal que v ⊥ ui para i = 1, . . . , j − 1. 

De fato, basta tomar uma das soluções não triviais do sistema homogêneo 

⎧ 

〈v, u1〉 = 

⎪⎨ 

⎪⎩ 

j 

ai 〈vi, u1〉 = 0 

i=1 

. 

〈v, uj−1〉 = j 

ai 〈vi, uj−1〉 = 0 

que possui j − 1 equações e j incógnitas. Logo, disso e do Teorema 1.15 segue que 

〈∇v, ∇v〉 L 2 (Ω) 

v 2 

L 2 (Ω) 

= ∇v2 L2 (Ω) 

v 2 

L2 = 

(Ω) 

∞ 

i=1 

∞ 

i=1 

i=1 

λi 〈v, ui〉 2 

L 2 (Ω) 

〈v, ui〉 2 

L 2 (Ω) 

= 

i=1 

∞ 

i=j 

∞ 

i=j 

λi 〈v, ui〉 2 

L 2 (Ω) 

〈v, ui〉 2 

L 2 (Ω) 

 

i=1 

∞ 

λj 

i=j 

∞ 

i=j 

〈v, ui〉 2 

L 2 (Ω) 

〈v, ui〉 2 

L 2 (Ω) 

= λj,


e portanto 

max 

u∈L ′ 

u=0 

〈∇u, ∇u〉 L 2 (Ω) 

u 2 

L 2 (Ω) 

Isso prova (1.20). 

Para provar a afirmativa dual (1.21), seja L ⊂ Lj um subespaço de W 1,2 

0 (Ω) de dimensão j − 1, digamos 

L = 〈v1, . . . , vj−1〉. Afirmamos que existe um vetor não nulo v = j 

aiui ⊥ L, combinação linear dos vetores 

λj. 

u1, . . . , uj. De fato, basta tomar uma das soluções não triviais do sistema homogêneo 

⎧ 

〈v, v1〉 = 

⎪⎨ 

⎪⎩ 

n 

ai 〈ui, v1〉 = 0 

i=1 

. 

. 

〈v, vj−1〉 = n 

ai 〈ui, vj−1〉 = 0 

i=1 

que possui j − 1 equações e j incógnitas. Então algum dos vetores u1, . . . , uj é perpendicular a L, digamos 

ui. Logo, disso e do Teorema 1.13 segue que 

〈∇v, ∇v〉 L 2 (Ω) 

v 2 

L 2 (Ω) 

e portanto 

= ∇v2 L2 (Ω) 

v 2 

L2 = 

(Ω) 

 

o que prova (1.21). 

λj 

i=1 

∞ 

i=1 

j 

∞ 

i=1 

∞ 

i=1 

a 2 i 〈ui, ui〉 2 

L 2 (Ω) 

a 2 i 〈ui, ui〉 2 

L 2 (Ω) 

λi 〈v, ui〉 2 

L 2 (Ω) 

〈v, ui〉 2 

L 2 (Ω) 

= λj, 

min 

u⊥L 

u=0 

1.7.2 Comparação de Autovalores 

= 

∞ 

λi 

i=1 

j 

∞ 

 

j 

i=1 

〈∇u, ∇u〉 L 2 (Ω) 

u 2 

L 2 (Ω) 

i=1 

2 

akuk, ui 

k=1 

L2 (Ω) 

2 

akuk, ui 

k=1 

λj, 

L 2 (Ω) 

= 

j 

i=1 

∞ 

i=1 

a 2 i λi 〈ui, ui〉 2 

L 2 (Ω) 

a 2 i 〈ui, ui〉 2 

L 2 (Ω) 

Como uma conseqüência simples da caracterização minimax obtemos uma comparação entre os autovalores 

do laplaciano de Dirichlet e os autovalores do laplaciano de Neumann de um mesmo domínio: 

1.17 Corolário. Seja Ω ⊂ R n um aberto limitado. Sejam 

0 < λ D 1 λ D 2 . . . λ D k . . . 

os autovalores do laplaciano com condição de Dirichlet e 

0 = λ N 0 λ N 1 λ N 2 . . . λ N k . . . 

os autovalores do laplaciano com condição de Neumann. Então 

para todo j. 

λ N j−1 λ D j


Prova: Denotando 

 

Lj W 1,2 

 

0 (Ω) = L ⊂ W 1,2 

 

0 (Ω) : L é um subespaço vetorial de dimensão j , 

1,2 1,2 

W (Ω) = L ⊂ W (Ω) : L é um subespaço vetorial de dimensão j , 

Lj 

como W 1,2 

0 (Ω) ⊂ W 1,2 (Ω), segue que 

Em particular, o mínimo sobre Lj 

que 

⎛ 

λ N j−1 = min 

L∈Lj(W 1,2 (Ω)) 

⎝ max 

u∈L 

u=1 

Lj 

 

W 1,2 

1,2 

0 (Ω) ⊂ Lj W (Ω) . 

 

W 1,2 

 

 

1,2 

0 (Ω) não pode ser maior que o mínimo sobre Lj W (Ω) . Segue 

〈∇u, ∇u〉 L 2 (Ω) 

⎞ 

⎠ min 

L∈Lj(W 1,2 

0 (Ω)) 

⎛ 

⎝ max 

u∈L 

u=1 

〈∇u, ∇u〉 L 2 (Ω) 

⎞ 

⎠ = λ D j . 

 

O que acontece com os autovalores do laplaciano de um domínio Ω quando este aumenta? Se nos 

restringirmos a simples aumentos de escala, a resposta é simples. Denote Ωa = {ax : x ∈ Ω}. Se u satisfaz 

 


então v (x) = u 

 

x 

 

satisfaz 

a 

 


−∆v = λ 

v em Ωa, 

a2 v = 0 sobre ∂Ωa. 

Em particular, se a > 1 (dilatação), então os autovalores do laplaciano em Ωa são menores que os autovalores 

do laplaciano em Ω. No caso geral, ainda é verdade que os autovalores decrescem quando o domínio aumenta, 

e no caso dos autovalores de Dirichlet isto é novamente uma conseqüência simples da caracterização minimax: 

1.18 Corolário. Sejam Ω1 ⊂ Ω2 ⊂ R n abertos limitados. Sejam λj (Ω1) e λj (Ω2) os autovalores de 

Dirichlet do laplaciano em Ω1 e Ω2, respectivamente. Então 


λj (Ω2) λj (Ω1) 

Prova: Podemos considerar W 1,2 

0 (Ω1) ⊂ W 1,2 

0 (Ω2), porque qualquer função u ∈ W 1,2 

0 (Ω1) pode ser estendida 

a uma função u ∈ W 1,2 

0 (Ω2) definindo-se 

 

u (x) se x ∈ Ω1, 

u (x) = 

0 se x ∈ Ω2\Ω1. 

Em particular, usando a notação do corolário anterior, temos que 

 

Lj W 1,2 

 

0 (Ω1) ⊂ Lj W 1,2 

 

0 (Ω2) . 

e o mínimo sobre Lj 

λj (Ω2) = min 

L∈Lj(W 1,2 

0 (Ω2)) 

 

W 1,2 

 

 

1,2 

0 (Ω1) não pode ser maior que o mínimo sobre Lj W (Ω2) . Logo 

⎛ 

⎞ 

⎛ 

⎞ 

⎝ max 

u∈L 

u=1 

〈∇u, ∇u〉 L 2 (Ω) 

⎠ min 

L∈Lj(W 1,2 

0 (Ω1)) 

⎝ max 

u∈L 

u=1 

〈∇u, ∇u〉 L 2 (Ω) 

⎠ = λj (Ω1) .


 

No caso dos autovalores de Neumann, o resultado continua válido mas a demonstração é mais complicada 

porque o operador extensão E : W 1,2 (Ω1) −→ W 1,2 (Ω2) não preserva a norma: em geral Eu W 1,2 (Ω2) > 

u W 1,2 (Ω1) (embora exista uma constante C > 0 tal que Eu W 1,2 (Ω2) C u W 1,2 (Ω1) , esta constante é 

geralmente maior que 1) e por este motivo W 1,2 (Ω1) não pode ser considerado um subespaço de Hilbert de 

W 1,2 (Ω2). 

1.8 Conjunto Nodal e Domínios Nodais de uma Autofunção 

1.8.1 Princípio do Máximo Forte: o Primeiro Autovalor do Laplaciano é Simples 

O primeiro autovalor do laplaciano é simples, isto é, o seu autoespaço associado tem dimensão 1, e possui 

uma autofunção associada positiva. Para provar este resultado, precisamos do Princípio do Máximo Forte 

para operadores elípticos, adaptado para o operador de Helmholtz (veja [Gilbarg-Trudinger] ou [Biezuner] 

para uma demonstração): 

1.19 Lema. (Princípio do Máximo Forte) Seja Ω ⊂ R n um aberto conexo. Seja u ∈ C 2 (Ω). 

Se ∆u 0 em Ω e u atinge o seu máximo no interior de Ω, então u é constante. 

Se ∆u 0 em Ω e u atinge o seu mínimo no interior de Ω, então u é constante. 

Prova: Provaremos a segunda afirmação, que será usada na seqüência; a demonstração da primeira é 

análoga. Afirmamos que se ∆u 0 em Ω, vale a seguinte desigualdade do valor médio: para qualquer bola 

BR (x) ⊂⊂ Ω temos 

u (x) 1 

 

u = 

|BR| BR 

1 

ωnRn 

u, (1.22) 

BR 

onde ωn é o volume da bola unitária em Rn . Para provar esta desigualdade, defina para r ∈ (0, R] a função 

φ(r) = 1 

 

u. 

|∂Br| 

Para obter a derivada da função φ, fazemos a mudança de variáveis 


e daí 

φ(r) = 

ω = 

y − x 

, 

r 

1 

nωnrn−1 

u(y) ds = 

∂Br 

1 

 

 

1 

u(x + rω) dω = 

u(x + rω) dω, 

nωn ∂B1(0) 

|∂B1(0)| ∂B1(0) 

φ ′ 

1 

(r) = 

|∂B1(0)| 

= 1 

 

|∂Br| 

∂Br 

∂B1(0) 

∂Br 

∇u(x + rω) · ω dω = 1 

 

y − x 

∇u(y) · ds 

|∂Br| ∂Br r 

∂u 

∂ν ds, 

pois o vetor normal unitário à ∂Br(x) apontando para fora é exatamente o vetor 

da Divergência e por hipótese, temos 

∂Br 

∂u 

∂ν = 

 

∆u 0, 

Ω 

y − x 

. Mas, pelo Teorema 

r


logo 

e φ(r) é uma função decrescente. Portanto, 

1 

|∂Br| 

 

∂Br 

φ ′ (r) 0 

u 1 

 

u 

|∂BR| ∂BR 

para todo 0 < r R. Usando o Teorema do Valor Médio para Integrais 

 

1 

lim 

u = u(x), 

r→0 |∂Br| 

∂Br 

obtemos 

u(x) 1 

 

u. 

|∂BR| ∂BR 

(1.23) 

Em particular, como R é arbitrário, vale a desigualdade 

nωnr n−1 

u(x) u 

para todo r, e a desigualdade do valor médio (1.22) é obtida integrando-se esta equação de r = 0 até r = R. 

Vamos agora provar o lema. Seja m = minΩ u e considere o conjunto A = {x ∈ Ω : u(x) = m}. Por 

hipótese, A é não-vazio e fechado em Ω, pois u é contínua em Ω. Como Ω é conexo, para provar que A = Ω e 

portanto que u é constante, basta provar que A é aberto. De fato, dado x ∈ A e uma bola BR = BR(x) ⊂⊂ Ω, 

temos pela desigualdade do valor médio para funções harmônicas que 

m = u(x) 1 

|BR| 

 

BR 

∂Br 

u 1 

|BR| 

 

BR 

m = m. 

Se houvesse pelo menos um ponto em BR(x) cujo valor é estritamente maior que m, então a desigualdade 

acima seria estrita, o que constituiria uma contradição. Concluímos que u ≡ m em BR(x), logo A é aberto. 

 

1.20 Lema. Seja Ω ⊂ R n um aberto. Seja u ∈ C 2 (Ω) uma solução de −∆u = λu em Ω, λ 0. Se u 

atinge um mínimo igual a 0 no interior de Ω, então u é constante. 

Prova: Se minΩ u = 0, em particular u 0 em Ω. Logo, ∆u = −λu 0 em Ω. Pelo Princípio do Máximo 

Forte, concluímos que u é constante. 

1.21 Teorema. Seja Ω ⊂ R n um aberto limitado conexo. Então o problema de autovalor 



possui uma solução positiva u1 > 0 em Ω. Além disso, qualquer outra autofunção associada a λ1 é 

múltipla de u1. 

Prova: Para simplificar a demonstração, assumiremos que Ω tem regularidade suficiente para que u ∈ 

C2 (Ω)∩C 0 Ω de modo que podemos usar o Princípio do Máximo Forte clássico dado no lema anterior (um 

princípio do máximo forte para funções em W 1,2 

0 (Ω) pode ser visto em [Gilbarg-Trudinger]). Pela formulação 

variacional, se u é uma autofunção associada a λ1, então |u| também é, pois I (u) = I (|u|). A teoria de 

regularidade (Teorema 1.13) garante então que |u| ∈ C2 (Ω) ∩ C0 Ω também. Pelo lema anterior, u não 

pode se anular no interior de Ω, pois isso implicaria que |u| atinge o seu mínimo no interior, logo u > 0. 

Este argumento também implica que as autofunções associadas a λ1 são negativas ou positivas em Ω, logo 

não podem ser ortogonais, e portanto o subespaço associado a λ1 só pode ser unidimensional. 

Mais geralmente, vale o resultado do Teorema 1.24 a seguir para todos os autovalores do laplaciano.


1.8.2 Conjunto Nodal e Domínios Nodais de Autofunções do Laplaciano 

Definição. Se λj é um autovalor do laplaciano em Ω e uj é uma autofunção associada, definimos o conjunto 

nodal de uj por 

Γj = {x ∈ Ω : uj (x) = 0} . 

As componentes conexas de Ω\Γj são chamadas os domínios nodais de uj. 

O conjunto nodal de uj é simplesmente o conjunto dos pontos onde uj se anula; a terminologia nodal é oriunda 

do estudo das vibrações de cordas e membranas em Mecânica. O Teorema 1.21 afirma que o conjunto nodal 

de u1 é vazio; em particular, se Ω é conexo, então Ω\Γ1 possui uma componente conexa, isto é, apenas 

um domínio nodal. Para as demais autofunções, o Teorema do Conjunto Nodal de Courant (Teorema 1.24 

abaixo) afirma que o número de domínios nodais da autofunção uj não pode exceder j. 

1.22 Lema. Seja Ω ⊂ R n um aberto limitado conexo e 

0 < λ1 < λ2 . . . λj . . . 

os autovalores de Dirichlet do laplaciano e u1, u2, . . . , uj, . . . as respectivas autofunções associadas. Se 

λj tem multiplicidade r, de modo que 

λj−1 < λj = λj+1 = . . . = λj+r−1 < λj+r, 

Então uj possui no máximo j + r − 1 domínios nodais. 

Prova: A demonstração do lema é baseada na caracterização variacional dos autovalores do laplaciano. 

Suponha que uj tenha m domínios nodais Ω1, · · · , Ωm. Defina 

 

βiuj (x) se x ∈ Ωi, 

wi (x) = 

0 caso contrário, 

onde o fator de escala βi é escolhido de tal forma que wi L 2 (Ω) = 1. Observe que, como os domínios nodais 

Ωi são disjuntos, as funções wi são ortogonais em L 2 (Ω) e em W 1,2 

0 (Ω). Como 


0 (Ω), em particular temos 

 

 

Ωi 

∇uj · ∇v = λj 

Ω 

∇wi · ∇wi = λj 

(embora wi seja uma autofunção do laplaciano em Ωi associada a λj, wi não é uma autofunção do laplaciano 

em Ω associada a λj; pelo Princípio da Continuação Única (veja o lema a seguir), uma autofunção que se 

anula em um aberto, deve-se anular no domínio todo). Considere combinações lineares v dos wi tais que 

vL2 (Ω) = 1, isto é, 

m 

v = 

i=1 

e a1, . . . , am ∈ R são quaisquer escalares que satisfazem 

m 

i=1 

aiwi 

a 2 i = 1. 

 

Ω 

 

ujv 

Ωi 

w 2 i


Em particular, 

ou seja, 

m 

〈∇v, ∇v〉 L2 (Ω) = a 2 i 〈∇wi, ∇wi〉 L2 (Ωi) = 

m 

i=1 

〈∇v, ∇v〉 L 2 (Ω) 

v L 2 (Ω) 

i=1 

= λj. 

Por outro lado, podemos escolher a1, . . . , am de tal forma que 

para i = 1, . . . , m − 1, pois o sistema 

⎧ 

⎪⎨ 

⎪⎩ 

〈v, ui〉 L 2 (Ω) = 0 

〈v, u1〉 = n 

ai 〈wi, u1〉 = 0 

i=1 

. 

. 

〈v, um−1〉 = n 

ai 〈wi, um−1〉 = 0 

i=1 

a 2 i λj 〈wi, wi〉 L 2 (Ωi) 

= λj, 

possui m − 1 equações e m incógnitas. Para esta escolha de v, segue do Teorema 1.13 que 

〈∇v, ∇v〉 L 2 (Ω) 

v 2 

L 2 (Ω) 

Portanto, 

= ∇v2 L2 (Ω) 

v 2 

L2 = 

(Ω) 

∞ 

i=1 

∞ 

i=1 

λi 〈v, ui〉 2 

L 2 (Ω) 

〈v, ui〉 2 

L 2 (Ω) 

= 

λm λj. 

∞ 

i=m 

∞ 

i=m 

λi 〈v, ui〉 2 

L 2 (Ω) 

〈v, ui〉 2 

L 2 (Ω) 

 

∞ 

λm 

i=m 

∞ 

i=m 

〈v, ui〉 2 

L 2 (Ω) 

〈v, ui〉 2 

L 2 (Ω) 

= λm. 

Como λj < λj+r, segue que λm < λj+r, donde m < n + r. 

Em particular, se λj é um autovalor simples, o número máximo de domínios nodais de uj é j. Para 

mostrar que esta mesma estimativa vale para as demais autofunções, Courant e Hilbert produziram um 

refinamento complicado do seu argumento no lema acima. A demonstração simplificada apresentada a 

seguir é devida a Herrman [Herrman] e Pleijel [Pleijel] (reproduzida em [Gladwell-Zhu]) e é baseada no 

Princípio da Continuação Única (uma demonstração deste pode ser encontrada em [Aronszajn]): 

1.23 Lema. (Princípio da Continuação Única) Seja Ω ⊂ Rn um aberto limitado conexo. Se u é uma solução 

de 

−∆u = λu em Ω 

que se anula em um aberto não vazio de Ω, então u ≡ 0. 

1.24 Teorema. (Teorema do Conjunto Nodal de Courant) Seja Ω ⊂ R n um aberto limitado conexo e 

0 < λ1 < λ2 . . . λj . . . 

os autovalores de Dirichlet do laplaciano e u1, u2, . . . , uj, . . . as respectivas autofunções associadas. 

Então uj possui no máximo j domínios nodais. 

Prova: Suponha por absurdo que uj tenha m > j domínios nodais. Defina wi e v como na demonstração 

do Lema 1.22, escolhendo 

aj+1 = . . . = am = 0,


de modo que v ≡ 0 em Ωj+1 ∪ . . . ∪ Ωm. Como antes, temos 

e podemos escolher a1, . . . , aj de tal forma que 

〈∇v, ∇v〉 L 2 (Ω) 

v L 2 (Ω) 

= λj 

〈v, ui〉 L 2 (Ω) = 0 

para i = 1, . . . , j − 1. Isso implica que v é uma autofunção associada a λj (como vimos na demonstração 

do Teorema 1.13, nestas condições o mínimo λj do quociente de Rayleigh é realizado em uma autofunção 

de λj), isto é, é uma solução fraca de −∆u = λju em Ω. Como v se anula em Ωj+1 ∪ . . . ∪ Ωm, segue do 

Princípio da Continuação Única que v ≡ 0 em Ω, contradizendo vL2 (Ω) = 1. 

Observe que o Teorema 1.24 implica que se λj tem multiplicidade r, de modo que 

λj−1 < λj = λj+1 = . . . = λj+r−1 < λj+r, 

então qualquer autofunção associada a λj possui no máximo j domínios nodais, mesmo as autofunções 

uj+1, . . . , uj+r−1. 

1.25 Corolário. O Teorema do Conjunto Nodal de Courant vale mesmo se Ω não é conexo. 

Prova: Sejam Ω = Ω1 ∪ . . . ∪ Ωp a decomposição de Ω em componentes conexas. Denote por λk 

j j∈N 

a seqüência crescente de autovalores de Ωk com uk 

j j∈N as correspondentes autofunções. Seja {λj} j∈N = 

 

1 λj j∈N ∪ . . . ∪ λ p 

j a seqüência crescente de autovalores de Ω; as autofunções correspondentes são da 

j∈N 

forma 

 

k u 

uj (x) = i (x) se x ∈ Ωk, 

0 caso contrário, 

para alguns índices i, k, com j i. Pelo Teorema do Conjunto Nodal de Courant aplicado a Ωk, uk i não tem 

mais que i domínios nodais em Ωk, logo uj não tem mais que j domínios nodais em Ωk e é nula fora de Ωk. 

 

1.26 Corolário. Uma autofunção u2 associada ao segundo autovalor λ2 possui exatamente 2 domínios 

nodais. Autofunções associadas a outros autovalores λj, j = 1, 2, possuem pelo menos dois domínios 

nodais. 

Prova: Pelo Teorema do Conjunto Nodal de Courant, o número de domínios nodais de u2 não pode exceder 

2. Por outro lado, o fato de que uma autofunção u1 associada ao primeiro autovalor λ1 = λ2 ter o mesmo 

sinal em Ω, juntamente com o fato que u1 ⊥ u2, implicam que u2 muda de sinal em Ω, logo não pode ter 

apenas um domínio nodal. Este mesmo argumento de ortogonalidade, u1 ⊥ uj se j = 1, implica que qualquer 

autofunção associada a um autovalor diferente de λ1 necessariamente muda de sinal em Ω. 

O Corolário 1.26 sugere que a estimativa dada no Teorema 1.24 é a melhor possível. Isso não é verdade, no 

entanto. Usando a desigualdade de Faber-Krahn e a Lei de Weyl sobre a expansão assintótica dos autovalores, 

Pleijel [Pleijel] provou que para valores suficientemente grandes de j, o número máximo de domínios nodais 

j nunca é atingido (Corolário 1.30, a seguir). A demonstração da desigualdade de Faber-Krahn dada a seguir 

é baseada na simetrização de Schwartz, que definiremos a seguir. 

Definição. Seja Ω ⊂ R n um aberto limitado. O domínio simetrizado Ω ∗ é a bola B = {x ∈ R n : |x| < R} 

que possui o mesmo volume de Ω. 

Dada uma função u : Ω −→ R, a função simetrizada u ∗ : Ω ∗ −→ R é definida da seguinte forma. 

Denotando 

Ωµ = {x ∈ Ω : u (x) µ} 

definimos 

u ∗ (x) = sup µ : x ∈ Ω ∗ 

µ .


Observe que u ∗ é uma função radialmente simétrica, não-crescente. Assumiremos os seguintes resultados 

sem demonstração (para uma prova, veja [Bandle], Lema 2.4 e Corolário 2.1): 

1.27 Lema. Seja Ω ⊂ Rn um aberto limitado. Então 

 

f 

e 

|∇u| 

Ω 

2 

 

Ω 

Ω ∗ 

Ω ∗ 

f ∗ 

|∇u ∗ | 2 . 

1.28 Teorema. (Desigualdade de Faber-Krahn) Seja Ω ⊂ R 2 um aberto limitado. Se λ1 é o primeiro 

autovalor de Dirichlet do laplaciano em Ω, então vale 

λ1 πα2 0,1 

A , 

onde α0,1 é o primeiro zero positivo da função de Bessel J0 e A é a área de Ω. 

Prova: Seja (un) ⊂ W 1,2 

0 (Ω) uma seqüência minimizante para o quociente de Rayleigh I do primeiro 

autovalor de Dirichlet λ1 (Ω) do laplaciano em Ω. Como I (|u|) = I (u), podemos assumir un 0 para todo 

n. Então u ∗ n ∈ W 1,2 

0 (D), onde D = Ω ∗ é o disco de raio R que possui área A. Segue que 

 

Ω 

λ1 (Ω) = lim inf 

|∇un| 2 

Ω u2 n 

= α2 0,1 π 

= 

R2 πR2 α2 0,1 = πα2 0,1 

A . 

 

D lim inf 

|∇u∗n| 2 

 

D (u∗ 2 min 

n) u∈W 1,2 

0 (Ω)\{0} 

 

Ω |∇u|2 

 

Ω u2 = λ1 (D) 

 

A desigualdade de Faber-Krahn entre outras coisas comprova a conjectura de Rayleigh de que entre todas 

as regiões de mesma área, o disco tem o menor primeiro autovalor. 

1.29 Teorema. (Lei de Weyl) Seja Ω ⊂ R 2 um aberto limitado conexo e 

0 < λ1 < λ2 . . . λj . . . 

os autovalores de Dirichlet do laplaciano em Ω. Então 

λj ∼ 4πj 

A , 

onde A é a área de Ω. Mais geralmente, se Ω ⊂ R n é um aberto limitado, então 

λj ∼ 4π 2 

2/n j 

, 

ωnV 

Prova: Veja [Weyl] ou [Courant-Hilbert], pág. .429–443 

1.30 Corolário. Seja Ω ⊂ R 2 um aberto limitado conexo. Existe apenas um número finito de autovalores 

λj para os quais o número máximo j de domínios nodais é atingido.


Prova: A demonstração deste corolário depende da observação de que se u é uma autofunção associada a 

um certo autovalor de Dirichlet λ e Ωi é qualquer domínio nodal de u, então λ é o primeiro autovalor do 

laplaciano em Ωi, isto é, 

λ1 (Ωi) = λ. 

De fato, ui = u|Ωi é uma autofunção associada a λ em Ωi, pois ui ∈ C2 (Ωi) ∩ C0 

Ωi satisfaz −∆ui = λui 

em Ωi e ui = 0 em ∂Ωi (pois ∂Ωi está contida na união do conjunto nodal de u e ∂Ω, onde u = 0). Além 

disso, ui não muda de sinal em Ωi por definição de domínio nodal de u, logo possui apenas um domínio nodal 

e portanto segue do Corolário 1.26 que ui é uma autofunção associada ao primeiro autovalor de Dirichlet em 

Ωi. 

Sejam Ω1, · · · , Ωm, m j, os domínios nodais de uma autofunção u associada a λj. Como λj = λ1 (Ωi) 

para todo i, segue da Desigualdade de Faber-Krahn que 

λj πα2 0,1 

A (Ωi) , 

onde A (Ωi) é a área de Ωi, para todo i. Escrevendo estas desigualdades na forma 

e somando-as para i = 1, . . . , m, segue que 

Logo, se o caso máximo m = j ocorre, temos 

A (Ωi) 

πα 2 0,1 

A (Ω) 

πα 2 0,1 

A (Ω) 

πα 2 0,1 

1 

, 

λj 

m 

. 

λj 

j 

. 

λj 

Se o número máximo m = j de domínios nodais fosse atingido para um número infinito de índices j, tomando 

o limite nesta desigualdade quando j → ∞ para esta subseqüência de índices, teríamos pela Lei de Weyl que 


A (Ω) 

πα 2 0,1 

 

α0,1 2. 

A (Ω) 

4π , 

Mas α0,1 = 2.404825558..., contradição. 

Com relação aos conjuntos nodais das autofunções do laplaciano, pode-se dizer que eles são altamente 

regulares: o conjunto nodal de uma autofunção u do laplaciano em Ω ⊂ R n é localmente composto de 

hiperfícies de dimensão n − 1, que podem se intersectar em superfícies de dimensão menor que n − 1 (veja 

[Cheng] para o enunciado preciso e sua demonstração). Estas hiperfícies não podem terminar no interior de 

Ω, o que significa que ou elas são fechadas, ou elas começam e terminam na fronteira de Ω. Além disso, no 

caso bidimensional, quando as curvas nodais se intersectam, ou quando elas interceptam a fronteira, elas o 

fazem em ângulos iguais; assim, por exemplo, se uma curva nodal intercepta a fronteira, ela o faz em um 

ângulo reto, enquanto que se duas curvas nodais interceptam a fronteira no mesmo ponto, elas o fazem em 

ângulos de π/3 e guardam também um ângulo de π/3 entre si (veja [Courant-Hilbert]). 

Exemplo 8. Como vimos no Exemplo 2, os autovalores de Dirichlet do laplaciano no quadrado Q = [0, π] 2 ⊂ 

R 2 são dados por 

λnm = n 2 + m 2 , n, m ∈ N,


com correspondentes autofunções 

unm (x, y) = sen nx sen my. 

O autovalor λ2 = λ3 = 5 tem multiplicidade 2 e o seu autoespaço é constituído pelas funções da forma 

u (x, y) = A sen x sen 2y + B sen 2x sen y, A, B ∈ R. 

Para A = 0, u tem uma reta nodal vertical (x = π/2); para B = 0, u tem uma reta nodal horizontal 

(y = π/2); se A = ±B, u tem uma reta nodal diagonal (a reta y = x se A = −B e a reta y = −x + 1 

se A = B); nos demais casos, a curva nodal é especificada pela equação transcendental 

A cos y + B cos x = 0, 

que é uma curva que intercepta a fronteira em dois pontos em ângulos retos. Em todos os casos, a 

curva nodal de uma autofunção associada ao autovalor 5 divide o quadrado em dois domínios nodais. 

O autovalor λ4 = 8 é simples, com o seu autoespaço gerado pela autofunção 

u (x, y) = sen 2x sen 2y, 

cujo conjunto nodal é a união das retas vertical x = π/2 e horizontal y = π/2; ela possui portanto 

quatro domínios nodais. 

O autovalor λ5 = λ6 = 10 também tem multiplicidade 2 e o seu autoespaço é constituído pelas funções 

da forma 

u (x, y) = A sen x sen 3y + B sen 3x sen y, A, B ∈ R. 

Para A = 0, u tem duas retas nodais verticais (x = π/3 e x = 2π/3); para B = 0, u tem duas retas 

nodais horizontais (y = π/3 e y = 2π/3); em ambos os casos, temos três domínios nodais. Se A = −B, 

u tem as duas diagonais do quadrado como retas nodais, originando quatro domínios nodais, enquanto 

que se A = B, u tem uma curva nodal fechada 

sen 2 x + sen 2 y = 3/2 

que divide o quadrado em apenas dois domínios nodais, a região interior à curva e a região exterior. 

Pleijel verifica em [Pleijel] que os únicos autovalores do laplaciano no quadrado que possuem autofunções 

que assumem o número maximal de domínios nodais são λ1 = 2 (um domínio nodal), 

λ2 = λ3 = 5 (dois domínios nodais) e λ4 = 8 (quatro domínios nodais). 

1.9 Multiplicidade dos Autovalores do Laplaciano 

Em regiões com algum tipo de simetria, o laplaciano freqüentemente possui autovalores com multiplicidades 

maiores que 1. 

Exemplo 9. Como os autovalores de Dirichlet do laplaciano no quadrado Q = [0, π] 2 ⊂ R 2 , dados por 

com correspondentes autofunções 

λnm = n 2 + m 2 , n, m ∈ N, 

unm (x, y) = sen nx sen my, 

vemos imediatamente que sempre que n = m o autovalor λnm terá multiplicidade pelo menos igual a 

2, já que as autofunções 

unm (x, y) = sen nx sen my e umn (x, y) = sen mx sen ny


são linearmente independentes. Na verdade, o conjunto de todas as autofunções unm associadas ao 

autovalor λnm é linearmente independente, logo a questão da multiplicidade do autovalor λnm é reduzida 

à questão de quantos maneiras diferentes um número inteiro p pode ser escrito como a soma 

de quadrados inteiros n 2 + m 2 . A Teoria dos Números permite responder precisamente a esta questão 

(veja [Kuttler-Sigillito] para referências). Obtemos a decomposição em primos do autovalor 

λnm = 2 α p r1 

1 

. . . prk 

k qs1 1 . . . qsl 

l , 

onde os primos pi são da forma 4t + 1, enquanto que os primos qj são da forma 4t + 3, e todos os si 

são pares. Segue que a multiplicidade do autovalor λnm é 

mult (λnm) = 

k 

(ri + 1) . 

Em particular, o laplaciano possui autovalores no quadrado de multiplicidade arbitrariamente grande. 

 

O comportamento exibido pelo laplaciano no quadrado nos Exemplos 8 e 9 não é típico, no entanto. 

Em [Uhlenbeck1] e [Uhlenbeck2], Uhlenbeck mostrou que na maioria das regiões (no sentido genérico), os 

autovalores do laplaciano são todos simples, os conjuntos nodais das autofunções são de fato hiperfícies 

que não se autointerceptam e os pontos críticos das autofunções são máximos ou mínimos não-degenerados 

(as autofunções são funções de Morse). Assim, dada qualquer região, existem perturbações suficientemente 

pequenas que a transformarão em uma região com estas propriedades, ou seja, autovalores múltiplos se 

tornarão distintos e cruzamentos das linhas nodais desaparecerão. 

i=1

Capítulo 2 

Método de Diferenças Finitas 

2.1 O Caso Unidimensional 

Nesta seção, desenvolveremos um método numérico de diferenças finitas para resolver o problema de Dirichlet 

para a equação de Poisson em uma dimensão 

−u ′′ = f (x) em [0, a] , 

u (0) = u (a) = 0, 

e para o problema de autovalor de Dirichlet para o laplaciano 

−u ′′ = λu em [0, a] , 

u (0) = u (a) = 0. 

2.1.1 Séries de Taylor e Diferenças Finitas em Uma Dimensão 

Seja ∆x > 0. Considere as seguintes expansões de Taylor de uma função u em torno de um ponto x0, 

respectivamente à direita e à esquerda de x0: 

Daí, 

u(x0 + ∆x) = u(x0) + u ′ (x0)∆x + 1 

2! u′′ (x0)∆x 2 + 1 

3! u′′′ (x0)∆x 3 + . . . , (2.1) 

u(x0 − ∆x) = u(x0) − u ′ (x0)∆x + 1 

2! u′′ (x0)∆x 2 − 1 

3! u′′′ (x0)∆x 3 + . . . (2.2) 

u ′ (x0) = u(x0 + ∆x) − u(x0) 

∆x 

u ′ (x0) = u(x0) − u(x0 − ∆x) 

∆x 

− 1 

2! u′′ (x0)∆x − 1 

3! u′′′ (x0)∆x 2 − . . . , 

+ 1 

2! u′′ (x0)∆x − 1 

3! u′′′ (x0)∆x 2 + . . . 

Isso fornece duas aproximações possíveis para a primeira derivada u ′ (x0) de u em x0: 

u ′ (x0) ≈ u(x0 + ∆x) − u(x0) 

, 

∆x 

(2.3) 

u ′ (x0) ≈ u(x0) − u(x0 − ∆x) 

. 

∆x 

(2.4) 

A primeira é chamada uma diferença progressiva e a segunda é uma diferença regressiva. Pela Fórmula 

de Taylor com Resto, o erro destas aproximações é dado por 

ɛ = ± 1 

2 u′′ (ξ)∆x = O(∆x), 

39


onde x0 ξ x0 + ∆x no primeiro caso, e x0 − ∆x ξ x0 no segundo caso. 

Por outro lado, se subtrairmos (2.2) de (2.1), obtemos 

u ′ (x0) = u(x0 + ∆x) − u(x0 − ∆x) 

2∆x 

− 1 

3! u′′′ (x0)∆x 2 − 1 

5! u(5) (x0)∆x 4 − . . . 

o que dá uma outra aproximação possível para a primeira derivada u ′ (x0) de u em x0: 

u ′ (x0) ≈ u(x0 + ∆x) − u(x0 − ∆x) 

2∆x 

com erro 

ɛ = − 1 

6 u′′′ (ξ)∆x 2 = O(∆x 2 ), 

para algum x0 − ∆x ξ x0 + ∆x. Esta aproximação por diferença finita é chamada diferença centrada. 

Ela é uma melhor aproximação que as aproximações laterais (progressiva e regressiva). 

Se, ao invés, adicionarmos (2.1) e (2.2), obtemos 

u ′′ (x0) = u(x0 + ∆x) + u(x0 − ∆x) − 2u(x0) 

∆x 2 

o que fornece uma aproximação para a derivada segunda u ′′ (x0) de u em x0: 

u ′′ (x0) ≈ u(x0 + ∆x) + u(x0 − ∆x) − 2u(x0) 

∆x 2 

− 2 

4! u(4) (x0)∆x 2 − 2 

5! u(6) (x0)∆x 4 − . . . 

com erro 

ɛ = − 1 

12 u(4) (ξ)∆x 2 = O(∆x 2 ), 

onde x0 − ∆x ξ x0 + ∆x. Esta aproximação é também chamada uma diferença centrada para a 

derivada segunda. 

2.1.2 Discretização 

Dividimos o intervalo [0, a] em n subintervalos de comprimento ∆x = a/n através de n − 1 pontos interiores 

uniformemente espaçados: 

x0 = 0, x1 = ∆x, x2 = 2∆x, . . . , xn−1 = (n − 1) ∆x, xn = n∆x = a, 

de modo que [0, a] = [x0, x1] ∪ [x1, x2] ∪ . . . ∪ [xn−1, xn]. Introduzimos a notação: 

ui = u(xi), 

fi = f (xi) . 

Esta é uma discretização uniforme do intervalo [0, a]. Uma vez discretizado o domínio da equação diferencial 

parcial, procedemos à discretização desta. Usando diferenças centradas para cada ponto interior xi, 1 i 

n − 1, temos 

−ui−1 + 2ui − ui+1 

∆x 2 = fi. (2.7) 

Para os pontos de fronteira, a condição de Dirichlet implica simplesmente que 

(2.5) 

(2.6) 

u0 = un = 0. (2.8)


Portanto, para encontrar a solução discretizada temos que resolver o sistema linear com n − 1 equações a 

n − 1 incógnitas: ⎧⎪ ⎨ 

ou seja, 

⎪⎩ 

1 

∆x2 ⎡ 

2 −1 

⎢ 

−1 

⎢ 

⎣ 

2 

−1 

−1 

. .. 

. .. 

∆x −2 (2u1 + u2) = f1 

∆x −2 (−u1 + 2u2 − u3) = f2 

. 

. 

∆x −2 (−un−3 + 2un−2 − un−1) = f2 

∆x −2 (−un−2 + 2un−1) = fn−1 

. .. 

. .. −1 

−1 2 −1 

−1 2 

⎤ ⎡ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎦ ⎣ 

u1 

u2 

. 

. 

un−2 

un−1 

⎤ 

, 

⎡ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ = ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎦ ⎣ 

Esta é uma matriz tridiagonal simétrica, esparsa. Além disso, como veremos na próxima subseção, ela é 

positiva definida (isto é, seus autovalores são positivos) e portanto possui uma inversa, o que garante a 

existência e unicidade da solução. Dada sua simplicidade, ela pode ser resolvida por eliminação gaussiana 

ou sua inversa pode ser efetivamente calculada. Por exemplo, para n = 4, 5, 6 temos 

⎡ 

⎢ 

⎣ 

⎡ 

⎣ 

2 −1 0 

−1 2 −1 

0 −1 2 

2 −1 0 0 

−1 2 −1 0 

0 −1 2 −1 

0 0 −1 2 

⎡ 

⎢ 

⎣ 

⎤ 

⎥ 

⎦ 

−1 

0 0 3 

4 

1 

3 

2 

3 

f1 

f2 

. 

. 

fn−2 

fn−1 

⎤−1 

⎡ 

⎦ = ⎣ 1 ⎤ ⎡ ⎤ ⎡ ⎤ 

1 1 1 

2 3 2 0 0 1 0 0 

2 0 1 ⎦ ⎣ 2 

3 0 3 0 ⎦ ⎣ 1 

2 1 0 ⎦ = 

0 0 1 

1 

1 

⎡ 

⎣ 

4 

= 

2 −1 0 0 0 

−1 2 −1 0 0 

0 −1 2 −1 0 

0 0 −1 2 −1 

0 0 0 −1 2 

⎡ 

⎢ 

⎣ 

⎤ 

⎥ 

⎦ 

1 

4 

2 

0 

0 

0 

0 

3 

1 

0 

4 

3 

4 

1 

1 1 1 2 3 

2 0 1 

−1 

⎤ ⎡ 

1 

2 0 0 0 

4 

4 

0 0 0 5 

⎤ ⎡ 

⎥ ⎢ 2 

⎥ ⎢ 0 3 0 0 ⎥ ⎢ 

⎥ ⎢ 

⎦ ⎣ 

3 0 0 0 ⎦ ⎣ 

A forma da inversa no caso geral pode ser facilmente adivinhada. 

1 0 0 0 

1 

2 1 0 0 

1 

3 

1 

4 

2 

3 1 0 

1 

2 

4 

3 

4 

⎤ 

⎥ . 

⎥ 

⎦ 

⎤ 

3 2 1 

2 4 2 

1 2 3 

⎥ 

1 

⎦ = 

5 

⎡ 

⎢ 

⎣ 

⎤ 

⎦ , 

4 3 2 1 

3 6 4 2 

2 4 6 3 

1 2 3 4 

⎡ 

1 1 1 

1 2 3 4 

⎢ 

2 2 

⎢ 0 1 3 4 

= ⎢ 

3 

⎢ 0 0 1 4 

⎣ 0 0 0 1 

0 0 0 0 

= 

⎤ ⎡ 

1 

5 

2 ⎥ ⎢ 

5 ⎥ ⎢ 

3 ⎥ ⎢ 

5 ⎥ ⎢ 

4 ⎦ ⎣ 

5 

1 

1 

2 

0 

0 

0 

0 

0 

2 

3 

0 

0 

0 

0 

0 

3 

4 

0 

0 

0 

0 

0 

4 

5 

0 

0 

0 

0 

0 

5 

6 

⎤ ⎡ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎦ ⎣ 

1 

1 

2 

1 

3 

1 

4 

1 

5 

0 

1 

2 

3 

1 

2 

5 

0 

0 

1 

3 

4 

3 

5 

0 

0 

0 

1 

4 

5 

⎤ 

0 

0 ⎥ 

0 ⎥ 

0 ⎦ 

1 

1 

⎡ 

5 4 3 2 

⎢ 4 8 6 4 

⎢ 

6 ⎢ 3 6 9 6 

⎣ 2 4 6 8 

⎤ 

1 

2 ⎥ 

3 ⎥ 

4 ⎦ 

1 2 3 4 5 

. 

⎤ 

⎥ 

⎦


2.1.3 Resolução Numérica do Problema de Autovalor Unidimensional 

Os autovalores de Dirichlet do laplaciano em [0, a] devem ser aproximados pelos autovalores da matriz 

(n − 1) × (n − 1) 

A = 1 

∆x2 ⎡ 

2 −1 

⎤ 

⎢ 

−1 

⎢ 

⎣ 

2 

−1 

−1 

. .. 

. .. 

. .. 

. .. 

−1 

−1 

2 −1 

⎥ 

⎦ 

−1 2 

quando n → ∞ e correspondentemente ∆x → 0. 

Lembrando que as autofunções de Dirichlet do laplaciano no intervalo [0, a] são as funções 

Uj (x) = sen jπx 

a , 

este fato sugere que os autovetores uj da matriz A são os vetores de coordenadas 

Uj (x1) , Uj (x2) , . . . , Uj (xn−2) , Uj (xn−1) = Uj (∆x) , Uj (2∆x) , . . . , Uj ((n − 2) ∆x) , Uj ((n − 1) ∆x) , 

ou seja, como ∆x = a/n, os vetores 

1 θ 

sin = cos θ 

2 2 

 

uj = sen jπ 

 

2jπ (n − 2) jπ (n − 1) jπ 

, sen , . . . , sen , sen . 

n n n 

n 

Usando identidades trigonométricas, vamos verificar que isso de fato acontece: 

2.1 Lema. Os n − 1 autovalores da matriz A são 

λj = 2 

∆x2 

1 − cos jπ 

 

= 

n 

4 jπ 

sen2 , 

∆x2 2n 

j = 1, . . . , n − 1, (2.9) 

e os autovetores correspondentes são 

 

uj = sen jπ 2jπ 

, sen 

n n 

(n − 2) jπ 

, . . . , sen , sen 

n 

 

(n − 1) jπ 

, j = 1, . . . , n − 1. (2.10) 

n


Prova. Temos 

⎡ 

2 −1 

⎢ 

−1 

⎢ 

⎣ 

2 

−1 

−1 

. .. 

. .. 

pois 

e 

. .. 

. .. −1 

−1 2 −1 

−1 2 

2 sen jπ 

n 

− sen 2jπ 

n 

⎡ 

⎤ 

⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎦ ⎢ 

⎣ 

sen 

sen jπ 

n 

sen 2jπ 

n 

. 

(n − 2) jπ 

sen 

n 

(n − 1) jπ 

n 

= 2 sen jπ 

n 

⎤ ⎡ 

⎥ ⎢ 

2 sen 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ = ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎥ ⎢ 

⎦ ⎣ 

jπ 2jπ 

− sen 

n n 

− sen jπ 

⎤ 

⎥ 

2jπ 3jπ 

⎥ 

+ 2 sen − sen ⎥ 

n n n 

⎥ 

. 

⎥ 

(n − 3) jπ (n − 2) jπ (n − 1) jπ ⎥ 

− sen + 2 sen − sen ⎥ 

n 

n 

n ⎥ 

(n − 2) jπ (n − 1) jπ ⎦ 

− sen + 2 sen 

n 

n 

 

= 2 1 − cos jπ 

⎡ 

⎢ 

sen 

⎢ 

⎢ 

n ⎢ 

⎣ 

jπ 

n 

sen 2jπ 

⎤ 

⎥ 

n 

⎥ 

. ⎥ , 

⎥ 

(n − 2) jπ ⎥ 

sen ⎥ 

n ⎥ 

(n − 1) jπ ⎦ 

sen 

n 

− 2 sen jπ 

n 

cos jπ 

n 

 

= 2 1 − cos jπ 

 

sen 

n 

jπ 

n , 

(n − k − 1) jπ (n − k) jπ (n − k + 1) jπ 

− sen + 2 sen − sen 

 

n 

n 

n 

(n − k) jπ 

= − sen 

− 

n 

jπ 

 

 

(n − k) jπ (n − k) jπ 

+ 2 sen − sen 

+ 

n 

n 

n 

jπ 

 

n 

(n − k) jπ 

= − sen cos 

n 

jπ (n − k) jπ 

+ cos sen 

n n 


+ 2 sen 

n n 

(n − k) jπ 

− sen cos 

n 


− cos sen 

n n 

jπ 

 

n 

= 2 1 − cos jπ 

 

(n − k) jπ 

sen , 

n n 

(n − 2) jπ (n − 1) jπ 

− sen + 2 sen 

 

n 

n 

(n − 1) jπ 

= − sen 

− 

n 

jπ 

 

(n − 1) jπ 

+ 2 sen 

n 

n 

(n − 1) jπ 

= − sen cos 

n 

jπ (n − 1) jπ 

+ cos sen 

n n 

jπ 

n 

(n − 1) jπ 

= − sen cos 

n 

jπ (n − 1) jπ 

− sen cos 

n n 

jπ 

 

n 

= 2 1 − cos jπ 

 

(n − 1) jπ 

sen , 

n n 

onde na penúltima identidade usamos o fato que 

cos 

(n − 1) jπ 

n 

sen jπ 

n 

= − sen (n − 1) jπ 

n 

+ 2 sen (n − 1) jπ 

n 

+ 2 sen (n − 1) jπ 

n 

cos jπ 

n


porque 

 

(n − 1) jπ 

0 = sen jπ = sen 

+ 

n 

jπ 

 

(n − 1) jπ 

= sen cos 

n 

n 

jπ (n − 1) jπ 

+ cos sen 

n n 

jπ 

n . 

 

Os autovalores de A são positivos, portanto A é uma matriz positiva definida. Observe que, fixado j, se n é 

arbitrariamente grande então 

cos jπ 

n ≈ 1 − j2π 2 

, 

2n2 pois o desenvolvimento em série de Taylor da função cosseno em torno da origem é 

cos x = 1 − 1 

2 x2 + O x 3 ; 

tomando x = jπ/n para n suficientemente grande e desprezando os termos de terceira ordem, obtemos a 

aproximação acima. Daí, 

2 

∆x 2 

 

1 − cos jπ 

n 

 

= 2n2 

a 2 

 

1 − cos jπ 

 

≈ 

n 

2n2 

a2 

1 − 1 − j2π 2 

2n2 

= j2π 2 

, 

a2 de forma que os menores autovalores da matriz A são uma boa aproximação para os menores autovalores de 

Dirichlet do laplaciano no intervalo [0, a]. Já o maior autovalor da matriz A é 

λn−1 = 2 

∆x2 

 

(n − 1) π 

1 − cos = 

n 

2n2 

a2 

 

(n − 1) π 

1 − cos ≈ 

n 

4n2 

, 

a2 que não é uma boa aproximação para um autovalor do laplaciano. Vemos que se aumentarmos o número de 

pontos de discretização (malha mais refinada) obteremos melhores aproximações e uma quantidade maior de 

autovalores próximos aos autovalores do laplaciano. Para comparar, veja a tabela a seguir para os autovalores 

do laplaciano no intervalo [0, π]; na primeira coluna temos os autovalores exatos do laplaciano, enquanto que 

na demais colunas os autovalores da matriz A, λj = 2n2 

π2 número n de subintervalos na malha 

 

1 − cos jπ 

 

, com a linha superior indicando o 

n 

n = 11 n = 21 n = 31 n = 51 n = 101 n = 1001 

1 0.993 221 21 0.998 136 38 0.999 144 44 0.999 683 82 0.999 919 37 0.999 999 18 

4 3.892 419 95 3.970 248 82 3.986 325 21 3.994 943 16 3.998 710 15 3.999 986 87 

9 8.462 720 39 8.849 945 24 8.930 889 79 8.974 415 97 8.993 471 18 8.999 933 51 

16 14.333 863 96 15.528 221 28 15.782 100 25 15.919 213 41 15.979 370 36 15.999 789 87 

25 21.030 205 54 23.855 895 28 24.469 653 89 24.802 991 47 24.949 649 29 24.999 486 99 

36 28.009 247 34 33.646 940 78 34.904 404 68 35.592 050 94 35.895 629 79 35.998 936 22 

49 34.705 588 92 44.682 641 99 46.979 277 93 48.245 465 23 48.806 722 35 48.998 029 23 

64 40.576 732 50 56.716 479 58 60.570 369 11 62.715 235 6 63.670 436 30 63.996 637 97 

81 45.147 032 93 69.479 637 52 75.538 215 24 78.946 473 26 80.472 391 97 80.994 614 71 

100 48.046 231 68 82.687 007 94 91.729 225 95 96.877 607 56 99.196 334 56 99.991 792 02 

2.2 O Caso Bidimensional 

Nesta seção, desenvolveremos um método numérico de diferenças finitas para resolver o problema de Dirichlet 

para a equação de Poisson no retângulo (0, a) × (0, b) 

−∆u = f (x, y) em (0, a) × (0, b) , 

u = 0 sobre ∂ ((0, a) × (0, b)) , 

e para o problema de autovalor de Dirichlet para o laplaciano no retângulo 

−∆u = λu em (0, a) × (0, b) , 

u = 0 sobre ∂ ((0, a) × (0, b)) .


2.2.1 A Fórmula dos Cinco Pontos 

Vamos estabelecer alguma notação. Denote 

Ao discretizar Ω através dos pontos 

Ω = (0, a) × (0, b) = (x, y) ∈ R 2 : 0 < x < a, 0 < y 

(xi, yj) = (i∆x, j∆y) , 0 i n, 0 j m 

onde 

∆x = a 

, 

n 

b 

∆y = 

m , 

substituímos o domínio Ω pela malha (ou gride) uniforme 

Ωd = {(x, y) ∈ Ω : x = i∆x, y = j∆y, 1 i n − 1, 1 j m − 1} . 

Sua fronteira discretizada é o conjunto 

de forma que 

A equação de Poisson 

pode ser agora discretizada. Denotamos 

∂Ωd = {(x, y) ∈ ∂Ω : x = i∆x, y = j∆y, 0 i n, 0 j m} , 

Ωd = (x, y) ∈ Ω : x = i∆x, y = j∆y, 0 i n, 0 j m . 

−uxx − uyy = f (x, y) 

ui,j = u (xi, yj) , 

fi,j = f (xi, yj) . 

Aproximamos cada derivada parcial de segunda ordem pela sua diferença centrada, obtendo 

−uxx ≈ −ui−1,j + 2ui,j − ui+1,j 

∆x2 , 

−uyy ≈ −ui,j−1 + 2ui,j − ui,j+1 

∆y2 . 

Portanto, a equação de Poisson discretizada toma a forma 

−ui−1,j + 2ui,j − ui+1,j 

∆x 2 

+ −ui,j−1 + 2ui,j − ui,j+1 

∆y 2 = fi,j. (2.11) 

Como a função u é calculada em cinco pontos, esta equação é chamada a fórmula dos cinco pontos. 

Para cada ponto interior da malha obtemos uma equação, logo temos um sistema linear de (n − 1) (m − 1) 

equações com o mesmo número de incógnitas. Diferente do caso unidimensional, no entanto, não existe uma 

maneira natural de ordenar os pontos da malha, logo não podemos obter imediatamente uma representação 

matricial para o problema discretizado. Precisamos antes escolher uma ordenação para os pontos da malha, 

e como existem várias ordenações possíveis, existem várias matrizes associadas. 

Talvez a mais simples ordenação é a ordem lexicográfica induzida de Z 2 . Nesta ordem, os pontos da 

malha são percorridos linha por linha, da esquerda para a direita, de baixo para cima: 

u1,1, u2,1, . . . , un−1,1, u1,2, u2,2, . . . , un−1,2, . . . . . . , u1,m−1, u2,m−1, . . . , un−1,m−1.


Neste caso, a matriz associada ao sistema linear é uma matriz (n − 1) (m − 1) × (n − 1) (m − 1) que pode 

ser escrita como uma matriz de (m − 1) × (m − 1) blocos de dimensão (n − 1) × (n − 1) na forma 

⎡ 

⎢ 

A = ⎢ 

⎣ 

B − 1 

− 

I 

∆y2 1 

I 

∆y2 B 

1 

− I 

∆y2 − 1 

I 

∆y2 . .. 

. .. 

. .. 

. .. 1 

− I 

∆y2 − 1 

1 

I B − I 

∆y2 ∆y2 − 1 

I B 

∆y2 ⎤ 

⎥ 

⎦ 

(m−1)×(m−1) 

onde I é a matriz identidade (n − 1) × (n − 1) e B é a matriz (n − 1) × (n − 1) dada por 

⎡ 

1 1 

⎢ 

2 + 

⎢ ∆x2 ∆y 

⎢ 

⎣ 

2 

 

− 1 

∆x2 − 1 

∆x2 

1 1 

2 + 

∆x2 ∆y2 

− 1 

∆x2 − 1 

∆x2 . .. 

. .. 

. .. 

. .. 

− 1 

∆x2 − 1 

∆x2 

1 1 

2 + 

∆x2 ∆y2 

− 1 

∆x2 − 1 

∆x2 

1 1 

2 + 

∆x2 ∆y2 

Observe que 

para todo 1 i (n − 1) (m − 1), enquanto que 

 

1 1 

aii = 2 + 

∆x2 ∆y2 

aij = − 1 

∆y 2 

se o ponto j é vizinho à esquerda ou à direita do ponto i e 

aij = − 1 

∆x 2 

⎤ 

⎥ 

⎦ 

(n−1)×(n−1) 

se o ponto j é vizinho acima ou abaixo do ponto i. Por exemplo, no caso especial ∆x = ∆y, se n = 4 e m = 6


(ou seja 3 × 5 = 15 pontos internos na malha e uma matriz 15 × 15), temos 

A = 1 

∆x2 ⎡ 

4 

⎢ −1 

⎢ 0 

⎢ −1 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎣ 0 

−1 

4 

−1 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

4 

0 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

0 

4 

−1 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

−1 

4 

−1 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

−1 

4 

0 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

0 

4 

−1 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

−1 

4 

−1 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

−1 

4 

0 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

0 

4 

−1 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

−1 

4 

−1 

0 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

−1 

4 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

0 

4 

−1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

−1 

4 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−1 

0 

−1 

0 0 0 0 0 0 0 0 0 0 0 −1 0 −1 4 

Observe que a matriz A é uma matriz simétrica, pentadiagonal e esparsa. 

2.2.2 Existência e Unicidade da Solução Discreta – Autovalores do Problema 

Bidimensional 

Denotaremos por ud a função u| Ωd , isto é, ud é a discretização da função u no domínio discretizado Ωd. 

Vamos definir o operador laplaciano discreto obtido a partir da fórmula dos cinco pontos por 

 

ui−1,j − 2ui,j + ui+1,j 

−∆dud = − 

∆x2 + ui,j−1 − 2ui,j + ui,j+1 

∆y2 

. (2.12) 

de modo que a discretização do problema 

−∆u = f em Ω, 


é o problema −∆dud = fd em Ωd, 

ud = 0 sobre ∂Ωd. 

⎤ 

⎥ 

⎦ 

(2.13) 

Para estabelecer a existência e unicidade da solução discreta, provaremos que a matriz de discretização A, 

que é uma matriz simétrica, é também uma matriz positiva definida, pois isso implica em particular que A 

é invertível. 

Lembrando que as autofunções de Dirichlet do laplaciano no retângulo [0, a] × [0, b] são as funções 

Ukl (x, y) = sen kπx 

a 

sen lπy 

b , 

este fato sugere que os autovetores ukl da matriz A na ordem lexicográfica são os vetores de coordenadas 

Ukl (x1, y1) , Ukl (x2, y1) , . . . , Ukl (xn−1, y1) , 

Ukl (x1, y2) , Ukl (x2, y2) , . . . , Ukl (xn−1, y2) , 

. 

Ukl (x1, ym−1) , Ukl (x2, ym−1) , . . . , Ukl (xn−1, ym−1)


= Ukl (∆x, ∆y) , Ukl (2∆x, ∆y) , . . . , Ukl ((n − 1) ∆x, ∆y) , 

Ukl (∆x, 2∆y) , Ukl (2∆x, 2∆y) , . . . , Ukl ((n − 1) ∆x, 2∆y) , 

. 

. 

Ukl (∆x, (m − 1) ∆y) , Ukl (2∆x, (m − 1) ∆y) , . . . , Ukl ((n − 1) ∆x, (m − 1) ∆y) , 

ou seja, como ∆x = a/n e ∆y = b/m, os vetores 

ukl = 

 

sen kπ 

n 

sen kπ 

n 

. . . , 

sen kπ 

n 

lπ 2kπ 

sen , sen 

m n 

2lπ 2kπ 

sen , sen 

m n 

(m − 1) lπ 

sen , sen 

m 

2kπ 

n 

lπ (n − 1) kπ 

sen , . . . , sen sen 

m n 

lπ 

m , 

2lπ (n − 1) kπ 


m n 

2lπ 

m , 

(m − 1) lπ (n − 1) kπ 


m 

n 

 

(m − 1) lπ 

. 

m 

2.2 Lema. Os (n − 1) × (m − 1) autovalores da matriz A são 

 

1 

λkl = 2 

∆x2 

1 − cos kπ 

 

+ 

n 

1 

∆y2 

1 − cos lπ 

 

1 kπ 1 lπ 

= 4 sen2 + sen2 , (2.14) 

m ∆x2 2n ∆y2 2m 

k = 1, . . . , n − 1, l = 1, . . . , m − 1, e os autovetores correspondentes são 

ukl = 

 

sen kπ 

n 

sen kπ 

n 

. . . , 

sen kπ 

n 

lπ 2kπ 

sen , sen 

m n 

2lπ 2kπ 

sen , sen 

m n 

(m − 1) lπ 

sen , sen 

m 

2kπ 

n 

k = 1, . . . , n − 1, l = 1, . . . , m − 1. 

lπ (n − 1) kπ 


m n 

lπ 

m , 

2lπ (n − 1) kπ 

sen , . . . , sen 

m n 

(m − 1) lπ (n − 1) kπ 


m 

n 

sen 2lπ 

, (2.15) 

m 

 

(m − 1) lπ 

, 

m 

Prova. Embora a demonstração deste lema possa ser feita de maneira análoga à do Lema 2.1, usando 

identidades trigonométricas, daremos uma demonstração diferente. Lembrando que as autofunções e os 

autovalores de Dirichlet do laplaciano no retângulo são facilmente obtidos através do método de separação 

de variáveis, encontraremos os autovalores da matriz A usando um método de separação de variáveis discreto 

para achar os autovalores do laplaciano discreto 

 

ui−1,j − 2ui,j + ui+1,j 

− 

∆x2 + ui,j−1 − 2ui,j + ui,j+1 

∆y2 

= λui,j. (2.16) 

Em particular, este método não depende da maneira como os pontos da malha são ordenados (não depende 

da matriz A usada para representar o laplaciano discreto). Como no método de separação de variáveis 

contínuo, assumimos que as soluções da equação discreta acima são produtos da forma 

ui,j = F (i) G (j) , (2.17) 

onde F e G são funções de uma variável inteira. Substituindo esta expressão na equação de Helmholtz 

discreta, obtemos 

F (i − 1) G (j) − 2F (i) G (j) + F (i + 1) G (j) 

∆x2 + F (i) G (j − 1) − 2F (i) G (j) + F (i) G (j + 1) 

∆y2 = −λF (i) G (j) .


Dividindo esta equação por F (i) G (j), segue que 

F (i − 1) − 2F (i) + F (i + 1) 

∆x 2 F (i) 

+ G (j − 1) − 2G (j) + G (j + 1) 

∆y 2 G (j) 

= −λ. 

Separando as variáveis, concluímos que cada um dos quocientes acima é independente de i ou de j, isto é, 

eles são constantes: 

onde as constantes α, β estão relacionadas pela identidade 

F (i − 1) − 2F (i) + F (i + 1) 

= A, 

F (i) 

(2.18) 

G (j − 1) − 2G (j) + G (j + 1) 

= B, 

G (j) 

(2.19) 

A B 

+ = −λ. (2.20) 

∆x2 ∆y2 Estas equações podem ser escritas como fórmulas de recorrência (análogas às equações diferenciais ordinárias 

obtidas no método de separação de variáveis contínuo) 

F (i + 1) − (A + 2) F (i) + F (i − 1) = 0, 

G (j − 1) − (B + 2) G (j) + G (j + 1) = 0. 

Para resolvê-las, é mais conveniente trabalhar com as constantes 

Desta forma, as equações para F e G tornam-se 

Observe que 

2α = A + 2, 2β = B + 2. 

F (i − 1) − 2αF (i) + F (i + 1) = 0, (2.21) 

G (j − 1) − 2βG (j) + G (j + 1) = 0. (2.22) 

 

1 − α 1 − β 

λ = 2 + 

∆x2 ∆y2 

. (2.23) 

Vamos resolver a equação para F , já que a equação para G é completamente análoga. Substituindo em 

(2.21) uma solução da forma 

F (i) = z i 

(2.24) 

obtemos 

z i−1 − 2αz i + z i+1 = 0, 

donde, dividindo por z i−1 extraímos a equação quadrática (análoga à equação indicial) 

As duas raízes são 

z 2 − 2αz + 1 = 0. (2.25) 

z± = α ± α 2 − 1, 

com z+ + z− = 2α e z+z− = 1. Portanto, a solução geral para a equação (2.21) é 

F (i) = c1z i + + c2z i − 

para algumas constantes c1, c2. Para determinarmos estas constantes e também α, aplicamos as condições 

de fronteira, que implicam 

F (0) = F (n) = 0.


A primeira destas por sua vez implica que c1 = −c2, logo 

F (i) = c z i + − z i 

− . (2.26) 

Como a equação para F é homogênea, a constante c é arbitrária. Aplicando a segunda, segue que 

ou, como z+z− = 1, 

z n + = z n −, 

z 2n 

+ = 1 

Conseqüentemente, z+ é uma 2n-ésima raiz complexa de 1: 

z+ = e ijπ/n 

(2.27) 

para algum inteiro 1 k 2n − 1, onde i = √ −1. Como z− = 1/z+, podemos restringir 0 k n − 1 e 

(2.26) produz todas as soluções não-triviais F de (2.21). 

Portanto, 

e, escolhendo c = 1/2, 

Analogamente, 

e 

Segue que os autovalores são 

α = z+ + z− 

2 

λkl = 2 

= eiπk/n + e −iπk/n 

2 

= cos kπ 

, 0 k n − 1, 

n 

Fk (i) = e iπki/n − e −iπki/n = sen ikπ 

n . 

β = cos lπ 

, 0 l m − 1, 

m 

Gl (j) = sen jlπ 

m . 

 

1 

∆x2 

1 − cos kπ 

 

+ 

n 

1 

∆y2 

1 − cos lπ 

 

m 

e as coordenadas das autofunções associadas são dadas por 

 

(ukl) i,j = Fk (i) Gl (j) = sen ikπ 

n 

sen jlπ 

m . 

2.3 Teorema. (Existência e Unicidade da Solução Discreta) Seja Ω = (0, a) × (0, b). Então o problema 

discretizado −∆dud = fd em Ωd, 

possui uma única solução. 

ud = 0 sobre ∂Ωd, 

Prova. Pelo lema anterior, os autovalores da matriz simétrica A são positivos, logo ela é uma matriz 

invertível.


2.2.3 Princípio do Máximo Discreto 

Para obter uma estimativa a priori para a equação de Poisson discretizada, e com isso provar a convergência 

da solução discreta para a solução clássica, usaremos um princípio do máximo discreto que enunciaremos e 

provaremos nesta subseção. 

2.3 Lema. (Propriedade do Valor Médio) Se ∆dud = 0, então para pontos interiores vale 

ui,j = ∆x2 (ui,j−1 + ui,j+1) + ∆y2 (ui−1,j + ui+1,j) 

2 (∆x2 + ∆y2 . 

) 

Em particular, se ∆x = ∆y, então para pontos interiores vale 

ui,j = ui,j−1 + ui,j+1 + ui−1,j + ui+1,j 

. 

4 

2.4 Teorema. (Princípio do Máximo Discreto) Se ∆dud 0, o máximo de ud em Ωd é atingido na fronteira 

∂Ωd; se o máximo de ud é atingido no interior, então ud é constante. 

Se ∆dud 0, o mínimo de ud em Ωd é atingido na fronteira ∂Ωd; se o mínimo de ud é atingido no 

interior, então ud é constante. 

Prova. Primeiro provaremos para ∆x = ∆y, para ilustrar a analogia com o caso contínuo. ∆dud 0 implica 

Logo, um ponto interior é um máximo local, isto é, 

ui,j ui,j−1 + ui,j+1 + ui−1,j + ui+1,j 

. 

4 

ui,j ui,j−1, ui,j+1, ui−1,j, ui+1,j 

(ou seja, é um máximo em relação aos seus quatro vizinhos), somente se cada um dos seus quatro vizinhos 

assume este mesmo valor máximo, e a desigualdade torna-se uma identidade. Aplicando este argumento a 

todos os pontos da malha, concluímos que ou não existe um máximo interior, e portanto o máximo é atingido 

na fronteira, ou existe um máximo interior e todos os pontos da malha assumem o mesmo valor, isto é, ud é 

constante. 

No caso geral ∆x = ∆y, se ∆dud 0 temos 

 

1 1 

+ 

∆x2 ∆y2 

ui,j 1 

 

ui,j−1 + ui,j+1 

2 ∆y2 Se ui,j é um máximo local, segue que 

 

1 1 

+ 

∆x2 ∆y2 

ui,j 1 

 

ui,j + ui,j 

2 ∆y2 + ui−1,j + ui+1,j 

∆x2 

. 

+ ui,j + ui,j 

∆x2 

= 1 

 

1 1 

+ 

2 ∆x2 ∆y2 

ui,j, 

logo nenhum dos seus quatro vizinhos pode assumir um valor menor que ui,j, isto é, cada um dos quatro 

vizinhos assume o mesmo valor máximo e o argumento prossegue como no caso anterior. O caso ∆dud 0 

é provado considerando-se −ud. 

2.2.4 Convergência da Solução Discreta para a Solução Clássica 

Por simplicidade, trabalharemos no quadrado unitário, isto é, Ω = (0, 1) × (0, 1). Consideraremos a norma 

do máximo discreta para funções vd definidas no domínio discretizado Ωd: 

vd∞ = max |vi,j| . 

0in 

0jm 

Em primeiro lugar, obtemos uma estimativa a priori discreta (que também pode ser visto como um resultado 

de regularidade discreto) para soluções da equação de Poisson discreta com condição de Dirichlet homogênea:


2.5 Lema. (Estimativa a Priori) Seja Ω = (0, 1) 2 . Seja ud uma solução de 

 

−∆dud = fd em Ωd, 

ud = 0 sobre ∂Ωd. 

Então 

Prova. Considere a função 

e sua versão discretizada wd definida por 

Então 

e também 

pois 

ud ∞ 1 

8 ∆dud ∞ . (2.28) 

w (x, y) = 1 

x − 

4 

1 

2 

+ y − 

2 

1 

 

2 

2 

wi,j = 1 

4 

 

xi − 1 

2 

2 

w 0 e ∆w = 1, 

∆dwd = wi−1,j − 2wi,j + wi+1,j 

+ wi,j−1 − 2wi,j + wi,j+1 

∆x 2 

xi−1 − 1 

2 

2 + yj − 1 

2 

 

+ yj − 1 

 

2 

. (2.29) 

2 

wd 0 e ∆dwd = 1, (2.30) 

∆y 2 

2 − 2 xi − 1 

2 

2 − 2 yj − 1 

2 

2 + xi+1 − 1 

2 

2 

+ yj − 1 

2 2 

= 1 

4 

∆x2 

xi − 

+ 

1 

2 

2 + yj−1 − 1 

2 

2 − 2 xi − 1 

2 

2 − 2 yj − 1 

2 

2 + xi − 1 

2 

2 + yj+1 − 1 

2 2 

∆y2 

= 1 

 

xi−1 − 

4 

1 

2 

2 − 2 xi − 1 

2 

2 + xi+1 − 1 

2 2 

∆x2 

yj−1 − 

+ 

1 

2 

2 − 2 yj − 1 

2 

2 + yj+1 − 1 

2 2 

∆y2 

= 1 

 

xi − ∆x − 

4 

1 

2 

2 − 2 xi − 1 

2 

2 + xi + ∆x − 1 

2 2 

∆x2 

yj − ∆y − 

+ 

1 

2 

2 − 2 yj − 1 

2 

2 + yj + ∆y − 1 

2 2 

∆y2 

= 1 

 

2 xi + ∆x 

4 

2 + 1 

4 − 2xi∆x − xi + ∆x − 2 x2 i − xi + 1 

 

2 

4 + xi + ∆x2 + 1 

4 + 2xi∆x − xi − ∆x 

∆x2 

2 yj + ∆y 

+ 

2 + 1 

4 − 2yj∆y − yj + ∆y − 2 y2 j − yj + 1 

 

2 

4 + yj + ∆y2 + 1 

4 + 2yj∆y − yj − ∆y 

∆y2 

= 1 

2 2∆x 2∆y2 

+ 

4 ∆x2 ∆y2 

= 1. 

Considere agora a função 

Temos então 

ud − ∆dud ∞ wd. (2.31) 

∆d (ud − ∆dud ∞ wd) = ∆dud − ∆dud ∞ ∆dwd 

= ∆dud − ∆dud ∞ 

0.


Segue do Princípio do Máximo Discreto que a função ud − ∆dud ∞ wd assume o seu mínimo na fronteira. 

Este último é igual a − ∆dud ∞ max∂Ωd wd. Por sua vez, o máximo de wd na fronteira é menor ou igual ao 

máximo de w em ∂Ω, dado por 

Portanto, concluímos que 

para todos i, j. Analogamente, 

 

1 

max x − 

0x1 4 

1 

2 

1 

= max y − 

2 0x1 4 

1 

2 = 

2 

1 

8 . 

ui,j ui,j − ∆dud ∞ wi,j − 1 

8 ∆dud ∞ 

∆d (ud + ∆dud ∞ wd) 0 

(2.32) 

e a função ud + ∆dud∞ wd assume o seu máximo na fronteira, igual a ∆dud max∂Ωd ∞ wd 1 

8a, donde 

ui,j ui,j − ∆dud ∞ wi,j 1 

8 ∆dud ∞ 

para todos i, j. Reunindo as duas desigualdades, segue que 

para todos i, j, o que conclui a demonstração. 

|ui,j| 1 

8 ∆dud ∞ 

2.6 Teorema. Seja Ω = (0, 1) 2 . Sejam u ∈ C 4 Ω uma solução clássica para o problema de Dirichlet 

−∆u = f em Ω, 


e vd uma solução do correspondente problema discretizado 

 

−∆dvd = fd em Ωd, 

vd = 0 sobre ∂Ωd. 

(2.33) 

Então existe uma constante C > 0 independente de u tal que 

ud − vd∞ C D 4 u 

2 2 

L∞ ∆x + ∆y 

(Ω) 

. (2.34) 

Prova. A hipótese f ∈ C2,α Ω garante que u ∈ C4 Ω . Lembre-se que 

 

D 4 u 

L∞ = 

(Ω) 

sup 

 

 

 

∂ 

 

4u ∂xp 

 

(x, y) 

∂yq . 

Pela Fórmula de Taylor, 

(x,y)∈Ω 

p+q=4 

∂2u ∂x2 (xi, yj) = u(xi − ∆x, yj) − 2u(xi, yj) + u(xi + ∆x, yj) 

∆x2 − 2 ∂ 

4! 

4u ∂x4 (xi, yj)∆x 2 − 2 ∂ 

5! 

6u ∂x6 (xi, yj)∆x 4 − . . . 

= ui−1,j − 2ui,j + ui+1,j 

∆x2 − 2 ∂ 

4! 

4u ∂x4 (xi, yj)∆x 2 − 2 ∂ 

5! 

6u ∂x6 (xi, yj)∆x 4 − . . . , 

∂2u ∂y2 (xi, yj) = u(xi, yj − ∆y) − 2u(xi, yj) + u(xi, yj + ∆y) 

∆y2 − 2 ∂ 

4! 

4u ∂y4 (xi, yj)∆y 2 − 2 ∂ 

5! 

6u ∂y6 (xi, yj)∆y 4 − . . . 

= ui,j−1 − 2ui,j + ui,j+1 

∆y2 − 2 ∂ 

4! 

4u ∂y4 (xi, yj)∆y 2 − 2 ∂ 

5! 

6u ∂y6 (xi, yj)∆y 4 − . . . ,



Como 

temos que 

∆u (xi, yj) = (∆dud) ij − 1 

4 ∂ u 

3! ∂x4 (xi, yj)∆x 2 + ∂4u ∂y4 (xi, yj)∆y 2 

 

+ O ∆x 4 , ∆y 4 . (2.35) 

−∆u (xi, yj) = f (xi, yj) , 

− (∆dud) i,j = (fd) i,j − 1 

4 ∂ u 


 

+ O ∆x 4 , ∆y 4 . (2.36) 

Subtraindo desta equação a equação 

obtemos 

o que implica 

− (∆dvd) i,j = (fd) i,j , 

− (∆dud − ∆dvd) i,j = − 1 

4 ∂ u 


 

+ O ∆x 4 , ∆y 4 , 

∆d (ud − vd)∞ 1 

D 

3! 

4 u 

2 2 

L∞ ∆x + ∆y 

(Ω) 

+ O ∆x 4 , ∆y 4 

C 

4 

D uL 2 2 

∞ ∆x + ∆y (Ω) 

. 

Usando a estimativa a priori do lema anterior, obtemos finalmente o resultado desejado. 

Definição. Dizemos que as soluções do problema discretizado 

 

−∆dvd = fd em Ωd, 

vd = 0 sobre ∂Ωd, 

convergem para a solução exata u do problema de Poisson 

−∆u = f em Ω, 


com relação à norma · se 

ud − vd → 0 

quando ∆x, ∆y → 0. Dizemos que a convergência é de ordem k (ou que o esquema de diferenças 

finitas é convergente de ordem k) se 

ud − vd = O ∆x k , ∆y k . 

O Teorema 2.6 diz que o esquema de diferenças finitas da fórmula de cinco pontos é um esquema convergente 

na norma do sup de ordem 2, se u ∈ C 4 Ω . Maior regularidade da solução u não causa melhor convergência 

no método. Na verdade, a ordem de convergência da fórmula de cinco pontos ainda é 2 mesmo sob hipóteses 

mais fracas sobre a regularidade de u: basta assumir u ∈ C 3,1 Ω , ao invés de u ∈ C 4 Ω . No entanto, 

regularidade menor que esta em u afeta negativamente a ordem de convergência da fórmula de cinco pontos. 

Em geral, pode-se provar que se u ∈ C k,α Ω , 2 k 4, então existe uma constante C = C (k, α) tal que 

ud − vd ∞ C ∆x k+α−2 + ∆y k+α−2 u C k,α (Ω) . (2.37) 

Para uma demonstração destes resultados, veja [Hackbusch], págs. 60-61. Se quisermos uma melhor ordem 

de convergência para as soluções discretizadas, é necessário considerar outras forma de discretizar o laplaciano 

através de diferenças finitas. Isto será feito na próxima seção.


2.3 Discretizações de Ordem Superior 

Para obter esquemas de diferenças finitas com melhor ordem de convergência, em geral é necessário acrescentar 

mais pontos na fórmula. O método dos coeficientes indeterminados é um método simples para 

construir estes esquemas. 

2.3.1 Caso Unidimensional 

Vamos obter um esquema de diferenças finitas convergente de ordem 4 para o caso unidimensional. O 

esquema envolvendo três pontos, que obtivemos no início do capítulo através da aproximação da derivada 

segunda em um ponto por uma diferença finita centrada (que envolve o ponto e seus dois vizinhos, à esquerda 

e à direita), é convergente de ordem 2 (isso que pode ser provado de maneira semelhante a como fizemos para 

a fórmula de cinco pontos). Para obter um esquema com uma maior ordem de convergência, acrescentamos 

mais dois pontos à fórmula de diferenças finitas do esquema, que denotaremos por δui: 

Cada termo tem sua expansão em série de Taylor: 

δui = c1ui−2 + c2ui−1 + c3ui + c4ui+1 + c5ui+2. (2.38) 

u(xi − 2∆x) = u(xi) − 2u ′ (xi)∆x + 4 

2! u′′ (xi)∆x 2 − 8 

3! u′′′ (xi)∆x 3 + 16 

4! u(4) (xi)∆x 4 − 32 

5! u(5) (xi)∆x 5 + O ∆x 6 , 

u(xi − ∆x) = u(xi) − u ′ (xi)∆x + 1 

2! u′′ (xi)∆x 2 − 1 

3! u′′′ (xi)∆x 3 + 1 

4! u(4) (xi)∆x 4 − 1 

5! u(5) (xi)∆x 5 + O ∆x 6 , 

u(xi + ∆x) = u(xi) + u ′ (xi)∆x + 1 

2! u′′ (xi)∆x 2 + 1 

3! u′′′ (xi)∆x 3 + 1 

4! u(4) (xi)∆x 4 + 1 

5! u(5) (xi)∆x 5 + O ∆x 6 , 

u(xi + 2∆x) = u(xi) + 2u ′ (xi)∆x + 4 

2! u′′ (xi)∆x 2 + 8 

3! u′′′ (xi)∆x 3 + 16 

4! u(4) (xi)∆x 4 + 32 

5! u(5) (xi)∆x 5 + O ∆x 6 . 

Substituindo estas expressões na fórmula acima, obtemos: 

δui = (c1 + c2 + c3 + c4 + c5) u (xi) 

+ ∆x (−2c1 − c2 + c4 + 2c5) u ′ (xi) 

+ ∆x 2 

 

2c1 + 1 

2 c2 + 1 

2 c4 

 

+ 2c5 u ′′ (xi) 

+ ∆x 3 

 

− 4 

3 c1 − 1 

6 c2 + 1 

6 c4 + 4 

3 c5 

 

u ′′′ (xi) 

+ ∆x 4 

 

2 

3 c1 + 1 

24 c2 + 1 

24 c4 + 2 

3 c5 

 

u (4) (xi) 

+ ∆x 5 

 

− 4 

15 c1 − 1 

120 c2 + 1 

120 c4 + 4 

15 c5 

 

u (5) (xi) 

+ O ∆x 6 . 

Como procuramos um esquema de diferenças finitas com ordem de convergência maior que 2, queremos obter 

uma solução não-nula para o sistema 

⎧ 

⎪⎨ 

⎪⎩ 

c1 + c2 + c3 + c4 + c5 = 0 

−2c1 − c2 + c4 + 2c5 = 0 

2c1 + 1 

2 c2 + 1 

2 c4 + 2c5 

= 

1 

∆x 2 

− 4 

3 c1 − 1 

6 c2 + 1 

6 c4 + 4 

3 c5 = 0 

2 

3 c1 + 1 

24 c2 + 1 

24 c4 + 2 

3 c5 = 0 

;


isso implicaria em princípio em um esquema com ordem de convergência pelo menos igual a 3: 

δui = u ′′ (xi) + O ∆x 3 . 

Como a matriz ⎡ 

1 1 1 1 1 

⎢ −2 

⎢ 2 

⎢ 

− 

⎣ 

−1 

1 

2 

0 

0 

1 

1 

2 

2 

2 

4 

3 −1 

⎤ 

2 

3 

6 

1 

24 

0 

0 

1 

6 

1 

24 

⎥ 

4 ⎥ 

3 ⎥ 

⎦ 

2 

3 

tem determinante igual a 1, ela é invertível e o sistema possui a solução única 

Incidentalmente, esta solução também implica 

c1 = − 1 1 

, 

12 ∆x2 c2 = 4 1 

, 

3 ∆x2 c3 = − 5 1 

2 ∆x2 c4 = 4 1 

, 

3 ∆x2 c5 = − 1 1 

. 

12 ∆x2 − 4 

15 c1 − 1 

120 c2 + 1 

120 c4 + 4 

15 c5 = 0 

o que permite obter um esquema com ordem de convergência igual a 4: 

δui = u ′′ (xi) + O ∆x 4 , 

aproximando a derivada segunda u ′′ pela diferença finita 

ou 

u ′′ = 

− 1 

12 ui−2 + 4 

3 ui−1 − 5 

2 ui + 4 

3 ui+1 − 1 

12 ui+2 

∆x 2 

−u ′′ = ui−2 − 16ui−1 + 30ui − 16ui+1 + ui+2 

12∆x 2 . (2.39) 

2.3.2 Caso Bidimensional: A Fórmula dos Nove Pontos Compacta 

Um esquema de ordem 4 para a equação de Poisson em duas dimensões é a fórmula de nove pontos compacta. 

Se buscássemos uma fórmula de nove pontos simplesmente a partir da fórmula de cinco pontos unidimensional 

obtida na subseção precedente (como obtivemos a fórmula de cinco pontos bidimensional a partir 

da fórmula de três pontos unidimensional), escreveríamos 

−∆dud = ui−2,j − 16ui−1,j + 30ui,j − 16ui+1,j + ui+2,j 

12∆x 2 

+ ui,j−2 − 16ui,j−1 + 30ui,j − 16ui,j+1 + ui,j+2 

12∆y2 , 

(2.40)


que pode ser resumida na forma 

⎡ 

⎢ 

−∆dud = ⎢ 

⎣ 

− 1 16 

− 

12∆x2 12∆x2 − 1 

12∆y2 − 16 

12∆y2 

1 1 

30 + 

12∆x2 12∆y2 

− 16 

12∆y2 − 1 

12∆y2 − 16 1 

− 

12∆x2 12∆x2 Embora este esquema seja de fato de ordem 4, ele apresenta dificuldades para pontos interiores adjacentes à 

fronteira do retângulo (por exemplo, se considerarmos o ponto (x1, y1), os pontos (x−1, y1) e (x1, y−1) estão 

fora do retângulo). Uma possibilidade para resolver este problema seria aplicar a fórmula dos cinco pontos 

nos pontos interiores adjacentes à fronteira e aplicar a fórmula dos nove pontos apenas nos pontos interiores 

mais distantes da fronteira. No entanto, como a fórmula de cinco pontos é de segunda ordem, a convergência 

deste método misto não deve ser de ordem 4. 

Vamos tentar encontrar uma fórmula de nove pontos compacta, em que os nove pontos estão dispostos 

em três linhas e três colunas, de modo que não há problemas em usá-la nos pontos interiores adjacentes à 

fronteira. Aplicando o método dos coeficientes indeterminados, buscamos nove coeficientes para a diferença 

finita 

−∆dud = c1ui−1,j−1 + c2ui,j−1 + c3ui+1,j−1 

+ c4ui−1,j + c5ui,j + c6ui+1,j 

+ c7ui−1,j+1 + c8ui,j+1 + c9ui+1,j+1. 

⎤ 

⎥ . 

⎥ 

⎦ 

(2.41) 

Observe a distribuição dos nove pontos. Além dos cinco usuais, foram acrescentados os quatro pontos que 

ocupam as posições diagonais. Para os quatro pontos vizinhos horizontais ou verticais do ponto central, a 

fórmula de Taylor produz 

u(xi − ∆x, yj) = u(xi, yj) − ∂u 

∂x (xi, yj)∆x + 1 

2! 

− 1 ∂ 

5! 

5u ∂x5 (xi, yj)∆x 5 + O ∆x 6 

u(xi + ∆x, yj) = u(xi, yj) + ∂u 

∂x (xi, yj)∆x + 1 

2! 

+ 1 ∂ 

5! 

5u ∂x5 (xi, yj)∆x 5 + O ∆x 6 

u(xi, yj − ∆y) = u(xi, yj) − ∂u 

∂y (xi, yj)∆y + 1 

2! 

− 1 ∂ 

5! 

5u ∂x5 (xi, yj)∆x 5 + O ∆x 6 

u(xi, yj + ∆y) = u(xi, yj) + ∂u 

∂y (xi, yj)∆y + 1 

2! 

+ 1 ∂ 

5! 

5u ∂x5 (xi, yj)∆x 5 + O ∆x 6 , ∆y 6 

∂2u ∂x2 (xi, yj)∆x 2 − 1 ∂ 

3! 

3u ∂x3 (xi, yj)∆x 3 + 1 ∂ 

4! 

4u ∂x4 (xi, yj)∆x 4 

∂2u ∂x2 (xi, yj)∆x 2 + 1 ∂ 

3! 

3u ∂x3 (xi, yj)∆x 3 + 1 ∂ 

4! 

4u ∂x4 (xi, yj)∆x 4 

∂2u ∂y2 (xi, yj)∆y 2 − 1 ∂ 

3! 

3u ∂y3 (xi, yj)∆y 3 + 1 ∂ 

4! 

4u ∂y4 (xi, yj)∆y 4 

∂2u ∂y2 (xi, yj)∆y 2 + 1 ∂ 

3! 

3u ∂y3 (xi, yj)∆y 3 + 1 ∂ 

4! 

4u ∂y4 (xi, yj)∆y 4


enquanto que para os quatro pontos diagonais temos 

u(xi + ∆x, yj + ∆y) 

= u(xi, yj) + 

+ 1 

3 ∂ u 

3! 

+ 1 

4! 

+ 1 

5! 

∂u 

∂x (xi, yj)∆x + ∂u 

∂y (xi, yj)∆y 

 

+ 1 

2 ∂ u 

2! ∂x2 (xi, yj)∆x 2 + 2 ∂2u ∂x∂y (xi, yj)∆x∆y + ∂2 u 

∂x3 (xi, yj)∆x 3 + 3 ∂3u ∂x2∂y (xi, yj)∆x 2 ∆y + 3 ∂3u ∂x∂y2 (xi, yj)∆x∆y 2 + ∂3u ∂y3 (xi, yj)∆y 3 

∂ 4 u 

 

∂y2 (xi, yj)∆y 2 

 

∂x4 (xi, yj)∆x 4 + 4 ∂4u ∂x3∂y (xi, yj)∆x 3 ∆y + 6 ∂4u ∂x∂y3 (xi, yj)∆x 2 ∆y 2 + 4 ∂3u ∂x∂y3 (xi, yj)∆x∆y 3 + ∂4u ∂ 5 u 

∂x 5 (xi, yj)∆x 5 + 5 ∂5 u 

∂x 4 ∂y (xi, yj)∆x 4 ∆y + 10 ∂5 u 

+5 ∂5 u 

∂x∂y 4 (xi, yj)∆x∆y 4 + ∂5 u 

∂y 5 (xi, yj)∆y 5 

u(xi − ∆x, yj − ∆y) 

= u(xi, yj) − 

− 1 

3 ∂ u 

3! 

+ 1 

4! 

− 1 

5! 

∂u 

∂x (xi, yj)∆x + ∂u 

∂y (xi, yj)∆y 

∂x3∂y 2 (xi, yj)∆x 3 ∆y 2 + 10 ∂5u ∂x∂y4 (xi, yj)∆x 2 ∆y 3 

 

+ O ∆x 6 , ∆y 6 , 

 

+ 1 

2 ∂ u 

2! ∂x2 (xi, yj)∆x 2 + 2 ∂2u ∂x∂y (xi, yj)∆x∆y + ∂2 u 

∂x3 (xi, yj)∆x 3 + 3 ∂3u ∂x2∂y (xi, yj)∆x 2 ∆y + 3 ∂3u ∂x∂y2 (xi, yj)∆x∆y 2 + ∂3u ∂y3 (xi, yj)∆y 3 

∂ 4 u 

 

∂y4 (xi, yj)∆y 4 

 

∂y2 (xi, yj)∆y 2 

 

∂x4 (xi, yj)∆x 4 + 4 ∂4u ∂x3∂y (xi, yj)∆x 3 ∆y + 6 ∂4u ∂x∂y3 (xi, yj)∆x 2 ∆y 2 + 4 ∂3u ∂x∂y3 (xi, yj)∆x∆y 3 + ∂4u ∂ 5 u 

∂x 5 (xi, yj)∆x 5 + 5 ∂5 u 

∂x 4 ∂y (xi, yj)∆x 4 ∆y + 10 ∂5 u 

+5 ∂5 u 

∂x∂y 4 (xi, yj)∆x∆y 4 + ∂5 u 

∂y 5 (xi, yj)∆y 5 

u(xi + ∆x, yj − ∆y) 

= u(xi, yj) + 

 

∂u 

∂x (xi, yj)∆x − ∂u 

∂y (xi, 

 

yj)∆y 

 

+ O ∆x 6 


+ 1 

2 ∂ u 

2! ∂x2 (xi, yj)∆x 2 − 2 ∂2u ∂x∂y (xi, yj)∆x∆y + ∂2u ∂y2 (xi, yj)∆y 2 

 

+ 1 

3 ∂ u 

3! ∂x3 (xi, yj)∆x 3 − 3 ∂3u ∂x2∂y (xi, yj)∆x 2 ∆y + 3 ∂3u ∂x∂y2 (xi, yj)∆x∆y 2 − ∂3u ∂y3 (xi, yj)∆y 3 

 

+ 1 

4 ∂ u 

4! ∂x4 (xi, yj)∆x 4 − 4 ∂4u ∂x3∂y (xi, yj)∆x 3 ∆y + 6 ∂4u ∂x∂y3 (xi, yj)∆x 2 ∆y 2 − 4 ∂3u + 1 

5 ∂ u 

5! ∂x5 (xi, yj)∆x 5 − 5 ∂5u ∂x4∂y (xi, yj)∆x 4 ∆y + 10 ∂5u ∂x3∂y 2 (xi, yj)∆x 3 ∆y 2 − 10 ∂5u 

+ O ∆x 6 , ∆y 6 , 

+5 ∂5 u 

∂x∂y 4 (xi, yj)∆x∆y 4 − ∂5 u 

∂y 5 (xi, yj)∆y 5 

∂x∂y 3 (xi, yj)∆x∆y 3 + ∂4 u 

∂x∂y 4 (xi, yj)∆x 2 ∆y 3 

∂y4 (xi, yj)∆y 4 

 

∂y4 (xi, yj)∆y 4


u(xi − ∆x, yj + ∆y) 

= u(xi, yj) + 

+ 1 

2 ∂ u 

2! 

+ 1 

3! 

+ 1 

4! 

+ 1 

5! 

 

− ∂u 

∂x (xi, yj)∆x + ∂u 

∂y (xi, 

 

yj)∆y 

∂x 2 (xi, yj)∆x 2 − 2 ∂2 u 

∂x∂y (xi, yj)∆x∆y + ∂2 u 

∂y 2 (xi, yj)∆y 2 

 

− ∂3 u 

∂ 4 u 

∂x 3 (xi, yj)∆x 3 + 3 ∂3 u 

∂x 2 ∂y (xi, yj)∆x 2 ∆y − 3 ∂3 u 

 

∂x∂y 2 (xi, yj)∆x∆y 2 + ∂3 u 

∂y3 (xi, yj)∆y 3 

 

∂x 4 (xi, yj)∆x 4 − 4 ∂4 u 

∂x 3 ∂y (xi, yj)∆x 3 ∆y + 6 ∂4 u 

∂x∂y 3 (xi, yj)∆x 2 ∆y 2 − 4 ∂3 u 

∂x∂y 3 (xi, yj)∆x∆y 3 + ∂4 u 

∂y 4 (xi, yj)∆y 4 

 

− ∂5 u 

∂x 5 (xi, yj)∆x 5 + 5 ∂5 u 

∂x 4 ∂y (xi, yj)∆x 4 ∆y − 10 ∂5 u 

−5 ∂5 u 

∂x∂y 4 (xi, yj)∆x∆y 4 + ∂5 u 

∂y 5 (xi, yj)∆y 5 

 

+ O ∆x 6 , ∆y 6 . 

Substituindo estas expressões na fórmula acima, obtemos: 

−∆dud = (c1 + c2 + c3 + c4 + c5 + c6 + c7 + c8 + c9) u (xi, yj) 

+ ∆x (−c1 + c3 − c4 + c6 − c7 + c9) ∂u 

∂x (xi, yj) 


+ ∆y (−c1 − c2 − c3 + c7 + c8 + c9) ∂u 

∂y (xi, yj) 

+ ∆x 2 

 

1 

2 c1 + 1 

2 c3 + 1 

2 c4 + 1 

2 c6 + 1 

2 c7 + 1 

2 c9 

2 ∂ u 

∂x2 (xi, yj) 

+ ∆x∆y (c1 − c3 − c7 + c9) ∂2u ∂x∂y (xi, yj) 

+ ∆y 2 

 

1 

2 c1 + 1 

2 c2 + 1 

2 c3 + 1 

2 c7 + 1 

2 c8 + 1 

2 c9 

2 ∂ u 

∂y2 (xi, yj) 

+ ∆x 3 

 

− 1 

6 c1 + 1 

6 c3 − 1 

6 c4 + 1 

6 c6 − 1 

6 c7 + 1 

6 c9 

3 ∂ u 

∂x3 (xi, yj) 

+ ∆x 2 

∆y − 1 

2 c1 − 1 

2 c3 + 1 

2 c7 + 1 

2 c9 

3 ∂ u 

∂x2∂y (xi, yj) 

+ ∆x∆y 2 

 

− 1 

2 c1 + 1 

2 c3 − 1 

2 c7 + 1 

2 c9 

3 ∂ u 

∂x∂y2 (xi, yj) 

+ ∆y 3 

 

− 1 

6 c1 − 1 

6 c2 − 1 

6 c3 + 1 

6 c7 + 1 

6 c8 + 1 

6 c9 

3 ∂ u 

∂y3 (xi, yj) 

+ ∆x 4 

 

1 

24 c1 + 1 

24 c3 + 1 

24 c4 + 1 

24 c6 + 1 

24 c7 + 1 

24 c9 

4 ∂ u 

∂x4 (xi, yj) 

+ ∆x 3 

1 

∆y 

6 c1 − 1 

6 c3 − 1 

6 c7 + 1 

6 c9 

4 ∂ u 


+ ∆x 2 ∆y 2 

 

1 

4 c1 + 1 

4 c3 + 1 

4 c7 + 1 

4 c9 

4 ∂ u 

∂x2∂y 2 (xi, yj) 

+ ∆x∆y 3 

 

1 

6 c1 − 1 

6 c3 − 1 

6 c7 + 1 

6 c9 

4 ∂ u 


+ ∆y 4 

 

1 

24 c1 + 1 

24 c2 + 1 

24 c3 + 1 

24 c7 + 1 

24 c8 + 1 

24 c9 

4 ∂ u 

∂y4 (xi, yj)


+ ∆x 5 

 

− 1 

120 c1 + 1 

120 c3 − 1 

120 c4 + 1 

120 c6 − 1 

120 c7 + 1 

+ ∆x 4 

∆y − 1 

24 c1 − 1 

24 c3 + 1 

24 c7 + 1 

24 c9 

5 ∂ u 


+ ∆x 3 ∆y 2 

 

− 1 

12 c1 + 1 

12 c3 + 1 

12 c7 + 1 

12 c9 

5 ∂ u 

+ ∆x 2 ∆y 3 

 

− 1 

5 ∂ u 

120 c9 

∂x 3 ∂y 2 (xi, yj) 

∂ 5 u 

∂x 5 (xi, yj) 

12 c1 − 1 

12 c3 − 1 

12 c7 + 1 

12 c9 

∂x2∂y 3 (xi, yj) 

+ ∆x∆y 4 

 

− 1 

24 c1 + 1 

24 c3 − 1 

24 c7 + 1 

24 c9 

5 ∂ u 


+ ∆y 5 

 

− 1 

120 c1 − 1 

120 c2 − 1 

120 c3 + 1 

120 c7 + 1 

120 c8 + 1 

120 c9 

5 ∂ u 

∂y5 (xi, yj) 

Para obter um esquema com ordem de convergência pelo menos igual a 3, precisaríamos obter uma solução 

não-nula para o sistema 

⎧ 

⎪⎨ 

⎪⎩ 

c1 + c2 + c3 + c4 + c5 + c6 + c7 + c8 + c9 = 0 

−c1 + c3 − c4 + c6 − c7 + c9 = 0 

−c1 − c2 − c3 + c7 + c8 + c9 = 0 

c1 + c3 + c4 + c6 + c7 + c9 

= 

1 

∆x 2 

c1 − c3 − c7 + c9 = 0 

c1 + c2 + c3 + c7 + c8 + c9 

= 

1 

∆y2 −c1 + c3 − c4 + c6 − c7 + c9 = 0 

−c1 − c3 + c7 + c9 = 0 

−c1 + c3 − c7 + c9 = 0 

−c1 − c2 − c3 + c7 + c8 + c9 = 0 

c1 + c3 + c4 + c6 + c7 + c9 = 0 

c1 − c3 − c7 + c9 = 0 

c1 + c3 + c7 + c9 = 0 

c1 − c3 − c7 + c9 = 0 

c1 + c2 + c3 + c7 + c8 + c9 = 0 

Infelizmente este sistema não tem solução pois ele é inconsistente: a sexta e a última equação são incompatíveis, 

assim como a quarta e a décima primeira. Portanto, não existe uma fórmula de nove pontos 

compacta tal que 

−∆dud = −∆u + O ∆x 3 , ∆y 3 . 

No entanto, em 1975 o matemático e lógico Rosser introduziu a seguinte fórmula de nove pontos compacta 

no caso especial ∆x = ∆y (em [Rosser1]; veja também [Rosser2]) 

∆dud = ui−1,j−1 + 4ui,,j−1 + ui+1,j−1 + 4ui−1,j − 20ui,j + 4ui+1,j + ui−1,j+1 + 4ui,j+1 + ui+1,j+1 

6∆x2 , (2.42) 

que pode ser resumida na forma 

−∆dud = 1 

6∆x2 ⎡ 

⎣ 

−1 −4 −1 

−4 20 −4 

−1 −4 −1 

⎤ 

⎦ , (2.43) 

a qual produz um esquema convergente de quarta ordem se a solução u ∈ C 6 Ω (ou mesmo se u ∈ C 5,1 Ω 

apenas) dependendo de como a função f é discretizada. Para entender como isso ocorre, observe que se


u ∈ C 8 Ω a fórmula de Taylor produz 

−∆dud = −∆u − ∆x2 

12 ∆2u − ∆x4 

4 ∂ ∂ 

+ 4 

360 ∂x4 4 

∂x2∂y = −∆u − ∆x2 

4 ∆x4 ∂ ∂ 

∆f − + 4 

12 360 ∂x4 4 

∂x2∂y ∂y4 

∆u + O ∆x 6 

(2.44) 

∂y4 

f + O ∆x 6 . (2.45) 

2 + ∂4 

2 + ∂4 

O ponto crucial aqui é que o erro é expresso em termos de −∆u e, conseqüentemente, por f. Ainda é 

necessário escolher uma discretização especial para f: 

ou 

fd = fi,,j−1 + fi−1,j + 8fi,j + fi+1,j + fi,j+1 

12 

fd = 1 

⎡ 

⎣ 

12 

1 

1 8 1 

1 

⎤ 

(2.46) 

⎦ . (2.47) 

Usando a fórmula de Taylor para f, obtemos que esta discretização especial para f satisfaz 

fd = f + ∆x2 

12 ∆f + O ∆x 4 . (2.48) 

Somando esta estimativa com (2.45), e usando −∆dud = fd, −∆u = f, obtemos 

−∆dud = −∆u + O ∆x 4 

Para este esquema, pode-se provar (veja [Hackbusch], pág. 64) que existe uma constante C > 0 tal que 

ud − vd ∞ C∆x 4 u C 6 (Ω) 

ou ud − vd ∞ C∆x 4 u C 5,1 (Ω) 

(2.49) 

O esquema de Rosser também satisfaz o princípio do máximo. Concluindo, vemos que uma maior regularidade 

da solução permite obter métodos de diferenças finitas com maior ordem de convergência, embora esta não 

seja uma tarefa simples. 

2.4 Diferenças Finitas em Coordenadas Polares 

Consideraremos nesta seção diferenças finitas em coordenadas polares para domínios com simetria radial. 

Consideraremos em detalhes os casos do disco e do anel. O primeiro caso inclui a origem no domínio da 

definição, onde o laplaciano apresenta uma singularidade quando escrito em coordenadas polares, singularidade 

esta que não existe no problema original, e esta particularidade deve ser tratada com cuidado para não 

atrapalhar a ordem de convergência do esquema obtido. 

Considere a equação de Poisson em coordenadas polares no disco Ω = [0, R) × [0, 2π) : 

 

urr + 1 

r ur + 1 

r2 uθθ = f (r, θ) se 0 r < R e 0 < θ < 2π, 

u (R, θ) = 0 se 0 θ 2π. 

A solução exata deste problema deve satisfazer a condição de continuidade 

u (r, 0) = u (r, 2π) para todo 0 r R. 

Embora esta condição não seja uma condição de fronteira e aparece apenas por causa do sistema de coordenadas 

utilizado, ela acaba funcionando como uma condição de fronteira em muitos métodos numéricos (e


mesmo analíticos), pois não deixa de ser uma condição na fronteira do retângulo (0, R) × (0, 2π). 


Discretizamos o disco através de uma malha polar 

Sua fronteira discretizada é o conjunto 

∆r 

∆θ 

Ωd = {(ri, θj) ∈ Ω : ri = i∆r, θj = j∆θ, 0 i n − 1, 0 j m} 

∆r = R 2π 

, ∆θ = 

n m . 

∂Ωd = {(rn, θj) ∈ ∂Ω : rn = n∆r = R, θj = j∆θ, 0 j m} . 

Discretizamos a equação de Poisson da seguinte forma. Denotamos os valores das discretizações ud e fd 

em pontos da malha por 

entendendo que ui,j e fi,j devem satisfazer 

ui,j = u (ri, θj) , 

fi,j = f (ri, θj) , 

u0,0 = u0,j e f0,0 = f0,j (2.50) 

para todo 0 j m, já que existe apenas um ponto associado com i = 0 (a origem, correspondente a r = 0). 

Além disso, pela condição de continuidade, devemos ter também 

ui,0 = ui,2π e fi,0 = fi,2π (2.51) 

para todo 0 i n. Usando uma diferença centrada usual para derivadas segundas, o terceiro termo do 

laplaciano em coordenadas polares pode ser aproximado para pontos interiores do disco por 

 

1 

uθθ (ri, θj) ≈ 

r2 1 

r2 ui,j−1 − 2ui,j − ui,j+1 

i ∆θ2 . (2.52) 

Para aproximar os primeiros dois termos, escrevemos 

urr + 1 

r ur = 1 

r (rur) r . 

Se (ri, θj) é um ponto interior do disco diferente da origem (isto é, i = 0), podemos usar diferenças centradas 

para a derivada primeira, tanto na primeira quanto na segunda aproximações a seguir, obtendo 

1 

r (rur) r (ri, θj) ≈ 1 (rur) (ri + ∆r/2, θj) − (rur) (ri − ∆r/2, θj) 

ri 

2∆r/2 

≈ 1 

u (ri + ∆r, θj) − u (ri, θj) u (ri, θj) − u (ri − ∆r, θj) 

ri+1/2 − ri−1/2 ∆r 

∆r 

ri 

∆r 

= 1 ri+1/2 (ui+1,j − ui,j) − ri−1/2 (ui,j − ui−1,j) 

ri 

∆r2 . (2.53)


Portanto, a discretização da equação de Poisson no disco para pontos interiores do disco diferentes da origem 

é 

1 ri+1/2 (ui+1,j − ui,j) − ri−1/2 (ui,j − ui−1,j) 

− 

∆r2 ui,j−1 − 2ui,j − ui,j+1 

∆θ2 

= fi,j (2.54) 

ri 

para 1 i n − 1 e 1 j m − 1. Se j = 0, usando a condição de continuidade que identifica o ponto 

(i, 0) com o ponto (i, n), substituímos ui,j−1 por ui,n−1e escrevemos 

 

1 ri+1/2 (ui+1,0 − ui,0) − ri−1/2 (ui,0 − ui−1,0) 

− 

∆r2 ui,n−1 − 2ui,0 − ui,1 

∆θ2 

= fi,0 (2.55) 

ri 

para 1 i n − 1. Como este esquema de diferenças finitas foi obtido através de diferenças centradas, 

ele deve ser de segunda ordem. No entanto, devemos ter cuidado ao discretizar a equação de Poisson na 

origem para preservar esta ordem de convergência. Para isso, multiplicamos a equação de Poisson por r e 

integramos o resultado sobre um pequeno disco Dε centrado na origem de raio ε: 

2π ε 2π ε 

1 

fr drdθ = r 

r (rur) r + 1 

 

uθθ drdθ 

r2 onde assumimos u ∈ C 2 (Ω) de modo que 

0 

0 

= 

= 

0 0 

2π ε 

+ 1 

r 2 i 

+ 1 

r 2 i 

(rur) r drdθ + 

ε 

1 

r 

2π 

0 0 

0 0 

2π 

[rur] 

0 

ε 

ε 

1 2π 

0 dθ + [uθ] 0 

0 r drdθ 

2π 

= ε 

0 

ur (ε, θ) dθ, 

uθ (r, 0) = uθ (r, 2π) 

para todo 0 r < R. Escolhendo ε = ∆r/2, discretizamos a equação integral 

∆r 

2 

2π 

0 

ur (∆r/2, θ) dθ = 

2π ∆r/2 

0 

0 

fr drdθ 

uθθ drdθ 

aproximando a derivada primeira ur (∆r/2, θ) = (ur) i+1/2,j por diferenças centradas e f por f (0) (pois ∆r 

é suposto pequeno), de modo que 

e assim 

2π ∆r/2 

0 

ur (∆r/2, θj) ≈ u1,j − u0,j 

, 

∆r 

0 

fr drdθ ≈ f (0) 

∆r 

2 

m−1 

j=0 

2π ∆r/2 

0 

0 

r drdθ = 2πf (0) r2 

2 

u1,j − u0,j 

∆θ = 

∆r 

π 

4 f (0) ∆r2 , 

 

 

 

 

∆r/2 

0 

= π 

4 f (0) ∆r2 , 

donde, como u0 := u0,j independe de j, segue que o valor de u na origem será dado por 

m ∆θ 

2 u0 = ∆θ 

m−1 

u1,j − 

2 

π 

4 f (0) ∆r2 , 

ou, usando m∆θ = 2π, 

j=0 

4u0 2∆θ 

− 

∆r2 π∆r2 m−1 

u1,j = f0. (2.56) 

j=0


Para escrever essas diferenças finitas em forma matricial 

Au = f, 

escolhemos ordenar os pontos da malha discretizada no retângulo polar {(ri, θj) : 1 i n − 1, 0 j m} 

pela ordem lexicográfica em (θ, r) e colocando a origem antes de todos estes pontos:. 

u = (u0, u1,0, u1,1, . . . , u1,m−1, u2,0, u2,1, . . . , u2,m−1, . . . . . . , un−1,0, un−1,1, . . . , un−1,m−1) . (2.57) 

Observe que existem (n − 1) × m + 1 incógnitas. Nesta ordenação, segue que A tem a forma em blocos 



⎡ 

α0 b 

⎢ 

a B1 −β1I 

⎢ 

. 

⎢ −α2I B2 −β2I .. 

A = ⎢ 

−α3I B3 −β3I 

⎢ 

. .. . .. 

⎢ 

⎣ 

⎡ 

⎢ 

Bi = ⎢ 

⎣ 

αi = 1 

∆r 2 

βi = 1 

∆r 2 

α0 = 4 

, 

∆r2 ⎡ ⎤ 

−α1 

⎢ 

a = ⎣ . 

⎥ 

. ⎦ 

−α1 

. .. 

−αn−2I Bn−2 −βn−2I 

−αn−1I Bn−1 

m×1 

ri−1/2 , i = 1, . . . , n − 1, 

ri 

ri+1/2 , i = 1, . . . , n − 2, 

ri 

b = −β0 . . . −β0 

β0 = 2 ∆θ 

, 

π ∆r2 I = Im, 

, 

 

1×m , 

γi −δi 0 −δi 

−δi γi −δi 


. .. . .. 

. .. 


−δi −δi γi 

γi = 1 

ri 

δi = 1 

r 2 i 

r i+1/2 + r i−1/2 

1 

. 

∆θ2 ∆r 2 

+ 2 

r 2 i 

1 

, 

∆θ2 ⎤ 

⎥ 

⎦ 

m×m 

, 

⎤ 

⎥ , (2.58) 

⎥ 

⎦


A matriz A em geral não é simétrica. Por exemplo, no caso n = 4 e m = 5 ((n − 1) × m + 1 = 16) temos 

⎡ 

α 

⎢ −α1 ⎢ −α1 ⎢ −α1 ⎢ −α1 ⎢ −α1 ⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎢ 0 

⎣ 0 

−β0 

γ1 

−δ1 

0 

0 

−δ1 

−α2 

0 

0 

0 

0 

0 

0 

0 

0 

−β0 

−δ1 

γ1 

−δ1 

0 

0 

0 

−α2 

0 

0 

0 

0 

0 

0 

0 

−β0 

0 

−δ1 

γ1 

−δ1 

0 

0 

0 

−α2 

0 

0 

0 

0 

0 

0 

−β0 

0 

0 

−δ1 

γ1 

−δ1 

0 

0 

0 

−α2 

0 

0 

0 

0 

0 

−β0 

−δ1 

0 

0 

−δ1 

γ1 

0 

0 

0 

0 

−α2 

0 

0 

0 

0 

0 

−β1 

0 

0 

0 

0 

γ2 

−δ2 

0 

0 

−δ2 

−α3 

0 

0 

0 

0 

0 

−β1 

0 

0 

0 

−δ2 

γ2 

−δ2 

0 

0 

0 

−α3 

0 

0 

0 

0 

0 

−β1 

0 

0 

0 

−δ2 

γ2 

−δ2 

0 

0 

0 

−α3 

0 

0 

0 

0 

0 

−β1 

0 

0 

0 

−δ2 

γ2 

−δ2 

0 

0 

0 

−α3 

0 

0 

0 

0 

0 

−β1 

−δ2 

0 

0 

−δ2 

γ2 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−β2 

0 

0 

0 

0 

γ3 

−δ3 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−β2 

0 

0 

0 

−δ3 

γ3 

−δ3 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−β2 

0 

0 

0 

−δ3 

γ3 

−δ3 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−β2 

0 

0 

0 

−δ3 

γ3 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

−β2 

−δ3 

0 

0 

−δ3 

⎤ 

⎥ 

⎦ 

0 0 0 0 0 0 0 0 0 0 −α3 −δ3 0 0 −δ3 γ3 

A primeira linha e a primeira coluna são diferentes porque os pontos (0, j), j = 0, . . . , m, são realmente um 

único ponto e este ponto é vizinho a todos os pontos (1, j), j = 0, . . . , m. 

A matriz de discretização A no caso do anel será um pouco mais simples, já que ela será igual à matriz 

de discretização no caso do disco menos a primeira linha e a primeira coluna. 

2.5 Domínios Arbitrários 

Queremos agora discutir a resolução numérica da equação de Poisson através de diferenças finitas em um 

domínio arbitrário. 

Seja Ω ⊂ R 2 um domínio arbitrário. Se sobrepusermos uma malha uniforme 

M = {(i∆x, j∆y) ∈ Ω : i ∈ Z e j ∈ Z} 

sobre Ω, obtemos um domínio discretizado definido por 

Ωd = {(x, y) ∈ Ω : x/∆x ∈ Z e y/∆y ∈ Z} . (2.59) 

Esta é exatamente a maneira como discretizamos o retângulo. No entanto, o conjunto discretizado dos 

pontos de fronteira ∂Ωd de um domínio arbitrário deve ser tratado de maneira diferente do retângulo, já que 

a malha uniforme M em geral não vai se sobrepor à fronteira de Ω, podendo não possuir nenhum ponto em 

comum com a fronteira ou um número muito pequeno de pontos em poucas regiões da fronteira. 

Uma maneira de tratar este problema é a seguinte. Para determinar se o ponto (xi, yj) ∈ Ωd é adjacente 

à “fronteira esquerda” de Ω, por exemplo, e ao mesmo tempo encontrar o seu vizinho à esquerda na fronteira 

se for o caso, basta verificar se o segmento 

[xi − ∆x, yj] = {(xi − t∆x, yj) : t ∈ [0, 1]} 

está inteiramente contido em Ω ou não. Se não estiver, então (xi, yj) é um ponto interior adjacente à fronteira 

e existe um número tW ∈ (0, 1) tal que 

(xi − tW ∆x, yj) ∈ ∂Ω e (xi − t∆x, yj) ∈ Ω para todo t ∈ [0, tW ). (2.60) 

Este será o vizinho à esquerda de (xi, yj) na fronteira discretizada ∂Ωd do domínio. Analogamente, os 

pontos vizinhos na fronteira discretizada à direita, abaixo e acima de pontos adjacentes à fronteira podem 

ser encontrados; eles satisfazem, respectivamente, 

(xi + tE∆x, yj) ∈ ∂Ω e (xi + t∆x, yj) ∈ Ω para todo t ∈ [0, tE). (2.61)


(xi, yj − tS∆y) ∈ ∂Ω e (xi, yj − t∆y) ∈ Ω para todo t ∈ [0, tS). (2.62) 

(xi, yj + tN∆y) ∈ ∂Ω e (xi, yj + t∆y) ∈ Ω para todo t ∈ [0, tN ). (2.63) 

(os subíndices W, E, S, N correspondem aos quatro pontos cardeais oeste, leste, sul, norte em inglês). Definimos 

∂Ωd = {(x, y) ∈ ∂Ω : (x, y) satisfaz (2.60), (2.61), (2.62) ou (2.63)} (2.64) 

Dependendo da geometria de Ω é concebível que um ponto seja simultaneamente adjacente às “quatro 

fronteiras” de Ω, isto é, que ele tenha os seus quatro vizinhos em ∂Ωd. Além disso, embora os pontos 

interiores da malha estejam distribuídos uniformemente, esta discretização da fronteira do domínio permite 

que às vezes dois pontos da malha da fronteira estejam bem próximos um do outro em alguma região da 

fronteira e relativamente distantes em outras (isso ocorre mesmo em domínio regulares como um disco). 

Para discretizar a equação de Poisson nesta malha, observe que pela fórmula de Taylor temos, para pontos 

x− < x < x+, 


De fato, 

u ′′ (x) = 

2 

x+ − x− 

 

u (x+) − u (x) 

− 

x+ − x 

 

u (x) − u (x−) 

+ r, (2.65) 

x − x− 

|r| 1 (x+ − x) 

3 

2 + (x − x−) 2 

1 

uC3 ([x−,x+]) 

x+ − x− 

3 max (x+ − x, x − x−) uC3 ([x−,x+]) . (2.66) 

u(x−) = u(x) − u ′ (x) (x − x−) + 1 

2 u′′ (x) (x − x−) 2 − 1 

3! u′′′ (ξ−) (x − x−) 3 , 

u(x+) = u(x) + u ′ (x) (x+ − x) + 1 

2 u′′ (x) (x+ − x) 2 + 1 

3! u′′′ (ξ+) (x+ − x) 3 , 

para alguns ξ− ∈ [x−, x] , ξ+ ∈ [x, x+], de modo que 

u (x) − u (x−) 

− 

x − x− 

u (x+) − u (x) 

x+ − x 

donde, somando as duas expressões, 

u (x+) − u (x) 

x+ − x 

− 

Assim, podemos aproximar 

u (x) − u (x−) 

x − x− 

u ′′ (x) ≈ 

= −u ′ (x) + 1 

2 u′′ (x) (x − x−) − 1 

6 u′′′ (ξ−) (x − x−) 2 , 

= u ′ (x) + 1 

2 u′′ (x) (x+ − x) + 1 

6 u′′′ (ξ+) (x+ − x) 2 , 

= 1 

2 u′′ (x) (x+ − x−) + 1 

 

u 

6 

′′′ (ξ+) (x+ − x) 2 − u ′′′ (ξ−) (x − x−) 2 

. 

2 

x+ − x− 

 

u (x+) − u (x) 

− 

x+ − x 

 

u (x) − u (x−) 

x − x− 

Se x− = x − ∆x e x+ = x + ∆x, obtemos a fórmula de diferenças centradas usual para a derivada segunda. 

Para aproximar o laplaciano através de uma fórmula de cinco pontos, usamos os quatro pontos vizinhos 

(xi − tW ∆x, yj) , (xi + tE∆x, yj) , (xi, yj − tS∆y) , (xi, yj + tN ∆y) , com t∗ ∈ (0, 1]


definindo o esquema de diferenças finitas de Shortley-Weller: 

 

2 

u (xi + tE∆x, yj) − u (xi, yj) 

∆dud = 

− 

(xi + tE∆x) − (xi − tW ∆x) (xi + tE∆x) − xi 

u (xi, 

 

yj) − u (xi − tW ∆x, yj) 

xi − (xi − tW ∆x) 

 

2 

u (xi, yj + tN ∆y) − u (xi, yj) 

+ 

− 

(yj + tN ∆y) − (yj − tS∆y) (yj + tN∆y) − yj 

u (xi, 

 

yj) − u (xi, yj − tS∆y) 

yj − (yj − tS∆y) 

 

2 ui+tE∆x,j − ui,j 

= 

− 

(tE + tW ) ∆x tE∆x 

ui,j 

 

− ui−tW ∆x,j 

tW ∆x 

 

2 ui,j+tN ∆y − ui,j 

+ 

− 

(tN + tS) ∆y tN∆y 

ui,j 

 

− ui,j−tS∆y 

tS∆y 

ou 

−∆dud = 2 

∆x2 

1 

− 

+ 2 

∆y2 

1 

− 

tS (tN + tS) ui,j−tS∆y + 1 

tE (tE + tW ) ui+tE∆x,j + 1 

1 

ui,j − 

tEtW tW (tE + tW ) ui−tW ∆x,j 

ui,j − 

tNtS 

1 

tN (tN + tS) ui,j+tN ∆y 

 

. 

 

(2.67) 

Se (xi, yj) é um ponto interior distante da fronteira (isto é, não adjacente à fronteira), então t∗ = 1 e para 

este ponto vale a fórmula dos cinco pontos usual. 

Embora a ordem de aproximação do laplaciano para pontos próximos à fronteira é apenas 1, o esquema de 

Shortley-Weller é convergente de segunda ordem, conforme veremos no próximo capítulo, onde provaremos 

também que o correspondente problema discretizado possui solução única. 

2.6 Exercícios 

1. Implemente os métodos discutidos neste capítulo computacionalmente, verifique a precisão comparando 

com a solução exata e também a velocidade de convergência. 

2. Discretize o problema de Poisson com valor de fronteira de Dirichlet a seguir, usando a fórmula de 

cinco pontos. −∆u = f (x, y) em (0, a) × (0, b) , 

u = g (x, y) sobre ∂ ((0, a) × (0, b)) , 

Implemente alguns exemplos deste problema computacionalmente e compare os resultados obtidos com 

as soluções exatas. 

3. Prove que a fórmula dos nove pontos compacta satisfaz o princípio do máximo discreto. 

4. Prove resultados equivalentes ao Lema 2.5 e ao Teorema 2.6 para a fórmula dos nove pontos compacta. 

5. Investigue a ordem de convergência do esquema de diferenças finitas misto: fórmula dos nove pontos nos 

pontos interiores distantes da fronteira e fórmula dos cinco pontos para pontos adjacentes à fronteira. 

6. Encontre um esquema de diferenças finitas de segunda ordem para a equação de laplace tridimensional 

em um paralelepípedo reto. Escolha uma ordenação apropriada dos pontos da malha e descreva a 

matriz de discretização obtida. Implemente o método no computador. 

7. Mostre que o esquema de diferenças finitas em coordenadas polares introduzido neste capítulo satisfaz 

o princípio do máximo discreto desde que o valor de u0 seja dado pela fórmula (2.56).


8. Mostre que se ∆d denota o esquema de diferenças finitas em coordenadas polares introduzido neste 

capítulo e Ω é o disco unitário, então vale a estimativa a priori: se ud é uma solução de 

 

−∆dud = fd em Ωd, 

ud = 0 sobre ∂Ωd, 

então 

ud ∞ 1 

4 ∆dud ∞ 

(2.68) 

desde que o valor de u0 seja dado pela fórmula (2.56). Conclua que este esquema tem ordem de 

convergência 2. 

9. Encontre os autovalores da matriz de discretização do esquema de diferenças finitas em coordenadas 

polares e compare com os autovalores de Dirichlet do laplaciano no disco. 

10. Discretize o problema de Poisson com valor de fronteira de Dirichlet para o anel: 

⎧ 

⎨ 

⎩ 

−∆u = f (r, θ) se R1 < r < R2 e 0 < θ < 2π, 

u (R1, θ) = g1 (θ) 

u (R2, θ) = g2 (θ) se 0 θ 2π. 

Implemente alguns exemplos deste problema computacionalmente e compare os resultados obtidos com 

as soluções exatas. 

11. Mostre que tomando o “quadrado” da fórmula de três pontos para o laplaciano unidimensional (esquema 

de diferenças centradas para a derivada segunda) obtemos a seguinte fórmula de cinco pontos 

para o operador biharmônico unidimensional (esquema de diferenças centradas para a derivada quarta): 

δ 4 ui = ui−2 − 4ui−1 + 6ui − 4ui+1 + ui+2 

∆x 4 

Usando a fórmula de Taylor, obtenha o expoente p tal que 

δ 4 ui = u (4) (xi) + O (∆x p ) . 

(2.69) 

12. O esquema de diferenças finitas mais simples para o operador biharmônico ∆2 em duas dimensões é a 

seguinte fórmula de 13 pontos (para o caso ∆x = ∆y): 

∆ 2 u = 1 

∆x4 ⎡ 

⎢ 1 

⎣ 

2 

−8 

2 

1 

−8 

20 

−8 

1 

2 

−8 

2 

1 

⎤ 

⎥ . 

⎦ 

(2.70) 

Mostre que esta fórmula pode ser obtida a partir do “quadrado” da fórmula de cinco pontos para 

o laplaciano. Como a equação biharmônica não satisfaz o princípio do máximo, a demonstração da 

ordem de convergência deste esquema necessita de argumentos diferentes dos usados neste capítulo 

para o laplaciano. Na realidade, dependendo de como as duas condições de fronteira são discretizadas, 

a ordem de convergência deste método pode ser O ∆x 3/2 ou O ∆x 2 . Veja [Hackbusch], pág. 103 e 

págs. 105-109, para detalhes e referências.

Capítulo 3 

Existência e Unicidade de Soluções 

Discretas 

Determinar a existência e unicidade de soluções discretas para as matrizes de discretização obtidas via 

esquemas de diferenças finitas através do cálculo de seus autovalores como fizemos no capítulo anterior para 

diferenças centradas em uma dimensão e para a fórmula de cinco pontos é inviável em geral (tente calcular 

os autovalores da matriz de discretização para a fórmula dos nove pontos, para o esquema em coordenadas 

polares e para o esquema de Shortley-Weller). Neste capítulo, desenvolveremos métodos mais gerais e mais 

fáceis de aplicar. 

3.1 Normas Matriciais 

Uma norma matricial no espaço vetorial Mn (C) das matrizes complexas n × n é uma norma vetorial que 

satisfaz a propriedade submultiplicativa 

AB A B (3.1) 

para todas as matrizes A, B ∈ Mn (C). Algumas das normas mais importantes em Mn (C) são as seguintes: 

1. Norma l1 

De fato, 

AB 1 = 

2. Norma l2 

Com efeito, 

AB 2 

2 = 

n 

 

n 

 

 

i,j=1 

n 

 

n 

 

 

i,j=1 

k=1 

k=1 

aikbkj 

aikbkj 

 

 

 

 

 

2 

 

 

 

 

 

 

n 

i,j,k=1 

n 

 

n 

i,j=1 

A 1 = 

|aikbkj| 

⎛ 

A2 = ⎝ 

k=1 

|aik| 2 

n 

|aij| . (3.2) 

i,j=1 

n 

i,j,k,l=1 

n 

i,j=1 

n 

69 

l=1 

|aij| 2 

|blj| 2 

|aikblj| = 

⎞ 

⎠ 

 

1/2 

= ⎝ 

n 

i,j=1 

|aik| 

n 

|blj| = A1 B1 . 

k,l=1 

. (3.3) 

⎛ 

n 

i,k=1 

|aik| 2 

⎞ ⎛ 

⎠ ⎝ 

n 

j,l=1 

|blj| 2 

⎞ 

⎠ = A 2 

2 B2 

2 .


A norma l2 também é chamada norma euclidiana e, mais raramente e somente para matrizes, norma 

de Schur, norma de Frobenius ou norma de Hilbert-Schmidt. 

3. Norma l∞ modificada 

A norma l∞ 

A ∞ = max 

1i,jn |aij| . 

é uma norma vetorial no espaço das matrizes complexas, mas não é uma norma matricial, pois se 

então 

A = 

A 2 = 

1 1 

1 1 

2 2 

2 2 

e portanto A 2 ∞ = 2 > 1 = A ∞ A ∞ . 

Mas um múltiplo escalar desta norma vetorial é uma norma matricial: 

Com efeito, 

4. Norma induzida 

AB n∞ = n max 

 

n 

 

 

 

aikbkj 

1i,jn 1i,jn 

k=1 

k=1 

= n A∞ n B∞ = ABn∞ . 

 

, 

 

A n∞ = n max 

1i,jn |aij| . (3.4) 

 

 

 

n max 

n 

|aikbkj| n max 

n 

A 

1i,jn 

∞ B∞ k=1 

Dada uma norma vetorial |·| em C n , ela induz uma norma matricial através da definição 

De fato, 

AB = max 

x=0 

|ABx| 

|x| 

= max 

x=0 

|ABx| 

|Bx| 

A = max |Ax| = max 

|x|=1 x=0 

|Ax| 

. (3.5) 

|x| 

 

|Bx| |ABx| 

max 

|x| x=0 |Bx| max 

|Bx| |Ay| 

max 

x=0 |x| y=0 |y| max 

|Bx| 

= A B . 

x=0 |x| 

Esta norma também é chamada norma do operador. Ela satisfaz a propriedade muitas vezes útil 

para todo vetor x ∈ C n . 

5. Norma do máximo das somas das linhas 

|Ax| A |x| (3.6) 

A L = max 

1in 

j=1 

n 

|aij| . (3.7) 

Esta norma é induzida pela norma vetorial l∞. De fato, se x = (x1, . . . , xn), temos 

 

 

n 

 

 

n 

n 

|Ax| ∞ = max aijxj 

1in max |aijxj| max 

1in 

1in 

j=1 

j=1 

j=1 

|aij| |x| ∞ = A L |x| ∞ ,



max 

|x|=1 |Ax| ∞ AL . 

Supondo que a k-ésima linha de A é não-nula, definimos o vetor y = (y1, . . . , yn) ∈ Cn por 

⎧ 

⎨ 

yi = 

⎩ 

akj 

|akj| 

1 

se aij = 0, 

se aij = 0. 

, 

o que implica |y| ∞ = 1, akjyj = |akj| e 

max 

|x| ∞ =1 |Ax| ∞ |Ay| 

 

n 

∞ = max 

1in 

 

Isso vale para todo k, logo 

j=1 

max 

|x| ∞ =1 |Ax| ∞ max 

1kn 

6. Norma do máximo das somas das colunas 

A C = max 

aijyj 

 

 

 

 

 

 

 

 

n 

 

 

 

j=1 

akjyj 

n 

|aij| = AL . 

j=1 

1jn 

i=1 

 

 

 

 

 

= 

n 

|akj| . 

j=1 

n 

|aij| . (3.8) 

Esta norma é induzida pela norma vetorial l1. De fato, escrevendo A em termos de suas colunas 

segue que 

Se x = (x1, . . . , xn), segue que 


|Ax| 1 = |x1A1 + . . . + xnAn| 1 

= A C 

A = [A1 . . . An] 

A C = max 

1jn |Aj| 1 . 

n 

|xiAi| 1 = 

i=1 

n 

|xi| = AC |x| 1 , 

i=1 

Agora, se escolhermos y = ej, temos que |y| 1 = 1 e 

para todo k, logo 

7. p-normas 

n 

|xi| |Ai| 1 

i=1 

max 

|x| 1 =1 |Ax| 1 AC . 

|Ay| 1 = |Aj| 1 

max 

|x| 1 =1 |Ax| 1 |Ay| 1 = max 

1jn |Aj| 1 = AC . 

n 

i=1 

|xi| max 

1jn |Aj| 1 

Este é o nome geral para as normas induzidas pela norma vetorial lp. O caso especial da norma induzida 

pela norma vetorial l2 (a norma vetorial euclidiana) é também chamada a norma espectral e satisfaz 

|A|2 = √ 

∗ 

λmax = max λ : λ é um autovalor de A A .


De fato, A ∗ A é uma matriz hermitiana e possui autovalores não-negativos, pois se A ∗ Ay = λy, então 

λ |y| 2 

2 = 〈y, λy〉 2 = 〈y, A∗Ay〉 2 = 〈Ay, Ay〉 2 = |Ay| 2 

2 

e, além disso, pela caracterização variacional dos autovalores de uma matriz hermitiana temos 

λmax = max 

x=0 

〈A ∗ Ax, x〉 2 

|x| 2 

2 

= max 

x=0 

|Ax| 2 

2 

|x| 2 

2 

Observe que a 2-norma é diferente da norma matricial l2. Note também que se A é uma matriz 

hermitiana, então A ∗ A = A 2 e |A| 2 é portanto o módulo do maior autovalor de A, isto é, a norma 

espectral de A é o raio espectral de A, definido como sendo o maior valor absoluto dos autovalores 

de A: 

ρ (A) = max 

i=1,...,n |λi| , 

8. Norma induzida por uma matriz invertível 

Se · é uma norma matricial qualquer e se S é uma matriz invertível, então 

define uma norma matricial. Com efeito, 

. 

A S = S −1 AS (3.9) 

AB S = S −1 ABS = S −1 ASS −1 BS S −1 AS S −1 BS = A S B S . 

Lembramos que todas as normas em um espaço vetorial são equivalentes, e isso vale em particular para 

normas matriciais. 

3.2 Matrizes Diagonalmente Dominantes 

Definição. Dizemos que uma matriz An×n é diagonalmente dominante se 

|aii| 

n 

|aij| para todo i = 1, . . . , n 

j=1 

j=i 

e estritamente diagonalmente dominante se 

|aii| > 

n 

|aij| para todo i = 1, . . . , n. 

j=1 

j=i 

3.1 Proposição. Se A é uma matriz estritamente diagonalmente dominante, então A é invertível. 

Prova. Uma matriz A é invertível se existe alguma norma matricial · tal que I − A < 1. De fato, se 

esta condição é satisfeita, então a inversa é dada explicitamente pela série 

A −1 = 

∞ 

(I − A) k . (3.10) 

k=0 

A condição I − A < 1 garante a convergência desta série, pois a série geométrica ∞ 

k=0 rk tem raio de 

convergência 1; como para todo N temos 

N 

A (I − A) k N 

= [I − (I − A)] (I − A) k N 

= (I − A) k N+1 

− (I − A) k = I − (I − A) N+1 , 

k=0 

k=0 

k=0 

k=1


tomando o limite quando N → ∞, concluímos (3.10). 

Para provar a proposição, denote por D a matriz diagonal cujas entradas diagonais são as entradas 

diagonais de A. Uma matriz estritamente diagonalmente dominante possui, por definição, entradas diagonais 

não-nulas, logo D é uma matriz invertível. A matriz D −1 A tem apenas 1’s na diagonal principal e se 

mostramos que D −1 A é invertível, isto implicará que A é invertível. Para provar isso, considere a matriz 

I − D −1 A. Temos 

−1 

I − D A 

ij = 

 

0 se i = j, 

se i = j. 

−aij/aii 

Usemos a norma do máximo das somas das linhas. Para cada 1 i n temos 

n 

 

I − D −1 A n 

 

aij 

 

n 

= 

1 

ij = |aij| < 1, 

|aii| 

j=1 

j=1 

j=i 

logo I − D −1 A < 1 e o resultado segue. 

Às vezes, exigir dominância diagonal estrita em todas as linhas é pedir demais. Para certas matrizes, 

dominância diagonal junto com dominância diagonal estrita em apenas uma linha é suficiente para garantir 

a sua invertibilidade. As matrizes de discretização obtidas no capítulo anterior satisfazem esta condição 

(nas linhas correspondentes à pontos adjacentes à fronteira), e nenhuma delas é estritamente diagonalmente 

dominante. Por outro lado, esta condição não é suficiente para estabelecer a invertibilidade de uma matriz 

em geral, como o exemplo ⎡ 

⎣ 

aii 

4 2 1 

0 1 1 

0 1 1 

demonstra. Precisamos de desenvolver várias idéias e ferramentas teóricas antes de provar a invertibilidade 

das matrizes de discretização do capítulo anterior. 

3.3 Teorema dos Discos de Gershgorin 

A primeira ferramenta teórica é o importante Teorema dos Discos de Gershgorin. Ele decorre da seguinte 

observação: se A é uma matriz complexa n × n, podemos sempre escrever A = D + B, onde D = diag 

(a11, . . . , ann) é a matriz diagonal formada pela diagonal principal de A e B consiste dos elementos restantes 

de A, possuindo uma diagonal principal nula. Se definirmos Aε = D + εB, então A0 = D e A1 = A. Os 

autovalores de D são a11, . . . , ann, enquanto que os autovalores de Aε devem estar localizados em vizinhanças 

dos pontos a11, . . . , ann, desde que ε seja suficientemente pequeno. O mesmo deve valer para os autovalores 

da matriz A: eles devem estar contidos em discos centrados nos elementos a11, . . . , ann da diagonal principal 

se os discos são suficientemente grandes. O Teorema de Gershgorin dá uma estimativa precisa e simples de 

calcular para os raios destes discos em função das entradas restantes da matriz A. Denote o disco complexo 

fechado de centro em a e raio R por 

⎤ 

⎦ 

j=1 

j=i 

DR (a) = {z ∈ C : |z − a| R} . 

3.2 Teorema. (Teorema dos Discos de Gershgorin) Se A ∈ Mn (C) e 

n 

Ri (A) = |aij| (3.11) 

denota a soma dos valores absolutos dos elementos da linha i de A excetuando o elemento da diagonal 

principal, então todos os autovalores de A estão contidos na união dos n discos de Gershgorin 

n 

G (A) = 

i=1 

j=1 

j=i 

D Ri(A) (aii) . (3.12)


Além disso, se uma união de k destes discos forma uma região que é disjunta dos n−k discos restantes, 

então existem exatamente k autovalores de A nesta região. 

Prova. Seja λ um autovalor de A e x = (x1, . . . , xn) = 0 um autovetor associado. Seja k um índice tal que 

|xk| |xj| para j = 1, . . . , n, 

isto é, xk é a coordenada de x de maior valor absoluto. Denotando por (Ax) k a k-ésima coordenada do vetor 

Ax = λx, temos 

n 

λxk = (Ax) k = 

que é equivalente a 

Daí, 

ou seja, 

|xk| |λ − akk| 

j=1 

j=k 

xk (λ − akk) = 

j=1 

j=k 

j=1 

n 

j=1 

j=k 

akjxj 

akjxj. 

n 

n 

n 

|akjxj| = |akj| |xj| |xk| |akj| = |xk| Rk (A) , 

|λ − akk| Rk (A) . 

Isso prova o resultado principal do Teorema de Gershgorin (como não sabemos qual k é apropriado para 

cada autovalor λ, e um mesmo k pode servir para vários autovalores λ, tudo o que podemos afirmar é que 

os autovalores estão na união dos discos). 

Para provar a segunda afirmação, escreva A = D + B, onde D = diag (a11, . . . , ann) e defina 

para 0 t 1. Note que 

At = D + tB 

j=1 

j=k 

Ri (At) = Ri (tB) = tRi (A) . 

Para simplificar a notação, assuma que a união dos primeiros k discos de Gershgorin 

satisfaz Gk (A) ∩ [G (A) \Gk (A)] = ∅. Temos 

logo 

e 

Gk (A) = 

k 

i=1 

D Ri(A) (aii) 

D Ri(At) (aii) = {z ∈ C : |z − aii| Ri (At)} = {z ∈ C : |z − aii| tRi (A)} ⊂ D Ri(A) (aii) , 

Gk (At) ⊂ Gk (A) 

Gk (A) ∩ [G (At) \Gk (At)] = ∅ 

para 0 t 1. Porque os autovalores são funções contínuas das entradas de uma matriz, o caminho 

λi (t) = λi (At) 

é um caminho contínuo que liga λi (A0) = λi (D) = aii a λi (A1) = λi (A). Como λi (At) ∈ Gk (At) ⊂ Gk (A), 

concluímos que para cada 0 t 1 existem k autovalores de At em Gk (A); em particular, fazendo t = 1,


obtemos que Gk (A) possui pelo menos k autovalores de A. Da mesma forma, não pode haver mais que 

k autovalores de A em Gk (A), pois os n − k autovalores restantes de A0 = D começam fora do conjunto 

Gk (A) e seguem caminhos contínuos que permanecem fora de Gk (A). 

A união G (A) dos discos de Gershgorin é conhecida como a região de Gershgorin. Observe que enquanto 

não podemos em geral afirmar com certeza que cada disco de Gershgorin possui um autovalor, a segunda 

afirmação do teorema permite-nos fazer tal conclusão desde que os discos de Gershgorin sejam dois a dois 

disjuntos. 

O Teorema dos Discos de Gershgorin permite entender o resultado da Proposição 3.1: se uma matriz A é 

estritamente diagonalmente dominante, então os discos de Gershgorin D Ri(A) (aii) não interceptam a origem, 

logo 0 não pode ser um autovalor para a matriz A, o que implica que A é invertível. Além disso, se todos 

os elementos da diagonal principal de A são reais e positivos, então os autovalores de A estão localizados no 

semiplano direito de C, de modo que se A é também simétrica, concluímos que todos os autovalores de A 

são positivos. 

A aplicação mais óbvia do Teorema dos Discos de Gershgorin é na estimativa dos autovalores de uma 

matriz, o que é importante se vamos usar os autovalores de matrizes de discretização para aproximar os 

autovalores do laplaciano: 

Aplicação 1. Pelo Teorema dos Discos de Gershgorin, os autovalores da matriz de discretização do laplaciano 

no intervalo (0, π) discretizado com n + 1 pontos (esquema de diferenças finitas centradas para 

a derivada segunda unidimensional) 

⎡ 

2 −1 

⎤ 

⎢ 

−1 2 −1 

⎥ 

A = n2 

π 2 

⎢ 

⎣ 

−1 

. .. 

. .. 

. .. 

. .. −1 

−1 2 −1 

−1 2 

estão todos localizados no intervalo (A é simétrica, logo seus autovalores são todos reais) centrado em 

x = 2n 2 /π 2 de raio 2n 2 /π 2 , ou seja, no intervalo 0, 4n 2 /π 2 . Em particular o maior autovalor de A 

não pode exceder 4n 2 /π 2 . Como os autovalores do laplaciano neste intervalo são da forma λj = j 2 , 

para termos esperança em aproximar o autovalor λj por autovalores da matriz A precisamos que 

j 2 4n 2 /π 2 , isto é, precisamos discretizar o intervalo (0, π) com 

n π 

2 j 

pontos. Isso dá uma estimativa bastante grosseira do quão refinada a nossa malha precisa ser para 

aproximar os autovalores do laplaciano. Na prática, vimos que apenas os primeiros autovalores de 

A aproximam bem os primeiros autovalores do laplaciano e portanto precisamos de uma malha com 

um número muito maior de pontos. Observe que uma estimativa semelhante vale para a matriz de 

discretização M fornecida pela fórmula de cinco pontos no quadrado (0, π) 2 quando tomamos ∆x = 

∆y = π/n: como os autovalores de M estão localizados no intervalo de centro em x = 4n 2 /π 2 de raio 

4n 2 /π 2 , isto é, em 0, 8n 2 /π 2 , precisamos de 

n π 

2 √ 

i2 + j2 2 

pontos no eixos horizontal e vertical para aproximar o autovalor i 2 + j 2 . Por outro lado, no caso 

bidimensional isso implica em uma matriz de discretização da ordem de i 2 + j 2 . 

Usos mais refinados do Teorema de Gershgorin permitem obter conhecimento mais preciso sobre onde 

os autovalores da matriz se encontram e correspondentemente melhores estimativas para o raio espectral 

⎥ 

⎦


de uma matriz. Por exemplo, como A e A t possuem os mesmos autovalores, existe um teorema dos discos 

de Gershgorin equivalente para as colunas de uma matriz. Em particular, todos os autovalores de A estão 

localizados na interseção destas duas regiões: G (A) ∩ G (A t ). Isso implica a seguinte estimativa simples para 

o raio espectral de uma matriz complexa: 

3.3 Corolário. Se A ∈ Mn (C), então 

⎛ 

ρ (A) min ⎝ max 

i=1,...,n 

j=1 

n 

|aij| , max 

n 

|aij| 

j=1,...,n 

i=1 

⎞ 

⎠ = min (A L , A C ) . 

Prova. O ponto no i-ésimo disco de Gershgorin que é mais distante da origem tem módulo 

n 

|aii| + Ri (A) = 

e um resultado semelhante vale para as colunas de A. 

O resultado do Corolário 3.3 não é surpreendente em vista do raio espectral de uma matriz ser menor que 

qualquer norma matricial (veja o próximo capítulo). Um resultado melhor pode ser obtido uma vez que 

se observa que A e S−1AS também possuem os mesmos autovalores, qualquer que seja a matriz invertível 

S. Em particular, quando S = D = diag (p1, . . . , pn) é uma matriz diagonal com todos os seus elementos 

positivos, isto é, pi > 0 para todo i, aplicando o Teorema de Gershgorin à matriz 

 

D −1 AD = 

e à sua transposta, obtemos o seguinte resultado que permite obter uma estimativa arbitrariamente boa dos 

autovalores de A: 

pj 

j=1 

aij 

pi 

3.4 Corolário. Se A ∈ Mn (C) e p1, . . . , pn > 0, então todos os autovalores de A estão contidos em 


G D −1 AD ∩ G DA t D −1 = 

ρ (A) min 

3.4 Propriedade FC 

p1,...,pn>0 

⎛ 

∩ 

⎝ max 

i=1,...,n 

n 

i=1 

n 

i=1 

1 

⎧ 

⎪⎨ 

|aij| 

z ∈ C : |z − aii| 

⎪⎩ 

1 

pi 

⎧ 

⎪⎨ 

⎪⎩ z ∈ C : |z − aii| pj 

n 

n 

n 

j=1 

j=i 

n 

i=1 

i=j 

pj |aij| 

1 

|aij| 

pi 

pj |aij| , max 

pi 

j=1,...,n 

j=1 

pj |aij| 

pi 

i=1 

1 

⎞ 

⎫ 

⎪⎬ 

⎪⎭ 

⎫ 

⎪⎬ 

⎪⎭ . 

(3.13) 

⎠ . (3.14) 

Na nossa busca por propriedades para matrizes diagonalmente dominantes que garantirão a sua invertibilidade, 

uma observação fundamental é a de que se A é uma matriz diagonalmente dominante, então 0 não 

pode ser um ponto interior de nenhum disco de Gershgorin. De fato, se λ é um autovalor de A interior a 

algum disco de Gershgorin então devemos ter desigualdade estrita 

n 

|λ − aii| < Ri (A) = |aij| 

j=1 

j=i


para algum i. Se 0 é um autovalor de A interior a algum disco de Gershgorin, então 

|aii| < 

n 

j=1 

j=i 

para algum i e A não pode ser diagonalmente dominante na linha i. 

Uma condição equivalente para que um autovalor λ de A não seja um ponto interior de nenhum disco de 

Gershgorin é que 

n 

|λ − aii| Ri (A) = |aij| para todo i = 1, . . . , n. 

j=1 

j=i 

Tais pontos λ na região de Gershgorin G (A) (não necessariamente autovalores de A) constituem precisamente 

a fronteira ∂G (A) da região de Gershgorin. Chamaremos a fronteira de um disco de Gershgorin 

{z ∈ C : |z − aii| = Ri (A)} um círculo de Gershgorin. 

3.5 Lema. Seja A ∈ Mn (C) e λ um autovalor de A que não é um ponto interior de nenhum disco de 

Gershgorin. Seja x = (x1, . . . , xn) = 0 um autovetor associado a λ e k um índice tal que 

Se i é qualquer índice tal que 

|aij| 

|xk| |xj| para j = 1, . . . , n. 

|xi| = |xk| 

então o i-ésimo círculo de Gershgorin passa por λ. Se, além disso, 

então 

aij = 0, 

|xj| = |xk| 

e o j-ésimo círculo de Gershgorin também passa por λ. 

Prova. Como na demonstração do Teorema de Gershgorin, temos 

|xi| |λ − aii| 

n 

n 

n 

|aijxj| = |aij| |xj| |xk| |aij| = |xk| Ri (A) (3.15) 

j=1 

j=k 

para todo índice i. Logo, se |xi| = |xk|, temos 

Como por hipótese 

para todo índice i, segue que 

j=1 

j=k 

|λ − aii| Ri (A) . 

|λ − aii| Ri (A) 

|λ − aii| = Ri (A) . 

Em geral, |xi| = |xk| implica que as desigualdades em (3.15) são identidades; em particular, 

n 

n 

|aij| |xj| = |xi| 

j=1 

j=k 

j=1 

j=k 

|aij| 

j=1 

j=k



n 

|aij| (|xi| − |xj|) = 0. 

j=1 

j=k 

Esta é uma soma de termos não-negativos, pois |xi| |xj|, logo se aij = 0 necessariamente devemos ter 

|xj| = |xi| = |xk|. 

Este lema técnico tem as seguintes conseqüências úteis: 

3.6 Teorema. Seja A ∈ Mn (C) uma matriz cujas entradas são todas não-nulas e seja λ um autovalor de 

A que não é um ponto interior de nenhum disco de Gershgorin. Então todo círculo de Gershgorin 

de A passa por λ (isto é, λ está na interseção de todos os círculos de Gershgorin de A) e se x = 

(x1, . . . , xn) = 0 é um autovetor associado a λ então 

Prova. Decorre diretamente do lema anterior. 

|xi| = |xj| para todos i, j = 1, . . . , n. 

3.7 Corolário. Se A ∈ Mn (C) é uma matriz cujas entradas são todas não-nulas e diagonalmente dominante 

tal que |aii| > n 

|aij| para pelo menos alguma linha i, então A é invertível. 

j=1 

j=i 

Prova. Pois, como A é diagonalmente dominante, se 0 é um autovalor de A então 0 não pode ser um ponto 

interior de nenhum disco de Gershgorin. Por outro lado, pelo teorema anterior, segue que todo círculo de 

Gershgorin passa por 0. Entretanto, o i-ésimo círculo de Gershgorin centrado em aii e com raio Ri < |aii| 

não pode passar por 0. Concluímos que 0 não é um autovalor de A, logo A é invertível. 

Na verdade, usando com maior cuidado a informação dada pelo Lema 3.5 podemos obter resultados ainda 

melhores: 

Definição. Dizemos que uma matriz A = (aij) ∈ Mn (C) satisfaz a propriedade FC se para todo par de 

inteiros distintos i, j existe uma seqüência de inteiros distintos i1 = i, i2, i3, . . . , im−1, im = j, com 

1 m n, tais que todas as entradas matriciais 

são não-nulas. 

ai1i2 , ai2i3 , . . . , aim−1im 

Por exemplo, a matriz diagonalmente dominante não-invertível 

⎡ 

4 

⎣ 0 

2 

1 

1 

1 

⎤ 

⎦ , 

0 1 1 

já vista anteriormente, não satisfaz a propriedade FC porque o par 2, 1 não admite tal seqüência (a única 

seqüência possível é a23, a31). Já qualquer par de inteiros distintos i, j tal que aij = 0 admite a seqüência 

trivial não-nula aij, de modo que uma matriz cujas entradas não-diagonais são todas não-nulas satisfaz a 

propriedade FC. O significado da abreviatura “FC”, ou “fortemente conexo”, ficará claro mais adiante. 

3.8 Teorema. Seja A ∈ Mn (C) uma matriz que satisfaz a propriedade FC e seja λ um autovalor de A que 

não é um ponto interior de nenhum disco de Gershgorin. Então todo círculo de Gershgorin de A passa 

por λ (isto é, λ está na interseção de todos os círculos de Gershgorin de A) e se x = (x1, . . . , xn) = 0 

é um autovetor associado a λ então 

|xi| = |xj| para todos i, j = 1, . . . , n.


Prova. Seja x = (x1, . . . , xn) = 0 um autovetor associado a λ e i um índice tal que 

Pelo Lema 3.5, 

|xi| |xk| para k = 1, . . . , n. 

|λ − aii| = Ri (A) . 

Seja j = i qualquer outro índice e i1 = i, i2, i3, . . . , im−1, im = j, com 1 m n, índices tais que todas as 

entradas matriciais 

aii2, ai2i3, . . . , aim−1j = 0. 

Como aii2 = 0, segue da segunda afirmativa do Lema 3.5 que |xi2| = |xi|. Mas então ai2i3 = 0 e portanto 

|xi3| = |xi2| = |xi|. Prosseguindo desta forma, concluímos que 

|xi| = |xi2| = . . . 

xim−1 

= |xj| . 

Em particular, segue novamente do Lema 3.5 que o j-ésimo círculo de Gershgorin passa por λ. Como j é 

arbitrário, isso prova o teorema. 

3.9 Corolário. Se A ∈ Mn (C) é uma matriz que satisfaz a propriedade FC e diagonalmente dominante tal 

que |aii| > n 

|aij| para pelo menos alguma linha i, então A é invertível. 

j=1 

j=i 

Prova. Segue do teorema anterior da mesma forma que o Corolário 3.7 segue do Teorema 3.6. 

Vamos tentar entender melhor o significado da propriedade FC. Note que ela se refere apenas à localização 

dos elementos não-nulos de A fora da diagonal principal – os elementos da diagonal principal e os valores 

específicos dos elementos fora da diagonal principal são irrelevantes. Isso motiva as seguintes definições: 

Definição. Dada uma matriz A = (aij) ∈ Mn (C) definimos o módulo da matriz A como sendo a matriz 

|A| = (|aij|) 

cujos elementos são os módulos dos elementos da matriz A e a matriz indicadora de A como sendo 

a matriz 

M (A) = (µij) , 


µij = 

1 se aij = 0, 

0 se aij = 0. 

O conceito de uma seqüência de entradas não-nulas da matriz A que aparece na definição da propriedade 

FC pode ser visualizado em termos de caminhos em um grafo associado a A: 

Definição. Dada uma matriz A ∈ Mn (C), o grafo direcionado de A é o grafo direcionado Γ (A) com n 

nodos P1, . . . , Pn tais que existe um arco direcionado em Γ (A) de Pi a Pj se e somente se aij = 0. 

Um caminho direcionado γ em um grafo Γ é uma seqüência de arcos Pi1Pi2, Pi2Pi3, . . . em Γ. O 

comprimento de um caminho direcionado é o número de arcos sucessivos no caminho direcionado. Um 

ciclo é um caminho direcionado que começa e termina no mesmo nó. 

Dizemos que um grafo direcionado é fortemente conexo se entre qualquer par de nodos distintos 

Pi, Pj ∈ Γ existir um caminho direcionado de comprimento finito que começa em Pi e termina em Pj. 

Observe que quando Γ é um grafo direcionado com n nodos, se existe um caminho direcionado entre dois 

nodos de Γ, então sempre existe um caminho direcionado entre estes dois nodos de comprimento menor que 

ou igual a n − 1.


3.10 Teorema. A ∈ Mn (C) satisfaz a propriedade FC se e somente se Γ (A) é fortemente conexo. 

Verificar a propriedade FC a partir do grafo direcionado de A pode ser impraticável se o tamanho da 

matriz for muito grande. Existe um método computacional mais explícito para fazê-lo: 

3.11 Teorema. Sejam A ∈ Mn (C) e Pi, Pj nodos de Γ (A). Existe um caminho direcionado de comprimento 

m em Γ (A) de Pi para Pj se e somente se 

ou, equivalentemente, se e somente se 

(|A| m ) ij = 0 

[M (A) m ] ij = 0. 

Prova. Provaremos o teorema por indução. Para m = 1 a afirmativa é trivial. Para m = 2, temos 


 

|A| 2 

ij 

 

|A| 2 

ij 

= 

n 

k=1 

(|A|) ik (|A|) kj = 

n 

k=1 

|aik| |akj| , 

= 0 se e somente se aik, akj são ambos não-nulos para algum índice k. Mas isso é 

equivalente a dizer que existe um caminho direcionado de comprimento 2 em Γ (A) de Pi para Pj. 

Em geral, supondo a afirmativa provada para m, temos 

 

|A| m+1 

ij 

= 

n 

k=1 

(|A| m ) ik (|A|) kj = 

n 

(|A| m ) ik 

|akj| = 0 

se e somente se (|A| m ) ik , akj são ambos não-nulos para algum índice k. Por hipótese de indução, isso é 

equivalente a existir um caminho direcionado de comprimento m em Γ (A) de Pi para Pk e um caminho 

direcionado de comprimento 1 em Γ (A) de Pk para Pj, isto é, um caminho direcionado de comprimento 

m + 1 em Γ (A) de Pi para Pj. O mesmo argumento vale para M (A). 

Definição. Seja A = (aij) ∈ Mn (C). Dizemos que A 0 se aij 0 para todos 1 i, j n e que A > 0 se 

aij > 0 para todos 1 i, j n. 

3.12 Corolário. Seja A ∈ Mn (C). Existe um caminho direcionado de comprimento m em Γ (A) de cada 

nodo Pi para cada nodo Pj se e somente se 


|A| m > 0 

M (A) m > 0. 

3.13 Corolário. Seja A ∈ Mn (C). A satisfaz a propriedade FC se e somente se 


k=1 

(I + |A|) n−1 > 0 

[I + M (A)] n−1 > 0. 

Prova. Temos 

(I + |A|) n−1 

n − 1 

= I + (n − 1) |A| + |A| 

2 

2 

n − 1 

+ . . . + |A| 

n − 3 

n−1 + |A| n−1 > 0


se e somente se para cada par de índices i, j com i = j pelo menos um dos termos |A| , |A| 2 , . . . , |A| n−1 

tem uma entrada positiva em (i, j). Pelo Teorema 3.11, isso ocorre se e somente se existe algum caminho 

direcionado em Γ (A) de Pi para Pj com comprimento n−1. Isto é equivalente a A satisfazer a propriedade 

FC. O mesmo argumento vale para M (A). 

Em geral, a maneira como uma matriz foi obtida (como as nossas matrizes de discretização; veja a última 

seção do capítulo) torna clara se elas são matrizes que satisfazem a propriedade FC ou não. Se isso 

não é possível, e pretende-se verificar a propriedade FC através do Corolário 3.13, é preferível calcular 

[I + M (A)] n−1 , já que M (A) é uma matriz composta apenas de 0’s e 1’s. 

3.5 Matrizes Irredutíveis 

Lembre-se que uma matriz de permutação P é uma matriz quadrada cujas entradas são todas 0 ou 1 e, 

além disso, em cada linha e em cada coluna de P existe exatamente um 1. Em particular, P é uma matriz 

ortogonal, de modo que P −1 = P t , isto é, a inversa de P também é uma matriz de permutação. Um caso 

especial de uma matriz de permutação é uma matriz de transposição, que é uma matriz de permutação T 

igual à matriz identidade exceto em duas posições, isto é, para algum par de índices fixado k, l temos 

⎧ 

⎨ δij se (i, j) = (k, l) , (l, k) , (k, k) ou (l, l) , 

Tij = 1 e (i, j) = (k, l) ou se (i, j) = (l, k) , 

⎩ 

0 se (i, j) = (k, k) ou se (i, j) = (l, l) . 

Matrizes de transposição são simétricas. O efeito de multiplicar uma matriz A por uma matriz de transposição 

à esquerda é trocar a posição de duas linhas da matriz A (no caso acima, as linhas k e l), enquanto que a 

multiplicação de A por uma matriz de transposição à direita muda a posição de duas colunas de A (no caso 

acima, as colunas k e l). 

T A = 

AT = 

⎡ 

⎢ 

⎣ 

⎡ 

⎢ 

⎣ 

1 0 0 0 

0 0 1 0 

0 1 0 0 

0 0 0 1 

⎤ ⎡ 

⎥ ⎢ 

⎥ ⎢ 

⎦ ⎣ 

a11 a12 a13 a14 

a21 a22 a23 a24 

a31 a32 a33 a34 

a41 a42 a43 a44 

a11 a12 a13 a14 

a21 a22 a23 a24 

a31 a32 a33 a34 

a41 a42 a43 a44 

⎤ ⎡ 

⎥ ⎢ 

⎥ ⎢ 

⎦ ⎣ 

1 0 0 0 

0 0 1 0 

0 1 0 0 

0 0 0 1 

⎤ 

⎡ 

⎥ 

⎦ = 

⎢ 

⎣ 

⎤ 

⎥ 

⎦ = 

⎡ 

⎢ 

⎣ 

a11 a12 a13 a14 

a31 a32 a33 a34 

a21 a22 a23 a24 

a41 a42 a43 a44 

a11 a13 a12 a14 

a21 a23 a22 a24 

a31 a33 a32 a34 

a41 a43 a42 a44 

Pode-se provar que toda matriz de permutação P é o produto de matrizes de transposição P = T1 . . . Tm; 

em particular, P t = Tm . . . T1. A matriz 

P t AP = Tm . . . T1AT1 . . . Tm 

é portanto obtida através da permutação de linhas e colunas de A, de modo que nenhum novo elemento é 

criado ou algum elemento existente de A destruído. 

Definição. Dizemos que uma matriz A ∈ Mn (C) é redutível se existe alguma matriz de permutação P e 

algum inteiro 1 m n − 1 tal que 

P t 

B 

AP = 

0 

C 

D 

 

onde B é uma matriz m × m, D é uma matriz (n − m) × (n − m), C é uma matriz m × (n − m) e 0 é 

a matriz nula (n − m) × m. Caso contrário, dizemos que A é irredutível. 

⎤ 

⎥ 

⎦ , 

⎤ 

⎥ 

⎦ .


Da definição vemos que se |A| > 0, então A é irredutível, e para que A seja redutível, ela precisa ter pelo 

menos n − 1 zeros (caso m = 1). A motivação para este nome é a seguinte. Suponha que queiramos resolver 

o sistema Ax = b e que A seja redutível. Então, se escrevermos 

A = P t AP = 

B C 

0 D 

teremos Ax = P AP t x = b ou AP t x = P t b; denotando x = P t x e b = P t b, resolver o sistema Ax = b é então 

equivalente a resolver o sistema 

Ax = b. 

Escrevendo 

x = 

y 

z 

 

b1 

, b = 

b2 

onde y, b1 ∈ C m e z, b2 ∈ C n−m , este sistema é por sua vez equivalente ao sistema 

By + Cz = b1 

Dz = b2 

Se resolvermos primeiro Dz = b2 e utilizarmos o valor de z encontrado na primeira equação resolvendo 

By = b1 − Cz, teremos reduzido o problema original a dois problemas menores, mais fáceis de resolver. 

3.14 Teorema. Uma matriz A ∈ Mn (C) é irredutível se e somente se 


(I + |A|) n−1 > 0 

 

, 

 

[I + M (A)] n−1 > 0. 

Prova. Para provar o resultado, mostraremos que A é redutível se e somente se (I + |A|) n−1 possui pelo 

menos uma entrada nula. 

Assuma primeiramente que A é redutível, de modo que para alguma matriz de permutação P tenhamos 

Observe que 

A = P 

B C 

0 D 

 

P t =: P AP t . 

|A| = P AP t = P A P t , 

já que o efeito de P é apenas trocar linhas e colunas. Além disso, note que 

A k 

k B 

= 

0 

Ck 

Dk 

para alguma matriz Ck. Logo, como 

(I + |A|) n−1 = I + P A t 

P n−1 n−1 = P I + A t 

P 

 

 

n − 1 

= P I + (n − 1) |A| + |A| 

2 

2 

n − 1 

+ . . . + |A| 

n − 3 

n−1 + |A| n−1 

 

P t 

e todos os termos dentro dos colchetes são matrizes que tem um bloco (n − m) × m nulo no canto esquerdo 

inferior, segue que (I + |A|) n−1 é redutível, logo possui entradas nulas e não pode ser positiva.


Reciprocamente, suponha que (I + |A|) n−1 possui pelo menos uma entrada nula. Como 

(I + |A|) n−1 = I + 

n−1 

m=1 

n − 1 

m 

 

|A| m , 

(I + |A|) n−1 

não possui entradas diagonais nulas, logo podemos assumir que para algum par i = j temos 

(I + |A|) n−1 

= 0, o que implica [|A| m ] ij = 0 para todo 1 m n − 1. Pelo Teorema 3.11 (e observação 

ij 

imediatamente posterior à definição de grafo direcionado), não existe um caminho direcionado em Γ (A) de 

comprimento finito entre Pi e Pj. Defina os conjuntos de nodos 

S1 := {Pk : Pk = Pj ou existe um caminho direcionado em Γ (A) entre Pk e Pj} , 

S2 = [ nodos de Γ (A)] \S1. 

Por definição destes conjuntos, não pode existir nenhum caminho de algum nodo de S2 para algum nodo de 

S1, logo [|A| m ] lk = 0 se Pl ∈ S2 e Pk ∈ S1. E ambos os conjuntos são não-vazios, pois Pj ∈ S1 e Pi ∈ S2. 

Renomeando os nodos de modo que 

 

S1 = P1, . . . , 

Pm , 

 

S2 = Pm+1, . . . , 

Pn , 

segue que existe uma matriz de permutação P tal que 

P t 

B C 

AP = 

0 D 

De fato, P é justamente a matriz de permutação que troca as colunas de tal forma que as variáveis anteriores 

correspondentes aos nodos P1, . . . , Pm no sistema Ax = b são as novas m primeiras variáveis do sistema linear 

Ax = b; como não existe nenhum caminho direcionado entre nenhum dos nodos Pm+1, . . . , Pn e qualquer um 

dos nodos P1, . . . , Pm, temos aij = 0 para m + 1 i n e 1 j m pelo Teorema 3.11. 

3.15 Corolário. Uma matriz A ∈ Mn (C) é irredutível se e somente se ela satisfaz a propriedade FC. 

3.16 Proposição. Se A é uma matriz irredutível, diagonalmente dominante tal que |aii| > n 

|aij| para 

pelo menos alguma linha i, então A é invertível. 

Além disso, se A é hermitiana e todos os elementos da diagonal principal de A são positivos, então 

todos os autovalores de A são positivos. 

Prova. O resultado segue do Teorema 3.14, do Corolário 3.9 e do Teorema dos Discos de Gershgorin (veja 

comentários após o Teorema 3.2). 

3.6 Invertibilidade de Matrizes de Discretização 

Os resultados obtidos nas seções anteriores fornecem uma demonstração alternativa de que as matrizes 

de discretização do capítulo anterior (tanto no caso unidimensional, quanto no caso bidimensional) são 

invertíveis, sem a necessidade de se calcular os seus autovalores. 

 

. 

j=1 

j=i


3.6.1 Esquemas de Diferenças Finitas para o Intervalo e para o Retângulo 

É fácil ver que todas as matrizes de discretização obtidas no capítulo anterior para o intervalo e para o 

retângulo (isto é, os esquemas unidimensionais de três pontos e cinco pontos, e os esquemas bidimensionais 

de cinco e nove pontos, compacto ou não-compacto) são matrizes diagonalmente dominantes com dominância 

diagonal estrita nas linhas correspondentes a pontos adjacentes à fronteira. Além disso, elas são matrizes 

irredutíveis porque elas satisfazem a propriedade FC. De fato, cada índice i da matriz corresponde a um 

ponto interior Pi da malha e aij = 0 sempre que Pi e Pj são pontos vizinhos naqueles esquemas. Então, 

dados dois pontos distintos Pi, Pj é fácil encontrar uma seqüência de índices i1 = i, i2, i3, . . . , im−1, im = j, 

com 1 m n, tais que todas as entradas matriciais 

ai1i2 , ai2i3 , . . . , aim−1im 

são não-nulas: no caso unidimensional, basta percorrer a malha diretamente de Pi até Pj (andando a partir 

de Pi sempre para a direita ou sempre para a esquerda, conforme o caso, até encontrar Pj), e no caso 

bidimensional basta usar qualquer caminho interior de Pi até Pj (pode-se usar a ordem lexicográfica para 

percorrer a malha, ou a ordem lexicográfica inversa, dependendo das posições relativas de Pi e Pj; no entanto, 

estes caminhos são mais longos que o necessário). Em outras palavras, identificando as malhas de pontos 

internos com os grafos direcionados da matriz de discretização, de modo que existe um arco direcionado entre 

dois pontos da malha se e somente se eles são vizinhos, os esquemas de discretização considerados garantem 

que estes grafos são fortemente conexos. 

As matrizes obtidas através de diferenças finitas em geral são irredutíveis, pois elas satisfazem a propriedade 

FC. É difícil imaginar um esquema de diferenças finitas para uma malha sobre um domínio conexo 

em que não houvesse um caminho direcionado entre pontos vizinhos (isto é, em que tivéssemos aij = 0 

para dois pontos vizinhos Pi e Pj). Outra maneira de pensar sobre isso é observar que se uma matriz de 

discretização fôsse (após permutação de linhas e colunas) da forma 

 

B C 

, 

0 D 

isso implicaria que um conjunto de pontos da malha (os correspondentes ao bloco D) teriam diferenças 

finitas independentes do conjunto dos pontos restantes da malha (os correspondentes ao bloco D); pior 

ainda, estes últimos poderiam ter diferenças finitas dependentes dos primeiros (já que o bloco C poderia 

ser não-nulo). Em última análise, seria possível reduzir o problema de resolver o sistema linear associado à 

discretização a dois problemas mais simples. 

É difícil imaginar um esquema de diferenças finitas com esta 

propriedade, embora talvez possa ocorrer em algum domínio com geometria altamente irregular em que a 

malha de pontos interiores se dividisse em essencialmente duas malhas independentes. Tal situação deve ser 

evitada com cuidado na hora de discretizar tais regiões. 

3.6.2 Esquema de Coordenadas Polares 

As mesmas observações anteriores valem para a matriz de discretização obtida através do esquema de coordenadas 

polares do capítulo anterior, isto é, ela satisfaz a propriedade FC. Para verificar que ela é diagonalmente 

dominante, note que para todas as linhas, exceto a primeira que deve ser tratada separadamente, temos 

|aii| = γi = 1 

ri 

r i+1/2 + r i−1/2 

∆r 2 

+ 2 

r 2 i 

1 

. 

∆θ2 Além disso, para todas as linhas, excetuando a primeira e as linhas correspondentes a pontos adjacentes à 

fronteira do disco temos 

n 

j=1 

j=i 

|aij| = αi + βi + 2δi = 1 

∆r2 ri−1/2 + 

ri 

1 

∆r2 ri+1/2 + 

ri 

2 

r2 i 

1 

∆θ 2 = |aii| .


Nestas linhas existe dominância diagonal, enquanto que nas linhas correspondentes a pontos adjacentes à 

fronteira do disco temos 

(n−1)×m+1 

j=1 

j=i 

|aij| = αi + 2δi < |aii| , 

isto é, temos dominância diagonal estrita. Finalmente, para a primeira linha também temos dominância 

diagonal, pois 

(n−1)×m+1 

j=1 

j=0 

|a00| = 4 

, 

∆r2 |a0j| = m 2 

π 

3.6.3 Esquema de Shortley-Weller 

∆θ m 

= 4 

∆r2 2π 

∆θ 4 

= 

∆r2 ∆r2 = |a00| . 

Se a geometria é razoavelmente regular, o esquema de Shortley-Weller para o problema de Dirichlet deve 

satisfazer a propriedade FC : aij = 0 sempre que Pi e Pj são pontos internos vizinhos, e se a geometria não é 

altamente irregular (por exemplo, se o domínio é “razoavelmente” convexo) existe um caminho direcionado de 

um ponto interno arbitrário a qualquer outro ponto interno da malha passando apenas por pontos internos do 

domínio. Caso contrário, a matriz de discretização obtida pode deixar de ser irredutível, mas isso deve ocorrer 

apenas devido à quebra da malha de pontos internos em várias submalhas desconexas, e cada submalha por 

si só deve ser fortemente conexa. Portanto, a matriz de discretização total deve ser uma matriz em blocos, 

cada bloco satisfazendo a propriedade FC, logo a matriz é invertível.

Capítulo 4 

Métodos Iterativos para a Resolução 

de Sistemas Lineares 

Neste capítulo investigaremos métodos iterativos para a resolução de sistemas lineares 

Ax = b. 

Embora a matriz A que temos em mente é em geral uma matriz grande e esparsa, do tipo que aparece 

em esquemas de diferenças finitas, os métodos considerados aqui requerem apenas que A seja uma matriz 

invertível com todas as entradas diagonais aii não-nulas. 

Métodos iterativos requerem um chute inicial x 0 , um vetor inicial que aproxima a solução exata x (se 

não há nenhuma informação disponível sobre a solução exata, de modo que não temos como construir o 

chute inicial de forma inteligente, x 0 pode ser uma aproximação muito ruim de x). Uma vez que x 0 é dado, 

o método iterativo gera a partir de x 0 uma nova aproximação x 1 , que esperamos deve aproximar melhor a 

solução exata. Em seguida, x 1 é usada para gerar uma nova melhor aproximação x 2 e assim por diante. 

Desta forma, gera-se uma seqüência de vetores x k que espera-se convergir para x. Como na prática não 

podemos iterar para sempre, algum critério de parada deve ser estabelecido a priori. Uma vez que x k esteja 

suficientemente próximo da solução exata quanto se precise, de acordo com uma margem de tolerância aceita, 

pára-se o processo de iteração e aceita-se x k como a solução aproximada adequada para o problema. Por 

exemplo, o critério de parada pode ser estabelecido através de uma cota de tolerância τ: quando 

 

b − Ax k < τ 

ou quando x k+1 − x k < τ 

as iterações são interrompidas e o último valor aproximado obtido é aceito como a melhor aproximação da 

solução dentro das circunstâncias. 

Os métodos discutidos neste capítulo não necessitam de um bom chute inicial (embora, é claro, quanto 

melhor o chute inicial, menor o número de iterações necessárias para se chegar à solução aproximada com a 

precisão especificada). 

4.1 Métodos Iterativos Lineares 

Nesta seção apresentamos alguns exemplos clássicos de métodos iterativos lineares. Na próxima seção daremos 

condições necessárias e suficientes para estabelecer a sua convergência. 

86


4.1.1 Método de Jacobi 

O primeiro método iterativo (que já foi descrito como o mais lento para convergir, embora isso realmente 

depende da matriz A do sistema) é o algoritmo de Jacobi. Escrevendo o sistema Ax = b na forma 

⎧ n 

⎪⎨ 

⎪⎩ 

a1jxj = b1 

j=1 

n 

. 

. 

anjxj = bn 

j=1 

se aii = 0 para todo i, cada xi pode ser isolado na i-ésima equação e escrito na forma 

xi = 1 

⎛ 

⎜ 

⎝bi ⎞ 

n ⎟ 

− aijxj ⎟ 

⎠ . 

aii 

Isso sugere definir um método iterativo da seguinte forma: suposto xk = xk 1, . . . , xk anterior, obtemos x 

 

n obtido no passo 

k+1 = x k+1 

1 , . . . , xk+1 

n por 

x k+1 

⎛ 

1 ⎜ 

i = ⎜ 

aii 

⎝bi n 

− aijx k ⎞ 

⎟ 

j ⎠ . (4.1) 

No caso da fórmula de cinco pontos para o problema de Poisson com ∆x = ∆y, como a equação para 

cada ponto (i, j) é dada por 

j=1 

j=i 

j=1 

j=i 

−ui,j−1 − ui,j+1 + 4ui,j − ui−1,j − ui+1,j = ∆x 2 fi,j 

o método de Jacobi é 

u k+1 1 k 

i,j = ui,j−1 + u 

4 

k i,j+1 + u k i−1,j + u k i+1,j + ∆x 2 

fi,j . (4.2) 

No caso especial da equação de Laplace (f = 0) com condição de fronteira de Dirichlet não-nula, o método 

de Jacobi é simplesmente a propriedade do valor médio discreta 

u k+1 

i,j 

, 

1 k 

= ui,j−1 + u 

4 

k i,j+1 + u k i−1,j + u k 

i+1,j . (4.3) 

Em outras palavras, calculados os valores de u em todos os pontos da malha na iteração anterior, o novo 

valor de u em um ponto interior da malha nesta iteração é calculado através da média dos seus quatro 

pontos vizinhos. Os valores iniciais de u nos pontos interiores da malha para a primeira iteração (isto é, o 

chute inicial) podem ser atribuidos arbitrariamente ou através de algum argumento razoável; por exemplo, 

podemos utilizar uma média ponderada dos valores de fronteira para o valor inicial em cada ponto interior 

da malha, de acordo com a posição do ponto em relação aos pontos das quatro fronteiras discretizadas. 

Em forma matricial, o algoritmo de Jacobi pode ser descrito da seguinte forma. Denotando por D = diag 

(a11, . . . , ann) a matriz diagonal cujas entradas são as entradas diagonais de A, temos que 

x k+1 = D −1 (D − A) x k + b 

(4.4) 

ou 

x k+1 = D −1 Cx k + b 

onde C = D − A é a matriz consistindo dos elementos restantes de A fora da diagonal principal. 

(4.5)


4.1.2 Método de Gauss-Seidel 

Um método iterativo que converge cerca de duas vezes mais rápido que o método de Jacobi (pelo menos em 

várias aplicações) é o método de Gauss-Seidel, onde os valores de x são atualizados dentro de cada iteração, 

sem esperar pela próxima. Em outras palavras, obtido o valor de x k+1 

l este é usado no lugar de xk l no cálculo 

seguinte. No sistema Ax = b em que aii = 0 para todo i, como antes isolamos cada xi na i-ésima equação 

mas desta vez escrevemos 

xi = 1 

⎛ 

⎞ 

i−1 

⎝bi − aijxj + 

n 

⎠ . 

Então definimos 

pois os valores x k+1 

1 

x k+1 

i 

aii 

⎛ 

1 

= 

aii 

j=1 

i−1 

⎝bi − 

j=1 

aijx k+1 

j 

j=i+1 

+ 

aijxj 

n 

j=i+1 

aijx k j 

⎞ 

⎠ (4.6) 

, . . . , x k+1 

i−1 já foram computados nesta iteração, enquanto que os valores xk i+1 , . . . , xk n são 

fornecidos pela iteração anterior. 

Por exemplo, no caso da equação de Laplace, poderíamos utilizar a fórmula 

u k+1 

i,j 

1 k+1 

= ui,j−1 4 

+ uki,j+1 + u k+1 

i−1,j + uk 

i+1,j 

assumindo que os pontos da malha são percorridos na ordem lexicográfica, de modo que quando vamos 

calcular o valor de u no ponto i, j na iteração k + 1, nesta mesma iteração já calculamos os valores de u em 

i − 1, j e em i, j − 1, e usamos estes valores para calcular u k+1 

i,j ao invés dos valores uk i,j−1 e uki−1,j obtidos 

na iteração anterior. 

Em forma matricial, o algoritmo de Jacobi pode ser descrito da seguinte forma. Dada uma matriz A, 

existe uma única decomposição 

A = D − L − U (4.8) 

onde D é uma matriz diagonal, L é uma matriz estritamente triangular inferior e U é uma matriz estritamente 

triangular superior; de fato, D = diag (a11, . . . , ann) é a parte diagonal de A, −L é a parte estritamente 

triangular inferior de A e −U é a parte estritamente triangular superior de A. Então o algoritmo de Jacobi 

pode ser definido por 

x k+1 = D −1 Lx k+1 + Ux k + b 

(4.9) 

ou 


(D − L) x k+1 = Ux k + b, 

(4.7) 

x k+1 = (D − L) −1 Ux k + b . (4.10) 

É importante ressaltar que existem matrizes para as quais o método de Jacobi converge e o método de 

Gauss-Seidel diverge, e vice-versa. Veja a próxima seção sobre a convergência dos métodos. 

4.1.3 Método SOR 

O processo de corrigir uma equação através da modificação de uma variável é às vezes chamado de relaxamento. 

Antes da correção, a equação não é verdadeira; como um conjunto de partes que não se ajustam, 

ela está em estado de tensão. A correção de uma variável relaxa a tensão. O método de Gauss-Seidel efetua 

relaxamento sucessivo, ou seja, passa de equação para equação, relaxando uma depois da outra. [Watkins] 

Por este motivo, os métodos de Jacobi e de Gauss-Seidel são também chamados métodos de relaxamento. 

Em muitos casos, a convergência pode ser substancialmente acelerada através de sobrerelaxamento. Isso 

significa que ao invés de fazer uma correção para a qual a equação é satisfeita exatamente, nós fazemos uma 

correção maior. No caso mais simples, escolhe-se um fator de relaxamento ω > 1 que sobrecorrige por aquele


fator em cada passo (se mover um passo na direção de xk para xk+1 é bom, mover naquela direção ω > 1 

passos é melhor). Este é o chamado método de sobrerelaxamento sucessivo (SOR, successive overrelaxation): 

usando o método de Gauss-Seidel obtemos 

⎛ 

⎞ 

daí tomamos 

Isso pode ser resumido em 

x k+1 

i 

x k+1 

i 

= xk i + ω 

1 

= 

aii 

⎡ 

i−1 

⎝bi − 

x k+1 

i 

⎣ 1 

aii 

j=1 

aijx k+1 

j 

= xk i + ω x k+1 

i 

⎛ 

i−1 

⎝bi − 

j=1 

aijx k+1 

j 

+ 

n 

j=i+1 

− xk 

i . 

− 

n 

j=i+1 

aijx k j 

aijx k j 

⎠ ; 

⎞ 

⎤ 

⎠ − x k⎦ i . (4.11) 

Quando ω = 1, o método SOR é exatamente o método de Gauss-Seidel. Um fator ω < 1 (subrelaxamento) 

normalmente diminui a velocidade de convergência. 

Para a maioria dos problemas, o melhor valor para o fator de relaxamento é desconhecido. Para a matriz 

de discretização obtida a partir da fórmula de cinco pontos, é sabido que o valor ótimo de ω é, como veremos 

na próxima seção, 

ω = 

2 

. (4.12) 

1 + sen (π∆x) 

Em forma matricial, o método SOR pode ser descrito da seguinte forma. Como antes, dada uma matriz 

A escrevemos 

A = D − L − U (4.13) 

onde D é uma matriz diagonal, L é uma matriz estritamente triangular inferior e U é uma matriz estritamente 

triangular superior. Então, escrevendo o algoritmo SOR na forma 

= aiix k ⎡ 

i−1 

i + ω ⎣bi − 

− 

⎤ 

n 

⎦ , 

temos 

aiix k+1 

i 

j=1 

aijx k+1 

j 

j=i 

aijx k j 

Dx k+1 = Dx k + ω Lx k+1 + (U − D) x k + b 

ou 

1 

D − L x 

ω k+1 

1 − ω 

= D + U x 

ω k + b, 


x k+1 = 

(4.14) 

−1 

1 

1 − ω 

D − L 

D + U x 

ω ω k 

+ b . (4.15) 

4.1.4 Comparação da Velocidade de Convergência dos Três Métodos 

A tabela a seguir foi extraída de [Watkins], págs. 533 e 542. Os métodos introduzidos acima foram usados 

para resolver o sistema linear Ax = b onde A é a matriz de discretização obtida a partir da fórmula dos 

cinco pontos do laplaciano no quadrado unitário Ω = (0, 1) 2 e b é estabelecido pela condição de fronteira de 

Dirichlet dada por 

⎧ 

⎪⎨ 

0 se x = 0, 

y se x = 1, 

g (x, y) = 

⎪⎩ 

(x − 1) sen x se y = 0, 

x (2 − x) se y = 1,


ou seja, para resolver o problema discretizado 

 

−∆dud = 0 em Ωd, 

sobre ∂Ωd. 

As iterações foram interrompidas quando 

ud = gd 

 

u k+1 − u k 2 

|u k+1 | 2 

< 10 −8 . 

O número de iterações necessárias para convergir de acordo com esta margem de tolerância, para três refinamentos 

possíveis da malha (correspondentes a matrizes de dimensões n = 81, 361 e 1521, respectivamente), 

de acordo com cada método e para diferentes valores de ω no caso do método SOR é apresentado na tabela 

abaixo. 

∆x = 0.1 ∆x = 0.05 ∆x = 0.025 

Jacobi 299 1090 3908 

SOR (ω = 0.8) 235 845 3018 

Gauss-Seidel 160 581 2082 

SOR (ω = 1.4) 67 262 955 

SOR (ω = 1.6) 42 151 577 

SOR (ω = 1.7) 57 96 412 

SOR (ω = 1.8) 86 89 252 

SOR (ω = 1.9) 176 180 179 

SOR (ω = 2.0) ∞ ∞ ∞ 

Vemos que o método de Gauss-Seidel é cerca de duas vezes mais rápido para convergir que o método de 

Jacobi e que dependendo da escolha de ω, o método SOR pode ser até dez vezes mais rápido que o método 

de Gauss-Seidel para a malha mais refinada. Subrelaxamento não ajuda e para ω = 2 o método SOR é 

divergente. 

4.1.5 Método de Jacobi Amortecido 

O método de Gauss-Seidel pode ser sobrerelaxado através de um parâmetro ω > 1 para obter um método 

que converge mais rápido.Já o método de Jacobi não pode em geral ser sobrerelaxado, porque o método 

obtido não converge. Ele pode no entanto ser subrelaxado através de um parâmetro ω < 1 para obter um 

método convergente, se bem que mais vagaroso. A vantagem de se utilizar um tal método é que para certos 

valores de ω ele é um ótimo suavizador de erro (em um sentido que será explicado no próximo capítulo), 

enquanto que o método de Jacobi usual não possui esta propriedade. Assim, o método de Jacobi amortecido 

pode ser usado em métodos multigrid (veja o próximo capítulo). 

Pelo método de Jacobi usual obtemos 

⎛ 

⎞ 

e tomamos 

ou seja, 

x k+1 

i 

x k+1 

i 

x k+1 

i 

1 

= 

aii 

= xk ⎢ 

i + ω ⎢ 

1 

⎣ 

⎜ 

⎝ bi − 

n 

j=1 

j=i 

= xk i + ω x k+1 

i 

⎡ 

aii 

⎛ 

⎜ 

⎝ bi − 

n 

j=1 

j=i 

aijx k j 

⎟ 

⎠ , 

− xk 

i , 

aijx k j 

⎞ 

⎤ 

⎟ 

⎠ − xk ⎥ 

i ⎦ . (4.16)


Este método é conhecido como método de Jacobi amortecido, método de Jacobi ponderado ou ainda 

método de relaxamento simultâneo (diferente do método de relaxamento sucessivo, baseado no método de 

Gauss-Seidel, em que cada variável é substituída sucessivamente dentro da mesma iteração à medida que 

ela é atualizada; no método de Jacobi, as variáveis são todas substituídas simultameamente na próxima 

iteração). 

Em forma matricial, o método de Jacobi amortecido pode ser descrito da seguinte forma. Denotando por 

D a parte diagonal de A, temos 

⎛ 

⎞ 

temos 

aiix k+1 

i 

= aiix k i + ω 

⎝bi − 

n 

j=1 

aijx k j 

Dx k+1 = Dx k + ω b − Ax k 

⎠ , 

(4.17) 

ou 

1 

ω D 

 

x k+1 

1 

= D − A x 

ω k + ωb, 


x k+1 

1 

= 

ω D 

−1 

1 

D − A x 

ω k 

+ b . (4.18) 

Em contraste com o método SOR, que converge em geral para 0 < ω < 2, o método de Jacobi amortecido 

converge para 0 < ω 1 (veja a próxima seção). 

4.2 Análise de Convergência dos Métodos Iterativos Lineares 

Os métodos descritos na seção anterior são casos especiais de uma classe geral de métodos chamados métodos 

iterativos lineares ou métodos de correção residual. Um método iterativo linear para resolver o sistema 

linear 

Ax = b 

envolve a decomposição da matriz A na forma 

A = B − C, (4.19) 

onde B é necessariamente uma matriz invertível, e então a resolução iterativa do sistema de equações 

ou, mais explicitamente, 

Bx k+1 = Cx k + b (4.20) 

x k+1 = B −1 Cx k + b . 

Se x k → x, então Bx = Cx + b, donde Ax = b. Do ponto de vista prático, é importante que a matriz B 

seja “fácil de resolver” (mesmo que a inversa de B não seja efetivamente calculada), como nos exemplos da 

seção anterior: 

B C 

Jacobi D D − A 

Gauss-Seidel D − L U 

SOR 

1 1 − ω 

D − L D + U 

ω ω 

Para obter uma convergência rápida, também gostaríamos que B ≈ A e C ≈ 0. Deste ponto de vista, o ideal 

seria B = A e C = 0 (convergência em uma iteração), mas isso viola em geral o critério que B seja “fácil 

de resolver”. Um compromisso é necessário: B deve aproximar A o melhor possível sem se tornar muito 

complicada.


4.2.1 Convergência dos Métodos Iterativos Lineares 

Para métodos iterativos em geral, definimos o erro algébrico por 

enquanto que o erro residual é dado por 

e k = x − x k , (4.21) 

r k = Ax − Ax k = f − Ax k . (4.22) 

O erro algébrico tem interesse puramente teórico (para provar que determinado método iterativo converge, 

precisamos mostrar que o erro algébrico tende a zero), já que ele só pode ser calculado uma vez que se 

conhece a solução exata, e se este for o caso obviamente não há necessidade de resolver o sistema. Já o erro 

residual pode ser usado como critério de parada para o método iterativo. Como 

segue que 

Observe que 

A matriz 

Be k+1 = Bx − Bx k+1 = Ax + Cx − Cx k − b = C x − x k = Ce k , 

e k+1 = B −1 Ce k . 

B −1 C = B −1 (B − A) = I − B −1 A. 

R = I − B −1 A = B −1 C (4.23) 

é chamada a matriz de iteração ou matriz de propagação do erro do algoritmo considerado, porque 

e o erro é dado por 


x k+1 = Rx k + B −1 b. (4.24) 

e k+1 = Re k . (4.25) 

e k = R k e 0 

(4.26) 

de modo que o erro converge para 0, independentemente do chute inicial x 0 , se e somente se R k → 0. Isso 

ocorre se e somente se existe alguma norma matricial · tal que R < 1. Obter uma norma matricial 

que satisfaz esta propriedade, no entanto, é difícil. Vamos obter uma condição necessária e suficiente para 

R k → 0 em termos do raio espectral da matriz de iteração (Corolário 4.5 a seguir), que é em geral um pouco 

mais fácil de calcular. Antes, para motivar o resultado, suponha que A seja uma matriz diagonalizável com 

λ1, . . . , λn os seus autovalores e {v1, . . . , vn} uma correspondente base de autovetores. Escrevendo o erro 

inicial como uma combinação linear dos autovetores, temos 

Logo, 


e 0 = 

n 

aivi. 

i=1 

e k = R k e 0 = 

 

e k 

n 

i=1 

aiλ k i vi, 

n 

|ai| |λi| k |vi| . 

i=1 

Como |λi| k → 0 se e somente se |λi| < 1, concluímos que e k → 0 qualquer que seja o erro inicial (isto é, 

qualquer que seja o chute inicial), se e somente se ρ (R) = max1in |λi| < 1 .


4.1 Lema. Se A ∈ Mn (C) e · é qualquer norma matricial, então 

ρ (A) A . 

Prova. Seja λ um autovalor qualquer de A e x um autovetor não-nulo correspondente a λ, de modo que 

Ax = λx. 

Considere a matriz X ∈ Mn (C) cujas colunas são todas iguais ao vetor x. Temos também 



AX = λX 

|λ| X = AX A X , 

|λ| A 

para todo autovalor λ de A. Como existe um autovalor λ de A tal que ρ (A) = λ, isso prova o resultado. 

4.2 Lema. Seja A ∈ Mn (C) e ε > 0 dado. Então existe uma norma matricial · tal que 

ρ (A) A ρ (A) + ε. (4.27) 

Prova. Toda matriz complexa é triangularizável através de uma matriz unitária (isto é, uma matriz U que 

satisfaz U ∗ U = UU ∗ = I; sua inversa é a sua adjunta ou transposta conjugada). Sejam então 

⎡ 

⎤ 

λ1 a12 a22 . . . a1n 

⎢ λ2 a23 ⎢ 

. . . a2n ⎥ 

⎢ 

T = 

λ3 ⎢ 

. . . a3n ⎥ 

⎢ 

⎣ 

. .. 

. ⎥ 

. ⎦ 

uma matriz triangular e U uma matriz unitária tais que 

Considere a matriz diagonal 

Temos 

DtT D −1 

t 

⎡ 

⎢ 

= ⎢ 

⎣ 

⎡ 

t 

⎢ 

Dt = ⎢ 

⎣ 

A = U ∗ T U. 

t 2 

. .. 

t n 

λn 

⎤ 

⎥ 

⎦ . 

λ1 a12t −1 a22t −2 . . . . . . a1nt −n+1 

λ2 a23t −1 . . . . . . a2nt −n+2 

Logo, para t > 0 suficientemente grande, a matriz DtT D −1 

t 

λ3 . . . . . . a3nt −n+3 

. .. 

. 

λn−1 an−1,nt −1 

tem a propriedade que a soma dos valores 

absolutos de elementos fora da diagonal principal é menor que ε. Em particular, se ·L denota a norma do 

máximo das somas das linhas, podemos garantir que 

 

DtT D −1 

 

 

t ρ (A) + ε 

L 

λn 

⎤ 

⎥ . 

⎥ 

⎦


para t suficientemente grande. Portanto, fixado um tal t, se definirmos uma norma por 

 

 

 

 

, 

teremos 

Pelo lema anterior, ρ (A) A. 

A := DtUAU ∗ D −1 

 

 

t = L U ∗ D −1−1 

∗ −1 

t AU Dt 

L 

A = DtUAU ∗ D −1 

 

t 

L = DtT D −1 

t 

 

ρ (A) + ε. 

L 

4.3 Lema. Seja A ∈ Mn (C). Se existe alguma norma matricial · tal que A < 1, então 

Prova. Se A < 1, então 

 

4.4 Proposição. Seja A ∈ Mn (C). Então 

se e somente se 

A k → 0. 

 

A k A k → 0. 

A k → 0 

ρ (A) < 1. 

Prova. Se existe algum autovalor λ de A tal que |λ| 1 e x é um autovetor não-nulo correspondente, então 

A k x = λ k x 

não converge para 0. Reciprocamente, se ρ (A) < 1, então pelo Lema 4.2 existe uma norma matricial · tal 

que A < 1, logo A k → 0 pelo lema anterior. 

4.5 Corolário. Seja R a matriz de iteração de um método iterativo linear. Então 


e k → 0 

ρ (R) < 1. 

Em outras palavras, um método iterativo linear é convergente independentemente da escolha do chute 

inicial se e somente se todos os autovalores da matriz de iteração têm valor absoluto menor que 1. 

4.2.2 Velocidade de Convergência dos Métodos Iterativos Lineares 

O raio espectral também dá informação sobre a velocidade de convergência. Se nós tivermos dois métodos 

iterativos lineares diferentes, isto é, duas maneiras diferentes de decompor a matriz A: 

A = B1 − C1 = B2 − C2, 

então o segundo método convergirá mais rápido se e somente se 

ρ (R2) < ρ (R1) . 

Vamos analisar a velocidade de convergência dos métodos iterativos com maior precisão. Novamente à 

título de motivação, suponha que A é uma matriz diagonalizável com seu maior autovalor sendo um autovalor 

simples. Ordene os autovalores de A na forma 

|λ1| > |λ2| . . . |λn|


e seja {v1, . . . , vn} uma correspondente base de autovetores. Escrevendo de novo 

e 0 n 

= aivi, 


segue que 

e k = λ k 1 

i=1 

e k = R k e 0 = 

 

a1x1 + 

Como λi 

λ1 

n 

i=1 

aiλ k i vi, 

n 

k λi 

ai vi 

λ1 

i=2 

k 

→ 0, 

a taxa de convergência é determinada por |λ1| k . Para k grande, temos 

e k ≈ λ k 1a1v1. 

Portanto, 

ek+1 |ek | = |λ1| = ρ (R) . (4.28) 

Em outras palavras, a convergência é linear com taxa de convergência igual ao raio espectral. Se a1 = 

0 a convergência será mais rápida, pois dependerá do módulo do segundo autovalor, mas é obviamente 

extremamente raro que o chute inicial satisfaça esta condição. Para o caso geral, precisamos do seguinte 

resultado: 

4.6 Proposição. Seja A ∈ Mn (C) e · uma norma matricial. Então 

ρ (A) = lim A k 1/k . 

Prova. Como os autovalores da matriz A k são as k-ésimas potências dos autovalores de A, temos que 


Dado ε > 0, a matriz 

ρ (A) k = ρ A k A k , 

ρ (A) A k 1/k . 

B = 

1 

ρ (A) + ε A 

tem raio espectral menor que 1, logo B k → 0. Portanto, existe algum N = N (ε, A) tal que 

 

B k < 1 

ou seja, 

 

A k 1/k < ρ (A) + ε 

para todo k > N. 

Definimos a taxa média de convergência de um método iterativo linear com matriz de iteração R por 

 

Rk (R) = − log R 10 

k 1/k = − 1 

k log 

R 10 

k (4.29) 

e a taxa assintótica de convergência por 

 

. 

R∞ (R) = lim 

k→∞ Rk (R) . (4.30)


4.7 Corolário. Seja R a matriz de iteração de um método iterativo linear. Então a taxa assintótica de 

convergência do método é dada por 

Prova. Pois 

R∞ (R) = − lim 

k→∞ log 10 

R∞ (R) = − log 10 ρ (R) . (4.31) 

 

R k 1/k 

= − log10 lim R k 1/k = − log10 ρ (R) . 

 

A taxa assintótica de convergência mede o aumento no número de casas decimais corretas na solução por 

iteração. De fato, usando a norma matricial do Lema 4.2 e medindo as normas dos vetores de acordo, temos 

 

ek+1 |ek | = 

 

Rk+1e0 |Rke0 R = ρ (R) + ε, 

| 


ou 

Assim, se 

teremos 

− log 10 

 

e k+1 

k→∞ 

|e k | = − log 10 ρ (R) + O (ε) 

 

log e 10 

k 

− log e 10 

k+1 = R∞ (R) + O (ε) . (4.32) 

 

e k = O 10 −p , 

 

e k+1 = O 10 −q , 

q − p ≈ R∞ (R) , 

isto é, reduzimos R∞ (R) ≈ q − p casas decimais no erro. Visto de outra forma, como 

 

ek+m |ek | = 

 

Rk+me0 |Rke0 | Rm = ρ (R) m + O (ε) , 


ou 

− log 10 

 

e k+m 

|e k | ≈ −m log 10 ρ (R) , 

m = log 

e 10 

k+m / ek 

log10 ρ (R) 

é o número de iterações necessárias para diminuir o erro de um número prescrito de casas decimais. 

4.2.3 Convergência para Matrizes Simétricas Positivas Definidas 

(4.33) 

Para matrizes reais simétricas positivas definidas é mais fácil provar a convergência dos métodos iterativos 

lineares. Temos o seguinte resultado básico a seguir. Antes precisamos da seguinte definição: 

Definição. Introduzimos uma ordenação parcial em Mn (C) definindo 

se 

para todo x ∈ C n . 

A B 

〈Ax, x〉 〈Bx, x〉


Em particular, se A é uma matriz positiva definida, segue que A εI para algum ε (o menor autovalor de 

A) e denotamos este fato por 

A > 0. 

4.8 Teorema. Seja A uma matriz simétrica positiva definida e seja A = B − C com B invertível. Então 

o método iterativo linear com matriz de iteração R = B −1 C converge se e somente se B t + C é uma 

matriz simétrica positiva definida. 

Prova. Medimos a norma do erro através da norma induzida por A 

|x| A := 〈Ax, x〉 1/2 

e consideraremos a norma matricial · A induzida por esta norma. Se provarmos que 

o método convergirá. Temos 

R A < 1, 

R 2 

A = 

B 

−1 2 

B C = sup A 

x=0 

−1Cx 2 A 

|x| 2 

 

−1 −1 t −t −1 AB Cx, B Cx C B AB Cx, x 

= sup 

= sup 

. (4.34) 

A 

x=0 〈Ax, x〉 

x=0 〈Ax, x〉 

Suponha que B t + C é uma matriz simétrica, positiva definida. Temos 

ou 

C t B −t AB −1 C = B t − A B −t AB −1 (B − A) = I − AB −t A I − B −1 A 

= A − AB −t A + AB −1 A − AB −t AB −1 A 

= A − AB −t B + B t − A B −1 A 

= A − B −1 A t B + B t − A B −1 A 

C t B −t AB −1 C = A − B −1 A t B t + C B −1 A, (4.35) 

de modo que C t B −t AB −1 C é uma matriz simétrica, positiva definida. Logo, por (4.34), mostrar que 

R A < 1 é equivalente a provar que 

C t B −t AB −1 C < A, 

e por (4.35) C t B −t AB −1 C < A se e somente se B −1 A t (B t + C) B −1 A > 0, o que é verdade porque B t +C 

é positiva definida. 

4.3 Convergência dos Métodos Iterativos Lineares para as Matrizes 

de Discretização 

4.3.1 Convergência do Método de Jacobi 

4.9 Teorema. Se A é uma matriz irredutível, diagonalmente dominante tal que |aii| > n 

|aij| para pelo 

menos alguma linha i, então o método de Jacobi converge. 

Prova. Seja D a parte diagonal da matriz A e R = D −1 (D − A) = I − D −1 A a matriz de iteração do 

método de Jacobi para A. Suponha por absurdo que exista um autovalor λ de R tal que |λ| 1. Como 

λ det λ −1 R − I = det (R − λI) = 0, temos 

det I − λ −1 R = 0. 

j=1 

j=i


Por outro lado, observe que I − λ−1R também é irredutível, pois 

Rij = I − D −1 A 

ij = 

 

0 se i = j, 

se i = j, 

− aij 

aii 

−1 

I − λ R 

ij = 

 

1 se i = j, 

se i = j, 

−1 

aij 

λ 

aii 

de modo que, onde A se anula, I −λ−1R também se anula. Além disso, I −λ−1R é diagonalmente dominante 

e estritamente dominante nas linhas onde A é, pois |λ| −1 1, I − λ−1R 

= 1 e 

ii 

n 

 

I − λ −1 R 

j=1 

j=i 

ij 

 

 

= |λ|−1 

|aii| 

n 

j=1 

j=i 

|aij| 1 

|aii| 

n 

|aij| . 

Mas, pela Proposição 3.16, isso implica que I − λ −1 R é invertível, uma contradição. 

O Teorema 4.8 mostra que o método de Jacobi converge para as matrizes de discretização obtidas através 

dos esquemas de diferenças finitas do Capítulo 2. 

Através do Teorema 4.9, fomos capazes de provar a convergência do método de Jacobi para as matrizes de 

discretização sem calcular explicitamente os seus raios espectrais. Para analizar a velocidade de convergência 

do método de Jacobi, no entanto, é necessário obter os raios espectrais destas matrizes. Vamos fazer isso 

para as matrizes de discretização obtidas a partir da fórmula de três pontos unidimensional e a partir da 

fórmula de cinco pontos bidimensional. 

4.10 Teorema. Seja A a matriz de discretização obtida a partir da fórmula de três pontos unidimensional 

ou a partir da fórmula de cinco pontos bidimensional com ∆x = ∆y. Seja R = D −1 (D − A) a matriz 

de iteração do método de Jacobi. Então 

j=1 

j=i 

ρ (R) = cos π 

. (4.36) 

n 

Prova. Para o método de Jacobi, a matriz de discretização x k+1 = Rx k +D −1 b é obtida através da fórmula: 

Já vimos no Lema 2.2 que 

com 

Daí segue que 

Logo 

para 

u k+1 

i,j 

1 k 

= ui,j−1 + u 

4 

k i,j+1 + u k i−1,j + u k 

i+1,j . 

−u kl 

i−1,j − u kl 

i+1,j + 4u kl 

i,j − u kl 

i,j−1 − u kl 

i,j+1 = λkl∆x 2 u kl 

i,j 

λkl = 2 

∆x2 

2 − cos kπ 

 

lπ 

− cos . 

n n 

u kl 

i,j−1 + u kl 

i,j+1 + u kl 

i−1,j + u kl 

i+1,j = 4 − λkl∆x 2 u kl 

i,j 

1 kl 

ui,j−1 + u 

4 

kl 

i,j+1 + u kl 

i−1,j + u kl 

i+1,j = µlku kl 

i,j 

µlk = 1 − 1 

4 λkl∆x 2 = 1 − 1 

 

2 − cos 

2 

kπ 

 

lπ 

− cos = 

n n 

1 

 

cos 

2 

kπ 

 

lπ 

+ cos . 

n n


Estes são os autovalores da matriz de iteração de Jacobi para a matriz de discretização obtida a partir da 

fórmula de cinco pontos (observe que elas possuem os mesmos autovetores; no entanto R possui autovalores 

nulos). Segue que o máximo autovalor ocorre quando k = l = 1, logo 

ρ (R) = cos π 

n . 

O argumento para a fórmula de três pontos é análogo. 

Para o quadrado unitário temos 

ρ (R) = cos (π∆x) . (4.37) 

Vemos em particular que ρ (R) → 1 quando ∆x → 0, de modo que a velocidade de convergência do método 

de Jacobi vai ficando cada vez menor para malhas mais refinadas. Podemos dizer mais usando a expansão 

da função cosseno em torno da origem 

se ∆x é pequeno podemos aproximar 

cos x = 1 − 1 

2 x2 + O x 4 ; 

cos (π∆x) ≈ 1 − π2 

2 ∆x2 , 

de modo que ρ (R) → 1 quadraticamente quando ∆x → 0. Em outras palavras, para uma malha duas vezes 

mais refinada (isto é, ∆x reduzido pela metade), o método de Jacobi é cerca de quatro vezes mais vagaroso 

em média (consulte novamente a tabela no final da seção anterior). A tabela abaixo mostra os valores do 

raio espectral para alguns valores de ∆x: 

∆x 0.1 0.05 0.025 

ρ (R) 0.9511 0.9877 0.9969 

Para ∆x = 0.025 (correspondente a uma matriz de tamanho n = 39 × 39 = 1521), temos 

R∞ (R) = − log 10 (0.9969) = 0.0013484, 

de modo que para reduzir o erro pelo fator de uma casa decimal precisamos de 

iterações. 

m = log 10 0.1 

log 10 ρ (R) 

1 

= − 

log10 ρ (R) = 

1 

≈ 742 

0.00135 

4.3.2 Convergência do Método de Gauss-Seidel 



menos alguma linha i, então o método de Gauss-Seidel converge. 

Prova. Sejam D a parte diagonal, −L a parte triangular inferior estrita e −U a parte triangular superior 

estrita da matriz A, e seja R = (D − L) −1 U a matriz de iteração do método de Gauss-Seidel para A. 

Escrevemos 

R = (D − L) −1 U = D I − D −1 L −1 U 

ou 

j=1 

j=i 

R = I − D −1 L −1 D −1 U. (4.38)


Suponha por absurdo que exista um autovalor λ de R tal que |λ| 1; como na demonstração do Teorema 

4.9, temos 

Agora, observando que 

det I − λ −1 R 

= det I − λ −1 

−1 −1 −1 

I − D L D U = 0. 

det I − D −1 L = 1 

porque I − D−1L é uma matriz triangular inferior com apenas 1’s na diagonal principal, escrevemos 

 

0 = det I − λ −1 

−1 −1 −1 

I − D L D U 

= det I − D −1 L 

det I − λ −1 

−1 −1 −1 

I − D L D U 

I −1 

= det − D L 

I − λ −1 

−1 −1 −1 

I − D L D U 

Por outro lado, 

= det I − D −1 L − λ −1 D −1 U . 

D −1 A = I − D −1 L − D −1 U 

é irredutível, diagonalmente dominante e estritamente dominante nas linhas onde A é porque 

−1 

D A ij = 

 

1 se i = j, 

aij 

se i = j. 

aii 

Logo, a matriz I − D −1 L − λ −1 D −1 U também satisfaz estas propriedades, pois I, −D −1 L e −D −1 U são 

respectivamente a parte diagonal, a parte triangular inferior estrita e a parte triangular superior estrita da 

matriz D −1 A, e multiplicar a parte triangular inferior estrita pelo número λ −1 cujo módulo é menor que ou 

igual a 1 não alterará a dominância diagonal (na verdade só tende a melhorá-la) nem acrescentará zeros à 

matriz. A Proposição 3.16 implica então que I − D −1 L − λ −1 D −1 U é invertível, um absurdo. 

Usando o Teorema 4.11, concluímos que o método de Gauss-Seidel converge para as matrizes de discretização 

obtidas através dos esquemas de diferenças finitas do Capítulo 2. Para analizar a velocidade de convergência 

do método de Gauss-Seidel, vamos obter os raios espectrais para as matrizes de discretização obtidas a partir 

da fórmula de três pontos unidimensional e a partir da fórmula de cinco pontos bidimensional. 


ou a partir da fórmula de cinco pontos bidimensional com ∆x = ∆y. Seja R = (D − L) −1 U a matriz 

de iteração do método de Gauss-Seidel. Então 

2 π 

ρ (R) = cos . (4.39) 

n 

Prova. Para obter o raio espectral da matriz de iteração R, queremos encontrar os autovalores µ de R: 

ou seja, 

Ru = (D − L) −1 Uu = µu, 

Uu = µ (D − L) u 

(um problema de autovalor generalizado). No caso da matriz de discretização da fórmula de cinco pontos, 

isso significa encontrar µ tal que 

Para os autovalores não-nulos, podemos fazer a substituição 

ui,j+1 + ui+1,j = µ (4ui,j − ui,j−1 − ui−1,j) . (4.40) 

ui,j = µ i+j 

2 vi,j (4.41)


para transformar a equação de autovalor naquela que aparece no método de Jacobi. Temos 

 

µ i+j+1 

2 vi,j + µ i+j+1 

2 vi+1,j = µ 4µ i+j 

2 vi,j − µ i+j−1 

2 vi,j−1 − µ i+j−1 

2 vi−1,j 

de modo que, dividindo por µ i+j+1 

2 , obtemos 

= 4µ i+j+2 

2 vi,j − µ i+j+1 

2 vi,j−1 − µ i+j+1 

2 vi−1,j, 

vi−1,j + vi+1,j + vi,j−1 + vi,j+1 = µ 1/2 4vi,j. 

Portanto os autovalores da matriz de iteração de Gauss-Seidel para esta matriz são exatamente os quadrados 

dos autovalores da matriz de iteração de Jacobi (e os autovetores são os mesmos): 

µlk = 1 

 

cos 

4 

kπ 

2 lπ 

+ cos . 

n n 

Portanto, o máximo autovalor ocorre quando k = l = 1 e 

2 π 

ρ (R) = cos 

n . 

O argumento para a fórmula de três pontos é análogo. 


ρ (R) = cos 2 (π∆x) , 

e usando 

cos 2 x = 


 

1 − 1 

2 x2 + O x 4 2 

= 1 − x 2 + O x 4 , 

cos 2 (π∆x) ≈ 1 − π 2 ∆x 2 . 

No método de Gauss-Seidel ainda temos ρ (R) → 1 quadraticamente quando ∆x → 0, mas a sua velocidade 

de convergência para a matriz de discretização de cinco pontos do quadrado unitário é duas vezes maior que 

a do método de Jacobi. Para ver isso, faça a expansão do logaritmo em torno do ponto x = 1: 

Segue que 

4.3.3 Convergência do Método SOR 

4.13 Teorema. Se o método SOR converge, então 

log (1 + x) = x + O ∆x 2 . 

R∞ (RJacobi) = π2 

2 ∆x2 + O ∆x 4 , (4.42) 

R∞ (RGauss-Seidel) = π 2 ∆x 2 + O ∆x 4 . (4.43) 

0 < ω < 2. 

Prova. A matriz de iteração do método SOR é 

−1 

1 

1 − ω 

1 

R = D − L 

D + U = 

ω ω 

= I − ωD −1 L 

−1 −1 1 − ω 

ωD D + U 

ω 

ω D I − ωD −1 L −1 

1 − ω 

ω 

 

D + U


ou 

Se λ1, . . . , λn são os autovalores de R, então 

Mas, 

R = I − ωD −1 L −1 (1 − ω) I + ωD −1 U . (4.44) 

det R = λ1 . . . λn. 

I −1 −1 −1 

det R = det − ωD L (1 − ω) I + ωD U 

= det I − ωD −1 L −1 −1 

det (1 − ω) I + ωD U 

= (1 − ω) n , 

já que I − ωD −1 L é uma matriz triangular inferior com apenas 1 na diagonal principal e (1 − ω) I + ωD −1 U 

é uma matriz triangular superior com apenas 1 − ω na diagonal principal. Logo 

λ1 . . . λn = (1 − ω) n . 

Em particular, pelo menos um dos autovalores λj de R deve satisfazer 

|λj| |1 − ω| . 

Mas, se o método SOR converge, devemos ter também |λ| < 1 para todo autovalor λ de R. Logo 


 

|1 − ω| < 1, 

0 < ω < 2. 

4.14 Corolário. Se R é a matriz de iteração n × n para o método SOR, então 

det R = (1 − ω) n . 

Em particular, diferente das matrizes de iteração dos métodos de Jacobi e de Gauss-Seidel (para a matriz de 

discretização de cinco pontos), zero não é um autovalor para a matriz de iteração do método SOR se ω = 1 

(para nenhuma matriz). 



menos alguma linha i, então o método SOR converge se 0 < ω 1. 

Prova. A demonstração é análoga à do Teorema 4.11. A matriz de iteração do método SOR é 

R = I − ωD −1 L −1 (1 − ω) I + ωD −1 U . 

Suponha por absurdo que exista um autovalor λ de R tal que |λ| 1; temos 

Agora, observando que 

det I − λ −1 R = det 

j=1 

j=i 

 

I − λ −1 I − ωD −1 L −1 (1 − ω) I + ωD −1 U 

= 0. 

det I − ωD −1 L = 1


porque I − ωD −1 L é uma matriz triangular inferior com apenas 1’s na diagonal principal, escrevemos 

0 = det 

 

I − λ −1 I − ωD −1 L −1 (1 − ω) I + ωD −1 U 

= det I − ωD −1 L det 

= det 

 

I − λ −1 I − ωD −1 L −1 (1 − ω) I + ωD −1 U 

I − ωD −1 L 

I − λ −1 I − ωD −1 L −1 (1 − ω) I + ωD −1 U 

= det I − ωD −1 L − λ −1 (1 − ω) I + ωD −1 U 

= det 1 − λ −1 (1 − ω) I − ωD −1 L − λ −1 ωD −1 U . 

Por outro lado, como vimos na demonstração do Teorema 4.11, a matriz 

D −1 A = I − D −1 L − D −1 U 

é irredutível, diagonalmente dominante e estritamente dominante nas linhas onde A é, logo a matriz 

S = 1 − λ −1 (1 − ω) I − ωD −1 L − λ −1 ωD −1 U 

também satisfaz estas propriedades. De fato, S tem zeros nas mesmas posições que I − D −1 L − D −1 U, logo 

a sua irredutibilidade não é afetada. Além disso, pela dominância diagonal de D −1 A, sabemos que se 

bij = D −1 L 

ij , 

cij = D −1 U 

ij . 

então 

i−1 

1 |bij| + 

j=1 

Para provar a dominância diagonal de S, observamos que os valores que S possui na diagonal principal são 

de modo que precisamos provar que 

se 0 < ω 1 e |λ| 1. Provaremos que 

1 − λ −1 (1 − ω) = 1 − 

j=1 

n 

j=i+1 

1 − ω 

λ 

|cij| . 

 

 

 

λ + ω − 1 

i−1 

 

λ ω |bij| + ω 

|λ| 

 

 

 

λ + ω − 1 

 

λ ω, 

 

 

 

λ + ω − 1 

 

ω 

λ 

|λ| . 

λ + ω − 1 

= , 

λ 

Para isso, observe que como |λ| 1 basta provar a primeira desigualdade, a qual por sua vez é equivalente a 

|λ + ω − 1| |λ| ω. 

É fácil ver que esta desigualdade é válida quando λ ∈ R, pois 

n 

j=i+1 

|cij| 

|λ + ω − 1| = λ + ω − 1 λω porque λ − 1 λω − ω = ω (λ − 1) .


Para o caso geral em que λ ∈ C, fazemos cair no caso real escrevendo 

|λ + ω − 1| 2 = |λ − (1 − ω)| 2 = |λ| 2 − 2 (Re λ) (1 − ω) + (1 − ω) 2 

|λ| 2 − 2 |λ| (1 − ω) + (1 − ω) 2 = [|λ| − (1 − ω)] 2 

= [|λ| + ω − 1] 2 |λ| 2 ω 2 . 

O resultado acima continua valendo com desigualdade estrita nas linhas onde a desigualdade é estrita. A 

Proposição 3.16 implica então que S é invertível, contradizendo det S = 0. 

4.16 Teorema. Seja A uma matriz simétrica positiva definida. Então o método SOR converge se 0 < ω < 2. 

Prova. Usaremos o Teorema 4.8. Escrevendo A = D − L − U, temos L t = U porque A é simétrica e as 

entradas diagonais de D positivas porque A é positiva definida. Para o método SOR temos 

B = 1 

1 − ω 

D − L e C = D + U, 

ω ω 

logo 

B t + C = 1 

ω D − Lt 1 − ω 2 − ω 

+ D + U = 

ω ω D 

é uma matriz simétrica positiva definida se 0 < ω < 2. 

Na verdade, se as entradas diagonais de uma matriz simétrica são positivas, a condição de ser definida 

positiva é equivalente à convergência do método SOR para 0 < ω < 2, como o próximo resultado mostra. 

4.17 Teorema. Seja A uma matriz simétrica com entradas diagonais positivas. Então o método SOR 

converge se e somente se A é positiva definida e 0 < ω < 2. 

Prova. Assuma que A é positiva definida e que 0 < ω < 2. Seja 

R = I − ωD −1 L −1 (1 − ω) I + ωD −1 U 

a matriz de iteração do método SOR. Se λ é um autovalor de R e x um autovetor associado, temos Rx = λx, 

donde (1 − ω) I + ωD −1 U x = λ I − ωD −1 L x. 

Fazendo o produto interno canônico (hermitiano) de C n de ambos os lados com o vetor x, segue que 

(1 − ω) 〈x, x〉 + ω x, D −1 Ux = λ 〈x, x〉 − ω x, D −1 Lx 

Isolando λ, 

λ = (1 − ω) 〈x, x〉 + ω x, D−1Ux 

〈x, x〉 − ω 〈x, D−1 . (4.45) 

Lx〉 

Como A é simétrica, o produto de matrizes simétricas D −1 A = I − D −1 U − D −1 L também é; como 

D −1 U, D −1 L são respectivamente a parte estritamente triangular superior e estritamente triangular inferior 

de uma matriz simétrica, temos 

D −1 U t = D −1 L. 

Logo 

e definindo 

x, D −1 Ux = 

D 

−1 t 

U x, x = D −1 L x, x = 〈x, (D−1L) x〉, 

z = 

x, D −1 L x 

〈x, x〉 

,


podemos escrever 

(1 − ω) + ωz 

λ = . (4.46) 

1 − ωz 

Os argumentos acima assumem que o denominador é não-nulo. E, de fato, temos 

Re z = 1 

 

−1 −1 

1 x, D L x x, D U x 

(z + z) = + 

= 

2 2 〈x, x〉 

〈x, x〉 

1 

 

−1 −1 x, D L + D U x 

2 〈x, x〉 

= 1 

 

−1 x, I − D A x 

= 

2 〈x, x〉 

1 

 

−1 x, D A x 

1 − 

. 

2 〈x, x〉 

e como A é positiva definida, D −1 A também é, o que implica 

x, D −1 A x 

〈x, x〉 


Re z < 1 

2 . 

de modo que a parte real do denominador 1 − ωz de λ é não-nula para 0 < ω < 2. Segue que 

|λ| 2 = λλ = 

[(1 − ω) + ωz] [(1 − ω) + ωz] 

(1 − ωz) (1 − ωz) 

> 0 

= ω2 − 2ω2 Re z − 2ω + 4ω Re z + 1 − 2ω Re z + ω2 |z| 2 

1 − 2ω Re z + ω2 |z| 2 

ω (2 − ω) (1 − 2 Re z) 

= 1 − 

1 − 2ω Re z + ω2 2 . 

|z| 

Como 0 < ω < 2 e Re z < 1 

, temos 

2 

e concluímos que 

ω (2 − ω) (1 − 2 Re z) > 0, 

|λ| < 1 

= (1 − ω)2 + 2ω (1 − ω) Re z + ω 2 |z| 2 

1 − 2ω Re z + ω 2 |z| 2 

para todo autovalor λ de R, logo o método SOR converge. A demonstração da recíproca (assim como uma 

demonstração alternativa, variacional, deste teorema) pode ser vista em [Young]. 

Usando o Teorema 4.15, concluímos que o método SOR converge para as matrizes de discretização obtidas 

através dos esquemas de diferenças finitas do Capítulo 2 se 0 < ω 1. Isso permite apenas subrelaxamento 

do método de Gauss-Seidel, o que em geral reduz a velocidade de convergência. Por outro lado, usando o 

Teorema 4.16 ou o Teorema 4.17, concluímos que o método SOR converge para as matrizes de discretização 

obtidas a partir da fórmula de três pontos unidimensional e a partir da fórmula de cinco pontos bidimensional 

se 0 < ω < 2, já que estas são matrizes simétricas, positivas definidas (já as matrizes de discretização obtidas 

através de coordenadas polares ou pelo esquema de Shortley-Weller não são simétricas, em geral, como 

vimos). 

Em seguida fazemos uma análise da velocidade de convergência do método SOR para a matriz de discretização 

da fórmula de cinco pontos, bem como obtemos o melhor valor do fator de relaxamento ω para 

este caso. 

4.18 Lema. Seja A a matriz de discretização obtida a partir da fórmula de três pontos unidimensional ou 

a partir da fórmula de cinco pontos bidimensional com ∆x = ∆y. Se λ = 0 é um autovalor de RSOR, 

então existe um autovalor λJ de RJ tal que 

λJ = 

1 − ω − λ 

λ1/2 . (4.47) 

ω2


Reciprocamente, se λJ é um autovalor de RJ e λ ∈ C satisfaz a equação acima, então λ é um autovalor 

de RSOR. 

Prova. Argumentamos como na demonstração do Teorema 4.12. Para obter o raio espectral da matriz de 

iteração RSOR, queremos encontrar os autovalores λ de RSOR: 

RSORu = I − ωD −1 L −1 (1 − ω) I + ωD −1 U u = λu, 

ou seja, (1 − ω) I + ωD −1 U u = λ I − ωD −1 L u 

No caso da matriz de discretização da fórmula de cinco pontos, isso significa encontrar λ tal que 

(1 − ω) ui,j + ω 

4 ui,j+1 + ω 

4 ui+1,j 

 

= λ ui,j − ω 

4 ui,j−1 − ω 

4 ui−1,j 

 

ou 

Fazendo a substituição 

e dividindo por µ i+j+1 

2 , segue que 

1 − ω − λ 

ui,j = 

ω 

1 

4 (ui,j+1 + ui+1,j + λui,j−1 + λui−1,j) . (4.48) 

ui,j = λ i+j 

2 vi,j 

vi−1,j + vi+1,j + vi,j−1 + vi,j+1 = 

1 − ω − λ 

λ 1/2 ω 4vi,j 

e daí o resultado. 

Resolvendo a equação (4.47) como uma equação quadrática em √ λ, vemos que as duas raízes λ± = 2 

λ± 

podem ser escritas na forma 

λ± = 1 

 

−ωλJ ± ω 

4 

2λ2 2 J − 4 (ω − 1) . (4.49) 

Denotaremos 

e por λJ = ρ (RJ) o maior autovalor do método de Jacobi. 

Λω,λJ = max (|λ+| , |λ−|) (4.50) 

4.19 Proposição. Seja A a matriz de discretização obtida a partir da fórmula de três pontos unidimensional 

ou a partir da fórmula de cinco pontos bidimensional com ∆x = ∆y. Então 

Prova. Por definição, 

De (4.49) segue que 

Λω,λJ = 1 

4 

ρ (RSOR,ω) = Λ ω,λJ 

ρ (RSOR,ω) = max Λω,λJ 

λJ 

. 

 

 

 

ωλJ + 

 

ω2λ 2 

 

 

J − 4 (ω − 1) 

 

2 

. 

(4.51) 

Se 0 < ω 1, ω2λ 2 

J − 4 (ω − 1) 0 e Λω,λJ é uma função crescente de λJ, logo o máximo é atingido em λJ. 

Se ω > 1, defina 

 

4 (ω − 1) 

λc = 

ω2 .


Se λJ > λc, ω 2 λ 2 

J − 4 (ω − 1) > 0 e segue a conclusão como no caso anterior. Se λJ λc, então ω 2 λ 2 

J − 

4 (ω − 1) 0 e 

onde i = √ −1, logo 

Λω,λJ = 

 

ω2λ 2 

 

J − 4 (ω − 1) = 4 (ω − 1) − ω2λ 2 

Ji, 

 

 

 

ωλJ 

+ ω2λ 2 

 

 

J − 4 (ω − 1) 

 

= ω − 1, 

2 

 

 

 

= 

 

ω 2 λ 2 J + 

 

4 (ω − 1) − ω2λ 2 

 

J 

2 

 

e novamente Λω,λJ é uma função crescente de λJ. 

Defina 

2 

ωótimo = 

1 + 1 − λ 2 

. 

J 

(4.52) 

Note que 1 < ωótimo < 2. Mostraremos que ωótimo é de fato o melhor valor para o fator de relaxamento no 

método SOR. Antes precisamos do seguinte resultado: 

4.20 Proposição. Seja A a matriz de discretização obtida a partir da fórmula de três pontos unidimensional 

ou a partir da fórmula de cinco pontos bidimensional com ∆x = ∆y. Então 

⎧ 

⎨ 1 

ωλJ ρ (RSOR,ω) = 

+ ω 

⎩ 

4 

2λ 2 

2 J − 4 (ω − 1) se 0 < ω ωótimo, 

(4.53) 

ω − 1 se ωótimo ω < 2. 

Prova. Temos ω 2 λ 2 

J − 4 (ω − 1) 0 para 0 < ω < 2 se e somente se ω ωótimo. De fato, as raízes de 

f (ω) = ω 2 λ 2 

J − 4ω + 4 são 

ω± = 

 

4 ± 4 1 − λ 2 

J 

2λ 2 

J 

= 2 

λ 2 

 

1 ± 1 − λ 

J 

2 

 

J 

de modo que a raiz positiva de f é maior que 2, logo para que f (ω) 0 se 0 < ω < 2, devemos ter 

ω 2 

λ 2 

 

1 − 1 − λ 

J 

2 

 

J = 2 

λ 2 

 

1 − 1 − λ 

J 

2 

 

J 

 

1 + 1 − λ 2 

2 

= 

J 1 + 1 − λ 2 

. 

J 

O resultado segue então como na demonstração da proposição anterior. 


ou a partir da fórmula de cinco pontos bidimensional com ∆x = ∆y. Então o fator de relaxamento 

ótimo para o método SOR é dado por 

ωótimo = 

é o fator de relaxamento ótimo para o método SOR. 

Prova. Se 0 < ω ωótimo, então ω 2 λ 2 

J − 4 (ω − 1) 0 e 

 

d 

ωλJ + ω 

dω 

2λ 2 

 

J − 4 (ω − 1) = λJ 

2 

1 + sen π 

n 

 

ω 2 λ 2 

J − 4 (ω − 1) + ωλ 2 

J − 2 

 

ω2λ 2 

. 

J − 4 (ω − 1) 

(4.54)


Temos ωλ 2 

J − 2 < 0, porque 0 < ω < 2 e λJ < 1, e 

 

 

ωλ 2 

 

 

J − 2 

> λJ ω2λ 2 

J − 4 (ω − 1), 

pois 

Isso implica 

 

 

ωλ 2 

 

 

J − 2 

2 

= ω 2 λ 4 

J − 4λ 2 

Jω + 4 > ω 2 λ 4 

J − 4λ 2 

Jω + 4λ 2 

 

= λJ ω2λ 2 

2 J − 4 (ω − 1) . 

J > ω 2 λ 4 

 

d 

ωλJ + ω 

dω 

2λ 2 

 

J − 4 (ω − 1) < 0, 

J − 4λ 2 

J (ω − 1) 

logo ρ (RSOR,ω) é decrescente de 0 até ωótimo. Para ωótimo ω < 2, ρ (RSOR,ω) = ω − 1 é claramente 

crescente. Portanto, ρ (RSOR,ω) atinge o seu mínimo em ωótimo. 

Pelo Teorema 4.10, temos 

λJ = cos π 

n , 

logo 

2 

ωótimo = 

1 + 1 − λ 2 

J 

2 

= 

π 

1 + 1 − cos2 n 

2 

= 

1 + sen π 

 

. 

n 


2 

ωótimo = 

1 + sen (π∆x) 

e conseqüentemente 

2 

1 − sen (π∆x) 

ρ (RSOR,ω) = 

− 1 = 

1 + sen (π∆x) 1 + sen (π∆x) . 

e usando 

1 − x 

1 + x = 1 − 2x + O x 2 , 

sen x = x + O x 3 , 


1 − sen (π∆x) 

1 + sen (π∆x) ≈ 1 − 2π∆x + O ∆x 2 . 

Portanto, usando o valor ótimo de ω no método SOR, temos ρ (R) → 1 linearmente quando ∆x → 0, um 

resultado muito melhor que o obtido nos métodos de Jacobi e de Gauss-Seidel. Para uma comparação mais 

precisa, usando 

log (1 + x) = x + O ∆x 2 

temos que 

Segue que 

R∞ (RSOR) = 2π∆x + O ∆x 2 . (4.55) 

R∞ (RSOR) 

R∞ (RGauss-Seidel) 

2π∆x 

≈ 

π2 2 

= 

∆x2 π∆x . 

Em particular, se ∆x = 0.025, temos ωótimo = 1. 8545 e R∞ (RSOR) /R∞ (RGauss-Seidel) = 25.5, isto é, o 

método SOR é 25 vezes mais rápido que o método de Gauss-Seidel. Quanto mais refinada a malha, maior é 

a diferença na velocidade de convergência entre os dois métodos.


4.3.4 Convergência do Método de Jacobi Amortecido 

4.22 Teorema. Se o método de Jacobi converge, então o método de Jacobi amortecido converge para 

0 < ω 1. 

Prova. Vamos escrever a matriz de iteração RJ,ω do método de Jacobi amortecido em função da matriz de 

iteração do método de Jacobi RJ. Temos 



RJ,ω = 



RJ = D −1 (D − A) 

 

1 

ω D 

−1 

1 

D − A = ωD 

ω −1 

 

1 

D − D + D − A = ωD 

ω −1 

 

1 

D − D + ωD 

ω −1 (D − A) 

Portanto, λJ é um autovalor de RJ se e somente se 

RJ,ω = (1 − ω) I + ωRJ. (4.56) 

RJv = λv 

[RJ,ω − (1 − ω) I] v = ωλv. 

λJ,ω = ωλJ + 1 − ω (4.57) 

é um autovalor de RJ,ω. Logo, se todo autovalor de RJ satisfaz |λJ| < 1 (isto é, ρ (RJ) < 1 equivalente ao 

método de Jacobi convergir) e ω < 1, então 

|λJ,ω| 2 = (ωλJ + 1 − ω) ωλJ + 1 − ω 

= ω 2 |λJ| 2 + 2 Re λJω (1 − ω) + (1 − ω) 2 

ω 2 |λJ| 2 + 2 |λJ| ω (1 − ω) + (1 − ω) 2 

= (ω |λJ| + 1 − ω) 2 

< 1. 

 

Segue do Teorema 4.8 que o método de Jacobi amortecido converge para as matrizes de discretização do 

Capítulo 2 se 0 < ω 1. 

4.23 Corolário. 


Usando 

ρ (RJ,ω) = ω [ρ (RJ) − 1] + 1. (4.58) 

ρ (RJ,ω) = ω [cos (π∆x) − 1] + 1. (4.59) 

cos x = 1 − 1 

2 x2 + O x 4 , 

log (1 + x) = x + O ∆x 2 ,



ρ (RJ,ω) ≈ 1 − ω π2 

2 ∆x2 + O ∆x 4 , 

R∞ (RJ,ω) ≈ ω π2 

2 ∆x2 . 

Vemos que a velocidade de convergência do método de Jacobi amortecido é da mesma ordem que a do método 

de Jacobi, um pouco pior para valores de ω próximos de 1 e muito pior para valores de ω próximos de 0. 

4.3.5 Resumo 

Método ρ (R) R∞ (R) 

Jacobi cos (π∆x) 

π 2 

2 ∆x2 + O ∆x 4 

Gauss-Seidel cos 2 (π∆x) π 2 ∆x 2 + O ∆x 4 

SOR ótimo 1 − 2π∆x + O ∆x 2 

2π∆x + O ∆x 2 

Jacobi amortecido 1 − ω π2 

2 ∆x2 + O ∆x 4 ω π2 

2 ∆x2 + O ∆x 4 

4.4 Método do Gradiente Conjugado 

Nesta seção, A será sempre uma matriz real simétrica, positiva definida. Neste caso, a resolução do sistema 

Ax = b é equivalente à resolução de um problema de minimização de um funcional quadrático: 

4.24 Teorema. (Método Variacional para a Resolução de Sistemas Lineares) Seja A ∈ Mn (R) uma matriz 

simétrica positiva definida e b ∈ R n . Então a solução do sistema 

Ax = b 

é o único ponto x que minimiza o funcional quadrático 

f (y) = 1 

2 yt Ay − y t b. (4.60) 

Prova: Uma matriz simétrica positiva definida é invertível, logo existe uma única solução x para o sistema 

Ax = b. Para provar o teorema, começamos observando que, como y t Ax ∈ R é um escalar, temos 

Daí, 

y t Ax = y t Ax t = x t A t y = x t Ay. 

f (y) − f (x) = 1 

2 yt Ay − y t b − 1 

2 xt Ax + x t b 

= 1 

2 yt Ay − y t Ax − 1 

2 xt Ax + x t Ax 

= 1 

2 yt Ay − y t Ax + 1 

2 xt Ax 

= 1 

2 yt Ay − 1 

2 yt Ax − 1 

2 xt Ay + 1 

2 xt Ax 

= 1 

2 yt A (y − x) − 1 

2 xt A (y − x)


ou 

f (y) − f (x) = 1 

2 (y − x)t A (y − x) . (4.61) 

Como A é positiva definida, segue que 

e 

se e somente se y = x. Portanto, 

(y − x) t A (y − x) = 〈A (y − x) , (y − x)〉 0 

(y − x) t A (y − x) = 0 

f (y) > f (x) 

para todo y = x e o mínimo de f ocorre em x. 

Em muitos problemas, o funcional f tem significado físico, correspondente a um funcional de energia que 

quando é minimizado corresponde a um estado de equilíbrio do sistema. Observe que definindo um produto 

interno a partir da matriz simétrica positiva definida A da maneira usual por 〈v, w〉 A = vtAw e considerando 

a norma induzida vA = 〈v, v〉 1/2 

A , o funcional f pode ser escrito na forma 

f (y) = 1 

〈y, Ay〉 − 〈y, Ax〉 (4.62) 

2 

ou 

f (y) = 1 

2 y2 A − 〈y, x〉 A . (4.63) 

Outra maneira de enxergar o resultado do teorema anterior é observar que o gradiente do funcional f é 

Se x é um ponto de mínimo temos ∇f (x) = 0, ou seja, 

∇f (y) = Ay − b. (4.64) 

Ax = b. 

Este método variacional é a base dos métodos iterativos de descida em geral, e do método do gradiente 

conjugado em particular. A idéia é usar as idéias do cálculo diferencial para encontrar o mínimo do funcional 

quadrático f. 

4.4.1 Métodos de Descida 

A filosofia dos métodos de descida é começar com um chute inicial x 0 e gerar uma seqüência de iterados 

x 1 , x 2 , . . . , x k , . . . que satisfazem 

f x k+1 f x k 

ou, melhor ainda, 

f x k+1 < f x k 

de tal modo que x k convirja para o minimizador de f. Em outras palavras, em um método de descida 

buscamos encontrar uma seqüência minimizante x k que convirja para a solução do sistema. 

O passo de x k para x k+1 envolve dois ingredientes: (1) uma direção de busca e (2) um avanço de 

comprimento especificado na direção de busca. Uma direção de busca significa a escolha de um vetor p k que 

indicará a direção que avançaremos de x k para x k+1 . O comprimento do avanço é equivalente à escolha de 

um escalar αk multiplicando o vetor p k . Assim, 

x k+1 = x k + αkp k .


A escolha de αk é também chamada uma busca na reta, já que queremos escolher um ponto na reta 

x k + αp k : α ∈ R 

tal que 

f x k + αp k f x k . 

Idealmente, gostaríamos de escolher αk de tal modo que 

f x k+1 = f x k + αkp k = min 

α∈R f x k + αp k 

Esta é chamada uma busca na reta exata. Para funcionais quadráticos, a busca na reta exata é trivial e 

obtemos uma fórmula para o valor de αk, como veremos a seguir. Denotaremos o resíduo em cada iteração 

por 

r k = b − Ax k . (4.65) 

4.25 Proposição. Seja αk ∈ R tal que 

Então 

Prova: Considere o funcional 

g é um polinômio quadrático em α, pois 

f x k + αkp k = min 

α∈R f x k + αp k . 

αk = 

p k t r k 

(pk ) t = 

Apk g (α) = f x k + αp k . 

p k , r k 

〈pk , Apk . (4.66) 

〉 

g (α) = 1 k k 

x + αp 

2 

t k k 

A x + αp − x k + αp kt b 

= 1 k 

x 

2 

t k k 

Ax − x t α k 

b + x 

2 

t k α k 

Ap + p 

2 

t k α 

Ax + 2 k 

p 

2 

t k k 

Ap − α p t 

b 

= f x k 

1 k 

+ α p 

2 

t k 1 k 

Ax + p 

2 

t k k 

Ax − p t 

 

b + α2 k 

p 

2 

t k 

Ap 

= f x k − α p kt k α 

Ar + 2 k 

p 

2 

t k 

Ap , 

portanto o mínimo de g é atingido no vértice −B/2A da parábola Y = AX 2 + BX + C. 

Observe que αk = 0 se e somente se p k t r k = 0, isto é, a direção de busca é ortogonal ao resíduo. Como 

gostaríamos sempre que possível de ter x k+1 = x k , devemos sempre escolher a direção de busca de forma a 

não ser ortogonal a r k . Se esta escolha é feita, então teremos sempre f x k+1 < f x k . 

Exemplo 1. (Método de Gauss-Seidel) Considere o método de descida em que as primeiras n direções de 

busca p 1 , . . . , p n são os vetores e1, . . . , en da base canônica de R n , e isso é repetido a cada n iterações, 

de modo que p k+n = ek para todo k = 1, . . . , n, com uma busca na reta exata executada em cada 

iteração. Então cada grupo de n iterações corresponde a uma iteração do método de Gauss-Seidel. 

Exemplo 2. (Método SOR) Usando as mesmas direções de busca do exemplo anterior, mas com x k+1 = 

x k + ωαkp k , ω = 1, obtemos um método de descida em que as buscas nas retas são inexatas. Cada 

grupo de n iterações corresponde a uma iteração do método SOR.


4.4.2 Método da Descida Mais Acentuada 

Do Cálculo Diferencial, sabemos que a direção em que a função cresce a uma taxa mais rápida a partir de 

um ponto é a direção do gradiente neste ponto. Esta observação é a base da escolha da direção de busca no 

método da descida mais acentuada. Em outras palavras, escolhemos 

ou 

p k = −∇f x k = b − Ax k 

p k = r k . (4.67) 

Buscar na direção da descida mais acentuada é uma idéia natural, mas que na prática não funciona sem 

modificações. De fato, em alguns casos o método é de velocidade comparável à do método de Jacobi, como 

na matriz de discretização da fórmula de cinco pontos aplicada ao problema descrito na primeira seção deste 

capítulo [Watkins]: 

∆x = 0.1 ∆x = 0.05 ∆x = 0.025 

Jacobi 299 1090 3908 

Descida Mais Acentuada 304 1114 4010 

De fato, como as iterações do método de descida mais acentuada são bem mais custosas que as do método 

de Jacobi, o primeiro é muito pior que este último. 

Para entender melhor o método da descida mais acentuada, porque ele pode ser lento e as modificações que 

vamos fazer para torná-lo mais rápido levando ao método do gradiente conjugado, vamos entender o processo 

do ponto de vista geométrico. Como vimos na demonstração do Teorema 4.24, o funcional quadrático f é 

da forma 

f (y) = 1 

2 (y − x)t A (y − x) + c (4.68) 

onde c = f (x) = 1 

2 xt Ax − x t b é uma constante. Já que A é uma matriz simétrica, existe uma matriz 

ortogonal P tal que P t AP é uma matriz diagonal D , cujos valores na diagonal principal são exatamente os 

autovalores positivos de A. Nas coordenadas 

o funcional f tem a forma 

z = P t (y − x) , 

f (z) = 1 

2 ztDz + c = 1 

2 

n 

i=1 

λiz 2 i + c. (4.69) 

As curvas de nível do funcional f neste sistema de coordenadas são elipses (em R 2 , elipsóides em R 3 e 

hiperelipsóides em R n ) centradas na origem com eixos paralelos aos eixos coordenados e f (0) = c é nível 

mínimo de f; elipses correspondentes a menores valores de f estão dentro de elipses correspondentes a 

maiores valores de f. Como P é uma aplicação ortogonal, as curvas de nível de f no sistema de coordenadas 

original também são elipses, centradas em x, e uma reta de um ponto y até o ponto x corta elipses de níveis 

cada vez menores até chegar ao mínimo da função f em x, centro de todas as elipses. O vetor gradiente é 

perpendicular às curvas de nível, logo é perpendicular às elipses. Seguir a direção de descida mais acentuada 

equivale a cortar a elipse que contém x k ortogonalmente na direção do interior da elipse até encontrar um 

ponto x k+1 situado em uma elipse que a reta tangencie, pois a partir daí a reta irá na direção de elipses com 

níveis maiores, portanto este é o ponto da reta onde f atinge o seu mínimo. Em particular, vemos que a 

próxima direção p k+1 é ortogonal à direção anterior p k , tangente a esta elipse. Em geral, a direção de descida 

mais acentuada não é a direção de x (quando bastaria uma iteração para atingir a solução exata) a não ser 

que A seja um múltiplo escalar da identidade, de modo que todos os autovalores de A são iguais e as elipses 

são círculos. Por outro lado, se os autovalores de A têm valores muito diferentes uns dos outros, com alguns 

muito pequenos e alguns muito grandes, as elipses serão bastante excêntricas e, dependendo do chute inicial,


a convergência pode ser muito lenta (matrizes com estas propriedades são chamadas mal-condicionadas; para 

que o método de descida acentuada seja lento, a matriz A não precisa ser muito mal-condicionada). 

Como vimos na seção anterior, os algoritmos de Gauss-Seidel e SOR podem ser encarados como algoritmos 

de descida. A discussão no parágrafo anterior também pode ser usada para entender a relativa lentidão destes 

algoritmos. 

4.4.3 Método do Gradiente Conjugado 

Todos os métodos iterativos que vimos neste capítulo são limitados pela sua falta de memória, no sentido de 

que apenas informação sobre x k é usada para obter x k+1 . Toda a informação sobre as iterações anteriores é 

deletada. O método do gradiente conjugado é uma variação simples do método da descida mais acentuada 

que funciona melhor porque a informação obtida através das iterações anteriores é utilizada. 

Para entender brevemente como isso funciona, observe que depois de j iterações x k+1 = x k + αkp k de 

um método de descida temos 

x j = x 0 + α0p 0 + α1p 1 + . . . + αj−1p j−1 , 

de modo que x j está no subespaço afim gerado pelo chute inicial x 0 e pelos vetores p 0 , p 1 , . . . , p j−1 . 

Enquanto o método da descida mais acentuada minimiza o funcional de energia f apenas ao longo das j 

retas x k + αkp k , cuja união constitui apenas um pequeno subconjunto de x 0 + p 0 , p 1 , . . . , p j−1 , o método 

do gradiente conjugado minimiza f sobre todo o subespaço afim x 0 + p 0 , p 1 , . . . , p j−1 . 

Para definir as direções de busca do método do gradiente conjugado (que é, antes de mais nada, um 

método de descida), lembramos que o funcional f foi escrito na forma 

Defina o erro 

Pela regra do paralelogramo, temos 


f (y) = 1 

2 y2 

A − 〈y, x〉 A . 

e = x − y. (4.70) 

x + y 2 

A + x − y2 A = 2 x2 A + 2 y2 A , 

2 y 2 

A = x − y2 A + x2 A + 2 〈y, x〉 A + y2 A − 2 x2 A 

= x − y 2 

A + 2 〈y, x〉 A − x2 A + y2 A , 

ou 

y 2 

A − 2 〈y, x〉 A = x − y2 A − x2 A . 

Logo, podemos escrever 

f (y) = 1 

2 e2 

1 

A − 

2 x2 A . (4.71) 

Conseqüentemente, minimizar o funcional f é equivalente a minimizar a A-norma do erro. 

Agora, em um método de descida, depois de j iterações temos: 

e j = x − x j = x − x 0 − α0p 0 + α1p 1 + . . . + αj−1p j−1 

= e 0 − α0p 0 + α1p 1 + . . . + αj−1p j−1 . 

Logo, minimizar ej 2 

é equivalente a minimizar 

A 

 

e 0 − α0p 0 + α1p 1 + . . . + αj−1p j−1 , 

A 

o que por sua vez é equivalente a encontrar a melhor aproximação do vetor e 0 no subespaço Wj = p 0 , p 1 , . . . , p j−1 . 

Esta é dada pelo lema da melhor aproximação:


4.26 Proposição. Sejam A ∈ Mn (R) uma matriz simétrica positiva definida, v ∈ R n e W um subsespaço 

de R n . Então existe um único w ∈ W tal que 

v − w A = min 

z∈W v − z A . 

O vetor w é caracterizado pela condição v − w ⊥A W . 

Segue deste resultado que e j A é minimizado quando escolhemos p = α0p 0 + α1p 1 + . . . + αj−1p j−1 ∈ Wj 

tal que e j = e 0 − p satisfaz 

e j ⊥A p i para i = 1, . . . , j − 1. (4.72) 

Definição. Dois vetores y, z que são ortogonais com respeito ao produto interno 〈·, ·〉 A , isto é, tais que 

são chamados conjugados. 

〈y, z〉 A = 0 

Nosso objetivo então é desenvolver um método em que o erro a cada passo é conjugado com todas as direções 

de busca anteriores. O próximo resultado, que é basicamente uma reafirmação da Proposição 4.25, mostra 

que em qualquer método de descida em que a busca na reta é exata satisfaz automaticamente e j ⊥A p j−1 , 

isto é, (4.72) é válido para a última iteração (o erro da iteração presente é A-ortogonal à direção de busca 

da iteração anterior). 

4.27 Proposição. Seja x k+1 = x k + αkp k obtido através de uma busca na reta exata. Então 

e 

Prova: Temos 

r k+1 ⊥ p k 

e k+1 ⊥A p k . 

b − Ax k+1 = b − Ax k − αkAp k , 

de modo que a seqüência dos resíduos é dada pela fórmula 

Logo, 

Além disso, como 

k+1 k 

r , p = r k+1 , p k k k 

− αk Ap , p = r k , p k − 

r k+1 = r k − αkAp k . (4.73) 

Ae k+1 = r k+1 , 

p k , r k 

〈p k , Ap k 〉 

Ap k , p k = 0. 

segue que k+1 k 

e , p 

A = Ae k+1 , p k = r k+1 , p k = 0. 

 

O significado geométrico deste resultado é que o mínimo do funcional f na reta xk + αkpk ocorre quando a 

derivada direcional de f na direção de busca é zero, ou seja, 

0 = ∂f k+1 

x 

∂pk 

= ∇f x k+1 k+1 

, pk = r , pk . 

De acordo com a Proposição 4.27, depois do primeiro passo temos e 1 ⊥A p 0 . Para manter os erros 

subseqüentes conjugados a p 0 , como 

e k+1 = x − x k+1 = x − x k − αkp k


ou 

e k+1 = e k − αkp k , (4.74) 

basta escolher as direções de busca subseqüentes conjugadas a p 0 . Se escolhemos p 1 conjugado a p 0 , obtemos 

x 2 para o qual o erro satisfaz e 2 ⊥A p 1 ; como p 1 ⊥A p 0 , segue de (4.74) que e 2 ⊥A p 0 também. Para manter 

os erros subseqüentes conjugados a p 0 e p 1 , basta escolher as direções de busca subseqüentes conjugadas a 

p 0 e p 1 . Assim, vemos que para obter a condição (4.72) basta escolher as direções de busca de tal forma que 

p i ⊥A p j para todos i = j. 

Um método com estas características é chamado um método de direções conjugadas. Estes resultados 

são resumidos na proposição a seguir: 

4.28 Teorema. Se um método emprega direções de busca conjugadas e performa buscas na reta exatas, 

então 

e j ⊥A p i 

para i = 1, . . . , j − 1, 

para todo j. Conseqüentemente 

e j 

= min e A p∈Wj 

0 − p , A 

onde Wj = p 0 , p 1 , . . . , p j−1 . 

Prova: A demonstração é por indução. Para j = 1, temos e 1 ⊥A p 0 pela Proposição 4.27 porque a busca 

na reta é exata. Em seguida, assuma e j ⊥A p i para i = 1, . . . , j − 1; queremos mostrar que e j+1 ⊥A p i 

para i = 1, . . . , j. Como 

e j+1 = e j − αjp j , 

para i = 1, . . . , j − 1 temos 

e j+1 , p i 

A = e j − αjp j , p i 

A = e j , p i 

A 

− αj 

p j , p i 

A 

= 0 − 0 = 0 

porque as direções de busca são conjugadas. e j+1 ⊥A p j segue novamente da Proposição 4.27. 

Quando a direção inicial é dada pelo vetor gradiente de f, como na primeira iteração do método da descida 

mais acentuada, obtemos o método do gradiente conjugado. As direções subseqüentes são escolhidas 

através de A-ortogonalizar o resíduo (ou vetor gradiente de f, que é a direção de busca em cada iteração 

do método da descida mais acentuada) com todas as direções de busca anteriores, para isso utilizando o 

algoritmo de Gram-Schmidt. Assim, dado um chute inicial p 0 , a primeira direção é 

ou seja, a direção inicial é o primeiro resíduo: 

p 0 = −∇f x 0 = b − Ax 0 = r 0 

Depois de k passos com direções de busca conjugadas p 0 , . . . , p k , escolhemos 

p k+1 = r k+1 − 

onde os cki são dados pelo algoritmo de Gram-Schmidt: 

 

k+1 i r , p 

cki = 

p 0 = r 0 . (4.75) 

k 

i=0 

〈p i , p i 〉 A 

ckip i 

A 

(4.76) 

. (4.77) 

de forma que p k+1 ⊥A p i para todos i = 1, . . . , k. Felizmente, como veremos a seguir depois de algum trabalho 

preliminar (Corolário 4.32), cki = 0 para todo i exceto i = k, o que torna necessário que apenas a direção


de busca mais recente pk seja armazenada na memória do computador, o que garante que a implementação 

do gradiente conjugado é eficiente: 

 

k+1 k r , p 

 

k+1 k r , Ap 

p k+1 = r k+1 − 

〈p k , p k 〉 A 

A 

p k = r k+1 − 

〈p k , Ap k 〉 pk . (4.78) 

Esta é a modificação do método do gradiente conjugado em relação ao método da descida mais acentuada, 

em que p k+1 = r k+1 . 

Definição. Dada uma matriz A ∈ Mn (C) e um vetor v ∈ C n , o espaço de Krylov Kj (A, v) é o subespaço 

v, Av, . . . , A j−1 v . 

4.29 Teorema. Depois de j iterações do algoritmo do gradiente conjugado (com rk = 0 em cada iteração), 

temos 0 1 j−1 

p , p , . . . , p = r 0 , r 1 , . . . , r j−1 0 

= Kj A, r . 

Prova: A demonstração é por indução. O resultado é trivial para j = 0, pois p 0 = r 0 . Assuma o resultado 

válido para j − 1. Em primeiro lugar, mostraremos que 

0 1 j 

r , r , . . . , r 0 

⊂ Kj+1 A, r . (4.79) 

Em vista da hipótese de indução, basta mostrar que rj 

0 ∈ Kj+1 A, r . Como rj = rj−1 − αj−1Apj−1 e 

rj−1 

0 ∈ Kj A, r 

0 ⊂ Kj+1 A, r por hipótese de indução, basta provar que Apj−1 

0 ∈ Kj+1 A, r . Mas, 

também por hipótese de indução, pj−1 

0 ∈ Kj+1 A, r , logo 

Ap j−1 ∈ Kj 

Em seguida, mostraremos que 

0 

A, Ar = Ar 0 , A 2 r 0 , . . . , A j r 0 ⊂ r 0 , Ar 0 , A 2 r 0 , . . . , A j r 0 0 

= Kj+1 A, r . 

p 0 , p 1 , . . . , p j ⊂ r 0 , r 1 , . . . , r j . (4.80) 

Por hipótese de indução, basta provar que pj ∈ r0 , r1 , . . . , rj . Isso segue de (4.76) e da hipótese de indução. 

Até aqui provamos que 

0 1 j 

p , p , . . . , p ⊂ r 0 , r 1 , . . . , r j 0 

⊂ Kj+1 A, r . (4.81) 

Para provar que eles são iguais, basta mostrar que eles têm a mesma dimensão. Isso decorre de 

e 

dim r 0 , r 1 , . . . , r j j + 1, 

0 

dim Kj+1 A, r j + 1 

dim p 0 , p 1 , . . . , p j = j + 1, 

o último porque os vetores p 0 , p 1 , . . . , p j são vetores não-nulos A-ortogonais. 

4.30 Corolário. Depois de j iterações do algoritmo do gradiente conjugado, temos 

0 

A, r 


e j ⊥A Kj 

Prova: Segue imediatamente do teorema anterior e do Teorema 4.28.


4.31 Corolário. Depois de j iterações do algoritmo do gradiente conjugado, temos 

r j 0 

⊥ Kj A, r 


Prova: Em vista do Teorema 4.29, basta provar que rj ⊥ p0 , p1 , . . . , pj−1 para todo j. Como Aej+1 = rj+1 , 

j+1 i 

r , p = Ae j+1 , p i = e j+1 , p i 

= 0 A 

para todo i = 1, . . . , j − 1, como vimos na demonstração do Teorema 4.28. 

4.32 Corolário. cki = 0 para todo i = 1, . . . , k − 1. 

Prova: Temos que provar que k+1 i 

r , p 

A = r k+1 , Ap i = 0 

para todos i = 1, . . . , k − 1. Pelo Teorema 4.29, pi ∈ p0 , p1 , . . . , pi = r0 , Ar0 , . . . , Air 

0 = Ki+1 A, r , 

logo 

Ap i ∈ Ar 0 , A 2 r 0 , . . . , A i+1 r 0 

⊂ Ki+2 A, r 0 

⊂ Kk+1 A, r 

e o resultado segue do corolário anterior. 

4.33 Teorema. Seja A uma matriz simétrica positiva definida n×n. Então o método do gradiente conjugado 

converge em n iterações. 

Prova: Se fizemos n − 1 iterações em obter x, pelo Corolário 4.32 os vetores r 0 , r 1 , . . . , r n−1 formam uma 

base ortogonal para R n . Depois de mais uma iteração, de acordo com este mesmo corolário o resíduo r n 

satisfaz r n ⊥ r 0 , r 1 , . . . , r n−1 = R n , logo r n = 0. 

De fato, na maioria das aplicações o método do gradiente conjugado converge ainda mais rápido, se apenas 

uma boa aproximação é requerida. Defina o número de condição de uma matriz simétrica positiva definida 

por 

κ (A) = 

max {λ : λ é um autovalor de A} 

; (4.82) 

min {λ : λ é um autovalor de A} 

assim, quanto maior o número de condição de uma matriz, ela é mais mal-condicionada e a convergência 

de métodos de descida é mais vagarosa. Pode-se provar a seguinte estimativa de erro para o método do 

gradiente conjugado (veja [Strikwerda]): 

 

e k A 2 e 0 A 

κ (A) − 1 

κ (A) + 1 

k 

. (4.83) 

Esta estimativa é uma estimativa grosseira, mas mostra que o método do gradiente conjugado converge 

mais rapidamente para matrizes bem-condicionadas (κ (A) ∼ 1). Uma comparação entre a velocidade de 

convergência dos dois métodos para a matriz de discretização da fórmula de cinco pontos aplicada ao problema 

descrito na primeira seção deste capítulo, desta vez com o tamanho das matrizes indicado na linha superior 

da tabela, é dada a seguir [Watkins]. 

n = 81 n = 361 n = 1521 

Descida Mais Acentuada 304 1114 4010 

Gradiente Conjugado 29 60 118 

No caso desta matriz de discretização no quadrado unitário temos 

κ (A) = 

2 (n − 1) π 

sen 

2n 

π 

sen2 2n 

2 π π∆x 

= cot = cot2 

2n 2 ≈ 

4 

π 2 ∆x 2


de modo que 

κ (A) − 1 1 − π∆x/2 

≈ ≈ 1 − π∆x, 

κ (A) + 1 1 + π∆x/2 

o que dá uma velocidade de convergência para o método do gradiente conjugado duas vezes maior que a 

do método SOR com o fator de relaxamento ótimo. No entanto, deve-se ter em mente que enquanto que a 

taxa de covergência que obtivemos para o método SOR é precisa, a estimativa de erro (4.83) para o método 

do gradiente conjugado é apenas um limitante superior grosseiro (veja [Watkins] para algumas estimativas 

melhoradas).

Capítulo 5 

Métodos Multigrid 

5.1 Suavização de Erros 

5.2 Operador Restrição e Operador Extensão 

5.3 Ciclos V 

5.4 Multigrid Completo 

5.5 Convergência 

5.6 Multigrid Adaptativo 

5.7 Multigrid Algébrico 

120

Capítulo 6 

Método de Elementos Finitos 

O método de elementos finitos é um outro método de discretização de equações diferenciais parciais baseado 

na reformulação variacional da equação. Por exemplo, como já vimos exemplos, encontrar a solução u de 

uma equação diferencial parcial dada é equivalente a resolver um problema de minimização 

F (u) = min F (v) 

v∈V 

onde V é um conjunto de funções admissíveis e F : V −→ R é um funcional. Em geral, a dimensão de V é 

infinita e portanto as funções em V não podem ser descritas por um número finito de parâmetros. Discretizar 

este problema através de elementos finitos é substituir o espaço de dimensão infinita V por um subespaço de 

dimensão finita Vh consistindo de funções simples (por exemplo, funções polinomiais). O problema discreto 

passa a ser encontrar o minimizador do funcional F sobre o subespaço Vh. Espera-se que este seja uma 

aproximação do minimizador de F sobre o espaço completo V , isto é, uma aproximação para a solução da 

equação diferencial parcial. 

6.1 O Caso Unidimensional 

Nesta seção, desenvolveremos métodos de elementos finitos para resolver o problema de Dirichlet para a 

equação de Poisson em uma dimensão 

 

′′ −u = f (x) em [0, 1] , 

(6.1) 

u (0) = u (1) = 0, 

onde f é uma função contínua. 

6.1.1 Formulação Variacional 

Para obter uma formulação variacional deste problema, defina 

e 

V = v ∈ C 0 ([0, 1]) : v ′ é contínua por partes em [0, 1] e v (0) = v (1) = 0 

F (v) = 1 

2 

1 

0 

(6.2) 

|v ′ (x)| 2 1 

dx − f (x) v (x) dx = 

0 

1 

2 v′ L2 − 〈f, v〉 L2 . (6.3) 

Veremos agora que uma solução para o problema de Dirichlet (6.1), que sabemos existir por integração 

simples, é solução tanto de um problema de minimização como de um problema variacional. 

121


6.1 Proposição. (Problema Variacional) Se u ∈ V é uma solução do problema (6.1), então u é a solução 

única do problema variacional 

Prova. Multiplicando a equação 

〈u ′ , v ′ 〉 L 2 = 〈f, v〉 L 2 para todo v ∈ V. (6.4) 

−u ′′ (x) = f (x) 

por uma função teste v ∈ V e integrando sobre o intervalo (0, 1), obtemos 

Integrando por partes, temos 

Portanto, 

1 

0 

− 

1 

0 

u ′′ (x) v (x) dx = 

u ′′ (x) v (x) dx = u (x) v (x)| 1 

0 − 

1 

1 

u 

0 

′ (x) v ′ 1 

(x) dx = 

0 

0 

f (x) v (x) dx. 

1 

u 

0 

′ (x) v ′ 1 

(x) dx = − u 

0 

′ (x) v ′ (x) dx. 

f (x) v (x) dx. 

A unicidade de solução para o problema variacional (6.4) é facilmente determinada. Se u1, u2 satisfazem 

para todo v ∈ V , então 

〈u ′ 1, v ′ 〉 L 2 = 〈f, v〉 L 2 , 

〈u ′ 2, v ′ 〉 L 2 = 〈f, v〉 L 2 , 

〈u ′ 1 − u ′ 2, v ′ 〉 L 2 = 0 

para todo v ∈ V , em particular para v = u1 − u2, donde 

u ′ 1 − u ′ 2 L 2 = 0. 

Isso implica u1 − u2 = c para alguma constante c, e as condições de fronteira implicam que c = 0. 

6.2 Proposição. (Problema de Minimização) u ∈ V é uma solução do problema variacional (6.4), se e 

somente se u satisfaz 

F (u) = min F (v) . (6.5) 

v∈V 

Prova. Suponha que u satisfaz (6.4). Dado v ∈ V , escreva w = u − v. Temos 

F (v) = F (u + w) = 1 

2 u′ + w ′ L2 − 〈f, u + w〉 L2 = 1 

2 u′ L2 + 〈u ′ , w ′ 〉 + 1 

2 w′ L2 − 〈f, u〉 L2 − 〈f, w〉 L2 = 1 

2 u′ L2 − 〈f, u〉 L2 + 〈u ′ , w ′ 〉 − 〈f, w〉 L2 + 1 

2 w′ L2 = F (u) + 1 

2 w′ L2 F (u) . 

Reciprocamente, suponha que u é um minimizador para o funcional F em V . Considere a função quadrática 

g : R −→ R definida por 

g (t) = F (u + tv) . 

Temos 

g (t) = 1 

2 u′ L 2 + t 〈u ′ , v ′ 〉 + t2 

2 v′ L 2 − 〈f, u〉 L 2 − t 〈f, v〉 L 2 

= t2 

2 v′ L 2 + t [ 〈u ′ , v ′ 〉 − 〈f, v〉 L 2] + F (u) .


Como u é um ponto de mínimo para F , 0 é um ponto de mínimo para g, logo g ′ (0) = 〈u ′ , v ′ 〉 − 〈f, v〉 L 2 = 0. 

 

O problema variacional é chamado método de Galerkin, enquanto que o problema de minimização é 

chamado método de Ritz. Coletivamente, eles são chamados simplesmente de método de Ritz-Galerkin. 

6.1.2 Elementos Finitos Lineares por Partes 

Vamos agora construir um subespaço Vh de dimensão finita de V consistindo das funções lineares por partes 

em [0, 1]. Seja 

0 = x0 < x1 < x2 < . . . < xn < xn+1 = 1 

uma partição do intervalo [0, 1] em n+1 subintervalos Ij = [xj−1, xj] de comprimento hj = xj −xj−1. Defina 

Vh = {v ∈ V : v é linear em Ij para j = 0, . . . , n} . (6.6) 

Observe que para descrever uma função v ∈ Vh é suficiente conhecer os n valores v (x1) , . . . , v (xn). Introduzimos 

uma base B = {ϕ1, . . . , ϕn} ⊂ Vh para Vh declarando 

 

1 se i = j, 

ϕj (xi) = 

(6.7) 

0 se i = j, 

(note que como estas funções são não-negativas, esta base é evidentemente não-ortogonal). Assim as funções 

v de V têm a representação 

v = v (x1) ϕ1 + . . . + v (xn) ϕn. (6.8) 

As funções ϕ1, . . . , ϕn são chamadas funções base. Note que dim Vh = n. Observe que estas funções têm 

suporte compacto, e que o suporte está contido em dois subintervalos adjacentes. 

Se uh ∈ Vh satisfaz o problema variacional 

〈u ′ h, v ′ 〉 L 2 = 〈f, v〉 L 2 para todo v ∈ Vh, (6.9) 

então em particular ′ 

u h, ϕ ′ 

j L2 Escrevendo 

= 〈f, ϕj〉 L2 para todo j = 1, . . . , n. (6.10) 

ou 

uh = uh (x1) ϕ1 + . . . + uh (xn) ϕn 

uh = u1ϕ1 + . . . + unϕn, (6.11) 

onde denotamos ui = uh (xi), obtemos um sistema linear nas incógnitas u1, . . . , un: 

A matriz do sistema 

n 

i=1 

′ 

ϕ i, ϕ ′ 

j L2 ui = 〈f, ϕj〉 L2 para j = 1, . . . , n. (6.12) 

A = 

⎡ 

⎢ 

⎣ 

〈ϕ ′ 1, ϕ ′ 1〉 L 2 . . . 〈ϕ ′ 1, ϕ ′ n〉 L 2 

. 

. 

. 

. 

〈ϕ ′ n, ϕ ′ 1〉 L 2 . . . 〈ϕ ′ n, ϕ ′ n〉 L 2 

⎤ 

⎥ 

⎦ (6.13) 

é uma matriz simétrica porque ϕ ′ i , ϕ′ 

j L2 = ϕ ′ j , ϕ′ 

i L2. Ela é chamada a matriz de rigidez e o vetor 

⎡ ⎤ 

b = 

⎢ 

⎣ 

〈f, ϕ1〉 L 2 

. 

. 

〈f, ϕn〉 L 2 

⎥ 

⎦


é chamado o vetor de carga, terminologia emprestada das primeiras aplicações do método de elementos 

finitos em mecânica de estruturas; o método foi inventado por engenheiros para tratar de tais problemas na 

década de 1950. As entradas da matriz de rigidez podem ser facilmente calculados. Primeiro observe que 

′ 

ϕ i, ϕ ′ 

j L2 = 0 se |i − j| > 1, 

porque, neste caso, onde ϕ ′ i não se anula, ϕ′ j se anula, e vice-versa. Em particular, segue que a matriz A 

é uma matriz esparsa tridiagonal. A escolha especial de Vh e das funções base garantiu a esparsidade da 

matriz de rigidez. Os elementos da diagonal principal da matriz de rigidez são dados por 

〈ϕ ′ i, ϕ ′ i〉 L 2 = 

xi+1 

ϕ 

xi−1 

′ i (x) 2 xi 1 

dx = 

xi−1 h2 i 

dx + 

xi+1 

enquanto que os elementos das diagonais secundárias são dados por 

Resumindo, 

′ 

ϕ i, ϕ ′ 

i+1 L2 = 

xi+1 

ϕ ′ i (x) ϕ ′ xi+1 

i+1 (x) dx = 

xi 

′ 

ϕ i, ϕ ′ 

j L2 = 

⎧ 

⎪⎨ ⎪ ⎩ 

xi 

xi 

1 

h 2 i+1 

 

− 1 

 

1 

hi+1 

1 

+ 

hi 

1 

se i = j, 

hi+1 

− 1 

se |i − j| = 1, 

hi+1 

0 se |i − j| > 1. 

dx = 1 

hi+1 

hi 

+ 1 

, 

hi+1 

dx = − 1 

hi+1 

. 

(6.14) 

A matriz de rigidez também é positiva definida, Se ξ = (ξ1, . . . , ξn) ∈ Rn é um vetor não-nulo e v = n 

ξiϕi, 

temos 

〈Aξ, ξ〉 = 

n 

aijξiξj = 

i,j=1 

No caso especial em que 

n 

i,j=1 

′ 

ϕ i, ϕ ′ 

j L2 

n 

ξiξj = ξiϕ 

i=1 

′ i, 

hi = xi − xi−1 = 1 

=: h, 

n + 1 

n 

j=1 

ξjϕ ′ j 

 

L 2 

= 〈v ′ , v ′ 〉 L 2 > 0. 

a matriz de rigidez é exatamente a matriz de discretização de diferenças finitas centradas: 

1 

h2 ⎡ 

2 −1 

⎤ 

⎢ 

−1 

⎢ 

⎣ 

2 

−1 

−1 

. .. 

. .. 

. .. 

. .. 

−1 

−1 

2 −1 

⎥ . 

⎥ 

⎦ 

−1 2 

6.2 O Caso Bidimensional 

Nesta seção, desenvolveremos métodos de elementos finitos para resolver o problema de Dirichlet para a 

equação de Poisson em um domínio Ω ⊂ R2 : 

 

−∆u = f em Ω, 

(6.15) 


onde f é uma função contínua. 

i=1


6.2.1 Formulação Variacional 

Para obter uma formulação variacional deste problema, defina 

e 

V = W 1,2 

0 (Ω) (6.16) 

F (v) = 1 

 

|∇v (x)| 

2 Ω 

2 

dx − f (x) v (x) dx = 

Ω 

1 

2 ∇vL2 (Ω) − 〈f, v〉 L2 (Ω) . (6.17) 

Como vimos no Capítulo 1, os problemas variacional e de minimização são equivalentes e a solução de ambos 

é a solução do problema (6.15): 

6.3 Proposição. u ∈ V é uma solução do problema (6.15), se e somente se u é a solução única do problema 

variacional 

〈∇u, ∇v〉 L 2 (Ω) = 〈f, v〉 L 2 (Ω) para todo v ∈ V, (6.18) 

ou, equivalentemente, se e somente se u satisfaz 

F (u) = min F (v) . (6.19) 

v∈V 

6.2.2 Triangulações e Elementos Finitos Lineares por Partes 

Vamos agora construir um subespaço Vh de dimensão finita de V consistindo das funções lineares por partes 

em Ω. Por simplicidade, assumiremos que Ω é um domínio poligonal, significando que ∂Ω é uma curva poligonal 

(no caso geral, é necessário antes aproximar ∂Ω por uma curva poligonal). Fazemos uma triangulação 

de Ω subdividindo Ω em um conjunto de triângulos que não se sobrepõem, podendo se interceptar apenas 

ao longo de uma aresta em comum ou em um vértice em comum: 

Ω = 

N 

Ti. (6.20) 

i=1 

Esta triangulação de Ω é também chamada uma malha triangular e os vértices da triangulação são freqüentemente 

chamados nodos. Definimos o parâmetro da malha 

h = max 

i=1,...,N (diam Ti) . (6.21) 

Observe que o diâmetro de um triângulo é o comprimento de seu maior lado. Definimos o subespaço Vh de 

dimensão finita de V por 

Vh = {v ∈ V : v é contínua em Ω e linear em Ti para i = 1, . . . , N} . (6.22) 

Para descrever uma função v ∈ Vh, é suficiente conhecer os n valores de v nos n nodos internos da triangulação 

de Ω: x1, . . . , xn (nos nodos da fronteira, v é nula). Introduzimos uma base B = {ϕ1, . . . , ϕn} ⊂ Vh para Vh 

declarando 

 

1 se i = j, 

ϕj (xi) = 

(6.23) 

0 se i = j. 

As funções v de V têm a seguinte representação em termos das funções base ϕ1, . . . , ϕn: 

v = v (x1) ϕ1 + . . . + v (xn) ϕn 

(6.24) 

e dim Vh = n. Note que o suporte de ϕj consiste dos triângulos que têm xn como um nodo comum. Tais 

funções bases podem ser definidas da seguinte forma. Se Tk é um triângulo da triangulação de Ω que tem xi


como vértice, sejam xi = x0 , y0 , a1 k = x1 , y1 e a2 k = x2 , y2 os três vértices de Tk; definimos ϕi em Tk 

por 

 

1 x − x 

ϕi (x, y) = 

y2 − y1 − y − y1 x2 − x1 (x0 − x1 ) (y2 − y1 ) − (y0 − y1 ) (x2 − x1 ) . 

 

0 0 Observe que ϕi x , y 

1 1 = 1 e ϕi x , y 

2 2 = ϕi x , y = 0. Se Tk é um triângulo da triangulação de Ω que 

não tem xi como vértice, então definimos ϕj ≡ 0 em Tk. 

Se uh ∈ Vh satisfaz o problema variacional 

então em particular 


ou 

〈∇uh, ∇v〉 L 2 (Ω) = 〈f, v〉 L 2 (Ω) para todo v ∈ Vh, (6.25) 

〈∇uh, ∇ϕj〉 L 2 (Ω) = 〈f, ϕj〉 L 2 (Ω) para todo j = 1, . . . , n. (6.26) 

uh = uh (x1) ϕ1 + . . . + uh (xn) ϕn 

uh = u1ϕ1 + . . . + unϕn, (6.27) 

onde denotamos ui = uh (xi), obtemos um sistema linear nas incógnitas u1, . . . , un: 

n 

i=1 

A matriz de rigidez (isto é, a matriz do sistema) 

〈∇ϕi, ∇ϕj〉 L 2 (Ω) ui = 〈f, ϕj〉 L 2 (Ω) para j = 1, . . . , n. (6.28) 

A = 

⎡ 

⎢ 

⎣ 

〈∇ϕ1, ∇ϕ1〉 L 2 (Ω) . . . 〈∇ϕ1, ∇ϕn〉 L 2 (Ω) 

. 

. 

〈∇ϕn, ∇ϕ1〉 L 2 (Ω) . . . 〈∇ϕn, ∇ϕn〉 L 2 (Ω) 

. 

. 

⎤ 

⎥ 

⎦ (6.29) 

é uma matriz simétrica, positiva definida, pelos mesmos motivos que a matriz de rigidez no caso unidimensional 

é. Ela é esparsa porque o suporte da função base ϕj é constituído pelos triângulos que têm o vértice xj 

em comum. De fato, 〈∇ϕi, ∇ϕj〉 L 2 (Ω) = 0 se xi e xj não são diretamente ligados pelo lado de um triângulo. 

Para calcular o valor das entradas não-nulas, é útil usar a seguinte fórmula de mudança de coordenadas: se 

T é o triângulo de vértices (0, 0), (0, 1) e (1, 0) e T é um triângulo qualquer com vértices x 0 , y 0 , x 1 , y 1 e 

x 2 , y 2 , então a aplicação φ : T −→ T definida por 

é um difeomorfismo com 

T 

φ (ξ, η) = x 0 , y 0 + ξ x 1 − x 0 , y 1 − y 0 + η x 2 − x 0 , y 2 − y 0 

det dφ (ξ, η) = x 1 − x 0 y 1 − y 0 − x 2 − x 0 y 2 − y 0 , 

de modo que se F : T −→ R é uma função contínua, então 

 

F (x, y) dxdy = x 1 − x 0 y 1 − y 0 − x 2 − x 0 y 2 − y 0 

F (φ (ξ, η)) dxdy. 

T


6.2.3 Interpretação Geométrica do Método de Elementos Finitos 

6.4 Lema. (Melhor Aproximação) Se u ∈ V é a solução exata do problema de Dirichlet (6.15) e uh é a 

solução aproximada dada pelo método de elementos finitos, então 

u − uh W 1,2 

0 (Ω) u − v W 1,2 

0 (Ω) (6.30) 

para todo v ∈ Vh, ou seja, uh é a melhor aproximação para u em Vh na norma W 1,2 

0 (Ω) . 

Prova. Como 

e 

segue que 

〈∇u, ∇v〉 L 2 (Ω) = 〈f, v〉 L 2 (Ω) 

〈∇uh, ∇v〉 L 2 (Ω) = 〈f, v〉 L 2 (Ω) 

Pela desigualdade de Cauchy, para todo v ∈ Vh vale então 


para todo v ∈ V 

para todo v ∈ Vh, 

〈∇u − ∇uh, ∇v〉 L 2 (Ω) = 0 para todo v ∈ Vh. (6.31) 

∇u − ∇uh 2 

L 2 (Ω) = 〈∇u − ∇uh, ∇u − ∇uh〉 L 2 (Ω) + 〈∇u − ∇uh, ∇uh − ∇v〉 L 2 (Ω) 

= 〈∇u − ∇uh, ∇u − ∇v〉 L 2 (Ω) 

∇u − ∇uh L 2 (Ω) ∇u − ∇v L 2 (Ω) , 

∇u − ∇uh L 2 (Ω) ∇u − ∇v L 2 (Ω) 

para todo v ∈ Vh. Lembrando que a norma L 2 do gradiente é uma norma em W 1,2 

0 (Ω), pela desigualdade 

de Poincaré, segue o resultado. 

6.3 Formulação Abstrata do Método dos Elementos Finitos 

Denotaremos por V um espaço de Hilbert com produto escalar 〈·, ·〉 V e correspondente norma induzida · V . 

Definição. Uma forma bilinear a : V × V −→ R é limitada (ou contínua) se existe uma constante Λ > 0 

tal que 

|a (u, v)| Λ u V v V para todos u, v ∈ V. (6.32) 

a é coerciva se existe um número α > 0 tal que 

|a (v, v)| α v 2 

V para todo v ∈ V. (6.33) 

6.5 Lema. (Teorema de Lax-Milgram) Sejam V um espaço de Hilbert e a : V × V −→ R uma forma 

bilinear limitada e coerciva em V . Então para todo funcional linear limitado f : V −→ R existe um 

único u ∈ V tal que 

a (u, v) = f (v) para todo v ∈ V. 

Se a forma bilinear a que satisfaz as hipóteses do Teorema de Lax-Milgram for simétrica, isto é, 

a (u, v) = a (v, u) para todos u, v ∈ V, (6.34) 

então ela define um produto interno em V , e a conclusão segue diretamente do Teorema de Representação 

de Riesz. Seja a uma forma bilinear limitada coerciva e f um funcional linear limitado em V . Consideremos 

o funcional F : V −→ R definido por 

F (v) = 1 

a (v, v) − f (v) . (6.35) 

2


No caso da equação de Poisson com condição de Dirichlet homogênea, temos V = W 1,2 

0 (Ω) e 

de modo que a é simétrica. 

 

a (u, v) = 

 

f (v) = 

Ω 

Ω 

∇u · ∇v, 

6.6 Lema. Sejam V um espaço de Hilbert, a : V × V −→ R uma forma bilinear simétrica, limitada e 

coerciva em V com 

|a (v, v)| α v 2 

V para todo v ∈ V 

fv, 

e f : V −→ R um funcional linear limitado em V com 

|f (v)| C v V 

para todo v ∈ V. 

Então existe uma única solução u ∈ V para o problema variacional 

a (u, v) = f (v) para todo v ∈ V. (6.36) 

se e somente se existe uma única solução u ∈ V para o problema de minimização 

F (u) = min F (v) . 

v∈V 

Além disso, existe de fato uma única solução u ∈ V para estes problemas e ela satisfaz a seguinte 

condição de estabilidade: 

u V C 

α . 

Prova. A existência de solução para o problema variacional segue do teorema de Lax-Milgram. Suponha 

que u satisfaz o problema variacional. Dado v ∈ V , escreva w = u − v. Temos 

F (v) = F (u + w) = 1 

a (u + w, u + w) − f (u + w) 

2 

= 1 

2 

1 

a (u, u) + a (u, w) + a (w, w) − f (u) − f (w) 

2 

= 1 

2 

= F (u) + 1 

α 

a (w, w) F (u) + 

2 2 w2 V 

F (u) . 

1 

a (u, u) + f (w) + a (w, w) − f (u) − f (w) 

2 

Reciprocamente, suponha que u é um minimizador para o funcional F em V . Considere a função quadrática 

g : R −→ R definida por 

g (t) = F (u + tv) = 1 

a (u + tv, u + tv) − f (u + tv) 

2 

= 1 

t2 

a (u, u) + ta (u, v) + a (v, v) − f (u) − tf (v) 

2 2 

= t2 

a (v, v) + t [ a (u, v) − f (v)] + F (u) . 

2 

Como u é um ponto de mínimo para F , 0 é um ponto de mínimo para g, logo g ′ (0) = a (u, v) − f (v) = 0 

para todo v ∈ V .


Para provar a estimativa de estabilidade, escreva 

α u 2 

V a (u, u) = f (u) C u V . 

 

Observe que pelo Teorema de Lax-Milgram a solução para o problema variacional existe mesmo se a forma 

bilinear não é simétrica. No entanto, neste caso não existe um problema de minimização associado. 

Seja Vh um subespaço de V de dimensão finita. Seja B = {ϕ1, . . . , ϕn} uma base para Vh e 

v = v1ϕ1 + . . . + vnϕn 

a representação de v nesta base. Se uh ∈ Vh satisfaz o problema variacional 

então em particular 


obtemos um sistema linear nas incógnitas u1, . . . , un: 

A matriz do sistema 

é chamada matriz de rigidez. 

a (uh, v) = f (v) para todo v ∈ Vh, (6.37) 

a (uh, ϕj) = f (ϕj) para todo j = 1, . . . , n. (6.38) 

uh = u1ϕ1 + . . . + unϕn, (6.39) 

n 

a (ϕi, ϕj) ui = f (ϕj) para j = 1, . . . , n. (6.40) 

i=1 

⎡ 

⎢ 

A = ⎣ 

a (ϕ1, ϕ1) 

. 

. 

. . . a (ϕ1, ϕn) 

. 

. 

⎤ 

⎥ 

⎦ 

a (ϕn, ϕ1) . . . a (ϕn, ϕn) 

6.7 Proposição. Se a : V × V −→ R é uma forma bilinear simétrica, limitada e coerciva em V , então a 

matriz de rigidez é simétrica e positiva definida. 

Em particular, existe uma única solução para o problema discretizado (6.37). Além disso, vale a mesma 

estimativa de estabilidade do lema anterior. 

Prova. Seja A = (aij). Se ξ = (ξ1, . . . , ξn) ∈ Rn é um vetor não-nulo e v = n 

ξiϕi, temos 

 

〈Aξ, ξ〉 = 

⎛ 

n 

aijξiξj = 

n 

n n 

a (ϕi, ϕj) ξiξj = a ⎝ ξiϕi, 

i,j=1 

i,j=1 

Vamos agora provar a seguinte estimativa de erro: 

i=1 

j=1 

ξjϕj 

⎞ 

i=1 

⎠ = a (v, v) α v 2 

V 

6.8 Proposição. (Estimativa de Erro) Se u ∈ V é a solução exata para o problema variacional (6.36) e uh 

é a solução do problema discretizado (6.37), então 

para todo v ∈ Vh. 

u − uh V Λ 

α u − v V 

> 0. 

(6.41)


Prova. Como 

e 

segue que 

Para todo v ∈ Vh vale então 


a (u, v) = f (v) para todo v ∈ V 

a (uh, v) = f (v) para todo v ∈ Vh, 

a (u − uh, v) = 0 para todo v ∈ Vh. (6.42) 

α u − uh 2 

V a (u − uh, u − uh) + a (u − uh, uh − v) 

= a (u − uh, u − v) 

Λ u − uh V u − v V , 

u − uh 2 

V 

Λ 

α ∇u − ∇v L 2 (Ω) 

para todo v ∈ Vh. 

Introduzimos uma norma equivalente em V , induzida pela forma bilinear simétrica a, definindo 

De fato, 

Esta norma é chamada norma da energia. 

v a = a (v, v) 1/2 . (6.43) 

√ α vV v a √ Λ v V . 

6.9 Proposição. (Melhor Aproximação) Se u ∈ V é a solução exata para o problema variacional (6.36) e 

uh é a solução do problema discretizado (6.37), então 

u − uh a u − v a 

para todo v ∈ Vh, ou seja, uh é a melhor aproximação para u em Vh na norma da energia. 

Prova. A demonstração é análoga à da proposição anterior. 

(6.44)

Capítulo 7 

Aproximação de Autovalores do 

Laplaciano 

Neste capítulo desejamos mostrar que tanto os autovalores da matriz de discretização, quanto os autovalores 

da matriz de rigidez, são aproximações para os autovalores do laplaciano, o que produz métodos numéricos 

para encontrar os autovalores do laplaciano em domínios arbitrários. 

7.1 Elementos Finitos 

Como vimos, o problema de autovalor para o laplaciano com condição de Dirichlet 



pode ser formulado variacionalmente como 


a (u, v) = λ 〈u, v〉 L 2 (Ω) 

 

a (u, v) = 〈∇u, ∇v〉 L2 (Ω) = 

(7.1) 

para todo v ∈ V = W 1,2 

0 (Ω) , (7.2) 

Ω 

∇u · ∇v. 

A discretização correspondente de Ritz-Galerkin (isto é, elementos finitos) do problema de autovalor é 

a (uh, v) = λh 〈uh, v〉 L 2 (Ω) para todo v ∈ Vh. (7.3) 

Escolhendo uma base B = {ϕ1, . . . , ϕn} para Vh, de modo que 

e 

a (uh, v) = 

〈uh, v〉 L 2 (Ω) = 

uh = 

n 

uiϕi, v = 

i=1 

n 

uia (ϕi, ϕj) vj = 

i,j=1 

n 

i=1 

viϕi 

n 

ui 〈∇ϕi, ∇ϕj〉 L2 (Ω) 

vj = u t hAv, 

i,j=1 

n 

ui 〈ϕi, ϕj〉 L2 (Ω) 

vj = u t hMv, 

i,j=1 

131



é a matriz de rigidez e 

A = 

M = 

 

 

〈∇ϕi, ∇ϕj〉 L2 (Ω) 

1i,jn 

 

 

〈ϕi, ϕj〉 L2 (Ω) 

1i,jn 

é a chamada matriz de massa, este problema toma a seguinte forma matricial: 

Auh = λhMuh. (7.4) 

Ou seja, é um problema de autovalor generalizado. Para transformá-lo em um problema de autovalor 

“normal”, observe que a matriz de massa é simétrica e positiva definida, pois se ξ = (ξ1, . . . , ξn) ∈ Rn é um 

vetor não-nulo e v = n 

ξiϕi, temos 

i=1 

〈Mξ, ξ〉 = 

Logo, podemos decompor 

n 

 

n n 

〈ϕi, ϕj〉 L2 (Ω) 

ξiξj = ξiϕi, 

i,j=1 

i=1 

M = B t B 

j=1 

ξjϕj 

 

L 2 (Ω) 

= 〈v, v〉 L 2 (Ω) > 0. 

onde B também é simétrica positiva definida (por exemplo, a menos de similaridade ortogonal, B = M 1/2 ). 

Definindo 

A = B −t AB −1 , 

uh = Buh, 

o problema de autovalor generalizado (7.4) é transformado no problema de autovalor: 

Os autovalores em ambos os problemas são iguais, mas não as autofunções. 

7.1.1 Resultados Preliminares 

Auh = λhuh. (7.5) 

De agora em diante, além da continuidade e coercividade da forma bilinear a (no caso da equação de Poisson, 

observe que podemos tomar a constante de coercividade igual a 1 usando a norma equivalente em W 1,2 

0 (Ω)) 

e do fato que W 1,2 

0 (Ω) está compactamente imerso em L 2 (Ω), assumiremos que {Vhi}, hi → 0, será sempre 

uma seqüência de subespaços de dimensão finita de V que aproximam V no sentido que 

ou, dito de outro modo, 

lim dist (u, Vhi ) = 0 para todo u ∈ V (7.6) 

hi→0 

lim 

hi→0 inf {u − uhV : uh ∈ Vhi} para todo uh ∈ V. (7.7) 

Nestas condições, pode-se provar que a solução uh dada pelo método de elementos finitos converge na norma 

de V para a solução exata u (veja [Hackbusch]). Uma condição suficiente para assegurar (7.6) é que 

Vh1 ⊂ Vh2 ⊂ . . . ⊂ Vhi ⊂ Vhi+1 ⊂ . . . ⊂ V e 

∞ 

i=1 

Vhi é denso em V. (7.8)


Defina a forma bilinear 

aλ (u, v) = a (u, v) − λ 〈u, v〉 L 2 (Ω) . (7.9) 

Se a é coerciva com constante de coercividade α, então aλ também é coerciva para todo |λ| < α (veja Lema 

7.2 a seguir). Em seguida, considere os números 

ω (λ) = inf 

u∈V 

sup 

v∈V 

uV =1 vV =1 

ωh (λ) = inf 

u∈Vh 

uV =1 

sup 

v∈Vh 

v V =1 

|aλ (u, v)| , (7.10) 

|aλ (u, v)| . (7.11) 

A relação entre os números ω (λ) e ωh (λ) e os respectivos problemas de autovalores é dada pelos Lemas 7.1 

e 7.2 a seguir. 

A uma forma bilinear contínua a : V × V −→ R podemos associar de forma única um operador linear 

contínuo L : V −→ V ′ que satisfaz 

a (u, v) = (Lu) (v) . (7.12) 

Além disso, se 

para todos u, v ∈ V , então 

|a (u, v)| C u V v V 

L C. 

7.1 Lema. Sejam L e Lh os operadores lineares associados às formas bilineares a : V × V −→ R e a : 

Vh × Vh −→ R, respectivamente. 

Se λ não é um autovalor, temos 

1 

ω (λ) = 

 

(L − λI) −1 , 

 

1 

ωh (λ) = 

 

(Lh − λI) −1 . 

 

Prova. Se λ não é um autovalor, então o operador linear L − λI é invertível pela alternativa de Fredholm. 

Observe que L − λI é precisamente o operador linear associado à forma bilinear aλ. Denotando A = L − λI, 

temos 

ω (λ) = inf sup 

u∈V v∈V 

u=0 v=0 

= inf 

u ′ ∈V ′ 

u ′ =0 

= 

1 

A −1 . 

|aλ (u, v)| 

u V v V 

1 

A −1 u ′ V 

A demonstração para ωh (λ) é análoga. 

= inf sup 

u∈V v∈V 

u=0 v=0 

|u 

sup 

v∈V 

v=0 

′ (v)| 

= inf 

vV u ′ ∈V ′ 

u ′ =0 

|(Au) (v)| 

u V v V 

1 

= inf 

A −1 u ′ V 

7.2 Lema. λ é um autovalor de (7.2) se e somente se ω (λ) = 0. 

λh é um autovalor de (7.3) se e somente se ωh (λh) = 0. 

u ′ ∈V ′ 

u ′ =0 

sup 

v∈V 

v=0 

u ′ V 

 

AA −1 u ′ (v) 

A −1 u ′ V v V 

Prova. Se λ é um autovalor de (7.2), então por definição existe u ∈ V tal que aλ (u, v) = 0 para todo v ∈ V , 

donde ω (λ) = 0. Reciprocamente, se λ não é um autovalor, pelo lema anterior ω (λ) = 0. A demonstração 

para ωh (λ) é análoga.


7.3 Corolário. ω (λ) e ωh (λ) são contínuas em λ ∈ C. 

7.4 Lema. Se a : V × V −→ R é uma forma bilinear coerciva com 

|a (v, v)| α v 2 

V 

para todo v ∈ V, 

então existe µ ∈ R tal que aµ também é coerciva. Além disso, 

Prova. Temos 

ω (µ) α − |µ| , 

ωh (µ) α − |µ| . 

|aλ (u, u)| |a (u, u)| − |λ| u 2 

L2 (Ω) (α − |λ|) u2 V , 

de modo que aλ é coerciva sempre que |λ| < α. Para provar as desigualdades, note que se u ∈ V e uV = 1 

então 

sup |aλ (u, v)| |aλ (u, u)| α − |µ| . 

v∈V 

vV =1 

 

7.5 Lema. Seja K ⊂ C compacto. Então existem números C > 0 e ηh > 0 independentes de λ ∈ K com 

lim 

h→0 ηh = 0 tais que 

para todo λ ∈ K. 

ωh (λ) Cω (λ) − ηh, (7.13) 

ω (λ) Cωh (λ) − ηh, (7.14) 

Prova. Escolha µ ∈ R como no lema anterior. Defina operadores Zλ : V −→ V e Z h λ : V −→ Vh por 

z = Zλ (u) é a solução de aµ (z, v) = (λ − µ) 〈u, v〉 L 2 (Ω) para todo v ∈ V, 

zh = Z h λ (u) é a solução de aµ (zh, v) = (λ − µ) 〈u, v〉 L 2 (Ω) para todo v ∈ Vh. 

A existência e unicidade de z e zh é garantida pelo Teorema de Lax-Milgram. Observe que 

pois 

aλ (u, v) = aµ (u − z, v) , (7.15) 

aλ (u, v) = a (u, v) − λ 〈u, v〉 L 2 (Ω) 

= a (u, v) − µ 〈u, v〉 L 2 (Ω) − (λ − µ) 〈u, v〉 L 2 (Ω) 

= aµ (u, v) − aµ (z, v) . 

Usando a continuidade dos operadores Zλ, Z h λ com relação a λ e a compacidade de K, seja CZ > 0 uma 

constante positiva tal que 

Zλ , Z h 

 

λ CZ para todo λ ∈ K. (7.16) 

Denote por Cµ uma constante de continuidade para a forma bilinear aµ, isto é, 

|aµ (v, w)| Cµ v V w V 

(7.17) 

para todos u, v ∈ V , por C0 uma constante uniforme de continuidade para as formas bilineares aλ, λ ∈ K, 

isto é, 

|aλ (v, w)| C0 v V w V , (7.18)


para todos u, v ∈ V , para todo λ ∈ K, e 

β = α − |µ| . (7.19) 

Consideremos a primeira desigualdade, (7.13). Da definição de ω (λ), segue que para todo u ∈ V vale 

ω (λ) uV sup |aλ (u, v)| = sup |aµ (u − z, v)| Cµ u − zV . (7.20) 

v∈V 

v∈V 

vV =1 

vV =1 

Usando o Lema 7.4 e esta última desigualdade escrevemos então 

sup |aλ (u, v)| = sup |aµ (u − zh, v)| 

v∈Vh 

v∈Vh 

vV =1 

vV =1 

ωh (µ) u − zh V 

para todo u ∈ V . Escolhendo u ∈ Vh tal que u V = 1 e 

obtemos 

ωh (λ) = inf 

u∈Vh 

uV =1 

sup 

v∈Vh 

v V =1 

β u − zhV β (u − zV − z − zhV ) 

 

ω (λ) 

β − Zλ − Z h 

 

 

λ 

Cµ 

|aλ (u, v)| = min 

u∈Vh 

ωh (λ) β 

Cµ 

sup 

v∈Vh 

uV =1 vV =1 

u V 

|aλ (u, v)| = sup |aλ (u, v)| , 

v∈Vh 

vV =1 

ω (λ) − β Zλ − Z h 

 

λ . (7.21) 

Portanto, (7.13) segue se provarmos que 

lim 

h→0 sup 

 

Zλ − Z 

λ∈K 

h 

 

λ = 0. (7.22) 

Da mesma forma, a demonstração de (7.14) depende de (7.22). De fato, pela definição de ωh (λ) segue 

que para todo uh ∈ Vh temos 

ωh (λ) uhV sup |aλ (uh, v)| = sup |aµ (uh − zh, v)| Cµ uh − zhV . (7.23) 

v∈Vh 

v∈Vh 

vV =1 

vV =1 

Usando o Lema 7.4 e esta última desigualdade escrevemos 

sup |aλ (uh, v)| = sup |aµ (uh − z, v)| 

v∈V 

v∈V 

vV =1 

vV =1 

para todo uh ∈ Vh. Escolha u ∈ V tal que u V = 1 e 

ω (λ) = inf 

u∈V 

sup 

v∈V 

uV =1 vV =1 

ω (µ) uh − z V 

β uh − zV β (uh − zhV − z − zhV ) 

 

ωh (λ) 

β − Zλ − Z h 

 

 

λ 

|aλ (u, v)| = min 

u∈V 

Cµ 

sup 

v∈V 

uV =1 vV =1 

uh V 

|aλ (u, v)| = sup |aλ (u, v)| . 

v∈V 

vV =1


Como 

segue que 


sup |aλ (u − uh, v)| C0 u − uhV , 

v∈V 

vV =1 

ω (λ) + C0 u − uhV sup |aλ (u, v)| + sup |aλ (u − uh, v)| 

v∈V 

v∈V 

vV =1 

vV =1 

Cµ 

sup 

v∈V 

v V =1 

|aλ (uh, v)| 

 

ωh (λ) 

β − Zλ − Z h 

 

 

λ uhV , 

Cµ 

 

β 

ω (λ) ωh (λ) − β Zλ − Z h 

 

 

λ uhV − C0 u − uhV . 

Como para cada h podemos escolher uh tal que u − uhV → 0 quando h → 0, por (7.7), (7.14) será provado 

se (7.22) for verdadeiro. 

Para terminar a demonstração do lema, provaremos agora (7.22). Suponha por absurdo que existe ε > 0, 

{λi} ⊂ K e hi → 0 tal que 

Zλi − Z hi 

 

 

ε. 

Então existe uma seqüência {ui} ⊂ V com uiV = 1 tal que 

 

 

Zλi (ui) − Z hi 

λi (ui) 

 

 

Pela compacidade de K e da imersão V −→ L 2 (Ω), podemos assumir a menos de uma subseqüência que 

λi → λ0, 

λi 

V 

ui → u0 em V ′ . 

ε 

2 . 

Segue do fato que a solução dada por elementos finitos aproxima a solução exata que 

 

 

Zλ0 (u0) − Z hi 

λ0 (u0) 

 

 

→ 0. 

Logo, 


 

 

Zλi (ui) − Z hi 

λi (ui) 

 

 

V 

V 

 

 

Zλi (ui) − Zλ0 (ui)V + Z hi 

λ0 (ui) − Z hi 

λi (ui) 

 

 

 

V 

 

 

+ Zλ0 (ui − u0)V + Z hi 

λ0 (u0 

 

 

− ui) 

V 

 

 

+ Zλ0 (u0) − Z hi 

λ0 (u0) 

 

 

 

V 

 

2C |λi − λ0| + 2Cz u0 − uiV ′ + Zλ0 (u0) − Z hi 

λ0 (u0) 

 

 

→ 0 

V


7.1.2 Convergência dos Autovalores Discretos para os Autovalores Contínuos 

A convergência dos autovalores discretos para os autovalores exatos pode ser agora demonstrada: 

7.6 Teorema. Sejam λhi autovalores discretos de (7.3) tais que 

Então λ0 é um autovalor de (7.2). 

lim λhi = λ0. (7.24) 

Prova. Suponha por absurdo que λ0 não é um autovalor de (7.2). Então, pelo Lema 7.2, 

ω (λ0) = η0 > 0. 

Como ω (λ) é uma função contínua, existe ε0 > 0 tal que 

ω (λ) η0 

2 

para todo λ ∈ Dε0 (λ0) = {z ∈ C : |z − λ0| ε0}. Escolha K = Dε0 (λ0) no Lema 7.5 e sejam ηh e C os 

números dados naquele lema. Como lim ηhi = 0, seja h0 > 0 tal que 

ηh C η0 

4 

para todo h h0. Segue dos Lemas 7.2 e 7.5 que para todo λhi ∈ Dε0 (λ0) com hi h0 nós temos 


> 0 

0 = ωhi (λhi) Cω (λhi) − ηhi C η0 

2 

− C η0 

4 

= C η0 

4 

7.7 Lema. As funções ω (λ) e ωh (λ) não possuem um mínimo positivo próprio no interior de um compacto 

K ⊂ C. 

Prova. Seja L o operador associado à forma bilinear a. Sejam µ um ponto interior de K com ω (µ) > 0 

e ε > 0 suficientemente pequeno para que Dε (µ) ⊂ K e ω (λ) > 0 para todo λ ∈ Dε (µ). Pelo Lema 7.2, 

(L − λI) −1 está definida em Dε (µ), logo é holomórfica aí. Pela fórmula integral de Cauchy, 

(L − λI) −1 = 1 

 

2πi ∂Dε(µ) 

para todo λ ∈ Dε (µ). Daí, 

1 

ω (λ) = 

 

 

(L − λI) −1 max 


z∈∂Dε(µ) 

 

 

ω (λ) min ω (z) 


(L − zI) −1 

dz 

z − λ 

(L − zI) −1 = max 


> 0, 

1 

ω (z) , 

para todo λ ∈ Dε (µ). Portanto, ω (λ) não pode assumir um mínimo próprio em Dε (µ). 

A demonstração para ωh (λ) é análoga. 

A recíproca do Teorema 7.6, isto é, que todos os autovalores reais podem ser aproximados por uma 

seqüência de autovalores discretos, é dada no próximo resultado: 

7.8 Teorema. Seja λ0 um autovalor de (7.2). Então existem autovalores discretos λh de (7.3) tais que 

lim 

h→0 λh = λ0. (7.25)


Prova. Os autovalores do laplaciano são isolados, logo pelo Lema 7.2 

ω (λ) > 0 para todo 0 < |λ − λ0| < ε 

se ε > 0 é suficientemente pequeno. Como ω (λ) é contínua e ∂Dε (λ0) é compacto, temos 

ωε = min ω (λ) > 0. 

∂Dε(λ0) 

Segue do Lema 7.5 que para todo λ ∈ ∂Dε (λ0) e para todo h suficientemente pequeno temos 

ηh < C 

1 + 1 

ωε, 

C 


ωh (λ) Cω (λ) − ηh Cωε − ηh > ηh 

C ωh 

ω (λ0) 

(λ0) − 

C = ωh (λ0) . 

Em particular, ωh (λ) tem um mínimo próprio em Dε (λ0). Pelo lema anterior, isso implica que existe 

λh ∈ Dε (λ0) tal que ωh (λh) = 0, isto é, λh é um autovalor discreto. 

7.1.3 Convergência das Autofunções 

A convergência das autofunções segue do próximo teorema: 

7.9 Teorema. Sejam uh autofunções de (7.3) associadas respectivamentes aos autovalores discretos λh e 

satisfazendo uhV = 1 e lim λh = λ0. Então existe uma subseqüência uhi que converge em V para 

h→0 

uma autofunção u0 associada ao autovalor λ0 de (7.2) com u0V = 1. 

Prova. Usando o fato que V = W 1,2 

0 (Ω) está compactamente imerso em L 2 (Ω), obtemos uma subseqüência 

uhi convergente para u0 ∈ L 2 (Ω). Como no Lema 7.4, definimos 

z0 = Zλ0 (u0) é a solução de aµ (z0, v) = (λ0 − µ) 〈u0, v〉 L 2 (Ω) para todo v ∈ V, 

zhi = Z hi 

λ0 (u0) é a solução de aµ (zhi, v) = (λ0 − µ) 〈u0, v〉 L 2 (Ω) para todo v ∈ Vhi. 

Dado ε > 0, existe h 1 ε > 0 tal que 

se hi < h 1 ε. A função uhi é uma solução de 

ou seja, uhi = Z hi 

λi (uhi). Segue que 

z0 − zhi V < ε 

2 

aµ (uhi, v) = (λhi − µ) 〈uhi, v〉 L 2 (Ω) para todo v ∈ Vhi, 

fi (v) := aµ (zhi − uhi, v) 

= (λ0 − µ) 〈u0, v〉 L 2 (Ω) − (λhi − µ) 〈uhi, v〉 L 2 (Ω) 

= (λ0 − µ) 〈u0 − uhi, v〉 L 2 (Ω) − (λhi − λ0) 〈uhi, v〉 L 2 (Ω) 

para todo v ∈ Vhi. Mas fi → 0 em V ′ porque λhi → λ0 e uhi → u0 em L 2 (Ω), logo existe h 2 ε > 0 tal que 

fi V ′ ε 

2α 

(7.26)


e 

para hi < h 2 ε. Portanto, 

se hi < min h1 ε, h2 

ε , o que implica 


ou seja, 

e, portanto, 

 

zhi − uhi V < ε 

2 

z0 − uhi V < ε 

uhi → z0 em V, 

z0 = u0, 

aµ (u0, v) = (λ0 − µ) 〈u0, v〉 L 2 (Ω) para todo v ∈ V, 

a (u0, v) = λ0 〈u0, v〉 L 2 (Ω) para todo v ∈ V. 

(7.27)

Capítulo 8 

Métodos Numéricos para a Obtenção 

de Autovalores de Matrizes 

Os autovalores de uma matriz A são as raízes do polinômio característico de A 

p (λ) = det (λI − A) = λ n + an−1λ n−1 + . . . + a1λ + a0. 

Encontrar as raízes de um polinômio não é uma tarefa simples e nenhum dos algoritmos usados para encontrar 

os autovalores de uma matriz é baseado nesta estratégia (além disso, obter o polinômio característico de 

uma matriz grande também pode ser uma tarefa que consome muito tempo e recursos computacionais). Na 

verdade, muitos algoritmos para encontrar raízes de polinômios são baseados em algoritmos para encontrar 

autovalores de matrizes. Eles são baseados no fato que, dado um polinômio mônico p qualquer, ele é o 

polinômio característico da matriz companheira de p: 

⎡ 

⎤ 

−an−1 −an−2 . . . −a1 −a0 

⎢ 

1 0 . . . 0 0 ⎥ 

⎢ 

A = ⎢ 

. 

⎢ 0 1 

.. 

⎥ 

0 0 ⎥ . 

⎢ 

⎣ . 

. . ⎥ 

. 

.. 

0 0 ⎦ 

0 0 . . . 1 0 

Assim, encontrar as raízes do polinômio p é equivalente a encontrar os autovalores da matriz companheira 

de p. Por exemplo, o comando roots em MATLAB encontra as raízes de um polinômio transformando-o 

primeiro em um polinômio mônico e em seguida utilizando o eficiente algoritmo QR, discutido neste capítulo, 

para encontrar os autovalores da matriz companheira. 

Diferente do caso da resolução de sistemas lineares, em que existem métodos diretos eficientes para 

matrizes grandes, esparsas ou não, não existem correspondentes métodos diretos para obter autovalores de 

uma matriz (um método é chamado direto se a solução é obtida após um número finito de passos). Isso é 

devido ao teorema de Abel que diz que não existe uma fórmula geral para obter as raízes de um polinômio 

de grau maior que 4; se existisse um procedimento finito para obter os autovalores de uma matriz, usando a 

equivalência entre as raízes de um polinômio e os autovalores de sua matriz companheira, obteríamos uma 

fórmula geral para obter as raízes de um polinômio, por mais complicada que fosse. Portanto, todos os 

algoritmos para obter autovalores são iterativos. 

8.1 Método das Potências 

O método das potências é o algoritmo mais simples, mas ele pode apenas encontrar o maior autovalor de uma 

matriz A. Para simplificar a exposição, suponha que A é uma matriz diagonalizável cujo maior autovalor é 

140


um autovalor simples. Ordene os autovalores de A na forma 

|λ1| > |λ2| . . . |λn| 

e seja {v1, . . . , vn} uma base correspondente de autovetores. λ1 é chamado o autovalor dominante de A e 

v1 um autovetor dominante. Quando A tem um autovalor dominante, este e um correspondente autovetor 

dominante podem ser encontrados através do método das potências, que consiste essencialmente em tomar 

um vetor q arbitrário e considerar as potências 

ou seja, 

q, Aq, A 2 q, . . . , A k q, . . . 

A k q = A A k−1 q . 

Para quase todas as escolhas de q esta seqüência converge em um certo sentido para um autovetor dominante 

de A. De fato, para a maioria das escolhas de q devemos ter 

q = 

com a1 = 0; raramente uma escolha aleatória de q produzirá um vetor no subespaço 〈v2, . . . , vn〉. Temos 


A k q = λ k 1 

A k q = 

 

a1v1 + 

n 

i=1 

n 

i=1 

aivi 

aiλ k i vi, 

Embora A k q → ∞ se λ1 > 1 e A k q → 0 se λ1 < 1, como 

k λi 

para todo i = 2, . . . , n, segue que a seqüência reescalada 

λ1 

qk = Ak q 

λ k 1 

n 

k λi 

ai vi 

λ1 

i=2 

→ 0, 

→ a1v1 

converge para um autovetor dominante. No entanto, como o autovalor λ1 não é conhecido a priori, é 

impossível trabalhar com esta seqüência. Em geral, escolhemos um fator de escala σk e definimos 

qk+1 = 1 

σk+1 

 

. 

Aqk. (8.1) 

O fator de escala σk é comumente escolhido como sendo o valor da coordenada de Aqk que tem o maior 

valor absoluto. Deste modo, o maior componente de qk é igual a 1 e a seqüência converge para um autovetor 

dominante cujo maior componente é 1. 

8.1.1 Iteração Inversa e Iteração com Deslocamento 

O método das potência permite apenas encontrar o autovalor dominante. Para obter o menor autovalor de 

A, podemos aplicar o método das potências à matriz A −1 , pois se λ é o menor autovalor de A, 1/λ será


o maior autovalor de A −1 . Este método é chamado método das potências inverso ou iteração inversa (em 

contraste, o método das potências é às vezes chamado iteração direta). 

Para encontrar os demais autovalores da matriz A, observe que se A tem autovalores λ1, . . . , λn, então 

A − σI tem autovalores λ1 − σ, . . . , λn − σ. O escalar σ é chamado um deslocamento. Podemos então aplicar 

o método das potências à matriz (A − σI) −1 , pois o maior autovalor desta matriz é 1/ (λ − σ), onde λ é o 

autovalor de A mais próximo de σ. De fato, se 

(A − σI) −1 v = µv, 

então v = µ (A − σI) v, donde 

 

Av = σ + 1 

 

v. 

µ 

Assim, podemos escolher quais autovalores de A encontrar através da escolha do deslocamento σ. Este 

método é chamado iteração com deslocamento. 

estimativas para os autovalores de A. 

Ele é particularmente eficiente quando possuímos boas 

É muito importante notar que tanto na iteração inversa, quanto na iteração com deslocamento, em 

nenhum momento é necessário calcular a inversa A−1 recursos. Embora as iteradas satisfazem 

explicitamente, o que consumiria muito tempo e 

qk+1 = 1 

(A − σI) −1 qk, 

basta resolver o sistema 

e então tomar 

8.2 Iteração de Subespaços 

σk+1 

(A − σI) qk+1 = qk 

qk+1 = 1 

qk+1. 

σk+1 

O método de potências pode ser visto como uma iteração de subespaços 

S0 = 〈q〉 , 

S1 = AS, 

S2 = A 2 S, 

. 

. 

Sk = A k S, 

. 

. 

que convergem para o subespaço T = 〈v1〉 associado ao autovalor dominante de A. Esta idéia pode ser 

tornada mais precisa quando se define a distância entre dois subespaços vetoriais. 

Definição. Dados dois subespaços vetoriais E, F de um espaço vetorial V de dimensão finita com produto 

interno, cujas dimensões m = dim E, p = dim F satisfazem 

m p 1, 

os ângulos principais θ1, . . . , θp ∈ [0, π/2] entre E e F são definidos recursivamente por 

cos θj = max 

u∈E 

u=1 

〈u,ui〉=0 

para i=1,...,j−1 

max 

v∈F 

v=1 

〈v,vi〉=0 

para i=1,...,j−1 

〈u, v〉 = 〈uj, vj〉 . 

Os vetores {u1, . . . , up} e {v1, . . . , vp} são chamados os vetores principais entre os subespaços E e F .


Em outras palavras, escolha vetores u1, v1 tais que o máximo 

é realizado nestes vetores, e defina 

max 

u∈E 

max 

v∈F 

u=1 v=1 

〈u, v〉 

cos θ1 = 〈u1, v1〉 . 

Por exemplo, se dim E = 2 e dim F = 1, então θ1 é o maior ângulo que a reta F faz com retas de E; se 

dim E = dim F = 2, então θ1 é o maior ângulo entre uma reta de E e uma reta de F . Em seguida, escolha 

vetores u2, v2 tais que o máximo 

é realizado nestes vetores, e defina 

max 

u∈E 

u=1 

〈u,u1〉=0 

max 

v∈F 

v=1 

〈v,v1〉=0 

〈u, v〉 

cos θ2 = 〈u2, v2〉 . 

Por exemplo, se dim E = dim F = 2, então θ2 = 0 porque u2 = v2. E assim por diante definimos os ângulos 

principais restantes θ3, . . . , θp. Ângulos principais e vetores principais aparecem em aplicações de estatística 

e permitem a definição de uma noção de distância entre subespaços vetoriais de mesma dimensão. 

Definição. Dados dois subespaços vetoriais de mesma dimensão S1, S2 ⊂ V a distância dist (S1, S2) entre 

S1 e S2 é o seno do maior ângulo principal entre eles. 

Dada uma seqüência de subespaços {Sk} ⊂ V e um subespaço T ⊂ V , todos de mesma dimensão, 

dizemos que Sk converge para T , denotado por 

se 

Sk → T 

dist (Sk, T ) → 0. 

8.1 Teorema. Seja A ∈ Mn (F) uma matriz diagonalizável com autovalores λ1, . . . , λn ∈ F satisfazendo 

|λ1| |λ2| . . . |λn| 

Seja B = {v1, . . . , vn} ⊂ F n uma base de autovetores correspondente. Suponha que |λm| > |λm+1| para 

algum m. Sejam 

Tm = 〈v1, . . . , vm〉 , 

Um = 〈vm+1, . . . , vn〉 . 

Seja S um subespaço m-dimensional qualquer de Fn tal que S ∩Um = {0}. Então existe uma constante 

C > 0 tal que 

dist A k k 

λm+1 

 

S, Tm C 

para todo k. 

Em particular, A k S → Tm. 

Prova. Embora não demonstraremos o Teorema 8.1 rigorosamente, daremos uma idéia da demonstração. 

Seja q ∈ S um vetor arbitrário. Então q se escreve de maneira única na forma 

q = 

m 

aivi + 

i=1 

n 

i=m+1 

λm 

aivi =: q1 + q2


com q1 ∈ Tm e q2 ∈ Um. Como q /∈ Um, necessariamente q1 = 0, isto é, ai = 0 para algum índice i = 1, . . . , m. 

Em primeiro lugar, note que os subespaços A k S são todos m-dimensionais. De fato, |λm| > |λm+1| implica 

que nenhum dos autovalores λ1, . . . , λm é o autovalor nulo, logo ker A ⊂ Um. Como S ∩ Um = {0}, segue 

que A é injetiva sobre S logo dim S = dim (AS). Mais geralmente, como A k Tm = Tm, temos ker A k ⊂ Um 

para todo k. Além disso, A k S ∩ Um = {0}, pois se q = q1 + q2 ∈ S é um vetor arbitrário com q1 ∈ Tm e 

q2 ∈ Um, segue que a componente A k q1 de A k q em Tm é não-nula para todo k, pois A k q1 = m 

i=1 aiλ k vi e 

ai = 0 para algum índice i = 1, . . . , m. Portanto, dim (AS) = dim (AS) = . . . = dim A k S . 

Temos 

A k q 

λ k m 

= 

m−1 

k n 

 

λi 

λi 

ai vi + amvm + ai 

λm 

λm 

i=1 

i=m+1 

k 

vi. 

Os coeficientes da componente em Tm crescem, ou pelo menos não decrescem, enquanto que os coeficientes 

da componente em Um tendem a zero com taxa igual a ou melhor que λm+1/λm. Portanto, toda seqüência 

k A q converge para um vetor em Tm com a taxa de convergência dada no enunciado. O limite AkS não 

pode ser um subespaço próprio de Tm porque ele tem dimensão m. 

Tm é chamado o subespaço invariante dominante de A de dimensão m. 

Para fazer uma iteração de subespaços na prática, é necessário escolher uma base para o subespaço a 

ser iterado, iterando todos os vetores desta base simultaneamente. Assim, se B0 = q0 1, . . . , q0 

m é uma base 

para S, Bk = Akq0 1, . . . , Akq0 

k 

m é uma base para A S. Por outro lado, já vimos que trabalhar com os 

vetores Akq0 j pode ser problemático, pois pode ocorrer Akq0 

 

j → ∞ ou Akq0 

 

j → 0; seria necessário fazer 

um reescalamento a cada iteração. Pior que isso, as seqüências de vetores Akq0 

k 0 

1 , . . . , A qm convergem 

cada uma para o autovetor dominante v1, como vimos na seção anterior, logo os vetores A k q 0 1, . . . , A k q 0 m 

apontam aproximadamente para a mesma direção v1 para m grande, logo Bk = Akq0 1, . . . , Akq0 

m não é 

uma boa base para AkS (dizemos que Bk é uma base mal-condicionada): pequenas perturbações em um dos 

vetores-base podem fazer uma grande diferença no espaço. 

Deve-se portanto substituir a base obtida em cada iteração por uma base bem-condicionada. A maneira 

mais confiável de fazer isso é ortonormalizar a base. Assim, começa-se com uma base ortonormal B0 = 

0 q1, . . . , q0 

m para S e obtém-se a base B1 

= Aq0 1, . . . , Aq0 

m para AS. Através de um processo de 

ortonormalização, como o algoritmo de Gram-Schmidt, a partir de B1 obtém-se uma base ortonormal 

B1 = q1 1, . . . , q1 

m para AS. Em geral, dada uma base ortonormal Bk = qk 1 , . . . , qk 

k 

m para A S, obtemos 

uma base ortonormal Bk+1 = q k+1 

1 , . . . , qk+1 

k+1 

m para A S a partir da base Bk+1 

= Aqk 1 , . . . , Aqk 

m . 

Este procedimento é chamado iteração simultânea com ortonormalização ou simplesmente iteração 

simultânea. 

8.3 Método QR 

O algoritmo mais usado para calcular o conjunto completo de autovalores de uma matriz é o algoritmo 

QR, desenvolvido simultanea e independentemente por Francis e Kublanovskaya em 1961. Ele pode ser 

compreendido a partir do processo de iteração simultânea. 

Consideremos o que acontece quando o processo de iteração simultânea é aplicado a uma base B0 = 

0 q1, . . . , q0 

n 

n de vetores ortonormais para F . Como antes, assumimos que A é diagonalizável com autovalores 

λ1, . . . , λn e B = {v1, . . . , vn} é uma base correspondente de autovetores. Assuma 

para m = 1, . . . , n − 1, e defina 

|λm| > |λm+1| 

Sm = q 0 1, . . . , q 0 

m , 

Tm = 〈v1, . . . , vm〉 , 

Um = 〈vm+1, . . . , vn〉 .


Assuma também que Sm ∩ Um = {0} para m = 1, . . . , n − 1. Pelo Teorema 8.1, 

A k Sm = q k 1 , . . . , q k 

m → Tm 

com velocidade de convergência igual a |λm+1| / |λm|. 

Seja Qk a matriz unitária cujas colunas são os vetores ortonormais q k 1 , . . . , q k n e denote 

Ak = Q ∗ kA Qk. (8.2) 

Como Ak é similar a A, Ak possui os mesmos autovalores de A. Para k grande, as primeiras m colunas de 

Qk são próximas ao subespaço invariante Tm. Se estas colunas gerassem exatamente o subespaço Tm, então 

Ak teria a forma em blocos 

Ak = 

 

k A11 k×k 

0 (n−k)×k 

 

k A12 

k A22 k×(n−k) 

(n−k)×(n−k) 

e os autovalores λ1, . . . , λk seriam os autovalores do bloco A k 11. Como estas colunas apenas aproximam Tm, 

ao invés de um bloco nulo devemos obter um bloco A k 21 cujas entradas são próximas de zero. Pode-se provar 

que de fato A k 21 → 0. Isso acontece para todo k, de modo que Ak converge para uma matriz triangular, cujos 

elementos na diagonal principal são os autovalores λ1, . . . , λn de A. Se A for uma matriz hermitiana, então 

Ak também será hermitiana e Ak convergirá para uma matriz diagonal. 

O algoritmo QR é uma variante da iteração de subespaços que produz a seqüência (Ak) diretamente. 

8.3.1 O Algoritmo QR 

Para obter o algoritmo QR, vamos colocar a iteração simultânea em forma matricial. Assumiremos que A 

é invertível. Depois de k iterações, temos os vetores ortonormais qk 1 , . . . , qk n, que são as colunas da matriz 

unitária Qk, isto é, 

Qk = qk 1 . . . qk 

n . (8.4) 

Denote 

Bk+1 = A Qk = Aq k 1 . . . Aq k n 

 

(8.3) 

. (8.5) 

Em seguida, o processo de Gram-Schmidt clássico é aplicado aos vetores linearmente independentes b k+1 

1 

Aq k 1 , . . . , b k+1 

n 

= Aq k n (daí a hipótese de que A é invertível) para obter vetores ortonormais q k+1 

1 

= 

, . . . , q k+1 

n 

que serão as colunas da matriz unitária Qk+1. 

Para expressar o algoritmo de Gram-Schmidt em forma matricial, lembre-se que para obter vetores 

ortonormais q1, . . . , qn a partir de vetores linearmente independentes b1, . . . , bn neste processo primeiro ortogonalizamos, 

obtendo os vetores ortogonais 

q1 = b1, 

q2 = b2 − 〈b2, q1〉 

〈q1, q1〉 q1, 

. 

. 

m−1 

qm = bm − 

. 

. 

qn = bn − 

j=1 

〈bm, qj〉 

〈qj, qj〉 qj, 

n 〈bn, qj〉 

〈qj, qj〉 qk+1 j . 

j=1


e depois normalizamos obtendo os vetores ortonormais 

q1 = q1 

q1 , 

. 

. 

qn = qn 

qn . 

Podemos escrever o processo de ortogonalização na forma 

ou 


m−1 

qm = bm − 〈bm, qj〉 qj, 

qm = qm 

qm , 

j=1 

m−1 

qm = bm − rjmqj, (8.6) 

qm = 1 

rmm 

j=1 

qm, (8.7) 

rjm = 〈bm, qj〉 , se j = 1, . . . , m − 1, (8.8) 

rmm = qm . (8.9) 

Os vetores b1, . . . , bn podem então ser escritos diretamente em função dos vetores q1, . . . , qn: 

ou seja, 

bm = 

m−1 

j=1 

b1 = r11q1, 

b2 = r12q1 + r22q2, 

b3 = r13q1 + r23q2 + r33q3 

. 

. 

rjmqj + rmmqm, (8.10) 

bn = r1nq1 + r2nq2 + . . . + rnnqn 

Em forma matricial, se definirmos rjm = 0 sempre que j > m e considerarmos a matriz triangular superior 

R = (rij), temos 

b1 b2 b3 . . . bn 

 

= q1 q2 q3 . . . qn 

⎡ 

r11 

⎢ 

⎢ 0 

⎢ 0 

⎢ . 

⎣ . 

r12 

r22 

0 

. 

. 

r13 

r23 

r33 

. .. 

. . . 

. . . 

. . . 

. .. 

r1n 

r2n 

r3n 

. 

. 

⎤ 

⎥ 

⎦ 

0 0 0 . . . rnn


ou 

B = QR (8.11) 

Esta é a chamada decomposição QR de uma matriz invertível B em um produto de uma matriz unitária Q 

(ortogonal, se B for uma matriz real) e uma matriz triangular superior com entradas diagonais reais positivas 

R. 

Portanto, usando a decomposição QR, um passo de iteração simultânea pode ser expresso em forma 

matricial como 

Bk+1 = A Qk = Qk+1Rk+1, (8.12) 

onde Rk+1 é a matriz triangular superior definida por 

⎧ 

⎨ 0 

 

se j > m, 

k 

(Rk+1) 

jm = Aqj , q 

⎩ 

k+1 

j se j = 1, . . . , m − 1, 

k Aqj , Aqk 

j se j = m. 

(8.13) 

Agora suponha que comecemos a iteração simultânea a partir dos vetores da base canônica, isto é, 

0 q1, . . . , q0 

n = {e1, . . . , en}, de modo que Q0 = I. Então 


Daí, 

Denotando Q1 = Q1, escrevemos 

e 

No próximo passo, 

Observando que 

definindo 

obtemos a decomposição QR da matriz A1: 

Daí, 

Como Q ∗ 2A1 = R2, segue que 

Em geral, 

B1 = A Q0 = A, 

A = Q1R1. 

A1 = Q ∗ 1A Q1 = R1 Q1. 

A = Q1R1 

A1 = R1Q1. (8.14) 

B2 = A Q1 = Q2R2. 

A1 = Q ∗ 1A Q1 = Q ∗ 1 Q2R2, 

Q2 = Q ∗ 1 Q2 

A1 = Q2R2. (8.15) 

A2 = Q ∗ 2A Q2 = Q ∗ 2 Q1R1 Q2 = Q ∗ 2R1 Q1Q2 = Q ∗ 2A1Q2. 

A2 = R2Q2. (8.16) 

Ak−1 = QkRk, (8.17) 

Ak = RkQk, (8.18) 

isto é, obtemos primeiro a decomposição QR da matriz Ak−1 e a partir dela obtemos a próxima iterada, a 

matriz Ak.


8.3.2 Implementação Eficiente do Algoritmo QR 

O algoritmo QR da forma como introduzido na seção anterior é altamente ineficiente. Cada decomposição 

QR custa O n 3 operações de ponto flutuante e a multiplicação de matrizes que lhe segue também custa 

O n 3 operações de ponto flutuante. Além disso, a velocidade de convergência também é muito lenta. 

O primeiro problema é resolvido quando se reduz a matriz A à sua forma de Hessenberg. Uma decomposição 

QR de uma matriz na forma de Hessenberg é apenas O n 2 operações de ponto flutuante para uma 

matriz geral e O (n) operações de ponto flutuante para uma matriz hermitiana. 

Definição. Dizemos que uma matriz A = (aij) é uma matriz de Hessenberg superior se aij = 0 sempre 

que i > j + 1. 

Em outras palavras, uma matriz de Hessenberg superior tem a forma 

⎡ 

∗ 

⎢ ∗ 

⎢ 0 

⎣ 0 

∗ 

∗ 

∗ 

0 

∗ 

∗ 

∗ 

∗ 

∗ 

∗ 

∗ 

∗ 

∗ 

∗ 

∗ 

∗ 

⎤ 

⎥ 

⎦ 

0 0 0 ∗ ∗ 

. 

Observe que uma matriz hermitiana de Hessenberg é uma matriz tridiagonal. Toda matriz complexa é 

semelhante a uma matriz na forma de Hessenberg superior através de uma matriz unitária, isto é, dada 

A ∈ Mn (C), existe uma matriz unitária Q tal que 

B = Q ∗ AQ 

é de Hessenberg superior. O custo para isso é de 10 

3 n3 operações de ponto flutuante. Detalhes podem ser 

vistos em [Watkins]. Se Ak−1 é uma matriz de Hessenberg superior, então a matriz Ak obtida através do 

método QR também é de Hessenberg superior. De fato, da decomposição QR de Ak−1, Ak−1 = QkRk, 

obtemos Qk = Ak−1R −1 

k . Como a inversa de uma matriz triangular superior é uma matriz triangular 

superior, segue que R −1 

k é triangular superior. O produto de uma matriz triangular superior e de uma 

matriz de Hessenberg superior, em qualquer ordem, sempre é uma matriz de Hessenberg superior. Segue 

que Qk é de Hessenberg superior e daí que Ak = RkQk é de Hessenberg superior. Assim, se começarmos 

com uma matriz de Hessenberg superior, em cada passo QR estaremos trabalhando com uma matriz de 

Hessenberg superior e o custo computacional cai de O n3 para O n2 (ou até mesmo O (n) se a matriz for 

hermitiana), uma redução significativa. 

A velocidade de convergência do algoritmo QR pode ser acelerada pela estratégia de deslocamento. Com 

efeito, como a taxa de convergência do método depende da razão |λm+1| / |λm|, ela pode ser melhorada 

quando esta razão é decrescida. Isso pode ser feito através de deslocamento; |λm+1 − σ| / |λm − σ| pode 

ser tornado arbitrariamente próximo a zero escolhendo um deslocamento arbitrariamente próximo a λm+1. 

A escolha do deslocamento pode ser feita através do próprio método QR: depois de algumas iterações, os 

elementos na diagonal principal de Ak são aproximações dos autovalores de A. 

O método pode ter sua velocidade de convergência ainda mais acelerada através do uso de uma técnica 

chamada deflação. Suponha que obtivemos uma boa aproximação σ para o autovalor de menor módulo λn 

(como este autovalor tem o menor módulo, ele deve ser o melhor aproximado pelas iterações QR iniciais usadas 

para encontrar boas aproximações para os autovalores). Aplicando o algoritmo QR à matriz C = A − σI, 

obteremos uma convergência muito rápida, de modo que após poucas iterações a matriz Ck +σI (adicionando 

o deslocamento de volta) terá aproximadamente a forma 

⎡ 

⎤ 

∗ 

⎢ Ak 

Ck + σI = ⎢ 

. . . ⎥ 

⎣ 

∗ ⎦ 

0 0 0 λn 

.


Os autovalores restantes de A serão os autovalores de Ak, que é uma matriz (n − 1) × (n − 1), de modo que 

podemos efetuar iterações subseqüentes nesta matriz. Operando desta forma, a cada autovalor encontrado 

diminuímos o tamanho da matriz, diminuindo o custo computacional (é claro que a cada autovalor encontrado 

devemos também considerar um novo deslocamento, aproximando o próximo autovalor a ser encontrado). 

8.4 Métodos para Matrizes Esparsas 

O algoritmo QR não é conveniente para obter os autovalores de matrizes esparsas, já que depois de uma 

iteração QR a matriz A1 já deixa de ser esparsa (pode-se construir exemplos em que todas as posições 

superiores da matriz de Hessenberg são preenchidas; veja [Watkins], Exercício 6.3.24). Precisaremos de 

métodos que não preenchem os zeros da matriz esparsa A. Uma possibilidade é voltar ao método de iteração 

de subespaços básico, sem as mudanças de coordenadas a cada iteração que caracterizam o método QR e 

alteram a forma esparsa da matriz. Por outro lado, isso implica que apenas alguns poucos autovalores de 

maior módulo podem ser calculados. Para contornar este problema, deve-se usar as estratégias de iteração 

inversa e iteração com deslocamento. 

Entretanto, métodos mais sofisticados e eficientes existem para encontrar os autovalores de uma matriz 

esparsa. 

8.4.1 Processo de Arnoldi 

O processo de Arnoldi foi introduzido em 1950, mas só entrou em moda para calcular autovalores apenas na 

década de 1970. Atualmente, ele e suas variantes, são o método preferido para o cálculo de autovalores em 

várias aplicações. 

O método das potências (ou mesmo o método da iteração de subespaços) utiliza apenas a informação do 

último iterado para calcular o próximo iterado. A idéia do processo de Arnoldi (semelhante à do algoritmo 

do gradiente conjugado) é usar toda a informação dos passos anteriores. Depois de k passos no método 

das potências, guardamos todos os k + 1 vetores q, Aq, A 2 q, . . . , A k q e procuramos boas aproximações de 

autovetores no subespaço (k + 1)-dimensional gerado por estes vetores. 

Na prática, como já vimos antes, os vetores q, Aq, A 2 q, . . . , A k q formam uma base mal-condicionada para 

o subespaço, porque tendem a apontar na mesma direção do autovetor dominante, logo em cada iteração 

substituímos esta base por uma base ortonormal q1, . . . , qk+1. Isso é realizado pelo algoritmos de Gram- 

Schmidt com uma pequena modificação. Se trabalhássemos com a seqüência original q, Aq, A 2 q, . . . , A k−1 q, 

para obter A k q bastaria multiplicar A k−1 q por A. Como em cada passo usamos o algoritmo de Gram-Schmidt 

para ortonormalizar o conjunto de vetores obtidos anteriormente, o vetor A k−1 q não está disponível. Ao 

invés, multiplicamos o vetor qk por A e é necessário apenas ortonormalizar o vetor Aqk com relação aos 

vetores q1, . . . , qk para obter o vetor qk+1. Este é o processo de Arnoldi. 

Mais detalhadamente, no primeiro passo temos 

Em passos subseqüentes, tomamos 


qk+1 = Aqk − 

q1 = q 

. (8.19) 

q 

k 

hjkqj, (8.20) 

j=1 

qk+1 = qk+1 

, (8.21) 

qk+1 

hjk = 〈Aqk, qj〉 , se j = 1, . . . , k, (8.22) 

hk+1,k = qk+1 . (8.23)


Pode-se mostrar que este processo produz exatamente a mesma seqüência de vetores que o processo de 

Gram-Schmidt produz aplicado aos vetores q, Aq, A 2 q, . . . , A k q. 

Para ver como o processo de Arnoldi pode ser utilizado para encontrar autovalores, primeiro estabelecemos 

alguns resultados teóricos. Lembre-se que dada uma matriz A ∈ Mn (C) e um vetor q ∈ C n , o j-ésimo espaço 

de Krylov associado com A e q é o subespaço 

Kj (A, q) = q, Aq, . . . , A j−1 q . 

8.2 Proposição. Sejam A ∈ Mn (C) e q ∈ C n . Suponha que q, Aq, . . . , A m−1 q são linearmente independentes. 

Então Km (A, q) é invariante sob A se e somente se q, Aq, . . . , A m−1 q, A m q são linearmente 

dependentes. 

Prova. Como Km (A, q) é gerado por q, Aq, . . . , A m−1 q, Km (A, q) é invariante sob A se e somente se A m q 

é combinação linear de q, Aq, . . . , A m−1 q. 

8.3 Teorema. Sejam A ∈ Mn (C) e q ∈ C n . Suponha que q, Aq, . . . , A m−1 q são linearmente independentes. 

Sejam q1, . . . , qm os vetores gerados pelo processo de Arnoldi. Então 

(a) Kk (A, q) = 〈q1, . . . , qk〉 para k = 1, . . . , m. 

(b) hk+1,k > 0 para k = 1, . . . , m − 1. 

(c) hm+1,m = 0 se e somente se q, Aq, . . . , A m q são linearmente dependentes ou, equivalentemente, se 

e somente se Km (A, q) é invariante sob A. 

Prova. (a) e (b) seguem por indução. Para k = 1 é óbvio. Assumindo (a) e (b) válidos para todo j k < m, 

vamos provar a validade de (a) e (b) para k + 1. Isso significa que temos que mostrar que hk+1,k > 0 e 

q, Aq, . . . , A k−1 q, A k q = 〈q1, . . . , qk+1〉 

assumindo válido 

〈q〉 = 〈q1〉 

〈q, Aq〉 = 〈q1, q2〉 

q, Aq, A 2 q = 〈q1, q2, q3〉 

. 

q, Aq, . . . , A k−1 q = 〈q1, . . . , qk〉 

Em particular, vemos que cada vetor qj, para j = 1, . . . , k, possui uma componente não-nula na direção de 

Aj−1q, digamos 

qj = aj−1A j−1 j−2 

q + aiA i q com aj−1 = 0. 

Por definição 

de modo que se qk+1 = 0 teríamos 

i=0 

qk+1 = Aqk − 

k 

j=1 

hjkqj, 

 

Aqk = A ak−1A k−1 k−2 

q + aiA i 

q = 

i=0 

k 

j=1 

hjkqj,



A k q = 1 

ak−1 

⎛ 

⎝ 

k 

j=1 

k−2 

hjkqj − 

 

aiA i ⎞ 

q⎠ 

= 1 

i=0 

aj−1 

⎡ 

⎣ 

k 

j=1 

 

j−1 

hjk bijA i q 

i=0 

 

 

aiA i ⎤ 

q⎦ 

, (8.24) 

k−1 

− 

produzindo A k q como combinação linear de q, Aq, . . . , A k−1 q para k < m, violando a hipótese de que 

q, Aq, . . . , A m−1 q são linearmente independentes. Isso prova que hk+1,k = qk+1 > 0. Além disso, como 

 

qk+1 = A ak−1A k−1 k−2 

q + aiA i 

q − 

i=0 

k 

j=1 

hjkqj = ak−1A k k−1 

q + 

i=1 

 

aiA i q − 

i=1 

k 

j=1 

hjkqj, 

segue que qk+1 = qk+1/ qk+1 possui uma componente não-nula na direção de A k q; isso mais a hipótese de 

indução q, Aq, . . . , A k−1 q = 〈q1, . . . , qk〉 

implica que q, Aq, . . . , A k−1 q, A k q = 〈q1, . . . , qk+1〉 

Para provar (c), observe que hm+1,m = 0 implica q, Aq, . . . , A m q linearmente dependentes por (8.24). 

Reciprocamente, se A m q é combinação linear de q, Aq, . . . , A m−1 q, então 

e portanto 

A m q ∈ q, Aq, . . . , A m−1 q = 〈q1, . . . , qm〉 , 

A m q = 

m 

〈Aqm, qj〉 qj 

j=1 

pois esta é a expressão de A m q na base ortonormal {q1, . . . , qm}; daí segue da definição que qm+1 = 0. 

8.4.2 Representação Matricial do Processo de Arnoldi 

Segue de (8.20) e (8.21) que 

k+1 

Aqk = hjkqj. (8.25) 

j=1 

Pelo Teorema 8.3, esta relação vale para k = 1, . . . , m se q, Aq, . . . , Amq forem linearmente independentes. 

Estas equações vetoriais podem ser combinadas em uma equação matricial da seguinte maneira. Definimos 

Qm = 

q1 . . . qm 

(8.26) 

e 

Temos 

n×m 

⎡ 

h11 

⎢ h21 ⎢ 

0 

Hm+1,m = ⎢ 0 

⎢ . 

⎣ . 

h12 

h22 

h32 

0 

. 

. 

. . . 

. . . 

. . . 

. .. 

. .. 

h1,m−1 

h2,m−1 

h3,m−1 

. 

. 

hm,m−1 

h1m 

h2m 

h3,m 

. 

. 

hm,m 

⎤ 

⎥ 

⎦ 

0 0 . . . 0 hm+1,m 

(m+1)×m 

. (8.27) 

AQm = Qm+1Hm+1,m. (8.28)


Observe que Qm é uma isometria (embora não necessariamente um isomorfismo isométrico, a não ser que 

m = n) e que Hm+1,m é uma matriz de Hessenberg superior, não quadrada, com entradas diagonais positivas. 

Denotaremos por Hm a matriz de Hessenberg superior quadrada obtida através de Hm+1,m quando 

suprimimos a última linha desta. Segue que 

 

AQm = QmHm + qm+1 0 . . . 0 hm+1,m 

ou 

8.4 Proposição. Suponha que q1, . . . , qm+1 são vetores ortonormais, 

Qm = 

q1 . . . qm , 

AQm = QmHm + qm+1hm+1,me t m. (8.29) 

e que Hm é uma matriz de Hessenberg superior com hj+1,j > 0 para j = 1, . . . , m. Embora estes 

possam ter sido obtidos por qualquer processo, suponha que eles satisfazem (8.29). 

Então q1, . . . , qm+1 são exatamente os vetores produzidos pelo processo de Arnoldi com vetor inicial 

q1. Em outras palavras, dada uma matriz A, os objetos em (8.29) são unicamente determinados pela 

primeira coluna de Qm. 

Se q, Aq, . . . , A m q são linearmente independentes, então hm+1,m = 0. Se eles são linearmente dependentes, 

então hm+1,m = 0 e 

AQm = QmHm. (8.30) 

Em particular, isso implica que 〈q1, . . . , qm〉 são invariantes sob A e que os autovalores de Hm são autovalores 

de A, como o próximo resultado mostra: 

8.5 Proposição. Suponha que x1, . . . , xm ∈ Fn são linearmente independentes e sejam S = 〈x1, . . . , xm〉 e 

X = 

x1 . . . xm 

Então S é invariante sob A ∈ Mn (F) se e somente se existe algum B ∈ Mm (F) tal que 

AX = XB. 

Além disso, todo autovalor de B é um autovalor de A com autovetor correspondente em S. 

Prova. Se existe tal B, então 

Axj = 

m 

xibij ∈ S. 

i=1 

Reciprocamente, se X é invariante sob A, então para cada índice j = 1, . . . , m existem escalares bij tais que 

m 

Axj = bijxi. 

i=1 

Defina B = (bij). 

Se w é um autovetor de B com autovalor λ, então v = Xw ∈ S é um autovetor de A com autovalor λ. 

Se m não é muito grande, podemos então usar o algoritmo QR para encontrar os autovalores de Hm. Na 

prática, dificilmente obteremos hm+1,m = 0 exatamente, mas se hm+1,m é próximo de zero podemos esperar 

que estamos próximos de um subespaço invariante e, portanto, que os autovalores de Hm são próximos aos 

autovalores de A. O próximo resultado mostra que mesmo na eventualidade em que hm+1,m não é pequeno, 

alguns dos autovalores de Hm podem ser boas aproximações dos autovalores de A. 

8.6 Teorema. Sejam Qm, Hm e hm+1,m gerados pelo processo de Arnoldi. Seja λ um autovalor de Hm 

com autovetor unitário x. Seja v = Qmx. Então 

onde xm denota a última componente de x. 

n×m 

Av − λv = |hm+1,m| |xm| ,


8.4.3 Método de Lanczos 

Para matrizes simétricas reais, o processo de Arnoldi assume uma forma bem mais simples, porque a matriz 

de Hessenberg Hm é simétrica e portanto é uma matriz tridiagonal. Neste caso, o processo de Arnoldi é 

chamado o método de Lanczos.

Referências Bibliográficas 

[Asmar] Nakhlé ASMAR, Partial Differential Equations and Boundary Value Problems, Prentice 

Hall, 2000. 

[Aronszajn] N. ARONSZAJN, A unique continuation theorem for solutions of elliptic partial differential 

equations of second order, J. Math. Pures Appl. 36 (1957), 235-239. 

[Bandle] Catherine BANDLE, Isoperimetric Inequalities and Applications, Pitman, 1980. 

[Berard1] Pierre BÉRARD, Transplantation et isospectralité, Math. Ann. 292 (1992), pp. 547– 

559 

[Berard2] Pierre BÉRARD, Domaines plans isospectraux à la Gordon-Webb-Wolpert: 

preuve élémentaire, Afrika Mat. 3 (1993), no. 1, 135–146. 

une 

[Biezuner] Rodney Josué BIEZUNER, Notas de Aula: Equações Diferenciais Parciais, UFMG, 

2005. 

[BHM] William L. BRIGGS, Van Emden HENSON e Steve F. McCORMICK, A Multigrid 

Tutorial, SIAM, 2000. 

[Chapman] S. J. CHAPMAN, Drums That Sound the Same, American Mathematical Monthly, 

102 (1995), no. 2, 124–138. 

[Cheng] Shiu-Yuen CHENG, Eigenfunctions and nodal sets, Comment. Math. Helvetici 51 

(1976), 43–55. 

[Courant-Hilbert] Richard COURANT e David HILBERT, Methods of Mathematical Physics, Wiley- 

Interscience, 1953. 

[Demmel] James W. DEMMEL, Applied Numerical Linear Algebra, SIAM, 1997. 

[Driscoll] Tobin A. DRISCOLL, Eigenmodes of isospectral drums, SIAM Review 39 (1997), no. 

1, 1–17. 

[Evans] Lawrence C. EVANS, Partial Differential Equations, AMS, 1998. 

[Gilbarg-Trudinger] David GILBARG e Neil S. TRUDINGER, Elliptic Partial Differential Equations of 

Second Order, 2nd Ed., Springer-Verlag, 1983. 

[Gladwell-Zhu] G. M. L. GLADWELL and H. ZHU, Courant’s Nodal Line Theorem and Its Discrete 

Counterparts, The Quarterly Journal of Mechanics and Applied Mathematics 

55 (2002), 1-15. 

[GWW1] Carolyn GORDON, David L. WEBB e Scott WOLPERT, One cannot hear the shape 

of a drum, Bulletin of the American Mathematical Society 27 (1992), n. 1, 134–138. 

154


[GWW2] Carolyn GORDON, David L. WEBB e Scott WOLPERT, Isospectral plane domains 

and surfaces via Riemannian orbifolds, Inventiones Mathematicae 110 (1992), n. 1, 

1–22. 

[Hackbusch] W. HACKBUSCH, Elliptic Differential Equations: Theory and Numerical Treatment, 

Springer Series in Computational Mathematics 18, Springer, 1992. 

[Herrman] H. HERRMANN, Beziehungen zwischen den Eigenwerten und Eigenfunktionen verschiedener 

Eigenwertprobleme, Math. Z. 40 (1935), 221–241. 

[Heuveline] Vincent HEUVELINE, On the computation of a very large number of eigenvalues for 

selfadjoint elliptic operators by means of multigrid methods, Journal of Computational 

Physics 184 (2003), 321–337. 

[Horn-Johnson] Roger A. HORN e Charles R. JOHNSON, Matrix Analysis, Cambridge University 

Press, 1985. 

[Johnson] Claes JOHNSON, Numerical solutions of partial differential equations by the finite 

element method, Cambridge, 1987. 

[Jost] Jürgen JOST, Partial Differential Equations, Graduate Texts in Mathematics 214, 

Springer-Verlag, 2002. 

[Kac] M. KAC, Can one hear the shape of a drum?, American Mathematical Monthly 73 

(1966), no. 4, part II, 1–23. 

[Kuttler-Sigillito] J. R. KUTTLER e V. G. SIGILLITO, Eigenvalues of the Laplacian in two dimensions, 

SIAM REVIEW 26 (1984) no. 2, 163–193. 

[Milnor] J. MILNOR, Eigenvalues of the Laplace operator on certain manifolds, Proceedings 

of the National Academy of Sciences USA 51 (1964), 542. 

[Pleijel] A. PLEIJEL, Remarks on Courant’s nodal line theorem, Comm. Pure Appl. Math. 9 

(1956), 543–550. 

[Protter] M. H. PROTTER, Can one hear the shape of a drum? Revisited, SIAM REVIEW 

29 (1987) no. 2, 185–197. 

[Rosser1] J. Barkley ROSSER, Nine point difference solutions for Poisson’s equation, Comp. 

Math. Appl. 1 (1975), 351–360. 

[Rosser2] J. Barkley ROSSER, Finite-difference solution of Poisson’s equation in rectangles of 

arbitrary proportions, Zeitschrift für Angewandte Mathematik und Physik (ZAMP) 

28 (1977), no.2, 185–196. 

[Sridhar-Kudrolli] S. SRIDAR e A. KUDROLLI, Experiments on not “hearing the shape” of drums, 

Physical Review Letters 72 (1994), 2175–2178. 

[Strang] Gilbert STRANG, Linear Algebra and its Applications, 3rd Ed., Harcourt Brace Jovanovich, 

1988. 

[Strikwerda] John C. STRIKWERDA, Finite Difference Schemes and Partial Differential Equations, 

2nd Ed., SIAM, 2004. 

[Thomas1] J. W. THOMAS, Numerical Partial Differential Equations: Finite Difference Methods, 

Texts in Applied Mathematics 22, Springer, 1995.


[Thomas2] J. W. THOMAS, Numerical Partial Differential Equations: Conservation Laws and 

Elliptic Equations, Texts in Applied Mathematics 33, Springer, 1999. 

[Uhlenbeck1] K. UHLENBECK, Eigenfunctions of Laplace operator, Bulletin of the American 

Mathematical Society 78 (1972), 1073–1076. 

[Uhlenbeck2] K. UHLENBECK, Generic properties of eigenfunctions, American Journal of Mathematics 

98 (1976), 1059–1078. 

[Vigneras] Marie-France VIGNÉRAS, Varietés riemanniennes isospectrales et non isometriques, 

Annals of Mathematics 91 (1980), 21–32. 

[Wat1] K. WATANABE, Plane Domains Which Are Spectrally Determined, Annals of Global 

Analysis and Geometry 18 (2000), no. 5, 447–475. 

[Wat2] K. WATANABE, Plane Domains Which Are Spectrally Determined II, J. Inequal. 

Appl. 7 (2002), no. 1, 25–47. 

[Watkins] David S. WATKINS, Fundamentals of Matrix Computations, 2nd Ed., John Wiley & 

Sons, 2002. 

[Weyl] H. WEYL, Über die Asymptotische Verteilung der Eigenwerte, Nachr. Konigl. Ges. 

Wiss. Göttingen (1911), 110–117. 

[Young] David M. YOUNG, Iterative Solutions of Large Linear Systems, Academic Press, 

1971. 

[Zelditch] S. ZELDITCH, Spectral determination of analytic bi-axisymmetric plane domains, 

Geometric and Functional Analysis 10 (2000), no. 3, 628–677.

Autovalores do Laplaciano - Departamento de Matemática - UFMG

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?