12.07.2015 Views

t - Departamento de Sistemas e Computação - UFCG

t - Departamento de Sistemas e Computação - UFCG

t - Departamento de Sistemas e Computação - UFCG

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Cálculo Numérico — Fundamentos e AplicaçõesClaudio Hirofume AsanoEduardo Colli<strong>Departamento</strong> <strong>de</strong> Matemática Aplicada – IME-USP11 <strong>de</strong> abril <strong>de</strong> 2007


SumárioI <strong>Sistemas</strong> Lineares 91 Exemplos <strong>de</strong> aplicações <strong>de</strong> sistemas lineares 111.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.2 Provetas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.3 Petróleo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.4 Cores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.5 Interpolação polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.6 Outros problemas <strong>de</strong> <strong>de</strong>terminação <strong>de</strong> polinômios . . . . . . . . . . . . . . . . 161.7 Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.8 Problemas <strong>de</strong> contorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 O Método <strong>de</strong> Escalonamento 212.1 O método . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.2 Algarismos significativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.3 O <strong>de</strong>terminante no Método <strong>de</strong> Escalonamento . . . . . . . . . . . . . . . . . . 282.4 A <strong>de</strong>svantagem da Regra <strong>de</strong> Cramer . . . . . . . . . . . . . . . . . . . . . . . 292.5 <strong>Sistemas</strong> mal-condicionados e refinamento <strong>de</strong> solução . . . . . . . . . . . . . . 312.5.1 <strong>Sistemas</strong> mal-condicionados . . . . . . . . . . . . . . . . . . . . . . . . 312.5.2 Matrizes <strong>de</strong> Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322.5.3 Refinamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 Métodos iterativos 373.1 O Método <strong>de</strong> Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.2 Critério das Linhas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383.3 Critério <strong>de</strong> parada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403.4 O Método <strong>de</strong> Gauss-Sei<strong>de</strong>l . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41II Ajuste <strong>de</strong> Funções 474 Ajuste <strong>de</strong> funções 494.1 O problema do ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494.2 Os mínimos quadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.3 Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503


4 SUMÁRIO4.3.1 Densida<strong>de</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.3.2 Catenária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.3.3 Naftalinas e funções afins . . . . . . . . . . . . . . . . . . . . . . . . . 524.3.4 Decaimento exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . 534.3.5 Leis <strong>de</strong> potência e fractais . . . . . . . . . . . . . . . . . . . . . . . . . 544.3.6 Gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 555 Funções lineares nos parâmetros 595.1 Dependência linear dos parâmetros . . . . . . . . . . . . . . . . . . . . . . . . 595.2 Contínuo vs. discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.3 Um parâmetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615.4 Dois parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 625.5 Ajuste <strong>de</strong> qualquer função linear nos parâmetros . . . . . . . . . . . . . . . . 645.6 O caso contínuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655.7 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665.7.1 Dinamômetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665.7.2 Cosseno aproximado por um polinômio . . . . . . . . . . . . . . . . . 686 Levando a sério o produto escalar 716.1 Produto escalar e distância . . . . . . . . . . . . . . . . . . . . . . . . . . . . 716.2 Existência e unicida<strong>de</strong> <strong>de</strong> soluções no ajuste linear . . . . . . . . . . . . . . . 736.3 O caso contínuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 746.4 Outros produtos escalares: pesos . . . . . . . . . . . . . . . . . . . . . . . . . 757 Famílias ortogonais 777.1 Definições e exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 777.2 Calculando polinômios ortogonais por recorrência . . . . . . . . . . . . . . . . 797.3 Um exemplo <strong>de</strong> aplicação <strong>de</strong> polinômios ortogonais . . . . . . . . . . . . . . . 817.4 Exemplo <strong>de</strong> análise harmônica . . . . . . . . . . . . . . . . . . . . . . . . . . 817.5 Uso <strong>de</strong> funções tabeladas por mudança <strong>de</strong> variável . . . . . . . . . . . . . . . 84III Equações e Zeros <strong>de</strong> Funções 878 Zeros <strong>de</strong> funções e o Método da Dicotomia 898.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 898.2 Raiz cúbica <strong>de</strong> 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 908.3 Pára-quedista ou bolinha em queda <strong>de</strong>ntro d’água . . . . . . . . . . . . . . . 908.4 O cilindro <strong>de</strong>itado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 938.5 Catenária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 958.6 Método da Dicotomia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 969 Métodos iterativos 999.1 Plano geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 999.2 Pontos fixos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1009.3 Funções auxiliares candidatas . . . . . . . . . . . . . . . . . . . . . . . . . . . 101


SUMÁRIO 59.4 Visualizando iterações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1029.5 Iterando perto <strong>de</strong> pontos fixos . . . . . . . . . . . . . . . . . . . . . . . . . . . 1049.6 Teorema do Valor Médio e velocida<strong>de</strong> <strong>de</strong> convergência . . . . . . . . . . . . . 1099.6.1 O caso ϕ ′ (x ∗ ) = 0: convergência quadrática . . . . . . . . . . . . . . . 1109.7 Calculando zeros <strong>de</strong> funções - a escolha <strong>de</strong> ϕ . . . . . . . . . . . . . . . . . . 1119.8 A escolha <strong>de</strong> x 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1139.9 Um critério <strong>de</strong> parada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11510 O Método <strong>de</strong> Newton 11710.1 Quando o Método <strong>de</strong> Newton funciona? . . . . . . . . . . . . . . . . . . . . . 11810.1.1 Retirando a hipótese f ′ (x ∗ ) ≠ 0 . . . . . . . . . . . . . . . . . . . . . . 12110.2 Método <strong>de</strong> Newton em dimensões mais altas . . . . . . . . . . . . . . . . . . . 12310.2.1 Determinação da forma <strong>de</strong> uma corda . . . . . . . . . . . . . . . . . . 124IV Interpolação Polinomial 12711 Estimativa do erro nas interpolações 12912 Técnicas <strong>de</strong> interpolação 13312.1 Polinômios <strong>de</strong> Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13312.2 Forma <strong>de</strong> Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13312.2.1 Exemplo do uso da forma <strong>de</strong> Newton . . . . . . . . . . . . . . . . . . . 137V Integração <strong>de</strong> Funções 13913 Importância da integração numérica 14113.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14113.2 Cálculo <strong>de</strong> áreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14213.3 Comprimento <strong>de</strong> curvas e gráficos . . . . . . . . . . . . . . . . . . . . . . . . . 14413.4 Distância percorrida e tempo <strong>de</strong>corrido . . . . . . . . . . . . . . . . . . . . . . 14613.5 Período do pêndulo e as integrais elípticas . . . . . . . . . . . . . . . . . . . . 14713.6 Cálculo <strong>de</strong> π e <strong>de</strong> logaritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . 15113.7 A gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15214 Métodos <strong>de</strong> integração numérica 15514.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15514.2 O Método dos Trapézios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15514.3 O Método <strong>de</strong> Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15715 Estimativa do erro nos métodos <strong>de</strong> integração 16115.1 Fórmulas <strong>de</strong> erro e comparação dos métodos . . . . . . . . . . . . . . . . . . . 16115.2 Aplicação das fórmulas <strong>de</strong> erro . . . . . . . . . . . . . . . . . . . . . . . . . . 163


6 SUMÁRIO16 Obtenção das fórmulas <strong>de</strong> erro 16716.1 Primeira Abordagem - Método dos Trapézios . . . . . . . . . . . . . . . . . . 16816.2 Primeira Abordagem - Método <strong>de</strong> Simpson . . . . . . . . . . . . . . . . . . . 16916.3 Segunda Abordagem - Método dos Trapézios . . . . . . . . . . . . . . . . . . 16916.4 Segunda Abordagem - Método <strong>de</strong> Simpson . . . . . . . . . . . . . . . . . . . . 17016.5 Terceira Abordagem - Método dos Trapézios . . . . . . . . . . . . . . . . . . . 17116.6 Terceira Abordagem - Método <strong>de</strong> Simpson . . . . . . . . . . . . . . . . . . . . 172VI Equações Diferenciais 17517 Breve introdução às equações diferenciais 17717.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17717.2 Solução <strong>de</strong> equações autônomas e separáveis . . . . . . . . . . . . . . . . . . . 17917.3 Alguns exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18017.3.1 Naftalinas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18017.3.2 Crescimento populacional a taxas constantes . . . . . . . . . . . . . . 18017.3.3 Pára-quedista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18117.3.4 Crescimento populacional com restrições <strong>de</strong> espaço . . . . . . . . . . . 18117.3.5 Catenária . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18217.3.6 Escoamento <strong>de</strong> um copo furado . . . . . . . . . . . . . . . . . . . . . . 18317.3.7 Dada ϕ do Método <strong>de</strong> Newton, quem é f? . . . . . . . . . . . . . . . . 18517.3.8 Transferência <strong>de</strong> calor . . . . . . . . . . . . . . . . . . . . . . . . . . . 18517.4 Entendimento qualitativo <strong>de</strong> equações autônomas . . . . . . . . . . . . . . . . 18617.5 Equações diferenciais com mais variáveis . . . . . . . . . . . . . . . . . . . . . 18718 Solução numérica <strong>de</strong> equações diferenciais 19118.1 Equações separáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19118.2 Discretização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19218.3 O Método <strong>de</strong> Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19418.4 Indo para segunda or<strong>de</strong>m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19618.5 Runge-Kutta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19818.6 Runge-Kutta em sistemas <strong>de</strong> equações autônomas . . . . . . . . . . . . . . . . 202A Enten<strong>de</strong>ndo os sistemas lineares 205A.1 <strong>Sistemas</strong> lineares e interseções <strong>de</strong> hiperplanos . . . . . . . . . . . . . . . . . . 205A.2 Transformações lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206A.3 Notação e interpretação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208A.4 Inversão <strong>de</strong> matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208A.5 Explorando a linearida<strong>de</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209A.6 Existência e unicida<strong>de</strong> <strong>de</strong> soluções . . . . . . . . . . . . . . . . . . . . . . . . 212A.7 Injetivida<strong>de</strong>, sobrejetivida<strong>de</strong>... glup! . . . . . . . . . . . . . . . . . . . . . . . 213A.8 O <strong>de</strong>terminante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214A.8.1 Dimensão 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214A.8.2 Dimensão 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216A.8.3 Dimensão n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218


SUMÁRIO 7A.9 Quadro comparativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219B Revisão <strong>de</strong> Cálculo 221B.1 Derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221B.2 Primitivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222B.3 Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223B.4 A integral in<strong>de</strong>finida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224B.5 O Teorema Fundamental do Cálculo . . . . . . . . . . . . . . . . . . . . . . . 226B.6 A praticida<strong>de</strong> do Teorema Fundamental do Cálculo . . . . . . . . . . . . . . . 228B.7 O logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229B.8 O Teorema do Valor Médio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233B.9 A Regra da Ca<strong>de</strong>ia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234B.10 Regras do produto e do quociente . . . . . . . . . . . . . . . . . . . . . . . . . 236B.11 Truques <strong>de</strong> primitivização: integração por partes . . . . . . . . . . . . . . . . 237B.12 Truques <strong>de</strong> primitivização: substituição . . . . . . . . . . . . . . . . . . . . . 237C Fórmula <strong>de</strong> Taylor 241C.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241C.1.1 Polinômios <strong>de</strong> grau zero . . . . . . . . . . . . . . . . . . . . . . . . . . 242C.1.2 Aproximação da função nula . . . . . . . . . . . . . . . . . . . . . . . 242C.1.3 Aproximação <strong>de</strong> grau 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 242C.2 Polinômio e Fórmula <strong>de</strong> Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . 243D Respostas <strong>de</strong> exercícios selecionados 247


8 SUMÁRIO


Capítulo 1Exemplos <strong>de</strong> aplicações <strong>de</strong>sistemas lineares1.1 IntroduçãoUm sistema linear é um conjunto <strong>de</strong> m equações, com n incógnitas x 1 , x 2 , . . ., x n , da seguinteforma:a 11 x 1 + a 12 x 2 + . . . + a 1n x n = b 1a 21 x 1 + a 22 x 2 + . . . + a 2n x n = b 2..a m1 x 1 + a m2 x 2 + . . . + a mn x n = b mOs números a ij são os coeficientes do sistema linear, e são fornecidos no problema. Os b i ’ssão chamados <strong>de</strong> termos in<strong>de</strong>pen<strong>de</strong>ntes. Aqui estudaremos apenas os sistemas lineares quetenham tantas equações quanto incógnitas, isto é, m = n. Trataremos neste Capítulo <strong>de</strong>alguns exemplos on<strong>de</strong> se aplicam sistemas lineares, no Apêndice A discutimos um pouco dateoria envolvida (por exemplo, a relação entre o <strong>de</strong>terminante dos coeficientes do sistema e aexistência e unicida<strong>de</strong> <strong>de</strong> soluções), no Capítulo 2 falaremos <strong>de</strong> sua solução pelo Método <strong>de</strong>Escalonamento e no Capítulo 3, finalmente, exporemos dois métodos iterativos <strong>de</strong> resoluçãodos sistemas lineares (que, infelizmente, só funcionam em certos casos).1.2 ProvetasConsi<strong>de</strong>re o seguinte problema. Quatro tipos <strong>de</strong> materiais particulados estão distribuídos porquatro provetas, e em cada proveta os materiais são dispostos em camadas, não misturadas,<strong>de</strong> modo que seja possível medir facilmente o volume <strong>de</strong> cada material em cada uma <strong>de</strong>las.Dado que possamos medir a massa total <strong>de</strong> cada proveta, e que saibamos a massa da provetavazia, queremos calcular a <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> cada um dos materiais.11


12CAPÍTULO 1. EXEMPLOS DE APLICAÇÕES DE SISTEMAS LINEARESPara colocar o problema em termos matemáticos,chamemos os materiais <strong>de</strong> A, B, C 00 1100 1100 1100 11e D, e suas <strong>de</strong>nsida<strong>de</strong>s respectivas <strong>de</strong> ρ A , ρ B , 00 11D00 1100 1100 11ρ C e ρ D . Essas são as incógnitas do problema,00 1100 11C00 11números que queremos <strong>de</strong>scobrir.00 1100 1100 1100 11Entre os dados disponíveis para resolvê-lo00 1100 1100 1100 11estão a massa conjunta dos quatro materiais B00 1100 1100 11em cada uma das provetas (numeradas <strong>de</strong> 1 a00 1100 1100 114), que chamaremos <strong>de</strong> m 1 , m 2 , m 3 e m 4 , já 00 1100 11 A00 1100 11<strong>de</strong>scontada a tara das provetas.00 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 11 C00 1100 1100 1100 1100 1100 1100 11 B00 1100 1100 1100 1100 1100 11 A00 1100 1100 1100 1100 1100000000 1111111100 1100 1100 1100 1100 1100 1100 1100 1100 11C00 1100 1100 1100 1100 1100 1100 1100 1100 11 B00 1100 1100 1100 11 A00 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 1100 11 C00 1100 1100 1100 1100 11 B00 1100 1100 1100 1100 1100 1100 11 A00 1100 1100 11D D D1 2 3 4Além disso, temos o volume <strong>de</strong> cada um dos materiais em cada uma das provetas. Chamaremos<strong>de</strong> v 1A , v 1B , v 1C e v 1D o volume dos materiais A, B, C e D na Proveta 1, v 2A , v 2B ,v 2C e v 2D o volume dos materiais A, B, C e D na Proveta 2, e assim por diante.Como a <strong>de</strong>nsida<strong>de</strong> é a razão entre massa e volume, a massa do material A na Proveta 1é v 1A · ρ A . Esten<strong>de</strong>ndo esse raciocínio para os <strong>de</strong>mais materiais, obtemos que a massa totalm 1 contida na Proveta 1 év 1A · ρ A + v 1B · ρ B + v 1C · ρ C + v 1D · ρ D .Consi<strong>de</strong>rando as quatro provetas, obteremos quatro equações:v 1A · ρ A + v 1B · ρ B + v 1C · ρ C + v 1D · ρ D = m 1v 2A · ρ A + v 2B · ρ B + v 2C · ρ C + v 2D · ρ D = m 2v 3A · ρ A + v 3B · ρ B + v 3C · ρ C + v 3D · ρ D = m 3v 4A · ρ A + v 4B · ρ B + v 4C · ρ C + v 4D · ρ D = m 4Trata-se <strong>de</strong> um sistema linear <strong>de</strong> quatro equações e quatro incógnitas.Uma possível aplicação em Geologia seria a seguinte. Uma sonda faz o papel das provetas,e uma coluna <strong>de</strong> material é retirada, contendo materiais diferentes dispostos em camadas(po<strong>de</strong> ser até uma sonda coletando material gelado). A sonda permitiria medir a dimensão<strong>de</strong> cada camada, mas não po<strong>de</strong>ríamos <strong>de</strong>smanchar a coluna para medir a <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> cadamaterial isoladamente, sob o risco <strong>de</strong> alterar a compactação.1.3 PetróleoOutro problema para Geólogos e afins. Em três poços <strong>de</strong> petróleo, situados em regiõesdistintas, o material coletado tem diferentes concentrações <strong>de</strong> duas substâncias A e B. Umacentral recebe o petróleo dos três poços, mas antes do refino precisa obter uma mistura comuma concentração escolhida das substâncias A e B. A pergunta é: em cada litro <strong>de</strong> petróleoque será gerado para o refino, quanto petróleo <strong>de</strong> cada poço se <strong>de</strong>ve colocar?Mais uma vez equacionemos o problema: chamaremos <strong>de</strong> c 1A a concentração <strong>de</strong> A nopetróleo do Poço 1, c 1B a concentração <strong>de</strong> B no petróleo do Poço 1, e assim por diante. Essainformação é conhecida previamente. As concentrações que queremos obter são chamadas <strong>de</strong>c A e c B . As incógnitas são as quantida<strong>de</strong>s relativas <strong>de</strong> petróleo <strong>de</strong> cada poço que colocaremos


1.4. CORES 13na mistura final, que chamaremos <strong>de</strong> q 1 , q 2 e q 3 . Elas são medidas em litros, e <strong>de</strong>vem ser taisqueq 1 + q 2 + q 3 = 1 .Além disso, a concentração do material A após a mistura dos três será dada porc 1A · q 1 + c 2A · q 2 + c 3A · q 3 .Pensando o mesmo sobre o material B, ficamos com três equações lineares e três incógnitas:c 1A · q 1 + c 2A · q 2 + c 3A · q 3 = c Ac 1B · q 1 + c 2B · q 2 + c 3B · q 3 = c Bq 1 + q 2 + q 3 = 1Aqui é importante salientar que o problema não teria uma solução satisfatória para qualquerescolha <strong>de</strong> c A e c B . Por exemplo, se a concentração c A <strong>de</strong>sejada na mistura for superior àsconcentrações <strong>de</strong> A em cada um dos poços, não há como obter a mistura satisfatoriamente.Mesmo assim po<strong>de</strong>ria haver uma solução matemática para a equação, na qual provavelmenteuma das incógnitas q 1 , q 2 ou q 3 teria que ser negativa!Portanto no problema real <strong>de</strong>vemos adicionar a exigência <strong>de</strong> que os valores q 1 , q 2 e q 3encontrados não sejam negativos.O conjunto <strong>de</strong> valores <strong>de</strong> c A e c B para os quaishaveria uma solução para esse problema po<strong>de</strong> serrepresentado da seguinte forma. Queremos umpar <strong>de</strong> concentrações (c A , c B ) tal que existam q 1 ,q 2 e q 3 satisfazendo as equações acima. Esse conjunto<strong>de</strong> possibilida<strong>de</strong>s está representado no planocartesiano na figura ao lado, e é <strong>de</strong>nominado envoltóriaconvexa dos pontos (c 1A , c 1B ), (c 2A , c 2B )e (c 3A , c 3B ). Ele é o menor conjunto convexo quecontém os pontos citados.cB(c2A,c 2B)(c 1A,c 1B)possiveis(c A ,c B )(c3A,c 3B)cA1.4 CoresUm exemplo muito semelhante po<strong>de</strong> ser obtido trabalhando-se com combinações <strong>de</strong> cores.A maior parte das cores conhecidas po<strong>de</strong>m ser formadas pela combinação <strong>de</strong> três cores:vermelho (R), ver<strong>de</strong> (G) e azul (B), as letras correspon<strong>de</strong>ndo à nomenclatura em inglêsred-green-blue, que chamaremos <strong>de</strong> cores puras.


14CAPÍTULO 1. EXEMPLOS DE APLICAÇÕES DE SISTEMAS LINEARESIsto significa que as cores po<strong>de</strong>mser representadas por três númerosnão-negativos, cada um indicando aquantida<strong>de</strong> <strong>de</strong> cada uma das três cores,e esses números são geometricamentevistos pela posição que representamno primeiro octante formadopelos três eixos coor<strong>de</strong>nadosno espaço tridimensional.RBGNo entanto há um bocado <strong>de</strong> informação redundante nessa representação, uma vez que oponto (1, 1, 1) <strong>de</strong>ve resultar na mesma cor que (3, 3, 3), a única diferença sendo a quantida<strong>de</strong><strong>de</strong> material produzido.azulB(0,0,1)Se pensarmos que os números x R , x G , x B <strong>de</strong>notama quantida<strong>de</strong> <strong>de</strong> litros <strong>de</strong> cada cor purae sempre quisermos produzir exatamente 1 litro<strong>de</strong> mistura, então é necessário quex R + x G + x B = 1 .(1,0,0)Rvermelho(0,1,0)ver<strong>de</strong>GA equação acima restringe o espaço <strong>de</strong> corespossíveis à intersecção do plano x R + x G +x B = 1 com o primeiro octante, que é otriângulo mostrado na figura ao lado.Cada ponto Q <strong>de</strong>sse triângulo é obtido como combinação convexa <strong>de</strong> (1, 0, 0), (0, 1, 0) e(0, 0, 1), isto é,Q = (q R , q G , q B ) = q R (1, 0, 0) + q G (0, 1, 0) + q B (0, 0, 1) ,com a condição <strong>de</strong> que q R + q G + q B = 1. Chamaremos <strong>de</strong> T esse triângulo.Suponha agora que produzimos quatro cores distintas Q (1) , Q (2) , Q (3) e Q (4) , sendo queQ (i) = (q (i)R , q(i) G , q(i) B )para cada i = 1, 2, 3, 4. Elas são representadas por pontos no triãngulo T.


1.5.INTERPOLAÇÃO POLINOMIAL 15O conjunto <strong>de</strong> todas as combinações possíveis<strong>de</strong>ssas quatro cores (formando um litro) é omenor conjunto convexo em T que contém essasquatro cores, como ilustra a figura ao lado.Se Q é uma tal cor, entãoQ = x 1 Q (1) + x 2 Q (2) + x 3 Q (3) + x 4 Q (4) ,com x 1 + x 2 + x 3 + x 4 = 1.RQ(1)B(2)QQ (4) QPor exemplo, suponha que a cor cinza, dada por Q = ( 1 3 , 1 3 , 1 3), esteja contida nesse menorconjunto convexo, e gostaríamos <strong>de</strong> <strong>de</strong>terminar as quantida<strong>de</strong>s x 1 , x 2 , x 3 e x 4 das cores Q (1) ,Q (2) , Q (3) e Q (4) que produzam 1 litro da cor cinza Q. Isso nos dá quatro equações linearesnas incógnitas x 1 , x 2 , x 3 e x 4 :q (1)R x 1 + q (2)R x 2 + q (3)R x 3 + q (4)R x 4 = 1 3q (1)G x 1 + q (2)G x 2 + q (3)G x 3 + q (4)G x 4 = 1 3q (1)B x 1 + q (2)B x 2 + q (3)B x 3 + q (4)B x 4 = 1 3x 1 + x 2 + x 3 + x 4 = 11.5 Interpolação polinomialImagine que queiramos passar um polinômio quadrático (isto é, uma parábola) pelos pontos(x 1 , y 1 ), (x 2 , y 2 ) e (x 3 , y 3 ), <strong>de</strong>s<strong>de</strong> que x 1 , x 2 e x 3 sejam todos diferentes entre si.(3)Gp(x)y 1yx32x 1x3y 2Um polinômio quadrático é escrito, na sua forma geral, comop(x) = ax 2 + bx + c .Como neste problema nosso objetivo é <strong>de</strong>terminar o polinômio quadrático, as incógnitas sãoos três coeficientes a, b e c. Para encontrar as incógnitas dispomos <strong>de</strong> três equações, pois ográfico do polinômio <strong>de</strong>ve passar pelos três pontos dados: p(x 1 ) = y 1 , p(x 2 ) = y 2 e p(x 3 ) = y 3 .Explicitando as equações, ficamos comax 2 1 + bx 1 + c = y 1ax 2 2 + bx 2 + c = y 2ax 2 3 + bx 3 + c = y 3


16CAPÍTULO 1. EXEMPLOS DE APLICAÇÕES DE SISTEMAS LINEARESe reescrevendo-as evi<strong>de</strong>nciamos o caráter <strong>de</strong> sistema linear do problema:x 2 1 · a + x 1 · b + c = y 1x 2 2 · a + x 2 · b + c = y 2x 2 3 · a + x 3 · b + c = y 3Nem é preciso dizer que o mesmo tipo <strong>de</strong> problema se generaliza para um número qualquern <strong>de</strong> pontos. Sejam os pares (x 1 , y 1 ), . . . , (x n , y n ), com os x i ’s distintos dois a dois. Queremosachar um polinômio p(x) cujo gráfico passe pelos pontos dados, isto é: p(x 1 ) = y 1 , p(x 2 ) =y 2 , . . . , p(x n ) = y n .yny1y n−1x 1 x 2 x n−1 x ny2Se procurarmos por um polinômio <strong>de</strong> grau k teremos k + 1 coeficientes a <strong>de</strong>terminar.Como temos que satisfazer n equações, isso sugere que fixemos k = n − 1. Assim, temos osistema <strong>de</strong> n equações, on<strong>de</strong> os coeficientes são as n incógnitas:a 0 + x 1 · a 1 + x 2 1 · a 2 + . . . + x n−11 · a n−1 = y 1a 0 + x 2 · a 1 + x 2 2 · a 2 + . . . + x n−12 · a n−1 = y 2. . . . . = .a 0 + x n · a 1 + x 2 n · a 2 + . . . + xn n−1 · a n−1 = y nPo<strong>de</strong>mos nos perguntar se sempre existe solução para esse sistema, e se ela é única. Aresposta é sim (<strong>de</strong>s<strong>de</strong> que os x i ’s sejam distintos entre si, mas veremos a justificativa maisadiante, na Seção A.7.Exercício 1.1 Ache o único polinômio <strong>de</strong> grau 3 passando pelos pontos (−1, 0), (0, 1),(3, −1) e (4, 0).Exercício 1.2 Encontre o polinômio interpolador para os pontos (−1, −5), (0, 1), (3, 19) e(4, 45).1.6 Outros problemas <strong>de</strong> <strong>de</strong>terminação <strong>de</strong> polinômiosOutro problema <strong>de</strong> interpolação polinomial que po<strong>de</strong> ser reduzido a um sistema linear ocorrequando são impostas condições nas <strong>de</strong>rivadas do polinômio, em <strong>de</strong>terminados pontos. A idéiafica mais clara a partir do seguinte exemplo.


1.7. SPLINES 17Problema: “achar um polinômio tal que p(−1) = 1, p(3) = 0, p ′ (−1) = 0 e p ′ (3) = 0”.Isto é, fixa-se o valor e a <strong>de</strong>rivada <strong>de</strong> p em dois pontos, o que dá 4 equações. Com um polinômio<strong>de</strong> grau 3, fica-se com 4 incógnitas. Explicitamente, se p(x) = a 0 + a 1 x + a 2 x 2 + a 3 x 3 , entãoas 4 equações se transformam ema 0 − a 1 + a 2 − a 3 = 1a 0 + 3a 1 + 9a 2 + 27a 3 = 0a 1 − 2a 2 + 3a 3 = 0a 1 + 6a 2 + 27a 3 = 0Também po<strong>de</strong>-se impor alguma condição <strong>de</strong> integral <strong>de</strong>finida para o polinômio. Porexemplo, se p(x) = ax 2 + bx + c é polinômio <strong>de</strong> grau 2 e sabemos queisso nos dá uma equação linear, pois∫ 21∫ 21p(x)dx = a x33p(x)dx = 3 ,∣∣ 2 1+ b x22= 7 3 a + 3 2 b + c .∣ 2 ∣+ cx1∣ 2 11.7 SplinesHá também o problema <strong>de</strong> “spline”. Dados pontos (x 0 , y 0 ), . . . , (x n , y n ) (a numeração começa<strong>de</strong> zero, <strong>de</strong>sta vez) como na figura abaixo com n = 5, achar uma função que seja:1. um polinômio cúbico em cada intervalo [x k−1 , x k ], com k = 1, . . .,n;2. igual aos valores especificados y k nos pontos x k ;3. duas vezes diferenciável e com <strong>de</strong>rivada segunda contínua, inclusive nos pontos extremosdos intervalos (em particular, a função também <strong>de</strong>ve ser diferenciável);4. com <strong>de</strong>rivada zero nos extremos (ou com valores especificados da <strong>de</strong>rivada nos extremos).x x 1x 2x 3x 4x 50


18CAPÍTULO 1. EXEMPLOS DE APLICAÇÕES DE SISTEMAS LINEARESNesse problema temos que achar n polinômios cúbicos (um para cada intervalo), e sãoportanto 4n incógnitas (quatro coeficientes <strong>de</strong> cada polinômio). Será que temos 4n equaçõestambém?Vejamos. Chamaremos <strong>de</strong> p 1 (x), . . . , p n (x) os polinômios, sendo que o polinômio p k (x)correspon<strong>de</strong> ao intervalo [x k−1 , x k ]. Temos que impor os valores extremosp 1 (x 0 ) = y 0 , p n (x n ) = y n(no <strong>de</strong>senho, y 0 e y n são iguais a zero). Já temos duas equações. Além disso, <strong>de</strong>vemos impora segunda condição especificada acima, nos <strong>de</strong>mais nódulos (mais 2n − 2 equações):p 1 (x 1 ) = y 1 e p 2 (x 1 ) = y 1 , . . . , p n−1 (x n−1 ) = y n−1 e p n (x n−1 ) = y n−1 .Até agora totalizamos 2n equações. Temos ainda que impor as <strong>de</strong>rivadas nos extremos (zeroneste caso):p ′ 1 (x 0) = 0 , p ′ n (x n) = 0 ,e também a continuida<strong>de</strong> da <strong>de</strong>rivada em cada nódulo:p ′ 1 (x 1) = p ′ 2 (x 1) , . . . , p ′ n−1 (x n−1) = p ′ n (x n−1) ,perfazendo mais n + 1 equações. Finalmente, temos que impor também a continuida<strong>de</strong> dasegunda <strong>de</strong>rivada nos nódulos, com mais n − 1 equações:p ′′1(x 1 ) = p ′′2(x 1 ) , . . . , p ′′ n−1(x n−1 ) = p ′′ n(x n−1 ) .Ao todo são 4n equações!É possível mostrar que o sistema daí resultante sempre tem única solução.Exercício 1.3 Monte o sistema linear relativo ao spline dos pontos da figura, com osseguintes dados:k x k y k0 −3.0 0.01 −1.4 0.72 0.0 2.03 1.5 2.54 2.5 1.05 4.0 0.0Exercício 1.4 Faça um spline cúbico com os pontos (−1, 0), (0, 1) e (1, 0), com <strong>de</strong>rivadazero nos extremos.1.8 Problemas <strong>de</strong> contornoO problema do equilíbrio termostático (ou também do eletrostático) é outro exemplo <strong>de</strong>redução a um sistema linear.


1.8. PROBLEMAS DE CONTORNO 19Suponha uma situação como amostrada na figura ao lado, comtrês fontes <strong>de</strong> calor:1. O entorno do quadrado, àtemperatura T a2. O quadrado inclinado, àtemperatura T bT bT cT a(x,y)T(x,y)3. A barra, à temperatura T cA questão é: como se distribuiráa temperatura, no equilíbrio, emfunção da posição (x, y)?O mesmo problema po<strong>de</strong> ser formulado com um potencial eletrostático V (x, y), ao invésda temperatura, se nas regiões mostradas fixássemos valores V a , V b e V c . Na verda<strong>de</strong>, osvalores T a , T b , T c nem precisariam ser fixos: po<strong>de</strong>riam variar conforme a posição.Esse problema é mo<strong>de</strong>lado pela equação <strong>de</strong> Laplace∂ 2 T∂x 2 + ∂2 T∂y 2 = 0 ,significando que <strong>de</strong>vemos procurar uma função contínua T(x, y) cujo valor sobre as fontesseja aquele pré-<strong>de</strong>terminado e tal que fora <strong>de</strong>las satisfaça essa equação.Para obter uma soluçãoTT abnumérica, discretizamos oplano (x, y) com uma re<strong>de</strong> quadrada,como mostra a figura aolado. Em seguida, numeramosos vértices da malha cujas temperaturasnão estão fixadas, emqualquer or<strong>de</strong>m (por exemplo,T c adotamos da esquerda para adireita, e <strong>de</strong> cima para baixo).Na posição i queremos <strong>de</strong>terminar a temperatura T i , no equilíbrio. Se forem N vértices,serão N incógnitas T 1 , T 2 , . . .,T N a <strong>de</strong>terminar. A equação <strong>de</strong> Laplace, quando discretizada,se traduz no fato <strong>de</strong> que a temperatura <strong>de</strong> equilíbrio na posição i tem que ser igual à média


20CAPÍTULO 1. EXEMPLOS DE APLICAÇÕES DE SISTEMAS LINEARESda temperatura nos quatro vizinhos imediatos (na vertical e horizontal). Para cada vértice,isso se traduzirá numa equação (linear), e a reunião <strong>de</strong> todas essas equações formará umsistema linear <strong>de</strong> N equações e N incógnitas.A solução do sistema assim obtido será uma aproximação da distribuição <strong>de</strong> temperatura.Vejamos um exemplo, com uma gra<strong>de</strong><strong>de</strong> poucos vértices. O <strong>de</strong>senho da figuraao lado mostra uma gra<strong>de</strong> 9 × 8.Chamaremos <strong>de</strong> N o número <strong>de</strong> linhas(no exemplo, N = 9) e M o número<strong>de</strong> colunas (no exemplo, M = 8). Nagra<strong>de</strong> fixamos T a nas posições (4, 4),(5, 3), (5, 4), (5, 5) e (6, 4) (embora aposição interna (5, 4) não vá servir paranada), e T b nas posições (1, s) e (9, s),para s = 1, . . .,8, e (r, 1), (r, 8), parar = 1, . . . , 9. Veja que estamos usandor para in<strong>de</strong>xar as linhas e s para in<strong>de</strong>xaras colunas.r123456789000000000000000000000000000000000011111111111111111111111111111111111 2 3 4 5 6 7 80101010101010101010101010101010101010101010101010101010101010101010100 1100 1100 1101010101010100 1100 1100 1100 1100 11 00 1100 11 00 11A discretização da equação <strong>de</strong> Laplace significa que, nos vértices em que a temperaturanão foi fixada, o valor da temperatura será dado pela média dos valores dos quatro vérticesmais próximos. Numeraremos esses vértices da seguinte forma: da esquerda para a direita e<strong>de</strong> cima para baixo (como na leitura <strong>de</strong> um texto em português), e para o vértice i queremossaber a temperatura <strong>de</strong> equilíbrio T i . Assim, para o primeiro vértice, teremosT 1 = 1 4 (T b + T b + T 2 + T 7 ) ,pois o vizinho <strong>de</strong> cima e o vizinho à esquerda têm valor fixo T b e os vizinhos à direita eembaixo são as incógnitas T 2 e T 7 . Rearranjando a equação temos4T 1 − T 2 − T 7 = 2T b .Na figura, vemos que há 37 vértices livres, portanto 37 incógnitas T 1 , T 2 , . . . , T 37 a serem<strong>de</strong>terminadas. Porém cada vértice livre produz uma equação, don<strong>de</strong> resulta um sistemalinear com 37 equações e 37 incógnitas.Exercício 1.5 Discretizar e resolver a equação ∂2 T∂x 2 + ∂2 T∂y 2 = 0 no quadrado [0, 1]×[0, 1] comcondição <strong>de</strong> contorno dada por T(x, 0) = x 2 e T(x, 1) = x 2 −1 para 0 ≤ x ≤ 1 e T(0, y) = −y 2e T(1, y) = 1 − y 2 , para 0 ≤ y ≤ 1. Divida o intervalo [0, 1] em N = 3 subintervalos <strong>de</strong>mesmo comprimento. Compare sua solução com a solução exata T(x, y) = x 2 − y 2 .Exercício 1.6 Faça o mesmo exercício com a função T(x, y) = xy.00 1100 1100 11010101T a01010101010100 1100 1100 1100 1100 1100 1101010101010101010101010101010101010101010101010101010101010101T bs


Capítulo 2O Método <strong>de</strong> Escalonamento2.1 O métodoNesta Seção discutiremos um método <strong>de</strong> resolução <strong>de</strong> sistemas lineares, chamado Método doEscalonamento ou Método <strong>de</strong> Eliminação <strong>de</strong> Gauss. O método se baseia, em primeiro lugar,no fato <strong>de</strong> que um sistema triangularizado como abaixo tem fácil solução:a 11 x 1 + a 12 x 2 + a 13 x 3 + . . . + a 1n x n = b 1a 22 x 2 + a 23 x 3 + . . . + a 2n x n = b 2a 33 x 3 + . . . + a 3n x n = b 3a nn x n.= b nNa verda<strong>de</strong>, é tanto necessário quanto suficiente que todos os coeficientes na diagonal sejamnão-nulos para que se explicite a solução <strong>de</strong> forma única (se um dos termos da diagonal fornulo então haverá variáveis livres e uma infinida<strong>de</strong> <strong>de</strong> soluções). A solução, nesse caso, seobtém a partir da última equação. Primeiro, isola-se x n :A penúltima equação éentãox n = 1a nnb n .a n−1,n−1 x n−1 + a n−1,n x n = b n−1 ,x n−1 =1a n−1,n−1(b n−1 − a n−1,n x n ) .Como x n já foi <strong>de</strong>terminado, da equação acima <strong>de</strong>termina-se também x n−1 . E assim pordiante, até se conseguir o valor <strong>de</strong> x 1 .Um sistema triangularizado torna-se então o objetivo do método. Para ser mais preciso,preten<strong>de</strong>-se obter um sistema linear triangularizado equivalente ao original.Aqui enten<strong>de</strong>remos que dois sistemas lineares são equivalentes se eles possuem exatamenteas mesmas soluções, ou seja: se um conjunto <strong>de</strong> números x 1 , . . . , x n é solução <strong>de</strong> um sistemaentão automaticamente será solução do outro.21


22CAPÍTULO 2. O MÉTODO DE ESCALONAMENTOPo<strong>de</strong>-se trocar um sistema linear por outro equivalente através do seguinte processo.Escolhem-se duas linhas, a linha i e a linha j, e no lugar da linha j coloca-se uma linha queseja combinação linear da linha i com a linha j, exceto que essa combinação linear não po<strong>de</strong>ser somente a linha i (senão a informação sobre a linha j <strong>de</strong>saparece, o que po<strong>de</strong> tornar osistema in<strong>de</strong>terminado). Mais precisamente, o sistema lineara 11 x 1 + a 12 x 2 + . . . + a 1n x n = b 1a 21 x 1 + a 22 x 2 + . . . + a 2n x n = b 2..a n1 x 1 + a n2 x 2 + . . . + a nn x n = b npassa a ter, no lugar da linha j, a seguinte linha:(αa j1 + βa i1 )x 1 + . . . + (αa jn + βa in )x n = αb j + βb i ,on<strong>de</strong> α ≠ 0, para que a linha j não seja meramente substituída pela linha i. É evi<strong>de</strong>nte quequalquer solução do sistema linear original será solução do sistema linear alterado. Será quevale o inverso?De fato, sim. Se os números x 1 , . . . , x n formam uma solução do sistema alterado, entãojá garantimos que esses números satisfazem todas as equações do sistema original, excetopossivelmente a equação j. Acontece que subtraindo da linha alterada a linha i multiplicadapor β vemos que a linha j é automaticamente satisfeita, contanto que α ≠ 0.O essencial nesse “truque” é que po<strong>de</strong>mos controlar α e β <strong>de</strong> forma que a linha substitutatenha um zero em certa posição. Por exemplo, suponha que na linha i o termo a ik (k-ésimacoluna) seja diferente <strong>de</strong> zero. Com isso, po<strong>de</strong>mos substituir a linha j por uma linha em quena k-ésima coluna o coeficiente seja nulo. Basta colocar a linhaAssim, o k-ésimo coeficiente será1 · (linha j) − a jka ik· (linha i) .a jk − a jka ik· a ik = 0 .Usando judiciosamente essa operação po<strong>de</strong>mos ir substituindo as linhas, uma por uma,até chegar a um sistema triangularizado equivalente ao original. Antes <strong>de</strong> explicar o procedimento,no entanto, convencionemos uma forma mais fácil <strong>de</strong> escrever o sistema linear: aforma matricial. Nessa forma <strong>de</strong> escrever, só colocamos o que realmente interessa no sistemalinear: os coeficientes. Numa matriz <strong>de</strong> n linhas e n + 1 colunas colocamos todos eles, <strong>de</strong>ixandoa última coluna para os termos in<strong>de</strong>pen<strong>de</strong>ntes (e em geral separando essa coluna das<strong>de</strong>mais para não haver confusão):⎛⎜⎝⎞a 11 a 12 . . . a 1n b 1a 21 a 22 . . . a 2n b 2⎟. . . . . ⎠a n1 a n2 . . . a nn b n


2.1. O MÉTODO 23Uma observação importante que <strong>de</strong>vemos fazer neste ponto da exposição é que a or<strong>de</strong>mdas linhas não importa na montagem da equação, pois as linhas são as equações, e todasas equações <strong>de</strong>vem ser satisfeitas ao mesmo tempo. Já a or<strong>de</strong>m das colunas é importante,pois a primeira coluna representa os coeficientes da incógnita x 1 , a segunda representa oscoeficientes da incógnita x 2 , etc. Se quisermos trocar a or<strong>de</strong>m das colunas, teremos antesque renumerar as incógnitas!O procedimento <strong>de</strong> escalonamento funciona assim. Primeiramente verificamos se a 11 ≠ 0.Se não for, procuramos alguma linha cujo primeiro coeficiente seja diferente <strong>de</strong> zero e atrocamos <strong>de</strong> posição com a primeira. Se não houver nenhuma linha cujo primeiro coeficienteseja não-nulo então x 1 não entra no sistema linear e po<strong>de</strong> ser, a princípio, qualquer. Alémdisso, percebe-se que <strong>de</strong> fato o sistema linear envolve apenas n −1 incógnitas em n equações,havendo gran<strong>de</strong> chance <strong>de</strong> não ter solução. De qualquer forma, se isso acontecer não haveránada a ser feito nessa primeira etapa e po<strong>de</strong>remos passar imediatamente à etapa seguinte.O objetivo da primeira etapa é usar o fato <strong>de</strong> que a 11 ≠ 0 para trocar uma a uma aslinhas <strong>de</strong> 2 a n por linhas cujo primeiro coeficiente seja nulo, usando o truque <strong>de</strong>scrito acima.Ou seja, a j-ésima linha (j = 2, . . .,n) será substituída pela linha(linha j) − a j1a 11· (linha 1) .O sistema linear ficará então da seguinte forma:⎛⎞a 11 a 12 . . . a 1n b 10 a 22 . . . a 2n b 2⎜ . . . . . ⎟⎝ . . . . . ⎠ ,0 a n2 . . . a nn b non<strong>de</strong> é preciso lembrar que, por causa das operações com linhas, os coeficientes não são osmesmos do sistema linear original!Nessa primeira etapa <strong>de</strong>scrita, o número a 11 é chamado <strong>de</strong> pivô. Em cada etapa haveráum pivô, como veremos adiante. Vimos que o pivô tem que ser necessariamente diferente<strong>de</strong> zero, o que po<strong>de</strong> ser conseguido através <strong>de</strong> uma troca <strong>de</strong> linhas. De fato, é possívelaté escolher o pivô, <strong>de</strong>ntre os vários números da primeira coluna que sejam diferentes <strong>de</strong>zero. Na maioria das situações em que se resolve um sistema linear por este método, através<strong>de</strong> calculadora ou computador, é mais vantajoso, sob o ponto <strong>de</strong> vista dos erros <strong>de</strong> cálculooriginados <strong>de</strong> arredondamentos (veja discussão mais adiante), escolher o pivô como sendo omaior dos números disponíveis na coluna. Aqui enten<strong>de</strong>-se por “maior” número aquele quetem o maior valor absoluto <strong>de</strong>ntro da coluna. Esse procedimento é chamado <strong>de</strong> con<strong>de</strong>nsaçãopivotal.Na segunda etapa, verificamos se a 22 ≠ 0. Se não for, procuramos entre as linhas abaixo dasegunda alguma cujo segundo coeficiente seja não-nulo. Se não houver, passamos diretamentepara a terceira etapa. Se houver, trocamos a linha encontrada com a segunda linha. Observeque a primeira linha não será mais alterada, nem trocada <strong>de</strong> posição com outras. Aqui opivô será o número diferente <strong>de</strong> zero da segunda coluna, escolhido entre a segunda linha e aúltima. Mais uma vez, po<strong>de</strong>-se adotar a con<strong>de</strong>nsação pivotal, tomando como pivô o maiorem valor absoluto.


24CAPÍTULO 2. O MÉTODO DE ESCALONAMENTOSe após a troca tivermos a 22 ≠ 0, po<strong>de</strong>mos usar nosso truque para zerar todos os segundoscoeficientes <strong>de</strong>s<strong>de</strong> a linha 3 até a última linha. Trocaremos cada linha j = 3, . . .,n pela linha(linha j) − a j2a 22· (linha 2) ,e ficaremos com um sistema linear da forma⎛⎞a 11 a 12 a 13 . . . a 1n b 10 a 22 a 23 . . . a 2n b 20 0 a 33 . . . a 3n b 3⎜⎟⎝ . . . . . . ⎠0 0 a n3 . . . a nn b n,lembrando mais uma vez que os coeficientes são diferentes em relação à etapa anterior, excetoos da primeira linha, que ficam inalterados.É fácil ver que em n − 1 etapas teremos um sistema linear triangularizado que, como jáobservamos acima, po<strong>de</strong> ser facilmente resolvido.2.2 Algarismos significativosEm geral recorremos a um computador, ou no mínimo usamos uma calculadora, quandose trata <strong>de</strong> resolver sistemas lineares razoavelmente gran<strong>de</strong>s. Por exemplo, dificilmente nosaventuraríamos na resolução à mão do problema <strong>de</strong> contorno da Seção 1.8, que resulta numsistema linear <strong>de</strong> 37 incógnitas. E isso é pouco: imagine uma gra<strong>de</strong> bem mais fina!A solução <strong>de</strong> um sistema linear pelo Método do Escalonamento é exata, na medida emque o resultado final po<strong>de</strong> ser expresso em termos <strong>de</strong> frações envolvendo os coeficientes dosistema linear original. No entanto, calculadoras e computadores não trabalham <strong>de</strong>ssa forma.Num computador ou numa calculadora científica os números são representados em pontoflutuante, baseados na notação <strong>de</strong>cimal (internamente po<strong>de</strong> ser em outra base, mas o que nosaparece é, em geral, a notação <strong>de</strong>cimal). Na notação <strong>de</strong> ponto flutuante, um número tem umexpoente e uma mantissa. Se x é um número real, seu expoente será o número inteiro n talque10 n−1 ≤ x < 10 n .A mantissa <strong>de</strong> x, <strong>de</strong> or<strong>de</strong>m k, é a representação <strong>de</strong>cimal <strong>de</strong> x10 n até a k-ésima casa <strong>de</strong>cimal,com arredondamento. Em geral as calculadoras usam k > 6, e computadores mais mo<strong>de</strong>rnospo<strong>de</strong>m usar valores bem mais altos. Por exemplo, quando peço para minha calculadora ovalor <strong>de</strong> √ 50000 ela me respon<strong>de</strong>223.6067977Observe que x = √ 50000 é tal que10 2 ≤ x < 10 3 ,portanto o expoente é n = 3 nesse exemplo. Entãox ≈ 0.2236067977 × 10 3 .


2.2. ALGARISMOS SIGNIFICATIVOS 25A mantissa <strong>de</strong> x <strong>de</strong> or<strong>de</strong>m 10 é o número0.2236067977As máquinas trabalham com um tamanho fixo para a mantissa: na calculadora que euusei, esse tamanho é 10. A or<strong>de</strong>m k da mantissa que escolhemos para operar com um númeroé também chamada <strong>de</strong> “número <strong>de</strong> algarismos significativos”.Antes <strong>de</strong> discorrermos sobre como fazer operações aritméticas com números nessa representação(a chamada “aritmética <strong>de</strong> ponto flutuante”), vejamos como se dá o processo<strong>de</strong> arredondamento. Suponha que um número x se escreva da seguinte forma, na notação<strong>de</strong>cimal:x = N p N p−1 . . .N 1 N 0 .N −1 N −2 N −3 . . . ,on<strong>de</strong> N p , . . .,N 0 , N −1 , N −2 , . . . são os algarismos da notação, <strong>de</strong> fato números entre 0 e 9, jáque se trata <strong>de</strong> representação na base 10. À direita a seqüência dos N i ’s po<strong>de</strong> ser infinita(e inclusive há números que po<strong>de</strong>m ser escritos <strong>de</strong> duas formas diferentes, por exemplo0.999 . . . = 1.000 . . .). Assumiremos que ela seja sempre infinita, pois mesmo que não sejapo<strong>de</strong>mos torná-la completando a seqüência com zeros.Essa notação representa uma série infinita, isto é, uma soma <strong>de</strong> infinitos termos:x = N p · 10 p + N p−1 · 10 p−1 + . . . + N 1 · 10 1 + N 0 · 10 0 + N −1 · 10 −1 + N −2 · 10 −2 + . . .Mesmo sem estarmos familiarizados com séries, po<strong>de</strong>mos enten<strong>de</strong>r o número x da seguinteforma: x está entre N p · 10 p e (N p + 1) · 10 p , mas também está entre N p · 10 p + N p−1 · 10 p−1e N p · 10 p + (N p−1 + 1) · 10 p−1 , e assim por diante.Se quisermos arredondar na k-ésima casa <strong>de</strong>cimal <strong>de</strong>pois da vírgula, observamos primeiramenteque x é maior ou igual ae menor do queN p · 10 p + . . . + N 1 · 10 1 + N 0 + N −1 · 10 −1 + . . . + N −k · 10 −kN p · 10 p + . . . + N 1 · 10 1 + N 0 + N −1 · 10 −1 + . . . + (N −k + 1) · 10 −k ,e, para simplificar a notação, <strong>de</strong>finiremos<strong>de</strong> forma queX = N p · 10 p + . . . + N 1 · 10 1 + N 0 + N −1 · 10 −1 + . . . + N −k+1 · 10 −k+1 ,X + N −k · 10 −k ≤ x < X + (N −k + 1) · 10 −k .Para obter o arredondamento <strong>de</strong> x na k-ésima casa <strong>de</strong>cimal, que <strong>de</strong>notaremos por ˆx,precisamos saber se x está mais próximo <strong>de</strong> X +N −k ·10 −k ou <strong>de</strong> X +(N −k +1) ·10 −k . Issoé <strong>de</strong>terminado pelo algarismo seguinte na expansão <strong>de</strong>cimal <strong>de</strong> x, isto é, N −k−1 . Po<strong>de</strong>mosseguir a regra: se N −k−1 = 0, 1, 2, 3, 4, então ˆx = X + N −k · 10 −k ; já se N −k−1 = 5, 6, 7, 8, 9então ˆx = X + (N −k + 1) · 10 −k .No segundo caso é preciso tomar cuidado ao se voltar para a notação <strong>de</strong>cimal. Se 0 ≤N −k ≤ 8, entãoˆx = N p . . . N 0 .N −1 . . . N −k+1 (N −k + 1) .


26CAPÍTULO 2. O MÉTODO DE ESCALONAMENTOSe, no entanto, N −k = 9, teremos N −k + 1 = 10. Isso faz com que no lugar <strong>de</strong> N −k + 1coloquemos um zero e somemos 1 ao algarismo prece<strong>de</strong>nte, N −k+1 . Mas se N −k+1 for tambémigual a 9, então trocamos esse número por um zero e somamos 1 ao prece<strong>de</strong>nte, até isso nãomais acontecer. Por exemplo, o arredondamento <strong>de</strong> 1.5769996 para a sexta casa <strong>de</strong>cimal é1.577000.Agora voltemos à questão das operações aritméticas. No mundo das máquinas, elas <strong>de</strong>vemser feitas sempre respeitando um certo número pré-fixado <strong>de</strong> algarismos significativos. Paraenten<strong>de</strong>r bem, nada melhor do que alguns exemplos.Digamos que se queira efetuar a operação 2.236+12.448, com 4 algarismos significativos.O primeiro número já está escrito com 4 algarismos significativos, pois 2.236 = 0.2236 · 10 1 ,mas o seguinte não, pois 12.448 = 0.12448·10 2 . Então arredondamos o segundo para que fiquecom 4 algarismos significativos, resultando 0.1245 · 10 2 , ou 12.45, e fazemos a soma: 12.45 +2.236 = 14.686. A soma, no entanto, tem 5 algarismos significativos, logo somos obrigadosa arredondar o resultado: 14.69. Observe que teríamos obtido um número ligeiramentediferente se não houvéssemos arredondado 12.448 para 12.45, pois 2.236 + 12.448 = 14.684que, arredondado, fica 14.68.É fácil ver que haverá um acúmulo <strong>de</strong> erro se um gran<strong>de</strong> número <strong>de</strong> operações aritméticasfor efetuado em ca<strong>de</strong>ia.Vejamos um exemplo <strong>de</strong> subtração: queremos subtrair 0.122 <strong>de</strong> 943 com 3 algarismossignificativos. Isso dá 943, após arredondamento. Daí po<strong>de</strong>-se ver que em alguns casos aor<strong>de</strong>m das operações <strong>de</strong> adição e subtração po<strong>de</strong> ser importante. Por exemplo,mas(943 − 0.122) − 0.405 = 943 − 0.405 = 943 ,943 − (0.122 + 0.405) = 943 − 0.527 = 942 .É preciso tomar bastante cuidado com subtrações e somas <strong>de</strong> números com expoentes díspares,principalmente se essas operações forem feitas em gran<strong>de</strong> número. Senão corremos o risco<strong>de</strong> subtrair 9430 vezes o número 0.1 <strong>de</strong> 943 e continuar com 943, ao invés <strong>de</strong> obter zero!!Também <strong>de</strong>ve-se tomar cuidado com a subtração <strong>de</strong> números muito parecidos, cuja diferençase encontre além dos dígitos significativos, pois po<strong>de</strong>-se obter um zero on<strong>de</strong> <strong>de</strong>veria haver umnúmero simplesmente muito pequeno!Como regra geral, cada operação <strong>de</strong>ve ser feita (se possível com mais algarismos do queos significativos, o dobro em geral) e o resultado da operação arredondado. O mesmo valepara as operações <strong>de</strong> multiplicação e divisão. Por exemplo, 5.35/7.22, com 3 algarismossignificativos, dá 0.741 (confira!).Para ilustrar, façamos o escalonamento e a resolução <strong>de</strong> um sistema linear <strong>de</strong> or<strong>de</strong>m 3,usando 3 algarismos significativos. Este exemplo servirá para ilustrar como, em linhas gerais,se dá a resolução <strong>de</strong> um sistema por um programa <strong>de</strong> computador. Evi<strong>de</strong>ntemente um bomprograma (há alguns já prontos para uso) tratará <strong>de</strong> minimizar o quanto for possível os erros<strong>de</strong> arredondamento causados pelo número limitado <strong>de</strong> algarismos significativos. Aqui, aocontrário, tentaremos levar ao pé da letra a regra <strong>de</strong> arredondar após cada operação. A regrasó não será muito clara sobre a or<strong>de</strong>m <strong>de</strong> seguidas adições ou multiplicações: neste caso,faremos o arredondamento após todas as adições (ou multiplicações).Após o exemplo, sugerimos ao leitor, como exercício, que implemente no computador,usando alguma linguagem (C, Pascal, Fortran, Basic, etc), um programa que resolva sistemas


2.2. ALGARISMOS SIGNIFICATIVOS 27lineares <strong>de</strong> qualquer or<strong>de</strong>m (que a or<strong>de</strong>m seja apenas limitada por problemas <strong>de</strong> falta <strong>de</strong>memória, por exemplo).Consi<strong>de</strong>re o sistema ⎛⎝ 3 1 1 1 2 0 −12⎞⎠ ,2 2 −1 1que tem apenas coeficientes inteiros. Ele tem solução exata (x 1 , x 2 , x 3 ) = (− 9 2 , 13 2, 3), quepo<strong>de</strong> ser obtida por escalonamento também, sem arredondamento (mantendo frações).Não há arredondamentos a fazer, no princípio, porque todos os coeficientes são inteiroscom 1 algarismo significativo. O “3” da primeira coluna serve como pivô, pois é maior do queos <strong>de</strong>mais coeficientes da mesma coluna. A primeira etapa consiste em subtrair da segunda eda terceira linha múltiplos convenientes da primeira para que só reste o “3” como coeficientenão nulo. Para a segunda linha, o múltiplo tem que ser 1 3= 0.333, enquanto que para aterceira linha ele tem que ser 2 3= 0.667. Chamaremos esses múltiplos <strong>de</strong> multiplicadores.O leitor po<strong>de</strong> achar estranho que 1 − 0.333 × 3 = 1 − 0.999 = 0.001, o que faz com que<strong>de</strong> fato o primeiro coeficiente da segunda linha não se anule. Isso será ignorado na hora <strong>de</strong>se fazer o escalonamento. Observe que a escolha do multiplicador como 0.334 não ajudariaa resolver o problema. A única solução seria não arredondar o multiplicador antes <strong>de</strong> fazera conta, mas nem sempre é isso o que acontece num programa.Dessa primeira etapa sai o sistema⎛⎝ 3 1 2 −1 ⎞0 0.667 −0.666 2.33 ⎠ .0 1.33 −2.33 1.67Olhando para a segunda coluna, nota-se que a terceira linha <strong>de</strong>ve servir como pivô, pois 1.33é maior do que 0.667. Então faz-se a troca da segunda linha com a terceira, ficando⎛⎝ 3 1 2 −1⎞0 1.33 −2.33 1.67 ⎠ .0 0.667 −0.666 2.33Para a terceira linha, usa-se o multiplicadore daí temosPortantoex 2 =⎛0.6671.33 = 0.502 ,⎝ 3 1 2 −10 1.33 −2.33 1.670 0 0.504 1.491.67 + 2.33 × 2.961.33x 1 =x 3 = 1.490.504 = 2.96 ,=−1 − 6.44 − 2 × 2.9631.67 + 6.901.33= − 13.43⎞⎠ .= 8.571.33 = 6.44= −4.47 .


28CAPÍTULO 2. O MÉTODO DE ESCALONAMENTOObserve que não é preciso, quando se for dividir por 3, calcular 1 3, arredondar e <strong>de</strong>poismultiplicar pelo numerador. A divisão é consi<strong>de</strong>rada uma operação elementar.Comparando com a solução exata, po<strong>de</strong>mos ver que o maior erro absoluto foi <strong>de</strong> 0.06.Mais adiante, na Subseção 2.5.3, veremos como melhorar o cálculo, usando o refinamento <strong>de</strong>soluções.Exercício 2.1 Faça as contas intermediárias do exemplo acima. Resolva o sistema doexemplo acima usando apenas 2 algarismos significativos.Exercício 2.2 Implemente a resolução por escalonamento no computador.Exercício 2.3 Resolva o sistema linear(7.01 2.52 10.10.031 0.789 2.6com 3 algarismos significativos.Exercício 2.4 Consi<strong>de</strong>re o circuito elétrico da figura abaixo, no qual R 1 = 6Ω, R 2 = 4Ω,R 3 = 4Ω, R 4 = 1Ω, U 1 =19V , U 2 = 6V e U3 = 2V4Ω. Utilizando a Lei <strong>de</strong> Kirchoff (asoma das diferenças <strong>de</strong> potenciais em qualquer loop <strong>de</strong> um circuito é igual a zero) e a Lei<strong>de</strong> Ohm (a diferença <strong>de</strong> potencial, ∆V , resultante em um resistor <strong>de</strong> resistência R, <strong>de</strong>vidoà passagem <strong>de</strong> corrente elétrica I, é ∆V = RI), obtenha um sistema linear cujas variáveissão os valores das correntes I 1 , I 2 e I 3 . Utilize o método <strong>de</strong> Gauss para resolver o sistemaobtido consi<strong>de</strong>rando aritmética <strong>de</strong> ponto flutuante com dois algarismos significativos.R 1R31Ω R 419V U 12V U 3R 26V U 24ΩExercício 2.5 Dado o sistema linear Ax = b on<strong>de</strong>⎛A = ⎝6Ω ¡ I 1I 3−4.3 −4.2 1.10.90 −2.4 −0.700.70 −3.4 −0.10⎞)⎠ b =I 2⎛⎝ 3.42.1−3.3resolva-o pelo Método <strong>de</strong> Eliminação <strong>de</strong> Gauss com con<strong>de</strong>nsação pivotal, utilizando aritmética<strong>de</strong> ponto flutuante e 2 algarismos significativos. Não esqueça <strong>de</strong> arredondar após cadaoperação aritmética.2.3 O <strong>de</strong>terminante no Método <strong>de</strong> EscalonamentoObservemos em primeiro lugar que as proprieda<strong>de</strong>s do <strong>de</strong>terminante 1 <strong>de</strong> uma n-upla <strong>de</strong>vetores (u 1 , . . . , u n ) <strong>de</strong> R n (normalização, alternância e linearida<strong>de</strong>) po<strong>de</strong>m ser formuladas1 Veja A.8⎞⎠


2.4. A DESVANTAGEM DA REGRA DE CRAMER 29diretamente para uma matriz A: 1) <strong>de</strong>t(Id) = 1; 2) a troca <strong>de</strong> duas colunas faz mudar osinal do <strong>de</strong>terminante; e 3) se uma coluna se escreve como combinação αu + βv, então o<strong>de</strong>terminante é a soma <strong>de</strong> α vezes o <strong>de</strong>terminante da mesma matriz com a coluna αu + βvtrocada por u com β vezes o <strong>de</strong>terminante da mesma matriz com a coluna αu + βv trocadapor v.Por exemplo, suponha que queiramos calcular<strong>de</strong>t(u 1 , u 2 , . . .,u j + βu i , . . .,u n ) ,que, em termos matriciais, significa somar um múltiplo da i-ésima coluna à j-ésima coluna.Pelas proprieda<strong>de</strong>s do <strong>de</strong>terminante,<strong>de</strong>t(u 1 , u 2 , . . . , u j + βu i , . . . , u n ) = <strong>de</strong>t(u 1 , u 2 , . . . , u j , . . . , u n ) ,logo o <strong>de</strong>terminante não se altera quando somamos a uma coluna um múltiplo <strong>de</strong> uma outra.Em seguida, ressaltamos que as mesmas proprieda<strong>de</strong>s são válidas com linhas ao invés <strong>de</strong>colunas. Isso porque não é difícil mostrar que a transposta <strong>de</strong> A, <strong>de</strong>notada por A T , que éa matriz A on<strong>de</strong> se trocam colunas por linhas, tem o mesmo <strong>de</strong>terminante que A. Logo asproprieda<strong>de</strong>s <strong>de</strong> <strong>de</strong>tA em relação a suas linhas são as mesmas que <strong>de</strong>t A T = <strong>de</strong>tA em relaçãoa suas colunas.Portanto todas as operações realizadas no Método <strong>de</strong> Escalonamento não alteram o <strong>de</strong>terminanteda matriz <strong>de</strong> coeficientes, exceto as trocas <strong>de</strong> linhas, feitas por conta da con<strong>de</strong>nsaçãopivotal, pois cada troca <strong>de</strong> linha muda o sinal do <strong>de</strong>terminante.Por outro lado, o resultado final do escalonamento é uma matriz triangular, cujo <strong>de</strong>terminanteé dado pelo produto dos coeficientes da diagonal. Então o <strong>de</strong>terminante do sistemaserá zero se e somente se após o escalonamento houver um termo nulo na diagonal, e nessecaso o sistema será impossível ou in<strong>de</strong>terminado.Isto completa o argumento da Subseção A.8.3, on<strong>de</strong> queríamos provar que se A tem inversaentão <strong>de</strong>t A ≠ 0. Pois se A tem inversa, segue que o sistema tem única solução e todos ostermos da diagonal são não-nulos, e por conseguinte o <strong>de</strong>terminante do sistema também énão-nulo.2.4 A <strong>de</strong>svantagem da Regra <strong>de</strong> CramerA Regra <strong>de</strong> Cramer é uma fórmula bastante prática <strong>de</strong> se resolver Au = b, usando a noção<strong>de</strong> <strong>de</strong>terminante. Suponha que <strong>de</strong>tA ≠ 0. Nesse caso, existe única solução u = (x 1 , . . .,x n )para Au = b, mas quais são os valores <strong>de</strong> x 1 , . . .,x n ?Note que se trocarmos a i-ésima coluna pelo vetor b e calcularmos o <strong>de</strong>terminante damatriz resultante teremos<strong>de</strong>t(. . . , Ae i−1 , b, Ae i+1 , . . .) = <strong>de</strong>t(. . . , Ae i−1 , x 1 Ae 1 + . . . + x n Ae n , Ae i+1 , . . .) ,pois b = Au = x 1 Ae 1 +. . .+x n Ae n , pela linearida<strong>de</strong> <strong>de</strong> A. Pela linearida<strong>de</strong> do <strong>de</strong>terminante,po<strong>de</strong>mos separá-lo na soma <strong>de</strong> n <strong>de</strong>terminantes, on<strong>de</strong> em cada um <strong>de</strong>les teremos na i-ésimaposição um dos vetores x j Ae j . No entanto, apenas o <strong>de</strong>terminante com x i Ae i será não-nulo:<strong>de</strong>t(. . . , Ae i−1 , b, Ae i+1 , . . .) = <strong>de</strong>t(. . .,Ae i−1 , x i Ae i , Ae i+1 , . . .) .


30CAPÍTULO 2. O MÉTODO DE ESCALONAMENTOMais uma vez pela linearida<strong>de</strong>, po<strong>de</strong>mos tirar o escalar x i , que ficará multiplicado pelopróprio <strong>de</strong>terminante da matriz A:Logo<strong>de</strong>t(. . . , Ae i−1 , b, Ae i+1 , . . .) = x i <strong>de</strong>tA .x i = <strong>de</strong>t(. . . , Ae i−1, b, Ae i+1 , . . .),<strong>de</strong>tAque é a Regra <strong>de</strong> Cramer.A <strong>de</strong>svantagem da Regra <strong>de</strong> Cramer é que o número <strong>de</strong> operações necessárias para se chegarà solução é em geral muito maior do que no Método <strong>de</strong> Escalonamento. Essa comparaçãoé feita assim: calcula-se o número <strong>de</strong> operações aritméticas necessárias em cada método emfunção do tamanho n do sistema linear. Então vê-se que num método esse número crescemuito mais rapidamente com n do que no outro. Para facilitar a comparação, ignoraremos asinstruções <strong>de</strong> controle <strong>de</strong> fluxo que seriam necessárias caso os métodos fossem implementadosnum computador.Um número <strong>de</strong> operações aritméticas muito gran<strong>de</strong> é <strong>de</strong>svantajoso por duas razões: aumentao tempo <strong>de</strong> computação e aumenta a propagação dos erros <strong>de</strong> arredondamento.O número <strong>de</strong> produtos <strong>de</strong> n termos que aparecem no cálculo <strong>de</strong> um <strong>de</strong>terminante é n!(mostre isso), ou seja, são n! operações <strong>de</strong> adição. Para obter cada produto são n − 1multiplicações, totalizando n!(n−1) operações <strong>de</strong> multiplicação. Para calcular as n incógnitas,a Regra <strong>de</strong> Cramer pe<strong>de</strong> n + 1 <strong>de</strong>terminantes, logo são n!(n + 1) adições e n!(n − 1)(n + 1)multiplicações, mais as n divisões ao final <strong>de</strong> tudo.E quanto ao Método <strong>de</strong> Escalonamento, quantas operações aritméticas serão necessárias?Em vez <strong>de</strong> darmos a resposta sugere-se ao leitor fazer por ele mesmo, como indicado noseguinte exercício.Exercício 2.6 Mostre que o número <strong>de</strong> adições/subtrações, multiplicações e divisões necessáriaspara se completar o Método <strong>de</strong> Escalonamento num sistema linear <strong>de</strong> n equações e nincógnitas não passa <strong>de</strong> 2n 3 , para cada uma <strong>de</strong>las.Se quisermos comparar o número <strong>de</strong> operações totais, vemos que na Regra <strong>de</strong> Cramer sãonecessárias mais do que n! operações.Exercício 2.7 Mostre que, quando n é gran<strong>de</strong> então n! é muito maior do que 2n 3 . De fato,a razão2n 3n!vai a zero quando n vai a infinito. Se você mostrou isso com sucesso, verá então que seuargumento serve para mostrar que, qualquer que seja a potência p, a razãosempre vai a zero. Verifique!n pn!Na verda<strong>de</strong>, <strong>de</strong>vemos tomar um certo cuidado com a maneira pela qual fizemos a comparaçãoentre os dois métodos. Se estivermos pensando em tempo <strong>de</strong> computação, precisamos


2.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUÇÃO 31saber quanto a máquina gasta para fazer cada uma das operações. A divisão certamente gastamais tempo do que as outras operações, e o Método <strong>de</strong> Cramer apresenta menos divisões (apenasn) do que o Método <strong>de</strong> Escalonamento (cada multiplicador é calculado através <strong>de</strong> umadivisão). Já na contabilida<strong>de</strong> das outras operações o Método <strong>de</strong> Cramer per<strong>de</strong> do Método <strong>de</strong>Escalonamento, por causa do exercício acima.Exercício 2.8 Suponha que uma divisão nunca <strong>de</strong>more mais do que T vezes uma multiplicação,on<strong>de</strong> T é uma constante qualquer maior do que zero, e a multiplicação tome omesmo tempo que a adição e a subtração. Decida qual dos métodos é mais vantajoso, sob oponto <strong>de</strong> vista <strong>de</strong> tempo <strong>de</strong> computação para completá-lo.2.5 <strong>Sistemas</strong> mal-condicionados e refinamento <strong>de</strong> solução2.5.1 <strong>Sistemas</strong> mal-condicionadosNa teoria, se um sistema linear Au = b satisfaz <strong>de</strong>tA ≠ 0, então existe uma e só umasolução u. Na prática, porém, quando resolvemos o sistema via computador, erros po<strong>de</strong>mse acumular e a solução se afastar da solução verda<strong>de</strong>ira. Isso po<strong>de</strong> ser parcialmente sanadopela Con<strong>de</strong>nsação Pivotal, <strong>de</strong>scrita no Capítulo 2, e pelo Método <strong>de</strong> Refinamento, do qualdaremos uma idéia abaixo.O principal problema vem do fato <strong>de</strong> que muitas vezes os coeficientes do sistema e ostermos in<strong>de</strong>pen<strong>de</strong>ntes são retirados <strong>de</strong> medidas físicas ou <strong>de</strong> mo<strong>de</strong>los aproximados. Paraalguns sistemas, a solução po<strong>de</strong> <strong>de</strong>pen<strong>de</strong>r sensivelmente <strong>de</strong> seus coeficientes, a ponto <strong>de</strong>pequenas incertezas em seus valores provocarem gran<strong>de</strong>s alterações na solução final. Essessistemas são chamados <strong>de</strong> mal-condicionados.Para exemplificar, consi<strong>de</strong>remos o sistema 2 × 2{ x + y = 1,99x + 100y = 99.5que tem solução única e exata x = 0.5, y = 0.5. Agora consi<strong>de</strong>re o sistema{ x + y = 1,99.4x + 99.9y = 99.2com alterações <strong>de</strong> não mais do que 0.5% nos coeficientes originais (o que é bastante razoávelpara uma medida experimental). Sua solução única e exata é x = 1.4, y = −0.4, radicalmentediferente da anterior.Para enten<strong>de</strong>r porque isso acontece, experimente o leitor, para cada um dos dois sistemas,<strong>de</strong>senhar as retas que correspon<strong>de</strong>m a cada uma das equações. Nota-se que o problema é<strong>de</strong>vido ao fato <strong>de</strong> que as retas correspon<strong>de</strong>ntes a cada equação são quase paralelas, o quefaz com que o ponto <strong>de</strong> intersecção das duas seja muito sensível a pequenas mudanças noscoeficientes.A idéia vale em dimensões mais altas, se pensarmos em hiperplanos quase paralelos, nolugar <strong>de</strong> retas. Po<strong>de</strong>mos também pensar nos vetores-coluna <strong>de</strong> A (ou nos vetores-linha):se Ae 1 , Ae 2 , . . . , Ae n forem “quase” linearmente <strong>de</strong>pen<strong>de</strong>ntes, então o sistema será malcondicionado.


32CAPÍTULO 2. O MÉTODO DE ESCALONAMENTOUma maneira <strong>de</strong> se “medir” o condicionamento da matriz seria calculando seu <strong>de</strong>terminante(embora muitas vezes só possamos conhecê-lo <strong>de</strong>pois <strong>de</strong> escalonar a matriz). O<strong>de</strong>terminante é o hipervolume (com sinal) do hiperparalelepípedo formado pelos vetorescolunaAe 1 , Ae 2 , . . . , Ae n . Se esses vetores forem quase linearmente <strong>de</strong>pen<strong>de</strong>ntes, então ohiperparalelepípedo será “achatado”, e portanto terá volume pequeno. O argumento só falhano sentido <strong>de</strong> que o volume não <strong>de</strong>pen<strong>de</strong> somente do grau <strong>de</strong> achatamento do hiperparalelepípedo,mas também do comprimento <strong>de</strong> cada vetor. Então uma medida mais confiávelseria tomar o hipervolume do hiperparalelepípedo formado pela normalização <strong>de</strong>sses vetores,isto é, pelos vetoresv i = Ae i‖Ae i ‖ .Esse número estará entre 0 e 1, e quando estiver perto <strong>de</strong> zero significa que a matriz émal-condicionada.Em resumo, o número <strong>de</strong> condicionamento po<strong>de</strong> ser achado assim: (i) substitua cadacoluna Ae i da matriz pelo vetor v i = Aei‖Ae i‖, lembrando que a norma (eucli<strong>de</strong>ana) ‖u‖ <strong>de</strong> umvetor u = (x 1 , . . .,x n ) é dada por ‖u‖ = (x 2 1 + . . . + x2 n) 1/2 ; (ii) calcule o valor absoluto do<strong>de</strong>terminante da nova matriz; (iii) observe se o número obtido está próximo <strong>de</strong> zero ou <strong>de</strong>um: se estiver perto <strong>de</strong> zero então a matriz A é mal-condicionada.Há outras medidas do condicionamento <strong>de</strong> uma matriz, assim como há fórmulas querelacionam o erro cometido no Método <strong>de</strong> Escalonamento com essas medidas e com o número<strong>de</strong> algarismos significativos utilizados nas contas. Isso tudo no entanto foge ao escopo <strong>de</strong>ssasnotas. Além do mais, medidas <strong>de</strong> condicionamento são dificilmente aplicáveis na prática,pois são tão (ou mais) difíceis <strong>de</strong> serem obtidas quanto a própria solução do sistema linear.2.5.2 Matrizes <strong>de</strong> HilbertPara que o leitor se familiarize melhor com o problema do mau condicionamento, sugerimosque acompanhe o seguinte Exemplo.Consi<strong>de</strong>re o sistema⎧⎨⎩x 1 + 1 2 x 2 + 1 3 x 3 = 112 x 1 + 1 3 x 2 + 1 4 x 3 = 113 x 1 + 1 4 x 2 + 1 5 x 3 = 1Resolvendo o sistema por escalonamento (sem troca <strong>de</strong> linhas, pois não são necessáriaspara a con<strong>de</strong>nsação pivotal), e fazendo contas com frações exatas, obtemos a solução exata(x 1 , x 2 , x 3 ) = (3, −24, 30).Se, por outro lado, usarmos dois algarismos significativos ( 1 3= 0.33, por exemplo) e seguirmosexatamente o mesmo procedimento, obteremos (0.9, −11, 17). Com três algarismossignificativos, chegaremos em (2.64, −21.8, 27.8), resultado mais próximo mas ainda estranhamentelonge da solução exata.Matrizes do tipo⎛⎞⎜⎝1121 12 3.1n.1n+11 13· · ·n1 14· · ·n+1⎟. . . ⎠ .1 1n+2· · ·2n−1.


2.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUÇÃO 33são chamadas <strong>de</strong> matrizes <strong>de</strong> Hilbert, e aparecem naturalmente no problema do ajuste polinomial,como veremos mais adiante (vi<strong>de</strong> Subseção 5.7.2).2.5.3 RefinamentoUma das maneiras <strong>de</strong> sanar o problema <strong>de</strong> se encontrar uma solução “ruim”, causada pelomau condicionamento do sistema, é fazer o refinamento, que consiste em obter uma soluçãoû <strong>de</strong> Au = b, mesmo que não correta (por causa dos erros <strong>de</strong> arredondamento), e <strong>de</strong>poismelhorá-la.Para melhorar û, <strong>de</strong>finimos a diferença w = u −û para a solução verda<strong>de</strong>ira u, e tentamoscalcular w. Como u = û + w, entãologob = Au = A(û + w) ,Aw = b − Aû .Ou seja, a diferença w entre u e û é a solução <strong>de</strong> um sistema linear, on<strong>de</strong> os termos in<strong>de</strong>pen<strong>de</strong>ntessão dados por b −Aû e os coeficientes são os mesmos do sistema linear original (o quefacilita as coisas do ponto <strong>de</strong> vista <strong>de</strong> programação).O método po<strong>de</strong> ser implementado assim: calcula-se a primeira solução aproximada u (0) .Calcula-se então w (0) = u − u (0) resolvendo-se o sistemaAw (0) = b − Au (0) .Se a solução <strong>de</strong>sse sistema não contivesse erros, então u = u (0) +w (0) seria a solução correta.Como erros são inevitáveis, u (0) +w (0) po<strong>de</strong> não ser a solução exata, e será chamada <strong>de</strong> u (1) .Calcula-se então w (1) = u − u (1) , resolvendo-seAw (1) = b − Au (1) ,e em seguida <strong>de</strong>fine-se u (2) = u (1) + w (1) . E assim por diante.Vejamos um exemplo ilustrativo. Na Seção 2.2, usamos 3 algarismos significativos pararesolver⎛⎝ 3 1 1 1 2 0 −12⎞⎠ .2 2 −1 1Os passos do escalonamento ali usados são importantes para não se repetir as mesmas contasa cada etapa do refinamento.A solução obtida po<strong>de</strong> ser consi<strong>de</strong>rada uma primeira aproximação, chamada <strong>de</strong> u (0) :u (0) =⎛⎝ −4.476.442.96Calculamos então Au (0) , que é o teste usual para ver se u (0) é realmente solução. Obtemos⎛Au (0) = ⎝ −1.04⎞1.97 ⎠ ,1⎞⎠ .


34CAPÍTULO 2. O MÉTODO DE ESCALONAMENTOsempre usando 3 algarismos significativos, e então tiramos a diferença⎛b − Au (0) = ⎝ 0.04 ⎞0.03 ⎠ .0Agora queremos obter w do sistema Aw = b − Au (0) , para chegar à etapa seguinte, comu (1) = u (0) + w. Ou seja, temos que resolver o sistema⎛⎝ 3 1 2 0.04⎞1 1 0 0.03 ⎠ .3 2 −1 0Se proce<strong>de</strong>rmos ao escalonamento, seguiremos exatamente os mesmos passos feitos na Seção 2.2.Então não precisamos fazer tudo <strong>de</strong> novo no lado esquerdo, somente no vetor <strong>de</strong> termos in<strong>de</strong>pen<strong>de</strong>ntesdo lado direito.As transformações do lado direito são⎛⎝ 0.040.030⎞⎠ (i)−→⎛⎝0.040.0167−0.0267⎞⎠ (ii)−→⎛⎝0.04−0.02670.0167⎞⎠ (iii)−→⎛⎝0.04−0.02670.0301on<strong>de</strong> em (i) subtraímos da segunda linha 0.333 vezes a primeira linha e da terceira linhasubtraímos 0.667 vezes a primeira linha, em (ii) trocamos as posições da segunda e da terceiralinhas e em (iii) subtraímos da terceira linha 0.502 vezes a segunda linha. O sistemaescalonado fica⎛⎝3 1 2 0.040 1.33 −2.33 −0.02670 0 0.504 0.0301e daí chegamos a w = (w 1 , w 2 , w 3 ) = (−0.0543, 0.0842, 0.0597). Somando com u (0) obtemosu (1) = (−4.52, 6.52, 3.02), com erro absoluto máximo <strong>de</strong> 0.02.Para conferir, notamos que Au (1) = (−1.04, 2, 0.94), nada muito melhor do que Au (0) .De fato, mesmo com a possibilida<strong>de</strong> <strong>de</strong> refinamento, a solução <strong>de</strong> partida já era bastanterazoável. Vale a pena o leitor fazer mais algumas etapas, e conferir os seguintes valores:u (2) =⎛⎝ −4.446.442.96⎞⎠ , u (3) =⎛⎝ −4.536.533.02Com a limitação do número <strong>de</strong> algarismos significativos, não é certeza que o refinamentolevará à melhor aproximação da solução correta. Melhores resultados são obtidos se, nocálculo <strong>de</strong> b − Au (i) , for usada precisão dupla (isto é, o dobro <strong>de</strong> algarismos significativos),uma vez que b e Au (i) são vetores cujas coor<strong>de</strong>nadas têm valores muito próximos. Obviamenteos benefícios da precisão dupla po<strong>de</strong>m ser usados nos computadores e calculadoras mo<strong>de</strong>rnos,quando se escrevem várias operações concatenadas na mesma linha e o arredondamento paraprecisão simples só é feito no final. Isto diminui sensivelmente o acúmulo <strong>de</strong> erros.É preciso também colocar um critério <strong>de</strong> parada, principalmente no caso <strong>de</strong> se fazer aimplementação no computador. O critério po<strong>de</strong> ser feito nas soluções u (i) ou nos testes Au (i) .⎞⎠ ,⎞⎠ .⎞⎠ ,


2.5. SISTEMAS MAL-CONDICIONADOS E REFINAMENTO DE SOLUÇÃO 35Por exemplo, se u (i) = (u 1 , u 2 , . . .,u n ) e u (i+1) = (û 1 , û 2 , . . . , û n ), po<strong>de</strong>-se comparar o quantoas coor<strong>de</strong>nadas variam, relativamente, da etapa i para a etapa i+1, olhando para os números|u 1 − û 1 ||u 1 |, . . . ,|u n − û n ||u n |, . . . ,e pedindo que eles sejam menores do que um certo valor (por exemplo, 0.05, significando 5%<strong>de</strong> variação). O problema é quando o <strong>de</strong>nominador é igual a zero. Po<strong>de</strong>-se convencionar que:(i) se u j = 0 e û j = 0 então a variação é zero; (ii) se u j = 0 e û j ≠ 0, então a variação é iguala 1 (o que, em geral, fará com que o processo continue).Exercício 2.9 Melhorar o programa que implementa o Método <strong>de</strong> Escalonamento com con<strong>de</strong>nsaçãopivotal, acrescentando o refinamento, com algum critério <strong>de</strong> parada. Para fazer orefinamento, o programa <strong>de</strong>ve utilizar o “histórico” do escalonamento, isto é, os multiplicadorese as trocas <strong>de</strong> linha (para que não se repita tudo a cada etapa).Exercício 2.10 Tome o sistema discutido na Subseção 2.5.2 e sua solução obtida com2 algarismos significativos, chamando-a <strong>de</strong> u (0) . Obtenha o refinamento u (1) , calculandob − Au (0) com dupla precisão.Exercício 2.11 Consi<strong>de</strong>re o sistema⎛1/2 1/3 1/4⎝ −11/3 1/4 1/5 01/4 1/5 1/6 1(a) Ache sua solução exata.(b) Resolva-o com dois algarismos significativos.(c) Agora faça a seguinte experiência: escreva o mesmo sistema, arredondando para doisalgarismos significativos, mas a partir daí ache sua solução usando o máximo <strong>de</strong> algarismossignificativos que sua calculadora permite. Compare com a solução exata. Istomostra que o refinamento também é limitado pelo arredondamento inicial que, num sistemamal-condicionado, po<strong>de</strong> alterar drasticamente a solução.⎞⎠ .Exercício 2.12 Dado o sistema linear Ax = b on<strong>de</strong>⎛⎞⎛−3.2 −5.0 −4.0A = ⎝ −3.0 −2.9 −2.7 ⎠ b = ⎝ 2.5−4.4−1.5 −0.40 1.13.5⎞⎠,após resolvê-lo utilizando o Método <strong>de</strong> Eliminação <strong>de</strong> Gauss com con<strong>de</strong>nsação pivotal earitmética <strong>de</strong> ponto flutuante com 2 algarismos significativos, obtivemos⎛⎞ ⎛−3.2 −5.0 −4.0Ã = ⎝ 0.47 2.0 3.0 ⎠ p = ⎝ 1 ⎞ ⎛3 ⎠ x (0) = ⎝ 4.4 ⎞−7.5 ⎠ .0.94 0.90 −1.625.6Execute uma etapa <strong>de</strong> refinamento.


36CAPÍTULO 2. O MÉTODO DE ESCALONAMENTO


Capítulo 3Métodos iterativos3.1 O Método <strong>de</strong> JacobiO Método <strong>de</strong> Jacobi é um procedimento iterativo para a resolução <strong>de</strong> sistemas lineares. Tema vantagem <strong>de</strong> ser mais simples <strong>de</strong> se implementar no computador do que o Método <strong>de</strong>Escalonamento, e está menos sujeito ao acúmulo <strong>de</strong> erros <strong>de</strong> arredondamento. Seu gran<strong>de</strong><strong>de</strong>feito, no entanto, é não funcionar em todos os casos.Suponha um sistema linear nas incógnitas x 1 , ..., x n da seguinte forma:a 11 x 1 + a 12 x 2 + a 13 x 3 + . . . + a 1n x n = b 1a 21 x 1 + a 22 x 2 + a 23 x 3 + . . . + a 2n x n = b 2. . . . . .a n1 x 1 + a n2 x 2 + a n3 x 3 + . . . + a nn x n = b nSuponha também que todos os termos a ii sejam diferentes <strong>de</strong> zero (i = 1, . . .,n). Se nãofor o caso, isso às vezes po<strong>de</strong> ser resolvido com uma troca na or<strong>de</strong>m das equações. Então asolução <strong>de</strong>sse sistema satisfazx 1 =x 2 =.x n =1[b 1 − a 12 x 2 − a 13 x 3 − . . . − a 1n x n ]a 111[b 2 − a 21 x 1 − a 23 x 3 − . . . − a 2n x n ]a 22.1[b n − a n1 x 1 − a n2 x 2 − . . . − a n,n−1 x n−1 ]a nnEm outras palavras, se (x 1 , . . . , x n ) for solução do sistema e esses valores forem “colocados”no lado direito das equações, então resultarão no lado esquerdo os mesmos valores x 1 , . . . , x n .O Método <strong>de</strong> Jacobi consiste em “chutar” valores x (0)1 , . . .,x(0) n , colocar esses valores nolado direito das equações, obter daí x (1)1 , . . . , x(1) n , em seguida colocar esses novos valores nas37


38CAPÍTULO 3. MÉTODOS ITERATIVOSequações e obter x (2)1 , . . .,x(2) n , etc. Entãox (k+1)1 =x (k+1)2 =.x (k+1)n =1()b 1 − a 12 x (k)2 − a 13 x (k)3 − . . . − a 1n x n(k)a 111()b 2 − a 21 x (k)1 − a 23 x (k)3 − . . . − a 2n x n(k)a 22.1()b n − a n1 x (k)1 − a n2 x (k)2 − . . . − a n,n−1 x (k)n−1a nnEspera-se que para todo i = 1, . . .,n a seqüência {x (k)i} k convirja para o valor verda<strong>de</strong>iro x i .Como dissemos, no entanto, nem sempre ocorre essa convergência. Será que é possívelsaber <strong>de</strong> antemão se o método vai ou não vai funcionar?Daremos um critério, chamado <strong>de</strong> ‘Critério das Linhas’ que, se for satisfeito, implica naconvergência do Método. Infelizmente, daí não po<strong>de</strong>remos concluir a afirmativa inversa. Istoé, é falso dizer “não satisfaz o Critério das Linhas então não converge”. Po<strong>de</strong> haver sistemasem que o Método <strong>de</strong> Jacobi funcione porém não satisfaça o Critério das Linhas.3.2 Critério das LinhasO Critério das Linhas pe<strong>de</strong> quen∑j = 1j ≠ i|a ij | < |a ii |para todo i = 1, . . .,n. Em palavras: “o valor absoluto do termo diagonal na linha i é maiordo que a soma dos valores absolutos <strong>de</strong> todos os outros termos na mesma linha”, ou seja, adiagonal da matriz do sistema linear é dominante.É importante observar que o Critério das Linhas po<strong>de</strong> <strong>de</strong>ixar <strong>de</strong> ser satisfeito se houvertroca na or<strong>de</strong>m das equações, e vice-versa: uma troca cuidadosa po<strong>de</strong> fazer com que o sistemapasse a satisfazer o Critério.Teorema. Se o sistema linear satisfaz o Critério das Linhas então o Método <strong>de</strong> Jacobiconverge.Sugerimos o seguinte exercício, antes <strong>de</strong> passarmos à <strong>de</strong>monstração <strong>de</strong>sse Teorema.Exercício 3.1 Mostre que os sistemas lineares gerados por problemas <strong>de</strong> contorno (Seção 1.8)em geral não satisfazem o Critério das Linhas. Mesmo assim, monte um programa <strong>de</strong> computadorque resolva o problema, baseado no Método <strong>de</strong> Jacobi. O que acontece?Para provar o Teorema, precisamos mostrar (usando o Critério das Linhas) que as seqüênciasx (k)1 , x(k) 2 ,...,x(k) n , formadas a partir dos chutes iniciais x (0)1 , x(0) 2 ,...,x(0) n , convergem para osvalores procurados x 1 , . . .,x n . Então precisamos mostrar que|x (k)1 − x 1 | k→∞−→ 0 , |x (k)2 − x 2 | k→∞−→ 0 , . . . , |x n(k) − x n| k→∞−→ 0 ,


3.2.CRITÉRIO DAS LINHAS 39ou, introduzindo uma notação mais compacta, <strong>de</strong> forma que∆(k) = ∆ max (x (k) , x) = max{|x (k)1 − x 1 |, . . . , |x n(k) − x n|} k→∞−→ 0 .De fato, iremos mostrar que ∆(k) <strong>de</strong>cai geometricamente, isto é, existem um λ < 1 e umaconstante c > 0 tal que∆(k) ≤ cλ k ,e isso provará nossa afirmação.Já para conseguir essa <strong>de</strong>sigualda<strong>de</strong>, provaremos que para todo k ≥ 1 valeEntão teremos∆(k) ≤ λ∆(k − 1) .∆(1) ≤ λ∆(0)∆(2) ≤ λ∆(1) ≤ λ 2 ∆(0).∆(k) ≤ λ k ∆(0) ,.ou seja, a constante c po<strong>de</strong> ser o próprio ∆(0), que é a maior diferença entre o valor iniciale a solução verda<strong>de</strong>ira.Por sua vez, provar que∆(k) ≤ λ∆(k − 1)remete a provar que, para todo i = 1, . . . , n, vale|x (k)i− x i | ≤ λ∆(k − 1) = λ maxi=1,...,n |x(k−1) i − x i | .Faremos a <strong>de</strong>monstração completa para i = 1, mas ficará claro que o argumento valerá paratodo i = 1, . . .,n, <strong>de</strong>s<strong>de</strong> que escolhamos λ a<strong>de</strong>quadamente. Precisamos escrever x (k)i − x i ,lembrando quex (k)1 = 1 ()b 1 − a 12 x (k−1)2 − a 13 x (k−1)3 − . . . − a 1n x n(k−1)a 11e, como os x 1 , . . .,x n formam uma solução,x 1 = 1a 11(b 1 − a 12 x 2 − a 13 x 3 − . . . − a 1n x n ) .Entãox (k)1 − x 1 = 1 ()a 12 (x 2 − x (k−1)2 ) + a 13 (x 3 − x (k−1)3 ) + . . . + a 1n (x n − x n (k−1) )a 11Tomando o valor absoluto (o módulo) e lembrando que “o módulo da soma é menor ou igualà soma dos módulos”, temos|x (k)1 − x 1 | ≤1()|a 12 | · |x 2 − x (k−1)2 | + |a 13 | · |x 3 − x (k−1)3 | + . . . + |a 1n | · |x n − x n (k−1) ||a 11 |..


40CAPÍTULO 3. MÉTODOS ITERATIVOSNote, no entanto, que por <strong>de</strong>finiçãoportanto|x j − x (k−1)j | ≤ maxi=1,...,n |x i − x (k−1)i | ≡ ∆(k − 1) ,1 − x 1 | ≤ |a 12| + |a 13 | + . . . + |a 1n |∆(k − 1) .|a 11 ||x (k)Agora <strong>de</strong>finimos a constanteλ 1 = |a 12| + |a 13 | + . . . + |a 1n ||a 11 |que <strong>de</strong>ve ser menor do que 1, pelo Critério das Linhas. Então|x (k)1 − x 1 | ≤ λ 1 ∆(k − 1) .Para as outras linhas todo o procedimento é análogo, e sempre resultará|x (k)i − x i | ≤ λ i ∆(k − 1) ,,para todo i = 1, . . .,n, on<strong>de</strong>λ i = 1|a ii |n∑j = 1j ≠ i|a ij | .O Critério das Linhas garante que λ i < 1, para todo i = 1, . . .,n. Se <strong>de</strong>finirmos agoraλ = maxi=1,...,n λ i ,entãologo|x (k)i− x i | ≤ λ∆(k − 1) ,∆(k) ≤ λ∆(k − 1) ,como queríamos <strong>de</strong>monstrar!3.3 Critério <strong>de</strong> paradaDa <strong>de</strong>sigualda<strong>de</strong> ∆(k) ≤ λ∆(k −1), po<strong>de</strong>mos <strong>de</strong>duzir uma expressão que relaciona ∆(k) com∆ max (x (k−1) , x (k) ) = maxi=1,...,n |x(k−1) i − x (k)i | que correspon<strong>de</strong> à variação máxima entre x (k−1)e x (k) .


3.4. O MÉTODO DE GAUSS-SEIDEL 41De fato, <strong>de</strong> ∆(k) ≤ λ∆(k − 1) segue queAssime finalmentemaxi=1,...,n |x(k) i− x i | ≤ λ maxi=1,...,n |x(k−1) i− x i |= λ maxi=1,...,n |x(k−1) i≤ λ maxi=1,...,n{|x (k−1)i≤ λ maxi=1,...,n |x(k−1) i− x (k)i+ x (k)i − x i |− x (k)i | + |x (k)i − x i |}− x (k)i | + λ maxi=1,...,n |x(k) i − x i |(1 − λ) maxi=1,...,n |x(k) i− x i | ≤ λ maxi=1,...,n |x(k−1) i− x (k)i|que com nossa notação compacta se tornamaxi=1,...,n |x(k) i− x i | ≤ λ1 − λ maxi=1,...,n |x(k−1) i− x (k)i|∆(k) ≤λ1 − λ ∆ max(x (k−1) , x (k) )Um critério <strong>de</strong> parada para o Método <strong>de</strong> Jacobi consiste em calcular o lado direito da <strong>de</strong>sigualda<strong>de</strong>acima e parar quando esta for menor que a precisão <strong>de</strong>sejada.Outro critério <strong>de</strong> parada é aquele em que somente calculamos a iteração seguinte caso avariação relativa seja maior que uma quantida<strong>de</strong> p pré-fixada, isto é, se|x (k+1)i− x (k)i | ≥ p|x (k)i |para algum i = 1, . . ., n. Entretanto este segundo critério não garante que a distância entrex (k) e x seja menor que p. Muitas vezes a velocida<strong>de</strong> <strong>de</strong> convergência do método é muitolenta e mesmo longe da solução, a variação relativa das soluções aproximadas po<strong>de</strong> ser muitopequena.3.4 O Método <strong>de</strong> Gauss-Sei<strong>de</strong>lO Método <strong>de</strong> Jacobi po<strong>de</strong>ria ser aplicado nos problemas <strong>de</strong> contorno da Seção 1.8, massomente pelo Critério das Linhas não seria possível afirmar que haveria convergência, pois osvértices livres produzem equações on<strong>de</strong> o elemento da diagonal é exatamente igual à somados <strong>de</strong>mais termos, o que significa, na notação da Seção anterior, que λ i = 1, para algunsvalores <strong>de</strong> i.Experimentos numéricos evi<strong>de</strong>nciam que <strong>de</strong> fato há convergência do Método <strong>de</strong> Jacobinesses casos, embora ela seja muito lenta, principalmente se o número <strong>de</strong> vértices da gra<strong>de</strong>for muito gran<strong>de</strong>. Embora a convergência possa ser <strong>de</strong>monstrada matematicamente, comcritérios menos exigentes que o Critério das Linhas, discutiremos nesta Seção uma variaçãodo Método <strong>de</strong> Jacobi, chamada <strong>de</strong> Método <strong>de</strong> Gauss-Sei<strong>de</strong>l. Sua eficácia ficará <strong>de</strong>monstradaa partir <strong>de</strong> uma hipótese mais fraca que o Critério das Linhas, chamada <strong>de</strong> Critério <strong>de</strong>


42CAPÍTULO 3. MÉTODOS ITERATIVOSSassenfeld. Não será difícil mostrar que os problemas <strong>de</strong> contorno citados satisfazem essecritério, <strong>de</strong>s<strong>de</strong> que se tenha um mínimo <strong>de</strong> cuidado na numeração dos vértices livres.No Método <strong>de</strong> Jacobi, calcula-se o vetor (x (k+1)1 , . . . , x n(k+1) ) a partir do vetor (x (k)1 , . . .,x n (k) ) da seguinte forma:⎛⎜⎝x (k+1)1x (k+1)2.x (k+1)nou, <strong>de</strong> forma sucinta,⎞ ⎛⎟⎠ = ⎜⎝⎞ ⎛b 1 /a 11b 2 /a 22. ⎟. ⎠ − ⎜⎝b n /a nna0 12 a 13a 11a 21 aa 220 23.a n1a nn.a n2a nnu (k+1) = w − Bu (k) .a 11· · ·a 22· · ·a 1n11a 2na 22. . .a n3a nn· · · 0⎞⎛⎟⎠⎜⎝Em cada etapa, as coor<strong>de</strong>nadas x (k+1)1 , . . ., x n(k+1) <strong>de</strong> u (k+1) são obtidas todas <strong>de</strong> uma vezsó, a partir das coor<strong>de</strong>nadas x (k)1 , . . ., x(k) n <strong>de</strong> u (k) .Já no Método <strong>de</strong> Gauss-Sei<strong>de</strong>l as coor<strong>de</strong>nadas atualizadas são imediatamente usadas naatualização das <strong>de</strong>mais. Explicitamente, temosx (k+1)1 =x (k+1)2 =x (k+1)3 =1()b 1 − a 12 x (k)2 − a 13 x (k)3 − · · · − a 1n x n(k)a 111(b 2 − a 21 x (k+1)1 − a 23 x (k)3 − · · · − a 2n x n(k)a 221(b 3 − a 31 x (k+1)1 − a 32 x (k+1)3 − · · · − a 3n x n(k)a 33))x (k)1x (k)2.x (k)n⎞⎟⎠ ,.x (k+1)n =.1()b n − a n1 x (k+1)1 − a n2 x (k+1)2 − · · · − a n,n−1 x (k+1)n−1a nnPara introduzir o Critério <strong>de</strong> Sassenfeld e discutir a convergência, é melhor ilustrarmoscom um sistema com 4 equações. Depois enunciaremos o Critério para sistemas com umnúmero qualquer <strong>de</strong> equações, e ficará claro que os argumentos se generalizam. Com isso,evitaremos o excesso <strong>de</strong> elipses (os três pontinhos), e o critério emergirá <strong>de</strong> modo natural.Assim como na Seção anterior, queremos avaliar a diferença entre a aproximação obtidana etapa k e a solução original, e mostrar que essa diferença se reduz a cada etapa. Paramedir essa diferença, tomamos∆(k) = maxi=1,...,n |x(k) i − x i | ,on<strong>de</strong> x 1 , . . .,x n representa a solução verda<strong>de</strong>ira. Mais uma vez, nosso objetivo é mostrar queexiste λ < 1 tal que∆(k + 1) ≤ λ∆(k) ,e para isso precisaremos mostrar que|x (k+1)i− x i | ≤ λ∆(k)


3.4. O MÉTODO DE GAUSS-SEIDEL 43para todo i = 1, . . .,n.Num sistema <strong>de</strong> 4 equações e 4 incógnitas temosx (k+1)1 − x 1 =x (k+1)2 − x 1 =x (k+1)3 − x 1 =x (k+1)4 − x 1 =Da primeira equação, sai1()a 12 (x 2 − x (k)2a ) + a 13(x 3 − x (k)3 ) + a 14(x 4 − x (k)4 )111()a 21 (x 1 − x (k+1)1 ) + a 23 (x 3 − x (k)3a ) + a 24(x 4 − x (k)4 ) 221()a 31 (x 1 − x (k+1)1 ) + a 32 (x 2 − x (k+1)2 ) + a 34 (x 4 − x (k)4a ) 331(a 41 (x 1 − x (k+1)1 ) + a 42 (x 2 − x (k+1)2 ) + a 43 (x 3 − x (k+1)3 )a 44|x (k+1)1 − x 1 | ≤ |a 12||a 11 | · |x 2 − x (k)2 | + |a 13||a 11 | · |x 3 − x (k)3 | + |a 14||a 11 | · |x 4 − x (k)4 | ,Como |x i − x (k)i | ≤ ∆(k), para todo i = 1, 2, 3, 4, entãoDefinimospara ficar com|x (k+1)1 − x 1 | ≤ |a 12| + |a 13 | + |a 14 |∆(k) .|a 11 |β 1 = |a 12| + |a 13 | + |a 14 ||a 11 ||x (k+1)1 − x 1 | ≤ β 1 ∆(k) .Agora levamos em conta essa última inequação para mostrar que2 − x 2 | ≤ β 1|a 21 | + |a 23 | + |a 24 |∆(k) ≡ β 2 ∆(k) .|a 22 ||x (k+1)Continuando, obtemose3 − x 3 | ≤ β 1|a 31 | + β 2 |a 32 | + |a 34 |∆(k) ≡ β 3 ∆(k)|a 33 ||x (k+1)|x (k+1)Em conclusão, mostramos que4 − x 4 | ≤ β 1|a 41 | + β 2 |a 42 | + β 3 |a 43 |∆(k) ≡ β 4 ∆(k) .|a 44 ||x (k+1)i − x i | ≤ β i ∆(k) ,,)logo∆(k + 1) ≤ ( maxi=1,2,3,4 β i)∆(k) .


44CAPÍTULO 3. MÉTODOS ITERATIVOSSe cada um dos números β 1 , β 2 , β 3 e β 4 for menor do que 1, então teremos ∆(k+1) ≤ λ∆(k),com λ < 1.Para um sistema linear <strong>de</strong> n equações e n incógnitas, o Critério <strong>de</strong> Sassenfeld po<strong>de</strong> serenunciado <strong>de</strong> forma indutiva, da seguinte maneira. Primeiro,β 1 = |a 12| + |a 13 | + . . . + |a 1n ||a 11 |como no Critério das Linhas. Os <strong>de</strong>mais coeficientes são <strong>de</strong>finidos indutivamente. Suponhaque já tenham sido <strong>de</strong>finidos β 1 , β 2 , . . ., β i−1 , para i ≥ 2. Então β i se <strong>de</strong>fine comoβ i = β 1|a i1 | + . . . + β i−1 |a i,i−1 | + |a i,i+1 | + . . . + |a in ||a ii |isto é, no numerador os β i ’s aparecem multiplicando os coeficientes da linha i à esquerdada diagonal, enquanto que os coeficientes à direita da diagonal são multiplicados por 1. Ocoeficiente da diagonal aparece no <strong>de</strong>nominador (como no Critério das Linhas) e não apareceno numerador.Analogamente ao Método <strong>de</strong> Jacobi, o Método <strong>de</strong> Gauss-Sei<strong>de</strong>l também tem a <strong>de</strong>sigualda<strong>de</strong>∆(k) ≤λ1 − λ ∆ max(x (k−1) , x (k) )<strong>de</strong>s<strong>de</strong> que λ = max β i seja estritamente menor que 1.i=1,...,nExercício 3.2 Tente mostrar o Critério <strong>de</strong> Sassenfeld n × n.Exercício 3.3 Mostre que os problemas <strong>de</strong> contorno da Seção 1.8 satisfazem o Critério <strong>de</strong>SassenfeldExercício 3.4 Obtenha a solução com 3 algarismos significativos do sistema linear4x 1 + 2x 2 + x 3 = 11−x 1 + 2x 2 = 32x 1 + x 2 + 4x 3 = 16usando o Método <strong>de</strong> Jacobi e o Método <strong>de</strong> Gauss-Sei<strong>de</strong>l. Compare a velocida<strong>de</strong> <strong>de</strong> convergêncianos dois métodos.,,251 3x yw z7 130Exercício 3.5 Consi<strong>de</strong>re a tabela acima. Use o Método <strong>de</strong> Gauss-Sei<strong>de</strong>l para achar x, y, z, wtais que cada casinha que contenha uma incógnita seja a média das quatro adjacentes (consi<strong>de</strong>randoapenas verticais e horizontais). Faça 4 iterações, partindo <strong>de</strong> (x 0 , y 0 , z 0 , w 0 ) =


3.4. O MÉTODO DE GAUSS-SEIDEL 45(0, 0, 0, 0), e arredondando para 2 algarismos significativos após cada etapa. (Veja a Seção 1.8na página 18.)Exercício 3.6 Consi<strong>de</strong>re o sistema linear Ax = b, on<strong>de</strong>⎛A = ⎝ −1 4 −3⎞ ⎛−5 −3 8 ⎠ e b = ⎝ 4⎞−3 ⎠−6 2 3 3(a) A matriz A satisfaz o Critério das Linhas para alguma permutação <strong>de</strong> linhas?(b) A matriz A tem alguma permutação das linhas a qual satisfaz o Critério <strong>de</strong> Sassenfeld?Qual? Justifique.(c) Escreva as equações <strong>de</strong> recorrência do método <strong>de</strong> Gauss-Sei<strong>de</strong>l e calcule uma iteração apartir <strong>de</strong> x (0) = (1, 0, 0).(d) Sabendo-se que a solução exata está em [−3, 4] × [−1, 5] × [−2, 2], quantas iterações sãonecessárias para que o erro seja menor que 10 −2 ?Exercício 3.7 Consi<strong>de</strong>re os sistemas lineares⎧⎨ 4x + 1y + 1z = 2(1) 2x − 5y + 1z = 3 e (2)⎩1x + 1y + 1.5z = 4⎧⎨⎩5x + 2y + 2.5z = 62x − 5y + 1z = 31x + 1y + 1.5z = 4Observe que o sistema (2) foi obtido do sistema (1) substituindo-se a primeira equação <strong>de</strong>(1) pela soma <strong>de</strong>sta com a última equação <strong>de</strong> (1). Portanto eles são equivalentes.Queremos encontrar a solução do sistema (1) (ou (2)) usando o Método <strong>de</strong> Gauss-Sei<strong>de</strong>l,partindo <strong>de</strong> um certo chute inicial fixado (x 0 , y 0 , z 0 ), <strong>de</strong> forma a obter a melhor precisãopossível na vigésima iteração.A qual dos dois sistemas <strong>de</strong>vemos aplicar o Método <strong>de</strong> Gauss-Sei<strong>de</strong>l segundo esse objetivo?Justifique.


46CAPÍTULO 3. MÉTODOS ITERATIVOS


Parte IIAjuste <strong>de</strong> Funções47


Capítulo 4Ajuste <strong>de</strong> funções4.1 O problema do ajusteyEm medidas experimentais, freqüentemente nos <strong>de</strong>paramoscom uma tabela <strong>de</strong> dados (x i , y i ), i = 1, . . .,N, que representamosvisualmente por meio <strong>de</strong> um gráfico. Em geral,esperamos que haja uma relação entre a variável y e avariável x, que seria expressa por uma função: y = f(x).yix ixMuitas vezes não dispomos <strong>de</strong> um mo<strong>de</strong>lo que explique a <strong>de</strong>pendência <strong>de</strong> y em relação a x,<strong>de</strong> forma que não po<strong>de</strong>mos <strong>de</strong>duzir essa função apenas <strong>de</strong> teoria. De fato, o experimento po<strong>de</strong>se dar justamente como uma forma <strong>de</strong> investigar essa relação, para criar um embasamentoda teoria sobre dados reais.Mesmo que o experimento não culmine num mo<strong>de</strong>lo teórico, é sempre <strong>de</strong>sejável ter ummo<strong>de</strong>lo preditor, quer dizer, é interessante saber prever, pelo menos <strong>de</strong> forma aproximada,em que resultará a medida <strong>de</strong> y se soubermos x. Por exemplo, suponha que queiramos usarum elástico como dinamômetro. Para isso, fixamos uma das extremida<strong>de</strong>s do elástico e naoutra extremida<strong>de</strong> penduramos o objeto do qual <strong>de</strong>sejamos conhecer o peso. Quanto maispesado for o objeto, mais o elástico se disten<strong>de</strong>rá, isso é óbvio, mas nós gostaríamos <strong>de</strong> obter,a partir da distensão do elástico, um valor numérico para seu peso. Neste exemplo, x é adistensão do elástico e y o peso do objeto (ou po<strong>de</strong>ria ser o contrário, se <strong>de</strong>sejássemos prevera distensão que o elástico teria para um <strong>de</strong>terminado peso).Para ter uma fórmula a ser usada no dinamômetro precisamos conhecer muito bem comose comporta nosso elástico. Para isso, fazemos várias medidas do montante da distensão emfunção do peso do objeto, o que nos dará uma coleção <strong>de</strong> dados (x i , y i ), i = 1, . . . , N. Oque nós queremos agora é encontrar uma função y = f(x) que se aproxime o melhor possível49


50CAPÍTULO 4. AJUSTE DE FUNÇÕES<strong>de</strong>sses dados, mas como? É <strong>de</strong>sejável também que a fórmula <strong>de</strong> f não seja muito complicada,pois isso facilitaria mais tar<strong>de</strong> sua utilização como preditor.É claro que o problema, colocado <strong>de</strong>ssa forma, parece muito complicado. No entanto,po<strong>de</strong>mos restringir bastante o universo das funções candidatas, e <strong>de</strong>ntro <strong>de</strong>sse conjunto menor<strong>de</strong> funções procurar aquela que melhor se adapte a nossos pontos.Além disso, é preciso estabelecer um critério comparativo do que seja a qualida<strong>de</strong> <strong>de</strong> umaaproximação. Isto é, como <strong>de</strong>cidir se uma função se a<strong>de</strong>qua mais aos dados do que outra?4.2 Os mínimos quadradosPrecisamos <strong>de</strong> uma medida numérica para avaliar a qualida<strong>de</strong> <strong>de</strong> uma aproximação. Istoé, temos uma coleção <strong>de</strong> dados (x i , y i ), i = 1, . . .,N, e queremos avaliar o quanto uma<strong>de</strong>terminada função f difere <strong>de</strong>sses dados, associando a f um número Q(f). Esse número<strong>de</strong>ve ser sempre não-negativo, e <strong>de</strong>ve ser usado <strong>de</strong> forma comparativa: se Q(f 1 ) for menordo que Q(f 2 ) então f 1 é uma aproximação aos dados melhor do que f 2 .Evi<strong>de</strong>ntemente há um certo grau <strong>de</strong> arbitrarieda<strong>de</strong> no método que escolhemos para <strong>de</strong>terminarQ. Aqui adotaremos o mais comum <strong>de</strong>les, que po<strong>de</strong> ser justificado por razõesestatísticas fora do alcance <strong>de</strong>stas notas, e é conhecido como qui-quadrado (sem pesos, naSeção 6.4 abordamos o qui-quadrado com pesos):a distância <strong>de</strong> f(x) aos dados experimentais é <strong>de</strong>finida comosendoN∑Q(f) = (f(x i ) − y i ) 2 .i=1Em palavras, temos que avaliar, para cada x i , a diferençaentre o dado y i e o valor <strong>de</strong> f em x i , elevar essa diferença aoquadrado e <strong>de</strong>pois somar os resultados obtidos para cadax i .f(x )y iiyx ixfExercício 4.1 Dados os pontos (−2.8, −1.6), (1.6, −0.6), (3.0, 2.4), (4.5, 4.0), (6.0, 5.7) e asfunções afins f 1 (x) = −0.8 + 0.86x e f 2 (x) = −1.0 + 1.32x, qual das duas funções se ajustamelhor aos dados, usando o critério do qui-quadrado? Desenhe as retas e os pontos em papelmilimetrado antes <strong>de</strong> fazer as contas, e procure adivinhar o resultado por antecipação.4.3 ParâmetrosPrecisamos resolver também a questão do conjunto <strong>de</strong> funções aon<strong>de</strong> vamos procurar aquelaque minimiza o qui-quadrado. Veja que o problema em alguns casos per<strong>de</strong> o sentido se nãofizermos isso. De fato, para qualquer conjunto <strong>de</strong> dados (x i , y i ), i = 1, . . .,N, on<strong>de</strong> os x i ’snunca se repitam, sempre po<strong>de</strong>mos achar um polinômio <strong>de</strong> grau N − 1 tal que p(x i ) = y i ,para todo i = 1, . . . , N, como vimos nas Seções 1.5 e A.7. Com isso, Q(p) é zero e não hácomo encontrar uma função melhor do que essa.O bom senso, no entanto, levará a concluir que isso não vale a pena. Duas razões concretaspo<strong>de</strong>m ser dadas imediatamente: se a quantida<strong>de</strong> <strong>de</strong> dados for muito gran<strong>de</strong>, será necessário


4.3.PARÂMETROS 51achar um polinômio <strong>de</strong> grau bastante gran<strong>de</strong> para interpolar esses dados. Haverá a dificulda<strong>de</strong><strong>de</strong> se achar o polinômio e <strong>de</strong>pois a dificulda<strong>de</strong> <strong>de</strong> se utilizá-lo.Menos objetiva do que essa razão é o fato bastante comum em experiências <strong>de</strong> que sabemosmuitas vezes <strong>de</strong> antemão que tipo <strong>de</strong> função estamos procurando. Para ilustrar, vejamosalguns exemplos.4.3.1 Densida<strong>de</strong>Suponha que queiramos <strong>de</strong>terminar a <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> um certo material. O procedimento éclaro, se dispusermos dos instrumentos a<strong>de</strong>quados. Basta medir o volume <strong>de</strong> uma certaquantida<strong>de</strong> <strong>de</strong> material, sua massa e proce<strong>de</strong>r à razão massa por volume.Se estivermos um pouco mais preocupados com a precisão do resultado, faremos maismedidas e, evi<strong>de</strong>ntemente, tiraremos a média dos resultados. Se, no entanto, essas medidasforem tomadas com volumes diferentes, convém fazer um gráfico Massa (m) vs. Volume (V).Veremos que po<strong>de</strong>mos também tirar um valor para a <strong>de</strong>nsida<strong>de</strong> a partir <strong>de</strong>sse gráfico.Chamando <strong>de</strong> ρ 0 a <strong>de</strong>nsida<strong>de</strong> do material, temos que m = f(V ) = ρ 0 V , o que emportuguês po<strong>de</strong> ser assim entendido: “a massa do material <strong>de</strong>pen<strong>de</strong> apenas <strong>de</strong> seu volume,e essa <strong>de</strong>pendência é explicitamente dada por ρ 0 V , on<strong>de</strong> ρ 0 é uma constante fixa chamada<strong>de</strong>nsida<strong>de</strong>”. Se admitirmos que isso é verda<strong>de</strong> po<strong>de</strong>mos tentar, a partir do gráfico, achar ovalor <strong>de</strong> ρ 0 .Para achar o valor <strong>de</strong> ρ 0 que melhor se adapta aos dados experimentais recorremos aoqui-quadrado. Olhamos (num sentido abstrato) para todas as possíveis funções f ρ (V ) = ρV ,cujos gráficos são retas <strong>de</strong> inclinação ρ, passando pela origem. Observe que cada funçãof ρ é uma função <strong>de</strong> uma variável (V ), mas que <strong>de</strong>pen<strong>de</strong> do número ρ, que é chamado <strong>de</strong>parâmetro.Para cada função f ρ po<strong>de</strong>mos medir o qui-quadrado Q(f ρ ), e <strong>de</strong>pois procurar o parâmetroρ para o qual Q(f ρ ) é mínimo. Como ρ varia ao longo da reta real, a função ρ ↦→ Q(f ρ ) éuma função <strong>de</strong> uma variável, que <strong>de</strong>notaremos simplesmente por Q(ρ). Note agora que ρ,que era parâmetro para f ρ (V ), agora é a própria variável <strong>de</strong> Q(ρ) = Q(f ρ )!Po<strong>de</strong>mos visualizar Q(ρ) através <strong>de</strong> um gráfico. Se houverum mínimo, ele po<strong>de</strong> ser encontrado com exatidãoprocurando-se ρ 0 tal queQ( ρ)Q ′ (ρ 0 ) = 0 .(Porém atenção: Q ′ (ρ) = 0 não implica necessariamenteque ρ seja mínimo, po<strong>de</strong>ria se tratar <strong>de</strong> um máximo, ou umponto <strong>de</strong> inflexão com <strong>de</strong>rivada zero. Somento o inverso éválido: se ρ for mínimo, então Q ′ (ρ) = 0.)ρ0ρ


52CAPÍTULO 4. AJUSTE DE FUNÇÕES4.3.2 CatenáriaQuando suspen<strong>de</strong>mos uma corrente em dois pontos<strong>de</strong> sustentação, não necessariamente horizontalmentealinhados, ela assume um <strong>de</strong>terminado formato(entre os dois pontos <strong>de</strong> sustentação), dado pelafunção catenária:f(x) = 1 (cosh(cx) − 1) ,c xon<strong>de</strong> cosh é a função conhecida como cosseno hiperbólico, e é dada porcoshx = ex + e −x2.Observe que a função foi dada <strong>de</strong> tal forma que para x = 0 ela vale 0, ou seja, a origem dascoor<strong>de</strong>nadas é imposta como sendo o ponto <strong>de</strong> mínimo da corrente (uma justificativa paraessa função será dada na Subseção 17.3.5).Na expressão <strong>de</strong> f também aparece uma constante c, que é um número. Esse númeronão é conhecido a priori, pois <strong>de</strong>pen<strong>de</strong> <strong>de</strong> várias coisas, a começar pela posição dos pontos<strong>de</strong> sustentação. O número c é outro típico exemplo <strong>de</strong> um parâmetro. Se usarmos sempre amesma corrente ele po<strong>de</strong> ser modificado através da mudança dos pontos <strong>de</strong> sustentação, e érazoavelmente difícil saber que valor ele vai assumir ao pendurarmos a corrente.No entanto, já que se trata <strong>de</strong> uma medida experimental, po<strong>de</strong>ríamos medir a posição dacorrente em alguns pontos, convencionando x para a horizontal e y para a vertical, obtendoassim um conjunto <strong>de</strong> dados (x i , y i ), i = 1, . . .,N. Convém, além disso, <strong>de</strong>terminar a posiçãoexata do mínimo, que será o ponto (x, y) = (0, 0). Agora sabemos que a corrente assume aforma <strong>de</strong> uma função f como acima, mas nos resta saber com que valor <strong>de</strong> c isso acontece.Como proce<strong>de</strong>r?Para explicitar a existência <strong>de</strong> um parâmetro, que obviamente faz parte da <strong>de</strong>finição dafunção, adota-se a notaçãof c (x) = 1 (cosh(cx) − 1) .cPara cada função f c po<strong>de</strong>mos medir o qui-quadrado Q(f c ), e <strong>de</strong>pois procurar o parâmetro cpara o qual Q(f c ) é mínimo. Como c varia ao longo da reta real, a função c ↦→ Q(f c ) é umafunção <strong>de</strong> uma variável, que <strong>de</strong>notaremos simplesmente por Q(c).4.3.3 Naftalinas e funções afinsUma bolinha <strong>de</strong> naftalina per<strong>de</strong> seu material, por sublimação, a uma taxa proporcional a suasuperfície. Como evolui o raio da naftalina em função do tempo?Se V (t) é o volume da bolinha, então a hipótese implica que˙V (t) = −α4πr(t) 2 ,


4.3.PARÂMETROS 53isto é, a taxa <strong>de</strong> perda <strong>de</strong> volume é proporcional à área da superfície da bolinha. Por outrolado<strong>de</strong> forma queV (r) = 4 3 πr3 ,V (t) = V (r(t)) = 4 3 πr(t)3e˙V (t) = 4πr(t) 2 ṙ(t) .Juntando as duas equações em ˙V (t) e cancelando r(t) 2 , ficamos comṙ(t) = −α ,logo r(t) é uma função <strong>de</strong> <strong>de</strong>rivada constante negativa, ou seja, é uma função afim. Portantor(t) = r 0 − αt ,on<strong>de</strong> r 0 = r(0).Num experimento, supondo que o raciocínio acima se confirme, teremos uma série <strong>de</strong>dados (t i , r i ) que se disporão aproximadamente sobre uma reta. Cada reta não vertical doplano é gráfico <strong>de</strong> r(t) = a + bt, e gostaríamos <strong>de</strong> achar o par (a, b) que melhor aproximeos dados experimentais, isto é, que produza o menor qui-quadrado possível. Desta feita, oqui-quadrado é uma função <strong>de</strong> duas variáveis, pois para cada par (a, b) teremos uma funçãodiferente a + bt e um qui-quadrado Q(a, b). Ao contrário dos problemas da <strong>de</strong>nsida<strong>de</strong> e dacatenária, aqui aparece uma função que envolve dois parâmetros.4.3.4 Decaimento exponencialUm material contém um isótopo radioativo, e emite radiação, que po<strong>de</strong> ser <strong>de</strong>tectada por umcontador geiger. A emissão <strong>de</strong> radiação é proporcional à quantida<strong>de</strong> <strong>de</strong> isótopo, e é oriunda<strong>de</strong> seu <strong>de</strong>caimento. Veremos mais adiante (Subseção 17.3.2) que a quantida<strong>de</strong> do isótopo<strong>de</strong>cresce (na maioria dos casos) exponencialmente. Ou seja, a radiação emitida por unida<strong>de</strong><strong>de</strong> tempo R(t) obe<strong>de</strong>ce à leiR(t) = R 0 e −αt ,on<strong>de</strong> t é o tempo (a variável) e R 0 , α são dois parâmetros. A constante R 0 é a quantida<strong>de</strong><strong>de</strong> radiação emitida por unida<strong>de</strong> <strong>de</strong> tempo no instante t = 0 e α > 0 representa a taxa <strong>de</strong><strong>de</strong>caimento: quanto maior for α mais rápido ele será.A meia-vida do isótopo é o tempo T necessário para que sua quantida<strong>de</strong> caia pela meta<strong>de</strong>.Admitindo a proporcionalida<strong>de</strong> entre a radiação emitida e a quantida<strong>de</strong> do isótopo, T é talqueisto é,R(T) = R 02 ,R 02 = R 0e −αT ,


54CAPÍTULO 4. AJUSTE DE FUNÇÕESequação que resolvida nos dáT = log 2α .O conceito <strong>de</strong> meia-vida é muito usado para datação <strong>de</strong> fósseis, através da <strong>de</strong>terminaçãoda quantida<strong>de</strong> <strong>de</strong> carbono-14, em relação ao isótopo mais abundante carbono-12: quantomenor for a quantida<strong>de</strong> <strong>de</strong> carbono-14, mais antigo é o material.A função a dois parâmetros R(t) recai no caso afim quando tiramos o logaritmo:log R(t) = log R 0 − αt ,ou seja, L(t) ≡ log R(t) é uma função afim, on<strong>de</strong> −α é sua <strong>de</strong>rivada. Os papéis mono-log,vendidos em algumas papelarias, são uma maneira <strong>de</strong> se plotar o logaritmo dos dados daor<strong>de</strong>nada, log R(t), em função dos dados da abscissa, t, sem fazer contas.Isto não vale quando o <strong>de</strong>caimento exponencial é assintótico a um valor diferente <strong>de</strong> zero,em funções do tipof(t) = b + ce −αt .Não adianta tirar o logaritmo, pois o logaritmo <strong>de</strong> uma soma não po<strong>de</strong> ser <strong>de</strong>smembrado.Esse tipo <strong>de</strong> função tem três parâmetros, e po<strong>de</strong> ocorrer, por exemplo, no <strong>de</strong>caimento <strong>de</strong>temperatura <strong>de</strong> um corpo em contato com um reservatório mais frio, mas cuja temperaturanão é necessariamente zero.4.3.5 Leis <strong>de</strong> potência e fractaisPara funções f(x) = cx α , que têm dois parâmetros, recomenda-se também tirar o logaritmo:log f(x) = log c + α log x .Desta vez, log f(x) é uma função afim <strong>de</strong> log x, e o papel recomendado para se plotar osdados, em busca <strong>de</strong> uma reta, é o o log-log.Esse tipo <strong>de</strong> função aparece ligado ao conceito <strong>de</strong> fractal. Para exemplificar, tome a linhado litoral, fotografada num mapa <strong>de</strong> satélite, e suponha que a foto do satélite tenha boaresolução, para que se possa fazer uma análise razoavelmente <strong>de</strong>talhada.Escolha um tamanho l e divida o mapa em quadrados <strong>de</strong> tamanho l. Para facilitarmos oargumento suporemos que o mapa é quadrado e escolheremos apenas valores <strong>de</strong> l que sejamiguais à lateral do mapa dividida por um número inteiro, <strong>de</strong> forma que só haja uma maneira<strong>de</strong> se dividir o mapa em quadrados. Em seguida contamos o número N(l) <strong>de</strong> quadrados queintersectam a linha do litoral.Tomamos valores <strong>de</strong> l cada vez menores, e para cada l contamos N(l). A experiência temmostrado que, <strong>de</strong>ntro dos limites inerentes ao experimento, N(l) é proporcional a l −d , on<strong>de</strong>d é a chamada dimensão fractal daquele pedaço <strong>de</strong> litoral. O nome fractal vem do fato <strong>de</strong>que d po<strong>de</strong> ser um número fracionário (não inteiro), e o inesperado vem do fato <strong>de</strong> que se olitoral fosse uma reta então d seria igual a 1! Ocorre que em geral d é maior do que 1...Exercício 4.2 Munido <strong>de</strong> bons mapas, faça o experimento acima sugerido, e coloque osdados N(l) versus l em papel log-log. Se realmente N(l) = cl −d então você verá uma reta<strong>de</strong> inclinação negativa, e a dimensão fractal d será o valor absoluto <strong>de</strong>ssa inclinação. Presteatenção em <strong>de</strong>sconsi<strong>de</strong>rar valores <strong>de</strong> l muito gran<strong>de</strong>s ou muito pequenos, on<strong>de</strong> fatalmentenão se verá uma reta.


4.3.PARÂMETROS 554.3.6 GaussianaSuponha que várias medidas foram feitas <strong>de</strong> um mesmo fenômeno, por exemplo, o tempo <strong>de</strong>queda <strong>de</strong> um objeto que é solto, a partir do repouso, sempre da mesma altura. São feitas nmedidas T 1 , . . . , T n , e <strong>de</strong>ssas medidas constrói-se um histograma. Para fazer o histograma,escolhe-se um intervalo ∆t e divi<strong>de</strong>-se a reta dos tempos em intervalos <strong>de</strong> tamanho ∆t.Esses intervalos po<strong>de</strong>m ser numerados:I 1 , . . . , I N , mas para a numeração serfinita é preciso não incluir aqueles queestão longe dos tempos medidos. Paracada intervalo I j conta-se o número <strong>de</strong>medidas T i que inci<strong>de</strong>m em I j , chamandoesse número <strong>de</strong> n j . O histogramaé <strong>de</strong>senhado construindo-se barras<strong>de</strong> base I j e altura igual a n j .n jI1 I2 IjIN∆tNesse problema e em vários outros, a tendência do histograma é adotar o formato aproximado<strong>de</strong> um “sino”. O valor mais provável do que <strong>de</strong>ve ser o tempo <strong>de</strong> queda (que servirápor exemplo para se estimar a aceleração da gravida<strong>de</strong>) se situa próximo dos intervalos queapresentam maiores valores <strong>de</strong> n j , isto é, no “cume” do sino.Se o experimento não tiver erros sistemáticos, o formato <strong>de</strong> sino será tanto melhor aproximadoquanto mais medidas forem feitas e quanto menor forem os intervalos. É claro quea diminuição dos intervalos e o aumento do número <strong>de</strong> medidas <strong>de</strong>vem ser feitos <strong>de</strong> formaacoplada, mas isso já é outra história...O leitor mais atento po<strong>de</strong> estar pensando que ao mudarmos o número n <strong>de</strong> experimentosou o tamanho do intervalo básico ∆t não po<strong>de</strong>remos comparar um histograma com outro. Éclaro que se aumentarmos o número n então em média os n j ’s <strong>de</strong>vem aumentar, o que daráhistogramas radicalmente diferentes quando n = 500 ou n = 5000, por exemplo, mantidosiguais os ∆t’s. Por outro lado, se mantivermos n mas, digamos, diminuirmos pela meta<strong>de</strong> otamanho dos intervalos, isso fará com que em média os n j ’s caiam pela meta<strong>de</strong>. Assim, seriainteressante ter um histograma que não <strong>de</strong>pen<strong>de</strong>sse <strong>de</strong>mais <strong>de</strong> n e ∆t, e permitisse compararhistogramas do mesmo fenômeno construídos <strong>de</strong> formas diferentes.Para isso, em vez <strong>de</strong> colocarmos as barras à altura n j , fazemos um reescalonamento daor<strong>de</strong>nada, colocando as barras à alturan jn∆t .Com isso, a soma total da área das barras será igual a 1, pois cada barra terá área∆t ·e a soma da área <strong>de</strong> todas as barras seráN∑j=1n jn = 1 nn jn∆t = n jnN∑n j = 1 n · n = 1 .j=1


56CAPÍTULO 4. AJUSTE DE FUNÇÕESAlém disso, o histograma passa a ter a seguinte função utilitária. Se quisermos saber aproporção <strong>de</strong> eventos T i que caiu num <strong>de</strong>terminado conjunto <strong>de</strong> I j ’s, basta medir a área totaldas barras sobre esses intervalos. Esse número será um número entre 0 e 1 (que multiplicadopor 100 dará a porcentagem <strong>de</strong> eventos ocorridos nos intervalos consi<strong>de</strong>rados).À medida em que se dimui ∆t e se aumenta n, o formato do histograma se aproxima cadavez mais <strong>de</strong> um formato <strong>de</strong> sino, agora fixo. Esse formato <strong>de</strong> sino é tipicamente <strong>de</strong>scrito pelafunção Gaussianaf(t) = 1σ √ − τ)2exp{−(t2π 2σ 2 } .Observe que essa função <strong>de</strong>pen<strong>de</strong> <strong>de</strong> dois parâmetros, σ e τ, então seria mais correto <strong>de</strong>notá-laporf σ,τ (t) .O fator que multiplica a exponencial está colocado para normalizar a função, isto é, fazercom que a área <strong>de</strong>baixo <strong>de</strong> seu gráfico seja sempre igual a 1, não importando os valores <strong>de</strong> σe τ.Para enten<strong>de</strong>r melhor essa função, observe queela é uma variação <strong>de</strong>h(t) = exp{−t 2 } = e −t2 .1h(t) = e −t2A função h(t) tem um máximo em t = 0 eh(0) = 1, e <strong>de</strong>cresce à direita e à esquerda(simetricamente), indo a zero quando t vai a+∞ ou −∞. Se agora tomarmos h τ (t) =exp{−(t − τ) 2 }, a função valerá 1 e atingiráo máximo em t = τ, e <strong>de</strong>crescerá à direita eesquerda <strong>de</strong> τ. Então o parâmetro τ tem opapel <strong>de</strong> “<strong>de</strong>slocar o sino” para a direita oupara a esquerda, conforme for positivo ou negativo,e seu valor sempre representa a posiçãodo “cume”.10τ0h τ(t)ttPor outro lado, se consi<strong>de</strong>rarmos( ) 2h σ (t) = exp{− t2t2σ 2 } = exp{− t√ } = h( √ )2σ 2σt √2σ,então teremos o seguinte efeito: se √ 2σ > 1, então o valor <strong>de</strong> h σ (t) será o valor <strong>de</strong> h emque é menor do que t. Isso fará com que a curva <strong>de</strong>cresça mais lentamente, alargando o sino.Se, ao contrário, √ 2σ < 1, a curva <strong>de</strong>crescerá mais rapidamente.


4.3.PARÂMETROS 572 σ < 1 2 σ > 1hhh σh σh σt2σ(t)=h( )tt2σth σ0t2σ(t)=h( )Em resumo, combinando os dois parâmetros, τ indica a posição horizontal do cume,enquanto que σ indica o quão “agudo” é o pico. A altura do pico é dada pelo fator <strong>de</strong>1normalizaçãoσ √ , escolhido <strong>de</strong> forma que a integral <strong>de</strong> f seja igual a 1.2πFinalmente, estando <strong>de</strong> posse <strong>de</strong> um histograma, e admitindo as consi<strong>de</strong>rações acima,queremos saber qual é o melhor par <strong>de</strong> parâmetros (σ, τ) que aproxima o formato <strong>de</strong>lineadopelas barras. Para isso, po<strong>de</strong>mos tratar as barras como pontos, tomando t 1 , . . . , t N como ospontos centrais dos intervalos I 1 , . . . , I N , e y 1 , . . . , y N a altura das respectivas barras. Comesses dados, po<strong>de</strong>mos sempre estimar o qui-quadrado Q(f σ,τ ), procurando o par (σ, τ) que ominimize.A função f σ,τ encontrada serve como um preditor do experimento. Se quisermos saberem média qual é a proporção <strong>de</strong> medidas que ocorrerá entre t a e t b , bastará encontrar a áreado histograma entre t a e t b , que é aproximadamente o mesmo que calcular a integralt2σtt∫ tbt af σ,τ (t)dt .Po<strong>de</strong>-se mostrar (isso também já é outra história...) que os melhores parâmetros τ e σsão a média e o <strong>de</strong>svio-padrão da coleção <strong>de</strong> dados t 1 , . . .,t n . Ou seja,eτ = 1 nσ 2 = 1 nn∑t i ,i=1n∑(t i − τ) 2 .i=1Isso resolve o problema <strong>de</strong> se achar o menor qui-quadrado, mas raros são os casos em que asolução é tão explícita!


58CAPÍTULO 4. AJUSTE DE FUNÇÕES


Capítulo 5Funções lineares nos parâmetros5.1 Dependência linear dos parâmetrosEstaremos particularmente interessados nos casos em que a <strong>de</strong>pendência da função nosparâmetros é linear. Colocando <strong>de</strong> forma geral, isso significa que, se a função tiver kparâmetros a 1 , a 2 , . . . , a k , então f = f a1,...,a kse escreve comoPor exemplo, na funçãof(x) = a 1 g 1 (x) + a 2 g 2 (x) + . . . + a k g k (x) .ax + b senxi<strong>de</strong>ntificamos a 1 = a, a 2 = b, g 1 (x) = x e g 2 (x) = sen x. Ou senão na função afima + bxi<strong>de</strong>ntificamos a 1 = a, a 2 = b, g 1 (x) = 1 (isto é, a função i<strong>de</strong>nticamente igual a 1) e g 2 (x) = x.Mesmo uma função linearaxtem apenas um parâmetro: a 1 = a e g 1 (x) = x.É preciso não confundir entre “função linear nos parâmetros” e “função linear”. Umafunção linear <strong>de</strong> uma variável é sempre da forma ax, e reservamos o termo função afim parafunções da forma a + bx. Já uma função linear nos parâmetros não é necessariamente linearem x, basta ver os exemplos que <strong>de</strong>mos acima.Analisemos, sob essa ótica, com que tipos <strong>de</strong> problemas nos <strong>de</strong>paramos nos exemplos doCapítulo anterior.No exemplo do cálculo da <strong>de</strong>nsida<strong>de</strong> temos uma função do tipo f(x) = ax, que é linearno parâmetro a e na variável x. A função da catenária f(x) = 1 c(cosh(cx) −1) é um exemplo<strong>de</strong> função com apenas 1 parâmetro que porém não é linear nesse parâmetro. As funções afinsdas naftalinas são lineares nos parâmetros. Já o <strong>de</strong>caimento exponencial f(x) = ae −bx nãoé, mas o problema po<strong>de</strong> ser transformado num problema <strong>de</strong> função afim (e portanto linearnos parâmetros), poislog f(x) = log a − bx .59


60CAPÍTULO 5. FUNÇÕES LINEARES NOS PARÂMETROSJá f(x) = c+ae −bx tem três parâmetros e não é linear em b: se b fosse fixado (não consi<strong>de</strong>radocomo parâmetro), então sim teríamos a linearida<strong>de</strong>.A lei <strong>de</strong> potência f(x) = ax b também não é linear no parâmetro b, mas po<strong>de</strong> ser transformadanum problema linear através do logaritmo.Finalmente, a função Gaussiana não é linear nos parâmetros “média” e “<strong>de</strong>svio-padrão”,mas estes po<strong>de</strong>m ser encontrados, para se ajustarem aos dados experimentais, da maneiratradicional.Trataremos a partir <strong>de</strong> agora apenas do ajuste <strong>de</strong> funções lineares nos parâmetros. Várioscasos on<strong>de</strong> a <strong>de</strong>pendência no parâmetro é não linear po<strong>de</strong>m ser adaptados, mas sem dúvida<strong>de</strong>ve-se pensar caso a caso. Destacam-se entre os ajustes lineares os ajustes por polinômiosf(x) = a 0 + a 1 x + a 2 x 2 + . . . + a k x ke os ajustes por funções trigonométricasf(x) = a 0 + a 1 cos(x) + a 2 cos(2x) + . . . + a k cos(kx)++b 1 sen(x) + b 2 sen(2x) + . . . + b k sen(lx) .5.2 Contínuo vs. discretoVale a pena aqui introduzir um problema <strong>de</strong> ajuste ligeiramente modificado em relação aoque vimos discutindo até agora. Suponha que conhecemos <strong>de</strong>terminada função y(x) numintervalo fixo [c, d] e gostaríamos <strong>de</strong> aproximá-la o melhor possível por alguma função do tipof(x) = a 1 g 1 (x) + . . . + a k g k (x) .Observe que antes tínhamos um conjunto <strong>de</strong> dados (x i , y i ), com i variando <strong>de</strong> 1 até N. Agoranossa informação se dá num conjunto infinito <strong>de</strong> pontos: sabemos todos os (x, y(x)), com xvariando no intervalo [c, d], porque conhecemos a função y(x).Mais uma vez precisamos <strong>de</strong> um critério para quantificar a proximida<strong>de</strong> entre f e osdados, ou seja, entre f e y. O correspon<strong>de</strong>nte qui-quadrado, neste caso, é dado porQ(f) =∫ dc(f(x) − y(x)) 2 dx .e o objetivo é procurar o conjunto <strong>de</strong> parâmetros (a 1 , a 2 , . . . , a k ) que minimize Q(f).Este conceito po<strong>de</strong> ser útil quando y(x) tem uma expressão conhecida mas muito complicada,e a substituímos por uma expressão polinomial ou trigonométrica f(x).


5.3. UM PARÂMETRO 615.3 Um parâmetroPara introduzirmos o assunto gradualmente,convém começar pelas situações mais simples.Suponha que temos N dados (x 1 , y 1 ),(x 2 , y 2 ), . . ., (x N , y N ) como na figura ao ladoe que queiramos ajustar uma função linearf(x) = ax a esses pontos. Isto significa quequeremos achar o valor <strong>de</strong> a que melhor aproximaos pontos dados. Na figura, a reta pontilhadaindica mais ou menos o que esperamosdo nosso ajuste.yx 1x 2x 3x 4x x5 6xEm vez <strong>de</strong> tratarmos esse caso em particular, faremos uma discussão um pouco maisgeral. Isto é, suponha que tenhamos dados como acima e queiramos ajustar uma funçãof a (x) = ag(x), com um parâmetro e linear nesse único parâmetro. O caso da função linearé apenas um caso particular, correspon<strong>de</strong>nte à função g(x) = x.Para cada a, po<strong>de</strong>mos calcular o qui-quadrado Q(f a ), que <strong>de</strong>notaremos simplesmente porQ(a). ExplicitamenteQ(a) =N∑N∑(f a (x i ) − y i ) 2 = (ag(x i ) − y i ) 2 .i=1A função Q(a) <strong>de</strong>ve ser assim entendida: para cada a calculamos o erro Q(a) cometido entrea função f a (x) = ag(x) e os dados y i . Nossa tarefa será procurar o valor a 0 tal que Q(a 0 )seja mínimo.Notemos que para cada i valei=1(ag(x i ) − y i ) 2 = g(x i ) 2 · a 2 − 2g(x i )y i · a + y 2 i ,isto é, cada termo da soma que <strong>de</strong>fine Q(a) é um polinômio quadrático na variável a. Comoa soma <strong>de</strong> polinômios quadráticos é um polinômio quadrático, então Q(a) também é umpolinômio quadrático na variável a. Isto po<strong>de</strong> ser visto diretamente se <strong>de</strong>senvolvermos asoma que <strong>de</strong>fine Q(a):( N) (∑∑ N N∑Q(a) = g(x i ) 2 a 2 − 2 g(x i )y i)a + yi 2 .i=1O gráfico <strong>de</strong> Q(a) é, portanto, uma parábola. A concavida<strong>de</strong> é “para cima”, pois o termoque multiplica a 2 é certamente positivo, por ser uma soma <strong>de</strong> quadrados.Em conclusão, achar o mínimo da função Q(a) se resume a achar o mínimo <strong>de</strong> umaparábola.i=1i=1


62CAPÍTULO 5. FUNÇÕES LINEARES NOS PARÂMETROSConhecendo o cálculo diferencial, sabemos que po<strong>de</strong>mos procurar o ponto <strong>de</strong> mínimo daparábola pelo ponto que anula a <strong>de</strong>rivada, ou seja, procuramos a solução <strong>de</strong> ddaQ(a) = 0.Então calcularemos a <strong>de</strong>rivada <strong>de</strong> Q(a), mas não pela expressão acima, e sim pela expressãooriginal, que se prestará mais a generalizações quando tivermos mais parâmetros.TemosdNda Q(a) = ∑ ∂∂a (ag(x i) − y i ) 2 ,i=1se lembrarmos que “a <strong>de</strong>rivada da soma é a soma das <strong>de</strong>rivadas”. Além disso, pela Regra daCa<strong>de</strong>ia, “a <strong>de</strong>rivada <strong>de</strong> algo ao quadrado é duas vezes esse algo vezes a <strong>de</strong>rivada do algo”,temos quedNda Q(a) = ∑2g(x i )(ag(x i ) − y i ) ,i=1lembrando que a <strong>de</strong>rivada é em relação ao parâmetro a!!!!O fator 2 po<strong>de</strong> ser posto em evidência no somatório, <strong>de</strong> forma que quando igualarmos a<strong>de</strong>rivada <strong>de</strong> Q(a) a zero ele <strong>de</strong>saparece. Então queremos resolverRearranjando,don<strong>de</strong> sai facilmente o valor <strong>de</strong> a:N∑ag(x i ) 2 − g(x i )y i = 0 .i=1N∑ N∑a · g(x i ) 2 = g(x i )y i ,i=1a =i=1∑ Ni=1 g(x i)y i∑ Ni=1 g(x i) 2 .Esse é o a 0 que estávamos procurando!No caso <strong>de</strong> uma reta, a função g(x) é igual a x, e portanto a 0 é dado por∑ Ni=1a 0 =x iy i∑ Ni=1 x2 i.Exercício 5.1 Invente um conjunto <strong>de</strong> dados que estejam próximos <strong>de</strong> uma reta passandopela origem (N = 6, por exemplo), e <strong>de</strong>pois ajuste uma função ax. Num papel milimetrado,coloque os dados e <strong>de</strong>pois esboce a reta obtida.5.4 Dois parâmetrosSuponha que queiramos ajustar uma reta aos dados experimentais, mas não necessariamenteuma reta que passe pelo zero. Para isso, precisamos ajustar uma função na forma f(x) =


5.4. DOIS PARÂMETROS 63a + bx, isto é, uma função afim. Esse problema se insere no caso geral <strong>de</strong> ajuste <strong>de</strong> umafunção com dois parâmetros, que <strong>de</strong> forma geral po<strong>de</strong> ser escrita comof a1,a 2(x) = a 1 g 1 (x) + a 2 g 2 (x) .Raciocinando como na Seção anterior, queremos minimizar a função erroQ(f a1,a 2) =N∑(f a1,a 2(x i ) − y i ) 2 .i=1Agora, porém, a função erro <strong>de</strong>pen<strong>de</strong> <strong>de</strong> dois parâmetros, a 1 e a 2 , por causa da forma <strong>de</strong> f,e a <strong>de</strong>notaremos por Q(a 1 , a 2 ):Q(a 1 , a 2 ) =N∑(a 1 g 1 (x i ) + a 2 g 2 (x i ) − y i ) 2 .i=1Precisamos <strong>de</strong> 3 dimensões para traçar um gráfico da função Q.No ponto <strong>de</strong> mínimo <strong>de</strong> Q necessariamente todas as <strong>de</strong>rivadas parciais se anulam. Nopresente caso, elas são duas: em relação a a 1 e em relação a a 2 . Observe que não necessariamente(a princípio, sem um exame mais aprofundado) vale o inverso, isto é, se as <strong>de</strong>rivadasparciais se anularem então não obrigatoriamente se trata <strong>de</strong> um ponto <strong>de</strong> mínimo.Portanto o par <strong>de</strong> parâmetros procurado <strong>de</strong>ve satisfazer duas exigências simultâneas:∂Q∂a 1(a 1 , a 2 ) = 0 e ∂Q∂a 2(a 1 , a 2 ) = 0 .Se acharmos um ponto que satisfaça essas duas exigências teremos um candidato a ponto <strong>de</strong>mínimo <strong>de</strong> Q(a 1 , a 2 ).Adiante, no Capítulo 6, discutiremos melhor até que ponto po<strong>de</strong>mos confiar que a solução<strong>de</strong>sse problema seja realmente o mínimo procurado.As duas equações po<strong>de</strong>m ser escritas explicitamente, e após elaboração as <strong>de</strong>ixaremos emuma forma conveniente. TemosN∑i=1N∑i=1∂∂a 1(a 1 g 1 (x i ) + a 2 g 2 (x i ) − y i ) 2 = 0∂∂a 2(a 1 g 1 (x i ) + a 2 g 2 (x i ) − y i ) 2 = 0Usando a Regra da Ca<strong>de</strong>ia, fazemos as <strong>de</strong>rivadas parciais, obtendoN∑2g 1 (x i )(a 1 g 1 (x i ) + a 2 g 2 (x i ) − y i ) = 0i=1N∑2g 2 (x i )(a 1 g 1 (x i ) + a 2 g 2 (x i ) − y i ) = 0i=1


64CAPÍTULO 5. FUNÇÕES LINEARES NOS PARÂMETROSOs somatórios po<strong>de</strong>m ainda ser <strong>de</strong>compostos:∑N ∑N N∑2a 1 g 1 (x i ) 2 + 2a 2 g 1 (x i )g 2 (x i ) − 2 g 1 (x i )y i = 0i=1i=1i=1∑N ∑N N∑2a 1 g 2 (x i )g 1 (x i ) + 2a 2 g 2 (x i )g 2 (x i ) − 2 g 2 (x i )y i = 0i=1Rearranjando <strong>de</strong> forma a<strong>de</strong>quada fica evi<strong>de</strong>nte que recaímos num sistema linear <strong>de</strong> duasequações nas incógnitas a 1 e a 2 :( ∑N(i=1 g ∑N1(x i )g 1 (x i ))i=1 g 1(x i )g 2 (x i ))· a 1 +( ∑Ni=1 g 2(x i )g 1 (x i ))· a 1 +i=1i=1· a 2 = ∑ Ni=1 g 1(x i )y i( ∑Ni=1 g 2(x i )g 2 (x i ))· a 2 = ∑ Ni=1 g 2(x i )y iTodos os coeficientes do sistema linear são tirados dos dados do problema, sendo que somenteos termos in<strong>de</strong>pen<strong>de</strong>ntes usam os y i ’s.Aqui vale a pena introduzir uma notação simplificadora, que tornará muito mais fácil aaplicação do acima exposto em problemas práticos. Denotaremos por 〈g l , g m 〉 a somae por 〈g l , y〉 a somaN∑g l (x i )g m (x i )i=1N∑g l (x i )y i .i=1Com essa nomenclatura, reescrevemos o sistema linear:〈g 1 , g 1 〉a 1 + 〈g 1 , g 2 〉a 2 = 〈g 1 , y〉〈g 2 , g 1 〉a 1 + 〈g 2 , g 2 〉a 2 = 〈g 2 , y〉 ,que o torna muito mais simples <strong>de</strong> memorizar!Exercício 5.2 Construa um conjunto <strong>de</strong> dados e ajuste uma reta, não necessariamentepassando pela origem, usando o exposto nesta Seção.5.5 Ajuste <strong>de</strong> qualquer função linear nos parâmetrosAs idéias das Seções anteriores po<strong>de</strong>m ser usadas em qualquer situação que se queira ajustaruma função que <strong>de</strong>penda linearmente dos parâmetros, dada porf(x) = a 1 g 1 (x) + a 2 g 2 (x) + . . . + a k g k (x) ,on<strong>de</strong> k é o número <strong>de</strong> parâmetros.A função Q, que dá o erro do ajuste, <strong>de</strong>pen<strong>de</strong> agora dos k parâmetros a 1 , . . ., a k :Q(a 1 , a 2 , . . .,a k ) =N∑(a 1 g 1 (x i ) + a 2 g 2 (x i ) + . . . + a k g k (x i ) − y i ) 2 .i=1


5.6. O CASO CONTÍNUO 65Se o mínimo <strong>de</strong> Q ocorre em (a 1 , a 2 , . . . , a k ) então∂Q∂a l(a 1 , a 2 , . . .,a k ) = 0 ,para todo l entre 1 e k, simultaneamente. Isso nos dá k equações, lineares nos parâmetros(sugere-se ao leitor fazer as passagens). Abaixo, mostramos as k equações, usando a notaçãointroduzida ao final da Seção anterior:〈g 1 , g 1 〉a 1 + 〈g 1 , g 2 〉a 2 + . . . + 〈g 1 , g k 〉a k = 〈g 1 , y〉〈g 2 , g 1 〉a 1 + 〈g 2 , g 2 〉a 2 + . . . + 〈g 2 , g k 〉a k = 〈g 2 , y〉.... . . ... =..〈g k , g 1 〉a 1 + 〈g k , g 2 〉a 2 + . . . + 〈g k , g k 〉a k = 〈g k , y〉Logo adiante veremos a razão <strong>de</strong> se utilizar essa notação para os somatórios, idêntica àutilizada para o produto escalar <strong>de</strong> dois vetores. Aqui enten<strong>de</strong>mos como vetores os conjuntos<strong>de</strong> dados da abscissa x = (x 1 , . . .,x N ), da or<strong>de</strong>nada y = (y 1 , . . . , y N ), e os valores dasfunções g l avaliados em cada um <strong>de</strong>sses pontos: g l = (g l (x 1 ), . . . , g l (x N )). Assim a notaçãofaz sentido!5.6 O caso contínuoNo caso contínuo, tudo se passa <strong>de</strong> maneira análoga. Suponha que temos uma função y(x)<strong>de</strong>finida no intervalo [c, d], e gostaríamos <strong>de</strong> procurar uma função da formaf(x) = a 1 g 1 (x) + a 2 g 2 (x) + . . . + a k g k (x) ,que se aproxime <strong>de</strong>la o melhor possível. O erro do ajuste também é uma função dos kparâmetros, mas <strong>de</strong>sta vez é calculado por meio <strong>de</strong> uma integral, ao invés <strong>de</strong> uma soma:Q(a 1 , a 2 , . . .,a k ) =∫ dc(a 1 g 1 (x) + a 2 g 2 (x) + . . . + a k g k (x) − y(x)) 2 dx .É útil comparar com o caso discreto. A soma ao longo do índice i foi substituída pela integralna variável x, <strong>de</strong>ntro do intervalo [c, d]. Ao mesmo tempo, os y i <strong>de</strong>ram lugar aos valores dafunção y(x).Mais uma vez, o ponto <strong>de</strong> mínimo <strong>de</strong> Q <strong>de</strong>ve, necessariamente, anular todas as k <strong>de</strong>rivadasparciais <strong>de</strong> Q, o que nos dá um critério <strong>de</strong> busca para esse mínimo, se resolvermos as kequações resultantes. Para cada l = 1, . . .,k obtemos a equação0 = ∂Q (a 1 , a 2 , . . . , a k ) = ∂ ∫ d∂a l ∂a lc(a 1 g 1 (x) + a 2 g 2 (x) + . . . + a k g k (x) − y(x)) 2 dx .Como a variável <strong>de</strong> integração x é diferente da variável <strong>de</strong> diferenciação a l , po<strong>de</strong>mos intercambiara or<strong>de</strong>m das operações, obtendo0 =∫ dc2g l (x)(a 1 g 1 (x) + a 2 g 2 (x) + . . . + a k g k (x) − y(x)) dx ,


66CAPÍTULO 5. FUNÇÕES LINEARES NOS PARÂMETROSe, <strong>de</strong>pois <strong>de</strong> uma simples manipulação da equação, chegando aon<strong>de</strong>e〈g l , g 1 〉a 1 + 〈g l , g 2 〉a 2 + . . . + 〈g l , g k 〉a k = 〈g l , y〉 ,〈g l , g m 〉 =〈g l , y〉 =∫ dc∫ dcg l (x)g m (x)dxg l (x)y(x)dx .Juntando-se as k equações resulta um sistema linear idêntico àquele obtido no caso discreto,exceto pelo fato <strong>de</strong> que os “produtos escalares” são calculados por uma integral, aoinvés <strong>de</strong> uma soma.5.7 ExemplosPara que não fique tudo muito abstrato, façamos dois exemplos nesta Seção, um para o casodiscreto e um para o caso contínuo.5.7.1 DinamômetroSuponha que precisemos usar um elástico como dinamômetro, para pesar objetos. O elásticoé forte, e agüenta vários quilos. Queremos calibrar o elástico para que a medida do pesopossa ser inferida pela distensão que ele provoca no elástico, que po<strong>de</strong> ser facilmente medidapor uma régua.Para tanto, penduramos o elástico no teto, por uma ponta, e na outra atrelamos umbal<strong>de</strong>, cujo peso não é suficiente para disten<strong>de</strong>r o elástico (melhor ainda, serve para colocaro elástico muito próximo à posição <strong>de</strong> repouso, e esticado). Com uma jarra, colocamos águano bal<strong>de</strong>, e a cada litro colocado (x) medimos a distensão y do elástico.Os dados encontrados estão na tabela abaixo.i x i (kg) y i (cm)0 0 0.01 1 1.02 2 5.53 3 13.04 4 23.55 5 34.56 6 42.07 7 47.08 8 50.59 9 53.010 10 54.511 11 55.5


5.7. EXEMPLOS 67Os dados da tabela são fictícios, mas qualitativamente se assemelham bastante a experiênciasreais. Nota-se que a resposta do elástico é menor para pesos pequenos e gran<strong>de</strong>s,e atinge seu máximo aproximadamente entre 3 e 5 quilos.Discutiremos o ajuste da função y(x) (distensão em função do peso), embora na apresentaçãodo problema estívessemos interessados na função inversa x(y), que dá o peso emfunção da distensão. Se o leitor fizer um gráfico dos dados da tabela, verá que a funçãopeso em função da distensão parece ser singular em 0 (tem uma <strong>de</strong>rivada infinita), e essetipo <strong>de</strong> função se presta muito mal ao tipo <strong>de</strong> ajuste que faremos, baseado em polinômios.O problema <strong>de</strong>saparece se olharmos para y(x), pois esta função parece ter <strong>de</strong>rivada zero emx = 0.Se pensarmos em ajustar y(x) por um polinômio, temos primeiramente que escolher seugrau. Claramente o grau <strong>de</strong>sse polinômio <strong>de</strong>ve ser maior do que 2, pois retas e parábolas nãotêm pontos <strong>de</strong> inflexão, como aparenta ser o caso. Polinômios cúbicos po<strong>de</strong>m ter o formato<strong>de</strong>sejado, mas talvez convenha ter um pouco mais <strong>de</strong> liberda<strong>de</strong> no ajuste usando polinômios<strong>de</strong> quarto grau.Para ajustar um polinômio <strong>de</strong> quarto grau temos que resolver um problema a 5 parâmetros.Isso recairá num sistema linear <strong>de</strong> 5 equações e 5 incógnitas, e nesse caso convém ter implementadoum programa <strong>de</strong> computador para resolvê-lo. Como queremos apenas exemplificaras coisas, restringiremo-nos a um certo conjunto dos polinômios <strong>de</strong> quarto grau, que reduziránosso problema a apenas 3 parâmetros, embora o mais recomendável seja seguir a primeirasolução.Observe que se f(x) = c 0 +c 1 x+c 2 x 2 +c 3 x 3 +c 4 x 4 então f(0) = c 0 . Como nós já sabemosque f(0) = 0, pois a nenhum peso correspon<strong>de</strong> nenhuma distensão, então já po<strong>de</strong>mos suporque c 0 = 0. Além disso, o gráfico dá a forte sensação <strong>de</strong> que f ′ (0) = 0, e como f ′ (0) = c 1 ,teríamos c 1 também igual a zero. Desta forma, procuraremos o menor qui-quadrado entre afamíliaf(x) = a 1 x 2 + a 2 x 3 + a 3 x 4 ,linear em seus três parâmetros. Para uniformizar a notação com a parte teórica, temosg 1 (x) = x 2 , g 2 (x) = x 3 e g 3 (x) = x 4 .Agora temos que calcular os produtos escalares 〈g l , g m 〉, com l e m variando entre 1 e3. Como essas funções são potências <strong>de</strong> x, nossa tarefa fica razoavelmente facilitada, porquevários dos produtos escalares serão iguais. Por exemplo,∑1111〈g 1 , g 3 〉 = x 2 i x4 i == ∑x 6 i ,i=0i=0é igual a∑11〈g 2 , g 2 〉 = x 3 i x3 i .i=0O sistema linear fica⎛∑ ∑ ∑ ∑ x4i x5i x6∑ ∑ ∑ i |∑ yi x 2 ix5i x6i x7∑ ∑ ∑ i |∑ yi x 3 ix6i x7i x8i | yi x 4 i⎞⎝⎠ .


68CAPÍTULO 5. FUNÇÕES LINEARES NOS PARÂMETROSCalculando os coeficientes e resolvendo, obtemos a 1 = 2.5040, a 2 = −0.28427 e a 3 =0.0088925. Se o leitor tentar resolver o sistema por conta própria verá que ele é extremamentemal-condicionado. A solução apresentada foi obtida com 10 algarismos significativos,e arredondada somente ao final para 5 algarismos significativos.Recomenda-se verificar se a função obtidaf(x) = 2.5040x 2 − 0.28427x 3 + 0.0088925x 4é compatível com os dados (pelo menos visualmente), e isso po<strong>de</strong> ser feito através <strong>de</strong> seuesboço no gráfico, junto com os dados experimentais. Este teste sempre vale a pena emproblemas <strong>de</strong> ajuste, para saber se não houve algum erro <strong>de</strong> conta.Outro teste <strong>de</strong> compatibilida<strong>de</strong> mínimo é observar que a 1 teria que ser realmente positivo,pois a concavida<strong>de</strong> do gráfico é para cima em x = 0, e que a 2 teria que ser negativo, parapo<strong>de</strong>r criar o ponto <strong>de</strong> inflexão na região x > 0.5.7.2 Cosseno aproximado por um polinômioPara exemplificar um ajuste linear contínuo, tomemos a função y(x) = cosx no intervalo[− π 2 , π 2]. Gostaríamos <strong>de</strong> aproximá-la também por um polinômio, <strong>de</strong>sta vez <strong>de</strong> grau 2.Antes <strong>de</strong> resolver o problema, vale a pena investigar o que achamos que será o resultado.Se f(x) = a 1 +a 2 x+a 3 x 2 é o polinômio procurado, quanto <strong>de</strong>vem ser, aproximadamente, osvalores dos coeficientes?Como o cosseno vale 1 em x = 0, é uma função par, tem concavida<strong>de</strong> para baixo e se anulaem − π 2 e + π 2, então imaginamos um polinômio quadrático com características semelhantes.Ele teria que ter a 1 = 1 (para valer 1 em x = 0) e a 2 = 0 (por ser parábola centrada naorigem). Além disso, a 3 teria que ser negativo. Para que o polinômio se anule em π 2 é precisoque1 + a 3( π2) 2= 0 ,logo a 3 <strong>de</strong>ve estar próximo <strong>de</strong> −0.4.Veremos se nossos palpites se confirmam. Temos que calcular os produtos escalares, queagora são integrais. Por exemplo,〈g 1 (x), g 1 (x)〉 =∫ π2− π 21 · 1dx = π .Algumas integrais são nulas, pois o intervalo <strong>de</strong> integração é simétrico e os integrandos sãofunções ímpares. É o caso <strong>de</strong> 〈g 1, g 2 〉 e 〈g 2 , g 3 〉, por exemplo. Precisamos calcular∫ π2− π 2e do lado dos termos in<strong>de</strong>pen<strong>de</strong>ntes∫ πx 2 dx = π312 , 2− π 2x 4 dx = π580 ,∫ π2− π 2cosx = 2 ,


5.7. EXEMPLOS 69a integral <strong>de</strong> xcosx é nula, por ser ímpar, e resta calcular∫ π2− π 2x 2 cosx ,usando a técnica <strong>de</strong> Integração por Partes duas vezes, dando 1 2 π2 − 4.O sistema linear fica igual a⎛⎞ππ 0 312| 2⎜ π⎝ 0 3⎟120 | 0 ⎠ .π 3 π120 5 180|2 π2 − 4Da segunda equação conclui-se imediatamente que a 2 = 0, o que reduz o sistema linear a duasequações e duas incógnitas. Resolvendo o sistema, obtém-se a 1 = 0.98016 e a 3 = −0.41777,valores bem próximos das estimativas iniciais.O método que apresentamos, apesar <strong>de</strong> simples, tem problemas quando implementadonumericamente. É comum que os sistemas lineares a serem resolvidos sejam muito malcondicionados. Por exemplo, no caso do ajuste <strong>de</strong> uma função y(x) <strong>de</strong>finida no intervalo[0, 1] por um polinômiof(x) = a 0 + a 1 x + . . . + a k x k ,temos g l (x) = x l−1 , com l = 0, . . .,k, e〈g l , g m 〉 =∫ 10x l+m dx =1l + m + 1 .Isto implica que a matriz dos coeficientes do sistema linear é uma matriz <strong>de</strong> Hilbert, que éum conhecido exemplo <strong>de</strong> matriz mal condicionada, como discutimos na Subseção 2.5.2.No Capítulo 7 discutiremos outra forma <strong>de</strong> se fazer ajustes, que são especialmente úteispara ajustes polinomiais e trigonométricos. Antes, porém, discorreremos um pouco maisabstratamente sobre o método dos mínimos quadrados, investigando, por exemplo, questõescomo a unicida<strong>de</strong>, embora o Capítulo 7 possa ser compreendido sem o auxílio do Capítulo 6.Exercício 5.3 Ajuste f(x) = a(arctanx) 2 aos seguintes dadospor mínimos quadrados.x i 0.0 1.0 2.0 3.0 4.0y i 0.0 0.25 1.00 1.50 1.65Exercício 5.4 Ajuste f(x) = a+b(x −1) 2 por mínimos quadrados à função y(x) = x 3 −3x,no intervalo [0, 2].


70CAPÍTULO 5. FUNÇÕES LINEARES NOS PARÂMETROS


Capítulo 6Levando a sério o produtoescalar6.1 Produto escalar e distânciaVale a pena aqui uma pequena digressão, que nos levará a uma compreensão melhor doproblema do ajuste <strong>de</strong> funções lineares nos parâmetros e nos permitirá, além disso, dispor <strong>de</strong>outras maneiras <strong>de</strong> realizar o ajuste.Primeiramente, como <strong>de</strong> praxe, concentremo-nos no problema <strong>de</strong> ajuste discreto on<strong>de</strong>,dados os pontos (x 1 , y 1 ), (x 2 , y 2 ), . . . , (x N , y N ), queremos achar o conjunto <strong>de</strong> parâmetros(a 1 , . . . , a k ) que minimize o qui-quadrado <strong>de</strong>f(x) = a 1 g 1 (x) + a 2 g 2 (x) + . . . + a k g k (x) ,para um certo conjunto <strong>de</strong> funções previamente fixadas g 1 (x), . . . , g k (x).Para enten<strong>de</strong>rmos o problema <strong>de</strong> forma geométrica, consi<strong>de</strong>remos o espaço R N das N-uplas u = (u 1 , . . . , u N ), isto é, o espaço <strong>de</strong> vetores N-dimensional. Assim, os valores daor<strong>de</strong>nada nos pontos dados po<strong>de</strong>m ser representados por um vetor <strong>de</strong> R N :y = (y 1 , y 2 , . . . , y N ) .Além disso, cada uma das funções g l (x), l = 1, . . .,k gera um vetor <strong>de</strong> R N , cujas coor<strong>de</strong>nadassão os valores da função nos pontos x 1 , . . . , x N :g l = (g l (x 1 ), g l (x 2 ), . . . , g l (x N )) .O produto escalar ou produto interno em R N é a função que associa a cada par <strong>de</strong> vetoresu = (u 1 , . . .,u N ) e v = (v 1 , . . . , v N ) o número real〈u, v〉 = u 1 v 1 + u 2 v 2 + . . . + u N v N .Sendo assim, fica evi<strong>de</strong>nte que a <strong>de</strong>finição que <strong>de</strong>mos <strong>de</strong> 〈g l , g m 〉 correspon<strong>de</strong> exatamente aoproduto escalar dos vetores g l e g m , e 〈g l , y〉 é o produto escalar dos vetores g l e y.71


72CAPÍTULO 6. LEVANDO A SÉRIO O PRODUTO ESCALARO produto escalar fornece automaticamente uma noção <strong>de</strong> tamanho <strong>de</strong> vetores (ou norma<strong>de</strong> vetores, no jargão matemático) e, em conseqüência, <strong>de</strong> distância no espaço R N . Em R 2 , otamanho ‖u‖ <strong>de</strong> um vetor u = (u 1 , u 2 ) é dado pelo Teorema <strong>de</strong> Pitágoras: ‖u‖ = √ u 2 1 + u2 2 . Éfácil ver com o Teorema <strong>de</strong> Pitágoras que em R 3 a norma <strong>de</strong> um vetor u = (u 1 , u 2 , u 3 ) é dadapor ‖u‖ = √ u 2 1 + u2 2 + u2 3 . A generalização em RN é natural. A norma <strong>de</strong> u = (u 1 , . . .,u N )é dada por√‖u‖ = u 2 1 + u2 2 + . . . + u2 N ,expressão que po<strong>de</strong> ser escrita em termos do produto escalar:‖u‖ = √ 〈u, u〉 .A noção <strong>de</strong> norma dá origem à idéia <strong>de</strong> distância em R N . Olhando agora u e v comopontos, a distância entre eles é a norma do vetor u − v (ou v − u, tanto faz). Denotaremosessa distância por d(u, v) e, explicitamente, ela valed(u, v) = √ ∑〈u − v, u − v〉 = √ N (u i − v i ) 2 .Po<strong>de</strong>mos ainda relacionar o qui-quadrado com isso tudo. O qui-quadrado <strong>de</strong> uma funçãof (para esses dados), <strong>de</strong>notado por Q(f), é dado porQ(f) =i=1N∑(f(x i ) − y i ) 2 .Se chamarmos <strong>de</strong> f o vetor (f(x 1 ), f(x 2 ), . . . , f(x N )), entãoi=1Q(f) = 〈f − y, f − y〉 = d(f, y) 2 .Portanto, minimizar o qui-quadrado é um problema <strong>de</strong> minimizar a distância ao vetor y noespaço R N .Quando limitamos f(x) a ser uma combinação linear das funções g 1 (x), . . . , g k (x) estamos,automaticamente, limitando o vetor f a ser uma combinação linear dos vetores g 1 , . . . , g k .Isso implica que vamos procurar f que minimiza a distância ao vetor y apenas entre os vetoresque são uma combinação linear dos vetores g 1 , . . . , g k .Mas o que é o conjunto dos vetores que são combinação linear dos vetores g 1 , . . . , g k ?Esse tipo <strong>de</strong> conjunto é chamado <strong>de</strong> subespaço vetorial (<strong>de</strong> R N ). Um subespaço vetorial é umconjunto com a seguinte proprieda<strong>de</strong>: qualquer combinação linear <strong>de</strong> vetores do conjunto étambém um vetor do conjunto. Por exemplo, em R 3 um subespaço vetorial só po<strong>de</strong> ser <strong>de</strong>um dos seguintes tipos: a origem (dimensão zero), isto é, o conjunto formado apenas peloponto (0, 0, 0); uma reta que passa pela origem (dimensão 1); um plano que passa pela origem(dimensão 2); ou todo o R 3 (dimensão 3). Note que todo subespaço contém a origem, poisse u pertence ao subespaço então u − u = 0 também pertence. Em R N também existemsubespaços <strong>de</strong> todas as dimensões variando <strong>de</strong>s<strong>de</strong> zero até N.Pois bem, o problema do ajuste se reduz agora a achar, <strong>de</strong>ntro do subespaço formadopelas combinações lineares <strong>de</strong> g 1 , . . .,g l , o ponto que minimiza a distância a um certo pontoy. Disso trataremos na próxima Seção.


6.2.EXISTÊNCIA E UNICIDADE DE SOLUÇÕES NO AJUSTE LINEAR 736.2 Existência e unicida<strong>de</strong> <strong>de</strong> soluções no ajuste linearNesta Seção discutiremos a possibilida<strong>de</strong> <strong>de</strong> solução para o problema do ajuste linear, nocaso discreto. Deixaremos o caso contínuo para a próxima Seção. Lembraremos alguns fatos<strong>de</strong> Geometria Analítica e Álgebra Linear, sem <strong>de</strong>monstrá-los todos. Os que faltarem po<strong>de</strong>mser encontrados em textos clássicos, voltados especificamente para esse assunto.Seja G um subespaço <strong>de</strong> R N . Definimos o subespaço G ⊥ dos vetores <strong>de</strong> R N ortogonais atodo vetor <strong>de</strong> G, lembrando que u e v são ortogonais se 〈u, v〉 = 0. Fica para o leitor mostrarque G ⊥ é um subespaço.O primeiro fato para o qual chamaremos a atenção é o seguinte: qualquer y ∈ R N po<strong>de</strong>ser escrito como soma <strong>de</strong> um vetor <strong>de</strong> G com um vetor <strong>de</strong> G ⊥ . Para mostrar isso, tomeuma base ortonormal {w 1 , . . .,w r } <strong>de</strong> G (a existência <strong>de</strong>ssa base é um dos fatos que ficam<strong>de</strong> lado nessa exposição, mas o leitor po<strong>de</strong> encontrar nos livros <strong>de</strong> Álgebra Linear no tópico“Ortogonalização <strong>de</strong> Gram-Schimdt”). O que caracteriza esse conjunto como base ortonormalé o fato <strong>de</strong> ser base (todo vetor <strong>de</strong> G po<strong>de</strong> ser escrito como combinação linear dos vetores<strong>de</strong>sse conjunto) e 〈w i , w j 〉 ser igual a zero se i ≠ j e igual a 1 se i = j. Agora tome o vetoru =r∑〈y, w i 〉w i .i=1O vetor u é uma soma <strong>de</strong> múltiplos dos w i ’s (<strong>de</strong> fato, é a soma da projeção <strong>de</strong> y sobre asdireções dadas pelos w i ’s), portanto é um vetor <strong>de</strong> G. Por outro lado, vamos mostrar quey − u é um vetor <strong>de</strong> G ⊥ . Com isso, teremosy = (y − u) + u ,mostrando que y po<strong>de</strong> ser escrito como soma <strong>de</strong> um vetor <strong>de</strong> G ⊥ (o vetor y − u) com umvetor <strong>de</strong> G (o vetor u).Mostrar que y − u ∈ G ⊥ é mostrar que y − u é ortogonal a qualquer vetor <strong>de</strong> G. Umvetor qualquer g <strong>de</strong> G po<strong>de</strong> ser escrito como combinação linear dos vetores da base:g =r∑α i w i .i=1Para mostrar que 〈y − u, g〉 = 0 basta substituir a expressão <strong>de</strong> u e a expressão <strong>de</strong> g, emtermos dos vetores da base, e levar em conta que a base é ortonormal. Fica como exercício!!!A segunda observação é que a <strong>de</strong>composição <strong>de</strong> um vetor y em uma soma <strong>de</strong> dois vetores,um <strong>de</strong> G e outro <strong>de</strong> G ⊥ é única. Em outras palavras, se y = u + v = ũ + ṽ, com u, ũ ∈ G ev, ṽ ∈ G ⊥ , então u = ũ e v = ṽ. Para mostrar isso, vamos apenas nos utilizar do fato <strong>de</strong> queo único vetor que pertence a ambos os subespaços é a origem (pois se u pertence a ambos ossubespaços, então u é ortogonal a ele mesmo, ou seja, 〈u, u〉 = 0; só que 〈u, u〉 = ‖u‖ 2 , e oúnico vetor que tem norma zero é o vetor nulo). Se y = u + v e y = ũ + ṽ então0 = y − y = (u − ũ) + (v − ṽ) ,isto é,ũ − u = v − ṽ .


74CAPÍTULO 6. LEVANDO A SÉRIO O PRODUTO ESCALARDo lado esquerdo da igualda<strong>de</strong> temos um vetor <strong>de</strong> G e do lado direito da igualda<strong>de</strong> temosum vetor <strong>de</strong> G ⊥ , e eles são iguais. Logo eles têm que ser ambos nulos, e a afirmação segue.O vetor u = ∑ ri=1 〈y, w i〉w i é a componente <strong>de</strong> y no subespaço G, também chamada <strong>de</strong>projeção <strong>de</strong> y em G. A terceira observação que temos a fazer é que o vetor u é o (único)elemento <strong>de</strong> G à menor distância <strong>de</strong> y. Para ver a razão, tome um outro vetor qualquerg ∈ G. A distância <strong>de</strong> g a y é a raiz quadrada <strong>de</strong> 〈g − y, g − y〉, que mostraremos ser maiordo que a distância <strong>de</strong> u a y, que é a raiz quadrada <strong>de</strong> 〈u − y, u − y〉. Para comparar as duasdistâncias, escrevemos〈g −y, g −y〉 = 〈g −u+u−y, g −u+u−y〉 = 〈g −u, g −u〉+2〈g −u, u −y〉+〈u −y, u −y〉 ,mas como g − u ∈ G e u − y ∈ G ⊥ , segue que 〈g − u, u − y〉 = 0. Além disso, 〈g − u, g − u〉 épositivo, logo〈g − y, g − y〉 > 〈u − y, u − y〉 ,on<strong>de</strong> a <strong>de</strong>sigualda<strong>de</strong> estrita confirma a unicida<strong>de</strong>.Finalmente lembremos que, no problema do ajuste, o subespaço vetorial em questão é oconjunto <strong>de</strong> todas as combinações lineares dos vetores g 1 , . . .,g k . Nesse subespaço, existe umúnico elemento que minimiza a distância ao ponto y, como concluímos acima. Será que daípo<strong>de</strong>mos concluir que sempre existe um único conjunto <strong>de</strong> parâmetros (a 1 , . . . , a k ) tal quef = a 1 g 1 + . . . + a k g k minimiza a distância a y?A resposta é não, nem sempre!! Embora só haja um elemento u do subespaço que minimizea distância, po<strong>de</strong> haver diversas maneiras <strong>de</strong> se escrever esse elemento como combinaçãolinear dos vetores g 1 , . . .,g k . Para que haja apenas uma maneira <strong>de</strong> se escrever u é precisoque os vetores g 1 , . . . , g k sejam linearmente in<strong>de</strong>pen<strong>de</strong>ntes, isto é, que nenhum <strong>de</strong>les possaser escrito como combinação linear dos outros.Por exemplo, suponha que o número N <strong>de</strong> pontos dados seja menor do que o número k<strong>de</strong> funções do ajuste. Não há como ter k > N vetores linearmente in<strong>de</strong>pen<strong>de</strong>ntes em R N ,portanto certamente não será única a solução para o problema <strong>de</strong> ajuste.Outro exemplo, suponha que g 1 (x) = 1, g 2 (x) = x, g 3 (x) = x 2 , . . ., g k (x) = x k−1 , eN ≥ k. Será que a solução do problema <strong>de</strong> ajuste é única? A resposta é sim, mas o leitorestá convidado a justificá-la inspirando-se no que está escrito na Seção A.7.6.3 O caso contínuoNo caso contínuo não temos um espaço <strong>de</strong> dimensão finita (R N ) para trabalhar. Que espaçoutilizamos? Será que as idéias das seções anteriores também se aplicam? Veremos que sim,quase sem modificações!No lugar <strong>de</strong> R N consi<strong>de</strong>ramos um espaço <strong>de</strong> funções, que po<strong>de</strong>mos particularizar (para nãodificultar as coisas). Suponha que y(x) seja uma função contínua <strong>de</strong>finida no intervalo [c, d].Então consi<strong>de</strong>ramos o conjunto E <strong>de</strong> todas as funções contínuas <strong>de</strong>finidas nesse intervalo. EmE estão <strong>de</strong>finidas a adição e a multiplicação por números reais: se h 1 e h 2 são funções <strong>de</strong> E,então <strong>de</strong>fine-se a função h = h 1 +h 2 como sendo aquela que leva x em h(x) = h 1 (x) +h 2 (x),e se α é um número real, <strong>de</strong>fine-se a função h = αh 1 como sendo aquela que leva x emh(x) = αh 1 (x). O conjunto E é um espaço vetorial porque essas operações sempre resultamem elementos <strong>de</strong> E. A origem ou elemento nulo <strong>de</strong> E é a função i<strong>de</strong>nticamente nula em [c, d],e assim por diante.


6.4. OUTROS PRODUTOS ESCALARES: PESOS 75O espaço vetorial E não tem dimensão finita porque não po<strong>de</strong>mos escolher um númerofinito <strong>de</strong> elementos h 1 , . . . , h n que gere E, isto é, tal que qualquer elemento <strong>de</strong> E possa serescrito como combinação linear <strong>de</strong>sses elementos. No entanto, dado o conjunto <strong>de</strong> funçõesg 1 , . . . , g k (aquelas com as quais queremos fazer o ajuste), o conjunto <strong>de</strong> todas as suas combinaçõeslineares é um subespaço vetorial <strong>de</strong> dimensão finita <strong>de</strong> E (que chamaremos <strong>de</strong> G).Po<strong>de</strong>mos também <strong>de</strong>finir um produto interno, ou produto escalar em E. Se h e f sãofunções <strong>de</strong> E, então〈h, f〉 =∫ dch(x)f(x)dx ,que foi a <strong>de</strong>finição que usamos previamente, como notação.Observe o leitor que nas consi<strong>de</strong>rações que fizemos nas Seções anteriores, só nos utilizamosdas proprieda<strong>de</strong>s do produto interno, a saber:1. Simetria: 〈u, v〉 = 〈v, u〉;2. Linearida<strong>de</strong>: 〈αu + βv, w〉 = α〈u, w〉 + β〈v, w〉;3. Positivida<strong>de</strong>: se u ≠ 0, 〈u, u〉 > 0.Essas proprieda<strong>de</strong>s po<strong>de</strong>m ser usadas para <strong>de</strong>finir o produto interno, como fizemos com o<strong>de</strong>terminante no Capítulo A. Não é difícil mostrar que a <strong>de</strong>finição acima <strong>de</strong> 〈h, f〉 no espaçoE é a <strong>de</strong> um produto interno, e daí seguem as conseqüências que advêm diretamente <strong>de</strong>ssasproprieda<strong>de</strong>s.O subespaço G tem dimensão finita, logo tem uma base ortonormal, e daí po<strong>de</strong>mosmostrar que todo elemento y ∈ E po<strong>de</strong> ser <strong>de</strong>composto <strong>de</strong> forma única como uma soma <strong>de</strong>duas funções:y = f + ξ ,on<strong>de</strong> f ∈ G e ξ ∈ G ⊥ . A função f é a projeção <strong>de</strong> y em G, e minimiza a distância <strong>de</strong> y aospontos <strong>de</strong> G, sendo portanto uma solução do problema <strong>de</strong> ajuste.6.4 Outros produtos escalares: pesosPensando novamente no caso discreto (mas com conseqüências igualmente válidas no casocontínuo), notamos que o cálculo do qui-quadrado pressupõe uniformida<strong>de</strong> dos dados (x i , y i ),isto é, cada dado entra com igual peso na fórmulaQ(f) =N∑(f(x i ) − y i ) 2 .i=1No entanto, é comum sabermos, em geral em medidas experimentais, que certos dadossão mais confiáveis do que outros. A atribuição <strong>de</strong> um peso a cada dado se daria da seguinteforma: para cada i escolhemos um certo p i > 0, que entra no cômputo do qui-quadrado daseguinte maneira:N∑Q(f) = p i (f(x i ) − y i ) 2 .i=1


76CAPÍTULO 6. LEVANDO A SÉRIO O PRODUTO ESCALARAssim, quanto mais alto for w i maior será a contribuição do dado (x i , y i ) para o qui-quadrado.Por conseguinte, ao procurarmos minimizar o qui-quadrado teremos que obter menores diferençasf(x i ) − y i para os valores <strong>de</strong> i tais que p i seja mais alto. Isso fará com que a funçãof(x) ajustada “aproxime” melhor esses pontos (x i , y i ) em <strong>de</strong>trimento <strong>de</strong> outros que tenhammenor peso.Em medidas experimentais, em geral, o peso é dado pelo inverso da variânciap i = 1 σ 2 i,uma estimativa do erro que <strong>de</strong>ve ser obtida <strong>de</strong> forma in<strong>de</strong>pen<strong>de</strong>nte. Quando todos os dadostêm estimativas <strong>de</strong> erro iguais, então o método <strong>de</strong> mínimos quadrados se reduz àquele quehavíamos visto anteriormente.No caso contínuo o peso é uma função p(x) <strong>de</strong>finida no intervalo [c, d] da função daday(x), e o qui-quadrado é dado pela expressãoQ(f) =∫ dcp(x)(f(x) − y(x)) 2 dx .Se o qui-quadrado adotado tem pesos, temos que reformular a <strong>de</strong>finição do produto escalarentre dois vetores u = (u 1 , . . . , u N ) e v = (v 1 , . . . , v N ) para〈u, v〉 =N∑p i u i v i ,e no caso contínuo, se u(x) e v(x) são funções do intervalo [c, d], para〈u, v〉 =∫ dci=1p(x)u(x)v(x)dx .Esses produtos escalares satisfazem as proprieda<strong>de</strong>s que se esperam dos produtos escalares:simetria, linearida<strong>de</strong> e positivida<strong>de</strong>. Toda a argumentação feita anteriormente sesegue <strong>de</strong> forma idêntica, e o menor qui-quadrado entre a família <strong>de</strong> funções a k parâmetrosf(x) = a 1 g 1 (x) + . . . + a k g k (x) será para a k-upla (a 1 , . . .,a k ) que satisfaz o sistema linear〈g 1 , g 1 〉a 1 + 〈g 1 , g 2 〉a 2 + . . . + 〈g 1 , g k 〉a k = 〈g 1 , y〉〈g 2 , g 1 〉a 1 + 〈g 2 , g 2 〉a 2 + . . . + 〈g 2 , g k 〉a k = 〈g 2 , y〉.... . . ... =..〈g k , g 1 〉a 1 + 〈g k , g 2 〉a 2 + . . . + 〈g k , g k 〉a k = 〈g k , y〉,on<strong>de</strong> os produtos escalares foram modificados para incluir os pesos.


Capítulo 7Famílias ortogonais7.1 Definições e exemplosPo<strong>de</strong>mos observar que a resolução do sistema linear〈g 1 , g 1 〉a 1 + 〈g 1 , g 2 〉a 2 + . . . + 〈g 1 , g k 〉a k = 〈g 1 , y〉〈g 2 , g 1 〉a 1 + 〈g 2 , g 2 〉a 2 + . . . + 〈g 2 , g k 〉a k = 〈g 2 , y〉. . . . . . = .〈g k , g 1 〉a 1 + 〈g k , g 2 〉a 2 + . . . + 〈g k , g k 〉a k = 〈g k , y〉seria enormemente facilitada se as funções g 1 , . . .,g k satisfizessem a proprieda<strong>de</strong> <strong>de</strong> que osprodutos escalares mistos sejam nulos, isto é,〈g l , g m 〉 = 0 ,se l ≠ m. Isto é o mesmo que dizer que as funções g 1 , . . . , g k são todas ortogonais entre siou, <strong>de</strong> modo similar, que a família <strong>de</strong> funções {g 1 , . . . , g k } é ortogonal.Neste caso, teríamosa l = 〈g l, y〉〈g l , g l 〉 ,e portantof =k∑l=1〈y, g l 〉〈g l , g l 〉 g l .Melhor ainda seria se a família {g 1 , . . .,g k } fosse ortonormal, isto é, 〈g l , g l 〉 = 1 para todol = 1, . . .,k, pois a fórmula ficariaf =k∑〈y, g l 〉g l .l=1O leitor que acompanhou atentamente o Capítulo 6 perceberá que esta nada mais é quea fórmula da projeção <strong>de</strong> y no subespaço G das combinações lineares <strong>de</strong> g 1 , . . . , g k .77


78CAPÍTULO 7. FAMÍLIAS ORTOGONAISVejamos a partir <strong>de</strong> agora um exemplo <strong>de</strong> como po<strong>de</strong>mos fazer um ajuste <strong>de</strong> mínimosquadrados sem recorrer a um sistema linear, usando, ao invés, o conceito <strong>de</strong> ortogonalida<strong>de</strong>.O exemplo é <strong>de</strong> um ajuste contínuo, mas as idéias <strong>de</strong> apllicam no caso discreto.Como primeiro exemplo, fixemos o intervalo [0, 1] como domínio para as funções <strong>de</strong> E(isto é, c = 0 e d = 1). Se tomarmos as funções g 1 (x) = 1, g 2 (x) = x, g 3 (x) = x 2 , . . .,g k (x) = x k−1 , o subespaço G <strong>de</strong> suas combinações lineares consiste <strong>de</strong> todos os polinômios<strong>de</strong> grau até k − 1. Não é difícil mostrar que essas funções são linearmente in<strong>de</strong>pen<strong>de</strong>ntes,formando portanto uma base <strong>de</strong> G. No entanto, elas não são ortogonais entre si (e tampoucotêm norma igual a 1). Para ver isso, basta tomar um dos produtos internos:〈g 1 , g 2 〉 =∫ 10g 1 (x)g 2 (x)dx =∫ 10xdx = 1 2 ≠ 0 .E então como construir uma base ortonormal (ou ortogonal) <strong>de</strong> G? Faremos isso inspiradosno processo <strong>de</strong> Ortogonalização <strong>de</strong> Gram-Schimdt. Só para não confundir, <strong>de</strong>nominaremosos vetores <strong>de</strong>ssa nova base <strong>de</strong> f 1 , . . . , f k . Imporemos primeiramente que o primeiro vetorda base seja a função constante igual a 1: f 1 (x) ≡ 1. A segunda função será um polinômio <strong>de</strong>grau 1: f 2 (x) = a + bx, mas po<strong>de</strong>mos supor que b = 1, se multiplicarmos por uma constante(multiplicações por constantes só mudam a norma, mas não influenciam na ortogonalida<strong>de</strong>).Além disso, queremos que ele seja ortogonal ao primeiro, ou seja, queremos que〈f 1 , f 2 〉 =∫ 10f 1 (x)f 2 (x)dx =∫ 10(a + x)dx = 0 .Isso nos obriga a ter a = − 1 2 , logo f 2 (x) = − 1 2 + x .A terceira função será um polinômio <strong>de</strong> grau 2, cujo coeficiente <strong>de</strong> or<strong>de</strong>m mais alta tambémserá igual a 1: f 3 (x) = a+bx+x 2 (a e b diferentes dos anteriores, aqui usados somente comoparâmetros auxiliares). Esta função <strong>de</strong>ve ser ortogonal às duas previamente criadas, isto é,Da primeira equação saie da segunda sai∫ 10〈f 1 , f 3 〉 = 0 , 〈f 2 , f 3 〉 = 0 .∫ 10(a + bx + x 2 )dx = 0 ,(− 1 2 + x)(a + bx + x2 )dx = 0 .As duas equações reunidas formam um sistema linear nas incógnitas a e b, e resolvendo-o fica<strong>de</strong>terminada a função f 3 .O processo continua do mesmo jeito, até se chegar à k-ésima função. Observe que nãonos livramos totalmente dos sistemas lineares para acharmos a base ortogonal, mas nossotrabalho ficará enormemente facilitado se alguém já tiver feito isso por nós. Existem tabelas<strong>de</strong> polinômios ortogonais prontas para serem usadas! Cada família leva em conta a <strong>de</strong>finição


7.2. CALCULANDO POLINÔMIOS ORTOGONAIS POR RECORRÊNCIA 79do produto escalar utilizado que, em nosso caso, <strong>de</strong>pen<strong>de</strong> somente do intervalo <strong>de</strong> integração(e do peso, se for o caso). Veremos logo adiante como usar tabelas <strong>de</strong> funções ortogonais.Exercício 7.1 Consi<strong>de</strong>re (x 1 , x 2 , x 3 , x 4 ) = (0.0, 0.2, 0.7, 1.3) e o produto escalar〈f, g〉 =4∑f(x i )g(x i ) .i=1Ache p(x) = x 2 + ax + b que seja ortogonal a q(x) = x, em relação a esse produto escalar.Exercício 7.2 Mostre que as funções senx e cosx são ortogonais no intervalo [0, 2π](admitindo-se o produto escalar com peso uniforme).7.2 Calculando polinômios ortogonais por recorrênciaNa Seção anterior vimos que po<strong>de</strong>mos recorrer a polinômios ortogonais para facilitar a resoluçãodo problema <strong>de</strong> ajuste. No entanto,a obtenção dos polinômios ortogonais recai naresolução <strong>de</strong> vários sistemas lineares, tarefa que po<strong>de</strong> ser tão ou mais trabalhosa do que senão usássemos esses polinômios.A boa notícia, porém, é que há uma maneira mais fácil <strong>de</strong> se calcular os polinômiosortogonais, através <strong>de</strong> uma relação <strong>de</strong> recorrência. Essa relação <strong>de</strong> recorrência funciona tantono caso discreto (com qualquer conjunto <strong>de</strong> pontos x 1 , . . .,x N ) como no caso contínuo (comqualquer intervalo <strong>de</strong> integração), com ou sem pesos, ou seja, com qualquer dos produtosinternos que <strong>de</strong>screvemos.Proce<strong>de</strong>-se assim: fixa-se f 0 (x) ≡ 1 e calcula-se o primeiro polinômio f 1 (x) = x + a, damesma forma que fizemos previamente. O valor <strong>de</strong> a irá <strong>de</strong>pen<strong>de</strong>r do produto interno, e éescolhido <strong>de</strong> maneira que 〈f 0 , f 1 〉 = 0. Agora suponha que o processo continua, como <strong>de</strong>scritona Seção anterior, obtendo-se polinômios f 2 , f 3 , f 4 , etc, <strong>de</strong> graus 2, 3, 4, etc, exigindo-seapenas que o coeficiente <strong>de</strong> mais alto grau seja sempre igual a 1.Em cada etapa, {f 0 , f 1 , . . . , f k } gera o subespaço formado por todos os polinômios <strong>de</strong>grau k (mostre isso como exercício, com um argumento indutivo).Observe que começamos a numerar nossos polinômios a partir <strong>de</strong> zero, pois assim seuíndice assim correspon<strong>de</strong>rá exatamente a seu grau, facilitando os argumentos.O ponto central é a seguinte afirmação, que permitirá calcular f k (x), para k ≥ 2, somentecom os polinômios f k−1 e f k−2 : “para todo k ≥ 2, valexf k−1 (x) − f k (x) = a k f k−1 (x) + b k f k−2 (x) , ′′on<strong>de</strong> a k e b k são coeficientes apropriados.” Note que para k = 2 ela é verda<strong>de</strong>ira porquexf 1 (x) − f 2 (x)é um polinômio <strong>de</strong> grau 1 (o termo x 2 cancela, pois os coeficientes <strong>de</strong> mais alto grau sãosempre iguais a 1). Logo esse polinômio po<strong>de</strong> ser escrito como combinação linear <strong>de</strong> f 0 e f 1 ,isto éxf 1 (x) − f 2 (x) = a 2 f 1 (x) + b 2 f 0 (x) .


80CAPÍTULO 7. FAMÍLIAS ORTOGONAISPara k ≥ 3 o raciocínio é parecido, mas há uma pequena dificulda<strong>de</strong> a resolver. Opolinômioxf k−1 (x) − f k (x)tem grau k − 1, pois o termo x k se cancela. Segue que ele po<strong>de</strong> ser escrito como combinaçãolinear dos vetores f k−1 , f k−2 , . . ., f 1 , f 0 . Chamaremos <strong>de</strong> ˜f a parte <strong>de</strong>ssa combinação linearque correspon<strong>de</strong> à combinação <strong>de</strong> polinômios f j com j ≤ k − 3. Entãoxf k−1 (x) − f k (x) = a k f k−1 (x) + b k f k−2 (x) + ˜f(x) .A nossa afirmação estará <strong>de</strong>monstrada se provarmos que ˜f é i<strong>de</strong>nticamente nulo.Como ˜f é um polinômio <strong>de</strong> grau no máximo k − 3, basta mostrarmos que〈 ˜f, f j 〉 = 0para todo j ≤ k − 3. Isolando ˜f na expressão acima, usamos o fato <strong>de</strong> que, se j ≤ k − 3,então 〈f k , f j 〉 = 0, 〈f k−1 , f j 〉 = 0 e 〈f k−2 , f j 〉 = 0, restando apenas mostrar que〈xf k−1 (x), f j (x)〉 = 0 .Aí entra o “pulo do gato”, pois se observarmos as <strong>de</strong>finições dos produtos internos, veremosque〈xf k−1 (x), f j (x)〉 = 〈f k−1 (x), xf j (x)〉 .Como xf j (x) tem grau j + 1, e j + 1 é menor do que k − 1, então xf j (x) po<strong>de</strong> ser escritocomo combinação linear <strong>de</strong> f 0 , f 1 , . . ., f k−2 , e o produto interno resulta nulo.Talvez fosse mais didático apresentar o uso da afirmação antes <strong>de</strong> sua <strong>de</strong>monstração.Optamos pelo contrário porque a afirmação não parece ser muito óbvia. Ela dá uma fórmulapara f k (x) em função dos dois polinômios anteriores:f k (x) = (x − a k )f k−1 (x) − b k f k−2 (x) ,sendo apenas necessário calcular a k e b k . Para isso, fazemos o produto interno da equaçãopor f k−1 (a fim <strong>de</strong> obter a k ) e por f k−2 (a fim <strong>de</strong> obter b k ).Ou seja, <strong>de</strong>resultae <strong>de</strong>resulta〈xf k−1 , f k−1 〉 − 〈f k , f k−1 〉 = a k 〈f k−1 , f k−1 〉 + b k 〈f k−2 , f k−1 〉a k = 〈xf k−1, f k−1 〉〈f k−1 , f k−1 〉 ,〈xf k−1 , f k−2 〉 − 〈f k , f k−2 〉 = a k 〈f k−1 , f k−2 〉 + b k 〈f k−2 , f k−2 〉b k = 〈xf k−1, f k−2 〉〈f k−2 , f k−2 〉 .Exercício 7.3 Obtenha os quatro primeiros polinômios ortogonais usando o método acima<strong>de</strong>scrito, para o produto interno〈f, g〉 =∫ 1−1f(x)g(x)dx .


7.3. UM EXEMPLO DE APLICAÇÃO DE POLINÔMIOS ORTOGONAIS 817.3 Um exemplo <strong>de</strong> aplicação <strong>de</strong> polinômios ortogonaisGostaríamos <strong>de</strong> aproximar a função y(x) = sen x (em radianos) no intervalo [−1, 1] por umpolinômio cúbico. Fazendo o exercício do final da Seção anterior, constatamos que qualquerpolinômio cúbico po<strong>de</strong> ser gerado por combinação linear dos polinômios ortogonaisf 0 (x) = 1 , f 1 (x) = x , f 2 (x) = x 2 − 1 3 , f 3(x) = x 3 − 3 5 x .Estamos procurando o melhor conjunto <strong>de</strong> parâmetros que ajustef = a 0 f 0 + a 1 f 1 + a 2 f 2 + a 3 f 3 ,e como vimos anteriormente, f é dada pela projeção <strong>de</strong> y no espaço G das combinaçõeslineares <strong>de</strong>sses polinômios. Como eles são ortogonais, f é facilmente calculável, isto é, cadaum dos coeficientes a l , l = 0, 1, 2, 3 é dado pora l = 〈y, f l〉〈f l , f l 〉 .Os <strong>de</strong>nominadores são as normas ao quadrado. Temos〈f 0 , f 0 〉 = 2 , 〈f 1 , f 1 〉 = 2 3 , 〈f 2, f 2 〉 = 845 , 〈f 3, f 3 〉 = 8175 .Exercício 7.4 Termine o exemplo. Calcule os produtos 〈y, f l 〉, on<strong>de</strong> será preciso integrarx l sen x (sugestão: integração por partes). Tente não errar nas contas. Obtenha os coeficientese explicite a função f como um polinômio cúbico. Desenhe um gráfico do polinômioobtido e compare com a função h(x) = sen x.Exercício 7.5 Ajuste, por mínimos quadrados, um polinômio <strong>de</strong> primeiro grau à funçãoh(x) = senx no intervalo [0, 1], usando polinômios ortogonais.Exercício 7.6 Ajuste um polinômio quadrático à função e x em [−1, 1] usando polinômiosortogonais.7.4 Exemplo <strong>de</strong> análise harmônicaAlém dos polinômios ortogonais, é muito importante também a seguinte família <strong>de</strong> funçõestrigonométricas, <strong>de</strong>finidas no intervalo [0, 2π], que é a coleção <strong>de</strong> todas as funções do tipoa 0 +k∑(a l coslx + b l senlx) .l=1Todas as funções 1, cosx, cos2x, cos3x, . . ., sen x, sen 2x, sen3x, etc, são ortogonais entresi (prove!). Portanto, se quisermos ajustar y por uma função <strong>de</strong>sse tipo, teremosa 0 = 12π∫ 2π0y(x)dx , a l = 1 π∫ 2π0y(x)cos(lx)dx


82CAPÍTULO 7. FAMÍLIAS ORTOGONAISeb l = 1 π∫ 2π0y(x)sen(lx)dx ,para todo l = 1, 2, 3, . . ., k. O fator 12π em a 0 correspon<strong>de</strong> à norma ao quadrado da função1, e os fatores 1 πnos <strong>de</strong>mais termos correspon<strong>de</strong>m à norma ao quadrado <strong>de</strong> cada uma dasfunções restantes (prove também isto!).Esse tipo <strong>de</strong> ajuste é chamado <strong>de</strong> análise harmônica.O problema é que em geral a função a ser ajustada não se encontra <strong>de</strong>finida no intervalo[0, 2π], e mesmo assim gostaríamos <strong>de</strong> aproximá-la por funções trigonométricas. Mas aí, se ointervalo for escrito como [c, d], basta usar as funções1 , sen(2πl x − cd − c ) , cos(2πlx − c ) , l = 1, 2, . . .d − cPara exemplificar, faremos a análise harmônica <strong>de</strong> y(x) = x(1 − x) (uma parábola) nointervalo [0, 1]. Teremos que usar as funções 1, sen(2πlx), cos(2πlx), l = 1, 2, . . ., que sãoortogonais entre si.Primeiro calculamos as normas ao quadrado. Temos a mais fácil, ∫ 11 · 1dx = 1. Alémdissoe analogamente∫ 10sen 2 (2πlx)dx = 12πl∫ 10∫ 2πl0sen 2 udu = l2πl∫ 2π∫ 2πcos 2 (2πlx)dx = 2πl 2 cos 2 u .000sen 2 udu ,As integrais ∫ 2π0sen 2 udu e ∫ 2π0cos 2 udu são iguais a π (prove, usando que cos2u = 1 −2 sen 2 u = 2 cos 2 u − 1), portanto todas as normas ao quadrado são iguais a 1 2 , excetuando-sea primeira função, que tem norma 1.Agora temos que calcular os produtos internos <strong>de</strong>ssas funções com a função y(x) = x(1 −x) = x − x 2 . Com a primeira função é a própria integral <strong>de</strong> x(1 − x), que vale 1 6 . Entãoa 0 =∫ 101 · x(1 − x)dx∫ 10 1 · 1dx = 1 6 .Depois observamos que os b l ’s são todos nulos. Isso porque a função x(1 − x) é par emrelação a x = 1 2, e as funções sen(2πlx) são ímpares em relação ao mesmo ponto, don<strong>de</strong> oproduto das duas é ímpar em relação a x = 1 2. Como o intervalo [0, 1] é simétrico em torno<strong>de</strong> x = 1 2 , então ∫ 1para todo l ≥ 1.Só nos resta obter0a l =x(1 − x)sen(2πlx)dx = 0 ,∫ 10x(1 − x)cos(2πlx)dx.12


7.4. EXEMPLO DE ANÁLISE HARMÔNICA 83Com u = 2πlx obtemosa l = 2 ∫ 2πl(2πl) 2 u cosudu − 2 ∫ 2πl(2πl) 3 u 2 cosudu .0A primeira integral é nula, porque u cosu po<strong>de</strong> ser escrito como (u − πl)cosu + πl cosu. Oprimeiro termo da soma é uma função ímpar em relação a x = πl, que é o ponto intermediáriodo intervalo, e portanto sua integral é nula. E a integral <strong>de</strong> cosu em qualquer períodocompleto também é nula.Quanto à segunda integral, integramos por partes duas vezes e achamos a primitivau 2 sen u + 2u cosu − 2 senu <strong>de</strong> u 2 cosu. Usando a primitiva, chegamos ema l = − 1π 2 l 2 .Assim po<strong>de</strong>mos fazer o ajuste <strong>de</strong> x(1 − x) usando quantas funções trigonométricas quisermos.Se formos até l = k, teremosf(x) = 1 6 − 1 π 2k∑l=101l 2 cos(2πlx)(o leitor está convidado a fazer um gráfico <strong>de</strong> x(1 − x) e um gráfico <strong>de</strong> f(x) para l = 2 ecomparar visualmente o resultado).Está fora do escopo <strong>de</strong>ste livro <strong>de</strong>monstrar isto, mas se tomarmos k indo para infinito afunção <strong>de</strong> ajuste f(x) estará cada vez mais perto da função ajustada y(x) = x(1 − x). Emparticular, f(0) estará cada vez mais perto <strong>de</strong> y(0), que é igual a zero. PortantoEscrito <strong>de</strong> outra forma,1limk→∞ 6 − 1 k∑ 1π 2 l 2 = 0 .l=1limk→∞k∑l=11l 2 = π26 .O limite da soma é <strong>de</strong>notado como se a soma fosse infinita∞∑l=11l 2 ≡ limk→∞k∑i=1Assim, po<strong>de</strong>mos obter uma fórmula para π:∑ ∞π = √1 6l 2 .Exercício 7.7 Faça um pequeno programa <strong>de</strong> computador para ver se a fórmula acima estácorreta. O computador será necessário porque a convergência para o limite é bastante lenta,e um valor <strong>de</strong> k muito gran<strong>de</strong> é necessário para se conseguir uma boa aproximação <strong>de</strong> π.l=11l 2 .


84CAPÍTULO 7. FAMÍLIAS ORTOGONAIS7.5 Uso <strong>de</strong> funções tabeladas por mudança <strong>de</strong> variávelFreqüentemente conhecemos uma família <strong>de</strong> polinômios ortogonais (por exemplo, usando umatabela), ou mesmo a família <strong>de</strong> funções trigonométricas acima mencionada, mas a função h(x)da qual queremos fazer o ajuste está <strong>de</strong>finida em um intervalo diferente. Será que ainda assimpo<strong>de</strong>mos aproveitar a informação disponível?A resposta é sim, e a maneira é simples: recorremos a uma mudança <strong>de</strong> variáveis afim.Assumiremos que temos uma família <strong>de</strong> funções ortogonais f 0 , f 1 , . . . tabelada no intervalo[c, d], e gostaríamos <strong>de</strong> ter uma família <strong>de</strong> funções ortogonais no intervalo [ĉ, ˆd].Em primeiro lugar, construímos uma função afim L que leve o intervalo [ĉ, ˆd] no intervalo[c, d], sobrejetivamente. Isso po<strong>de</strong> ser feito explicitamente:L(x) = c + d − c (x − ĉ) .ˆd − ĉSua inversa também po<strong>de</strong> ser calculada <strong>de</strong> forma explícita:L −1 (x) = ĉ + ˆd − ĉ(x − c) .d − cPara facilitar a notação, chamaremos <strong>de</strong> λ o coeficiente linear <strong>de</strong> L:Afirmamos que a família ˆf 0 , ˆf 1 , . . . dada porλ = d − cˆd − ĉˆf l (x) = f l (L(x))é ortogonal com respeito ao produto interno usual do intervalo [ĉ, ˆd]. Para isso, só precisamosmostrar que∫ ˆdĉˆf l (x) ˆf k (x)dx = 0 ,para l ≠ k, usando a informação <strong>de</strong> que, nesse caso,Entretanto∫ ˆdĉ∫ dcˆf l (x) ˆf k (x)dx =f l (x)f k (x)dx = 0 .∫ ˆdĉf l (L(x))f k (L(x))dxe, fazendo a mudança <strong>de</strong> variáveis u = L(x) (com du = L ′ (x)dx = λdx), obtemos∫ L(ˆd)L(ĉ)f l (u)f k (u) 1 λ du = 1 λ∫ dcf l (u)f k (u)du = 0 .Observe que consi<strong>de</strong>ramos apenas o caso contínuo, com peso uniforme. Outras situaçõespo<strong>de</strong>m ser consi<strong>de</strong>radas, tomando-se os <strong>de</strong>vidos cuidados, mas não discutiremos receitasgerais aqui.


7.5. USO DE FUNÇÕES TABELADAS POR MUDANÇA DE VARIÁVEL 85Perceba também que no exemplo <strong>de</strong> análise harmônica da Seção passada nós fizemosisso, pois originalmente havíamos apresentado funções trigonométricas ortogonais entre si nointervalo [0, 2π], mas no exemplo fizemos a análise harmônica adaptada para o intervalo [0, 1].Além do mais, olhando para o que fizemos, no caso <strong>de</strong> as funções ˆf 0 , ˆf 1 , . . . serem polinômiosentão as funções f 0 , f 1 , . . . também serão polinômios, respectivamente <strong>de</strong> mesmograu.Vejamos um exemplo, para ilustrar. Na Seção 7.3 obtivemos os polinômios ortogonaisf 0 (x) = 1, f 1 (x) = x, f 2 (x) = x 2 − 1 3 , f 3(x) = x 3 − 3 5x, relativamente ao produto internousual no intervalo [−1, 1], porém gostaríamos <strong>de</strong> fazer um ajuste polinomial no intervalo [1, 2].Então proce<strong>de</strong>mos como <strong>de</strong>scrito acima. Achamos primeiro a função afim L que leve ointervalo [1, 2] no intervalo [−1, 1], dada porL(x) = −1 + 2(x − 1) = 2x − 3(procure sua própria maneira <strong>de</strong> achá-la!). Os polinômios procurados são dados por ˆf l = f l ◦L.Portantoˆf 1 (x) = f 1 (L(x)) = 1ˆf 2 (x) = f 2 (L(x)) = L(x) = −3 + 2xˆf 3 (x) = f 3 (L(x)) = L(x) 2 − 1 3 = 4x2 − 12x + 263ˆf 4 (x) = f 4 (L(x)) = L(x) 3 − 3 5 L(x) = 8x3 − 36x 2 + 54x − 6 5 x − 1265


86CAPÍTULO 7. FAMÍLIAS ORTOGONAIS


Parte IIIEquações e Zeros <strong>de</strong> Funções87


Capítulo 8Zeros <strong>de</strong> funções e o Método daDicotomia8.1 IntroduçãoConsi<strong>de</strong>re o seguinte problema: “dada uma função real f, achar suas raízes, isto é, os valores<strong>de</strong> x para os quais f(x) = 0”, como ilustra a figura abaixo (os pontos pretos indicam as raízesda função representada no <strong>de</strong>senho).fPo<strong>de</strong> a princípio parecer um problema específico, mas ele aparece toda vez que tivermosuma equação a ser resolvida. Uma equação nada mais é do que uma expressãof 1 (x) = f 2 (x) ,on<strong>de</strong> procuramos o(s) valor(es) <strong>de</strong> x que a satisfaça(m). Ora, mas isso é o mesmo que acharas raízes da função f(x) = f 1 (x) − f 2 (x).Além disso, o problema se relaciona com a inversão <strong>de</strong> funções. Por exemplo, temos umafunção g(x) conhecida, mas gostaríamos <strong>de</strong> <strong>de</strong>terminar g −1 em certos pontos. Lembrandoque g −1 (y) é <strong>de</strong>finido como sendo o valor x tal que g(x) = y temos que, para um dado y,resolver a equação g(x) = y e <strong>de</strong>terminar x = g −1 (y). Resolver a equação g(x) = y é omesmo que achar um zero da função f(x) = g(x) − y.Nas próximas Seções veremos alguns exemplos que ilustram o problema.89


90CAPÍTULO 8. ZEROS DE FUNÇÕES E O MÉTODO DA DICOTOMIA8.2 Raiz cúbica <strong>de</strong> 10Suponha que queiramos achar um número ¯x positivo tal que ¯x 3 = 10. Esse número é o que<strong>de</strong>nominamos a raiz cúbica <strong>de</strong> 10, ou 3√ 10.Graficamente, encontramos ¯x pela intersecção <strong>de</strong>{y = x 3 } com {y = 10}, como mostra a figura aolado. Observe também que o problema é equivalentea resolver a equação10y=x 3y=10x 3 − 10 = 0 ,xou seja, estamos procurando a raiz <strong>de</strong> f(x) = x 3 −10.8.3 Pára-quedista ou bolinha em queda <strong>de</strong>ntro d’águaImagine um pára-quedista que abre seu pára-quedas no instante t = 0, da altura h 0 . Ou,alternativamente, uma bolinha que parte do repouso à altura h 0 <strong>de</strong>ntro <strong>de</strong> um tubo cheiod’água, e cai sob a força da gravida<strong>de</strong>. Levando em conta que a queda não é completamentelivre, isto é, o meio oferece resistência ao movimento, quanto tempo levará a queda do páraquedistaou da bolinha?h 0h 0A diferença básica entre os dois problemas é a velocida<strong>de</strong> inicial. No caso do páraquedista,ela é bastante alta, e o pára-quedas ten<strong>de</strong>rá a amortecê-la até atingir uma velocida<strong>de</strong>compatível com a possibilida<strong>de</strong> do corpo humano suportar o choque com o solo. No caso dabolinha, a velocida<strong>de</strong> inicial é zero e cresce com o tempo.Empiricamente, constata-se que o meio oferece resistência ao movimento com uma forçatanto maior quanto maior for a velocida<strong>de</strong>.


8.3.PÁRA-QUEDISTA OU BOLINHA EM QUEDA DENTRO D’ÁGUA 91Num gráfico, teríamos algo como mostrado na figuraao lado. Isso implica que há um valor <strong>de</strong> velocida<strong>de</strong>v ∗ para o qual a força <strong>de</strong> resistência é exatamenteigual à força da gravida<strong>de</strong>. Se o corpo em queda estáa essa velocida<strong>de</strong>, a força da gravida<strong>de</strong> e a resistênciado meio se anulam entre si, e a resultante das forçasé zero. Isso implica que o corpo não será acelerado(nem <strong>de</strong>sacelerado), e portanto permanecerá constantementeem movimento à velocida<strong>de</strong> v ∗ .força <strong>de</strong>resistenciamgv*velocida<strong>de</strong>Por outro lado, se a velocida<strong>de</strong> inicialmente é maior do que v ∗ , então a força <strong>de</strong> resistênciaserá maior do que a força <strong>de</strong> gravida<strong>de</strong>, o que fará com que o corpo reduza sua velocida<strong>de</strong>.Tudo sugere que os gráficos Velocida<strong>de</strong> vs. Tempo tenham o seguinte aspecto, <strong>de</strong>pen<strong>de</strong>ndoda relação entre v 0 e v ∗ , on<strong>de</strong> v 0 é a velocida<strong>de</strong> inicial do corpo.v 0=v*v v vtv 0v*Sob a hipótese <strong>de</strong> que a força <strong>de</strong> resistência do ar é proporcional à velocida<strong>de</strong> do corpo,em valor absoluto, é possível mostrar que a evolução da velocida<strong>de</strong> em função do tempo édada porv(t) − v ∗ = (v 0 − v ∗ )e − gv∗ t ,on<strong>de</strong> g é a constante <strong>de</strong> gravida<strong>de</strong> à superfície terrestre (vi<strong>de</strong> Seção 17.3.3 para uma justificativa).Como interpretar essa fórmula? Ora, note que se <strong>de</strong>finirmos ∆v(t) = v(t) − v ∗ , isto é, adiferença entre a velocida<strong>de</strong> do corpo e a velocida<strong>de</strong> <strong>de</strong> equilíbrio, a fórmula apenas diz que∆v no instante t é igual a ∆v no instante t = 0 multiplicado por e − gv ∗ t . Isso está <strong>de</strong> acordocom as figuras que havíamos <strong>de</strong>senhado.tv*v 0tSabendo agora como evolui a velocida<strong>de</strong> do corpo em funçãodo tempo, como po<strong>de</strong>mos <strong>de</strong>duzir a evolução da altura h(t)?Primeiro precisamos fixar coerentemente as coor<strong>de</strong>nadas.Temos consi<strong>de</strong>rado velocida<strong>de</strong>s positivas para corpos emqueda, logo temos que medir a altura, com a coor<strong>de</strong>nada h,<strong>de</strong> cima para baixo. Por conveniência, fixaremos o zero <strong>de</strong>h como sendo à altura h 0 , <strong>de</strong> forma que o solo será atingidono instante T tal que h(T) = h 0 .0h=h 0h


92CAPÍTULO 8. ZEROS DE FUNÇÕES E O MÉTODO DA DICOTOMIAvv 0v *0 th(t)O espaço percorrido é dado pela integral da velocida<strong>de</strong>no intervalo <strong>de</strong> tempo consi<strong>de</strong>rado. Assim,h(t) − h(0) =∫ t0v(s)ds ,on<strong>de</strong> h(0) = 0, pela maneira como fixamos a coor<strong>de</strong>nada.No gráfico <strong>de</strong> velocida<strong>de</strong>s, isso correspon<strong>de</strong> aachar a área sob a curva v(t). A variável s é usadacomo auxiliar, para diferir do extremo <strong>de</strong> integração.Entãoh(t) ==∫ t0∫ t0(v ∗ + [v(0) − v ∗ ]e − gv ∗ s )ds∫ Tv ∗ ds + [v(0) − v ∗ ] e − gv ∗ s ds0= v ∗ t + [v(0) − v ∗ ](− v∗g )(e− gv ∗ t − 1) .Logoh(t) = v∗g [v(0) − v∗ ] + v ∗ t − v∗g [v(0) − v∗ ]e − gv ∗ t .Agora, se quisermos achar T tal que h(T) = h 0 , teremos que resolver a equaçãoh 0 = v∗g [v(0) − v∗ ] + v ∗ T − v∗g [v(0) − v∗ ]e − gv ∗ T .ChamandoA =v∗g [v(0) − v∗ ] − h 0B = v ∗C = v∗g [v(0) − v∗ ]D = v∗g


8.4. O CILINDRO DEITADO 93A+Btentão estamos procurando a raiz da funçãof(t) = A + Bt − Ce −Dt .Graficamente, essa raiz é dada pela projeçãona abscissa do encontro entre a reta A + Btcom a função Ce −Dt , vi<strong>de</strong> ao lado.TCe −Dtt8.4 O cilindro <strong>de</strong>itadoConsi<strong>de</strong>re um cilindro colocado horizontalmentesobre um plano, paralelo ao solo, comona figura ao lado. O cilindro tem uma abertura,na parte superior, para a colocação <strong>de</strong>água (para dramatizar o exemplo, imagine umcontêiner <strong>de</strong> petróleo, gigante, com esse formatoe nessa posição). O problema é: como<strong>de</strong>terminar uma escala com marcações que indiquemo volume <strong>de</strong> água <strong>de</strong>ntro do cilindro (enão simplesmente a altura do nível da água)?Para ver a relação entre essa questão e o problema <strong>de</strong> achar o zero <strong>de</strong> uma função,quantifiquemos um pouco mais o problema. Seja l o comprimento do cilindro e r o raio <strong>de</strong>uma seção transversal, perpendicular ao seu eixo. O volume total do cilindro é dado porv = l · πr 2 ,pois πr 2 é a “área da base” e l a “altura” do cilindro, embora ele esteja <strong>de</strong>itado.


94CAPÍTULO 8. ZEROS DE FUNÇÕES E O MÉTODO DA DICOTOMIArθLrcos(θ)hSe ele estiver cheio até a altura h então o volume<strong>de</strong> água ali contido será l vezes a áreapreenchida pela água numa seção transversalqualquer, que chamaremos <strong>de</strong> A(h). Noteque h varia entre 0 e 2r, e que A(0) = 0,A(2r) = πr 2 e A(r) = 1 2 πr2 . Mas e os outrosvalores <strong>de</strong> h? Como achar a função A(h)?A(h)Aqui po<strong>de</strong>mos fazer um pouco <strong>de</strong> geometria: supomos que h < r (o raciocínio serácompletamente análogo para h > r) e consi<strong>de</strong>ramos o ângulo θ formado entre a vertical e alinha L. A relação entre h e θ é simples: r cosθ + h = r, ou seja, h = r(1 − cosθ).Lembremos agora que a área <strong>de</strong> um setor <strong>de</strong> ângulo θ po<strong>de</strong> ser achada por regra <strong>de</strong> três,lembrando que para θ = 2π a área é πr 2 :θ = 2π −→ πr 2θ −→ a(θ)=⇒ a(θ) = 1 2 θr2 .Como mostra a figura, a área que queremos calcular é menor do que a área <strong>de</strong> dois setores<strong>de</strong> ângulo θ (perfazendo θr 2 ), e o exce<strong>de</strong>nte é a área <strong>de</strong> dois triângulos-retângulos.A área exce<strong>de</strong>nte é o produto d 1 d 2 , on<strong>de</strong> d 1 = r cosθ e d 2 = r sin θ. LogoA(h) = θr 2 − r 2 sinθ cosθ = r 2 (θ − 1 sin 2θ) ,2θ = πlembrando que θ <strong>de</strong>pen<strong>de</strong> <strong>de</strong> h pela relação h =r(1 − cosθ). Essa conta sugere que talvez seja maisfácil fazer a escala ao longo do contorno do cilindro,parametrizado pelo ângulo θ, como se fossem as marcas<strong>de</strong> um relógio (po<strong>de</strong>-se fazer uma escala vertical,mas as contas ficarão mais complicadas).3l2lθ = 01lÉ fácil ver que a mesma fórmula vale quando h > r (verifique!). Resumindo, o volumev(θ) <strong>de</strong>pen<strong>de</strong> <strong>de</strong> θ pela fórmulav(θ) = lr 2 (θ − 1 sin 2θ) ,2


8.5.CATENÁRIA 95on<strong>de</strong> θ varia entre 0 e π. O gráfico <strong>de</strong> v(θ) (<strong>de</strong> fato, o gráfico <strong>de</strong> ṽ = v(θ)/lr 2 ) está esboçadona figura abaixo.πv v = lr 2v ( θ)v = θ1201212v = − sen(2 θ )π θNa figura, colocamos na vertical a variável ṽ = vlr, <strong>de</strong> forma que o gráfico fique in<strong>de</strong>pen<strong>de</strong>ntedo raio r e do comprimento l do cilindro. As linhas pontilhadas indicam as duas2funções (θ e − 1 v(θ)2sin 2θ) que somadas produzem a função ṽ(θ) =lr. 2A função ṽ(θ) tem <strong>de</strong>rivada nula em θ = 0 (e por simetria em θ = π), poisev ′ (θ) = 1 − 1 2 · 2 cos2θv ′ (0) = 1 − cos(0) = 0 .Suponha agora que o volume total do cilindro seja da or<strong>de</strong>m <strong>de</strong> 10 litros e que queremosmarcar, no contorno do cilindro, o valor <strong>de</strong> ¯θ correspon<strong>de</strong>nte a um volume <strong>de</strong> água <strong>de</strong> 3litros. Isso correspon<strong>de</strong>, no gráfico, a achar o valor <strong>de</strong> ¯θ para o qual v(¯θ) = 3 (se o volumefor medido em litros).Esse é o problema <strong>de</strong> achar a raiz da função v(θ) − 3. O mesmo procedimento po<strong>de</strong> seradotado para se calcular as marquinhas correspon<strong>de</strong>ntes a outros valores do volume, <strong>de</strong> formaque toda a escala possa ser construída.8.5 CatenáriaMais uma vez, suponhamos uma corrente pendurada em dois pontos <strong>de</strong> sustentação. Seuformato, como já dissemos, é o do gráfico da funçãof(x) = 1 (cosh(cx) − 1) ,c<strong>de</strong>s<strong>de</strong> que a origem do plano cartesiano coincida com o ponto <strong>de</strong> mínimo da curva.


96CAPÍTULO 8. ZEROS DE FUNÇÕES E O MÉTODO DA DICOTOMIANa Subseção 4.3.2 propusemos uma maneira <strong>de</strong> achar o parâmetro c experimentalmente,através <strong>de</strong> um ajuste <strong>de</strong> funções, no caso não linear. Aqui veremos que, a partir da posição <strong>de</strong>um único ponto da corrente (excetuando o ponto <strong>de</strong> mínimo), po<strong>de</strong>mos achar o parâmetro c.Para tanto, reduziremos o problema a achar o zero <strong>de</strong> uma função cuja variável é o parâmetroc.Suponha que a corrente passa por um certo ponto (x 0 , y 0 ) ≠ (0, 0). Isso significa queEntãoy 0 = f(x 0 ) = 1 c (cosh(cx 0) − 1) .cosh(cx 0 ) − cy 0 − 1 = 0 ,isto é, o parâmetro c é, necessariamente, um zero da funçãoF(c) = cosh(cx 0 ) − cy 0 − 1 .Graficamente, po<strong>de</strong>mos pensar também que c é o cruzamento do gráfico <strong>de</strong> cosh(cx 0 )com o gráfico da função afim 1 + cy 0 . Da convexida<strong>de</strong> do cosseno hiperbólico segue que háapenas dois pontos on<strong>de</strong> as funções coinci<strong>de</strong>m, e um <strong>de</strong>les é c = 0. Como c não po<strong>de</strong> serzero (pois aparece no <strong>de</strong>nominador, na expressão da função f), então c fica completamente<strong>de</strong>terminado uma vez dado (x 0 , y 0 ).Para calcular c explicitamente, no entanto, é necessário algum método numérico.8.6 Método da DicotomiaNesta Seção apresentaremos o Método da Dicotomia, que é um método intuitivo <strong>de</strong> se achara raiz <strong>de</strong> uma função. Métodos mais sofisticados serão estudados nos próximos Capítulos.O primeiro passo é isolar a raiz x ∗ <strong>de</strong>ntro <strong>de</strong> um intervalo on<strong>de</strong> a função seja monótona:ou crescente ou <strong>de</strong>crescente. Sejam a 0 e b 0 os extremos <strong>de</strong>sse intervalo.Observamos então que a função assume valores com sinaisopostos nesses extremos, isto é,ff(a 0 ) · f(b 0 ) < 0 .No <strong>de</strong>senho ao lado, f(a 0 ) < 0 e f(b 0 ) > 0. Seria aocontrário se no <strong>de</strong>senho a função fosse <strong>de</strong>crescente. Esseprimeiro passo <strong>de</strong>pen<strong>de</strong> muito do conhecimento prévio quese tem a respeito da função.x * b 0Em seguida passamos a cercar a raiz com intervalos, cada intervalo com um tamanhoigual à meta<strong>de</strong> do tamanho do intervalo anterior.Para ilustrar o método, usemos a função f(x) = x 3 − 20. Observe que achar x ∗ tal quef(x ∗ ) = 0 é o mesmo que achar a raiz cúbica <strong>de</strong> 20.1. Escolhemos a 0 = 2, pois 2 3 − 20 < 0 e b 0 = 3, pois 3 3 − 20 > 0.2. Escolhemos o ponto médio do intervalo, ao qual chamaremos provisoriamente <strong>de</strong> c 0 :c 0 = a 0 + b 02.a 0


8.6.MÉTODO DA DICOTOMIA 97Neste caso, c 0 = 2.5.3. Testamos o valor <strong>de</strong> f em c 0 :f(c 0 ) = f(2.5) = 2.5 3 − 20 = −4.375 < 0 .Concluímos que x ∗ está à direita <strong>de</strong> c 0 , o que nos faz <strong>de</strong>finir o novo intervalo[a 1 , b 1 ] = [c 0 , b 0 ] .4. Repetimos o procedimento 2), agora com o intervalo [a 1 , b 1 ], ou seja, calculamos o pontomédioc 1 = a 1 + b 1= 2.75 .25. Avaliamos f em c 1 :f(c 1 ) = f(2.75) = 2.75 3 − 20 = 0.796875 > 0 .Concluímos que x ∗ está à esquerda <strong>de</strong> c 1 , o que nos faz <strong>de</strong>finir o novo intervalo[a 2 , b 2 ] = [a 1 , c 1 ] .Prosseguindo, colocamos os dados numa tabela, indo até a décima etapa:n a n b n c n r n ± e n rn30 2 3 2.5 2.5 ± 0.5 15.61 2.5 3 2.75 2.75 ± 0.25 20.82 2.5 2.75 2.625 2.63 ± 0.13 18.23 2.625 2.75 2.6875 2.69 ± 0.07 19.54 2.6875 2.75 2.71875 2.72 ± 0.04 20.125 2.6875 2.71875 2.703125 2.703 ± 0.016 19.756 2.703125 2.71875 2.7109375 2.711 ± 0.008 19.937 2.7109375 2.71875 2.71484375 2.715 ± 0.005 20.0138 2.7109375 2.71484375 2.712890625 2.7129 ± 0.0020 19.9669 2.712890625 2.71484375 2.713867188 2.7139 ± 0.0011 19.98910 2.713867188 2.71484375 2.714355469 2.7144 ± 0.0006 19.9996Na tabela, calculamos os extremos e centros dos intervalos usando todas as casas <strong>de</strong>cimaisdisponíveis na calculadora. No entanto em cada etapa só sabemos com certeza que a raizestá entre a n e b n , portanto o erro em assumi-la com o valor <strong>de</strong> c n éb n − a n2.Os valores <strong>de</strong> r n são arredondamentos <strong>de</strong> c n até uma certa casa <strong>de</strong>cimal, com um erro e ngarantindo que a raiz esteja entre r n − e n e r n + e n .O critério para a <strong>de</strong>terminação <strong>de</strong> r n e e n foi o seguinte. Primeiro <strong>de</strong>terminou-se o erro12 (b n −a n ), com todas as casas <strong>de</strong>cimais possíveis. De posse <strong>de</strong>sse valor, escolheu-se o número


98CAPÍTULO 8. ZEROS DE FUNÇÕES E O MÉTODO DA DICOTOMIA<strong>de</strong> algarismos significativos para expressar e n , 1 ou 2. O critério <strong>de</strong>ssa escolha baseou-se numcerto grau <strong>de</strong> “razoabilida<strong>de</strong>”, <strong>de</strong> forma que: (i) o primeiro ou os dois primeiros algarismossignificativos <strong>de</strong> e n sejam uma <strong>de</strong>ntre as possibilida<strong>de</strong>s 10, 11, 12, 13, 14, 15, . . ., 24, 25, 3, 4,5, 6, 7, 8 e 9; (ii) tomando r n como o arredondamento <strong>de</strong> c n na casa <strong>de</strong>cimal correspon<strong>de</strong>nteà última casa <strong>de</strong>cimal <strong>de</strong> e n , o intervalo [r n − e n , r n + e n ] contenha o intervalo [a n , b n ]; (iii)e n seja o menor possível.Por exemplo, para n = 4 temos 1 2 (b 4 − a 4 ) = 0.03125, então tomamos e 4 = 0.04 (nãopo<strong>de</strong>mos usar 0.03, senão a condição (ii) po<strong>de</strong> não ser satisfeita). Em seguida arredondamosc 4 = 2.71875 na segunda casa <strong>de</strong>cimal, obtendo r 4 = 2.72. É preciso aí testar a condição(iii): 2.72 − 0.04 = 2.68 < a 4 e 2.72 + 0.04 = 2.76 > b 4 , tudo bem. Se essa condição nãofosse satisfeita, e n teria que ser ligeiramente aumentado, respeitando (i), (ii) e (iii) ao mesmotempo.


Capítulo 9Métodos iterativos9.1 Plano geralNeste Capítulo discutiremos a <strong>de</strong>terminação <strong>de</strong> zeros <strong>de</strong> funções por meio <strong>de</strong> métodos iterativos.Os métodos iterativos (não são interativos, atenção!) são realizados da seguintemaneira.1. Dada a função f da qual se procura uma raiz x ∗ , “fabrica-se” uma função auxiliar ϕ(quais características ela <strong>de</strong>ve ter e como achá-la, veremos aos poucos).2. Arrisca-se um “palpite” inicial x 0 , e a partir <strong>de</strong>sse palpite constrói-se uma seqüência<strong>de</strong> valores x 0 , x 1 , x 2 , . . ., on<strong>de</strong> o valor x k+1 <strong>de</strong>pen<strong>de</strong> do valor x k pela relaçãox k+1 = ϕ(x k ) .3. Se a escolha <strong>de</strong> ϕ e <strong>de</strong> x 0 for feita com algum critério, espera-se que a seqüência {x k } kconvirja para x ∗ , como mostra esquematicamente a figura abaixo.4. Com algum critério <strong>de</strong> parada, em função da precisão que se <strong>de</strong>seja na resposta, toma-seum dos x k ’s como aproximação <strong>de</strong> x ∗ .f01010 0 1x*10x 1 x 2 x 3 0 11x 00101010199


100CAPÍTULO 9. MÉTODOS ITERATIVOS9.2 Pontos fixosA primeira observação pertinente a respeito do plano geral traçado acima é sobre o tipo <strong>de</strong>ponto que <strong>de</strong>ve ser x ∗ , em relação à aplicação ϕ (em relação à função f já sabemos: x ∗ éuma raiz <strong>de</strong> f). Supondo que, no mínimo, ϕ seja uma função contínua, notamos que, se x kten<strong>de</strong> a x ∗ , então ϕ(x k ) <strong>de</strong>ve ten<strong>de</strong>r a ϕ(x ∗ ) (é a <strong>de</strong>finição <strong>de</strong> função contínua, pense nisso!).Por outro lado tem-se que ϕ(x k ) = x k+1 , então a seqüência ϕ(x k ) é a própria seqüênciados x k , adiantada no índice k <strong>de</strong> uma unida<strong>de</strong>. Como ϕ(x k ) ten<strong>de</strong> a ϕ(x ∗ ), então x k ten<strong>de</strong>a ϕ(x ∗ ). Ora, mas se x k ten<strong>de</strong> ao mesmo tempo para x ∗ e para ϕ(x ∗ ), a conclusão é que x ∗e ϕ(x ∗ ) têm que ser iguais!Para resumir, uma condição necessária para que o plano geral <strong>de</strong> achar a raiz x ∗ <strong>de</strong> f poriteração <strong>de</strong> uma função ϕ funcione é que, no mínimo, valhaϕ(x ∗ ) = x ∗ .Esta condição, no entanto, não é suficiente para que o plano dê certo, como veremos maisadiante.Todo ponto x para o qual se tenha ϕ(x) = x é chamado <strong>de</strong> ponto fixo da função ϕ. O queacabamos <strong>de</strong> concluir é que a função auxiliar ϕ <strong>de</strong>ve ter a raiz x ∗ <strong>de</strong> f como ponto fixo.Um ponto fixo da função ϕ é localizado pelo cruzamento do gráfico <strong>de</strong> y = ϕ(x) com ográfico <strong>de</strong> y = x, a diagonal, ao contrário das raízes <strong>de</strong> f, que são localizadas pelo cruzamentodo gráfico <strong>de</strong> f com a abscissa (y = 0). Na figura abaixo, por exemplo, a função ϕ esboçadatem 2 pontos fixos (suas quatro raízes não nos interessam).ϕ01010101Exercício 9.1 Determine os pontos fixos (se houver) <strong>de</strong> ϕ(x) = x 2 − x + 0.5. Esboce ográfico <strong>de</strong> ϕ. Construa a seqüência <strong>de</strong> iterados x k+1 = ϕ(x k ) a partir <strong>de</strong> x 0 = 0. A seqüênciaconverge? Se converge, converge para algum ponto fixo? Faça o mesmo para x 0 = 2, e <strong>de</strong>poispara x 0 = 1.5.Exercícios <strong>de</strong> iteração ficam bem mais fáceis com uma boa calculadora científica. Algumasvezes é preciso iterar bastante, por isso convém reduzir ao máximo o número <strong>de</strong> operaçõesna máquina em cada etapa. Em algumas calculadoras, existe uma variável <strong>de</strong> memória queguarda a resposta do último cálculo. Às vezes essa variável po<strong>de</strong> ser colocada na fórmula


9.3.FUNÇÕES AUXILIARES CANDIDATAS 101completa. Por exemplo, em algumas calculadoras CASIO essa variável chama-se “Ans”.Proce<strong>de</strong>-se assim, para x 0 = 1.5 e ϕ(x) = x 2 − x + 0.5: (i) escreve-se 1.5 e aperta-se “EXE”,fazendo com que 1.5 seja armazenado em “Ans”; (ii) escreve-se “Ans 2 − Ans + 0.5”, apertase“EXE” e aparece a resposta 1.25, que é o x 1 (e esta resposta é armazenada em “Ans”,substituindo o valor anterior); (iii) apertando “EXE” novamente a calculadora fará a mesmaconta, só que a partir do novo valor <strong>de</strong> “Ans”, que é o x 1 , assim aparecerá o valor <strong>de</strong> x 2 ; (iv)a partir daí é só ir apertando “EXE” que vão aparecendo os x k ’s, em seqüência.Se a calculadora não dispuser <strong>de</strong>sses recursos, mesmo assim ela <strong>de</strong>ve ter maneiras <strong>de</strong>armazenar valores em memória. Guar<strong>de</strong> o resultado x k na memória e procure usá-la na hora<strong>de</strong> calcular x k+1 . Calculadoras que permitem colocar a fórmula inteira antes <strong>de</strong> fazer a contasão as melhores para isso.Há também, é claro, a possibilida<strong>de</strong> <strong>de</strong> se fazer um pequeno programa em computadorpara realizar essas contas. Qualquer linguagem que li<strong>de</strong> facilmente com números reais servepara isso.Exercício 9.2 Tome ϕ(x) = 3.1x(1 − x) e x 0 = 0.3. O que acontece com a seqüência <strong>de</strong>iterados?Exercício 9.3 Tome ϕ(x) = 4x(1 − x) e x 0 = 0.3. O que acontece com a seqüência <strong>de</strong>iterados?9.3 Funções auxiliares candidatasÉ natural nos questionarmos se po<strong>de</strong>mos achar uma função ϕ tal que ϕ(x ∗ ) = x ∗ se nãoconhecemos exatamente x ∗ , afinal estamos <strong>de</strong>senvolvendo um método cuja finalida<strong>de</strong> últimaé justamente achar x ∗ ! Acontece que por um pequeno truque isto é perfeitamente possível,e <strong>de</strong> maneira surpreen<strong>de</strong>ntemente simples!Para começar, tome a função f(x) e adicione a ela a função i<strong>de</strong>ntida<strong>de</strong>, isto é, <strong>de</strong>finaNote que se x ∗ for uma raiz <strong>de</strong> f entãoϕ(x) = x + f(x) .ϕ(x ∗ ) = x ∗ + f(x ∗ ) = x ∗ ,isto é, x ∗ é um ponto fixo <strong>de</strong> ϕ. Inversamente, se x ∗ for um ponto fixo <strong>de</strong> ϕ então x ∗ serátambém uma raiz <strong>de</strong> f. Em conclusão, se ϕ for <strong>de</strong>finida <strong>de</strong>ssa maneira então as raízes <strong>de</strong> fcoincidirão exatamente com os pontos fixos <strong>de</strong> ϕ!O mesmo acontecerá se <strong>de</strong>finirmosϕ(x) = x + αf(x) ,on<strong>de</strong> α é um número real qualquer, ou mesmoon<strong>de</strong> α(x) é uma função (contínua) qualquer.ϕ(x) = x + α(x)f(x) ,


102CAPÍTULO 9. MÉTODOS ITERATIVOSComo não <strong>de</strong>vemos nunca dispensar um <strong>de</strong>senho,em tudo o que fazemos na matemática,vejamos como po<strong>de</strong>mos esboçar ϕ(x) = x +αf(x) diretamente a partir do esboço dográfico da função f. Se α for positivo, ao multiplicarmosa função f por α estaremos “encolhendo”(se α < 1) ou “dilatando” (se α > 1)o gráfico na direção vertical. Nas raízes, comoa função vale zero, o efeito é nulo. Se α for negativoo gráfico será, além disso, refletido emtorno da abscissa. Depois <strong>de</strong>ssa multiplicaçãotemos apenas que “somar” o gráfico resultanteà diagonal. Na figura ao lado esboçamos o processocom α igual a − 1 2 .f(x)ϕ(x) = x2 1 f(x)2 1 f(x)Exercício 9.4 Consi<strong>de</strong>re f(x) = sen(x) (não se esqueça, x em radianos!). Esboce o gráfico<strong>de</strong> ϕ(x) = x + f(x). Esboce também o gráfico <strong>de</strong> ψ(x) = x − 1 2f(x). Itere ϕ e ψ a partir dacondição inicial x = 1 e compare os resultados.9.4 Visualizando iteraçõesÉ importante se ter noção visual do processo <strong>de</strong> iteração <strong>de</strong> uma função ϕ, e para issoveremos como fazer iterações usando apenas o esboço da função. Obviamente haverá umacúmulo <strong>de</strong> erro quando fizermos iterações sucessivas, mas os <strong>de</strong>senhos nos ajudarão a melhorcompreen<strong>de</strong>r os diversos tipos <strong>de</strong> comportamentos presentes nos métodos iterativos.


9.4. VISUALIZANDO ITERAÇÕES 103A primeira coisa que <strong>de</strong>vemos fazer é <strong>de</strong>senharo gráfico da função, e em seguida a diagonal,que nos auxiliará. Depois escolhemosuma condição inicial x 0 (é apenas um ponto daabscissa), e o objetivo é encontrar a posição,na abscissa, <strong>de</strong> x 1 = ϕ(x 0 ). Movendo-nos verticalmente,encontraremos o gráfico <strong>de</strong> ϕ, naposição (x 0 , ϕ(x 0 )). Como ϕ(x 0 ) = x 1 , este éo ponto (x 0 , x 1 ), ou seja, já encontramos x 1 ,mas ele é a segunda coor<strong>de</strong>nada do ponto encontrado.Nosso objetivo, no entanto, é encontraro ponto da abscissa (x 1 , 0).(x 1 , 0)(x 1 , x 1 )(x 0 , 0)(x 0 , x 1 )ϕ(x)Então movemo-nos horizontalmente, isto é, mantendo fixa a segunda coor<strong>de</strong>nada, a partir<strong>de</strong> (x 0 , x 1 ) até encontrar a diagonal. Na diagonal, os valores da primeira e da segundacoor<strong>de</strong>nada são iguais; como a segunda foi mantida sempre igual a x 1 , então esse ponto será(x 1 , x 1 ), e com um movimento vertical <strong>de</strong>terminamos x 1 sobre a abscissa.Para a <strong>de</strong>terminação <strong>de</strong> x 2 o procedimento é análogo: movimento vertical até encontraro gráfico, <strong>de</strong>pois movimento horizontal até encontrar a diagonal e finalmente movimentovertical até encontrar a abscissa. E assim por diante!Observe que po<strong>de</strong>mos poupar um pouco <strong>de</strong> trabalho quando fazemos uma série <strong>de</strong> iteraçõessucessivas. De x 0 vamos verticalmente até o gráfico (à altura x 1 ), <strong>de</strong>pois horizontalmente atéa diagonal (à posição horizontal x 1 ). Depois, <strong>de</strong> acordo com o que foi <strong>de</strong>scrito acima, iríamosverticalmente até a abscissa (à altura zero) e então verticalmente até o gráfico (à alturax 2 = ϕ(x 1 )). Ora, a composição <strong>de</strong> dois movimentos verticais ainda é um movimento vertical,que po<strong>de</strong>ria ser feito <strong>de</strong> uma vez só. Ou seja, logo após nos movermos horizontalmenteaté a diagonal, encontrando (x 1 , x 1 ), po<strong>de</strong>mos nos mover verticalmente até o gráfico, encontrando(x 1 , x 2 ). Em seguida continuamos, indo horizontalmente até a diagonal, no ponto(x 2 , x 2 ), e <strong>de</strong>pois verticalmente até o gráfico, no ponto (x 2 , x 3 ), e assim por diante. Coletandoas primeiras coor<strong>de</strong>nadas <strong>de</strong> cada ponto <strong>de</strong> encontro com o gráfico, teremos a seqüência <strong>de</strong>iterados a partir <strong>de</strong> x 0 . Veja na figura abaixo uma ilustração <strong>de</strong>sse procedimento.


104CAPÍTULO 9. MÉTODOS ITERATIVOSϕ(x)x 4x 3x 2x 1x 0Exercício 9.5 Faça um esboço <strong>de</strong> ϕ = 2x(1 − x) e itere a partir das seguintes condiçõesiniciais: (i)x 0 = −0.5; (ii) x 0 = 0.0; (iii) x 0 = 0.25; (iv) x 0 = 0.5; (v) x 0 = 0.75; (vi)x 0 = 1.0; (vii) x 0 = 1.25. O que acontece com cada seqüência <strong>de</strong> iterados? Converge, nãoconverge? Dá para inferir o que acontecerá com o restante das condições iniciais?Exercício 9.6 Como se explica um ponto fixo no procedimento acima?Exercício 9.7 Se a regra fosse “verticalmente até a diagonal e horizontalmente até ográfico”, o procedimento estaria bem <strong>de</strong>finido? A regra seria clara?Exercício 9.8 Uma pré-imagem <strong>de</strong> um ponto y pela função ϕ é um ponto x tal que ϕ(x) = y.Muitas vezes um ponto tem mais do que uma pré-imagem. Usando um gráfico <strong>de</strong> ϕ, inventeum método rápido para achar todas as pré-imagens <strong>de</strong> um ponto dado (suponha que o pontodado foi indicado sobre a abscissa).9.5 Iterando perto <strong>de</strong> pontos fixosVejamos agora, através <strong>de</strong> esboços, o que acontece com a seqüência <strong>de</strong> iterados quando acondição inicial está próxima <strong>de</strong> um ponto fixo. A pergunta a ser respondida é: será queela converge para esse ponto fixo? A resposta é <strong>de</strong> suma importância, uma vez que nossoobjetivo é encontrar o ponto fixo por aproximações sucessivas. Sem isso, não teremos condição<strong>de</strong> preencher o terceiro item do nosso plano geral, traçado no começo do Capítulo.Para começar, adotaremos como hipótese que o ponto fixo x ∗ seja isolado, isto é, quenuma vizinhança (pequena) <strong>de</strong> x ∗ não exista nenhum outro ponto fixo. Isto também significaque perto <strong>de</strong> x ∗ o gráfico <strong>de</strong> ϕ só toca a diagonal no próprio x ∗ .


9.5. ITERANDO PERTO DE PONTOS FIXOS 105Na figura ao lado mostramos os ingredientesbásicos <strong>de</strong> que necessitaremos:o gráfico <strong>de</strong> ϕ, próximo a x ∗ ,a diagonal e o que chamaremos <strong>de</strong>diagonal secundária em x ∗ , que é areta <strong>de</strong> inclinação −1 passando por(x ∗ , x ∗ ). Para simplificar, assumiremosque também a diagonal secundária sóseja intersectada pelo gráfico <strong>de</strong> ϕ noponto (x ∗ , x ∗ ). Essas hipóteses não são<strong>de</strong>masiadamente restritivas: é raro encontrarum caso em que elas não sejamrespeitadas.x*Assim, po<strong>de</strong>mos imaginar diversas possibilida<strong>de</strong>s para o gráfico <strong>de</strong> ϕ, <strong>de</strong> acordo com aposição em relação ao cone duplo formado pela diagonal e pela diagonal secundária, comomostra a figura abaixo. Nos diagramas, hachuramos o que queremos convencionar como a“parte interna” do cone, entre as duas diagonais.x*ϕ(a) (b) (c)(e)(d) (f) (g)(h) (i) (j) (l)Nos casos (d), (e), (f) e (g) o gráfico <strong>de</strong> ϕ tangencia a diagonal em x ∗ . Isto tem um


106CAPÍTULO 9. MÉTODOS ITERATIVOSsignificado, se ϕ for uma função diferenciável: ϕ ′ (x ∗ ) = 1, pois basta lembrar que a <strong>de</strong>rivadaé a inclinação da reta tangente ao gráfico. Nos casos (h), (i), (j) e (l) o gráfico <strong>de</strong> ϕ tangenciaa diagonal secundária em x ∗ , ou seja, ϕ ′ (x ∗ ) = −1.No caso (a), a tangente ao gráfico <strong>de</strong> ϕ em x ∗ é uma reta <strong>de</strong> inclinação menor do que 1(pois é menor do que a inclinação da diagonal) e maior do que −1 (ou seja, menos negativado que a inclinação da diagonal secundária). Portanto−1 < ϕ ′ (x ∗ ) < +1no caso (a).No caso (b) temose no caso (c) temosϕ ′ (x ∗ ) < −1ϕ ′ (x ∗ ) > +1 .Em resumo, po<strong>de</strong>mos consi<strong>de</strong>rar 3 possibilida<strong>de</strong>s, <strong>de</strong> acordo com o módulo <strong>de</strong> ϕ ′ (x ∗ ): (i)|ϕ ′ (x ∗ )| < 1, caso (a); (ii) |ϕ ′ (x ∗ )| > 1, casos (b) e (c); (iii) |ϕ ′ (x ∗ )| = 1, casos (d) a (l).Uma espécie <strong>de</strong> recíproca também é válida: sempre que |ϕ ′ (x ∗ )| for menor do que 1 ográfico <strong>de</strong> ϕ na vizinhança <strong>de</strong> x ∗ assumirá o aspecto <strong>de</strong> (a), e sempre que |ϕ ′ (x ∗ )| for maiordo que 1 ele assumirá o aspecto <strong>de</strong> (b) ou (c), <strong>de</strong> acordo com o sinal. No entanto, se |ϕ ′ (x ∗ )|for igual a 1, haverá todas as possibilida<strong>de</strong>s mostradas <strong>de</strong> (d) até (l).Nosso objetivo é fazer uma análise da convergência das seqüências x 0 , x 1 = ϕ(x 0 ), x 2 =ϕ(x 1 ), . . . para o ponto fixo x ∗ , quando x 0 é escolhido perto <strong>de</strong> x ∗ , porém restringiremosnossa argumentação apenas aos casos (a), (b) e (c). A razão é que, primeiramente, algunsdos outros casos po<strong>de</strong>m ser facilmente analisados <strong>de</strong> forma semelhante (e outros não tãofacilmente), como mostram os exercícios propostos abaixo. Além disso, cada caso apresentaráum comportamento distinto: po<strong>de</strong> haver convergência ou não, e em alguns casos a resposta<strong>de</strong>pen<strong>de</strong> até <strong>de</strong> saber se x 0 está à esquerda ou à direita <strong>de</strong> x ∗ !No caso (a) note que, se x k estiver próximo a x ∗ então ϕ(x k ) estará <strong>de</strong>ntro do cone, istoé,x k − x ∗ < ϕ(x k ) − x ∗ < x ∗ − x k , (x k < x ∗ )oux k − x ∗ > ϕ(x k ) − x ∗ > x ∗ − x k , (x k > x ∗ )pois y = x ∗ + (x − x ∗ ) e y = x ∗ − (x − x ∗ ) são as diagonais principal e secundária passandopor x ∗ . Isto é o mesmo que|ϕ(x k ) − x ∗ | < |x k − x ∗ | ,ou seja, x k+1 = ϕ(x k ) está mais perto <strong>de</strong> x ∗ do que está x k . O mesmo valerá <strong>de</strong> x k+1para x k+2 , <strong>de</strong> modo que os iterados x k , x k+1 , . . . se aproximarão cada vez mais <strong>de</strong> x ∗ (vejaexercício abaixo para tornar mais rigoroso este argumento).Outra maneira (mais intuitiva) <strong>de</strong> se chegar à mesma conclusão é esboçando a evoluçãodos iterados no <strong>de</strong>senho, como mostra a figura abaixo, em duas situações: ϕ ′ (x ∗ ) > 0 eϕ ′ (x ∗ ) < 0. Observe pela figura que quando ϕ ′ (x ∗ ) < 0 os iterados x k , x k+1 , . . . se alternamà direita e à esquerda <strong>de</strong> x ∗ , quando estão suficientemente próximos <strong>de</strong> x ∗ .


9.5. ITERANDO PERTO DE PONTOS FIXOS 107x*ϕx*x k x k+1 x k+2 x k+3x*x kϕx*x k+2x k+3 xk+1Nos casos (b) e (c) ocorre o oposto: tem-se|x k+1 − x ∗ | > |x k − x ∗ | ,o que impossibilita a aproximação a x ∗ e, em verda<strong>de</strong>, afasta os iterados <strong>de</strong> x ∗ . Isto po<strong>de</strong>ser visto na figura abaixo.ϕϕx*x*x*x*x k+3 x k+2x kx k+1 x k+2 xk x k+1 x k+3Quando o ponto fixo é tal que a seqüência <strong>de</strong> iterados iniciada em sua proximida<strong>de</strong>converge para ele, dizemos que o ponto fixo é atrator. Se, ao contrário, os iterados se afastam,mesmo que x k esteja arbitrariamente próximo <strong>de</strong> x ∗ , então dizemos que o ponto fixo érepulsor.Da argumentação acima, concluímos que se |ϕ ′ (x ∗ )| < 1 então x ∗ é um ponto fixo atrator,enquanto que se |ϕ ′ (x ∗ )| > 1 então x ∗ é um ponto fixo repulsor. Se |ϕ ′ (x ∗ )| = 1 não é possívelprever o comportamento dos iterados, a não ser que se tenha outras informações sobre ϕ, emgeral ligadas a <strong>de</strong>rivadas <strong>de</strong> or<strong>de</strong>m mais alta. Veja mais sobre isso nos exercícios abaixo.Exercício 9.9 Esboce a função ϕ(x) = ex 4− x e <strong>de</strong>termine seus pontos fixos, dizendo quemé atrator e quem é repulsor apenas através do <strong>de</strong>senho do gráfico.


108CAPÍTULO 9. MÉTODOS ITERATIVOSExercício 9.10 Consi<strong>de</strong>re a equação e −x = x − 1. Investigue se ϕ(x) = e −x + 1 po<strong>de</strong> serútil para achar a solução. Ache-a.Exercício 9.11 Este exercício é um conjunto <strong>de</strong> “observações dirigidas” a respeito doscasos não discutidos, on<strong>de</strong> a <strong>de</strong>rivada <strong>de</strong> ϕ no ponto fixo tem módulo 1. O leitor <strong>de</strong>ve tentarse convencer ao máximo <strong>de</strong> cada uma <strong>de</strong>las, usando <strong>de</strong>senhos, principalmente. O exercícioajudará a fixar melhor a teoria discutida nesta Seção.1. Nos casos (e) e (i) o ponto fixo é atrator.2. Nos casos (g) e (l) o ponto fixo é repulsor.3. Nos casos (e), (i), (g) e (l) a segunda <strong>de</strong>rivada <strong>de</strong> ϕ é nula. A terceira <strong>de</strong>rivada nãopo<strong>de</strong> ser negativa em (i) e em (g), e não po<strong>de</strong> ser positiva em (e) e (l).4. A segunda <strong>de</strong>rivada não po<strong>de</strong> ser negativa em (d) e (h), e não po<strong>de</strong> ser positiva em (f)e (j).5. No caso (d), o ponto fixo é atrator pelo lado esquerdo e repulsor pelo lado direito. Jáem (f) ele é atrator pelo lado direito e repulsor pelo esquerdo.6. Os casos (h) e (j) são os mais <strong>de</strong>licados. Há alternância <strong>de</strong> lado na iteração, poisa <strong>de</strong>rivada é negativa. Olhando para o caso (h), há aproximação para o ponto fixo acada vez que se passa pelo lado direito e afastamento a cada vez que se passa pelo ladoesquerdo, e não é claro a priori qual vai prevalecer (no caso (j) ocorre o oposto). Tentefazer <strong>de</strong>senhos caprichados criando casos on<strong>de</strong> há atração e outros on<strong>de</strong> há repulsão,sempre no caso (h), e <strong>de</strong>pois tente o mesmo para o caso (j).Exercício 9.12 Este exercício é opcional, para aqueles que gostam <strong>de</strong> um pouco mais <strong>de</strong>rigor nos argumentos. Observamos que no caso (a) ocorre |x k+1 − x ∗ | < |x k − x ∗ |, o queimplicaria que a seqûência |x k − x ∗ | vai a zero (equivalente a dizer que x k ten<strong>de</strong> a x ∗ ). Issono entanto não tem que ser necessariamente verda<strong>de</strong>, quer dizer, nem toda seqüência em quecada termo é menor do que seu pre<strong>de</strong>cessor vai a zero. Por exemplo, a seqüência 1 + 1 k , queten<strong>de</strong> a 1 e é <strong>de</strong>crescente. No entanto, se usarmos as hipóteses estabelecidas <strong>de</strong> início, issoserá verda<strong>de</strong>. Para isso, verifique as seguintes observações:1. Se a seqüência for monótona, isto é, ficar só do lado direito ou só do lado esquerdo, ese |x k − x ∗ | não for a zero, então a seqüência tem que convergir para um outro pontoˆx que não é x ∗ .2. Pelo que vimos na Seção 9.2, o ponto ˆx teria que ser um outro ponto fixo <strong>de</strong> x ∗ , masnós já tínhamos isolado uma vizinhança <strong>de</strong> x ∗ sem nenhum outro ponto fixo. Entãoesta situação não po<strong>de</strong> ocorrer.3. Já se a seqüência não for monótona, po<strong>de</strong> acontecer também <strong>de</strong> que |x k −x ∗ | tenda paraum valor maior do que zero, e x k fique alternando <strong>de</strong> lado, ten<strong>de</strong>ndo para dois pontossimetricamente posicionados em torno <strong>de</strong> x ∗ . Mostre que nesses pontos o gráfico <strong>de</strong> ϕtocaria a diagonal secundária, contradizendo também as hipóteses.


9.6. TEOREMA DO VALOR MÉDIO E VELOCIDADE DE CONVERGÊNCIA 1099.6 Teorema do Valor Médio e velocida<strong>de</strong> <strong>de</strong> convergênciaA Seção anterior po<strong>de</strong> ser resumida na seguinte afirmação: “se x ∗ é ponto fixo e se |ϕ ′ (x ∗ )| 1 então x ∗ é repulsor”.Vamos <strong>de</strong>monstrar essa afirmação <strong>de</strong> maneira mais simples, sem usar o <strong>de</strong>senho, usandoo Teorema do Valor Médio. A <strong>de</strong>monstração também nos ajudará a saber qual é a velocida<strong>de</strong><strong>de</strong> convergência no caso <strong>de</strong> o ponto fixo ser atrator. A única hipótese adicional será que a<strong>de</strong>rivada <strong>de</strong> ϕ é uma função contínua, hipótese que se verifica na maioria dos casos.Chamemos <strong>de</strong> γ a <strong>de</strong>rivada <strong>de</strong> ϕ em x ∗ . Como a <strong>de</strong>rivada <strong>de</strong> ϕ é uma função contínua,ela <strong>de</strong>ve assumir valores próximos <strong>de</strong> γ perto <strong>de</strong> x ∗ . Em outras palavras, po<strong>de</strong>mos isolaruma vizinhança <strong>de</strong> x ∗ , <strong>de</strong> preferência simétrica, <strong>de</strong> tal forma que para qualquer x escolhido<strong>de</strong>ntro <strong>de</strong>ssa vizinhança ter-se-á|ϕ ′ (x) − γ|muito pequeno.Suponha agora que γ é um número <strong>de</strong> módulo menor do que 1 (é o caso em que queremosmostrar que x ∗ é um atrator). Então, po<strong>de</strong>mos encontrar uma vizinhança <strong>de</strong> x ∗ em que|ϕ ′ (x) − γ| seja tão pequena que também |ϕ ′ (x)| seja menor do que 1, ou mesmo menor doque um certo λ também menor do que 1, para todo x na vizinhança.Nosso interesse é comparar |x k+1 − x ∗ | com |x k − x ∗ |. Como x k+1 = ϕ(x k ) e x ∗ = ϕ(x ∗ )então queremos comparar |ϕ(x k ) − ϕ(x ∗ )| com |x k − x ∗ |. Ora, isso tem toda a “cara” <strong>de</strong>Teorema do Valor Médio, poisϕ(x k ) − ϕ(x ∗ ) = ϕ ′ (c k )(x k − x ∗ ) ,para algum número c k entre x k e x ∗ . Se x k estiver na vizinhança acima referida, então c ktambém estará, e teremos |ϕ ′ (c k )| menor do que λ. Logo|ϕ(x k ) − ϕ(x ∗ )| ≤ λ|x k − x ∗ | .Então a cada iteração a distância <strong>de</strong> x k a x ∗ é multiplicada por um número menor doque λ, o que caracteriza uma convergência (ao menos) geométrica (lembre-se <strong>de</strong> uma P.G. <strong>de</strong>razão menor do que 1).O importante <strong>de</strong> se escolher uma vizinhança simétrica em torno do ponto fixo é que issogarante que o ponto x k+1 cairá ainda <strong>de</strong>ntro da mesma vizinhança, e o argumento po<strong>de</strong>ráser repetido ad infinitum. Logo adiante (na Subseção 9.8) falaremos um pouco mais sobreeste assunto.Observe também que a mesma igualda<strong>de</strong> do Teorema do Valor Médio mostra que, àmedida que os iterados se aproximam do ponto fixo, a razão entre |x k+1 − x ∗ | e |x k − x ∗ | seaproxima <strong>de</strong> |γ| = |ϕ ′ (x ∗ )|. Pois comoϕ ′ (c k ) = x k+1 − x ∗x k − x ∗ ,e c k , estando “espremido” entre x ∗ e x k , também se aproxima <strong>de</strong> x ∗ , então ϕ ′ (c k ) se aproxima<strong>de</strong> ϕ ′ (x ∗ ), por causa da continuida<strong>de</strong> da <strong>de</strong>rivada.Exercício 9.13 Observe que se |ϕ ′ (x ∗ )| > 1 então o Teorema do Valor Médio implica quenão po<strong>de</strong> haver convergência para o ponto fixo.


110CAPÍTULO 9. MÉTODOS ITERATIVOSExercício 9.14 Tome a função ϕ(x) = ex 4 − x. Iterando a partir <strong>de</strong> x 0 = 0, ache seu pontofixo x ∗ mais à esquerda, mas guar<strong>de</strong> os iterados. Calcule ϕ ′ (x ∗ ) e compare com as razõesx k+1 − x ∗x k − x ∗ .Exercício 9.15 Este exercício é para transformar a informação sobre a velocida<strong>de</strong> <strong>de</strong> convergênciaem informação sobre o tempo <strong>de</strong> convergência. O exercício fornecerá apenas umaresposta aproximada, baseada em suposições que nem sempre são satisfeitas. Suponha quea distância da condição inicial x 0 ao ponto fixo x ∗ seja da or<strong>de</strong>m <strong>de</strong> D. Suponha tambémque a condição inicial esteja numa vizinhança do ponto fixo on<strong>de</strong> a função é aproximadamentelinear, com inclinação dada pela <strong>de</strong>rivada <strong>de</strong> ϕ no ponto fixo, o que significa que ataxa geométrica <strong>de</strong> aproximação é mais ou menos constante. Calcule o número <strong>de</strong> iteraçõesk necessárias para que x k esteja mais perto do que a distância p <strong>de</strong> x ∗ .Exercício 9.16 É possível existir uma função contínua ϕ que tenha apenas dois pontosfixos, ambos atratores? Justifique sua resposta.9.6.1 O caso ϕ ′ (x ∗ ) = 0: convergência quadráticaNo caso em que ϕ ′ (x ∗ ) = 0 a razão entre |x k+1 − x ∗ | e |x k − x ∗ | se aproxima <strong>de</strong> zero, o quesignifica que a taxa <strong>de</strong> convergência é melhor do que qualquer razão geométrica. Po<strong>de</strong>mos irmais além no Teorema do Valor Médio, aplicando-o novamente <strong>de</strong>sta feita na <strong>de</strong>rivada <strong>de</strong> ϕ,e obter uma informação mais precisa sobre a taxa <strong>de</strong> convergência.Para aplicar o Teorema do Valor Médio na <strong>de</strong>rivada <strong>de</strong> ϕ assumiremos que ϕ seja duasvezes diferenciável. Depois acrescentaremos a hipótese <strong>de</strong> que essa segunda <strong>de</strong>rivada tambémseja contínua.Retomando a <strong>de</strong>sigualda<strong>de</strong> obtida no Teorema do Valor Médio, temosx k+1 − x ∗ = ϕ ′ (c k )(x k − x ∗ ) .Mas se ϕ ′ (x ∗ ) = 0 então po<strong>de</strong>mos usar o Teorema do Valor Médio. Existe d k entre c k e x ∗tal queϕ ′ (c k ) = ϕ ′ (c k ) − ϕ ′ (x ∗ ) = ϕ ′′ (d k )(c k − x ∗ ) .Portanto|x k+1 − x ∗ | = |ϕ ′′ (d k )| · |c k − x ∗ | · |x k − x ∗ | .Como c k está entre x k e x ∗ , então |c k − x ∗ | ≤ |x k − x ∗ |; além disso, supondo que ϕ ′′ sejacontínua, os valores <strong>de</strong> ϕ ′′ (d k ) estarão muito próximos <strong>de</strong> ϕ ′′ (x ∗ ), e portanto estarão limitadospor uma constante C, em módulo. Então, se x k estiver nessa vizinhança, ter-se-á|x k+1 − x ∗ | ≤ C|x k − x ∗ | 2 ,que motiva a <strong>de</strong>finir o regime <strong>de</strong> convergência com o nome <strong>de</strong> convergência quadrática.Um ponto fixo com <strong>de</strong>rivada nula é também chamado <strong>de</strong> super-atrator, por causa darapi<strong>de</strong>z com que se dá a convergência.


9.7. CALCULANDO ZEROS DE FUNÇÕES - A ESCOLHA DE ϕ 111Exercício 9.17 Chame <strong>de</strong> a 0 a distância <strong>de</strong> x 0 ao super-atrator x ∗ , e <strong>de</strong> a k a distância<strong>de</strong> x k a x ∗ . Suponha que em todos os iterados vale a estimativa <strong>de</strong> convergência quadrática,com constante C. Mostre quea k ≤ 1 C (Ca 0) 2k ,e que para se aproximar x k <strong>de</strong> x ∗ da distância p são necessárias1 lnCplnln 2 lnCa 0iterações. Compare com a convergência geométrica.Exercício 9.18 Itere ϕ(x) = x + sen x e ψ(x) = x + 1 2sen x, a partir da condição inicialx 0 = 1, e compare as velocida<strong>de</strong>s <strong>de</strong> convergência, à luz do que foi exposto acima.9.7 Calculando zeros <strong>de</strong> funções - a escolha <strong>de</strong> ϕPo<strong>de</strong>mos neste momento retornar ao plano geral traçado no começo do Capítulo para acharuma raiz x ∗ <strong>de</strong> uma função f, pois já temos todos os ingredientes para isso: uma maneira<strong>de</strong> se construir funções ϕ que tenham x ∗ como ponto fixo, por exemplo, escrevendo ϕ(x) =x + αf(x); e critérios para saber se o ponto fixo x ∗ é atrator ou não.Nosso objetivo é explorar a escolha <strong>de</strong> α na expressão ϕ(x) = x + αf(x) <strong>de</strong> modo que araiz procurada x ∗ seja um atrator e o plano geral funcione.De acordo com o que dissemos, é preciso que a <strong>de</strong>rivada ϕ ′ (x ∗ ) tenha módulo menor doque 1. A <strong>de</strong>rivada <strong>de</strong> ϕ sabemos calcular, em função da <strong>de</strong>rivada da f:ϕ ′ (x) = 1 + αf ′ (x) ,Observe que se f ′ (x ∗ ) for igual a zero então ϕ ′ (x ∗ ) será igual a 1, e aí não po<strong>de</strong>remossaber se há convergência ou não. Na verda<strong>de</strong> po<strong>de</strong>mos saber sim, se <strong>de</strong>senharmos o gráfico<strong>de</strong> ϕ.Por exemplo, tome afunção f(x) = (x − 1) 2 ,que tem raiz x ∗ = 1. Essaraiz é ponto fixo <strong>de</strong> ϕ(x) =x + 0.1f(x) = x + 0.1(x −1) 2 , como mostra a figuraao lado. Sabemos que seiniciarmos a iteração comx 0 perto e à esquerda <strong>de</strong> 1,então a seqüência convergirápara o ponto fixo.f(x) = x + 0.1(x−1) 21Ocorre no entanto que nos casos on<strong>de</strong> a <strong>de</strong>rivada é 1, mesmo havendo convergência ela sedá <strong>de</strong> forma muito lenta, que não chega nem a ser geométrica. Mais adiante veremos comosuperar este problema.


112CAPÍTULO 9. MÉTODOS ITERATIVOSConsi<strong>de</strong>remos então o caso f ′ (x ∗ ) ≠ 0. Ora, pedir que |ϕ ′ (x ∗ )| seja menor do que 1 é omesmo que pedir que−1 < 1 + αf ′ (x ∗ ) < +1 .Ou seja α <strong>de</strong>ve estar entre 0 e − 2f ′ (x ∗ ) .Exercício 9.19 Verifique o intervalo <strong>de</strong> escolhas possíveis <strong>de</strong> α para se calcular a raiz x ∗ = π<strong>de</strong> f(x) = senx usando a função <strong>de</strong> iteração ϕ(x) = x + α sen x. Confira a resposta usando<strong>de</strong>senhos.Notemos agora que, apesar <strong>de</strong> haver todo um intervalo <strong>de</strong> possíveis escolhas <strong>de</strong> α, háuma escolha preferencial, que faz com que a <strong>de</strong>rivada <strong>de</strong> ϕ no ponto fixo seja nula e ele sejasuper-atrator. É só escolher α <strong>de</strong> modo que 1 + αf ′ (x ∗ ) seja igual a zero, isto é,α = − 1f ′ (x ∗ ) .Essa escolha <strong>de</strong> α garantiria convergência rápida, mas o leitor atento po<strong>de</strong> perguntar:como escolher α em função <strong>de</strong> f ′ (x ∗ ) se para saber f ′ (x ∗ ) precisamos conhecer x ∗ , que éjustamente o que estamos procurando?A pergunta faz todo sentido pois, apesar <strong>de</strong> estar claro em teoria que valor <strong>de</strong> α é necessáriopara o método funcionar, não é claro na prática como proce<strong>de</strong>r, uma vez que nãodispomos do valor <strong>de</strong> f ′ (x ∗ ).Há duas respostas para esta questão, cuja eficiência vai <strong>de</strong>pen<strong>de</strong>r do tipo <strong>de</strong> problemaque se quer resolver.Uma das respostas será o Método <strong>de</strong> Newton, do qual falaremos no próximo Capítulo.Em vez <strong>de</strong> usarmos a funçãoϕ(x) = x − f(x)f ′ (x ∗ ) ,a qual não po<strong>de</strong>mos <strong>de</strong>terminar por não conhecermos x ∗ , usamosϕ(x) = x − f(x)f ′ (x) .Se x estiver próximo <strong>de</strong> x ∗ então f ′ (x) estará próximo <strong>de</strong> f ′ (x ∗ ), e jogará um papel semelhante.Em cada iteração, o fator que multiplica f(x), em vez <strong>de</strong> fixo e igual a − 1f ′ (x ∗ ) , évariável e igual a − 1f ′ (x). Observe que essa função é do tipoϕ(x) = x + α(x)f(x) ,introduzida previamente, com o único problema que α(x) = − 1f ′ (x)não é contínua on<strong>de</strong> a<strong>de</strong>rivada se anula. Voltaremos ao assunto adiante.A outra resposta não é tão fácil <strong>de</strong> dar, e em linhas gerais consiste no seguinte procedimento.Lembrando que nosso objetivo é achar α tal que −1 < 1+αf ′ (x ∗ ) < +1, suponha queconsigamos isolar a raiz da função num intervalo [a, b] e mostrar que, <strong>de</strong>ntro <strong>de</strong>sse intervalo,sua <strong>de</strong>rivada f ′ (x) satisfaz −1 < 1 + αf ′ (x) < +1 para todo x no intervalo. Ora, se satisfazpara todo x ∈ [a, b] em particular satisfaz para x ∗ , e então estaremos prontos para usar essevalor <strong>de</strong> α.


9.8. A ESCOLHA DE X 0 113Então tudo o que queremos é que−2 < αf ′ (x) < 0 , x ∈ [a, b] .Em primeiro lugar, temos que escolher [a, b] <strong>de</strong> forma que sua <strong>de</strong>rivada não se anule: oué sempre negativa ou é sempre positiva. Se a <strong>de</strong>rivada f ′ (x) for negativa, mas muito alta emvalor absoluto, basta escolher α positivo e pequeno. Já se a <strong>de</strong>rivada f ′ (x) for positiva e altaem valor absoluto, basta multiplicar por α negativo e pequeno.Exercício 9.20 Consi<strong>de</strong>re a equação f(x) = e −x2 − cosx = 0. O objetivo do exercício étrabalhar com uma função ϕ(x) = x+αf(x) para achar a menor raiz positiva <strong>de</strong> f, admitindoo fato <strong>de</strong> que essa raiz, que chamaremos <strong>de</strong> x ∗ , seja a única localizada estritamente entre 0e π 2(isso não parece fácil <strong>de</strong> se mostrar, mas se quiser tente!).1. Mostre que f(1) < 0 e f( π 2) > 0, o que indica que a raiz procurada está no intervalo[a, b] = [1, π 2 ].2. Estime valores m e M tais quem ≤ f ′ (x) ≤ Mpara todo x ∈ [1, π 2] (será preciso investigar em <strong>de</strong>talhe o comportamento das <strong>de</strong>rivadas<strong>de</strong> e −x2 e cosx no intervalo consi<strong>de</strong>rado).3. Use o item anterior para escolher α <strong>de</strong> modo que −1 < ϕ ′ (x) < 1, para todo x ∈ [1, π 2 ].4. Determine qual extremo está mais próximo <strong>de</strong> x ∗ : x = 1 ou x = π 2 ?5. Use esse extremo como condição inicial e itere, para <strong>de</strong>terminar a raiz com precisão <strong>de</strong>10 −4 .Exercício 9.21 Compare as funções <strong>de</strong> iteração ϕ 1 , ϕ 2 , ϕ 3 e ϕ 4 dadas abaixo, no que dizrespeito à eficácia <strong>de</strong> se obter a solução da equação cosx = x 2 (consi<strong>de</strong>rando-se condiçõesiniciais apropriadas). Ache a solução, com o maior número <strong>de</strong> casas <strong>de</strong>cimais possíveis.ϕ 1 (x) = cosx − 2x 2 , ϕ 2 (x) = − cosx + x 2 ,ϕ 3 (x) = x + 1 8 (cosx − x2 ) , ϕ 4 (x) =xsen x + cosx + x2senx + 2x.9.8 A escolha <strong>de</strong> x 0Observe que para saber o quão próximo da raiz o ponto inicial x 0 po<strong>de</strong> ser escolhido, po<strong>de</strong>mosadotar o seguinte procedimento.Em primeiro lugar, usar o Método da Dicotomia para cercar um intervalo pequeno [a, b]que contenha a raiz, e <strong>de</strong>pois eventualmente encolher mais ainda o intervalo para que a<strong>de</strong>rivada <strong>de</strong> f não se anule, como comentado na Seção anterior. Isso permitirá escolher α econstruir ϕ para fazer as iterações.


114CAPÍTULO 9. MÉTODOS ITERATIVOSEssas consi<strong>de</strong>rações servirão também para o Método <strong>de</strong> Newton, do qual falaremos nopróximo Capítulo. O importante é conseguir o intervalo [a, b] <strong>de</strong> forma a isolar a raiz e obterque |ϕ ′ (x)| ≤ λ < 1 em todo o intervalo. Isso fará com que|x k+1 − x ∗ | ≤ λ|x k − x ∗ | ,se x k estiver em [a, b] (conclusão que po<strong>de</strong> ser obtida mesmo sem conhecermos x ∗ ).Observe que o problema não termina neste ponto. Uma vez escolhido x 0 <strong>de</strong>ntro dointervalo [a, b], com a condição sobre a <strong>de</strong>rivada satisfeita, então teremos certeza que x 1estará mais próximo da raiz x ∗ do que x 0 .Isso não garante, no entanto, que x 1 esteja<strong>de</strong>ntro do intervalo [a, b], e se isso não acontecer,não po<strong>de</strong>remos mais saber se x 2 se aproximaráx 0x * x 1<strong>de</strong> x ∗ mais do que x 1 (vi<strong>de</strong> figura aolado).abUma solução para esse obstáculo é tomar x 0 como sendo o extremo do intervalo [a, b] queesteja mais próximo da raiz x ∗ . Por exemplo, suponha que b seja esse extremo, isto é,|b − x ∗ | < |a − x ∗ | .Tomando x 0 = b, teremos |x 1 − x ∗ | < |b − x ∗ |, logo x 1 ∈ [a, b]. O mesmo acontecerá com ostermos seguintes da seqüência, pois todos eles estarão a uma distância da raiz menor do quea distância <strong>de</strong> b a essa raiz.Só que esse raciocínio só funcionará na prática se soubermos <strong>de</strong>terminar qual extremodo intervalo [a, b] está mais próximo da raiz. O truque é o seguinte: olhamos para o pontomédio do intervalo e chamamos esse ponto <strong>de</strong> x 0 (pelo menos provisoriamente: o chute inicialx 0 será <strong>de</strong> fato o extremo do intervalo que estamos tentando <strong>de</strong>terminar). Calculando x 1 ,sabemos que a distância <strong>de</strong> x 1 à raiz x ∗ será menor do que a distância <strong>de</strong> x 0 a x ∗ . Entãobasta ver se x 1 cai à direita ou à esquerda <strong>de</strong> x 0 .Se x 1 > x 0 então concluímos que x ∗ > x 0(logo o extremo direito do intervalo está maisx * x 1próximo da raiz), pois se x ∗ estivesse à esquerda<strong>de</strong> x 0 e x 1 à direita, então teríamosxx 1 > x 0a b|x 1 − x ∗ | > |x 0 − x ∗ |, absurdo, pois em [a, b] a0= a+b2distância à raiz <strong>de</strong>ve diminuir! Note que o argumentofunciona mesmo que x 1 caia fora dointervalo [a, b]. Se x 1 < x 0 então concluímosx xque x ∗ < x 0 . O argumento é o mesmo que no* 1x 1 < x 0caso anterior.abx 0= a+b2Se porventura x 1 = x 0 , então x 0 é a raiz (prove!), e ambos os extremos estão a igualdistância <strong>de</strong>la.


9.9. UM CRITÉRIO DE PARADA 1159.9 Um critério <strong>de</strong> paradaExistem vários critérios <strong>de</strong> parada, isto é, regras para se consi<strong>de</strong>rar um <strong>de</strong>terminado iteradox k como a aproximação <strong>de</strong>sejada para a raiz procurada x ∗ . Os critérios <strong>de</strong> parada sãoimportantes primeiramente por razão <strong>de</strong> coerência (imagine uma extensa lista <strong>de</strong> raízes sendocalculadas numericamente, é preciso uniformizar a maneira <strong>de</strong> encontrá-las), e em segundolugar para automatizar os procedimentos.Alguns critérios <strong>de</strong> parada, como aquele que vamos ver aqui, fornecem também a margem<strong>de</strong> erro da aproximação.O critério do qual falaremos aqui funciona quando, no entorno da raiz, a função émonótona, isto é, se x 1 < x ∗ < x 2 então os valores <strong>de</strong> f(x 1 ) e f(x 2 ) têm sinais opostos,ou seja,f(x 1 )f(x 2 ) < 0 .Suponha que queiramos <strong>de</strong>terminar uma aproximação <strong>de</strong> x ∗ com precisão p. Isto significaque gostaríamos <strong>de</strong> encontrar um valor ¯x tal que a verda<strong>de</strong>ira raiz x ∗ esteja no intervalo[¯x − p, ¯x + p] (a interpretação do que significa exatamente a precisão p varia <strong>de</strong> acordo como gosto do freguês, esta é a que adotaremos neste livro).Como estamos supondo que f é monótona, isso só acontecerá se f assumir sinais opostosem ¯x − p e ¯x + p.Bom, então nada mais temos a fazer do que iterar a função auxiliar ϕ, obtendo valoresx 0 , x 1 , . . .,x k , . . ., e para cada iterado x k calcularf(x k − p)f(x k + p) .Se esse produto for negativo, então po<strong>de</strong>mos consi<strong>de</strong>rar x k como sendo a aproximação <strong>de</strong>sejada.É claro que <strong>de</strong>vemos prestar um pouco <strong>de</strong> atenção para o número <strong>de</strong> casas <strong>de</strong>cimais queusamos nas contas, e se fixarmos x k talvez queiramos arredondar para uma casa <strong>de</strong>cimalcompatível com a precisão <strong>de</strong>sejada. Isso po<strong>de</strong> ser feito com bom senso, mas se tivermos queautomatizar para um programa <strong>de</strong> computador convém tomar certos cuidados.Para exemplificar, seja f(x) = e −x −x+1 = 0, que tem única raiz (veja isto esboçando ográfico!). Usaremos ϕ(x) = e −x + 1 como função auxiliar, para achar a raiz x ∗ com precisãop = 10 −2 .Partindo <strong>de</strong> x 0 = 0, obtemos os iterados. Temos que usar no mínimo um número <strong>de</strong>casas <strong>de</strong>cimais compatível com a precisão <strong>de</strong>sejada, por exemplo 4 parece ser razoável. Nestecaso, faremos as contas com todas os algarismos significativos da calculadora, e cada etapaarredondaremos para a quarta casa <strong>de</strong>cimal, a fim <strong>de</strong> minimizar os erros. Então x 1 = 2,x 2 = 1.1353, x 3 = 1.3213, x 4 = 1.2668, x 5 = 1.2817, x 6 = 1.2776, x 7 = 1.2787. Comof(1.27) > 0 e f(1.29) < 0 então po<strong>de</strong>mos consi<strong>de</strong>rar a aproximação ¯x = 1.28. Observe quepelo critério <strong>de</strong> parada já po<strong>de</strong>ríamos parar em x 5 , no entanto ao arredondarmos para 1.28convém fazer o teste novamente. Os iterados x 6 e x 7 foram a rigor <strong>de</strong>snecessários.


116CAPÍTULO 9. MÉTODOS ITERATIVOS


Capítulo 10O Método <strong>de</strong> NewtonComo já mencionado no Capítulo anterior, o Método <strong>de</strong> Newton consiste em fazer a iteraçãox k+1 = x k − f(x k)f ′ (x k ) ,a partir <strong>de</strong> uma condição inicial bem escolhida x 0 , e assim obter aproximações sucessivas <strong>de</strong>alguma raiz x ∗ <strong>de</strong> f.A maneira <strong>de</strong> achar x 1 em função <strong>de</strong> x 0 , eigualmente <strong>de</strong>pois <strong>de</strong> achar x k+1 em função<strong>de</strong> x k , tem uma forte inspiração geométrica:olhamos para a reta tangente ao gráfico <strong>de</strong> fno ponto (x k , f(x k )) e <strong>de</strong>finimos x k+1 comosendo o ponto <strong>de</strong> encontro <strong>de</strong>ssa reta com aabscissa.f( x k )x *fx kx k+1Vejamos como a fórmula acima se relaciona com esta idéia geométrica. Para isso, notamosque a inclinação da reta tangente ao gráfico <strong>de</strong> f no ponto (x k , f(x k )) é dada pela <strong>de</strong>rivadaf ′ (x k ). A única reta com inclinação f ′ (x k ) que passa por (x k , f(x k )) é dada pory = f(x k ) + f ′ (x k )(x − x k ) .O ponto x k+1 é <strong>de</strong>finido como o valor <strong>de</strong> x para o qual y = 0, isto éou0 = f(x k ) + f ′ (x k )(x k+1 − x k ) ,x k+1 = x k − f(x k)f ′ (x k ) ,117


118CAPÍTULO 10. O MÉTODO DE NEWTON<strong>de</strong>s<strong>de</strong> que f ′ (x k ) ≠ 0 (hipótese que assumiremos gratuitamente, para facilitar os argumentos).A título <strong>de</strong> exemplo apliquemos o método no exemplo f(x) = x 3 −20, para compararmoscom o Método da Dicotomia.Para f(x) = x 3 − 20 temos f ′ (x) = 3x 2 , então a fórmula <strong>de</strong> iteração ficaque neste caso po<strong>de</strong> ser simplificada parax k+1 = x k − x3 k − 203x 2 kx k+1 = 2x3 k + 203x 2 kEm primeiro lugar “chutamos” o valor <strong>de</strong> x 0 , por exemplo x 0 = 3, e obtemos x 1 :x 1 = 2 · 33 + 203 · 3 2 = 7427 = 2.7407407 .É claro que a última igualda<strong>de</strong> não é <strong>de</strong> fato uma igualda<strong>de</strong>, pois um arredondamento foiefetuado. Neste exemplo, usaremos 7 casas <strong>de</strong>cimais <strong>de</strong>pois da vírgula.A partir <strong>de</strong> x 1 calculamos x 2 , e assim por diante. Os resultados se encontram na tabelaabaixo.n x n x 3 n0 3 271 2.7407407 20.62 2.7146696 20.00563 2.7144176 19.99999964 2.7144176 19.9999996Surpreen<strong>de</strong>nte! Em poucos iterados chega-se a um valor com precisão <strong>de</strong> muitas casas <strong>de</strong>cimais!Po<strong>de</strong>mos testar a precisão <strong>de</strong>sse valor usando o mesmo princípio do Método da Dicotomia.Por exemplo, queremos saber se essa resposta tem precisão <strong>de</strong> 0.0000001. Então verificamosse os números f(2.7144175) e f(2.7144177) têm sinais opostos. Ora,edon<strong>de</strong> concluímos quef(2.7144175) = 2.7144175 3 − 20 = −0.0000026 < 0f(2.7144177) = 2.7144177 3 − 20 = 0.0000018 > 0 ,3√20 = 2.7144176 ± 0.0000001 ..,10.1 Quando o Método <strong>de</strong> Newton funciona?Será que o Método <strong>de</strong> Newton sempre funciona? Será que qualquer chute inicial levará auma seqüência x 1 , x 2 , x 3 , x 4 , . . . , x k , . . . convergindo à raiz x ∗ procurada?


10.1. QUANDO O MÉTODO DE NEWTON FUNCIONA? 119Se formulada a pergunta <strong>de</strong>sse jeito, a resposta é não! Vejamos dois argumentos bastantesimplistas para justificar o porquê.O primeiro: imagine uma função com duas raízes, f(x) = x 2 − 4, por exemplo. Paraqualquer escolha <strong>de</strong> x 0 , a seqüência x 1 , x 2 , x 3 , x 4 , . . . , x n , . . . só po<strong>de</strong>rá convergir para uma dasraízes! A outra fatalmente será esquecida, e isso po<strong>de</strong> acontecer quando menos esperarmos!O segundo: mesmo que só hajauma raiz x ∗ e que x 0 esteja “razoavelmenteperto” <strong>de</strong>la, a seqüênciax 1 , x 2 , x 3 , x 4 , . . . , x n , . . . po<strong>de</strong> se afastar!Veja um exemplo na figura ao lado.x *x 0x 1fNo entanto, quase sempre po<strong>de</strong>mos garantir que “se x 0 for escolhida suficientementepróxima <strong>de</strong> x ∗ então a seqüência x 1 , x 2 , x 3 , x 4 , . . .,x n , . . . convergirá para x ∗ ”. O “quasesempre” se refere às hipóteses que <strong>de</strong>vemos exigir que a função f satisfaça. Por exemplo,pediremos sempre que f seja uma função diferenciável, com <strong>de</strong>rivada contínua. Mais ainda,<strong>de</strong>vemos examinar como f se comporta perto da raiz (infelizmente, nem sempre isso é possívelsem se conhecer a raiz!!).Na hipótese <strong>de</strong> que f ′ (x ∗ ) ≠ 0 e que a condição inicial x 0 seja escolhida suficientementeperto da raiz então a convergência será bastante rápida, mais rápida do que qualquerseqüência geométrica. De fato, a convergência é (no mínimo) quadrática, se usarmos os resultados<strong>de</strong>duzidos no Capítulo anterior: basta mostrar que a <strong>de</strong>rivada da função <strong>de</strong> iteraçãoϕ(x) = x − f(x)f ′ (x) , calculada na raiz x∗ , vale zero.Ora, usando as regras usuais <strong>de</strong> <strong>de</strong>rivação, obtemosϕ ′ (x) = f(x)f ′′ (x)f ′ (x) 2 ,e como f(x ∗ ) = 0, segue que ϕ ′ (x ∗ ) = 0.No caso f ′ (x ∗ ) = 0 não po<strong>de</strong>mos aplicar o raciocínio diretamente, porque teremos umadivisão “zero sobre zero”. Esse caso será analisado na próxima Subseção. Antes disso, valea pena fazer alguns exercícios.Exercício 10.1 Use o Método <strong>de</strong> Newton para resolver as seguintes equações:1. −2 + 3x = e −x2. x 5 + 3x 2 − x + 1 = 03. cosx + 0.5x = 04. 0.3x 4 + 0.2x 3 + x 2 + 0.1x + 0.5 = 05. 0.3x 4 − x 3 − x 2 − 2x + 2 = 0


120CAPÍTULO 10. O MÉTODO DE NEWTONAtenção: alta probabilida<strong>de</strong> <strong>de</strong> pegadinhas.21ψ211212fExercício 10.2 Consi<strong>de</strong>re a função ψ cujo gráfico está mostrado na figura acima, à esquerda.1. Descreva, justificando (po<strong>de</strong> usar <strong>de</strong>senhos nas justificativas!), o que acontece com aseqüência x 0 , x 1 = ψ(x 0 ), . . . , x k = ψ k (x 0 ), . . . para cada uma das cinco possibilida<strong>de</strong>s:(i) x 0 = 0.0; (ii) x 0 = 1.0; (iii) x 0 = 1.5; (iv) x 0 = 2.2; (v) x 0 = 2.7.2. A função ψ po<strong>de</strong> ser a função <strong>de</strong> iteração <strong>de</strong> Método <strong>de</strong> Newton aplicado à função facima, à direita? Dê duas justificativas essencialmente diferentes para sua resposta.Exercício 10.3 Esboce uma função que tenha raízes a e b (com a < b), mas para o qualexista uma condição inicial x 0 entre a e b tal que o Método <strong>de</strong> Newton produza um resultadodivergente (apesar <strong>de</strong> o Método estar bem <strong>de</strong>finido para x 0 e todos os seus iteradosposteriores). Justifique sua resposta da melhor forma que pu<strong>de</strong>r.Exercício 10.4 Encontre numericamente o valor <strong>de</strong> x tal que e −x2 = x, com precisãop = 10 −7 .Exercício 10.5 Consi<strong>de</strong>re a catenária dada porg(x) = 1 (cosh(cx) − 1) .cRepare que g(0) = 0, isto é, a curva passa por (x, y) = (0, 0). Se a curva também passa por(x, y) = (1, 1), qual é o valor <strong>de</strong> c?Exercício 10.6 Consi<strong>de</strong>re f(x) = x 5 , que tem única raiz x ∗ = 0. Se o Método <strong>de</strong> Newtonfor aplicado a partir da condição inicial x 0 = 1, qual será o menor valor <strong>de</strong> k para o qualx k < 10 −20 ?Exercício 10.7 Consi<strong>de</strong>re a função f da figura abaixo. Se usarmos o Método <strong>de</strong> Newtonpara essa função, teremos que consi<strong>de</strong>rar iterados <strong>de</strong>ϕ(x) = x − f(x)f ′ (x) .


10.1. QUANDO O MÉTODO DE NEWTON FUNCIONA? 121Esboce o gráfico <strong>de</strong> ϕ, com base na intuição geométrica sobre o Método <strong>de</strong> Newton. Nãoesqueça <strong>de</strong> <strong>de</strong>senhar: abscissa, or<strong>de</strong>nada, diagonal e os pontos a, b e c.fa b c10.1.1 Retirando a hipótese f ′ (x ∗ ) ≠ 0A hipótese <strong>de</strong> que a <strong>de</strong>rivada <strong>de</strong> f seja diferente <strong>de</strong> zero na raiz x ∗ não é necessária para semostrar convergência, e po<strong>de</strong> ser substituída por uma hipótese bem mais fraca, <strong>de</strong>s<strong>de</strong> que ochute inicial x 0 esteja suficientemente próximo <strong>de</strong> x ∗ .Antes <strong>de</strong> <strong>de</strong>duzir resultados gerais, vejamos o que acontece com alguns exemplos.Consi<strong>de</strong>remos f(x) = ax 2 , que tem raiz em x = 0, mas a <strong>de</strong>rivada <strong>de</strong> f na raiz é nula.Montando a função <strong>de</strong> iteração do Método <strong>de</strong> Newton obtemosϕ(x) = x − f(x)f ′ (x) = x − ax22ax ,que a princípio não estaria <strong>de</strong>finida em x = 0. No entanto, as iterações são tomadas fora dozero, on<strong>de</strong> ϕ está bem <strong>de</strong>finida. Além disso, a expressão po<strong>de</strong> ser simplificada <strong>de</strong> modo aescon<strong>de</strong>r o problema:ϕ(x) = x 2 .Agora a <strong>de</strong>rivada <strong>de</strong> ϕ no zero <strong>de</strong> f é igual a 1 2, que significa que a seqüência <strong>de</strong> iterados iráconvergir para a raiz zero à razão geométrica <strong>de</strong> 1 2 .Se consi<strong>de</strong>rarmos f(x) = ax n , então teremosϕ(x) = (1 − 1 n )x ,e portanto 1 − 1 nserá a razão da convergência geométrica.Aparentemente, essas consi<strong>de</strong>rações levam a crer que quando f ′ (x ∗ ) = 0 o Método <strong>de</strong> Newtonainda funciona, mas a velocida<strong>de</strong> <strong>de</strong> convergência passa a ser mais lenta (<strong>de</strong> quadráticapassa a ser apenas geométrica). Até que ponto isso po<strong>de</strong> ser generalizado?A melhor maneira <strong>de</strong> compreen<strong>de</strong>r o que se passa é por meio <strong>de</strong> polinômios <strong>de</strong> Taylor (vi<strong>de</strong>o Apêndice C para uma revisão sobre o assunto). Para facilitar os argumentos, suporemos


122CAPÍTULO 10. O MÉTODO DE NEWTONque a função f po<strong>de</strong> ser diferenciada infinitamente. A expansão <strong>de</strong> f em torno <strong>de</strong> x ∗ é assimescrita:f(x) = f(x ∗ ) + f ′ (x ∗ )(x − x ∗ ) + f ′′ (x ∗ )2(x − x ∗ ) 2 + . . . + f(n) (x ∗ )(x − x ∗ ) n + o((x − x ∗ ) n ) ,n!on<strong>de</strong> o((x − x ∗ ) n ) indica a presença <strong>de</strong> termos <strong>de</strong> or<strong>de</strong>m mais alta do que (x − x ∗ ) n , ouem outras palavras, <strong>de</strong>nota a presença <strong>de</strong> um resto que vai a zero mais rapidamente do que(x − x ∗ ) n quando x ten<strong>de</strong> a x ∗ .Como x ∗ é a raiz <strong>de</strong> f, e estamos supondo que f tem <strong>de</strong>rivada nula em x ∗ , os doisprimeiros termos serão nulos, necessariamente. Já a <strong>de</strong>rivada segunda po<strong>de</strong> ou não ser nula.Para a maioria das situações, haverá um primeiro termo não nulo, <strong>de</strong> or<strong>de</strong>m m, que po<strong>de</strong> ser2 ou mais. Assim, po<strong>de</strong>mos escrever f comoou ainda,f(x) = f(m) (x ∗ )(x − x ∗ ) m + o((x − x ∗ ) m ) ,m!f(x) = f(m) (x ∗ )(x − x ∗ ) m m! o((x − x(1 ∗ ) m ))+m!f (m) (x ∗ ) (x − x ∗ ) m .Como o((x − x ∗ ) m ) tem or<strong>de</strong>m mais alta do que (x − x ∗ ) m , o quociente dos dois vai a zero,e assim po<strong>de</strong>mos escreverf(x) = f(m) (x ∗ )(x − x ∗ ) m (1 + r 1 (x)) ,m!on<strong>de</strong> r 1 (x) vai a zero quando x ten<strong>de</strong> a x ∗ .Da mesma forma, a função f ′ (x) po<strong>de</strong> ser expressa na sua fórmula <strong>de</strong> Taylor. Desta vez,o primeiro termo não nulo será <strong>de</strong> or<strong>de</strong>m m − 1, e teremosf ′ (x) = m f(m) (x ∗ )(x − x ∗ ) m−1 (1 + r 2 (x)) ,m!on<strong>de</strong> r 2 (x) vai a zero quando x ten<strong>de</strong> a x ∗ .Posto tudo isso, po<strong>de</strong>mos montar a função <strong>de</strong> iteração ϕ, usando essas expressões no lugar<strong>de</strong> f(x) e f ′ (x):ϕ(x) = x − 1 m (x − x∗ ) 1 + r 1(x)1 + r 2 (x) .Subtraindo x ∗ dos dois lados, e colocando (x − x ∗ ) em evidência no lado direito da equação,obtemos(ϕ(x) − x ∗ = (x − x ∗ ) 1 − 1 )1 + r 1 (x).m 1 + r 2 (x)Só que o quociente envolvendo r 1 e r 2 ten<strong>de</strong> a 1, entãoϕ(x) − x ∗x − x ∗ten<strong>de</strong> a 1 − 1 m. Esta é a razão assintótica <strong>de</strong> convergência geométrica do Método <strong>de</strong> Newton,que só <strong>de</strong>pen<strong>de</strong> da or<strong>de</strong>m m da função f em x ∗ .


10.2.MÉTODO DE NEWTON EM DIMENSÕES MAIS ALTAS 12310.2 Método <strong>de</strong> Newton em dimensões mais altasSuponha que F : R n → R n seja uma função diferenciável e estejamos procurando um pontox ∗ tal que F(x ∗ ) = 0. Esse é o análogo multidimensional do problema que vimos discutindoaté agora. Se ao leitor o problema parece muito abstrato, observe que F leva (x 1 , . . .,x n )num elemento <strong>de</strong> R n , que po<strong>de</strong> ser explicitado por cada uma <strong>de</strong> suas componentes, isto é,F(x 1 , x 2 , . . .,x n ) = (f 1 (x 1 , . . . , x n ), . . . , f n (x 1 , . . .,x n )) .Então achar um zero <strong>de</strong> F é achar uma solução para o sistema <strong>de</strong> equaçõesf 1 (x 1 , . . .,x n ) = 0f 2 (x 1 , . . .,x n ) = 0f n (x 1 , . . .,x n ) = 0que não é necessariamente linear.Para generalizar, <strong>de</strong>vemos examinar com cuidado a motivação do método em dimensão 1.Para <strong>de</strong>finir x (k+1) em função <strong>de</strong> x (k) , passamos uma reta por x (k) com a mesma inclinaçãoque a <strong>de</strong>rivada <strong>de</strong> f em x (k) (usaremos essa forma <strong>de</strong> in<strong>de</strong>xar para não confundir com oíndice que indica as coor<strong>de</strong>nadas <strong>de</strong> x, quando x ∈ R n ). Isto é o mesmo que aproximar fpela sua expansão em Taylor <strong>de</strong> or<strong>de</strong>m 1:f(x) = f(x (k) ) + f ′ (x (k) )(x − x (k) ) + R 1 (x) ,mas ignorando R 1 . O ponto x (k) era <strong>de</strong>finido pelo encontro <strong>de</strong>ssa reta com o zero, ou seja0 = f(x (k) ) + f ′ (x (k) )(x (k+1) − x (k) ) ,e a fórmula do Método <strong>de</strong> Newton foi obtida isolando-se x (k+1) nessa equação.A expansão em Taylor é igualmente válida em dimensão mais alta. Para primeira or<strong>de</strong>m,por exemplo, po<strong>de</strong>mos escreverF(x) = F(x (k) ) + DF(x (k) )(x − x (k) ) + R 1 (x) ,on<strong>de</strong> x ∈ R n , R 1 é uma função <strong>de</strong> R n em R n (assim como F) e DF(x) é a matriz jacobianano ponto x, isto é⎛⎞∂f 1 ∂f 1 ∂f∂x 1 ∂x 2. . . 1∂x n∂f 2 ∂f 2 ∂fDF(x) =∂x 1 ∂x 2. . . 2∂x n⎜ . . . .⎟⎝ . . . . ⎠ ,∂f n∂x 2. . .∂f n∂x 1sendo que por economia <strong>de</strong> espaço fica implícito que cada uma das <strong>de</strong>rivadas parciais écalculada no ponto x. Portanto, o termo DF(x (k) )(x −x (k) ) é a multiplicação <strong>de</strong> uma matrizpor um vetor (coluna), que resulta em outro vetor..∂f n∂x n


124CAPÍTULO 10. O MÉTODO DE NEWTONO resto R 1 tem a proprieda<strong>de</strong> <strong>de</strong> quelimx→x (k)R 1 (x)‖x − x (k) ‖ = 0 ,tomando-se o cuidado <strong>de</strong> tomar a norma no <strong>de</strong>nominador, porque afinal não faz sentidodividir por vetores.Para <strong>de</strong>finir x (k+1) , ignoramos R 1 e igualamos a aproximação <strong>de</strong> primeira or<strong>de</strong>m a zero:ou seja,0 = F(x (k) ) + DF(x (k) )(x (k+1) − x (k) ) ,DF(x (k) )x (k+1) = DF(x (k) )x (k) − F(x (k) ) .Observe que essa equação é um sistema linear, on<strong>de</strong> x (k+1) é a incógnita, a matriz <strong>de</strong> coeficientesé a matriz jacobiana DF(x (k) ) e o vetor <strong>de</strong> termos in<strong>de</strong>pen<strong>de</strong>ntes é dado porDF(x (k) )x (k) − F(x (k) ).Assim como a solução <strong>de</strong> um sistema linear é um encontro <strong>de</strong> hiperplanos em R n , asolução <strong>de</strong> um sistema não-linear é um encontro <strong>de</strong> hipersuperfícies em R n . Para n = 2, oshiperplanos são retas e as hipersuperfícies são curvas. Sugere-se fazer o seguinte exercíciopara fixar idéias.Exercício 10.8 Achar numericamente a intersecção das curvas dadas por x 2 + y 2 − 1 = 0(um círculo!) e 1 2 x4 +3(1−cosy) 2 −1 = 0. Bom, pelo menos organize uma estratégia baseadano Método <strong>de</strong> Newton. Quanto ao chute inicial, isso é um problema, principalmente porquepo<strong>de</strong> haver mais do que uma intersecção entre as curvas.10.2.1 Determinação da forma <strong>de</strong> uma cordaUma aplicação interessante do Método <strong>de</strong> Newton em dimensão 3 ocorre na <strong>de</strong>terminaçãodo formato <strong>de</strong> uma corda a partir das coor<strong>de</strong>nadas <strong>de</strong> dois pontos (po<strong>de</strong>m ser os pontos <strong>de</strong>sustentação, por exemplo) e do comprimento da corda entre os dois pontos. A implementação<strong>de</strong>sta idéia <strong>de</strong>ve ser feita com o auxílio do computador, pela quantida<strong>de</strong> <strong>de</strong> cálculos a seremfeitos, mas mesmo assim <strong>de</strong>ve-se prestar bastante atenção para o chute da condição inicial,que po<strong>de</strong> freqüentemente levar o método a divergir.Como vimos na Subseção 4.3.2, uma corda ou corrente pendurada assume o formato dográfico da função1c cosh(cx) ,conhecida como catenária.No entanto, assume-se aí que a origem das coor<strong>de</strong>nadas esteja uma unida<strong>de</strong> abaixo doponto mais baixo da corda. De modo geral, se quisermos <strong>de</strong>slocar a corda na vertical,precisamos acrescentar um parâmetro h, que será somado à expressão acima, e se quisermos<strong>de</strong>slocar a corda horizontalmente em a unida<strong>de</strong>s então <strong>de</strong>vemos trocar x por x − a, <strong>de</strong> modoquef(x) = 1 cosh(c(x − a)) + hcé a maneira mais geral <strong>de</strong> se representar o formato da corda.


10.2.MÉTODO DE NEWTON EM DIMENSÕES MAIS ALTAS 125Se nosso mo<strong>de</strong>lo preten<strong>de</strong> ser consistente, <strong>de</strong>veria prever exatamente a forma da corda,<strong>de</strong>s<strong>de</strong> que informemos dois pontos <strong>de</strong> sustentação e o comprimento total da corda entre osdois pontos. Ou seja, com essas três informações <strong>de</strong>veria ser possível <strong>de</strong>terminar c, a e h, eportanto f.Sejam (x 0 , y 0 ) e (x 1 , y 1 ) os pontos <strong>de</strong> sustentação. Entãoy 0 = 1 c cosh(c(x 0 − a)) + hey 1 = 1 c cosh(c(x 1 − a)) + h .O comprimento da corda entre os pontos <strong>de</strong> sustentação será chamado <strong>de</strong> l. Portantol =∫ x1x 0√1 + f′(x) 2 dx(ver Seção 13.3 adiante, para uma justificativa <strong>de</strong>sta fórmula). Comoelogol =∫ x1f ′ (x) = sinh(c(x − a)) ,1 + sinh 2 t = cosh 2 t ,x 0cosh(c(x − a))dx = 1 c {sinh(c(x 1 − a)) − sinh(c(x 0 − a))} .Com isso, obtivemos um sistema não-linear <strong>de</strong> três equações e três incógnitas:⎧⎨ c(y 0 − h) − cosh(c(x 0 − a)) = 0c(y 1 − h) − cosh(c(x 1 − a)) = 0⎩lc + sinh(c(x 0 − a)) − sinh(c(x 1 − a)) = 0O sistema po<strong>de</strong> ser resolvido numericamente pelo Método <strong>de</strong> Newton.


126CAPÍTULO 10. O MÉTODO DE NEWTON


Parte IVInterpolação Polinomial127


Capítulo 11Estimativa do erro nasinterpolaçõesVoltemos à questão (abordada nas Seções 1.5 e A.7) da interpolação <strong>de</strong> um polinômio <strong>de</strong> grauk a k + 1 pontos dados (t 0 , z 0 ), (t 1 , z 1 ), . . ., (t k , z k ), que será importante na Parte seguintedo livro, on<strong>de</strong> falaremos <strong>de</strong> integração <strong>de</strong> funções.Nesta Parte do livro, usaremos t como variável (no lugar <strong>de</strong> x), valores z (no lugar <strong>de</strong>y) e pontos in<strong>de</strong>xados <strong>de</strong> 0 a k (no lugar <strong>de</strong> n). Tudo isso justamente para não fazermosconfusão na Parte V, quando usaremos alguns conceitos aqui expostos.Imagine que utilizemos a interpolação polinomial como uma maneira <strong>de</strong> “aproximar”uma função. Mais precisamente, seja f : [t L , t R ] → R uma função (cuja regularida<strong>de</strong> sóespecificaremos adiante) e uma partição <strong>de</strong> seu domíniot L = t 0 < t 1 < t 2 < . . . < t k−1 < t k = t R ,não necessariamente a intervalos regulares. Assumiremos sempre que t L < t R e que k ≥ 1.Aos k + 1 pontos (t 0 , f(t 0 )), (t 1 , f(t 1 )), . . ., (t k , f(t k )) po<strong>de</strong>mos interpolar um polinômiop(t) <strong>de</strong> grau k, que é único. A pergunta é: quanto se per<strong>de</strong> ao se trocar f(t) pelo polinômiointerpolador p(t)? Ou seja, quão gran<strong>de</strong> é a diferença f(t) − p(t), para cada ponto t dointervalo [t L , t R ]?Vejamos primeiro como <strong>de</strong>ve ser a função diferença F(t) ≡ f(t) − p(t). Para k = 1 apartição tem que ser t L = t 0 < t 1 = t R , e o polinômio interpolador é a função afim cujográfico passa por (t 0 , f(t 0 )) e (t 1 , f(t 1 )). Como p(t 0 ) = f(t 0 ) e p(t 1 ) = f(t 1 ), então F se anulaem t 0 e t 1 . Veja na figura abaixo, esquematicamente, como <strong>de</strong>vem ser f e p (à esquerda) eF (à direita).129


130CAPÍTULO 11. ESTIMATIVA DO ERRO NAS INTERPOLAÇÕESpt 0 t 1t 0 tf 1FPelas mesmas razões, para valores quaisquer <strong>de</strong> k, a função F se anula em todos os pontost 0 , t 1 , . . ., t k da partição. Ela po<strong>de</strong> até se anular em outros pontos, mas não é necessário queisto ocorra. Veja na figura abaixo uma situação com k = 2, on<strong>de</strong> p tem que ser um polinômioquadrático.0101f0101p0101F00 110100 11 01t 0 t 1 t 2 t 0 t 1t 2Se p e f não diferem nos pontos da partição, quanto será a diferença para os <strong>de</strong>maisvalores <strong>de</strong> t?Para respon<strong>de</strong>r, tentaremos <strong>de</strong>finir uma função (não-negativa) S(t) tal que−S(t) ≤ F(t) ≤ S(t)(ou |F(t)| ≤ S(t)) para todo t ∈ [t L , t R ], sabendo <strong>de</strong> antemão que S(t) po<strong>de</strong> se anular emt 0 , t 1 , . . .,t k .A forma <strong>de</strong> S e −S, em linha pontilhada, seria algo assim (para k = 4):0101


S131010101010101t 0t 1 t 2 t 3t 4F−S010100 1100 11É claro que S <strong>de</strong>veria ser do tipo mais simples possível. Uma tentativa é olhar para umpolinômio não-nulo q(t) <strong>de</strong> grau k+1 que se anule nos pontos t 0 , . . . , t k e tomar S(t) = c|q(t)|,on<strong>de</strong> c é uma constante positiva. O polinômioq(t) = (t − t 0 )(t − t 1 )...(t − t k ) ,por exemplo, satisfaz a condição pedida.O que faremos agora é mostrar que uma tal estimativa é possível, e além do mais apresentarum valor <strong>de</strong> c, que possa ser calculado a partir <strong>de</strong> algum conhecimento sobre a funçãof.De fato, mostraremos um resultado mais forte, que implicará automaticamente o quequeremos. Provaremos que, para cada t ∈ [t L , t R ] existe um outro ponto s = s t (s t indica a<strong>de</strong>pendência <strong>de</strong> s em relação a t) tal queF(t) = F (k+1) (s)(k + 1)! q(t) ,on<strong>de</strong> F (k+1) (s) indica a <strong>de</strong>rivada (k + 1)-ésima <strong>de</strong> F em s.Como conseqüência <strong>de</strong>ssa afirmação, teremos que(F (k+1) )(s)|F(t)| ≤ max|q(t)| .s∈[t L,t R] (k + 1)!Além disso, não <strong>de</strong>vemos esquecer que F(t) = f(t) − p(t), on<strong>de</strong> p(t) é polinômio <strong>de</strong> grau k.Como a <strong>de</strong>rivada (k + 1)-ésima <strong>de</strong> um polinômio <strong>de</strong> grau k é zero, entãoF (k+1) = f (k+1) ,logoe po<strong>de</strong>mos tomar(|F(t)| ≤maxs∈[t L,t R]f (k+1) )(s)|q(t)| ,(k + 1)!f (k+1) (s)c = max .s∈[t L,t R] (k + 1)!


132CAPÍTULO 11. ESTIMATIVA DO ERRO NAS INTERPOLAÇÕESÉ claro que esta resposta só é possível se f for uma função pelo menos (k + 1) vezes diferenciável.É o que ocorre com a maioria das funções com que nos <strong>de</strong>paramos na prática, maspo<strong>de</strong> haver exceções.Finalmente só nos falta provar a afirmação, que diz que para cada t em [t L , t R ] existe ums neste mesmo intervalo tal que(k + 1)!F(t) = F (k+1) (s)q(t) .A afirmação é trivialmente válida se t for um dos pontos t 0 , t 1 , . . . , t k , pois F e q se anulamnesses pontos, e os dois lados da equação ficam iguais a zero. Resta-nos assim provar aafirmação quando t não é nenhum <strong>de</strong>sses pontos.Em primeiro lugar, fazemos a constatação esperta <strong>de</strong> que (k+1)! é a (k+1)-ésima <strong>de</strong>rivada<strong>de</strong> q, pois o polinômio q tem grau (k+1) e o coeficiente <strong>de</strong> t k+1 é igual a 1. Então nos bastará<strong>de</strong>monstrar que existe s = s t tal quePara isso <strong>de</strong>finimos a funçãoq (k+1) (s)F(t) − F (k+1) (s)q(t) = 0 .G(s) = q(s)F(t) − F(s)q(t) ,lembrando que t está fixo, neste raciocínio. Desta maneira, queremos apenas mostrar queexiste s on<strong>de</strong> G (k+1) se anula.Acontece que G é uma função que se anula em todos os pontos t 0 , t 1 , . . .,t k , pois tanto qcomo F se anulam nesses pontos, mas G também se anula em s = t, poisG(t) = q(t)F(t) − F(t)q(t) = 0 .Como estamos interessados no caso em que t não é nenhum dos pontos t 0 , t 1 , . . . , t k , então Gse anula em pelo menos k +2 pontos distintos. Pelo Teorema do Valor Médio, entre cada parconsecutivo <strong>de</strong> pontos on<strong>de</strong> G se anula há um ponto on<strong>de</strong> a <strong>de</strong>rivada <strong>de</strong> G se anula. PortantoG ′ se anula, obrigatoriamente, em pelo menos k + 1 pontos. Pelo mesmo raciocínio, G ′′ seanula em pelo menos k pontos. Continuando indutivamente, temos que G (k) se anula em 2pontos e, finalmente, que G (k+1) se anula em 1 ponto, como queríamos <strong>de</strong>monstrar.Tendo em vista que os resultados <strong>de</strong>ste Capítulo serão usados no Capítulo 16, resumimosa estimativa obtida (com a notação já exposta):|f(t) − p(t)| ≤ c|q(t)| ,on<strong>de</strong>ec =f (k+1) (s)maxs∈[t L,t R] (k + 1)!q(t) = (t − t 0 )(t − t 1 )...(t − t k ) .


Capítulo 12Técnicas <strong>de</strong> interpolaçãoNeste Capítulo apresentaremos duas técnicas <strong>de</strong> interpolação que servem como alternativasao método já <strong>de</strong>scrito na Seção 1.5 <strong>de</strong> redução a um sistema linear.12.1 Polinômios <strong>de</strong> LagrangeConsi<strong>de</strong>re o polinômio(t − t 1 )(t − t 2 ) · · · (t − t k ) ,que tem grau k e se anula em t 1 , . . .,t k . Além disso, em t 0 ele vale (t 0 −t 1 )(t 0 −t 2 ) · · · (t 0 −t k ),e portanto o polinômioL 0 (t) = (t − t 1)(t − t 2 ) · · · (t − t k )(t 0 − t 1 )(t 0 − t 2 ) · · · (t 0 − t k )vale 1 em t 0 e zero nos <strong>de</strong>mais pontos t 1 , . . . , t k . Analogamente, po<strong>de</strong>mos <strong>de</strong>finir, para cadat i , um polinômio L i (t) <strong>de</strong> grau k que vale 1 em t i e zero nos <strong>de</strong>mais pontos.Agora observe que a soma <strong>de</strong> polinômios <strong>de</strong> grau k é um polinômio <strong>de</strong> grau k, logoc 0 L 0 (t) + c 1 L 1 (t) + . . . + c k L k (t)é um polinômio <strong>de</strong> grau k, que vale c 0 em t 0 , c 1 em t 1 , ..., c k em t k . Portanto, se quisermosachar um polinômio <strong>de</strong> grau k que valha z 0 , . . . , z k nos pontos t 0 , . . . , t k basta tomar os c i ’siguais aos z i ’s:p(t) = z 0 L 0 (t) + z 1 L 1 (t) + . . . + z k L k (t) .Essa é uma maneira <strong>de</strong> achar o polinômio interpolador sem resolver nenhum sistema linear!Os polinômios L i são conhecidos como polinômios <strong>de</strong> Lagrange.12.2 Forma <strong>de</strong> NewtonJá vimos duas maneiras <strong>de</strong> fazer uma interpolação polinomial: através <strong>de</strong> um sistema linear,on<strong>de</strong> as incógnitas são os coeficientes do polinômio que se quer <strong>de</strong>terminar, e cada ponto133


134CAPÍTULO 12. TÉCNICAS DE INTERPOLAÇÃOda interpolação gera uma equação; e através <strong>de</strong> uma combinação linear dos polinômios <strong>de</strong>Lagrange.Nesta Seção veremos outra forma <strong>de</strong> interpolar, chamada forma <strong>de</strong> Newton. Ela levacerta vantagem em um aspecto: é mais fácil acrescentar um ponto à interpolação, sem terque <strong>de</strong>smanchar (ou revisar) as contas feitas anteriormente.Para obter esse novo método, teremos que investigar um pouco mais alguns aspectossubjacentes à interpolação.Seja (t 0 , z 0 ), (t 1 , z 1 ), . . . , (t k , z k ) o conjunto <strong>de</strong> pontos que se <strong>de</strong>seja interpolar. A únicaexigência, como <strong>de</strong> hábito, é que os t i ’s sejam dois a dois distintos, mas não há necessida<strong>de</strong>que sua enumeração respeite a or<strong>de</strong>m em que eles se dispõem sobre a reta, e os z i ’s po<strong>de</strong>mser experimentais ou provenientes <strong>de</strong> uma função (z i = f(t i )), tanto faz.Olharemos para as interpolações parciais, que envolvem apenas certos subconjuntos dospontos acima. Mais precisamente, sejam i e j tais que 0 ≤ i ≤ j ≤ k e seja p i j (t) o polinômiointerpolador dos pontos (t i , z i ), . . . , (t j , z j ). Assim, o polinômio interpolador procurado ép(t) = p 0 k (t), enquanto que pi i (t) é o polinômio interpolador <strong>de</strong> um ponto só (portanto pi i (t) ≡z i , isto é, tem grau zero e é i<strong>de</strong>nticamente igual a z i ). Lembremos que o grau (máximo) <strong>de</strong>p i j (t) é j − i, pois pi j (t) é o polinômio interpolador <strong>de</strong> j − i + 1 pontos.Chamaremos <strong>de</strong> or<strong>de</strong>m <strong>de</strong> p i j (t) ao número j − i + 1, que nada mais é do que o número<strong>de</strong> pontos que ele interpola.Em seguida po<strong>de</strong>mos observar que um polinômio <strong>de</strong> or<strong>de</strong>m l > 1 se relaciona <strong>de</strong> formamais ou menos simples com algum polinômio <strong>de</strong> or<strong>de</strong>m inferior. Por exemplo, com i


12.2. FORMA DE NEWTON 135e assim por diante, <strong>de</strong> forma quep 0 k(t) = p 0 0(t) + ω(t 0 , t 1 )(t − t 0 )++ω(t 0 , t 1 , t 2 )(t − t 0 )(t − t 1 ) + . . . + ω(t 0 , . . . , t k )(t − t 0 )...(t − t k−1 ) .Como p 0 0(t) ≡ z 0 , convencionaremos que ω(t 0 ) = z 0 (e ω(t i ) = z i , para todo i = 0, . . .,k),para que a notação fique uniforme.Se procedêssemos inversamente na or<strong>de</strong>m dos pontos, chegaríamos emp 0 k(t) = α(t k ) + α(t k−1 , t k )(t − t k )++α(t k−2 , t k−1 , t k )(t − t k−1 )(t − t k ) + . . . + α(t 0 , . . .,t k )(t − t 1 )...(t − t k ) ,estipulando-se que α(t i ) = z i , ∀i = 0, . . .,k.Os ω’s (e analogamente os α’s) são chamados <strong>de</strong> diferenças divididas, porque po<strong>de</strong>m ser<strong>de</strong>duzidos da Equação 12.1, colocando-se t = t j . Assimω(t i , . . . , t j ) =p i j (t j) − p i j−1 (t j)(t j − t i )...(t j − t j−1 ) ,on<strong>de</strong> conhecemos p i j (t j) = z j , mas p i j−1 (t j) <strong>de</strong>pen<strong>de</strong> <strong>de</strong> se conhecer previamente o polinômiop i j−1 (t). Isso possibilita achar os ω’s indutivamente, mas é um caminho trabalhoso. Nossoobjetivo é buscar um meio mais fácil <strong>de</strong> <strong>de</strong>terminar ω’s e α’s, embora não possamos nos livrar<strong>de</strong> alguma indução.Partiremos <strong>de</strong> uma pequena observação sobre os polinômios <strong>de</strong> or<strong>de</strong>m 1 e 2 (um e doispontos), e <strong>de</strong>pois enunciaremos um resultado geral que servirá a nossos propósitos.Não há muito o que dizer em or<strong>de</strong>m 1: a interpolação <strong>de</strong> um ponto é um polinômio <strong>de</strong>grau zero, portantop i i (t) = z i = ω(t i ) = α(t i ) ,por <strong>de</strong>finição.Já a interpolação <strong>de</strong> dois pontos t i e t i+1 (0 ≤ i ≤ k − 1) é um polinômio <strong>de</strong> grau 1, cujográfico é uma reta. Temosp i i+1 (t) = z i + ω(t i , t i+1 )(t − t i ) ,que po<strong>de</strong> ser obtido da Equação 12.1 diretamente. Mas ω(t i , t i+1 ) é também a inclinação dareta que passa por (t i , z i ) e (t i+1 , z i+1 ), logoAnalogamente,ω(t i , t i+1 ) = z i+1 − z it i+1 − t i= ω(t i+1) − ω(t i )t i+1 − t i.p i i+1 (t) = z i+1 + α(t i , t i+1 )(t − t i+1 ) ,don<strong>de</strong> α(t i , t i+1 ) = ω(t i , t i+1 ), pois α(t i , t i+1 ) é a inclinação da mesma reta!Assim mostramos que ω’s e α’s coinci<strong>de</strong>m até or<strong>de</strong>m 2 e relacionamos ω’s <strong>de</strong> or<strong>de</strong>m 2com ω’s <strong>de</strong> or<strong>de</strong>m 1. Vejamos como generalizar nossas observações para qualquer or<strong>de</strong>m.


136CAPÍTULO 12. TÉCNICAS DE INTERPOLAÇÃOMostraremos o seguinte enunciado: “para todo par i, j tal que 0 ≤ i ≤ j, temos α(t i , . . . , t j ) =ω(x i , . . . , x j ), e se i < j temosω(t i , . . . , t j ) = ω(t i+1, . . . , t j ) − ω(t i , . . .,t j−1 )t j − t i. ′′ (12.3)O enunciado já foi <strong>de</strong>monstrado acima em or<strong>de</strong>ns 1 e 2, isto é, sempre que j − i + 1 ≤ 2.Sejam agora i e j tais que j − i + 1 ≥ 3 e consi<strong>de</strong>re os polinômios p i+1j (t) e p i j−1 (t) queinterpolam j − i pontos, e portanto têm grau (máximo) j − i − 1. Como eles coinci<strong>de</strong>m emt i+1 , . . . , t j−1 , entãop i+1j (t) − p i j−1 (t) = a(t − t i+1)...(t − t j−1 ) . (12.4)Acharemos o valor <strong>de</strong> a <strong>de</strong> três maneiras diferentes, o que fornecerá as igualda<strong>de</strong>s que queremos<strong>de</strong>monstrar.(i) Tomamos t = t j na Equação 12.4. Entãoa(t j − t i+1 )...(t j − t j−1 ) = p i+1j (t j ) − p i j−1(t j ) .Como p i+1j (t) inclui t j em sua interpolação, p i+1j (t j ) = z j , mas z j também é o valor <strong>de</strong> p i j (t j),logo o lado direito é igual aDaí segue quep i j (t j) − p i j−1 (t j) = ω(t i , . . .,t j )(t j − t i )(t j − t i+1 )...(t j − t j−1 ) .(ii) Tomamos t = t i na Equação 12.4. EntãoO lado direito é igual alogoa = (t j − t i )ω(t i , . . .,t j ) .a(t i − t i+1 )...(t i − t j−1 ) = p i+1j (t i ) − p i j−1 (t i) .p i+1j (t i ) − p i j (t i) = −α(t i , . . . , t j )(t i − t i+1 )...(t i − t j ) ,o que mostra que α(t i , . . . , t j ) = ω(t i , . . . , t j ).a = (t j − t i )α(t i , . . . , t j ) ,(iii) Depois que vimos que ω’s e α’s coinci<strong>de</strong>m, usamos a mesma Equação 12.4, manipulando-a<strong>de</strong> outra forma, para estabelecer a relação dos ω’s com seus correspon<strong>de</strong>ntes <strong>de</strong> or<strong>de</strong>m inferior.Observe quep i+1j (t) − p i j−1(t) = [ p i+1j (t) − p i+1j−1 (t)] + [ p i+1j−1 (t) − pi j−1(t) ] ,que, pela <strong>de</strong>finição <strong>de</strong> ω’s e α’s, é igual aω(t i+1 , . . . , t j )(t − t i+1 )...(t − t j−1 ) − α(t i , . . . , t j−1 )(t − t i+1 )...(t − t j−1 ) .Como α(t i , . . .,t j−1 ) = ω(t i , . . .,t j−1 ), segue queEntãop i+1j (t) − p i j−1 (t) = [ω(t i+1, . . . , t j ) − ω(t i , . . .,t j−1 )] (t − t i+1 )...(t − t j−1 ) .a = ω(t i+1 , . . . , t j ) − ω(t i , . . .,t j−1 ) .Como já sabemos que a = (t j − t i )ω(t i , . . .,t j ), concluímos a Equação 12.3.


12.2. FORMA DE NEWTON 13712.2.1 Exemplo do uso da forma <strong>de</strong> NewtonA Equação 12.3 permite que calculemos os ω’s em função <strong>de</strong> seus correspon<strong>de</strong>ntes <strong>de</strong> or<strong>de</strong>minferior. Isso é possível porque conhecemos os ω’s <strong>de</strong> or<strong>de</strong>m 1, que são os z i ’s. A seguintetabela mostra como po<strong>de</strong>mos esquematizar as informações.t 0 ω(t 0 )ω(t 0 , t 1 )t 1 ω(t 1 ) ω(t 0 , t 1 , t 2 )ω(t 1 , t 2 )t 2 ω(t 2 ) · · ·......... ω(t 0 , . . . , t k−1 ). ω(t 0 , . . . , t k ). . .. . ω(t 1 , . . .,t k )t k−2 ω(t k−2 ) · · ·ω(t k−1 , t k−2 )t k−1 ω(t k−1 ) ω(t k−2 , t k−1 , t k )ω(t k−1 , t k )t k ω(t k )Cada ω(t i , . . . , t j ) po<strong>de</strong> ser obtido da diferença entre os dois elementos adjacentes da colunaimediatamente à esquerda (o <strong>de</strong> baixo menos o <strong>de</strong> cima), dividida pela diferença t j − t i ,on<strong>de</strong> t i e t j são encontrados como as extremida<strong>de</strong>s da base da pirâmi<strong>de</strong> (<strong>de</strong>itada) da qualω(t i , . . . , t j ) é o cume.Por exemplo, se quisermos achar o polinômio interpolador dos pontos (0, 1), ( 1 2 , 1 2 ),, −1), (2, 0), acabaremos por montar a seguinte tabela (confira!):( 3 20 1−11 12 2− 1 3− 3 2372−132 0243Da tabela, tiramos o polinômio interpolador procurado:p(t) = 1 + (−1) · (x − 0) + (− 1 3 )(x − 0)(x − 1 2 ) + 4 3 (x − 0)(x − 1 2 )(x − 3 2 ) .Juntando termos <strong>de</strong> mesmo grau, ficamos comp(t) = 1 + 1 6 t − 3t2 + 4 3 t3 .Para verificar que <strong>de</strong>u certo, testamos os valores p(0), p( 1 2 ), p(3 2) e p(2) e vemos que batemcom 1, 1 2, −1 e 0.


138CAPÍTULO 12. TÉCNICAS DE INTERPOLAÇÃOHá outras formas <strong>de</strong> se tirar o mesmo polinômio da tabela. Por exemplo, pegando os ω’s<strong>de</strong> baixo:p(t) = 0 + 2(t − 2) + 7 3 (t − 2)(t − 3 2 ) + 4 3 (t − 2)(t − 3 2 )(t − 1 2 ) .Ou senão em “zigue-zague”:p(t) = ω(t 2 )+ω(t 1 , t 2 )(t−t 2 )+ω(t 0 , t 1 , t 2 )(t−t 2 )(t−t 1 )+ω(t 0 , t 1 , t 2 , t 3 )(t−t 2 )(t−t 1 )(t−t 0 ) ,que é igual a−1 − 3 2 (t − 3 2 ) − 1 3 (t − 3 2 )(t − 1 2 ) + 4 3 (t − 3 2 )(t − 1 )(t − 0) .2O “zigue-zague” po<strong>de</strong> servir para se escolher os melhores coeficientes, facilitando a tarefa<strong>de</strong> juntar termos <strong>de</strong> mesmo grau logo <strong>de</strong>pois, mas não é aconselhável por ser mais sujeito aerros.


Parte VIntegração <strong>de</strong> Funções139


Capítulo 13Importância da integraçãonumérica13.1 IntroduçãoNo próximo Capítulo falaremos <strong>de</strong> métodos numéricos para o cálculo <strong>de</strong> integrais <strong>de</strong>finidas,mas antes <strong>de</strong>vemos atentar para a razão <strong>de</strong> sua utilida<strong>de</strong>. O Cálculo ensina que, para seobter∫ baf(x)dx ,basta achar uma primitiva, isto é, uma função F(x) tal que F ′ (x) = f(x), <strong>de</strong> forma que∫ baf(x)dx = F(b) − F(a)(vi<strong>de</strong> Apêndice B).Uma função f é, em geral, dada por uma “fórmula”, que nada mais é do que a combinaçãofinita, via somas, multiplicações, divisões e composições <strong>de</strong> funções elementares. As funçõeselementares são as usuais: potências <strong>de</strong> x (negativas e positivas), funções trigonométricas esuas inversas, logaritmo e exponencial.Entretanto, no mundo abstrato <strong>de</strong> todas as funções possíveis, essas funções formam apenasuma minúscula parte. Em outras palavras, a gran<strong>de</strong> maioria das funções não tem umafórmula que as represente, embora nas aplicações do ‘mundo real’ os mo<strong>de</strong>los freqüentementeconduzam a funções <strong>de</strong>scritas por meio <strong>de</strong> fórmulas.Mesmo se nos restringirmos apenas às funções dadas por fórmulas, acabaremos por nos<strong>de</strong>parar com um fato matemático: nem todas elas admitem uma primitiva que também sejaescrita como combinação (finita) <strong>de</strong> funções elementares!É claro que existe o recurso <strong>de</strong> se escrever a primitiva F como uma combinação infinita<strong>de</strong> funções elementares, por exemplo através <strong>de</strong> uma série <strong>de</strong> potências∞∑F(x) = c k x k .k=0141


142CAPÍTULO 13. IMPORTÂNCIA DA INTEGRAÇÃO NUMÉRICAIsto é possível (em muitos casos <strong>de</strong> forma até razoavelmente fácil), mas com dois inconvenientes:primeiro, quando formos avaliar F(a) e F(b) através da série (ou da fórmula infinita)po<strong>de</strong> ser necessária uma quantida<strong>de</strong> tão gran<strong>de</strong> <strong>de</strong> termos (ou operações) que inviabilize outorne muito lento o cálculo. Além disso, nem sempre séries <strong>de</strong> potência convergem para todosos valores <strong>de</strong> x, o que exigiria uma análise criteriosa do alcance <strong>de</strong>ssa convergência, em cadacaso.De outra parte, é preciso também dispor <strong>de</strong> instrumentos para estimar integrais a partir<strong>de</strong> dados experimentais. As aplicações mais óbvias se encontram no cálculo <strong>de</strong> comprimentos,áreas, volumes, massa, centro <strong>de</strong> massa, distância percorrida, tempo <strong>de</strong>corrido, etc. No quesegue, discutiremos algum exemplos on<strong>de</strong> a integração numérica se faz necessária: ora por setratar <strong>de</strong> medida experimental ora porque não há primitiva elementar da função que se querintegrar.13.2 Cálculo <strong>de</strong> áreasGostaríamos <strong>de</strong> um método sistemáticopara estimar a área <strong>de</strong> figuras planascomo a mostrada ao lado (po<strong>de</strong>ria seruma ilha, por exemplo). Para isso, vamosnos basear no Princípio <strong>de</strong> Cavalieri,que diz: “dados dois conjuntos A eB, se houver uma linha L tal que todaperpendicular a L cruze A e B em intervalos<strong>de</strong> tamanhos iguais, então A eB têm a mesma área.”Por exemplo, os triângulos da figura abaixo (à esquerda) têm áreas iguais, pois cada retaR horizontal, à altura y, cruza os triângulos em segmentos <strong>de</strong> tamanho igual a l(y). Paraenten<strong>de</strong>r porque l(y) é igual para os dois triângulos, observe que em ambos l(y) varia comouma função afim (“linearmente”), em y = 0 tem-se l(0) = b (os triângulos têm bases <strong>de</strong> igualtamanho) e em y = h tem-se l(h) = 0 (os triângulos têm alturas iguais). Portanto a funçãol(y) tem o aspecto mostrado à direita, na figura.Isso explica porque todos os triângulos com base e altura iguais têm a mesma área, quepo<strong>de</strong> ser obtida <strong>de</strong> um <strong>de</strong>les, por exemplo o da direita. Essa área vale 1 2bh, e o leitor po<strong>de</strong>observar que essa também é a área sob o gráfico <strong>de</strong> l(y) (observação que será importante logoadiante).


13.2.CÁLCULO DE ÁREAS 143yhbl(y)bbO Princípio <strong>de</strong> Cavalieri tem uma formulação análoga para volumes. Dois sólidos S e Tterão mesmo volume se houver uma linha L tal que todo plano perpendicular a L cruze S eT em regiões <strong>de</strong> áreas iguais. Para o leitor que ainda não acreditou nesse princípio, imagineuma pilha <strong>de</strong> cartas com um arame passando no meio, e então incline e retorça o arame, <strong>de</strong>forma que a pilha fique <strong>de</strong>salinhada. As duas pilhas continuam tendo a mesma altura, a área<strong>de</strong> cada corte é a mesma, e o volume (que é a soma dos volumes “infinitesimais” das cartas)se mantém.0hyO que po<strong>de</strong>mos fazer com uma figura plana emgeral é criar uma segunda figura com mesmaárea apoiada no eixo horizontal. Na prática,temos que fazer isso para um número discreto<strong>de</strong> cortes verticais: medimos o comprimentodo corte e transferimos esse valor paraa segunda figura. Assim, a segunda figura éum esboço do gráfico “Comprimento do cortevs. Posição do corte”, mais precisamente é aregião compreendida entre esse gráfico e a linhahorizontal. Quando o corte ocorrer emdois intervalos separados a altura do gráficoserá igual à soma dos comprimentos das duasintersecções.yx 1x0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 101 00 1 1 0 0 1 1 0 0 1 1010 0 1 101010101x 0 ...... x 6...... x 11xAo final, teremos uma seqüência <strong>de</strong> pontos x 0 , x 1 , . . .,x n , que fornecem a posição <strong>de</strong> cadacorte, e valores correspon<strong>de</strong>ntes y 0 , y 1 , . . . , y n , que são os respectivos comprimentos <strong>de</strong> cadacorte. Esses dados é que serão usados para se fazer a integração.O curioso é que o mesmo tipo <strong>de</strong> “coleta <strong>de</strong> dados” será feito para a integração <strong>de</strong> umafunção f(x) dada por uma fórmula. Se a integração se <strong>de</strong>r no intervalo [a, b], então <strong>de</strong>ve-sedividir o intervalo com uma partiçãoa = x 0 < x 1 < x 2 < . . . < x n = be tomar os valores da função nos extremos dos intervalos da partição:y 0 = f(x 0 ) , y 1 = f(x 1 ) , . . . , y n = f(x n )


144CAPÍTULO 13. IMPORTÂNCIA DA INTEGRAÇÃO NUMÉRICA(que po<strong>de</strong>m até ser negativos). A partir <strong>de</strong>sses dados, a maneira <strong>de</strong> se proce<strong>de</strong>r será a mesma,tanto no caso ’experimental’ como no caso ’teórico’. A única diferença é que no caso ’teórico’nós teremos, na maioria dos casos, uma maneira <strong>de</strong> <strong>de</strong>limitar o erro cometido na integração.O volume <strong>de</strong> um lago ou <strong>de</strong> uma montanha também é passível <strong>de</strong> ser estimado usando essetipo <strong>de</strong> dados. Po<strong>de</strong>-se fazer isso em duas etapas. Primeiramente, escolhe-se uma direção(x, por exemplo) on<strong>de</strong> se posicionarão, perpendicularmente, as retas dos “cortes”. Para cadacorte do lago, posicionado em x i , estima-se sua área A(x i ), usando dados (y i , z i ). Depoisestima-se a integral da função “área do corte”, usando-se os dados (x i , A(x i )), que resulta novolume.13.3 Comprimento <strong>de</strong> curvas e gráficosConsi<strong>de</strong>re o seguinte problema: “calcular o comprimento do gráfico da função f entre a eb”. Se a função f for diferenciável, esse problema remete a uma integral.Para enten<strong>de</strong>r melhor, tentemos aproximar a curva por pequenos segmentos <strong>de</strong> reta eseu comprimento pela soma dos tamanhos <strong>de</strong>sses segmentos. Como sempre, dividimos ointervalo [a, b] com uma partição a = x 0 < x 1 < . . . < x n = b e em cada intervalo [x i , x i+1 ](i = 0, . . .,n−1) aproximamos a função pelo segmento <strong>de</strong> reta que une os pontos (x i , f(x i ))e (x i+1 , f(x i+1 )). Pelo Teorema <strong>de</strong> Pitágoras, esse segmento tem tamanho igual a√(xi+1 − x i ) 2 + (f(x i+1 ) − f(x i )) 2 .Para simplificar um pouco, po<strong>de</strong>mos supor que todos os intervalos tenham o mesmo tamanho∆x. Além disso, aproximamos a diferença f(x i+1 ) − f(x i ) por f ′ (x i )∆x, <strong>de</strong> forma quesomando para todos os segmentos obtenhamos, aproximadamente,n−1∑∆x √ 1 + f ′ (x i ) 2 .i=0Fazendo ∆x ir a zero estaremos, por um lado, fazendo com que a soma dos comprimentos dossegmentos esteja cada vez mais próxima do comprimento verda<strong>de</strong>iro da curva e, por outrolado, fazendo com que a aproximação pela <strong>de</strong>rivada seja cada vez mais fi<strong>de</strong>digna. No limite,teremos um número que é ao mesmo tempo o comprimento da curva e também a integral∫ ba√1 + f′(x) 2 dx .O gráfico <strong>de</strong> f entre a e b é um caso particular <strong>de</strong> curva no plano. Cada ponto <strong>de</strong>ssa curvapo<strong>de</strong> ser obtido tomando-se t no intervalo [a, b] e então o ponto (t, f(t)). Po<strong>de</strong>mos imaginaresse processo como uma função com domínio [a, b] e contradomínio R 2 , que leva t em (t, f(t)).Na verda<strong>de</strong>, po<strong>de</strong>mos generalizar para situações que não correspondam a gráficos <strong>de</strong> funções.Por exemplo, tome a funçãoγ(t) = (cost, sen t) ,com t variando no intervalo [0, 2π]. Para cada t, o ponto γ(t) é um ponto do círculo unitário,correspon<strong>de</strong>nte a um giro <strong>de</strong> ângulo t. Uma elipse é a imagem da funçãoγ(t) = (α cost, β sent) ,


13.3. COMPRIMENTO DE CURVAS E GRÁFICOS 145com t variando em [0, 2π]. Basta ver que se (x, y) pertence à curva então (x, y) = (α cost, β sen t),para algum t, logox 2α 2 + y2β 2 = 1 .Uma curva γ(t) é expressa com duas funções, uma para cada coor<strong>de</strong>nada: γ(t) = (x(t), y(t)).Se quisermos calcular o comprimento total da curva (com t variando no intervalo [a, b]), po<strong>de</strong>mosproce<strong>de</strong>r com uma idéia semelhante à exposta acima para calcular o comprimento dográfico <strong>de</strong> uma função. Dividimos o intervalo [a, b] com uma partição a = t 0 < t 1 < . . .


146CAPÍTULO 13. IMPORTÂNCIA DA INTEGRAÇÃO NUMÉRICAPor razões <strong>de</strong> simetria, po<strong>de</strong>mos integrar somente <strong>de</strong> 0 a π 2e multiplicar por quatro. Alémdisso po<strong>de</strong>mos substituir cos 2 por 1 − sen 2 , e colocar b em evidência na integral:∫ π2 √p = 4b 1 − κ2 sen 2 tdt ,0on<strong>de</strong> κ 2 é <strong>de</strong>finido como sendo1 − a2b 2 ,um número positivo e menor do que 1 (ele vale 1 quando a elipse é um círculo, e 0 quando aelipse <strong>de</strong>genera num segmento <strong>de</strong> reta vertical).A integral∫ √1− κ2 sen 2 tdté conhecida como integral elíptica do primeiro tipo, e não admite uma expressão via combinaçãofinita <strong>de</strong> funções elementares. Em outras palavras, não há uma fórmula fechada parao perímetro da elipse.13.4 Distância percorrida e tempo <strong>de</strong>corridoA Física está repleta <strong>de</strong> conceitos <strong>de</strong>finidos por meio <strong>de</strong> integração. Faremos aqui umapequena discussão sobre movimentos unidimensionais, isto é, movimentos num espaço cujaposição possa ser <strong>de</strong>terminada por apenas uma coor<strong>de</strong>nada. Po<strong>de</strong> ser o movimento <strong>de</strong> umapartícula numa reta, um carro numa estrada, um pêndulo simples, etc. O caso do pênduloserá discutido com <strong>de</strong>talhes na próxima Seção.O movimento unidimensional <strong>de</strong> um corpo po<strong>de</strong> ser <strong>de</strong>scrito por uma função x(t), on<strong>de</strong>x(t) indica a posição em cada instante <strong>de</strong> tempo t. No caso <strong>de</strong> um pêndulo, sua posição éindicada por um ângulo θ(t) (para ser mais preciso, sua posição é circular), medido a partirda posição vertical mais baixa.A velocida<strong>de</strong> do corpo v(t) é a <strong>de</strong>rivada da função x(t):v(t) = x ′ (t) ,e a aceleração é a <strong>de</strong>rivada <strong>de</strong> v(t). No caso em que a posição é <strong>de</strong>scrita por um ângulo,falamos em velocida<strong>de</strong> angular, <strong>de</strong>notada por ω(t):ω(t) = θ ′ (t) .Conhecendo a posição inicial x 0 (no instante t = 0) e a maneira como evolui a velocida<strong>de</strong>em função do tempo, po<strong>de</strong>mos recuperar a função posição:x(t) = x 0 +∫ t0v(τ)dτ ,equação que nada mais é do que o Teorema Fundamental do Cálculo. Fisicamente, po<strong>de</strong>mospensar que no instante τ, a velocida<strong>de</strong> é v(τ) e, sendo contínua, assume valores próximos av(τ) em instantes próximos a τ. Tomando um intervalo <strong>de</strong> tempo ∆τ próximo a τ, teremos


13.5.PERÍODO DO PÊNDULO E AS INTEGRAIS ELÍPTICAS 147que a distância percorrida será aproximadamente igual a v(τ)∆τ. Da divisão em pedacinhos<strong>de</strong> tamanho ∆τ do intervalo <strong>de</strong> tempo on<strong>de</strong> percurso é acompanhado, a distância percorridaé a integral <strong>de</strong> v(τ), o que justifica a fórmula <strong>de</strong> forma empírica. Da mesma forma, emcoor<strong>de</strong>nadas angulares, temosθ(t) = θ 0 +∫ t0ω(τ)dτ .Ocorre entretanto que, em muitas aplicações físicas, conhecemos a velocida<strong>de</strong> em funçãoda posição, e não do tempo. O pêndulo será um exemplo disso. Não vamos discorrer arespeito <strong>de</strong> outros exemplos, mas imagine o leitor que seja esse o caso. E suponha que agorao problema é outro: da posição inicial x 0 até a posição final x, em cada ponto ξ sabe-se quea velocida<strong>de</strong> assume o valor v(ξ) (mas nunca se anula). Quanto tempo durou o percurso?A exigência <strong>de</strong> que a velocida<strong>de</strong> não se anule no percurso po<strong>de</strong> ser justificada assim: se ocorpo pára numa posição ξ, e <strong>de</strong>pois recobra seu movimento, não há como saber quanto tempoele ficou parado, logo não há como obter uma resposta única para a pergunta. Eventualmentepo<strong>de</strong>remos consi<strong>de</strong>rar que a velocida<strong>de</strong> se anule instantaneamente, principalmente se se tratar<strong>de</strong> ξ = x 0 ou ξ = x.Como no caso anterior, po<strong>de</strong>mos dividir o espaço percorrido em pequenos intervalos <strong>de</strong>tamanho ∆ξ. Em cada intervalo, a velocida<strong>de</strong> é aproximadamente constante, por exemplo,próxima ao valor v(ξ) do extremo do intervalo. O tempo dispendido nesse pequeno trecho<strong>de</strong> percurso é aproximadamente igual a∆ξv(ξ) .Portanto somando esses tempos e fazendo ∆ξ ir a zero, teremos que o tempo <strong>de</strong>corrido seráNo caso angular, temosT =T =∫ xx 01v(ξ) dξ .∫ θθ 01ω(ξ) dξ ,on<strong>de</strong> ξ agora representa a variável angular <strong>de</strong> posição. Esta fórmula será aplicada na próximaSeção para se calcular o período do pêndulo simples.13.5 Período do pêndulo e as integrais elípticasConsi<strong>de</strong>remos um pêndulo simples sem atrito. Mostraremos que a Lei <strong>de</strong> Conservação daEnergia implica que a velocida<strong>de</strong> <strong>de</strong>pen<strong>de</strong> somente da posição do pêndulo.A energia cinética do pêndulo é dada por 1 2 mv2 , on<strong>de</strong> v representa sua velocida<strong>de</strong> linear.Se o comprimento da haste for igual a l, essa velocida<strong>de</strong> é igual a lω, on<strong>de</strong> ω é a velocida<strong>de</strong>angular.Por outro lado, a energia potencial é igual a mgh, on<strong>de</strong> h é a altura do pêndulo em relaçãoao solo. A bem da verda<strong>de</strong> a energia potencial é uma gran<strong>de</strong>za relativa, o que quer dizer que


148CAPÍTULO 13. IMPORTÂNCIA DA INTEGRAÇÃO NUMÉRICApo<strong>de</strong>mos somar uma constante a essa energia e nada se alterará. Ou ainda, quer dizer quepo<strong>de</strong>mos supor que o solo está na altura que quisermos, inclusive acima do pêndulo!! Aquiassumiremos que o solo está na altura do ponto mais baixo do pêndulo, <strong>de</strong> forma que a h serelaciona com a coor<strong>de</strong>nada angular θ porh = l − l cosθ .01θl00 1100 1100 11hA energia total é a soma da energia cinética com a energia potencial, e essa energia éconstante:12 ml2 ω 2 + mgl(1 − cosθ) = E .Mas quanto vale essa constante E?Observe que a constante E tem a ver com a amplitu<strong>de</strong> θ 0 do movimento: quanto maiorfor a amplitu<strong>de</strong>, maior será essa energia. Para não ficar dúvidas, θ 0 representa o ângulomáximo que o pêndulo alcança a partir da posição vertical mais baixa, logo o maior valorque po<strong>de</strong> assumir, em tese, é π (estamos evitando consi<strong>de</strong>rar o movimento em que a posiçãoθ = π é “atravessada”). Quando o pêndulo atinge o ângulo máximo (θ 0 ou −θ 0 , tanto faz),há uma reversão do movimento, e a velocida<strong>de</strong> angular instantaneamente se anula. Nessecaso, a energia cinética é nula, e toda a energia se concentra na energia potencial. Em outraspalavras, a energia total E é igual à energia potencial no ângulo máximo θ 0 .Substituindo na equação acima, obtemosω 2 = 2gl[(1 − cosθ 0 ) − (1 − cosθ)] .A expressão entre colchetes po<strong>de</strong> ser simplificada para cosθ − cosθ 0 , porém mais tar<strong>de</strong> voltaremosa <strong>de</strong>ixá-la <strong>de</strong>ssa forma por razões técnicas.Notemos que essa equação tem duas soluções, uma positiva e uma negativa. De todaforma, ela evi<strong>de</strong>ncia a <strong>de</strong>pendência da velocida<strong>de</strong> angular em relação à posição: fixada aamplitu<strong>de</strong> θ 0 do movimento, para cada posição θ (entre −θ 0 e θ 0 ), a velocida<strong>de</strong> angular ωsó po<strong>de</strong> assumir dois valores, um negativo e um positivo, e ambos <strong>de</strong> igual módulo. Um dosvalores representa o movimento <strong>de</strong> “ida” do pêndulo e o outro <strong>de</strong> “volta”.Para obter o período do pêndulo, po<strong>de</strong>mos calcular o tempo <strong>de</strong>corrido para se ir <strong>de</strong> −θ 0até θ 0 , no movimento <strong>de</strong> “ida” (velocida<strong>de</strong> angular positiva). De fato, pela simetria do


13.5.PERÍODO DO PÊNDULO E AS INTEGRAIS ELÍPTICAS 149movimento, basta analisar o percurso <strong>de</strong> θ = 0 até θ = θ 0 , percorrido em um quarto doperíodo. Levando em conta as consi<strong>de</strong>rações da Seção anterior, teremoslogo√lT = 4 ·2g∫Tθ04 = 10 ω(θ) dθ ,∫ θ001√ cosθ − cosθ0dθ .Vale apenas examinarmos com mais atenção essa integral, tentando esboçar o integrando.Primeiro <strong>de</strong>senhamos a função cosθ, marcando a altura <strong>de</strong> cosθ 0 (que po<strong>de</strong> ser negativo, seθ 0 > π 2 ). A partir daí esboçamos a função cosθ − cosθ 0, no intervalo [0, θ 0 ], que é o que nosinteressa. Essa função tem <strong>de</strong>rivada não nula em θ 0 , a não ser que θ 0 = π, mas esse caso nãoserá consi<strong>de</strong>rado.cosθ −cosθ 0( cosθ −cosθ 0) 1/2 ( cosθ −cosθ 0) −1/20π2θ 0πθθθ0 θ 0θ 00√Em seguida, extraímos a raiz <strong>de</strong>ssa função, e observamos que a inclinação da funçãocosθ − cosθ0 vai a infinito quando θ vai a θ 0 . Como a função original tinha “cara” <strong>de</strong>c(θ 0 − θ) (perto <strong>de</strong> θ 0 ), quando tiramos a raiz ela fica com “cara” <strong>de</strong> c(θ 0 − θ) 1 2 (bastacomparar com os gráficos y = cx e y = √ cx, porém afirmações mais precisas po<strong>de</strong>m serobtidas usando Fórmula <strong>de</strong> Taylor, vi<strong>de</strong> Apêndice C).Acontece que o integrando é (cosθ − cosθ 0 ) − 1 2, que tem “cara” <strong>de</strong> c(θ 0 − θ) − 1 2 perto <strong>de</strong>θ 0 . É uma função divergente em θ 0 (vai a infinito), e é natural que nos questionemos sobrea convergência da integral. Fisicamente sabemos que a integral tem que convergir, pois opêndulo alcança o ângulo <strong>de</strong> amplitu<strong>de</strong> máxima em tempo finito. Mas e matematicamente?É empírico porém extremamente válido pensar na integrabilida<strong>de</strong> da função x − 1 2 entre0 e 1. Neste caso, a divergência ocorre em x = 0. Essa integral existe, pois se tomarmos aintegral∫ 1∣x −1/2 dx = 2x 1/2 ∣∣1= 2(1 − a a1/2 ) ,ateremos que ela ten<strong>de</strong> a 2 quando a ten<strong>de</strong> a zero, e portanto converge. De fato, a integral<strong>de</strong> qualquer função x −α , com 0 < α < 1 existe em (0, 1), pelas mesmas razões. Fica para oleitor verificar que o mesmo não ocorre com α ≥ 1!Apesar <strong>de</strong> não haver problema quanto à convergência da integral que fornece o períododo pêndulo, veremos no próximo Capítulo que nossos métodos se prestarão mais a funções


150CAPÍTULO 13. IMPORTÂNCIA DA INTEGRAÇÃO NUMÉRICAque sejam contínuas no intervalo <strong>de</strong> integração, inclusive nos extremos. O “pulo do gato”neste caso é que uma mudança <strong>de</strong> coor<strong>de</strong>nadas (muito) esperta po<strong>de</strong> transformar a integralacima numa outra cujo integrando seja uma função contínua <strong>de</strong>ntro <strong>de</strong> um intervalo, istoé, sem pontos <strong>de</strong> divergência. Façamos então essa mudança <strong>de</strong> coor<strong>de</strong>nadas, que a bem daverda<strong>de</strong> será uma seqüência <strong>de</strong> duas substituições.A primeira substituição será inofensiva. Faremos η = θ θ 0(logo dη = dθθ 0), e ficaremos comuma integral no intervalo (0, 1) (in<strong>de</strong>pen<strong>de</strong>ntemente <strong>de</strong> θ 0 ):√lT = 4 ·2g · θ 0∫ 101√cos(ηθ0 ) − cosθ 0dη .Em seguida lembramos <strong>de</strong> como estava escrito o radicando, para obtermos√cos(ηθ0 ) − cosθ 0 = √ (1 − cosθ 0 ) − (1 − cos(ηθ 0 )) = √ √1 − cosθ 0 · 1 − 1 − cos(ηθ 0),1 − cosθ 0e já tiramos o fator (1 − cosθ 0 ) − 1 2 para fora da integral. Só para não nos per<strong>de</strong>rmos nascontas, o conjunto <strong>de</strong> termos que multiplica a integral é√l4 ·2g · θ 0√ . 1 − cosθ0Observe que a fração1 − cos(ηθ 0 )1 − cosθ 0varia monotamente <strong>de</strong> 0 a 1 quando η varia <strong>de</strong> 0 a 1. Fazemos então a substituiçãosen 2 ξ = 1 − cos(ηθ 0)1 − cosθ 0,on<strong>de</strong> ξ varia entre 0 e π 2 . Daí teremos uma integral <strong>de</strong> 0 a π 2 cos ξ, mas precisamos colocartudo em função <strong>de</strong> ξ. Diferenciando os dois lados da equação acima e dividindo por cosξ,obtemosθ 02 senξdξ = sen(θ 0 η) dη1 − cosθ 0 cosξ ,logo<strong>de</strong>dηdηcosξ = 2(1 − cosθ 0) sen ξ·θ 0 sen(θ 0 η) dξ .Note que ainda temos um termo <strong>de</strong>pen<strong>de</strong>ndo <strong>de</strong> η. Da equação on<strong>de</strong> introduzimos a substituição,po<strong>de</strong>mos isolar cos(θ 0 η):cos(θ 0 η) = 1 − (1 − cosθ 0 )sen 2 ξ ,logosen(θ 0 η) = √ 1 − [1 − (1 − cosθ 0 )sen 2 ξ] 2


13.6.CÁLCULO DE π E DE LOGARITMOS 151ou, simplificando,sen(θ 0 η) = √ 2 √ 1 − cosθ 0 sen ξ√1 − 1 − cosθ 02sen 2 ξ .Já que1−cos θ02é sempre um número não negativo, <strong>de</strong>nominamosκ 2 = 1 − cosθ 02e juntando tudo obtemos (<strong>de</strong>pois <strong>de</strong> vários cancelamentos)√∫ πl 2 1T = 4 √g 1 − κ2 sen 2 ξ dξ .0Se θ 0 < π então κ 2 < 1 e o <strong>de</strong>nominador do integrando nunca se anula. Portanto esteintegrando é contínuo no intervalo [0, π 2 ]. No caso em que θ 0 = π o integrando é divergenteem π 2e a própria integral é divergente (o leitor é convidado a comparar com sua intuiçãofísica). De fato, quanto mais θ 0 se aproxima <strong>de</strong> π maior se torna T, em outras palavras, operíodo do movimento vai a infinito quando a amplitu<strong>de</strong> se aproxima <strong>de</strong> π.Por outro lado, quando a amplitu<strong>de</strong> se aproxima <strong>de</strong> 0 significa que κ 2 se aproxima <strong>de</strong>0, e o integrando se aproxima da função constante igual a 1. Isso implica que o período seaproxima do conhecido valor√l2πg .A integral∫1√1 − κ2 sen 2 ξ dξ ,com 0 < κ 2 < 1, é conhecida como integral elíptica do segundo tipo e não po<strong>de</strong> ser expressa pormeio <strong>de</strong> combinações finitas <strong>de</strong> funções elementares. Portanto não há uma fórmula fechadapara o período do pêndulo em função da amplitu<strong>de</strong> do movimento.13.6 Cálculo <strong>de</strong> π e <strong>de</strong> logaritmosA integração numérica se presta também para calcular constantes matemáticas, por exemploo número π, que é <strong>de</strong>finido como sendo a área do círculo unitário. Como para o círculounitário se tem x 2 + y 2 = 1, então y = ± √ 1 − x 2 , ou seja,∫ 1 √π = 2 1 − x2 dx .−1Aqui é possível até achar uma primitiva para o integrando, mas o problema é que essaprimitiva acabará sendo expressa em termos <strong>de</strong> π. Po<strong>de</strong>-se mostrar teoricamente que o ladodireito é igual ao esquerdo, obtendo-se uma bela equação π = π!!!! O valor numérico <strong>de</strong> π sópo<strong>de</strong>rá ser obtido, no entanto, se fizermos a integração precisa da função no integrando.,


152CAPÍTULO 13. IMPORTÂNCIA DA INTEGRAÇÃO NUMÉRICAOutra maneira <strong>de</strong> se obter π via integração é usando o fato <strong>de</strong> queComo arctan(0) = 0, então(arctanx) ′ = 11 + x 2 .arctanx =∫ x011 + t 2 dt .Aí nos aproveitamos do fato <strong>de</strong> que arctan1 = π 4, <strong>de</strong> forma a po<strong>de</strong>rmos expressar π comouma integral∫ 1π = 4011 + t 2 dt .Lembremos também que o logaritmo é <strong>de</strong>finido através <strong>de</strong> uma integração. Comolnx ≡∫ x(vi<strong>de</strong> Apêndice B), então para cada x o valor numérico <strong>de</strong> lnx será obtido como uma área<strong>de</strong>baixo do gráfico <strong>de</strong> uma função.A constante e é <strong>de</strong>finida como sendo o (único) número que satisfaz a equação1lnx = 1 .Ele po<strong>de</strong> ser obtido, por exemplo, resolvendo-se essa equação pelo Método <strong>de</strong> Newton. Sóque, para sermos honestos, temos que aplicar o Método <strong>de</strong> Newton calculando todos oslogaritmos através da integração numérica (vi<strong>de</strong> Exercício na Seção 15.2).1t dt13.7 A gaussianaComo vimos na Subseção 4.3.6, a distribuição <strong>de</strong> probabilida<strong>de</strong> mais comum na natureza édada pela funçãoP τ,σ (x) = 1σ √ − τ)2exp{−(t2π 2σ 2 } .Para sabermos a probabilida<strong>de</strong> <strong>de</strong> ocorrer um evento <strong>de</strong>ntro do intervalo [a, b] precisamoscalcular a integral∫ baP τ,σ (t)dt .É um pouco chato calcular integrais com essas constantes, mas através <strong>de</strong> uma mudança<strong>de</strong> coor<strong>de</strong>nadas po<strong>de</strong>mos reduzir o problema a calcular integrais <strong>de</strong> e −x2 . Por exemplo,tomemos u = t − τ (du = dt). Então∫ baP τ,σ (t)dt = 1 ∫ b−τσ √ e − u22σ 2 du .2π a−τ


13.7. A GAUSSIANA 153Em seguida, fazemos outra mudança <strong>de</strong> coor<strong>de</strong>nadas x = uσ √ 212σ 2√ π∫ b−τσ √ 2a−τσ √ 2e −x2 dx ,du(dx =σ √ ). Obtemos2isto é, uma integral <strong>de</strong> e −x2 no intervalo [A, B], on<strong>de</strong> A = a−τσ √ 2 e B = b−τσ √ 2 .Acontece que e −x2 é uma daquelas funções que não têm fórmula para sua primitiva, ea partir daí só se prossegue com estimativas numéricas. Em probabilida<strong>de</strong>, como é muitofreqüente o uso <strong>de</strong>ssa integral, adotam-se tabelas com precisão limitada mas razoável, queservem para a maioria dos propósitos. Essas tabelas po<strong>de</strong>m ser facilmente montadas com osmétodos <strong>de</strong> integração do próximo Capítulo.


154CAPÍTULO 13. IMPORTÂNCIA DA INTEGRAÇÃO NUMÉRICA


Capítulo 14Métodos <strong>de</strong> integração numérica14.1 IntroduçãoQueremos resolver o seguinte problema: “dada uma função f : [a, b] → R, achar a integral<strong>de</strong> f nesse intervalo, <strong>de</strong>notada por∫ baf(x)dx ′′ .Aqui trataremos <strong>de</strong> dois métodos <strong>de</strong> integração <strong>de</strong> funções, a saber, o Método dos Trapéziose o Método <strong>de</strong> Simpson.14.2 O Método dos TrapéziosA primeira coisa a fazer é dividir o intervalo [a, b] em n intervalos (não necessariamente <strong>de</strong>tamanhos iguais). Isto é, fixar x 0 = a (extremo esquerdo do intervalo) e x n = b (extremodireito do intervalo), e escolher pontos x 1 , . . . , x n−1 entre a e b <strong>de</strong> modo que valhaa = x 0 < x 1 < x 2 < x 3 < . . . < x n−1 < x n = b .Em seguida, <strong>de</strong>ve-se estimar a área (com sinal) entre cada par <strong>de</strong> pontos sucessivos. Porexemplo, entre x i e x i+1 : po<strong>de</strong>mos aproximar essa área tomando o retângulo cuja base é ointervalo [x i , x i+1 ] e cuja altura seja a média entre f(x i ) e f(x i+1 ). Esse retângulo terá área<strong>de</strong>f(x i ) + f(x i+1 )· (x i+1 − x i ) .2Finalmente, somam-se as estimativas <strong>de</strong> cada retângulo, obtendo-se a área (aproximada)total.Algumas observações são pertinentes. Para começar, por que o Método dos Trapéziosassim se chama? Afinal, nenhum trapézio apareceu para justificar o nome...!155


156CAPÍTULO 14. MÉTODOS DE INTEGRAÇÃO NUMÉRICAObserve que em vez <strong>de</strong> termos pego o retângulo com altura média(f(x i ) + f(x i+1 ))/2 po<strong>de</strong>ríamos ao invés ter pego o trapézio cujosvértices são (x i , 0), (x i+1 , 0), (x i+1 , f(x i+1 )) e (x i , f(x i )). A área <strong>de</strong>ssetrapézio po<strong>de</strong> ser calculada da seguinte forma: completamos a alturacom um trapézio <strong>de</strong> mesmas proporções, formando um retângulo <strong>de</strong> alturaf(x i ) + f(x i+1 ) e base x i+1 − x i . A área <strong>de</strong>sse retângulo é o dobroda área do trapézio, don<strong>de</strong> essa última <strong>de</strong>ve valerf(x i )f(x i+1 )f(x i ) + f(x i+1 )2· (x i+1 − x i ) ,x i x i+1ou seja, o mesmo valor que tínhamos obtido <strong>de</strong> outra forma!Não é preciso que o espaçamento entre os pontos seja sempre igual, mas se for facilitabastante. Suponha que a distância entre eles seja igual a h, isto é,x 1 − x 0 = x 2 − x 1 = x 3 − x 2 = . . . = x n − x n−1 = h .Então o trapézio com base [x i , x i+1 ] tem áreah2 (f(x i) + f(x i+1 )) .Para todos os trapézios aparece a multiplicação por h 2, portanto po<strong>de</strong>mos <strong>de</strong>ixar essa multiplicaçãopor último (o que é o mesmo que colocar em evidência esse fator). Então a áreatotal dos trapézios seráh2 (f(x 0) + f(x 1 ) + f(x 1 ) + f(x 2 ) + f(x 2 ) + f(x 3 ) + . . .. . . + f(x n−2 ) + f(x n−1 ) + f(x n−1 ) + f(x n )) .Excetuando o primeiro e o último termo, todos os outros aparecem duas vezes na soma.Então a área total seráh2 {f(x 0) + 2f(x 1 ) + 2f(x 2 ) + . . . + 2f(x n−1 ) + f(x n )} .Isso facilita bastante na hora <strong>de</strong> se fazer as contas!!Outra pergunta: que erro estamos cometendo ao fazer a aproximação da área por trapézios?Veremos mais adiante como calcular esse erro. Por enquanto ficamos com a percepção (correta)<strong>de</strong> que nosso resultado será tanto mais preciso quanto menor for o tamanho dos intervalinhosda divisão. Nem sempre porém nos interessa calcular a integral <strong>de</strong> funções exatamenteconhecidas, pois muitas vezes estamos diante <strong>de</strong> uma função obtida através <strong>de</strong> dados experimentais.Ou senão queremos simplesmente estimar a área <strong>de</strong> uma região, e colhemosos dados <strong>de</strong> forma semelhante ao que foi feito acima: para cada x i , medimos o valor y i dafunção. Todo o procedimento será o mesmo. A única coisa é que não po<strong>de</strong>remos controlar aprecisão da estimativa, por falta <strong>de</strong> mais informações sobre a função e <strong>de</strong>vido ao erro inerenteaos dados experimentais.Para exemplificar o uso do Método dos Trapézios, ilustremos com um exemplo cujo resultadoé bem conhecido. Sabendo que a <strong>de</strong>rivada da função arctan é11+x 2 , segue que∫ 1011 + x 2 dx = arctan(1) − arctan(0) = π 4 ,


14.3. O MÉTODO DE SIMPSON 157pelo Teorema Fundamental do Cálculo. Logo a estimativa <strong>de</strong>ssa integral levará a uma estimativado valor <strong>de</strong> π.Como ainda não falamos em estimativa <strong>de</strong> erro para o Método, nossa escolha em relaçãoao tamanho dos intervalos da partição e ao número <strong>de</strong> algarismos significativos será arbitrária.Mais adiante veremos como fazer escolhas mais conscientes.Dividiremos o intervalo [0, 1] em 10 intervalos iguais, ou seja, faremos h = 0.1. Entãoπ4 ≈ 0.1 {f(0) + 2f(0.1) + 2f(0.2) + . . . + 2f(0.9) + f(1)} ,2on<strong>de</strong> f(x) = 11+x 2 é a função do integrando. Os dados para realizar essa soma (com 5algarismos significativos) são:i x i f(x i )0 0.0 1.00001 0.1 0.990102 0.2 0.965143 0.3 0.917434 0.4 0.862075 0.5 0.800006 0.6 0.735297 0.7 0.671148 0.8 0.609769 0.9 0.5524910 1.0 0.50000Entãof(0) + 2f(0.1) + 2f(0.2) + . . . + 2f(0.9) + f(1) ≈ 15.700 ,logoπ ≈ 4 × 0.12× 15.700 = 3.1400 ,valor à distância <strong>de</strong> aproximadamente 1.6 × 10 −3 do valor verda<strong>de</strong>iro.14.3 O Método <strong>de</strong> SimpsonSe notarmos bem, no Método dos Trapézios o que nós fizemos foi aproximar a função f, emcada intervalo, por uma reta coinci<strong>de</strong>nte com a função nos extremos. O Método <strong>de</strong> Simpsoné um melhoramento <strong>de</strong>ssa estratégia, pois consi<strong>de</strong>ra polinômios quadráticos como forma <strong>de</strong>aproximar a função. Vejamos como ele funciona.Como no Método dos Trapézios, a primeira coisa a fazer é dividir o intervalo <strong>de</strong> integraçãoem intervalinhos, só que agora em um número par <strong>de</strong> intervalos. Ou seja, <strong>de</strong>nominar x 0 = a,x 2n = b e escolher pontos intermediáriosa = x 0 < x 1 < x 2 < . . . < x 2n−2 < x 2n−1 < x 2n = b .


158CAPÍTULO 14. MÉTODOS DE INTEGRAÇÃO NUMÉRICADepois para cada i = 0, . . .,n − 1 consi<strong>de</strong>rar os três pontos x 2i , x 2i+1 , x 2i+2 e os valoresrespectivos da função avaliada nesses três pontos: f(x 2i ), f(x 2i+1 ), f(x 2i+2 ). Para simplificara notação, chamar esses valores <strong>de</strong> y 2i , y 2i+1 , y 2i+2 .Em seguida encontrar o único polinômio quadrático (isto é, <strong>de</strong> grau 2) p i (x) tal quep i (x 2i ) = y 2i , p i (x 2i+1 ) = y 2i+1 , p i (x 2i+2 ) = y 2i+2 ,e usar esse polinômio p i (x) como aproximação para a função no intervalo [x 2i , x 2i+2 ] (opolinômio po<strong>de</strong> ser achado com qualquer um dos métodos <strong>de</strong>scritos na Seção 1.5 ou noCapítulo 12). Assim a integralé aproximada pela integral∫ x2i+2x 2i∫ x2i+2f(x)dxx 2ip i (x)dx .Finalmente, há que se somar as aproximações obtidas em cada intervalo para se obter aaproximação <strong>de</strong>∫ baf(x)dx .Vejamos como fica o caso em que todos os intervalos da partição têm o mesmo tamanho h.Resultará daí uma fórmula bastante elegante para a aproximação da integral (parecida coma fórmula <strong>de</strong> integração pelo Método dos Trapézios), conhecida como fórmula <strong>de</strong> Simpson.Em primeiro lugar, temos que <strong>de</strong>senvolver em <strong>de</strong>talhe o passo do procedimento que consisteem achar o polinômio interpolador pelos três pontos (x 2i , y 2i ), (x 2i+1 , y 2i+1 ) e (x 2i+2 , y 2i+2 ).Como não estamos interessados no polinômio em si mas sim na sua integral <strong>de</strong>finida no intervalo[x 2i , x 2i+2 ], será mais simples trabalharmos no intervalo [−h, h], interpolando os pontos(−h, y 2i ), (0, y 2i+1 ) e (h, y 2i+2 ) (fica ao leitor <strong>de</strong>talhista a tarefa <strong>de</strong> mostrar por que isso po<strong>de</strong>ser realmente feito).O polinômio interpolador p(x) = p i (x) po<strong>de</strong> ser calculado como no Capítulo 12, com oauxílio dos polinômios <strong>de</strong> Lagrange:x(x − h)p(x) = y 2i(−h)(−2h) + y (x + h)(x − h) (x + h)x2i+1+ y 2i+2h(−h) (2h)(h) ,isto é,Daí quep(x) = 12h 2 {x(x − h)y 2i − 2(x + h)(x − h)y 2i+1 + x(x + h)y 2i+2 } .∫ h−hp(x)dx ={ ∫1 h2h 2 y 2i−h∫ h∫ }hx(x − h)dx − 2y 2i+1 (x + h)(x − h)dx + y 2i+2 x(x + h)dx .−h−h


14.3. O MÉTODO DE SIMPSON 159Fazemos então uma a uma cada uma das três integrais:∫ h−hSemelhantemente,ex(x − h)dx == x33∣h−h= 2 3 h3 .∫ h−h∫ h− h x22−h∣h∣(x 2 − hx)dx =h( h3==(x + h)(x − h)dx =∫ h−hCom esses valores, voltamos à integral <strong>de</strong> p(x):∫ h−h3 − (−h)33∫ h−h(x + h)xdx = 2 3 h3 .) ( ) h2− h2 − (−h)2 =2x 2 − h 2 dx = − 4 3 h3p(x)dx = h 3 (y 2i + 4y 2i+1 + y 2i+2 ) .Observe como, à semelhança do Método dos Trapézios, essa fórmula facilita o cômputogeral da aproximação, mesmo com uma subdivisão em muitos intervalos. Se, como acima,tivermos a partição do intervalo [a, b] em 2n intervalos, todos com tamanho h, então a soma<strong>de</strong> todas as aproximações seráh3 {(y 0 + 4y 1 + y 2 ) + (y 2 + 4y 3 + y 4 ) + . . . + (y 2n−2 + 4y 2n−1 + y 2n )} ,que é igual ah3 {y 0 + 4y 1 + 2y 2 + 4y 3 + 2y 4 + . . . + 2y 2n−2 + 4y 2n−1 + y 2n } .∫Para exemplificar e comparar com o Método dos Trapézios, calculemos a mesma integral1 10 1+xdx usando a mesma divisão <strong>de</strong> intervalinhos (neste caso é possível porque o número2<strong>de</strong> intervalos é par). Usaremos 9 algarismos significativos. Obtemose2(y 2 + y 4 + y 6 + y 8 ) = 6.337315294(y 1 + y 3 + y 5 + y 7 + y 9 ) = 15.7246294 ,<strong>de</strong> modo que∫ 11 0.1dx ≈ (1.0000 + 6.33731529 + 15.7246294 + 0.50000) ,1 + x2 30ou seja,∫ 11π = 4 dx ≈ 3.14159263 ,0 1 + x2 valor que difere <strong>de</strong> π por menos do que 3 × 10 −8 , resultado bem melhor do que o obtido noMétodo dos Trapézios.


160CAPÍTULO 14. MÉTODOS DE INTEGRAÇÃO NUMÉRICA


Capítulo 15Estimativa do erro nos métodos<strong>de</strong> integração15.1 Fórmulas <strong>de</strong> erro e comparação dos métodosAparentemente o Método <strong>de</strong> Simpson se revela melhor do que o Método dos Trapézios. Paraverificar melhor essa afirmação, olhemos para a seguinte tabela, que mostra os cálculos feitospara se obter π com os dois métodos para os valores <strong>de</strong> h iguais a 1 4 , 1 8 , 116 e 1 32. Os cálculosforam feitos com o software Maple, usando-se 20 algarismos significativos. A primeira colunaindica o número <strong>de</strong> intervalos da partição e a coluna seguinte o tamanho <strong>de</strong> cada intervalo dapartição. Na terceira e na quinta os valores <strong>de</strong> T(h) e S(h), multiplicados por quatro (paracomparar com π). Usaremos T(h) para <strong>de</strong>notar a estimativa da integral ∫ 1 10 1+xdx com o 2Método dos Trapézios e S(h) a estimativa da mesma integral com o Método <strong>de</strong> Simpson. Naquarta e na sexta estão as diferenças, em valor absoluto, entre os números obtidos e o valorπ = 3.1415926535897932385 ,fornecido pelo Maple com 20 algarismos significativos.n h 4T(h) |4T(h) − π| 4S(h) |4S(h) − π|4 1/4 3.131 0.011 3.141569 2.4 × 10 −58 1/8 3.1390 0.0026 3.14159250 1.5 × 10 −716 1/16 3.14094 0.00065 3.1415926512 2.4 × 10 −932 1/32 3.14143 0.00016 3.141592653552 3.7 × 10 −11Na tabela po<strong>de</strong>mos observar que o Método <strong>de</strong> Simpson não só é mais eficiente (comparena primeira linha, por exemplo), mas a cada vez que h é diminuído a sua eficácia é proporcionalmentemaior do que a do Método dos Trapézios. A cada vez que h é reduzido por 2, oerro no Método dos Trapézios diminui aproximadamente 4 vezes, enquanto que no Método<strong>de</strong> Simpson, neste exemplo, a redução é <strong>de</strong> pelo menos 64 vezes!!Devotaremos o restante <strong>de</strong>ste Capítulo à discussão da eficácia dos dois métodos. Gostaríamos<strong>de</strong> ter, por exemplo, uma estimativa máxima para o erro cometido na integração <strong>de</strong>161


162CAPÍTULO 15. ESTIMATIVA DO ERRO NOS MÉTODOS DE INTEGRAÇÃOuma função f : [a, b] → R, dado o tamanho h dos intervalos da partição. Essa estimativa seráchamada <strong>de</strong> E T , no caso do Método dos Trapézios, e E S , no caso do Método <strong>de</strong> Simpson.Tanto E T como E S <strong>de</strong>pen<strong>de</strong>rão <strong>de</strong> f, do tamanho total b − a do intervalo <strong>de</strong> integração e<strong>de</strong> h. No entanto, assumiremos f e o intervalo [a, b] como fixos, <strong>de</strong> forma que freqüentementeexprimiremos apenas a <strong>de</strong>pendência em relação a h, <strong>de</strong>ssas estimativas: E T = E T (h)e E S = E S (h).O significado <strong>de</strong> E T (h) (e similarmente <strong>de</strong> E S (h)) é o seguinte. Se calcularmos T(h), entãosaberemos, com absoluta certeza, que o valor correto da integral está entre T(h) − E T (h) eT(h) + E T (h). É claro que essa interpretação não leva em conta os erros <strong>de</strong> arredondamentocometidos nos cálculos, <strong>de</strong>vidos à limitação no número <strong>de</strong> algarismos significativos. Poroutro lado, o conhecimento prévio do erro inerente ao processo permite avaliar com quantosalgarismos significativos <strong>de</strong>ve ser feita a integração.Além disso é importante salientar que E T (h) (e similarmente E S (h)) não me<strong>de</strong> a realdiferença entre o valor obtido T(h) e o valor verda<strong>de</strong>iro. Essa diferença é, com certeza,apenas menor do que E T (h). Por exemplo, na <strong>de</strong>terminação <strong>de</strong> π que fizemos acima, ocálculo <strong>de</strong> E T (h) e E S (h), <strong>de</strong> acordo com as fórmulas que discutiremos abaixo, leva a valoresmuito maiores do que a real diferença entre os valores <strong>de</strong> T(h) e S(h) e o valor verda<strong>de</strong>iro.Po<strong>de</strong>-se dizer então que a previsão <strong>de</strong> erro foi bastante pessimista. Em outros casos, porém,ela po<strong>de</strong> acabar sendo realista, e isso vai <strong>de</strong>pen<strong>de</strong>r muito da função integranda.Na Seção seguinte nos preocuparemos em calcular E T (h) e E S (h). Usaremos três abordagensdiferentes para o problema, obtendo ao final resultados similares, e adotaremos, naprática, aquelas que julgaremos ser as melhores estimativas. Os resultados estão expostos natabela abaixo.1 a 2 a 3 a1E T (h)12 max |f ′′ | · |b − a|h 2 112 max |f ′′ | · |b − a|h 2 5 12 max |f ′′ | · |b − a|h 21E S (h)24 max |f ′′′ | · |b − a|h 3 1180 max |f(iv) | · |b − a|h 4 1 45 max |f(iv) | · |b − a|h 4Para enten<strong>de</strong>rmos melhor o significado <strong>de</strong>sta tabela, percebemos primeiro que todas asfórmulas são do tipo Ch β , com β igual a 2, 3 ou 4. Nas constantes, está presente o máximovalor absoluto <strong>de</strong> certas <strong>de</strong>rivadas <strong>de</strong> f, máximo que <strong>de</strong>ve ser avaliado <strong>de</strong>ntro do intervalo[a, b].Quem será menor, C 2 h 2 , C 3 h 3 ou C 4 h 4 ? Ou colocando em números, a título <strong>de</strong> exemplo,quem é menor, 1000h 4 ou 0.2h 2 ?Evi<strong>de</strong>ntemente não há resposta a essa pergunta, pois se h = 0.5, por exemplo, então1000h 4 = 62.5, que é (bem) maior do que 0.2h 2 = 0.05, mas por outro lado se h = 0.01então 1000h 4 = 10 −5 , menor do que 0.2h 2 = 2 × 10 −5 . Na verda<strong>de</strong>, mesmo que 1000h 4 sejamaior do que 0.2h 2 , para certos valores <strong>de</strong> h, isso nunca vai acontecer se h for suficientementepequeno, pois1000h 40.2h 2 = 5000h2 → 0quando h ten<strong>de</strong> a zero. O limite indica mais ainda do que isso: a razão entre 1000h 4 e 0.2h 2é tanto menor quanto menor for h. Se, por exemplo, quisermos que 1000h 4 seja 100 vezesmenor do que 0.2h 2 , então basta tomar h menor do que 0.0014 (truncamento <strong>de</strong> 500000 −1/2 ).


15.2.APLICAÇÃO DAS FÓRMULAS DE ERRO 163Nesta linha <strong>de</strong> raciocínio, quando h ten<strong>de</strong> a ser pequeno, as melhores estimativas ten<strong>de</strong>ma ser aquelas que têm mais alta potência <strong>de</strong> h. São melhores nesse sentido, portanto, asestimativas do Método <strong>de</strong> Simpson, e <strong>de</strong>ntre elas a segunda, pois, <strong>de</strong>ntre as duas com h 4 , éaquela com menor constante multiplicativa:E S (h) = 1180 max |f(iv) | · |b − a|h 4 .As três estimativas para o Método dos Trapézios são da mesma or<strong>de</strong>m (h 2 ), sendo a terceiraum pouco pior do que as outras duas, por apresentar constante multiplicativa maior. EntãoE T (h) = 112 max |f ′′ | · |b − a|h 2 .Essas duas estimativas são as que iremos adotar nas aplicações práticas.15.2 Aplicação das fórmulas <strong>de</strong> erroNesta Seção aplicaremos as fórmulas <strong>de</strong> erro no cálculo <strong>de</strong>ln 2 =∫ 211x dx .Suponha que queiramos calcular ln 2 com precisão <strong>de</strong> 5 × 10 −5 , ou seja queremos que o valorcorreto esteja a menos <strong>de</strong> 5 × 10 −5 do valor estimado. Usaremos as fórmulas <strong>de</strong> erro para<strong>de</strong>terminar em quanto <strong>de</strong>vemos fixar h para obter estimativas com essa precisão.Examinemos primeiramente o Método dos Trapézios. Sua fórmula <strong>de</strong> erro envolve |b −a|,que é igual a 1, e o maior valor absoluto da <strong>de</strong>rivada segunda <strong>de</strong> f nesse intervalo. Ora, comof(x) = 1 x , então f ′ (x) = − 1 xe f ′′ (x) = 22 x. Logo f ′′ (x) é uma função positiva e <strong>de</strong>crescente3no intervalo consi<strong>de</strong>rado, atingindo seu máximo necessariamente em x = 1. O valor <strong>de</strong>ssemáximo é f ′′ (1) = 2. Assim sendo, a fórmula <strong>de</strong> erro ficaE T (h) = h26 .Essa fórmula representa o erro máximo da estimativa. Portanto, se quisermos garantirque o erro da estimativa seja menor do que 5 × 10 −5 , basta garantir que E T (h) seja menordo que esse valor, isto é, gostaríamos <strong>de</strong> escolher h <strong>de</strong> tal forma queIsto é o mesmo que pedirh 26 < 5 × 10−5 .h < √ 30 × 10 −5 = 0.01732 . . .Até agora, a conclusão é que qualquer valor <strong>de</strong> h menor do que 0.01732 . . . servirá paraobter a estimativa com a precisão <strong>de</strong>sejada, usando-se o Método dos Trapézios. Aconteceque h também <strong>de</strong>ve ser tal que o comprimento total do intervalo seja um múltiplo inteiro <strong>de</strong>h. Ou seja, <strong>de</strong>vemos terb − a= n .h


164CAPÍTULO 15. ESTIMATIVA DO ERRO NOS MÉTODOS DE INTEGRAÇÃOComo b − a = 1 e h < 0.01732 . . . entãon = b − ah= 1 h > 10.01732 . . . = 57.7 . . . ,implicando que n <strong>de</strong>ve ser maior ou igual a 58. Então precisamos dividir o intervalo [1, 2] emno mínimo 58 intervalinhos para conseguir a estimativa <strong>de</strong>sejada, com a precisão requerida!E o Método <strong>de</strong> Simpson, será que é mais vantajoso neste exemplo? Será que com menosintervalos na partição conseguiremos garantir a mesma precisão? Agora temos que nosconcentrar na fórmula <strong>de</strong> E S (h), que <strong>de</strong>pen<strong>de</strong> do máximo valor absoluto da quarta <strong>de</strong>rivada,entre 1 e 2. Como f ′′ (x) = 2 x, temos f ′′′ (x) = − 63 xe f (iv) (x) = 244 x. Essa função é positiva5e <strong>de</strong>crescente em [1, 2] <strong>de</strong> forma que seu máximo é atingido em x = 1 e é igual a 24. EntãoE S (h) = 24180 h4 = 215 h4 .Como queremos E S (h) < 5 × 10 −5 , basta tomar h tal queisto é,( 15 · 5h


15.2.APLICAÇÃO DAS FÓRMULAS DE ERRO 165<strong>de</strong> forma que um erro adicional <strong>de</strong> 10 −5 por arredondamento não nos tirará da margempreviamente <strong>de</strong>limitada <strong>de</strong> 5 × 10 −5 . O que nos faz concluir que o uso <strong>de</strong> 5 casas <strong>de</strong>cimais ésuficiente para os cálculos.Então vamos a eles! A tabela abaixo mostra os valores <strong>de</strong> f nos pontos da partição,arredondados para 5 casas <strong>de</strong>cimais.i x i f(x i )0 1.000 1.000001 1.125 0.888892 1.250 0.800003 1.375 0.727274 1.500 0.666675 1.625 0.615386 1.750 0.571437 1.875 0.533338 2.000 0.50000ObtemosS( 1 8 ) = 1 × 16.63568 = 0.69315 ,24que difere do valor verda<strong>de</strong>iro por menos do que 10 −5 , <strong>de</strong>ntro, portanto e com folga, daprecisão pedida.Exercício 15.1 A integral∫ 2e x x dx1é maior ou menor do que 3? Justifique sua resposta e dê uma estimativa para a integral.Exercício 15.2 Investigue, <strong>de</strong> maneira geral, como <strong>de</strong>ve se dar a escolha do número <strong>de</strong>casas <strong>de</strong>cimais dos cálculos do Método dos Trapézios e do Método <strong>de</strong> Simpson, baseado noque foi feito no exemplo acima, e levando em conta a precisão que se quer atingir no resultadofinal. Proponha uma “receita” para essa escolha.Exercício 15.3 Determine uma fórmula para S( h 2 ) em função <strong>de</strong> T(h) e T( h 2 ).Exercício 15.4 Procure integrar numericamente funções cujas primitivas sejam conhecidas,<strong>de</strong> forma a comparar os resultados obtidos com os valores exatos. Examine a integraçãonumérica da função Gaussiana e −x2 , largamente utilizada em Probabilida<strong>de</strong> e Estatística.Exercício 15.5 Consi<strong>de</strong>re a função lnx = ∫ x 11 tdt. O objetivo <strong>de</strong>ste exercício é ver que onúmero e po<strong>de</strong> ser obtido através da solução numérica da equação lnx = 1, usando o Método<strong>de</strong> Newton e calculando logaritmos somente através da <strong>de</strong>finição.1. Determine a função <strong>de</strong> iteração ϕ do Método <strong>de</strong> Newton, que resolve esta equaçãonumericamente.2. Determine o erro máximo <strong>de</strong> se calcular lnx, para 1 ≤ x ≤ 3, usando o Método <strong>de</strong>Simpson com 8 intervalos.


166CAPÍTULO 15. ESTIMATIVA DO ERRO NOS MÉTODOS DE INTEGRAÇÃO3. Tome x 0 = 3 e calcule x 1 = ϕ(x 0 ) (use 4 casas <strong>de</strong>cimais para os valores <strong>de</strong> 1 t , e 8intervalos para a integração).4. Calcule x 2 = ϕ(x 1 ), com 4 casas <strong>de</strong>cimais e 8 intervalos.5. Discuta uma estratégia que você adotaria para mostrar que e está, com certeza, nointervalo [2.716, 2.720].Exercício 15.6 Usando o método <strong>de</strong> mínimos quadrados, aproxime e −x2 por um polinômio<strong>de</strong> grau 4 no intervalo [−1, 1]. Para isso, use a família <strong>de</strong> polinômios ortogonais (nesseintervalo) g 0 (x) = 1, g 1 (x) = x, g 2 (x) = x 2 − 1 3 , g 3(x) = x 3 − 3 5 x, g 4(x) = x 4 − 6 7 x2 + 3 35 ,sabendo que < g 0 , g 0 >= 2, < g 1 , g 1 >= 2 3 , < g 2, g 2 >= 8 45 , < g 3, g 3 >= 8175 , < g 4, g 4 >=12811025. Observe que será preciso calcular a integral gaussiana. Outras integrais ou serãonulas (porque o integrando é ímpar) ou po<strong>de</strong>m ser reduzidas, por sucessivas integrações porpartes, à integral gaussiana. Estime os valores numéricos usando uma aproximação para essaintegral.Exercício 15.7 Consi<strong>de</strong>re a equação f(x) = ∫ x0 e−t2 dt − 1 = 0.1. Defina a função <strong>de</strong> iteração ϕ do Método <strong>de</strong> Newton para resolver a equação.2. Com x 0 = 1, obtenha x 1 = ϕ(x 0 ).


Capítulo 16Obtenção das fórmulas <strong>de</strong> erroComo dissemos no Capítulo anterior, <strong>de</strong>dicaremos este Capítulo para a obtenção das fórmulas<strong>de</strong> erro mencionadas. Seguiremos três abordagens, com a finalida<strong>de</strong> <strong>de</strong> propor diferentesvisões <strong>de</strong> como se po<strong>de</strong> estimar a integral da diferença entre a função verda<strong>de</strong>ira e o polinômiointerpolador que a substitui. O leitor reconhecerá que a primeira abordagem é a continuaçãonatural das estimativas do erro <strong>de</strong> interpolação obtidas no Capítulo 11.Todas as fórmulas <strong>de</strong> erro mencionadas pressupõem que os intervalos da partição sejam <strong>de</strong>igual tamanho. Po<strong>de</strong>ríamos, evi<strong>de</strong>ntemente, <strong>de</strong>terminar fórmulas mais gerais que levassemem conta um espaçamento irregular, mas sem dúvida isso seria um pouco menos interessante.As idéias da primeira abordagem, por exemplo, po<strong>de</strong>m ser seguidas no caso geral, se isso forda necessida<strong>de</strong> do leitor, mas <strong>de</strong>ve-se atentar para o fato <strong>de</strong> que as fórmulas <strong>de</strong> erro não serãotão boas quanto as outras.Em todas as abordagens, a fórmula <strong>de</strong> erro é obtida primeiro para uma unida<strong>de</strong> básica.No Método dos Trapézios, a unida<strong>de</strong> básica é um intervalo [x i , x i+1 ], <strong>de</strong> tamanho h. Paracada intervalo obtém-se uma fórmula e T (h), e como o número <strong>de</strong> intervalos é igual a n entãoE T (h) = ne T (h) .Acontece que n também é o tamanho total do intervalo <strong>de</strong> integração dividido por h, <strong>de</strong>forma que|b − a|E T (h) = e T (h) .hPor exemplo, na primeira e na segunda abordagens obteremose T (h) = 1 12 max |f ′′ |h 3 ,logo|b − a|E T (h) = max |f ′′ |h 2 .12Observe que também há uma perda em relação à constante multiplicativa, pois na fórmula<strong>de</strong> e T (h) o máximo valor absoluto da segunda <strong>de</strong>rivada é obtido <strong>de</strong>ntro da unida<strong>de</strong> básica,enquanto que na fórmula <strong>de</strong> E T (h) trata-se do máximo ao longo <strong>de</strong> todo o intervalo <strong>de</strong>integração.167


168CAPÍTULO 16. OBTENÇÃO DAS FÓRMULAS DE ERROJá no Método <strong>de</strong> Simpson, a unida<strong>de</strong> básica é um intervalo da forma [x 2i , x 2i+2 ], que temtamanho 2h. Em cada intervalo <strong>de</strong>sses troca-se f por um polinômio quadrático e examina-sea diferença produzida na integração. A fórmula <strong>de</strong> erro para a unida<strong>de</strong> será <strong>de</strong>notada pore S (h). Como são n unida<strong>de</strong>s básicas e 2n = |b−a|h, resulta que|b − a|E S (h) = ne S (h) =2h e S(h) .As fórmulas <strong>de</strong> erro das unida<strong>de</strong>s básicas (<strong>de</strong> acordo com a abordagem) estão contidas natabela abaixo.1 a 2 a 3 a1e T (h)12 max |f ′′ | · h 3 112 max |f ′′ | · h 3 512 max |f ′′ | · h 31e S (h)12 max |f ′′′ | · h 4 190 max |f(iv) | · h 5 245 max |f(iv) | · h 5Finalmente, vale notar que, via uma mudança <strong>de</strong> coor<strong>de</strong>nadas, os intervalos [x i , x i+1 ] doMétodo dos Trapézios po<strong>de</strong>m ser tomados como sendo [0, h], e as unida<strong>de</strong>s [x 2i , x 2i+2 ] doMétodo <strong>de</strong> Simpson po<strong>de</strong>m ser tomados como sendo [−h, h].No Método dos Trapézios, <strong>de</strong>finimos p(x) como o polinômio interpolador <strong>de</strong> grau 1 por(0, f(0)) e (h, f(h)), e procuramos limitar a diferença∆(h) =∫ h0(f(x) − p(x)) dx ,em valor absoluto, por e T (h).No Método <strong>de</strong> Simpson, <strong>de</strong>finimos p(x) como sendo o polinômio quadrático por (−h, f(−h)),(0, f(0)) e (h, f(h)), e procuramos limitar a diferençaem valor absoluto, por e S (h).∆(h) =∫ h−h(f(x) − p(x)) dx ,16.1 Primeira Abordagem - Método dos TrapéziosMostraremos que |∆(h)| ≤ 1 12 max |f ′′ | · h 3 (vi<strong>de</strong> tabela acima).De acordo com o exposto no Capítulo 11, a diferençaf(x) − p(x)po<strong>de</strong> ser limitada, em [0, h], da seguinte forma:on<strong>de</strong>Então, pela <strong>de</strong>finição <strong>de</strong> ∆(h), temos−cx(h − x) ≤ f(x) − p(x) ≤ cx(h − x) ,|∆(h)| ≤ ce segue o que queríamos <strong>de</strong>monstrar.c = 1 2! max[0,h] |f ′′ | .∫ h0x(h − x)dx = c h36 ,


16.2. PRIMEIRA ABORDAGEM - MÉTODO DE SIMPSON 16916.2 Primeira Abordagem - Método <strong>de</strong> SimpsonMostraremos que |∆(h)| ≤ 1 12 max |f ′′′ | · h 4 .De acordo com o Capítulo 11, |f(x) − p(x)| ≤ c|q(x)| , on<strong>de</strong> q(x) = (x + h)x(h − x) ec = 1 3! max [−h,h] |f ′′′ | .Então∫ h|∆(h)| ≤ c |q(x)|dx .−hComo q é função ímpar, |q| é função par, <strong>de</strong> forma que|∆(h)| ≤ 2c∫ h0|q(x)|dx .Além disso, em [0, h] a função q é positiva, e portanto só precisamos obter a integralLogo∫ h0(x + h)x(h − x)dx = h44 .|∆(h)| ≤ c 2 h4 ,<strong>de</strong> on<strong>de</strong> segue o que queríamos <strong>de</strong>monstrar.16.3 Segunda Abordagem - Método dos TrapéziosIremos mostrar que |∆(h)| ≤ 1 12 max |f ′′ | · h 3 .Queremos avaliar o erro <strong>de</strong> se aproximar a integral ∫ h0f(x)dx pela área do trapézioh2(f(0) + f(h)). Para isso, consi<strong>de</strong>raremos h como variável e estimaremos o erro ∆(h) emfunção <strong>de</strong>ssa variável. Temos∆(h) =∫ h0f(x)dx − h (f(0) + f(h)) .2Se P for uma primitiva <strong>de</strong> f (isto é, P ′ (x) = f(x)), então∆(h) = P(h) − P(0) − h (f(0) + f(h)) .2Observamos então que ∆(0) = 0, o que era <strong>de</strong> se esperar, pois nenhum erro é cometido se h énulo. Se pu<strong>de</strong>rmos limitar a <strong>de</strong>rivada <strong>de</strong> ∆(h) então limitaremos seu crescimento, em funçãodo tamanho <strong>de</strong> h. Temos∆ ′ (h) = P ′ (h) − 1 2 (f(0) + f(h)) − h 2 f ′ (h) .Como P ′ = f, então∆ ′ (h) = 1 2 (f(h) − f(0)) − h 2 f ′ (h) .


170CAPÍTULO 16. OBTENÇÃO DAS FÓRMULAS DE ERRONotamos também que ∆ ′ (0) = 0, o que nos sugere <strong>de</strong>rivar ainda mais uma vez, para <strong>de</strong>limitaro crescimento <strong>de</strong> ∆ ′ :∆ ′′ (h) = − h 2 f ′′ (h) .Então|∆ ′′ (h)| ≤ C h 2 ,on<strong>de</strong>C = max[0,h] |f ′′ | .Com o crescimento controlado <strong>de</strong> ∆ ′′ , voltamos a integrar:LogoIntegrando mais uma vez,∆ ′ (h) = ∆ ′ (0) +|∆ ′ (h)| ≤Como queríamos <strong>de</strong>monstrar!∫ h0∫ h0∆ ′′ (t)dt =∫ h0∆ ′′ (t)dt .∫ h|∆ ′′ t h2(t)|dt ≤ C dt = C0 2 4 .∫ ht 2|∆(h)| ≤ C0 4 dt = (max |f ′′ |) · h312 .16.4 Segunda Abordagem - Método <strong>de</strong> SimpsonQueremos mostrar que |∆(h)| ≤ 190 max |f(iv) | · h 5 .Temos que avaliar∆(h) =∫ h−hf(x)dx − h (f(−h) + 4f(0) + f(h)) .3Os passos são semelhantes àqueles do Método dos Trapézios, mas agora temos que <strong>de</strong>rivar eintegrar uma vez a mais. Derivando três vezes chegamos a∆ ′′′ (h) = − h 3 (f ′′′ (h) − f ′′′ (−h)) ,com ∆(0) = ∆ ′ (0) = ∆ ′′ (0) = 0. Pelo Teorema do Valor Médio, existe ξ = ξ(h) no intervalo[−h, +h] tal quef ′′′ (h) − f ′′′ (−h) = f (iv) (ξ) · 2h .Portanto, seentãoC = max[−h,h] |f(iv) ||∆ ′′′ (h)| ≤ C 2h23 ,


16.5. TERCEIRA ABORDAGEM - MÉTODO DOS TRAPÉZIOS 171e, por integrações sucessivas,|∆ ′′ (h)| ≤ C 2h39 ,|∆ ′ (h)| ≤ C h418 ,|∆(h)| ≤ C h590 .16.5 Terceira Abordagem - Método dos TrapéziosObteremos |∆(h)| ≤ 512 max |f ′′ | · h 3 .Nesta abordagem do cálculo <strong>de</strong> erro, levamos em conta a expansão em Taylor da funçãof (vi<strong>de</strong> Apêndice C. O método é um pouco mais intuitivo que os anteriores, mas produzresultados um pouco piores (não na or<strong>de</strong>m <strong>de</strong> h, mas nas constantes multiplicativas).Como na Segunda Abordagem, olhamos paraA função f se escreve comoon<strong>de</strong>∆(h) =Já que f ′ (0)h = ∫ h0 f ′ (0)dx, temos∆(h) ==∫ h0f(x)dx − h [f(h) + f(0)] .2f(x) = f(0) + f ′ (0)x + R(x) ,∫ h0∫ h0|R(x)| ≤ max |f ′′ | x22 .f(x) − f(0)dx + h [f(0) − f(h)]2f ′ (0)xdx − h ∫ h2 [f(0) − f(h)] + R(x)dx= f ′ (0) h22 − h ∫ h2 [f(h) − f(0)] + R(x)dx= f ′ (0) h22 − h 2 [f ′ (0)h + R(h)] += − h ∫ h2 R(h) + R(x)dx .Usando a estimativa em |R(x)|, concluímos que0|∆(h)| ≤ max |f ′′ | 5h312 .0∫ h00R(x)dx


172CAPÍTULO 16. OBTENÇÃO DAS FÓRMULAS DE ERRO16.6 Terceira Abordagem - Método <strong>de</strong> SimpsonIremos mostrar que ∆(h) ≤ 2 45 max |f(iv) | · h 5 .Em primeiro lugar, observaremos que o Método <strong>de</strong> Simpson, aplicado em pares <strong>de</strong> intervalosiguais, é exato para polinômios cúbicos.Sem perda <strong>de</strong> generalida<strong>de</strong>, suponha que queiramos integrarg(x) = ax 3 + bx 2 + cx + <strong>de</strong>m [−h, h]. O Método <strong>de</strong> Simpson nos dá a aproximaçãoMasAlém disso, g(0) = d, logoh(g(−h) + 4g(0) + g(h)) .3g(−h) + g(h) = 2bh 2 + 2d .h(g(−h) + 4g(0) + g(h)) = 2h(bh23 3 + d) .Por outro lado, vemos que esse é exatamente o valor da integral, pois∫ h−h(ax 3 + bx 2 + cx + d)dx = a x44 |h −h + b x33 |h −h + c x22 |h −h + dx h −h .O primeiro e o terceiro termos são nulos, logo a integral vale2b h33 + 2dh ,que é o mesmo valor dado pelo Método <strong>de</strong> Simpson.Agora consi<strong>de</strong>remos uma função f suficientemente diferenciável. Ela po<strong>de</strong> ser escritacomo seu polinômio <strong>de</strong> Taylor <strong>de</strong> or<strong>de</strong>m 3 mais um resto R(x):f(x) = f(0) + f ′ (0)x + f ′′ (0)2x 2 + f ′′′ (0)x 3 + R(x) ,3!on<strong>de</strong>R(x)x 3 −→ 0quando x → 0. Chamaremos <strong>de</strong> p 3 o polinômio <strong>de</strong> Taylor, <strong>de</strong> forma quef(x) − p 3 (x) = R(x) .Adiante teremos uma fórmula mais explícita para esse resto, que permitirá qualificar asconstantes envolvidas.Queremos avaliar o erro cometido pelo Método <strong>de</strong> Simpson para integrar ∫ hf(x)dx, isto−hé, olharemos para a diferença∆(h) =∫ h−hf(x)dx − h (f(−h) + 4f(0) + f(h)) .3


16.6. TERCEIRA ABORDAGEM - MÉTODO DE SIMPSON 173Sabendo que o Método <strong>de</strong> Simpson é exato para grau três, temos∫ h−hp 3 (x)dx = h 3 (p 3(−h) + 4p 3 (0) + p 3 (h)) ,logo, lembrando que p 3 (0) = f(0) e que f(x) − p 3 (x) = R(x),∆(h) =∫ h−hUsaremos a seguinte estimativa para o resto:R(x)dx − h (R(−h) + R(h)) .3|R(x)| ≤ max[0,x] |f(iv) | x44! ,<strong>de</strong> forma quee∣ ∣∣∣∣ ∫ hR(x)dx∣ ≤ max[−h,h] |f(iv) | 2h55!−h( ) 2h5|∆(h)| ≤ max[−h,h] |f(iv) | + 2h5 = max5! 3 · 4! [−h,h] |f(iv) | 2h545 .


174CAPÍTULO 16. OBTENÇÃO DAS FÓRMULAS DE ERRO


Parte VIEquações Diferenciais175


Capítulo 17Breve introdução às equaçõesdiferenciais17.1 IntroduçãoUma equação diferencial <strong>de</strong> uma variável real é uma equação em que a incógnita é umafunção real x : [a, b] → R. Esta equação coloca em relação a função e sua <strong>de</strong>rivada.O tipo mais simples <strong>de</strong> equação diferencial é o problema <strong>de</strong> achar uma primitiva <strong>de</strong> umadada função. Por exemplo,x ′ (t) = f(t) , ∀t ∈ [a, b] ,significa que a <strong>de</strong>rivada da função x(t) é igual a f(t) para todo t entre a e b. Em outraspalavras, a função x(t) é uma primitiva da função f(t). Na notação <strong>de</strong> Leibniz, escrevemos∫x(t) = f(t)dt + C ,indicando que todas as primitivas <strong>de</strong> f diferem por uma constante. Mais precisamente, seF 1 e F 2 são primitivas <strong>de</strong> f então existe uma constante C, que <strong>de</strong>pen<strong>de</strong> é claro <strong>de</strong> F 1 e F 2 ,tal que F 1 (t) − F 2 (t) = C para todo t ∈ I. Uma primitiva em particular po<strong>de</strong> ser dada pelaintegral in<strong>de</strong>finidaF(t) =∫ tt 0f(s)ds ,para um <strong>de</strong>terminado t 0 ∈ [a, b]. Neste caso, F(t 0 ) = 0.Se adicionarmos à equação diferencial x ′ (t) = f(t) a exigência <strong>de</strong> que x(t 0 ) = x 0 , entãofica <strong>de</strong>terminada a única primitiva que é solução <strong>de</strong>sse problema:∫ tx(t) = x 0 + f(s)ds .t 0Essa exigência extra é conhecida como um problema <strong>de</strong> valor inicial.177


178CAPÍTULO 17. BREVE INTRODUÇÃO ÀS EQUAÇÕES DIFERENCIAISEm geral as equações diferenciais não se resumem tão simplesmente a um problema <strong>de</strong>integração. Por exemplo, a <strong>de</strong>rivada <strong>de</strong> x(t) po<strong>de</strong> <strong>de</strong>pen<strong>de</strong>r <strong>de</strong> x(t), como na seguinte equação:x ′ (t) = x(t) , t ∈ R .É fácil verificar que x(t) = e t é solução. Ela não é a única, pois x(t) = ce t também ésolução da equação diferencial para todo c ∈ R. No entanto, se impusermos o problema<strong>de</strong> valor inicial x(t 0 ) = x 0 e supusermos x(t) = ce t , então a constante c fica univocamente<strong>de</strong>terminada porx 0 = x(t 0 ) = ce t0 ,don<strong>de</strong>x(t) = x 0 e t−t0 .Ao contrário do exemplo anterior, não é claro ainda neste ponto que x(t) seja a única soluçãoda equação diferencial x ′ (t) = x(t) satisfazendo o problema <strong>de</strong> valor inicial x(t 0 ) = x 0 , poisa princípio po<strong>de</strong>ria haver uma solução que não fosse da forma x(t) = ce t . De fato veremosque esse não é o caso, pelo menos para essa equação (vi<strong>de</strong> Subseção 17.3.2).De modo geral, uma equação diferencial é colocada assim: a <strong>de</strong>rivada <strong>de</strong> x(t) <strong>de</strong>pen<strong>de</strong> <strong>de</strong>t e <strong>de</strong> x(t), isto é,x ′ (t) = f(t, x(t)) ,on<strong>de</strong> f aqui <strong>de</strong>nota uma função <strong>de</strong> duas variáveis (não nos preocuparemos por enquanto como domínio da função f). Na notação compacta escreve-sex ′ = f(t, x) ,ficando implícito o argumento das funções x e x ′ . Por exemplo, x ′ = t 2 sen(tx) significax ′ (t) = t 2 sen(tx(t)). As funções x(t) que verificam x ′ (t) = f(t, x(t)) são chamadas soluçõesda equação diferencial.Além disso, como nos dois exemplos acima, po<strong>de</strong>-se colocar o problema <strong>de</strong> valor inicialx(t 0 ) = x 0 . O problema <strong>de</strong> achar x(t) tal que{x ′ = f(t, x)x(t 0 ) = x 0é comumente conhecido como problema <strong>de</strong> Cauchy.Dizemos que uma equação diferencial é autônoma quando f só <strong>de</strong>pen<strong>de</strong> <strong>de</strong> x, isto éf(t, x) = X(x) (na medida do possível usaremos a letra f para as equações não autônomase X para as autônomas, por questões <strong>de</strong> tradição).Pensando no caso autônomo, suponha que já conheçamos uma solução para o problema<strong>de</strong> Cauchy x ′ = X(x), x(0) = x 0 . Seja ˜x(t) essa solução, isto é ˜x ′ (t) = X(˜x(t)) e ˜x(0) = x 0 .Então é fácil ver que x(t) = ˜x(t−t 0 ) é solução do problema <strong>de</strong> Cauchy x ′ = X(x), x(t 0 ) = x 0 .Em outras palavras, no caso <strong>de</strong> equações autônomas basta estudar o problema <strong>de</strong> Cauchycom t 0 = 0.Além das equações autônomas, temos também as equações separáveis, on<strong>de</strong> f(t, x) é oproduto <strong>de</strong> uma função que só <strong>de</strong>pen<strong>de</strong> <strong>de</strong> t por uma função que só <strong>de</strong>pen<strong>de</strong> <strong>de</strong> x:f(t, x) = g(t)X(x) .


17.2.SOLUÇÃO DE EQUAÇÕES AUTÔNOMAS E SEPARÁVEIS 179Veremos adiante que equações autônomas e separáveis são facilmente solúveis, a menos<strong>de</strong> integrações e inversões, isto é, po<strong>de</strong>mos escrever suas soluções em termos <strong>de</strong> inversas <strong>de</strong>primitivas <strong>de</strong> funções elementares, mas eventualmente essas soluções não po<strong>de</strong>m ser obtidasexplicitamente.17.2 Solução <strong>de</strong> equações autônomas e separáveisEm primeiro lugar observamos que, <strong>de</strong> algum modo, equações autônomas representam umcaso particular das equações separáveis. Pois uma equação autônoma ẋ = X(x) também seescreve como ẋ = g(t)X(x), se tomarmos g(t) ≡ 1.Para discutir as soluções <strong>de</strong> ẋ = g(t)X(x), observamos primeiramente que se X(x ∗ ) = 0então x(t) ≡ x ∗ é solução, pois ẋ(t) ≡ 0 e g(t)X(x(t)) = g(t)X(x ∗ ) ≡ 0. Um ponto x ∗ <strong>de</strong>ssaforma é chamado <strong>de</strong> singularida<strong>de</strong> da equação.Está fora do escopo <strong>de</strong>stas notas, mas com condições razoáveis sobre g e X (por exemplo,g contínua e X diferenciável e com <strong>de</strong>rivada contínua), po<strong>de</strong>-se mostrar que se x(t) = x ∗para algum instante t então x(t) ≡ x ∗ . Em outras palavras, não há como uma solução x(t)chegar e sair <strong>de</strong> uma singularida<strong>de</strong>.Na verda<strong>de</strong>, sob essas mesmas hipóteses é possível mostrar que duas soluções quaisquerx(t) e ˜x(t) ou são idênticas (x(t) = ˜x(t), para todo t) ou nunca se cruzam (x(t) ≠ ˜x(t), paratodo t).Fora das singularida<strong>de</strong>s, po<strong>de</strong>mos encontrar a solução da seguinte maneira. Primeiroescrevemos a equação com a variável t explicitada:ẋ(t) = g(t)X(x(t)) .O instante inicial é t 0 , e gostaríamos <strong>de</strong> saber x(t) se x(t 0 ) = x 0 (problema <strong>de</strong> Cauchy).Como estamos supondo que x(t) não passa por singularida<strong>de</strong>, então X(x(t)) não se anula, epo<strong>de</strong>mos dividir os dois lados da equação por X(x(t)), e integrar <strong>de</strong> t 0 a t:∫ t∫1tt X(x(s))ẋ(s)ds = g(s)ds .0 t 0No lado esquerdo fazemos a substituição u = x(s), <strong>de</strong> forma que du = ẋ(s)ds. Então∫ x(t) ∫1 tx 0X(u) du = g(s)ds .t 0A partir daí po<strong>de</strong>mos, em teoria, encontrar x(t), mas sua expressão explícita <strong>de</strong>pen<strong>de</strong>rá<strong>de</strong> po<strong>de</strong>rmos cumprir certas etapas. Por exemplo, se acharmos uma primitiva F para 1 X euma primitiva G para g, então a equação ficaráF(x(t)) = F(x 0 ) + G(t) − G(t 0 ) .Se, além disso, conseguirmos achar a inversa <strong>de</strong> F (pelo menos numa região <strong>de</strong>limitada entreduas singularida<strong>de</strong>s isso em tese é possível, pois F ′ = 1 Xnão troca <strong>de</strong> sinal, mas achar umaexpressão explícita é outra coisa!), teremosx(t) = F −1 (F(x 0 ) + G(t) − G(t 0 )) .


180CAPÍTULO 17. BREVE INTRODUÇÃO ÀS EQUAÇÕES DIFERENCIAIS17.3 Alguns exemplosNesta Seção examinaremos alguns exemplos <strong>de</strong> equações diferenciais que surgem da mo<strong>de</strong>lagem<strong>de</strong> problemas do “mundo real”, e discutiremos sua solução.17.3.1 NaftalinasNa Subseção 4.3.3 abordamos a perda <strong>de</strong> material <strong>de</strong> uma bolinha <strong>de</strong> naftalina em funçãodo tempo, e chegamos à conclusão <strong>de</strong> que seu raio r(t) obe<strong>de</strong>ce à equaçãoṙ(t) = −α ,on<strong>de</strong> β é uma constante positiva.Po<strong>de</strong>mos dizer que a equação é autônoma, mas é muito mais do que isso. Ela diz que r(t)é uma função <strong>de</strong> <strong>de</strong>rivada constante negativa, ou seja, é uma função afim. Portantor(t) = r 0 − αt ,on<strong>de</strong> r 0 = r(0). Este caso não passa <strong>de</strong> uma simples primitivização.17.3.2 Crescimento populacional a taxas constantesSe tomarmos t como sendo o tempo, e x(t) como sendo a população <strong>de</strong> <strong>de</strong>terminada espécie noinstante t, po<strong>de</strong>mos, por aproximação, supor que x(t) varia continuamente (hipótese razoávelse a população é gran<strong>de</strong>). A taxa <strong>de</strong> variação da população é medida percentualmente, istoé, me<strong>de</strong>-se o incremento (ou <strong>de</strong>crescimento) x(t + h) − x(t), do instante t para o instantet + h, e divi<strong>de</strong>-se pela população que havia no instante t:x(t + h) − x(t)x(t)Mesmo assim, esse valor é muito <strong>de</strong>pen<strong>de</strong>nte do tempo h <strong>de</strong>corrido entre os dois instantes,sendo muito mais razoável, portanto, dividir tudo por h. Fazendo <strong>de</strong>pois o limite quando hten<strong>de</strong> a zero, ficamos comα(t) = x′ (t)x(t) ,on<strong>de</strong> α(t) indica a taxa <strong>de</strong> crescimento instantâneo no instante t.A hipótese Malthusiana <strong>de</strong> crescimento é que α(t) seja constante, isto é, α(t) ≡ α, o queleva à equaçãox ′ (t) = αx(t) .Po<strong>de</strong>mos <strong>de</strong>duzir a solução, sem apelar para “chutes”. A única singularida<strong>de</strong> da equaçãoé x ∗ = 0, e queremos achar as soluções que não passam pelo zero. Então∫ x(t)1x 0u du = α(t − t 0) ,portantolog x(t) = log x 0 + α(t − t 0 ).


17.3. ALGUNS EXEMPLOS 181e, exponenciando os dois lados,x(t) = x 0 e α(t−t0) .Um mo<strong>de</strong>lo como este se presta também à mo<strong>de</strong>lagem do <strong>de</strong>caimento radioativo, on<strong>de</strong> ataxa <strong>de</strong> <strong>de</strong>caimento <strong>de</strong> uma amostra <strong>de</strong> um isótopo é proporcional à quantida<strong>de</strong> <strong>de</strong>sse mesmoisótopo.17.3.3 Pára-quedistaAlém do crescimento populacional e do <strong>de</strong>caimento radioativo, equações do tipo ẋ = αxexplicam o comportamento da velocida<strong>de</strong> do pára-quedista. Se v(t) é velocida<strong>de</strong> do páraquedista(supondo positiva se estiver indo <strong>de</strong> cima para baixo), então ˙v(t) é a aceleração, epela Segunda Lei <strong>de</strong> Newton valem˙v(t) = mg − αv(t) ,on<strong>de</strong> o termo αv(t) correspon<strong>de</strong> à força <strong>de</strong> resistência exercida em sentido contrário ao domovimento e <strong>de</strong> intensida<strong>de</strong> proporcional à velocida<strong>de</strong>. Isso dá uma equação autônoma emv(t).A velocida<strong>de</strong> <strong>de</strong> equilíbrio v ∗ é <strong>de</strong>finida como sendo aquela para a qual a resultante <strong>de</strong>forças é nula, portanto v ∗ = mgα . Se <strong>de</strong>finirmos w(t) = v(t) − v∗ (ou seja, a diferença entre avelocida<strong>de</strong> e a velocida<strong>de</strong> <strong>de</strong> equilíbrio, em cada instante), teremosComo α m = gv ∗ , entãomẇ(t) = m˙v(t) = mg − αv(t) = αv ∗ − αv(t) = −αw(t) .w(t) = w 0 e − gv ∗ t ,se w 0 = w(0).A equação também po<strong>de</strong>ria ser resolvida diretamente, pela integração∫ v(t)v 0mmg − αv dv = t ,seguindo o método sugerido para equações autônomas e separáveis.17.3.4 Crescimento populacional com restrições <strong>de</strong> espaçoUm mo<strong>de</strong>lo ligeiramente mais realista do que o proposto na Subseção 17.3.2 levaria em contaa limitação <strong>de</strong> espaço e alimento que uma população enfrenta quando se torna muito gran<strong>de</strong>.Esse mo<strong>de</strong>lo preveria que: (i) se a população for muito gran<strong>de</strong>, a taxa <strong>de</strong> crescimento α(t)<strong>de</strong>veria ser negativa, e tanto mais negativa quanto maior for a população; (ii) se a populaçãofor muito pequena, a taxa <strong>de</strong> crescimento <strong>de</strong>veria ser positiva, e tanto mais positiva quantomenor for a população (respeitando é claro a velocida<strong>de</strong> <strong>de</strong> reprodução máxima da espécie).Nesse mo<strong>de</strong>lo, portanto, α(t) <strong>de</strong>pen<strong>de</strong>ria exclusivamente da população, sendo mais justoescreverα(t) = h(x(t)) .


182CAPÍTULO 17. BREVE INTRODUÇÃO ÀS EQUAÇÕES DIFERENCIAISA função h(x) assumiria um valor positivo em x = 0, correspon<strong>de</strong>nte a uma taxa <strong>de</strong> crescimentoi<strong>de</strong>al da população, sem limitação física alguma. Essa taxa <strong>de</strong>cresceria continuamentecom o aumento <strong>de</strong> x, ao ponto <strong>de</strong> se tornar negativa para x gran<strong>de</strong>.Por exemplo, h(x) = a − bx, com a e b positivos, satisfaz a essas exigências. Neste caso,teríamos a equação diferencialou, em notação compacta,x ′ (t) = x(t)(a − bx(t))x ′ = x(a − bx) .Po<strong>de</strong>ríamos resolver explicitamente esta equação, mas achamos que ela se presta muitomais a um exame qualitativo, do qual iremos falar na próxima Seção.17.3.5 CatenáriaJá falamos mais <strong>de</strong> uma vez sobre a catenária, mas em nenhum momento justificamos porqueuma corda (ou corrente) pendurada por dois pontos assume o formato <strong>de</strong> um cossenohiperbólico.A <strong>de</strong>dução mais razoável passa por uma equação diferencial. Vejamos.Em primeiro lugar, chamaremos <strong>de</strong> t a coor<strong>de</strong>nada horizontale <strong>de</strong> x a coor<strong>de</strong>nada vertical no plano da corda, paramanter a notação que usamos até este ponto da exposição.É comum o emprego <strong>de</strong> y e x para essas variáveis, <strong>de</strong> formaque a equação diferencial se escreva como y ′ = f(x, y), masnão o faremos para evitar confusão. A origem das coor<strong>de</strong>nadasserá colocada sobre o ponto <strong>de</strong> mínimo da corda.00 1100 1100 11x00 1100 1100 11tComo estamos mo<strong>de</strong>lando uma corda parada, temos um equilíbrio <strong>de</strong> forças sobre acorda, que po<strong>de</strong>mos investigar. As forças existem realmente, porque há o peso da cordaagindo verticalmente e as forças <strong>de</strong> tensão para contrabalançar.Faremos a análise <strong>de</strong>sse equilíbrio <strong>de</strong> forças sobre um segmento da corda, entre o ponto(0, 0) e um ponto arbitrário (t, x(t)) da corda, on<strong>de</strong> x(t) indica a função cujo gráfico coinci<strong>de</strong>com seu formato.Para se obter a força peso agindo sobre esse pedaço, é preciso calcular seu comprimentoe multiplicar pela <strong>de</strong>nsida<strong>de</strong> linear da corda (que suporemos constante e igual a um certonúmero δ). O comprimento l(t) do gráfico <strong>de</strong> x(t) entre 0 e t é dado pela integrall(t) =∫ t0√1 + x′ (s) 2 ds .As forças <strong>de</strong> tensão agem no segmento tangencialmente à corda. Estando já equilibradaslocalmente no interior do segmento, restam as forças nos extremos. Em (0, 0) é uma forçahorizontal, <strong>de</strong> intensida<strong>de</strong> f 0 <strong>de</strong>sconhecida. Em (t, x(t)) é uma força <strong>de</strong> intensida<strong>de</strong> f(t)<strong>de</strong>sconhecida, inclinada com ângulo θ = θ(t) cuja tangente é igual a x ′ (t).


17.3. ALGUNS EXEMPLOS 183Do equilíbrio <strong>de</strong> forças horizontal obtém-sef 0 = f(t)cosθe do equilíbrio verticalδgl(t) = f(t)senθ .Dividindo a segunda equação pela primeira ficamos comtan θ = δgf 0l(t) .Já sabemos que tanθ = x ′ (t) e que l(t) é dado por uma integral. Derivando ambos os ladosobtemosx ′′ (t) = c √ 1 + x ′ (t) 2 ,on<strong>de</strong> c = δgf 0. Essa é uma equação autônoma on<strong>de</strong> a função incógnita é x ′ (t).É fácil ver que x ′ (t) = senh(ct) é solução. Pois <strong>de</strong>rivando mais uma vez obteremosx ′′ (t) = c cosh(ct) e, por outro lado,√√1 + senh 2 (ct) = cosh 2 (ct) = cosh(ct) .Além disso, x ′ (t) = senh(ct) verifica x ′ (0) = 0, isto é, a inclinação da corda é zero no ponto<strong>de</strong> mínimo.Agora basta integrar x ′ (t) para obter x(t). Como x(0) = 0 entãox(t) = 1 (cosh(ct) − 1) .c17.3.6 Escoamento <strong>de</strong> um copo furadoNeste exemplo, imagine um copo cheio d’água, com um buraco no fundo, por on<strong>de</strong> a águaescoa. Suponha que no instante t = 0 a altura do nível da água seja igual a h 0 . Como evoluicom o tempo o nível h da água? Em quanto tempo o copo se esvaziará completamente?Se o copo tem um formato diferente, por exemplo, seu raio aumenta ou diminui conforme aaltura, como se comporta a função h(t)?Com algum grau <strong>de</strong> empirismo, é possível mo<strong>de</strong>lar o problema através <strong>de</strong> uma equaçãodiferencial.O dado empírico refere-se à taxa <strong>de</strong> saída <strong>de</strong> água pelo buraco, medida em volume porunida<strong>de</strong> <strong>de</strong> tempo. Espera-se primeiramente que ela seja proporcional à área do buraco(a qual chamaremos <strong>de</strong> a 0 ), mas não, a princípio, da sua forma. Também não se espera,em primeira aproximação, que ela <strong>de</strong>penda do formato do copo. Por outro lado, ela <strong>de</strong>veser proporcional à velocida<strong>de</strong> da água que sai do buraco. Essa sua velocida<strong>de</strong>, por suavez, <strong>de</strong>pen<strong>de</strong>ria da altura h, como se a coluna <strong>de</strong> água caísse <strong>de</strong>ssa altura, alcançando umavelocida<strong>de</strong> da or<strong>de</strong>m <strong>de</strong> √ h (lembre-se que para um corpo em queda livre, a partir do repouso,a velocida<strong>de</strong> é proporcional à raiz da distância já percorrida). Então a taxa <strong>de</strong> variação dovolume do copo seriaV ′ (t) = −ca 0√h(t) .


184CAPÍTULO 17. BREVE INTRODUÇÃO ÀS EQUAÇÕES DIFERENCIAISPor outro lado, o <strong>de</strong>crescimento do volume implica no <strong>de</strong>crescimento do nível da águah. Observe, no entanto, que quanto maior for a área da seção transversal ao copo na alturah menor será o <strong>de</strong>crescimento do nível, para uma mesma perda <strong>de</strong> volume. Ou pensandoinversamente, se o copo for muito fino à altura h então o nível cairá mais rapidamente.Para quantificar isso, notemos que o volume <strong>de</strong> água é completamente <strong>de</strong>terminado pelonível h através da funçãoV (h) =∫ h0A(u)du ,on<strong>de</strong> A(h) é a função que dá a área da seção correspon<strong>de</strong>nte à altura h. Pelo TeoremaFundamental do Cálculo,V ′ (h) = A(h) .A função V (t) resulta então da função h(t) pela relaçãoLogo, pela Regra da Ca<strong>de</strong>ia,V (t) ≡ V (h(t)) .V ′ (t) = V ′ (h(t))h ′ (t) = A(h(t))h ′ (t) .Juntando com a equação empírica acima, temosA(h(t))h ′ (t) = −ca 0√h(t) ,que é uma equação diferencial autônoma, se a escrevermos na forma tradicional:h ′ = −ca 0√hA(h) .O exemplo mais simples é o copo reto, quer dizer, cujas seções horizontais têm todas amesma área A. Neste caso, a equação se reduz ah ′ (t) = − ca √0 h(t) .ATomando t 0 = 0 e h(0) = h 0 , temos∫ h(t)h 01 √h dh = −βt ,on<strong>de</strong> β = ca0A. O lado esquerdo po<strong>de</strong> ser integrado:e h(t) po<strong>de</strong> ser isolado:2( √ h(t) − √ h 0 ) = −βt ,h(t) =( √h0− β 2 t ) 2.Portanto h(t) é uma função quadrática em t, que vale h 0 em t = 0, e se anula no seu ponto<strong>de</strong> mínimo, t = 2√ h 0β .


17.3. ALGUNS EXEMPLOS 18517.3.7 Dada ϕ do Método <strong>de</strong> Newton, quem é f?Um problema teórico que po<strong>de</strong> ser resolvido com o auxílio <strong>de</strong> equações diferenciais separáveisé o <strong>de</strong> achar a função f que, no Método <strong>de</strong> Newton, gera uma dada função <strong>de</strong> iteração ϕ.Em outras palavras, dada a função ϕ e sabendo-se queϕ(x) = x − f(x)f ′ (x) ,achar f. Manipulando, obtemos a equação separávelf ′ (x) =1x − ϕ(x) f(x) ,on<strong>de</strong> x faz o papel <strong>de</strong> t e f o papel <strong>de</strong> x. A equação só está <strong>de</strong>finida fora dos pontos fixos <strong>de</strong> ϕ,mas uma análise criteriosa mostra que as soluções muitas vezes se esten<strong>de</strong>m continuamentea esses pontos (é um bom exercício!).17.3.8 Transferência <strong>de</strong> calorUm corpo está em contato com um gran<strong>de</strong> reservatório, cuja temperatura é uma função dotempo T(t). Seja x(t) a temperatura do corpo no instante t. A cada instante, a variação datemperatura do corpo é proporcional à diferença entre sua temperatura e a temperatura doreservatório. Equacionando:ẋ(t) = α (T(t) − x(t)) ,on<strong>de</strong> α é uma constante positiva.Aqui não se trata mais <strong>de</strong> uma equação autônoma, pois se escrevermos ẋ = f(t, x) entãof(t, x) = α (T(t) − x) .Esta equação tampouco é separável, mas ainda assim é simples o suficiente para ser solúvel.Ela se enquadra no conjunto das equações do tipoẋ = a(t)x + b(t) ,cuja solução discutiremos abaixo.O caso em que b(t) = 0 é um caso particular <strong>de</strong> equação separável, que tem soluçãox(t) = x 0 exp{∫ tt 0a(s)ds}se x 0 = x(t 0 ).Para o problema afim ẋ = a(t)x + b(t), x(t 0 ) = x 0 , com solução x(t), usamos um truque:examinamos a <strong>de</strong>rivada <strong>de</strong> y(t) = x(t)e − R tt 0 a(s)ds . Obtemosẏ(t) = ẋ(t)e − R tt 0 a(s)ds − x(t)a(t)e − R tt 0 a(s)ds ,porém substituindo ẋ(t) por a(t)x(t) + b(t), ficamos comẏ(t) = b(t)e − R tt 0 a(s)ds ,


186CAPÍTULO 17. BREVE INTRODUÇÃO ÀS EQUAÇÕES DIFERENCIAISe portantoComo y(t 0 ) = x 0 , obtemos a solução∫ ty(t) = y(t 0 ) + b(r)e − R rt a(s)ds 0 dr .t 0R ta(s)ds tx(t) = e 0( ∫ tx 0 + b(r)e − R )rt a(s)ds 0 drt 0A unicida<strong>de</strong> é garantida pela unicida<strong>de</strong> da integração <strong>de</strong> ẏ com a condição y(t 0 ) = x 0 .17.4 Entendimento qualitativo <strong>de</strong> equações autônomasAté agora não discutimos nada sobre a representação gráfica das soluções <strong>de</strong> uma equaçãodiferencial, mas naturalmente o mais óbvio é <strong>de</strong>senharmos o gráfico da solução x(t). O queveremos nesta Seção é que é muito fácil <strong>de</strong>senharmos o esboço <strong>de</strong> algumas soluções (variandoa condição inicial) <strong>de</strong> equações autônomas, sem resolvê-las!Para começar, vimos que se x ∗ é uma singularida<strong>de</strong> da equação autônoma ẋ = X(x),então x(t) ≡ x ∗ é solução. Num diagrama em que coloquemos t na abscissa e x na or<strong>de</strong>nada,esse tipo <strong>de</strong> solução é uma linha reta horizontal à altura <strong>de</strong> x ∗ . Portanto as primeiras soluçõesque po<strong>de</strong>mos i<strong>de</strong>ntificar na equação são essas soluções constantes, cada uma correspon<strong>de</strong>ndoa um zero da função X.Em cada intervalo entre duas singularida<strong>de</strong>s e nos intervalos entre a última singularida<strong>de</strong>e o infinito, o sinal <strong>de</strong> X não muda, pois se mudasse haveria uma outra singularida<strong>de</strong> nointervalo, pelo Teorema <strong>de</strong> Bolzano. Seja I um intervalo <strong>de</strong>sses, e suponha que x(t) está emI. Como X(x(t)) = ẋ(t), então o sinal <strong>de</strong> ẋ(t) é o mesmo que o sinal <strong>de</strong> X(x(t)), e esse sinalé sempre o mesmo enquanto x(t) estiver em I.Como as soluções não cruzam as singularida<strong>de</strong>s (isto é garantido por um Teorema, se Xfor <strong>de</strong>rivável e com <strong>de</strong>rivada contínua), uma solução x(t) está sempre confinada a um mesmointervalo, o que implica que o sinal <strong>de</strong> ẋ(t) é sempre o mesmo, para todo t. O que é o mesmoque dizer que x(t) ou é crescente ou é <strong>de</strong>crescente, e uma ou outra opção será <strong>de</strong>terminadapelo sinal <strong>de</strong> X no intervalo on<strong>de</strong> está confinada a solução.Na figura abaixo, por exemplo, ilustramos esquematicamente uma função (arbitrária)X(x), com quatro singularida<strong>de</strong>s x ∗ 1 , x∗ 2 , x∗ 3 e x∗ 4 . A função é negativa à esquerda <strong>de</strong> x∗ 1 eentre x ∗ 3 e x∗ 4 , e positiva à direita <strong>de</strong> x∗ 4 e nos intervalos entre x∗ 1 e x∗ 2 e entre x∗ 2 e x∗ 3 .X(x).0101010101010101x 1* x 2* x 3* x 4*xO diagrama abaixo ilustra algumas soluções (uma para cada intervalo).


17.5.EQUAÇÕES DIFERENCIAIS COM MAIS VARIÁVEIS 187x0101010100 1100 11x 4*x 3*x 2*0101tx 1*As soluções são assintóticas, para t indo a mais ou menos infinito, às singularida<strong>de</strong>s (<strong>de</strong>fato, em equações autônomas, as soluções não po<strong>de</strong>m ser assintóticas a pontos que não sejamsingularida<strong>de</strong>s).Uma maneira mais compacta <strong>de</strong> se representar qualitativamente o comportamento dassoluções <strong>de</strong>ssa equação diferencial é usando um diagrama on<strong>de</strong> só entra a reta dos x’s, comomostra a figura abaixo. As setas entre as singularida<strong>de</strong>s indicam para que lado as soluçõesnaquele intervalo ten<strong>de</strong>m quando t ten<strong>de</strong> a infinito.x 3*010101x* 10101x* 20101x*401Assim fica fácil, por exemplo, enten<strong>de</strong>r a equação <strong>de</strong> crescimento populacionalẋ = x(a − bx) .Como essa equação só faz sentido para x ≥ 0, nos restringiremos a essa região. Nessa região,a função X(x) = x(a − bx) tem duas singularida<strong>de</strong>s: x ∗ 1 = 0 e x ∗ 2 = a b. Isso significa que apopulação nula e a população igual a x ∗ 2 são soluções <strong>de</strong> equilíbrio.Entre as duas, X(x) é positiva e à direita <strong>de</strong> x ∗ 2 a função X(x) é negativa. Isso significaque se a população inicial está abaixo da população <strong>de</strong> equilíbrio então ten<strong>de</strong>rá a aumentarassintoticamente até o equilíbrio x ∗ 2 . E se começar acima <strong>de</strong>crescerá assintoticamente até omesmo equilíbrio.17.5 Equações diferenciais com mais variáveisExistem também os chamados sistemas <strong>de</strong> equações diferenciais (<strong>de</strong> primeira or<strong>de</strong>m), queenvolvem simultaneamente duas ou mais funções e suas respectivas primeiras <strong>de</strong>rivadas. Porexemplo, {ẋ = 3x 2 − y + 3ẏ = sin x + yx 3 .Neste caso, achar uma solução para o sistema significa encontrar duas funções x(t) e y(t) quesimultaneamente verifiquem{ ẋ(t) = 3x(t) 2 − y(t) + 3ẏ(t) = sin x(t) + y(t)x(t) 3 .x


188CAPÍTULO 17. BREVE INTRODUÇÃO ÀS EQUAÇÕES DIFERENCIAISEsse tipo <strong>de</strong> problema parece ser bastante árido à primeira vista, mas se torna mais atraentese o interpretarmos do ponto <strong>de</strong> vista geométrico.Po<strong>de</strong>mos olhar as funções x(t) e y(t) como as coor<strong>de</strong>nadas<strong>de</strong> uma curva γ : t ↦→ (x(t), y(t)) no plano xy. A <strong>de</strong>rivadada curva γ, dada por ˙γ(t) = (ẋ(t), ẏ(t)), representa o vetortangente à curva. O sistema <strong>de</strong> equações diferenciais dizentão que, em cada instante t, o vetor tangente à curvaγ(t) dado por ˙γ(t) = (ẋ(t), ẏ(t)) tem que ser exatamenteigual ao vetor (3x(t) 2 − y(t) + 3, sinx(t) + y(t)x(t) 3 ).y.γ(t)xγ(t)=(x(t),y(t))Perceba que esse sistema <strong>de</strong> equações diferenciais já fixa, para cada ponto (x, y), qual seráo vetor tangente <strong>de</strong> uma solução que por ali passar em algum instante: (3x 2 −y+3, sin x+yx 3 ).Essa função que associa para cada ponto um vetor (que <strong>de</strong>ve ser sempre tangente às soluçõesdo sistema) é chamada <strong>de</strong> campo <strong>de</strong> vetores. Uma maneira <strong>de</strong> esboçar um campo <strong>de</strong> vetoresé mostrando os vetores correspon<strong>de</strong>ntes a alguns pontos do plano (x, y).yxPara um sistema <strong>de</strong> equações diferenciais como esse também po<strong>de</strong>mos estabelecer o problema<strong>de</strong> Cauchy: dado um ponto (x 0 , y 0 ) e um instante t 0 achar uma solução γ(t) tal queγ(t 0 ) = (x 0 , y 0 ).Mo<strong>de</strong>los <strong>de</strong> crescimento populacional envolvendo mais do que uma espécie são um típicoexemplo <strong>de</strong> sistemas <strong>de</strong> equações diferenciais. Cada variável do sistema representa a população<strong>de</strong> uma espécie. Por exemplo, se x(t) for a população <strong>de</strong> tartarugas e y(t) for apopulação <strong>de</strong> jacarés, po<strong>de</strong>mos tecer as seguintes consi<strong>de</strong>rações. Em primeiro lugar, a população<strong>de</strong> tartarugas não precisa dos jacarés para sobreviver, mas tem suas limitações <strong>de</strong>espaço e alimento usuais. Como na Subseção 17.3.4, a taxa <strong>de</strong> crescimento proporcional dapopulação é uma função parecida com A − Bx(t), mas <strong>de</strong>ve-se <strong>de</strong>scontar um termo tantomaior quanto maior for a população <strong>de</strong> jacarés, por exemplo Cy(t). Então teríamosx ′ (t)x(t)= A − Bx(t) − Cy(t) .


17.5.EQUAÇÕES DIFERENCIAIS COM MAIS VARIÁVEIS 189Por outro lado, supondo que os jacarés precisem se alimentar das tartarugas para sobreviverem,sua taxa <strong>de</strong> crescimento proporcional na ausência <strong>de</strong> tartarugas é negativa, e serámais negativa ainda se sua população for muito gran<strong>de</strong>, também por problemas relativosà limitação do espaço. Por outro lado, quanto maior for a população <strong>de</strong> tartarugas, maisfacilida<strong>de</strong> a população terá para crescer. Dessas consi<strong>de</strong>rações, é razoável supor quey ′ (t)y(t)= −D − Ey(t) + Fx(t) .Juntando tudo, ficamos com o sistema{ẋ = (A − Bx − Cy)xẏ = (−D − Ey + Fx)y.É claro que todo esse raciocínio é hipotético, pois carece <strong>de</strong> dados reais. No entanto,cada situação on<strong>de</strong> duas ou mais espécies se influenciam mutuamente, seja numa relaçãopredador-presa seja numa relação <strong>de</strong> competição pelo mesmo alimento ou espaço, esse tipo<strong>de</strong> mo<strong>de</strong>lagem po<strong>de</strong> ser feito.Outra classe <strong>de</strong> exemplos relevante vem das equações diferenciais <strong>de</strong> segunda or<strong>de</strong>m (istoé, que envolvem a segunda <strong>de</strong>rivada), por exemplo, qualquer equação do tipo ẍ = Γ(x, ẋ).Com um pequeno truque po<strong>de</strong>mos transformar essa equação num sistema <strong>de</strong> duas equações<strong>de</strong> primeira or<strong>de</strong>m. Basta <strong>de</strong>finir uma segunda variável (na verda<strong>de</strong>, uma segunda função dotempo) v(t) = ẋ(t), <strong>de</strong> forma que ẍ(t) = ˙v(t). Então ficamos com as duas equações{ ẋ = v,˙v = Γ(x, v)on<strong>de</strong> a primeira equação vem simplesmente da <strong>de</strong>finição <strong>de</strong> v.Por exemplo, tomemos a equação do pêndulo¨θ = − g l senθ .Chamando ω(t) = ˙θ(t), ficamos com{ ˙θ = ω˙ω = − g l senθ .


190CAPÍTULO 17. BREVE INTRODUÇÃO ÀS EQUAÇÕES DIFERENCIAIS


Capítulo 18Solução numérica <strong>de</strong> equaçõesdiferenciaisNeste Capítulo estudaremos algumas maneiras <strong>de</strong> se resolver numericamente uma equaçãodiferencial do tipo ẋ = f(t, x), e veremos no final como generalizar as idéias para dimensõesmais altas.18.1 Equações separáveisPara começar, veremos nesta Seção que já dispomos dos métodos necessários para resolvermosas equações separáveis. Os métodos propostos posteriormente serão, entretanto, muito maisgerais e, inclusive, mais práticos.Como vimos no Capítulo anterior, se ẋ = g(t)X(x) for a equação, F for uma primitivae G for uma primitiva <strong>de</strong> g, então<strong>de</strong> 1 Xx(t) = F −1 (F(x 0 ) + G(t) − G(t 0 )) .Acontece que nem sempre é possível obter integrais explícitas, e aqui temos que resolverduas. Resolvendo ou não, uma <strong>de</strong>las ainda terá que ser invertida, o que também é difícil ouimpossível, na maioria dos casos.Todos esses problemas po<strong>de</strong>riam ser solucionados numericamente. A primitiva <strong>de</strong> g po<strong>de</strong>ser <strong>de</strong>finida comoG(t) =∫ tt 0g(s)ds ,<strong>de</strong> forma que G(t 0 ) = 0 e, da mesma forma, a primitiva <strong>de</strong> 1 Xresultando em F(x 0 ) = 0, e portantoF(x) =∫ xx 01X(u) du ,x(t) = F −1 (G(t)) .191se <strong>de</strong>fine naturalmente como


192CAPÍTULO 18. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAISAs duas primitivas po<strong>de</strong>m ser obtidas nos pontos que se quiser, usando os métodos <strong>de</strong> integraçãonumérica discutidos na Parte V. Já ao problema <strong>de</strong> inversão da função F po<strong>de</strong>-seaplicar o Método <strong>de</strong> Newton.Para sermos mais precisos, imagine que queiramos calcular x(t) num <strong>de</strong>terminado instantet, e todas as operações mencionadas acima tenham que ser feitas numericamente. Em primeirolugar, calculamos G(t) usando integração numérica (com a melhor precisão possível, é claro),e <strong>de</strong>pois teremos que achar x(t) tal queF(x(t)) = G(t) ,tomando-se os cuidados necessários para que seja buscada a solução que nos interessa. Ouseja, x(t) é solução da equaçãof(x) = F(x) − G(t) = 0 .Como F ′ (x) = 1X(x), a função <strong>de</strong> iteração para o Método <strong>de</strong> Newton ficaϕ(x) = x − X(x)(F(x) − G(t)) .Com um palpite inicial x 0 temos que iterar a função ϕ, <strong>de</strong> forma a obter x 1 , x 2 , etc, atéchegar próximo à raiz com a precisão <strong>de</strong>sejada. Então( ∫ xk)1x k+1 = x k − X(x k ) −G(t) +x 0X(u) du ,isto é, em cada etapa da iteração é preciso estimar F(x k ) usando algum método <strong>de</strong> integraçãonumérica. O erro po<strong>de</strong>, em tese, ser controlado, usando-se estimativas <strong>de</strong> erro das duasintegrações e também do Método <strong>de</strong> Newton.Se o procedimento acima for implementado no computador e x(t) for calculado para váriosvalores <strong>de</strong> t, em seqüência, o melhor palpite para a condição inicial x 0 do Método <strong>de</strong> Newtoné o valor <strong>de</strong> x(t) obtido na etapa anterior, pois a função x(t) é contínua.18.2 DiscretizaçãoO fundamento da solução numérica <strong>de</strong> equações diferenciais ẋ = f(t, x) é a discretização davariável t. Se [a, b] é o intervalo on<strong>de</strong> gostaríamos <strong>de</strong> achar a solução x(t) então dividimosesse intervalo com uma partição regulara = t 0 < t 1 < t 2 < . . . < t n−1 < t n = b ,on<strong>de</strong> a diferença entre pontos sucessivos é igual a h (o chamado passo). “Determinar numericamente”a função x(t) significa achar, com precisão suficientemente boa, os valoresx 0 = x(t 0 ), x 1 = x(t 1 ), . . ., x n = x(t n ).Em suma, a solução numérica <strong>de</strong> uma equação diferencial peca, inevitavelmente, pelaimprecisão em t, pois os valores <strong>de</strong> x(t) são calculados somente para uma quantida<strong>de</strong> finita<strong>de</strong> valores <strong>de</strong> t, e pela imprecisão na <strong>de</strong>terminação <strong>de</strong> x(t), sendo que ambas po<strong>de</strong>m serminimizadas, segundo os métodos propostos abaixo, pela redução do passo h. Ao mesmo


18.2.DISCRETIZAÇÃO 193tempo esta é, para muitos propósitos, a melhor alternativa disponível, visto que a maioriadas equações diferenciais não admite solução explícita, em termos <strong>de</strong> funções elementares.Em todos os métodos, obteremos a solução numérica por recorrência. A condição inicialx 0 = x(t 0 ) é dada (senão não há sentido no problema, uma vez que existe uma infinida<strong>de</strong> <strong>de</strong>soluções da mesma equação), e a partir <strong>de</strong>la obter-se-ão, em sucessão, os valores <strong>de</strong> x 1 , x 2 ,etc.Como t k+1 = t k + h (para k = 0, . . .,n − 1), a estimativa <strong>de</strong> x k+1 = x(t k+1 ) po<strong>de</strong> serobtida a partir da estimativa <strong>de</strong> x k = x(t k ) por meio <strong>de</strong> uma expansão em Taylor. Parasimplificar a notação, <strong>de</strong>notaremos t k por t, a partir <strong>de</strong> agora, e x k por x(t), ou às vezessimplesmente por x. Entãox(t + h) = x(t) + x ′ (t)h + 1 2! x′′ (t)h 2 + . . . + 1 m! x(m) (t)h m + o(h m ) ,on<strong>de</strong> o(h m ) <strong>de</strong>nota o resto da expansão, que vai a zero quando h ten<strong>de</strong> a zero mesmo sedividido por h m (tipicamente, termos <strong>de</strong> or<strong>de</strong>m m+1 ou mais). É claro que a função precisaser diferenciável até or<strong>de</strong>m m para valer essa expressão, mas em geral esse é o caso.A expressão significa que, quanto menor for h, melhor o polinômio em h (sem o resto)aproximará x(t+h). Além disso, geralmente mas nem sempre, quanto maior for m melhor seráa aproximação e, principalmente, mais efetiva se tornará a redução <strong>de</strong> h como instrumentopara melhorar a precisão <strong>de</strong> x(t + h) através do polinômio.As <strong>de</strong>rivadas <strong>de</strong> x(t) se relacionam com as <strong>de</strong>rivadas <strong>de</strong> f através da equação diferencial,só que f é uma função <strong>de</strong> duas variáveis, t e x. Por exemplo, da própria equação temos aigualda<strong>de</strong> x ′ (t) = f(t, x(t)). Quanto à segunda <strong>de</strong>rivada temosx ′′ (t) = d ∂ff(t, x(t)) =dt ∂t (t, x(t)) + x′ (t) ∂f (t, x(t)) ,∂xpela Regra da Ca<strong>de</strong>ia aplicada a funções <strong>de</strong> duas variáveis, e portantox ′′ (t) = ∂f∂t(t, x(t)) + f(t, x(t))∂f (t, x(t)) .∂tAqui vale, antes <strong>de</strong> prosseguirmos, simplificar a notação. Na maioria dos casos, as <strong>de</strong>rivadas<strong>de</strong> x serão calculadas em t, e todas as <strong>de</strong>rivadas parciais <strong>de</strong> f, <strong>de</strong> qualquer or<strong>de</strong>m,em (t, x(t)). Assim, só indicaremos explicitamente o ponto on<strong>de</strong> estão sendo calculadas asfunções e suas <strong>de</strong>rivadas se esses pontos não forem t e x(t). Nessa notação, teremosx ′′ = ∂f∂t + f ∂f∂x .Para simplificarmos mais ainda, <strong>de</strong>notaremos as <strong>de</strong>rivadas parciais <strong>de</strong> f com um subíndice.Por exemplo,f tx = ∂2 f∂t∂x .Na hipótese <strong>de</strong> que f seja uma função <strong>de</strong> classe C 2 (jargão matemático para dizer que ftem <strong>de</strong>rivadas parciais até segunda or<strong>de</strong>m, e contínuas), então um teorema (o Teorema <strong>de</strong>Schwarz) garante que a or<strong>de</strong>m das <strong>de</strong>rivadas parciais po<strong>de</strong> ser trocada, <strong>de</strong> forma que po<strong>de</strong>mostrocar f tx por f xt , ou ainda f ttx por f xtt ou f txt .


194CAPÍTULO 18. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAISSegue <strong>de</strong>ssas consi<strong>de</strong>rações que a expressão <strong>de</strong> x(t + h) po<strong>de</strong> ser escrita, até a or<strong>de</strong>m<strong>de</strong>sejada, inteiramente em função <strong>de</strong> f e <strong>de</strong> suas <strong>de</strong>rivadas parciais. Neste Capítulo, iremostecer consi<strong>de</strong>rações somente até or<strong>de</strong>m 4, mesmo assim precisaremos da expressão <strong>de</strong> x ′′′ ex ′′′′ . Para obter x ′′′ temos que <strong>de</strong>rivar em relação a t a expressão <strong>de</strong> x ′′ , lembrando sempreque cada <strong>de</strong>rivada parcial <strong>de</strong> f também <strong>de</strong>pen<strong>de</strong> <strong>de</strong> (t, x(t)), e que a regra da Ca<strong>de</strong>ia <strong>de</strong>veser usada. Então, como x ′′ = f t + ff x , obtemose, reagrupando os termos,x ′′′ = f tt + ff tx + (f t + ff x )f x + f(f xt + ff xx )x ′′′ = f t f x + f(f x ) 2 + f tt + 2ff tx + f 2 f xx ,on<strong>de</strong> f 2 x <strong>de</strong>nota (f x ) 2 e não a <strong>de</strong>rivada em relação a x <strong>de</strong> f composta com si mesma. Sugere-sefortemente ao leitor que verifique essa conta, e em seguida que verifique quex ′′′′ = f t f 2 x + ff 3 x++f x f tt + 3f t f tx + 5ff x f tx + 3ff t f xx + 4f 2 f x f xx + f ttt + 3ff ttx + 3f 2 f txx + f 3 f xxx .Ao leitor assustado com o tamanho das expressões recomenda-se paciência: ao final, todosos algoritmos que <strong>de</strong>rivarão <strong>de</strong>sta linha <strong>de</strong> raciocínio serão extremamente simples! Veremosnas próximas Seções <strong>de</strong> que maneira po<strong>de</strong>mos implementar as idéias ora expostas, e suaspossíveis variações.18.3 O Método <strong>de</strong> EulerO Método <strong>de</strong> Euler consiste em tomar a aproximação <strong>de</strong> primeira or<strong>de</strong>m <strong>de</strong> x(t + h):x(t + h) = x(t) + x ′ (t)h + o(h) .O resto o(h) indica que o erro em tomar essa aproximação será, em geral, da or<strong>de</strong>m <strong>de</strong> h 2ou mais.Como x ′ = f, o Método sugere que, na prática, obtenhamos x k+1 = x(t k+1 ) = x(t k + h)comox k+1 = x k + f(t k , x k )h .A iteração a partir <strong>de</strong> x 0 acumulará um erro da or<strong>de</strong>m <strong>de</strong> h 2 em cada etapa, po<strong>de</strong>ndoacumular ao final um erro <strong>de</strong> nh 2 . Como n = b−ah, então o erro acumulado será da or<strong>de</strong>m <strong>de</strong>(b − a)h.A título <strong>de</strong> ilustração, vejamos um exemplo cuja solução exata é conhecida. Tomemosa equação separável x ′ = −3t 2 x, no intervalo [0, 1], com x(0) = 2. Para achar a soluçãoexplícita, temos que isolar x(t) emisto é,∫ x(t)2∫1 tu du = − 3s 2 ds ,log x(t) − log 2 = −t 3 .0


18.3. O MÉTODO DE EULER 195Então x(t) = 2e −t3 .Compararemos essa solução exata com a solução obtida pelo Método <strong>de</strong> Euler com passoh = 0.1. Antes <strong>de</strong> apresentar o resultado, calculemos os primeiros valores x k com cuidado,para fixarmos melhor o entendimento do método.Temosx 1 = x 0 + f(t 0 , x 0 )h ,com t 0 = 0, x 0 = 2 e f(t, x) = −3t 2 x. Portanto x 1 = x 0 = 2. Depois, temosx 2 = x 1 + f(t 1 , x 1 )h = x 1 − 3t 2 1x 1 h ,<strong>de</strong> forma que substituindo os valores conseguimosx 2 = 2 − 3 × 0.1 2 × 2 × 0.1 = 2 − 6 × 10 −3 = 1.994 .O resultado está na tabela abaixo, arredondados para 3 casas <strong>de</strong>cimais <strong>de</strong>pois <strong>de</strong> obtido cadax k .k t k x k 2e −t3 k0 0.0 2.000 2.0001 0.1 2.000 1.9982 0.2 1.994 1.9843 0.3 1.970 1.9474 0.4 1.917 1.8765 0.5 1.825 1.7656 0.6 1.688 1.6117 0.7 1.506 1.4198 0.8 1.285 1.1999 0.9 1.038 0.96510 1.0 0.786 0.736O maior erro cometido em relação à solução verda<strong>de</strong>iraocorreu em t k = 0.7 (1.506 − 1.419 = 0.087), mas não chegoua 0.1, o tamanho do passo. É preciso tomar cuidadocom a avaliação do erro, pois sabemos apenas que ele po<strong>de</strong>ser da or<strong>de</strong>m <strong>de</strong> h, mas isso significa apenas que ele é menordo que uma constante vezes h. Essa constante po<strong>de</strong> sermuito gran<strong>de</strong>, <strong>de</strong> forma que a informação não é suficientepara estimar o erro. No entanto, ela diz que, se reduzirmosh então o erro máximo se reduzirá proporcionalmente.Por exemplo, vejamos o que resulta da mesma equação com passo igual a 0.05, com quatrocasas <strong>de</strong>cimais.


196CAPÍTULO 18. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAISk t k x k 2e −t3 k0 0.00 2.0000 2.00001 0.05 2.0000 1.99982 0.10 1.9993 1.99803 0.15 1.9963 1.99334 0.20 1.9896 1.98415 0.25 1.9777 1.96906 0.30 1.9592 1.94677 0.35 1.9326 1.91618 0.40 1.8971 1.87609 0.45 1.8516 1.825810 0.50 1.7954 1.765011 0.55 1.7281 1.693512 0.60 1.6497 1.611513 0.65 1.5606 1.519714 0.70 1.4617 1.419315 0.75 1.3543 1.311616 0.80 1.2400 1.198617 0.85 1.1210 1.082218 0.90 0.9995 0.964819 0.95 0.8781 0.848520 1.00 0.7592 0.7358A maior diferença em relação ao valor verda<strong>de</strong>iro não passou <strong>de</strong> 0.043, em t k = 0.75, queé meta<strong>de</strong> da discrepância obtida com passo igual a 0.1.Exercício 18.1 Consi<strong>de</strong>re a equação diferencial x ′ = x 2 − sent, com a condição inicialx(0) = 1. Obtenha uma discretização/aproximação da solução usando o Método <strong>de</strong> Euler <strong>de</strong>primeira or<strong>de</strong>m, no intervalo [0, 0.6], com passo h = 0.1.18.4 Indo para segunda or<strong>de</strong>mPara que a redução <strong>de</strong> h seja mais eficiente é preciso fazer com que a or<strong>de</strong>m <strong>de</strong> gran<strong>de</strong>zado erro <strong>de</strong>penda <strong>de</strong> h elevado a uma potência mais alta. Para isso, é preciso ir além daaproximação <strong>de</strong> primeira or<strong>de</strong>m em x(t + h). Consi<strong>de</strong>remos, por exemplo, a aproximação <strong>de</strong>segunda or<strong>de</strong>m:x(t + h) ≈ x + x ′ h + 1 2 x′′ h 2 ,on<strong>de</strong> x ′ = f e x ′′ = f t + ff x .Então, ainda no exemplo x ′ = −3t 2 x, temos f(t, x) = −3t 2 x, f t (t, x) = −6tx e f x (t, x) =−3t 2 . Substituindo essas expressões, com a notação x(t+h) = x k+1 , x = x k , t = t k , obtemosa relação <strong>de</strong> recorrênciax k+1 = x k + 3t k x k h(−t k − h + 3 )2 t3 k h .


18.4. INDO PARA SEGUNDA ORDEM 197O erro máximo cometido em cada iteração é da or<strong>de</strong>m <strong>de</strong> h 3 , portanto o erro máximoacumulado ao longo <strong>de</strong> todo o intervalo é da or<strong>de</strong>m <strong>de</strong> (b −a)h 2 . Isso significa que a reduçãodo passo pela meta<strong>de</strong> provoca redução no erro da or<strong>de</strong>m <strong>de</strong> quatro vezes.Exercício 18.2 Use a relação <strong>de</strong> recorrência acima com passo 0.1, a partir da mesmacondição inicial x(0) = 2 e compare com os resultados obtidos anteriormente.Apesar da vantagem em relação à precisão, ao passar para segunda or<strong>de</strong>m acabamos pornos envolver com uma função <strong>de</strong> iteração muito mais complicada, apesar <strong>de</strong> a expressão <strong>de</strong>f(t, x) ser muito simples. Vários fatores contribuem para isso: as expressões das <strong>de</strong>rivadasparciais <strong>de</strong> f e a combinação da fórmula, que envolve vários termos. Indo para or<strong>de</strong>m aindamais alta essas complicações aumentam bastante e exigem, da parte do programador, ocálculo <strong>de</strong> todas as <strong>de</strong>rivadas parciais envolvidas e a montagem das fórmulas.O que faremos no restante <strong>de</strong>sta Seção é explorar uma observação a respeito da expansão<strong>de</strong> x(t + h) até segunda or<strong>de</strong>m, que nos permitirá implementar um método computacionalmentemais simples. Na Seção seguinte veremos como esse método po<strong>de</strong> ser generalizadoinclusive para or<strong>de</strong>ns mais altas, sem expressivo acréscimo da complexida<strong>de</strong> algorítmica, emboraa <strong>de</strong>dução do algoritmo propriamente dito possa ficar cada vez mais complicada. Essaabordagem é conhecida como Método <strong>de</strong> Runge-Kutta <strong>de</strong> integração das equações diferenciais.Estamos interessados na diferença x(t + h) − x(t), dada porque escreveremos assim:x(t + h) − x(t) = hf + 1 2 h2 (f t + ff x ) + o(h 2 ) ,x(t + h) − x(t) = h(f + 1 )2 (hf t + hff x ) + o(h 2 ) .Então reparamos que o termo hf t + hff x tem certa semelhança com a expansão da função<strong>de</strong> duas variáveis f(t, x) até primeira or<strong>de</strong>m:f(t + ∆t, x + ∆x) = f(t, x) + f t (t, x)∆t + f x (t, x)∆x + o(∆t, ∆t) ,on<strong>de</strong> o(∆t, ∆x) <strong>de</strong>nota um termo (o resto) muito menor do que a norma <strong>de</strong> (∆t, ∆x), isto é,muito menor do que √ ∆t 2 + ∆x 2 . “Muito menor” significa que esse termo, quando divididopor √ ∆t 2 + ∆x 2 , vai a zero, se √ ∆t 2 + ∆x 2 vai a zero. Logo, se tomarmos ∆t = h e ∆x = hfentão teremosf(t + h, x + hf) − f(t, x) = hf t (t, x) + hf(t, x)f x (t, x) + o(h) ,pois √ ∆t 2 + ∆x 2 = h √ 1 + f 2 . Na notação compacta que propusemos, temoshf t + hff x = f(t + h, x + hf) − f + o(h) .Portantox(t + h) − x(t) = h(f + 1 )2 (f(t + h, x + hf) − f) + o(h 2 )(a soma <strong>de</strong> dois termos o(h 2 ) é um termo o(h 2 )). Ou seja,x(t + h) − x(t) = h (f(t, x) + f(t + h, x + hf)) .2


198CAPÍTULO 18. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAISVejamos como isso se dá na prática, ao passarmos <strong>de</strong> x k para x k+1 . Pensando em termos<strong>de</strong> algoritmo, temos que calcular ξ 1 = f(t k , x k ) e, tomando esse valor <strong>de</strong> ξ 1 , calcularξ 2 = f(t k + h, x k + hξ 1 ) .Assimx k+1 = x k + h 2 (ξ 1 + ξ 2 ) .A vantagem <strong>de</strong>sse método é que não precisamos calcular <strong>de</strong>rivadas parciais <strong>de</strong> f, e oalgoritmo fica consi<strong>de</strong>ravelmente mais simples. Apenas calculamos ξ 1 (que é o valor <strong>de</strong> fno ponto (t k , x k )), e <strong>de</strong>pois usamos ξ 1 para calcular outro valor <strong>de</strong> f, <strong>de</strong>sta feita no ponto(t k +h, x k +hξ 1 ). O acréscimo em x k para se chegar a x k+1 será a média <strong>de</strong>sses dois valores,multiplicada pelo passo h.Na tabela abaixo fazemos esse algoritmo, com o problema x ′ = −3t 2 x, x(0) = 2, nointervalo [0, 1]. Usando o passo h = 0.1, a coluna ξ 1 significaξ 1 = −3t 2 k x ke a coluna ξ 2 significaξ 2 = −3t 2 k+1 (x k + hξ 1 ) ,pois t k + h = t k+1 .k t k 2e −t3 k x k ξ 1 ξ 2h2 (ξ 1 + ξ 2 )0 0.0 2.0000 2.0000 0 −.060000 −0.00300001 0.1 1.9980 1.9970 −0.059910 −0.23892 −0.0149422 0.2 1.9841 1.9821 −0.23785 −0.52875 −0.0383303 0.3 1.9467 1.9438 −0.52483 −0.90783 −0.0716334 0.4 1.8760 1.8722 −0.89866 −1.3368 −0.111775 0.5 1.7650 1.7604 −1.3203 −1.7586 −0.153956 0.6 1.6115 1.6065 −1.7350 −2.1065 −0.192087 0.7 1.4193 1.4144 −2.0792 −2.3164 −0.219788 0.8 1.1986 1.1946 −2.2936 −2.3455 −0.231969 0.9 0.96478 0.96264 −2.3392 −2.1862 −0.2262710 1.0 0.73576 0.73637 − − −Observamos que a diferença para o valor correto foi <strong>de</strong>, no máximo, 0.005.18.5 Runge-KuttaO método <strong>de</strong> Runge-Kutta é uma generalização do algoritmo que <strong>de</strong>senvolvemos em segundaor<strong>de</strong>m, para que não seja preciso calcular <strong>de</strong>rivadas parciais <strong>de</strong> f, e vale para qualquer or<strong>de</strong>mm. Pensando na passagem <strong>de</strong> x k para x k+1 a idéia é escreverx(t + h) − x(t) = h(γ 1 ξ 1 + γ 2 ξ 2 + . . . + γ m ξ m ) ,


18.5. RUNGE-KUTTA 199on<strong>de</strong>ξ 1 = f(t k , x k ) ,ξ 2 = f(t k + a 1 h, x k + b 1 ξ 1 h) ,ξ 3 = f(t k + a 2 h, x k + b 2 ξ 2 h) ,...ξ m = f(t k + a m−1 h, x k + b m−1 ξ m−1 h) .Ou seja, <strong>de</strong>ntro <strong>de</strong> cada etapa k é preciso fazer uma recorrência <strong>de</strong> tamanho m, on<strong>de</strong> cadaξ i (i ≥ 2) é calculado em função <strong>de</strong> ξ i−1 , partindo <strong>de</strong> ξ 1 = f(t k , x k ).Na Seção anterior, tínhamos m = 2, γ 1 = γ 2 = 1 2 e a 1 = b 1 = 1. Agora consi<strong>de</strong>raremos ocaso m = 3, e tentaremos <strong>de</strong>terminar as constantes γ 1 , γ 2 e γ 3 , assim como a 1 , b 1 , a 2 e b 2 .Ao final, veremos que existe uma certa liberda<strong>de</strong> na escolha <strong>de</strong>ssas constantes.A maneira <strong>de</strong> se organizar para uma tarefa <strong>de</strong>ssas é a seguinte. Desenvolveremos os doislados da equaçãox(t + h) − x(t)= γ 1 ξ 1 + γ 2 ξ 2 + γ 3 ξ 3haté or<strong>de</strong>m 2 em h (seria or<strong>de</strong>m 3, mas estamos dividindo tudo por h), e obteremos váriostermos envolvendo <strong>de</strong>rivadas parciais <strong>de</strong> f. Como ocorre com polinômios, é preciso haverigualda<strong>de</strong> termo a termo. Cada uma <strong>de</strong>ssas igualda<strong>de</strong>s será uma equação on<strong>de</strong> as incógnitassão as constantes procuradas, e o problema ficará reduzido à resolução <strong>de</strong>sse sistema (nãolinear) <strong>de</strong> equações.O lado esquerdo da equação é mais conhecido:x(t + h) − x(t)h= x ′ + 1 2 x′′ h + 1 6 x′′′ h 2 + o(h 2 ) ,on<strong>de</strong> as expressões <strong>de</strong> x ′ , x ′′ e x ′′′ já foram <strong>de</strong>duzidas na Seção 18.2. Introduzindo essasexpressões, ficamos comf + 1 2 hf t + 1 2 hff x + 1 6 h2 f t f x + 1 6 h2 ff 2 x + 1 6 h2 f tt + 1 3 h2 ff tx + 1 6 h2 f 2 f xx .Os termos estão separados um a um, propositalmente, porque isso tornará mais fácil a comparaçãocom o outro lado da equação.Com relação ao outro lado, é preciso calcular ξ 1 , ξ 2 e ξ 3 , até or<strong>de</strong>m h 2 . Já sabemos queξ 1 = f. E sabendo ξ i calculamos ξ i+1 porExpandindo f até segunda or<strong>de</strong>m, obtemosξ i+1 = f(t + a i h, x + b i ξ i h) =ξ i+1 = f(t + a i h, x + b i ξ i h) .= f + (a i h)f t + (b i ξ i h)f x + 1 2 (a ih) 2 f tt + (a i h)(b i ξ i h)f tx + 1 2 (b iξ i h) 2 f xx + o(h 2 ) .Por outro lado, ξ i já foi calculado <strong>de</strong> maneira semelhante, e sua expressão <strong>de</strong>veria ser substituídana expressão <strong>de</strong> ξ i+1 .


200CAPÍTULO 18. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAISNo caso m = 3, temos ξ 1 = f, portantoξ 2 = f(t + a 1 h, x + b 1 hf) == f + a 1 hf t + b 1 hff x + 1 2 a2 1h 2 f tt + a 1 b 1 h 2 ff tx + 1 2 b2 1h 2 f 2 f xx + o(h 2 ) .Já a expressão <strong>de</strong> ξ 3 é mais complicada, pois <strong>de</strong>vemos substituir a expressão <strong>de</strong> ξ 2 emcada lugar on<strong>de</strong> aparece. Por sorte, po<strong>de</strong>mos <strong>de</strong>sprezar os termos que tenha or<strong>de</strong>m mais altado que h 2 . Por exemplo,b 2 hξ 2 f x = b 2 h(f + a 1 hf t + b 1 hff x )f x + o(h 2 ) ,uma vez que os termos com h 2 , quando multiplicados por h, ficam h 3 , isto é, são termoso(h 2 ). Há outros dois termos a expandir:a 2 b 2 h 2 ξ 2 f tx = a 2 b 2 h 2 ff tx + o(h 2 )eEntão12 b2 2 h2 ξ 2 2 f xx = 1 2 b2 2 h2 f 2 f xx + o(h 2 ) .ξ 3 = f + (a 2 hf t ) + (b 2 hff x + a 1 b 2 h 2 f t f x + b 1 b 2 h 2 f 2 x )++ 1 2 a2 2 h2 f tt + a 2 b 2 h 2 ff tx + 1 2 b2 2 h2 f 2 f xx + o(h 2 ) .Finalmente, po<strong>de</strong>mos reunir γ 1 ξ 1 +γ 2 ξ 2 +γ 3 x 3 , e conseguiremos uma soma com os seguintestermos: (γ 1 +γ 2 +γ 3 )f, (γ 2 a 1 +γ 3 a 2 )hf t , (γ 2 b 1 +γ 3 b 2 )hff x , γ 3 a 1 b 2 h 2 f t f x , γ 3 b 1 b 2 h 2 ff 2 x,12 (γ 2a 2 1 + γ 3a 2 2 )h2 f tt , (γ 2 a 1 b 1 + γ 3 a 2 b 2 )h 2 ff tx e (γ 2 b 2 1 + γ 3b 2 2 )h2 f 2 f xx .Da comparação termo a termo com a expansão <strong>de</strong>x(t + h) − x(t)hque correspon<strong>de</strong> ao “lado esquerdo” da equação, obtemos as seguintes equações:,f : 1 = γ 1 + γ 2 + γ 3 (18.1)hf t :12= γ 2 a 1 + γ 3 a 2 (18.2)hff x :12= γ 2 b 1 + γ 3 b 2 (18.3)h 2 f t f x :16= γ 3 a 1 b 2 (18.4)h 2 ffx 2 :16= γ 3 b 1 b 2 (18.5)h 2 f tt :16= 1 2 (γ 2a 2 1 + γ 3a 2 2 ) (18.6)h 2 ff tx :13= γ 2 a 1 b 1 + γ 3 a 2 b 2 (18.7)h 2 f 2 f xx :16= 1 2 (γ 2b 2 1 + γ 3b 2 2 ) (18.8)


18.5. RUNGE-KUTTA 201A primeira equação é a única que envolve γ 1 , assim γ 1 ficará <strong>de</strong>terminado assim que γ 2 e γ 3forem <strong>de</strong>terminados. Da quarta e da quinta equações tiramos imediatamente que a 1 = b 1 .Levando isso em conta na sexta e na sétima equações resulta que também a 2 = b 2 . Com isso,as três últimas equações se tornam idênticas, a quarta e a quinta também, e a segunda e aterceira i<strong>de</strong>m. Em resumo, ficamos com três equações nas quatro incógnitas a 1 , a 2 , γ 2 e γ 3 :121613= γ 2 a 1 + γ 3 a 2= γ 3 a 1 a 2= γ 2 a 2 1 + γ 3a 2 2Havendo uma incógnita a mais do que o número <strong>de</strong> equações, abre-se a possibilida<strong>de</strong> para aexistência <strong>de</strong> uma infinida<strong>de</strong> <strong>de</strong> soluções. Po<strong>de</strong>mos escolher um valor para a 2 , por exemplo,mas algumas escolhas po<strong>de</strong>m tornar o sistema impossível. No entanto, saberemos comoescolher se tratarmos a 2 como uma constante, em vez <strong>de</strong> uma incógnita. Da segunda equaçãoγ 2 a 2 = 16a 1colocada na primeira obtemosMultiplicando por a 1 resultaγ 2 a 1 + 16a 1= 1 2 .γ 2 a 2 1 = a 12 − 1 6 ,que junto com a segunda po<strong>de</strong> ser substituída na terceira equação, levando a3a 2 1 − 3a 1 + a 2 = 0 ,<strong>de</strong>pois <strong>de</strong> mais uma multiplicação por a 1 e simplificações. Entãoa 1 = 3 ± √ 9 − 12a 26.Se tomarmos a 2 = 3 4 teremos necessariamente que a 1 = 1 2. Com esses valores, obtemosγ 3 = 4 9 , γ 2 = 2 9 e γ 1 = 2 9 .A conclusão é que o Método <strong>de</strong> Runge-Kutta po<strong>de</strong> ser aplicado comx(t + h) − x(t) = h 9 (2ξ 1 + 3ξ 2 + 4ξ 3 ) + o(h 3 ) ,on<strong>de</strong> ξ 1 = f(t, x), ξ 2 = f(t + 1 2 h, x + 1 2 ξ 1h) e ξ 3 = f(t + 3 4 h, x + 3 4 ξ 2h).Exercício 18.3 Use o algoritmo <strong>de</strong> Runge-Kutta <strong>de</strong> or<strong>de</strong>m 3 <strong>de</strong>duzido acima na equaçãodiferencial separável x ′ = −3t 2 x, x(0) = 2. Aumente o número <strong>de</strong> algarismos significativos.De preferência, crie um programa <strong>de</strong> computador para testar os algoritmos.Exercício 18.4 Na Seção anterior, obtivemos m = 2, γ 1 = γ 2 = 1 2 e a 1 = b 1 = 1 para oMétodo <strong>de</strong> Runge-Kutta <strong>de</strong> or<strong>de</strong>m 2. No entanto, como vimos em or<strong>de</strong>m 3, po<strong>de</strong> haver outrasmaneiras <strong>de</strong> implementá-lo, pois as equações que <strong>de</strong>terminam a escolha dos γ i ’s, a i ’s e b i ’s


202CAPÍTULO 18. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAIStêm mais do que uma solução. Baseando-se no raciocínio feito em or<strong>de</strong>m 3, ache todas aspossíveis implementações do Método <strong>de</strong> Runge-Kutta em or<strong>de</strong>m 2.Exercício 18.5 Consi<strong>de</strong>re a equação x ′ = e x2 t, com a condição inicial x(0) = 1. Obtenhauma discretização/aproximação da solução em [0, 0.5], usando o Método <strong>de</strong> Runge-Kutta <strong>de</strong>segunda or<strong>de</strong>m.Exercício 18.6 Consi<strong>de</strong>re a mesma equação e a mesma condição inicial do Exercício anterior.Aproveite o fato <strong>de</strong> ser uma equação separável para obter x(0.5) usando o Método <strong>de</strong>Newton e o Método <strong>de</strong> Simpson combinados. Para o Método <strong>de</strong> Newton, use condição inicialigual a 1 e calcule 3 iterados posteriores. Para o Método <strong>de</strong> Simpson use n = 4. Discutao erro envolvido ao se resolver a equação <strong>de</strong>ssa maneira, da melhor forma que você pu<strong>de</strong>r.Compare com o resultado da questão anterior.Exercício 18.7 O algoritmo <strong>de</strong> Runge-Kutta <strong>de</strong> or<strong>de</strong>m 4 po<strong>de</strong> ser <strong>de</strong>duzido <strong>de</strong> forma análoga.Para isso é preciso fazer as contas com muito cuidado. Tente partir da suposição <strong>de</strong> queon<strong>de</strong>x(t + h) − x(t) = h(αξ 1 + βξ 2 + γξ 3 + γξ 4 ) + o(h 4 ) ,ξ 1 = f(t, x) ,ξ 2 = f(t + bh, x + bξ 1 h) ,ξ 3 = f(t + ch, x + cξ 2 h) ,ξ 4 = f(t + dh, x + dξ 3 h) ,e mostre que essas constantes po<strong>de</strong>m assumir os seguintes valores: α = 1 6 , β = 2 6 , γ = 2 6 ,δ = 1 6 , b = 1 2 , c = 1 2 e d = 1.Exercício 18.8 Implemente o Método <strong>de</strong> Runge-Kutta <strong>de</strong> or<strong>de</strong>m 4 no computador.18.6 Runge-Kutta em sistemas <strong>de</strong> equações autônomasA resolução numérica <strong>de</strong> um sistema <strong>de</strong> equações autônomas é muito semelhante ao que jáfizemos antes. Desenvolveremos o Método <strong>de</strong> Runge-Kutta <strong>de</strong> or<strong>de</strong>m 2 para um sistema <strong>de</strong>duas equações, e o leitor verá que o Método po<strong>de</strong> ser aplicado a qualquer tipo <strong>de</strong> sistema<strong>de</strong> equações diferenciais, autônomas ou não, em qualquer or<strong>de</strong>m, tudo <strong>de</strong>pen<strong>de</strong>ndo <strong>de</strong> se <strong>de</strong>duziro algoritmo convenientemente. Há atualmente muitos programas <strong>de</strong> computador comos algoritmos já implementados, bastando ao usuário somente digitar as equações. Outrosalgoritmos mais finos são também usados, para minimizar ainda mais os erros, principalmentequando se trata <strong>de</strong> integrar a equação diferencial em gran<strong>de</strong>s intervalos <strong>de</strong> tempo. Érecomendável, no entanto, saber minimamente como eles funcionam.Suponha que queiramos integrar o sistema <strong>de</strong> equações diferenciais{ x′= f(x, y)y ′ = g(x, y).


18.6. RUNGE-KUTTA EM SISTEMAS DE EQUAÇÕES AUTÔNOMAS 203Até segunda or<strong>de</strong>m, temos{x(t + h) − x(t) = hx ′ + h22 x′′ + o(h 2 )y(t + h) − y(t) = hy ′ + h22 y′′ + o(h 2 ).Como x ′ = f e y ′ = g, entãox ′′ = x ′ f x + y ′ f y = ff x + gf yey ′′ = x ′ g x + y ′ g y = fg x + gg y .Então {x(t + h) − x(t) = h(f +12 (hff x + hgf y ) ) + o(h 2 )y(t + h) − y(t) = h ( g + 1 2 (hfg x + hgg y ) ) + o(h 2 )MasePortantohff x + hgf y = f(x + fh, y + gh) − f(x, y) + o(h)hfg x + hgg y = g(x + fh, y + gh) − f(x, y) + o(h) ..{x(t + h) − x(t) =h2 (f(x, y) + f(x + fh, y + gh)) + o(h2 )y(t + h) − y(t) = h 2 (g(x, y) + g(x + fh, y + gh)) + o(h2 ).Exercício 18.9 Consi<strong>de</strong>re o sistema <strong>de</strong> equações diferenciais{ ẋ = x 2 + yẏ =11+xSe x(0) = −0.5 e y(0) = 0.2, estime t > 0 necessário para que a solução (x(t), y(t)) cruze oeixo y, usando o Método <strong>de</strong> Euler <strong>de</strong> primeira or<strong>de</strong>m com passo 0.1.Exercício 18.10 Deduzir o Método <strong>de</strong> Runge-Kutta <strong>de</strong> or<strong>de</strong>m 4 para sistemas autônomos<strong>de</strong> duas equações.Exercício 18.11 Usar os Métodos <strong>de</strong> Runge-Kutta para integrar os sistemas <strong>de</strong> equaçõesdiferenciais da Seção 17.5.


204CAPÍTULO 18. SOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAIS


Apêndice AEnten<strong>de</strong>ndo os sistemas linearesA.1 <strong>Sistemas</strong> lineares e interseções <strong>de</strong> hiperplanosPo<strong>de</strong>-se melhorar bastante a compreensão dos sistemas lineares se os interpretarmos sob oponto <strong>de</strong> vista geométrico.Consi<strong>de</strong>re o sistema {5x + 2y = 3,−x + y = 1em que procuramos x e y que simultaneamente satisfaçam as equações dadas.Po<strong>de</strong>mos olhar para uma equação <strong>de</strong> cada vez, examinando o conjunto dos pares (x, y)que satisfazem a primeira e <strong>de</strong>pois o conjunto dos (x, y) que satisfazem a segunda. O queestamos procurando é a intersecção <strong>de</strong>sses dois conjuntos, isto é, os pontos do plano quesatisfazem as duas equações ao mesmo tempo.A equação 5x + 2y = 3 <strong>de</strong>termina umareta. Observe que essa reta é o gráficoda função y(x) = 3 2 − 5 2x, que teminclinação − 5 2e cruza o eixo das or<strong>de</strong>nadasem 3 2. A outra equação <strong>de</strong>terminaoutra reta, gráfico da funçãoy(x) = 1 + x, que tem inclinação 1 ecruza a or<strong>de</strong>nada em 1.325x+2y=3132y=1+x5x+2y=3Na figura ao lado <strong>de</strong>senhamos as duasretas, e constatamos que elas <strong>de</strong>vem secruzar num único ponto. Esse ponto,por estar simultaneamente nas duas retas,satisfaz as duas equações. Portantoele é a solução procurada do sistema linear.205


206APÊNDICE A. ENTENDENDO OS SISTEMAS LINEARESPor essa interpretação enten<strong>de</strong>-se porque alguns sistemaspo<strong>de</strong>m não ter solução. Isso acontece se asretas forem paralelas mas não coinci<strong>de</strong>ntes, como nosistema abaixo:{−2x + 2y = 0.−x + y = 11y=1+xy=xAs retas são os gráficos das funções y = 1+x e y = x,como mostra a figura ao lado.Outra coisa que po<strong>de</strong> acontecer é a existência <strong>de</strong> uma infinida<strong>de</strong> <strong>de</strong> soluções. Basta queas duas equações <strong>de</strong>terminem a mesma reta, como neste exemplo:{ −2x + 2y = 2−x + y = 1.Nem sempre a equação <strong>de</strong> uma reta <strong>de</strong>terminao gráfico <strong>de</strong> uma função y(x). Esse será sempreo caso quando o coeficiente que multiplicay for igual a zero. Por exemplo, a equação2x = 3 representa uma reta vertical, pois é ox= 323/2ou 2x=3conjunto <strong>de</strong> todos os (x, y) tais que x = 3 2 .E no caso <strong>de</strong> 3 equações a 3 incógnitas? Bem, nesse caso cada uma das equações <strong>de</strong>terminaum plano, e as soluções são todos os pontos <strong>de</strong> intersecção dos três planos. Como no caso <strong>de</strong>2 incógnitas, po<strong>de</strong> haver uma solução, nenhuma ou uma infinida<strong>de</strong> <strong>de</strong>las.Num sistema <strong>de</strong> n equações a n incógnitas <strong>de</strong>vemos imaginar que cada equação <strong>de</strong>terminaum hiperplano <strong>de</strong> dimensão n − 1 no espaço <strong>de</strong> dimensão n. Infelizmente não po<strong>de</strong>mosvisualizar nada disso, mas isso não nos impe<strong>de</strong> <strong>de</strong> teorizar sobre o assunto.A.2 Transformações linearesOutra maneira bastante importante <strong>de</strong> se enten<strong>de</strong>r os sistemas lineares é através do conceito<strong>de</strong> transformações lineares, e <strong>de</strong>le nos ocuparemos até o final do Capítulo.Tomemos novamente o exemplo{ 5x + 2y = 3−x + y = 1.Essa equação po<strong>de</strong> ser escrita na notação matricial( 5 2−1 1) ( xy) ( 3=1).


A.2.TRANSFORMAÇÕES LINEARES 207Para compactar ainda mais a notação, chamaremos <strong>de</strong> A a matriz, u o vetor (matriz coluna)<strong>de</strong> coor<strong>de</strong>nadas x e y e b o vetor (matriz coluna) <strong>de</strong> coor<strong>de</strong>nadas 3 e 1, e escreveremosAu = b .Essa forma <strong>de</strong> escrever sugere que pensemos A como uma função (ou transformação, ou aindaaplicação) que toma um( vetor qualquer ) u e transforma num outro vetor Au.−1Por exemplo, se u = , então2Au =como mostra a figura abaixo.(5 2−1 1) (−12)=(−14),u=(−1,2)Au=(−1,4)Num sistema linear o que temos é o problema ( inverso: ) dado o vetor b (a coluna <strong>de</strong> termosxin<strong>de</strong>pen<strong>de</strong>ntes à direita), qual é o vetor u = tal que Au = b?yÉ fácil ver que essa idéia funciona da mesma forma em dimensões mais altas. Se o sistemalinear tem n equações e n incógnitas então os coeficientes formam uma matriz A que po<strong>de</strong>ser usada como uma aplicação (ou transformação, ou função) levando vetores-coluna⎛ ⎞x 1⎜ ⎟u = ⎝ . ⎠x nem vetores Au. Apesar <strong>de</strong> não ser nossa preocupação aqui, na verda<strong>de</strong> nem é preciso que onúmero <strong>de</strong> incógnitas iguale o número <strong>de</strong> equações para termos esse tipo <strong>de</strong> interpretação.Pois o sistema lineara 11 x 1 + a 12 x 2 + . . . + a 1n x n = b 1a 21 x 1 + a 22 x 2 + . . . + a 2n x n = b 2,.a m1 x 1 + a m2 x 2 + . . . + a mn x n = b mque tem m equações e n incógnitas, po<strong>de</strong> ser escrito na forma matricial⎛⎞⎛⎞ ⎛ ⎞a 11 . . . a 1n x 1 b 1⎜⎝.. ..⎟⎜⎟ ⎜ ⎟. ⎠⎝. ⎠ = ⎝ . ⎠ .. . . a mn x n b ma m1


208APÊNDICE A. ENTENDENDO OS SISTEMAS LINEARESAgora a matriz dos coeficientes, que tem m linhas e n colunas, leva, por multiplicação,vetores-coluna <strong>de</strong> tamanho n em vetores-coluna <strong>de</strong> tamanho m (ou seja, é uma aplicação <strong>de</strong>R n em R m ).A.3 Notação e interpretaçãoVale a pena neste ponto fazermos alguns comentários a respeito da notação, o que evitaráconfusões mais tar<strong>de</strong>. Como vimos, a matriz A dos coeficientes, que é n × n, po<strong>de</strong> servista também como uma aplicação, mas não faremos distinção na notação. Como matriz, Amultiplica um vetor-coluna <strong>de</strong> tamanho n e o resultado é um outro vetor-coluna <strong>de</strong> tamanhon. Em notação compacta temos Au = b. Como aplicação, A toma um vetor u <strong>de</strong> R n etransforma em outro vetor b <strong>de</strong> R n .A rigor <strong>de</strong>veríamos escrever A(u) = b, mas não o faremos. Por razões <strong>de</strong> praticida<strong>de</strong> (etambém estéticas, por que não?) usaremos os parênteses somente quando for preciso <strong>de</strong>ixarclaro que A se aplica a toda uma expressão, por exemplo, A(u + v), ao invés <strong>de</strong> Au + v, quepo<strong>de</strong>ria dar a impressão <strong>de</strong> que aplicamos A em u e <strong>de</strong>pois somamos v, quando na verda<strong>de</strong>primeiro somamos u com v e <strong>de</strong>pois aplicamos A.Portanto não faremos distinção clara entre a matriz A e a aplicação A, pois usaremosa mesma notação nos dois casos. Para abusar mais um pouquinho, escreveremos muitasvezes os vetores como n-upla, ao invés <strong>de</strong> vetores-coluna, com as coor<strong>de</strong>nadas separadas porvírgulas, como por exemplo na frase “tome u = (x 1 , . . . , x n ) e b = Au...”, ficando claro quese quisermos calcular b <strong>de</strong>vemos dispor o vetor u em coluna e multiplicar por A, à esquerda.A.4 Inversão <strong>de</strong> matrizesAntes <strong>de</strong> prosseguir, observamos que a notação matricial nos propicia relacionar conceitosaparentemente distantes. Por exemplo, o problema <strong>de</strong> inverter uma matriz quadrada A <strong>de</strong>tamanho n é equivalente a resolver n sistemas lineares n × n.A inversa <strong>de</strong> A é <strong>de</strong>finida como a matriz U tal que AU = Id, on<strong>de</strong> Id é a matriz i<strong>de</strong>ntida<strong>de</strong>,que tem 1 ao longo da diagonal principal e 0 no restante. A proprieda<strong>de</strong> fundamental damatriz i<strong>de</strong>ntida<strong>de</strong> é que Id · A = A e A · Id = A, funcionando <strong>de</strong> forma análoga ao número1 na multiplicação usual entre números reais. A diferença principal entre a multiplicação <strong>de</strong>números reais e a multiplicação <strong>de</strong> matrizes é que a segunda não é comutativa: há (muitos)exemplos on<strong>de</strong> A · U não é igual a U · A (tente verificar com matrizes 2 por 2, escolhidas aoacaso).Suponha que tenhamos A = {a ij } n×n e queiramos achar U = {u ij } n×n tal que A·U = Id.Explicitamente, queremos resolver⎛⎞ ⎛⎞a 11 a 12 . . . a 1n u 11 u 12 . . . u⎛1na 21 a 22 . . . a 2nu 21 u 22 . . . u 2n⎜⎝.. .. . . ..⎟ ⎜⎠ ⎝.. .. . . ..⎟⎠ = ⎜⎝a n1 a n2 . . . a nn u n1 u n2 . . . u nn1 0 . . . 00 1 . . . 0. . . . . . . . . . . .0 0 . . . 1É fácil ver que temos aí n equações do tipo Au = b, on<strong>de</strong> u e b são colunas <strong>de</strong> U e Id na⎞⎟⎠ .


A.5. EXPLORANDO A LINEARIDADE 209mesma posição. Por exemplo, para essa equação ser satisfeita <strong>de</strong>ve valer⎛⎞ ⎛ ⎞ ⎛ ⎞a 11 a 12 . . . a 1n u 11 1a 21 a 22 . . . a 2nu 12⎜⎝.. ..⎟ ⎜ ⎟. . . . ⎠ ⎝ . ⎠ = 0⎜ ⎟⎝ . ⎠ ,a n1 a n2 . . . a nn u n1 0que correspon<strong>de</strong> à primeira coluna.A.5 Explorando a linearida<strong>de</strong>A proprieda<strong>de</strong> mais importante da função que leva vetores u em Au é a linearida<strong>de</strong>. Alinearida<strong>de</strong> significa que, para quaisquer vetores u 1 e u 2 tem-seA(u 1 + u 2 ) = Au 1 + Au 2 ,e que, para qualquer vetor u e qualquer número real α,A(αu) = αAu .Observe que isso é equivalente a dizer que para quaisquer vetores u 1 e u 2 e números α e βvaleA(αu 1 + βu 2 ) = αAu 1 + βAu 2 .Fica como exercício para o leitor <strong>de</strong>monstrar a linearida<strong>de</strong> (em dimensão 2), supondo que( )a bA =c dé uma matriz da forma mais geral possível! Não é difícil, tente!, e <strong>de</strong>pois procure mostrar nocaso geral, para matrizes n × n.Para enten<strong>de</strong>rmos o significado geométrico da linearida<strong>de</strong>, vejamos primeiro o que é asoma <strong>de</strong> vetores e sua multiplicação por um número (comumente chamado <strong>de</strong> escalar).A multiplicação <strong>de</strong> um vetor (x, y) por um escalar α é o vetor (αx, αy), isto é, cadacoor<strong>de</strong>nada é multiplicada por α. Isto significa que os dois vetores são colineares, mas otamanho do novo vetor é |α| vezes o tamanho do vetor original. Além disso, se α for umnúmero negativo, o sentido do novo vetor será oposto ao do vetor original (ver figura abaixo).Dizer então que A(αu) = αAu significa dizer: “tomar a imagem <strong>de</strong> um vetor u multiplicadopor α é o mesmo que tomar a imagem <strong>de</strong> u e <strong>de</strong>pois multiplicar por α”. Isto mostraque, se conhecermos Au então saberemos quem é A(αu) para qualquer α!!A soma <strong>de</strong> dois vetores é vista geometricamente pela Lei dos Paralelogramos. Se u 1 =(x 1 , y 1 ) e u 2 = (x 2 , y 2 ) entãocomo mostrado na figura abaixo.u 1 + u 2 = (x 1 + x 2 , y 1 + y 2 ) ,


210APÊNDICE A. ENTENDENDO OS SISTEMAS LINEARESuuαu( α >1 )u 1+y 1y 2u 2αu(α< 0)x 1x 2Dizer que A(u 1 + u 2 ) = Au 1 + Au 2 significa: “obter a soma por meio da Lei do Paralelogramoe <strong>de</strong>pois aplicar a transformação A é o mesmo que aplicar a transformação a cadaum dos vetores e <strong>de</strong>pois somar pela Lei do Paralelogramo”.Vejamos a principal conseqüência da linearida<strong>de</strong>. Para isso, chamemos a atenção paradois vetores especiais do plano: e 1 = (1, 0) e e 2 = (0, 1). Eles são chamados <strong>de</strong> vetorescanônicos. Sua importância resi<strong>de</strong> no fato <strong>de</strong> que se u = (x, y) é um vetor qualquer entãou = (x, y) = (x, 0) + (0, y) = x(1, 0) + y(0, 1) = xe 1 + ye 2 .Dizemos que u é uma combinação linear <strong>de</strong> e 1 e e 2 (isto é, a soma <strong>de</strong> dois vetores, um colineara e 1 e o outro colinear a e 2 ).Usando a linearida<strong>de</strong>, temos entãoAu = A(xe 1 + ye 2 ) = xAe 1 + yAe 2 .Isto significa que se soubermos Ae 1 e Ae 2 então saberemos automaticamente Au, para qualquervetor u!! Em outras palavras, a ação da aplicação linear A fica completamente <strong>de</strong>terminadapelo seu resultado em e 1 e e 2 !Por exemplo, na figura abaixo mostramos como calcular Au, se u = (1.5, 2), se Ae 1 e Ae 2forem como ilustrado.2uAue 2e11.5Ae 2Ae 1


A.5. EXPLORANDO A LINEARIDADE 211Isso sugere que o sistema <strong>de</strong> coor<strong>de</strong>nadas cartesiano original é transferido para um outrosistema <strong>de</strong> coor<strong>de</strong>nadas, medido a partir <strong>de</strong> combinações lineares <strong>de</strong> Ae 1 e Ae 2 .Fica reforçado assim o caráter geométrico dos sistemas lineares. Pois se <strong>de</strong>rmos b no ladodireito do <strong>de</strong>senho, temos um “método” para achar u tal que Au = b (vi<strong>de</strong> figura abaixo).Basta “medir” as coor<strong>de</strong>nadas <strong>de</strong> b no sistema <strong>de</strong> coor<strong>de</strong>nadas das combinações <strong>de</strong> Ae 1 eAe 2 , e <strong>de</strong>pois procurar no sistema cartesiano tradicional, à esquerda, o vetor que tem essascoor<strong>de</strong>nadas!ue 2e1Ae 2bAe 1b=AuVale aqui uma observação bastante pertinente: “os vetores Ae 1 e Ae 2 são as colunas damatriz A”. É fácil ver a razão:(a bAe 1 =c d) (10) (a=c)(a b, Ae 2 =c d) (01) (b=d).Tudo ocorre <strong>de</strong> forma semelhante em dimensão qualquer n. A soma <strong>de</strong> vetores tambémé obtida pela soma das coor<strong>de</strong>nadas dos vetores. Também como em dimensão 2, a aplicaçãoque leva vetores u em vetores Au é linear. Os vetores canônicos são e 1 = (1, 0, . . .,0), e 2 =(0, 1, 0, . . ., 0), . . ., e n = (0, 0, . . .,0, 1). Qualquer vetor po<strong>de</strong> ser escrito como combinaçãolinear dos vetores canônicos, poisu = (x 1 , x 2 , . . .,x n ) = x 1 e 1 + x 2 e 2 + . . . + x n e n .Isto implica que saber Ae 1 , . . .,Ae n permite calcular automaticamente qualquer Au.


212APÊNDICE A. ENTENDENDO OS SISTEMAS LINEARESA.6 Existência e unicida<strong>de</strong> <strong>de</strong> soluçõesVoltando a pensar em dimensão 2, observe que esse “esquemageométrico” para achar u tal que Au = b ficariaprejudicado se por alguma razão Ae 1 e Ae 2 fossem vetorescolineares. Isso aconteceria se os vetores-coluna da matrizA fossem colineares, como por exemplo na matriz( ) 2 −4.−3 6Neste caso, teremos Ae 1 e Ae 2 como na figura ao lado.Ae =(−4,6)2Ae =(2,−3)1O <strong>de</strong>sastre ocorre se tivermos um vetor b que não seja colinear a eles e quisermos achar utal que Au = b. É fácil ver porque não vai existir esse vetor: todo vetor u = (x, y) se escrevecomo combinação linear u = xe 1 + ye 2 , logo Au = xAe 1 + yAe 2 . Só que se Ae 1 e Ae 2 foremcolineares então Au também será colinear a eles. Em resumo, para qualquer escolha <strong>de</strong> u,o vetor imagem Au estará sempre sobre a mesma reta, na mesma direção <strong>de</strong> Ae 1 e Ae 2 (aaplicação A leva todo o R 2 sobre uma reta, uma aplicação longe <strong>de</strong> ser injetiva!). Portantoé impossível que exista Au = b se b não for colinear com esses dois vetores!Esse tipo <strong>de</strong> problema ocorre justamente nos sistemas in<strong>de</strong>terminados. É o caso em que osistema não tem solução. Por outro lado, se b for colinear a Ae 1 e Ae 2 então haverá infinitassoluções, isto é, infinitas escolhas <strong>de</strong> u tais que Au = b. Para mostrar isso, escrevemosAe 2 = αAe 1 (já que eles são colineares, e supondo que Ae 1 seja não-nulo), eAu = xAe 1 + yAe 2 = xAe 1 + αyAe 1 = (x + αy)Ae 1 .Ao mesmo tempo, com a hipótese <strong>de</strong> que b seja colinear a Ae 1 temosEntão Au = b <strong>de</strong>s<strong>de</strong> queb = βAe 1 .x + αy = β ,o que <strong>de</strong>termina uma reta <strong>de</strong> possibilida<strong>de</strong>s <strong>de</strong> x e y.Pensando em geral, em dimensão n, o problema <strong>de</strong> se achar u tal que Au = b terá soluçãogarantida sempre que possamos achar números x 1 , . . . , x n tais queb = x 1 Ae 1 + . . . + x n Ae n ,isto é, sempre que {Ae 1 , . . .,Ae n } formar uma base, pois então pela linearida<strong>de</strong>,b = A(x 1 e 1 + . . . + x n e n ) = Au ,se chamarmos u = (x 1 , . . .,x n ).Po<strong>de</strong>-se <strong>de</strong>monstrar que {Ae 1 , . . . , Ae n } não forma uma base se e somente se um dosvetores Ae i for combinação linear dos <strong>de</strong>mais. Sempre que {Ae 1 , . . . , Ae n } (lembre-se, são ascolunas da matriz A) não formar uma base, teremos duas situações possíveis para a equação


A.7. INJETIVIDADE, SOBREJETIVIDADE... GLUP! 213Au = b, <strong>de</strong>pen<strong>de</strong>ndo <strong>de</strong> b: se b não for combinação linear <strong>de</strong> {Ae 1 , . . . , Ae n } então a equaçãonão terá solução; e se b for combinação linear <strong>de</strong> {Ae 1 , . . . , Ae n } então haverá uma infinida<strong>de</strong><strong>de</strong> soluções da equação (tente mostrar isso!).Já se {Ae 1 , . . . , Ae n } formar uma base então b se escreve <strong>de</strong> forma única comob = x 1 Ae 1 + . . . + x n Ae n ,implicando que existe uma única solução para Au = b, a saber u = (x 1 , . . . , x n ).A.7 Injetivida<strong>de</strong>, sobrejetivida<strong>de</strong>... glup!Valem aqui alguns comentários complementares sobre a discussão teórica que estamos levando.Acabamos <strong>de</strong> ver que a matriz <strong>de</strong> coeficientes A nos <strong>de</strong>ixa duas opções: 1) para todob, Au = b tem solução (portanto a aplicação A é sobrejetiva) e essa solução é única (don<strong>de</strong>Au = Av implica u = v, isto é, a aplicação A é também injetiva); 2) existe b tal que Au = bnão tem solução (logo A não é sobrejetiva) e existe b tal que Au = b tem várias soluções(logo A não é injetiva). Ou seja, das duas uma: ou A é bijetiva ou não é nem sobrejetivanem injetiva.Uma característica típica <strong>de</strong> uma aplicação linear A é que se A não for injetiva então háum vetor w não-nulo (<strong>de</strong> fato, uma infinida<strong>de</strong> <strong>de</strong>les) tal que Aw = 0. Pois se A não é injetivaentão existem u e v, com u ≠ v, tais que Au = Av. Logo Au − Av = 0, e pela linearida<strong>de</strong>A(u − v) = 0 .Chame w = u − v. Esse vetor é não-nulo porque u ≠ v, e assim <strong>de</strong>monstramos nossaafirmativa.Para ilustrar, apliquemos essas idéias ao problema <strong>de</strong> interpolação polinomial da Seção 1.5.Lá queríamos passar o gráfico <strong>de</strong> um polinômio p(x) <strong>de</strong> grau n −1 por n pontos fixados (comabscissas distintas). Isto é, dados (x 1 , y 1 ), . . . , (x n , y n ) queríamos achar p(x) = a 0 + a 1 x +. . . + a n−1 x n−1 tal que p(x 1 ) = y 1 , . . .,p(x n ) = y n , e isso nos levou imediatamente a umsistema linear on<strong>de</strong> as incógnitas são os n coeficientes do polinômio:⎛⎜⎝ .1 x 1 x 2 1 . . . x n−111 x 2 x 2 2 . . . x n−12. . . .1 x n x 2 n . . . xnn−1⎞⎛⎟⎜⎠⎝⎞a 0a 1⎟.a n−1⎛⎠ = ⎜⎝⎞y 1y 2⎟. ⎠ .y nQueremos mostrar que essa equação sempre tem solução e essa solução é única. Comovimos acima, isso acontece se e somente se a matriz A dos coeficientes for uma aplicaçãoinjetiva.Suponha por contradição que essa matriz A não fosse injetiva. Então existiria um conjunto<strong>de</strong> coeficientes w = (a 0 , a 1 , . . . , a n−1 ) não-nulo (isto é, pelo menos um dos coeficientesdiferente <strong>de</strong> zero) tal que Aw = 0. Ou seja, teríamos um polinômio q(x) <strong>de</strong> grau n − 1 (nomáximo), não-nulo, tal que q(x 1 ) = 0, . . .,q(x n ) = 0, isto é, com n raízes distintas.Mas polinômios não-nulos <strong>de</strong> grau n − 1 têm no máximo n − 1 raízes (prove usandoseus conhecimentos <strong>de</strong> cálculo!), portanto chegamos a uma contradição, o que mostra que Aobrigatoriamente tem que ser injetiva!


214APÊNDICE A. ENTENDENDO OS SISTEMAS LINEARESExercício 1.1 Explique por que se A for injetiva então existe uma e somente uma soluçãopara a equação Au = b.A.8 O <strong>de</strong>terminanteO <strong>de</strong>terminante da matriz A dos coeficientes <strong>de</strong> um sistema linear serve como instrumentopara saber se {Ae 1 , . . . , Ae n } é uma base, indicando se o sistema tem ou não única solução.De fato, esta Seção tem a pretensão <strong>de</strong> convencer o leitor <strong>de</strong> que <strong>de</strong>tA ≠ 0 se e somente se{Ae 1 , . . . , Ae n } é uma base. A idéia é explicar o que é o <strong>de</strong>terminante <strong>de</strong> uma forma intuitivae geométrica, mas o leitor po<strong>de</strong> encontrar abordagens diferentes em outros livros.É preciso salientar que o <strong>de</strong>terminante será inicialmente <strong>de</strong>finido para um conjunto <strong>de</strong> nvetores (em R n ) e <strong>de</strong>pois <strong>de</strong>finiremos<strong>de</strong>t A = <strong>de</strong>t(Ae 1 , . . . , Ae n ) .Começaremos a discussão em dimensão 2, e <strong>de</strong>pois comentaremos sua generalização paradimensão qualquer.A.8.1 Dimensão 2O <strong>de</strong>terminante dá, <strong>de</strong> certa forma, uma medida do quanto dois vetores estão perto <strong>de</strong> sercolineares. Definiremos o <strong>de</strong>terminante <strong>de</strong> um par or<strong>de</strong>nado <strong>de</strong> vetores (u 1 , u 2 ), <strong>de</strong>notando-opor<strong>de</strong>t(u 1 , u 2 ) ,como sendo a área do paralelogramo <strong>de</strong>terminado por esses dois vetores, com um “sinal”.Sendo assim, dois vetores serão colineares entre si se e somente se seu <strong>de</strong>terminante fornulo. O <strong>de</strong>terminante <strong>de</strong> uma matriz A 2 × 2 é <strong>de</strong>finido como sendo o <strong>de</strong>terminante do par(Ae 1 , Ae 2 ):<strong>de</strong>tA ≡ <strong>de</strong>t(Ae 1 , Ae 2 ) .Desse modo, fica evi<strong>de</strong>nte que o <strong>de</strong>terminante <strong>de</strong> A é diferente <strong>de</strong> zero se e somente se osistema Au = b admitir única solução (não importando quais sejam os termos in<strong>de</strong>pen<strong>de</strong>ntes,isto é, o vetor b da equação). Lembrando também que Ae 1 e Ae 2 são as colunas da matrizA, segue que <strong>de</strong>tA = 0 se e somente se suas colunas forem colineares.Para que a <strong>de</strong>finição fique completa, precisamos estabelecer melhor o que é o paralelogramo<strong>de</strong>terminado pelos dois vetores e <strong>de</strong>finir <strong>de</strong> maneira inequívoca o sinal do <strong>de</strong>terminante.Além disso, precisamos saber calcular o <strong>de</strong>terminante, e o leitor verá que a <strong>de</strong>finição dadaaqui coinci<strong>de</strong> com aquela que ele provavelmente já conhece.Chamaremos <strong>de</strong> P(u 1 , u 2 ) o paralelogramo <strong>de</strong>terminado por u 1 e u 2 . Ele é <strong>de</strong>finido comosendo o conjuntoP(u 1 , u 2 ) = {su 1 + tu 2 ; 0 ≤ s ≤ 1 , 0 ≤ t ≤ 1} .Isso porque, se 0 ≤ s, su 1 é um vetor com o mesmo sentido que u 1 , e se s ≤ 1, su 1 é um vetor<strong>de</strong> tamanho menor ou igual ao tamanho <strong>de</strong> u 1 . O mesmo ocorre com tu 2 , para 0 ≤ t ≤ 1. Oparalelogramo é constituído então <strong>de</strong> todas as somas <strong>de</strong> vetores <strong>de</strong>sse tipo.O sinal <strong>de</strong> <strong>de</strong>t(u 1 , u 2 ) é <strong>de</strong>finido assim, se u 1 e u 2 não são colineares: se (u 1 , u 2 ) po<strong>de</strong>ser suavemente alterado até que coincida com o par <strong>de</strong> vetores canônicos (e 1 , e 2 ) (na or<strong>de</strong>m


A.8. O DETERMINANTE 215correspon<strong>de</strong>nte, isto é, u 1 é alterado até coincidir com e 1 , e u 2 com e 2 ), <strong>de</strong> forma que os vetoresnunca se tornem colineares ao longo do processo, então o sinal é positivo. Caso contrárioé negativo. Veja dois exemplos com sinais diferentes na figura abaixo. O da esquerda é opositivo.u2u 1u1Daí resulta que <strong>de</strong>t(e 1 , e 2 ) = +1 (sinal positivo e área igual a 1) e que <strong>de</strong>t(e 2 , e 1 ) = −1.Além disso, mais geralmente, <strong>de</strong>t(u 1 , u 2 ) = − <strong>de</strong>t(u 2 , u 1 ), ou seja, se trocarmos a or<strong>de</strong>m dosvetores então o sinal do <strong>de</strong>terminante será trocado.Uma proprieda<strong>de</strong> importante do <strong>de</strong>terminante é a linearida<strong>de</strong> com respeito a cada um dosvetores. Ou seja, precisamos mostrar quee queu2<strong>de</strong>t(αu, v) = α <strong>de</strong>t(u, v)<strong>de</strong>t(u 1 + u 2 , v) = <strong>de</strong>t(u 1 , v) + <strong>de</strong>t(u 2 , v) .Observe que se isso for verda<strong>de</strong>, então enunciados semelhantes são válidos para o segundovetor do par. Por exemplo,<strong>de</strong>t(u, αv) = − <strong>de</strong>t(αv, u) = −α <strong>de</strong>t(v, u) = α <strong>de</strong>t(u, v) .Para mostrar as duas proprieda<strong>de</strong>s <strong>de</strong> linearida<strong>de</strong> recorremos a princípios geométricos.Veja nas figuras abaixo o que acontece em cada caso. No segundo caso, o princípio <strong>de</strong> Cavalierigarante que a área <strong>de</strong> P(u 1 , v) mais a área <strong>de</strong> P(u 2 , v) é igual à área <strong>de</strong> P(u 1 +u 2 , v) (atenção,a figura é no plano, não se trata <strong>de</strong> <strong>de</strong>senho em perspectiva!).vuαuP(αu,v)vP(u + u ,v)1 2u + u1 2u2P(u,v)P(u ,v)1uP(u ,v)1 2


216APÊNDICE A. ENTENDENDO OS SISTEMAS LINEARESEsse argumento convence facilmente no caso em que <strong>de</strong>t(u 1 , v) e <strong>de</strong>t(u 2 , v) tenham omesmo sinal. Se esse não for o caso, então sugere-se provar que<strong>de</strong>t(u 1 , v) = <strong>de</strong>t((u 1 + u 2 ) + (−u 2 ), v) = <strong>de</strong>t(u 1 + u 2 , v) + <strong>de</strong>t(−u 2 , v) ,pois é fácil ver que <strong>de</strong>t(−u 2 , v) = − <strong>de</strong>t(u 2 , v).Com essas proprieda<strong>de</strong>s todas garantimos o cálculo <strong>de</strong> qualquer <strong>de</strong>terminante. Para verisso, escrevemos u 1 = (x 1 , y 1 ), u 2 = (x 2 , y 2 ), mas lembramos a outra forma <strong>de</strong> escrever essesvetores, como combinação linear <strong>de</strong> e 1 e e 2 : u 1 = x 1 e 1 + y 1 e 2 e u 2 = x 2 e 1 + y 2 e 2 . Então<strong>de</strong>t(u 1 , u 2 ) = <strong>de</strong>t(x 1 e 1 + y 1 e 2 , x 2 e 1 + y 2 e 2 )= x 1 <strong>de</strong>t(e 1 , x 2 e 1 + y 2 e 2 ) + y 1 <strong>de</strong>t(e 2 , x 2 e 1 + y 2 e 2 ) ,aplicando a linearida<strong>de</strong> no primeiro vetor do par. Aplicando novamente a linearida<strong>de</strong> nosegundo vetor do par, temos<strong>de</strong>t(u 1 , u 2 ) = x 1 (x 2 <strong>de</strong>t(e 1 , e 1 ) + y 2 <strong>de</strong>t(e 1 , e 2 )) + y 1 (x 2 <strong>de</strong>t(e 2 , e 1 ) + y 2 <strong>de</strong>t(e 2 , e 2 )) .Como <strong>de</strong>t(e 1 , e 1 ) = <strong>de</strong>t(e 2 , e 2 ) = 0, <strong>de</strong>t(e 1 , e 2 ) = +1 e <strong>de</strong>t(e 2 , e 1 ) = −1, então<strong>de</strong>t(u 1 , u 2 ) = x 1 y 2 − x 2 y 1 .Numa matriz ( a bc dos vetores coluna são u 1 = (a, c) e u 2 = (b, d), <strong>de</strong> forma que)<strong>de</strong>tA = ad − bc .Bom, essa é a fórmula usual do <strong>de</strong>terminante que apren<strong>de</strong>mos <strong>de</strong>s<strong>de</strong> o Colégio!!Vale a pena lembrar as proprieda<strong>de</strong>s essenciais do <strong>de</strong>terminante que permitem calculá-lopara qualquer par <strong>de</strong> vetores:1. <strong>de</strong>t(e 1 , e 2 ) = 1 (normalização);2. <strong>de</strong>t(u, v) = − <strong>de</strong>t(v, u) (alternância);3. <strong>de</strong>t(αu + βv, w) = α <strong>de</strong>t(u, w) + β <strong>de</strong>t(v, w) (linearida<strong>de</strong>).A.8.2 Dimensão 3Em dimensão 3, po<strong>de</strong>mos <strong>de</strong>finir o paralelepípedo P(u 1 , u 2 , u 3 ), on<strong>de</strong> u 1 , u 2 , u 3 são vetores<strong>de</strong> R 3 como o conjuntoP(u 1 , u 2 , u 3 ) = {ru 1 + su 2 + tu 3 ; 0 ≤ r, s, t ≤ 1}(não é difícil ver o que seria um paralelepípedo em dimensão mais alta, generalizando essa<strong>de</strong>finição). O <strong>de</strong>terminante <strong>de</strong>t(u 1 , u 2 , u 3 ) será o volume <strong>de</strong>sse paralelepípedo, com um sinalque <strong>de</strong>vemos convencionar.


A.8. O DETERMINANTE 217De qualquer forma, um <strong>de</strong>terminante nulo correspon<strong>de</strong> a um conjunto <strong>de</strong> três vetores emque um <strong>de</strong>les é combinação linear dos outros, pois daí não resulta um paralelepípedo comvolume.O sinal do <strong>de</strong>terminante é convencionado <strong>de</strong> maneira análoga ao que fizemos em dimensão2. Se {u 1 , u 2 , u 3 } é uma base (ou seja, nenhum é combinação linear dos outros), o sinal <strong>de</strong><strong>de</strong>t(u 1 , u 2 , u 3 ) será positivo se a trinca or<strong>de</strong>nada (u 1 , u 2 , u 3 ) pu<strong>de</strong>r ser suavemente <strong>de</strong>formadaaté (e 1 , e 2 , e 3 ) sem que nunca <strong>de</strong>ixe <strong>de</strong> formar uma base.Essa <strong>de</strong>finição é pouco prática: como calcular <strong>de</strong>tA = <strong>de</strong>t(Ae 1 , Ae 2 , Ae 3 )? Mais uma vez,é conveniente <strong>de</strong>monstrar as proprieda<strong>de</strong>s básicas do <strong>de</strong>terminante e usá-las para os cálculos.As proprieda<strong>de</strong>s básicas são (tente se convencer você mesmo por que elas valem):1. <strong>de</strong>t(e 1 , e 2 , e 3 ) = +1;2. <strong>de</strong>t(u 1 , u 2 , u 3 ) = <strong>de</strong>t(u 3 , u 1 , u 2 ) = <strong>de</strong>t(u 2 , u 3 , u 1 )= − <strong>de</strong>t(u 3 , u 2 , u 1 ) = − <strong>de</strong>t(u 1 , u 3 , u 2 ) = − <strong>de</strong>t(u 2 , u 1 , u 3 );3. <strong>de</strong>t(αu + βv, u 2 , u 3 ) = α <strong>de</strong>t(u, u 2 , u 3 ) + β <strong>de</strong>t(v, u 2 , u 3 ) .Na segunda proprieda<strong>de</strong>, note que qualquer troca entre vetores muda o sinal do <strong>de</strong>terminante.A troca po<strong>de</strong> ocorrer com qualquer par <strong>de</strong> posições: primeira com segunda, segundacom terceira e primeira com terceira. Isso implica em particular que sempre que houvervetores repetidos na trinca então o <strong>de</strong>terminante é nulo, pois, por exemplo,<strong>de</strong>t(u, u, v) = − <strong>de</strong>t(u, u, v) ,logo <strong>de</strong>t(u, u, v) = 0.Po<strong>de</strong>mos usar essas regras para calcular o <strong>de</strong>terminante da matriz 3 × 3⎛A = ⎝ a ⎞11 a 12 a 13a 21 a 22 a 23⎠ ,a 31 a 32 a 33que é o <strong>de</strong>terminante <strong>de</strong> seus vetores-coluna, na or<strong>de</strong>m em que se apresentam. Temos, pelalinearida<strong>de</strong> (proprieda<strong>de</strong> 3),<strong>de</strong>tA = <strong>de</strong>t((a 11 , a 21 , a 31 ), (a 12 , a 22 , a 32 ), (a 13 , a 23 , a 33 ))= <strong>de</strong>t(a 11 e 1 + a 21 e 2 + a 31 e 3 , a 12 e 1 + a 22 e 2 + a 32 e 3 , a 13 e 1 + a 23 e 2 + a 33 e 3 )= a 11 a 12 a 13 <strong>de</strong>t(e 1 , e 1 , e 1 ) + . . . + a 31 a 32 a 33 <strong>de</strong>t(e 3 , e 3 , e 3 ) .Dos 27 termos são não nulos apenas os <strong>de</strong>terminantes <strong>de</strong>t(e i , e j , e k ) tais que i, j, k são todosdistintos. Logo<strong>de</strong>tA = a 11 a 22 a 33 <strong>de</strong>t(e 1 , e 2 , e 3 ) + a 11 a 32 a 23 <strong>de</strong>t(e 1 , e 3 , e 2 )+a 21 a 12 a 33 <strong>de</strong>t(e 2 , e 1 , e 3 ) + a 21 a 32 a 13 <strong>de</strong>t(e 2 , e 3 , e 1 )+a 31 a 12 a 23 <strong>de</strong>t(e 3 , e 1 , e 2 ) + a 31 a 22 a 13 <strong>de</strong>t e 3 , e 2 , e 1 .Todos os <strong>de</strong>terminantes restantes são iguais a +1 ou −1. Já sabemos que <strong>de</strong>t(e 1 , e 2 , e 3 ) = +1,logo <strong>de</strong>t(e 1 , e 3 , e 2 ) = −1. Isso implica <strong>de</strong>t(e 3 , e 1 , e 2 ) = +1 e <strong>de</strong>t(e 3 , e 2 , e 1 ) = −1. Que porsua vez implica <strong>de</strong>t(e 2 , e 3 , e 1 ) = +1 e <strong>de</strong>t(e 2 , e 1 , e 3 ) = −1. Então<strong>de</strong>tA = a 11 (a 22 a 33 − a 32 a 23 ) + a 21 (a 32 a 13 − a 12 a 33 ) + a 31 (a 12 a 23 − a 22 a 13 ) .Esse é o conhecido <strong>de</strong>terminante <strong>de</strong> uma matriz 3 × 3!!


218APÊNDICE A. ENTENDENDO OS SISTEMAS LINEARESA.8.3Dimensão nEm dimensão n existe o conceito <strong>de</strong> volume - comumente conhecido como hipervolume. Noentanto, vimos que as proprieda<strong>de</strong>s <strong>de</strong> normalização, alternância e linearida<strong>de</strong> bastam para<strong>de</strong>finir inequivocamente o valor do <strong>de</strong>terminante <strong>de</strong> uma n-upla <strong>de</strong> vetores. Assim, <strong>de</strong>finimos<strong>de</strong>t(u 1 , . . .,u n ) através <strong>de</strong> suas proprieda<strong>de</strong>s:1. Normalização: <strong>de</strong>t(e 1 , . . . , e n ) = 1;2. Alternância: para todo par i, j entre 1 e n, vale<strong>de</strong>t(u 1 , . . .,u i , . . .,u j , . . .,u n ) = − <strong>de</strong>t(u 1 , . . .,u j , . . .,u i , . . . , u n )3. Multi-linearida<strong>de</strong>: <strong>de</strong>t(αu+βv, u 2 , . . . , u n ) = α <strong>de</strong>t(u, u 2 , . . . , u n )+β <strong>de</strong>t(v, u 2 , . . .,u n ).Decorre <strong>de</strong>ssas regras que o <strong>de</strong>terminante <strong>de</strong> uma matriz A = {a ij } n×n é<strong>de</strong>tA =∑a i11a i22 . . . a inn <strong>de</strong>t(e i1 , e i2 , . . .,e in ) .(i 1,...,i n)Já <strong>de</strong>t(e i1 , e i2 , . . . , e in ) é: nulo, se ocorre algum número repetido na lista (i 1 , . . .,i n ); +1, se(i 1 , . . .,i n ) po<strong>de</strong> ser levado em (1, 2, . . .,n) por um número par <strong>de</strong> trocas <strong>de</strong> posições; e −1se ((i 1 , . . . , i n ) po<strong>de</strong> ser levado em (1, 2, . . .,n) por um número ímpar <strong>de</strong> trocas <strong>de</strong> posições(é necessário observar que se (i 1 , . . .,i n ) po<strong>de</strong> ser levado em (1, . . .,n) por um número par <strong>de</strong>trocas <strong>de</strong> posições então não há como fazer o mesmo com um número ímpar, e vice-versa).Sem falarmos em hipervolume, verificamos também das três proprieda<strong>de</strong>s que se um dosvetores for combinação linear dos <strong>de</strong>mais então o <strong>de</strong>terminante é nulo. Isso porque<strong>de</strong>t(α 2 u 2 + . . . + α n u n , u 2 , . . . , u n ) == α 2 <strong>de</strong>t(u 2 , u 2 , . . .,u n ) + . . . + α n <strong>de</strong>t(u n , u 2 , . . . , u n ) = 0 ,pois vetores repetidos levam a <strong>de</strong>terminante nulo, por causa da regra <strong>de</strong> alternância.A implicação contrária não é tão óbvia, a partir das três proprieda<strong>de</strong>s: mostrar que se o<strong>de</strong>terminante é nulo então um dos vetores é combinação linear dos outros.Provaremos a afirmação equivalente: “se os vetores u 1 , . . . , u n formam uma base então<strong>de</strong>t(u 1 , . . .,u n ) é não-nulo”.Primeiro relacionamos <strong>de</strong>t(u 1 , . . .,u n ) com o <strong>de</strong>terminante <strong>de</strong> uma matriz: <strong>de</strong>finimos Acomo sendo a matriz tal que Ae 1 = u 1 , . . .,Ae n = u n , isto é, tal que suas colunas sejam osvetores u 1 , . . . , u n . Então <strong>de</strong>t A = <strong>de</strong>t(u 1 , . . .,u n ). O que queremos mostrar é que <strong>de</strong>tA ≠ 0e a hipótese que temos é que os vetores Ae 1 , . . .,Ae n formam uma base.Primeiro observamos que A tem uma inversa. Para enten<strong>de</strong>r por que, basta ver que paratodo b ∈ R n é possível encontrar u ∈ R n tal que Au = b (já vimos que para aplicações linearesa sobrejetivida<strong>de</strong> implica automaticamente na bijetivida<strong>de</strong>). Ora, como {Ae 1 , . . .,Ae n } ébase então existem números x 1 , . . . , x n tais queb = x 1 Ae 1 + . . . + x n Ae n .Logob = A(x 1 e 1 + . . . + x n e n ) ,


A.9. QUADRO COMPARATIVO 219e encontramos u = (x 1 , . . . , x n ).A inversa <strong>de</strong> A é <strong>de</strong>notada por A −1 , portanto u = A −1 b.Na Seção 2.3 vamos mostrar que se A tem inversa então <strong>de</strong>tA ≠ 0, o que completa a<strong>de</strong>monstração. Para isso, usaremos o próprio método <strong>de</strong> resolução dos sistemas lineares, oMétodo <strong>de</strong> Escalonamento, do qual iremos falar no próximo Capítulo.No entanto, po<strong>de</strong>mos seguir outro argumento, baseado na seguinte fórmula: se A e B sãomatrizes quadradas <strong>de</strong> tamanho n então<strong>de</strong>t(AB) = <strong>de</strong>tA · <strong>de</strong>t B .Esta fórmula po<strong>de</strong> ser <strong>de</strong>duzida das proprieda<strong>de</strong>s do <strong>de</strong>terminante, mas não o faremos aqui.Ao invés disso, daremos uma intuição geométrica <strong>de</strong> sua veracida<strong>de</strong>, logo abaixo.A aplicação da fórmula se faz assim: como A tem inversa A −1 , escrevemos AA −1 = Id.Isto porque se aplicarmos A −1 a um vetor e <strong>de</strong>pois aplicarmos A voltaremos ao vetor original.Ou seja, AA −1 u = u para qualquer u e AA −1 só po<strong>de</strong> ser a i<strong>de</strong>ntida<strong>de</strong>. Pela fórmula do<strong>de</strong>terminante, temos<strong>de</strong>t(AA −1 ) = <strong>de</strong>tA · <strong>de</strong>tA −1 = <strong>de</strong>tId = 1 ,portanto <strong>de</strong>tA não po<strong>de</strong> ser nulo.Já para enten<strong>de</strong>r a intuição geométrica da fórmula <strong>de</strong>t(AB) = <strong>de</strong>t(A)<strong>de</strong>t(B), <strong>de</strong> formanão rigorosa, lembremos que <strong>de</strong>tA representa o volume com sinal <strong>de</strong> P(Ae 1 , . . . , Ae n ) (oleitor po<strong>de</strong> pensar em dimensão 3). O paralelepípedo P(Ae 1 , . . . , Ae n ) é a imagem pelatransformação A do paralelepípedo P(e 1 , . . . , e n ), <strong>de</strong> volume unitário. Da linearida<strong>de</strong> <strong>de</strong>correque todo paralelepípedo formado por múltiplos dos vetores canônicos, quando transformadopor A, tem seu volume multiplicado por <strong>de</strong>tA. Daí <strong>de</strong>corre (intuitivamente, mas não tãofacilmente do ponto <strong>de</strong> vista matemático) que o volume <strong>de</strong> qualquer conjunto é multiplicadopor <strong>de</strong>tA pela transformação A.A intuição po<strong>de</strong> ser assim expressa: o conjunto é aproximado por pequenos paralelepípedosdisjuntos, cujo volume total está próximo do volume total do conjunto, e quantomenores forem esses paralelepípedos melhor será a aproximação. Ao transformarmos o conjuntopela aplicação A, po<strong>de</strong>mos imaginar também a transformação <strong>de</strong>sses pequenos paralelepípedos,que terá seu volume multiplicado por <strong>de</strong>t A.Portanto, se aplicarmos B e <strong>de</strong>pois A, o volume dos conjuntos será multiplicado por <strong>de</strong>tBe <strong>de</strong>pois por <strong>de</strong>tA. Este é o sentido da fórmula!A.9 Quadro comparativoPara resumir tudo o que dissemos até agora sobre a existência e a unicida<strong>de</strong> <strong>de</strong> soluções <strong>de</strong>um sistema linear, façamos um quadro comparativo que ilustra as únicas duas alternativasque po<strong>de</strong>m ocorrer para a matriz <strong>de</strong> coeficientes A, quando se quer resolver um sistema linearAu = b.Alternativa 1.1. Para qualquer b, sempre existe única solução para Au = b


220APÊNDICE A. ENTENDENDO OS SISTEMAS LINEARES2. A é bijetiva, como transformação linear3. Au = 0 implica u = 04. As colunas <strong>de</strong> A são linearmente in<strong>de</strong>pen<strong>de</strong>ntes5. As linhas <strong>de</strong> A são linearmente in<strong>de</strong>pen<strong>de</strong>ntes6. <strong>de</strong>tA ≠ 0Alternativa 2.1. Ou b é tal que Au = b não tem solução ou b é tal que Au = b tem infinitas soluções, esempre existem exemplos dos dois casos2. A não é nem injetiva nem sobrejetiva3. Existe u ≠ 0 tal que Au = 04. As colunas <strong>de</strong> A são linearmente <strong>de</strong>pen<strong>de</strong>ntes5. As linhas <strong>de</strong> A são linearmente <strong>de</strong>pen<strong>de</strong>ntes6. <strong>de</strong>tA = 0


Apêndice BRevisão <strong>de</strong> CálculoEste Apêndice é uma revisão breve e informal dos principais conceitos <strong>de</strong> Cálculo <strong>de</strong> umavariável.B.1 DerivadasConsi<strong>de</strong>re uma função real f(x). A inclinaçãodo gráfico <strong>de</strong> f no ponto (x, f(x)) é dada pelolimite do quocientef(x+h)f(x + h) − f(x)hquando h ten<strong>de</strong> a zero (pela direita ou pelaesquerda).f(x)xhx+hf(x+h)−f(x)Esse limite é <strong>de</strong>notado porf ′ (x) ,e a função f ′ (x), que dá a inclinação do gráfico para cada x, é chamada <strong>de</strong>rivada da funçãof.Por exemplo, se f(x) = x 2 , o gráfico <strong>de</strong> f é uma parábola, e a <strong>de</strong>rivada, para cada x, é olimite <strong>de</strong>f(x + h) − f(x)= (x + h)2 − x 2= 2x + h .hhEvi<strong>de</strong>ntemente, quando h ten<strong>de</strong> a zero, o limite é igual a 2x, e portanto f ′ (x) = 2x sef(x) = x 2 .Algumas <strong>de</strong>rivadas usuais. A função constante f(x) = c tem <strong>de</strong>rivada nula em todoponto: f ′ (x) = 0 (pu<strong>de</strong>ra, o gráfico <strong>de</strong> uma função constante é uma reta horizontal). A<strong>de</strong>rivada <strong>de</strong> uma função afim f(x) = ax + b é uma função constante: f ′ (x) = a, pois ainclinação do gráfico (que é uma reta) é sempre dada pelo coeficiente a. Po<strong>de</strong>-se mostrar221


222APÊNDICE B. REVISÃO DE CÁLCULOtambém que se f(x) = x n , com n inteiro (negativo ou positivo) porém diferente <strong>de</strong> zero, entãof ′ (x) = nx n−1 . Por exemplo, se f(x) = x, então f ′ (x) = 1 · x 0 = 1, ou se f(x) = x −1 = 1 xentão f ′ (x) = −x −2 = − 1x. 2Temos também as <strong>de</strong>rivadas <strong>de</strong> funções trigonométricas. Se f(x) = sin x então f ′ (x) =cosx, e se f(x) = cosx então f ′ (x) = − sinx. Para obter essas <strong>de</strong>rivadas é preciso mostrarantes quesin xlimx→0 x = 1 ,resultado que po<strong>de</strong> ser obtido <strong>de</strong> forma geométrica.Po<strong>de</strong>ríamos discorrer um pouco mais sobre <strong>de</strong>rivadas, falando <strong>de</strong> outras funções e <strong>de</strong>regras <strong>de</strong> <strong>de</strong>rivação <strong>de</strong> funções mais complicadas. Deixaremos porém essa discussão paralogo adiante. Só faremos antes uma observação que certamente já nos ampliará bastanteo leque <strong>de</strong> funções que sabemos <strong>de</strong>rivar. Digamos que uma função h(x) se escreva comocombinação linear <strong>de</strong> duas outras funções f(x) e g(x), isto é,h(x) = af(x) + bg(x) .Então a <strong>de</strong>rivada <strong>de</strong> h é a combinação linear das <strong>de</strong>rivadas:h ′ (x) = af ′ (x) + bg ′ (x) .Em particular, a <strong>de</strong>rivada dafunção f(x) + C é igual à <strong>de</strong>rivadada função f(x), pois a<strong>de</strong>rivada da função constante ézero (veja na figura ao lado duasfunções que diferem apenas pelaadição <strong>de</strong> uma constante).Cf(x)+Cf(x)CCxB.2 PrimitivasPo<strong>de</strong>mos agora colocar o seguinte problema: “dada uma função g(x), achar uma função f(x)cuja <strong>de</strong>rivada f ′ (x) seja igual a g(x)”. É um problema “inverso” ao <strong>de</strong> achar a <strong>de</strong>rivada.Qualquer função f(x) cuja <strong>de</strong>rivada seja igual a g(x) será chamada <strong>de</strong> uma primitiva <strong>de</strong> g(x).Por exemplo, queremos achar uma primitiva <strong>de</strong> g(x) = x 2 . Ora, sabemos que a <strong>de</strong>rivada<strong>de</strong> x 3 é 3x 2 (pela Seção anterior), portanto f(x) = 1 3 x3 é uma primitiva <strong>de</strong> g(x) = x 2 (o fator<strong>de</strong> 1 3 é necessário para se cancelar o expoente que “cai” ao se <strong>de</strong>rivar).Esse problema levanta duas questões: primeiro, será que sempre existe uma primitivapara a função g? E se existe, será que é única?Vejamos primeiro que não há chance <strong>de</strong> só haver uma primitiva para cada função. Porexemplo, suponha que encontramos uma primitiva f(x) para g(x), isto é, f ′ (x) = g(x). Agora


B.3. INTEGRAL 223consi<strong>de</strong>ramos uma outra função F(x) = f(x) + C. Pelo que vimos na Seção anterior,F ′ (x) = f ′ (x) = g(x) .Em outras palavras, se encontrarmos uma primitiva f(x) então todas as funções do tipof(x) + C serão também primitivas, para qualquer valor <strong>de</strong> C.A pergunta natural que viria em seguida seria: e além <strong>de</strong>ssas, será que há outras primitivas?A resposta é não. Suponha que f 1 (x) e f 2 (x) sejam duas primitivas da mesma funçãog(x), isto é,f ′ 1 (x) = g(x) = f ′ 2 (x) .Agora consi<strong>de</strong>re a função F(x) = f 1 (x) −f 2 (x) que para cada valor <strong>de</strong> x dá a diferença entreos valores das duas funções. EntãoF ′ (x) = f 1 ′ (x) − f 2 ′ (x) = g(x) − g(x) = 0 ,para qualquer x. Então a função diferença tem inclinação zero, ou seja, é uma funçãoconstante (se o domínio tiver só um pedaço):F(x) = C .De on<strong>de</strong> concluímos que f 1 (x) = f 2 (x) + C!!Colocando em palavras, acabamos <strong>de</strong> <strong>de</strong>monstrar que se duas funções são primitivas damesma função então elas necessariamente diferem por uma constante. Isso tem conseqüênciaspráticas importantes: se encontrarmos uma primitiva então automaticamente conheceremostodas as outras!Voltaremos ao assunto após a Seção seguinte.B.3 IntegralConsi<strong>de</strong>re uma função f(x) <strong>de</strong>finida no intervalo[a, b], não-negativa, como mostra a figuraao lado. A área da região acima da abscissa eabaixo do gráfico da função é chamada <strong>de</strong> integral<strong>de</strong> f no intervalo [a, b], e recebe a notaçãof∫ baf(x)dx .ab


224APÊNDICE B. REVISÃO DE CÁLCULOaf A 1A 2A 3bA integral também po<strong>de</strong> ser <strong>de</strong>finida parafunções que assumem valores negativos. Nessecaso, não po<strong>de</strong>mos interpretar a integral comoárea, a não ser que usemos a idéia <strong>de</strong> “áreacom sinal”, isto é, a área é contada positivamentequando a função é positiva e negativamentequando a função é negativa. Assim, nafigura ao lado temos∫ baf(x)dx = A 1 − A 2 + A 3 ,on<strong>de</strong> A 1 , A 2 e A 3 são as áreas das regiões sombreadas.Também <strong>de</strong>vemos convencionar o significado do símbolo acima da integral quando a nãoé menor ou igual a b. A convenção é a seguinte: se a > b então∫ bf(x)dx ≡ −∫ aabf(x)dx .Em palavras, fazer a integração do extremo direito para o esquerdo resulta no mesmo quefazer da esquerda para a direita, só que com o sinal oposto.Com essa regra, obtemos a seguinte proprieda<strong>de</strong>, para qualquer trinca <strong>de</strong> números a, b, c,não importando sua or<strong>de</strong>m:∫ bf(x)dx +∫ cf(x)dx =∫ cabaf(x)dx .Isso parece óbvio no caso em que a < b < c, mas confira a valida<strong>de</strong> da fórmula em outroscasos!B.4 A integral in<strong>de</strong>finidaNa Seção anterior, falamos da integral <strong>de</strong> uma função entre dois extremos fixos. Se resolvermosmudar um dos extremos, obteremos um resultado diferente para a integral, mesmo quea função não se altere. Isso sugere que um dos extremos do intervalo <strong>de</strong> integração possa serconsi<strong>de</strong>rado uma variável, do qual <strong>de</strong>pen<strong>de</strong> o valor da integral da função.


B.4. A INTEGRAL INDEFINIDA 225Por exemplo, consi<strong>de</strong>re a função linear g(x) =x, e fixe 0 como um dos extremos <strong>de</strong> integração.Quanto valewg(x)=x∫ w0g(x)dx ?Ora, se w ≥ 0, a integral é a área do triânguloretânguloesboçado na figura ao lado: w22 . 00wxSe w < 0, a integral é também, em valor absoluto, igual a w22, mas qual seria o sinal?Primeiro vemos que a área <strong>de</strong>ve ser contada negativamente, pois à esquerda do zero g(x) énegativa. Por outro lado, se w < 0 então a integral está sendo percorrida da direita para aesquerda, o que acarreta uma segunda mudança <strong>de</strong> sinal. Isso implica que também no casow < 0 a integral vale w22. Concluímos que∫ w0xdx = w22 ,para qualquer w.Agora po<strong>de</strong>mos criar uma função que a cada w associe a integral <strong>de</strong> g <strong>de</strong> 0 a w, echamaremos <strong>de</strong> f essa função:No exemplo, g(x) = x, e portantof(w) ≡f(w) =∫ w0∫ w0g(x)dx .xdx = w22 .Essa função f é chamada <strong>de</strong> uma integral in<strong>de</strong>finida <strong>de</strong> g. Ela é apenas uma e não a integralin<strong>de</strong>finida porque o extremo fixo <strong>de</strong> integração foi escolhido arbitrariamente.wg(x)=xPor exemplo, consi<strong>de</strong>re outra integral in<strong>de</strong>finida˜f, on<strong>de</strong> o extremo fixo <strong>de</strong> integração seja1 e não 0:f(w)˜f(w) ≡∫ w1xdx .001wxQuanto vale ˜f(w)?


226APÊNDICE B. REVISÃO DE CÁLCULOObserve que, pela regra <strong>de</strong> integração das triplas a, b, c, po<strong>de</strong>mos escrever∫ 10xdx +∫ w1xdx =∫ w0xdx .O primeiro termo do lado esquerdo vale 1 2. Além disso, o segundo termo do lado esquerdoda equação é a função ˜f(w), e o lado direito da equação é f(w). Entãof(w) = ˜f(w) + 1 2 ,e as duas funções diferem por uma constante. Aliás esse fato é bastante geral, e suas razõessaltam à vista imediatamente <strong>de</strong>sse exemplo: as integrais in<strong>de</strong>finidas <strong>de</strong> uma função, assimcomo suas primitivas, diferem umas das outras por uma constante.E será que há alguma relação entre as primitivas e as integrais in<strong>de</strong>finidas? Respon<strong>de</strong>remosa essa pergunta na próxima Seção.Antes <strong>de</strong> prosseguir, façamos uma observação a respeito da notação. Sempre falamos <strong>de</strong>funções <strong>de</strong>pen<strong>de</strong>ntes da variável x, mas agora apareceram funções que <strong>de</strong>pen<strong>de</strong>m da variávelw! Ora, esses nomes, x e w, são apenas nomes, que à função não interessam. Assim, sef(w) = w22e queremos avaliar f(x) então teremos f(x) = x22. O que interessa é que essafunção em particular toma um número qualquer em seu domínio, eleva-o ao quadrado e divi<strong>de</strong>o resultado por dois. Tanto faz se indicamos esse processo por f(w) = w2x22ou por f(x) =2 !Entendido isso, po<strong>de</strong>-se perguntar então porque não <strong>de</strong>finimos <strong>de</strong> uma vezf(x) =∫ x0xdx ?Por que não usar <strong>de</strong> uma vez a variável x como extremo <strong>de</strong> integração? Trata-se aí <strong>de</strong> umcuidado que tomamos para não misturar as coisas. A variável indicada <strong>de</strong>ntro da integraçãomuda enquanto os extremos estão fixos. Para cada x, temos que percorrer o intervalo [0, x]para calcular a integral. É mais justo, portanto, usar um outro nome para indicar esseprocesso, evitando assim confusões. Seria preferível então escreverouf(x) =f(x) =∫ x0∫ x0tdt ,udu ,usando, enfim, qualquer letra que não seja aquela utilizada nos extremos da integração.B.5 O Teorema Fundamental do CálculoNas seções anteriores vimos o que são primitivas e integrais in<strong>de</strong>finidas <strong>de</strong> uma função g.Uma primitiva <strong>de</strong> g é qualquer função f cuja <strong>de</strong>rivada é igual a g, e uma integral in<strong>de</strong>finidaé qualquer função da formaf(x) =∫ xag(t)dt .


B.5. O TEOREMA FUNDAMENTAL DO CÁLCULO 227O Teorema Fundamental do Cálculo diz exatamente que as integrais in<strong>de</strong>finidas <strong>de</strong> g sãotambém primitivas <strong>de</strong> g.Argumentaremos em favor do Teorema, sem excesso <strong>de</strong> tecnicalida<strong>de</strong>s. O importante éenten<strong>de</strong>r por que ele é verda<strong>de</strong>iro.Consi<strong>de</strong>re a integral in<strong>de</strong>finida <strong>de</strong> g, dada porf(x) =∫ xag(t)dt .Para mostrarmos que essa função é uma primitiva <strong>de</strong> g basta mostrar que f ′ (x) = g(x).Lembramos então <strong>de</strong> como <strong>de</strong>finimos a <strong>de</strong>rivada f ′ (x): é o limite da expressãof(x + h) − f(x)hquando h ten<strong>de</strong> a zero. Ou seja, é o limite <strong>de</strong>( ∫1 x+hg(t)dt −ha∫ xag(t)dt).Lembrando que∫ x+hag(t)dt =∫ xag(t)dt +∫ x+hxg(t)dt ,o limite que preten<strong>de</strong>mos examinar se torna1h∫ x+hxg(t)dt .agxx+hg(t)dtx x+hAgora olhemos bem para essa expressão, e observemos a figura. A integral é feita nointervalo [x, x + h] (<strong>de</strong> largura h, evi<strong>de</strong>ntemente), e a função ali tem altura <strong>de</strong> aproximadamenteg(x), se h for bastante pequeno. Portanto a integral está próxima do valor h · g(x).Lembrando que ainda temos que dividir por h, então toda a expressão fica quase igual a g(x),e levando ao limite será exatamente igual a g(x).Interpretando geometricamente, significa que a inclinação <strong>de</strong> f em x será tanto maiorquanto maior for o valor g(x). Pois f(x + h) será f(x) mais a integral <strong>de</strong> g entre x e x + h,que vale aproximadamente h · g(x), ou sejaDon<strong>de</strong>f(x + h) ≈ f(x) + h · g(x) .f(x + h) − f(x)h≈ g(x) .No exemplo da Seção anterior, vimos que f(x) = x22 é uma integral in<strong>de</strong>finida <strong>de</strong> g(x) = x.Pelo Teorema Fundamental do Cálculo, f(x) <strong>de</strong>ve ser também uma primitiva. De fato,f ′ (x) = 1 2 · 2x = x.


228APÊNDICE B. REVISÃO DE CÁLCULOB.6 A praticida<strong>de</strong> do Teorema Fundamental do CálculoVeremos agora que o Teorema Fundamental do Cálculo opera um verda<strong>de</strong>iro milagre. Eletorna o cálculo <strong>de</strong> áreas e integrais uma tarefa muito mais fácil do que po<strong>de</strong>ríamos imaginar!Suponha que queiramos calcular a integral <strong>de</strong> uma função g no intervalo [a, b]:∫ bag(t)dt .Po<strong>de</strong>ríamos olhar essa integral da seguinte forma. Chamamos <strong>de</strong> F a integral in<strong>de</strong>finida <strong>de</strong>g com extremo fixo <strong>de</strong> integração igual a a:F(x) =∫ xag(t)dt .Isso faz com que a integral que queremos calcular seja o valor <strong>de</strong> F em b, isto é, F(b). Observetambém que F(a) = 0.Por outro lado, F é uma primitiva <strong>de</strong> g, <strong>de</strong> acordo com o Teorema Fundamental doCálculo. Suponha que por alguma razão já conheçamos alguma primitiva f(x) <strong>de</strong> g(x).Isso po<strong>de</strong> parecer estranho, mas é algo muito comum quando sabemos <strong>de</strong>rivar uma gran<strong>de</strong>quantida<strong>de</strong> <strong>de</strong> funções. Por exemplo, se g(x) = x 3 , sabemos que f(x) = x44 é uma primitiva<strong>de</strong> g, porque sabemos a regra <strong>de</strong> <strong>de</strong>rivação das potências.Como F(x) e f(x) são ambas primitivas <strong>de</strong> g, então elas diferem por uma constante,digamos C:f(x) − F(x) = C ,para todo x no intervalo [a, b]. Se escolhermos x = a ou x = b a equação continua válida:<strong>de</strong> on<strong>de</strong> tiramos quef(a) − F(a) = C = f(b) − F(b) ,F(b) − F(a) = f(b) − f(a) .Mas F(b) = F(b) − F(a) era exatamente a integral que queríamos calcular!Resumindo: para qualquer f(x) primitiva <strong>de</strong> g(x) temos∫ bag(t)dt = f(b) − f(a) .O cálculo da integral torna-se uma simples tarefa <strong>de</strong> subtração, <strong>de</strong>s<strong>de</strong> que já conheçamosuma primitiva da função!!Por exemplo, qual é a área sob o gráfico da função g(x) = x 3 para x variando no intervalo[1, 2]? Ora, como f(x) = x44 é uma primitiva <strong>de</strong> g(x), entãoFácil, não?!∫ 21t 3 dt = f(2) − f(1) = 244 − 144 = 154 .


B.7. O LOGARITMO 229Existe uma notação que facilita a vida quando calculamos integrais na prática. EscrevemosAssim, com essa notação,f(t)| b a= f(b) − f(a) .∫ 21t 3 dt = t4 4 ∣Outra notação bastante utilizada se aproveita do fato <strong>de</strong> que primitivas e integrais in<strong>de</strong>finidassão a mesma coisa. Então, quando queremos dizer que f(x) é primitiva <strong>de</strong> g(x)escrevemos∫g(x)dx = f(x) + C ,sem indicar extremos <strong>de</strong> integração. A constante somada é simbólica e apenas indica quea expressão dada em f(x) não é a única primitiva <strong>de</strong> g, e as <strong>de</strong>mais po<strong>de</strong>m ser obtidassomando-se uma constante a ela. Essa notação é conhecida como notação <strong>de</strong> Leibniz. Porexemplo,∫sinx = − cosx + C .21.B.7 O logaritmoUma das funções mais importantes <strong>de</strong>finidas a partir <strong>de</strong> uma integral in<strong>de</strong>finida é o logaritmonatural. A abordagem que seguiremos aqui para falar <strong>de</strong> logaritmos, exponenciais, etc, nãoé das mais usuais, porém talvez seja mais fácil até do que aquela que estamos acostumadosa ver <strong>de</strong>s<strong>de</strong> os tempos do colégio. Ao final nada do que já sabíamos anteriormente será<strong>de</strong>rrubado. Pelo contrário, iremos chegar a nossas certezas através <strong>de</strong> uma argumentaçãológica.Consi<strong>de</strong>re a função g(x) = 1 x, cujo gráficoestá <strong>de</strong>senhado ao lado. Essa função divergeem x = 0 e não está <strong>de</strong>finida nesse ponto.Restringiremo-nos <strong>de</strong> início à parte positivado domínio e <strong>de</strong>finiremos, para x > 0, o logaritmonatural <strong>de</strong> x como sendo a integral <strong>de</strong> g<strong>de</strong> 1 até x:lnx ≡∫ x11t dt .1g(x)= 1 x1 xln xObserve no <strong>de</strong>senho que, para x > 1 essa função é positiva e representa a área sob ográfico <strong>de</strong> g no intervalo [1, x]. Para x < 1, no entanto, a integral corre em sentido contrário,logo vale o negativo da área sob o gráfico. Além disso, evi<strong>de</strong>ntemente, ln 1 = 0.


230APÊNDICE B. REVISÃO DE CÁLCULOln xLembremos sempre que essa função, por ser uma primitiva<strong>de</strong> 1 x tem <strong>de</strong>rivada exatamente igual a 1 x :1x(lnx) ′ = 1 x .O gráfico <strong>de</strong> lnx está esboçado ao lado. Quando x ten<strong>de</strong>a zero a função ten<strong>de</strong> a −∞ e quando x ten<strong>de</strong> a infinitoa função também ten<strong>de</strong> a infinito. Esses fatos po<strong>de</strong>mser <strong>de</strong>monstrados levando-se em conta os comentáriosabaixo.A proprieda<strong>de</strong> mais marcante que conhecemos é que “o logaritmo do produto é a somados logaritmos”, isto é,lnxy = lnx + lny .Essa proprieda<strong>de</strong> po<strong>de</strong> ser <strong>de</strong>duzida da <strong>de</strong>finição que <strong>de</strong>mos. Pois isso é o mesmo que provarque∫ xy ∫1 x ∫t dt = 1 yt dt + 1t dt .1Para tanto, separamos a integral do lado esquerdo em dois pedaços:Só falta verificar que ∫ xyx∫ xy11∫1 xt dt =1t dt é igual a ∫ y 11 t dt.11∫1 xyt dt +x1t dt .11/yA1 yA integral ∫ y1dada por1tdt é a área da região A na figura ao lado,A = {(t, s) ; 1 ≤ t ≤ y , 0 ≤ s ≤ 1/t} ,e a outra integral, ∫ xyxpor1tdt é a área da região B, dadaB = {(t, s) ; x ≤ t ≤ xy , 0 ≤ s ≤ 1/t} .1/x1/xyxBxyMostremos a seguinte afirmação: “(t, s) é um ponto <strong>de</strong> Ase e somente se (xt, 1 xs) é um ponto <strong>de</strong> B”. Assim, B éobtido <strong>de</strong> A pela multiplicação por x na horizontal e por1xna vertical. Em termos <strong>de</strong> área, as duas multiplicaçõesse cancelam, e a área <strong>de</strong> B tem que ser igual à área <strong>de</strong>A.


B.7. O LOGARITMO 231Já a afirmação é mostrada assim: (t, s) ∈ A se e somente se 1 ≤ t ≤ y e 0 ≤ s ≤ 1 t , queocorre se e somente se x ≤ xt ≤ xy e 0 ≤ 1 x s ≤ 1 xt , ou seja, (xt, 1 xs) ∈ B.Da fórmula ln xy = lnx+lny <strong>de</strong>corre, por exemplo, que lnx n = n lnx, se n ≥ 0 é inteiro.Para ver isso, primeiro verificamos que se n = 0 então x n = x 0 = 1 e ln x 0 = ln 1 = 0 = 0·lnx.Se n = 1 a fórmula também está trivialmente correta. Se n ≥ 2 basta fazer a recursãolnx n = lnx · x n−1= lnx + lnx n−1 = lnx + lnx · x n−2= 2 lnx + lnx n−2 = . . .= . . .= n lnx .Além disso, como ln 1 = ln x · 1x = lnx + ln 1 x entãoln 1 x = − lnx .Assim po<strong>de</strong>mos dizer que ln x −n = −n lnx, e que a fórmula também vale para os inteirosnegativos.Tendo então a <strong>de</strong>finição do logaritmo natural, po<strong>de</strong>mos <strong>de</strong>finir outros logaritmos. Se b épositivo e b ≠ 1, chamaremos <strong>de</strong> logaritmo <strong>de</strong> x na base b ao númerolog b x ≡ lnxlnb .Essa <strong>de</strong>finição po<strong>de</strong> parecer estranha. Afinal, a <strong>de</strong>finição a que estamos acostumados dizassim: o número r = log b x é aquele tal queb r = x .Mas essa proprieda<strong>de</strong> po<strong>de</strong> ser <strong>de</strong>monstrada (em vez <strong>de</strong> <strong>de</strong>finida). Pois se n é um númerointeiro e b n = x entãolog b x = lnxlnb = lnbnlnb = n lnblnb = n .E quanto a potências com números não inteiros? A princípio não sabemos o que issosignifica, mas po<strong>de</strong>mos adiante <strong>de</strong>fini-las inspirados no que vimos acima.Antes, porém, observemos que o logaritmo natural é umlogaritmo em alguma base. Suponha que achemos umnúmero e tal que lne = 1. Entãoln xlnx = lnx1 = lnxlne = log e x .Esse número e existe e é chamado <strong>de</strong> número <strong>de</strong> Euler.Ele vale, até a nona casa <strong>de</strong>cimal <strong>de</strong>pois da vírgula,11ex2.718281828 . . .


232APÊNDICE B. REVISÃO DE CÁLCULOOutra <strong>de</strong>finição que provém do logaritmo natural é a da função exponencial. A função exponencialé a inversa da função logaritmo natural e é <strong>de</strong>notada por exp(x). Geometricamente,se quisermos achar exp(x), temos que• <strong>de</strong>senhar o gráfico do logaritmo natural• localizar x na or<strong>de</strong>nada (e não na abscissa!)• procurar exp(x) como o único ponto da abscissa tal que (exp(x), x) esteja sobre o gráfico(ver figura abaixo, à esquerda).ln xxexp(x)1x1exp(x)Então o gráfico da exponencial assume o aspecto da figura acima, à direita. Enquanto odomínio do logaritmo natural é o conjunto dos números positivos e sua imagem o conjunto<strong>de</strong> todos os números reais, com a exponencial ocorre o inverso: ela está <strong>de</strong>finida para todosos números reais, mas só assume valores positivos.Lembremos também que a <strong>de</strong>finição geométrica dada acima significa que exp(lnx) = x,para todo x > 0, e que ln(exp(x)) = x, para todo x.A exponencial tem a seguinte proprieda<strong>de</strong>: “a exponencial da soma é o produto dasexponenciais”. Matematicamente,Isso ocorre pois, por um ladoe por outroexp(x + y) = exp(x) · exp(y) .x + y = ln exp(x + y) ,x + y = ln exp(x) + ln exp(y) = ln(exp(x) · exp(y)) ,<strong>de</strong> on<strong>de</strong> segue a igualda<strong>de</strong>.Agora, inspirados no fato <strong>de</strong> que para números inteiros n e b > 0 valeb n = exp(ln b n ) = exp(n lnb) ,


B.8. O TEOREMA DO VALOR MÉDIO 233<strong>de</strong>finiremos a operação <strong>de</strong> potenciação b r , com b > 0 e r qualquer:b r ≡ exp(r lnb) .É fácil ver que b r b s = b r+s , que <strong>de</strong>corre da proprieda<strong>de</strong> da exponencial que acabamos <strong>de</strong><strong>de</strong>monstrar. Daí temos que, por exemplo,ou seja,b 1 2 · b12 = b12 + 1 2 = b 1 = b .b 1 2 =√b .Isso explica por que <strong>de</strong>notamos b 1 n ≡ n√ b.Finalmente, é interessante notar que, com essa <strong>de</strong>finição,e x = exp(xlne) = exp(x) ,isto é, a exponencial é a potenciação do número <strong>de</strong> Euler e!B.8 O Teorema do Valor MédioCientes do fato <strong>de</strong> que o cálculo <strong>de</strong> integrais <strong>de</strong>pen<strong>de</strong> <strong>de</strong> nossa capacida<strong>de</strong> <strong>de</strong> achar primitivas,o que por sua vez <strong>de</strong>pen<strong>de</strong> <strong>de</strong> nossos conhecimentos sobre <strong>de</strong>rivação <strong>de</strong> funções, voltemos aoestudo das <strong>de</strong>rivadas! Nesta curta Seção, enunciaremos o Teorema do Valor Médio. Depois,nas <strong>de</strong>mais seções, obteremos regras <strong>de</strong> <strong>de</strong>rivação e <strong>de</strong>las conseguiremos também métodos <strong>de</strong>primitivização.Imagine uma função <strong>de</strong>finida num intervalo [a, b], cujográfico é mostrado na figura ao lado. Agora trace umareta L ligando os pontos (a, f(a)) e (b, f(b)) (indicadana figura por uma linha tracejada). A inclinação <strong>de</strong>ssareta é dada porf(b) − f(a).b − af(a)acbf(b)O Teorema do Valor Médio diz que existe (pelo menos) um ponto c no intervalo [a, b] talque a reta tangente a (c, f(c)) é paralela à reta L. Como a inclinação <strong>de</strong>ssa reta tangente édada por f ′ (c), então o Teorema do Valor Médio diz que existe c ∈ [a, b] tal queou tal quef ′ (c) =f(b) − f(a)b − af ′ (c)(b − a) = f(b) − f(a) .O Teorema do Valor Médio também tem sua versão em termos <strong>de</strong> integrais. Seja g umafunção contínua no intervalo [a, b], e seja f sua primitiva. Então existe c em [a, b] tal que∫ bag(t)dt = f(b) − f(a) = f ′ (c)(b − a) = g(c)(b − a) .Ou seja, a integral po<strong>de</strong> ser trocada pela integral da função constante g(c), que vale g(c)(b−a).,


234APÊNDICE B. REVISÃO DE CÁLCULOB.9 A Regra da Ca<strong>de</strong>iaFreqüentemente nos <strong>de</strong>paramos com funções compostas, e queremos achar suas <strong>de</strong>rivadas.Por exemplo, f(x) = sin(x 2 ) é uma função composta, resultante <strong>de</strong> se aplicar a função senoapós se elevar o número ao quadrado. Usaremos o <strong>de</strong>senho abaixo para representar essacomposição:u(x)=x 2v(x)=sen xxsen(x 2 )De acordo com a figura,x 2f(x)= sen(x 2 )f(x) = v(u(x)) .A Regra da Ca<strong>de</strong>ia nos dá uma forma <strong>de</strong> calcular a <strong>de</strong>rivada <strong>de</strong> f <strong>de</strong>s<strong>de</strong> que saibamos <strong>de</strong>rivaras funções que a compõem. A motivação que daremos <strong>de</strong> sua veracida<strong>de</strong> será baseada nahipótese <strong>de</strong> que as <strong>de</strong>rivadas <strong>de</strong> u e v são funções que variam continuamente.Para calcularmos a <strong>de</strong>rivada <strong>de</strong> f lembremos que <strong>de</strong>vemos examinar o quocientee calcular seu limite quando h ten<strong>de</strong> a zero.c(h)uf(x + h) − f(x)hd(h)vx x+h u(x) u(x+h) f(x) f(x+h)fAgora notemos que f(x) = v(u(x)) e f(x + h) = v(u(x + h)). Pelo Teorema do ValorMédio, existe um ponto d = d(h) (sim, ele <strong>de</strong>pen<strong>de</strong> <strong>de</strong> h, mas às vezes escreveremos apenasd) entre u(x) e u(x + h) (acompanhe na figura) tal quef(x + h) − f(x) = v(u(x + h)) − v(u(x)) = v ′ (d) · (u(x + h) − u(x)) .


B.9. A REGRA DA CADEIA 235Além disso, novamente por causa do Teorema do Valor Médio, existe c = c(h) entre x e x+htal queJuntando as duas equações, obtemosu(x + h) − u(x) = u ′ (c) · (x + h − x) = u ′ (c) · h .f(x + h) − f(x)h= v ′ (d) · u ′ (c) .Acontece que quando h ten<strong>de</strong> a zero o ponto c(h) ten<strong>de</strong> a x (pois está entre x e x + h), e oponto d(h) ten<strong>de</strong> a u(x). Como assumimos que as <strong>de</strong>rivadas são contínuas, então u ′ (c) ten<strong>de</strong>a u ′ (x) e v ′ (d) ten<strong>de</strong> a v ′ (u(x)).Assim temos a Regra da Ca<strong>de</strong>ia: se f(x) = v(u(x)) entãof ′ (x) = v ′ (u(x)) · u ′ (x) .É muito comum a Regra da Ca<strong>de</strong>ia ser aplicada quando a primeira função é linear. Porexemplo, se f(x) = cos(2x) (u(x) = 2x, v(x) = cos(x)), entãof ′ (x) = v ′ (u(x)) · u ′ (x) = − sin(2x) · 2 = −2 sin(2x) .Outra aplicação ocorre com funções inversas. Se u(x) e v(x) são inversas uma da outra,entãou(v(x)) = xpara todo x no domínio <strong>de</strong> v ev(u(x)) = xpara todo x no domínio <strong>de</strong> u. Isso ocorre por exemplo com as funções ln x e e x . Derivandodos dois lados <strong>de</strong> qualquer uma das equações, usando a Regra da Ca<strong>de</strong>ia, temosu ′ (v(x)) · v ′ (x) = 1 , v ′ (u(x)) · u ′ (x) = 1 .Vejamos como isso fica se u(x) = e x e v(x) = lnx. Já sabemos que v ′ (x) = 1 x (pelaprópria <strong>de</strong>finição do logaritmo!). Usaremos a segunda expressão para calcular a <strong>de</strong>rivada <strong>de</strong>u(x) = e x . Temosu ′ 1(x) =v ′ (u(x)) = 1 1= u(x) .u(x)Conclusão: a <strong>de</strong>rivada <strong>de</strong> e x é e x !!Agora também po<strong>de</strong>mos <strong>de</strong>rivar f(x) = b x . Como b x = e x ln b , entãof ′ (x) = (lnb) · e x ln b ,pela Regra da Ca<strong>de</strong>ia, isto é,f ′ (x) = (ln b)b x .


236APÊNDICE B. REVISÃO DE CÁLCULOB.10 Regras do produto e do quocienteQuando f(x) = u(x)v(x), quanto vale f ′ (x)? Precisamos calcular o limite1h {f(x + h) − f(x)} = 1 {u(x + h)v(x + h) − u(x)v(x)} .hDe maneira esperta, subtraímos e somamos u(x + h)v(x), sem alterar o valor da expressão:1{u(x + h)v(x + h) − u(x + h)v(x) + u(x + h)v(x) − u(x)v(x)} ,he <strong>de</strong>pois a arrumamos <strong>de</strong> forma conveniente:v(x + h) − v(x) u(x + h) − u(x)u(x + h) + v(x) .hhQuando h ten<strong>de</strong> a zero, essa expressão ten<strong>de</strong> aConclusão:u(x)v ′ (x) + u ′ (x)v(x) .(u(x)v(x)) ′ = u ′ (x)v(x) + u(x)v ′ (x) ,que é a conhecida Regra do Produto. Por exemplo,(x 2 e 2x ) ′ = 2xe 2x + x 2 · 2e 2x = 2x(1 + x)e 2x .A Regra do Produto também po<strong>de</strong> ser usada para calcular a <strong>de</strong>rivada <strong>de</strong> um quocientef(x) = u(x)v(x) ,<strong>de</strong>s<strong>de</strong> que v(x) ≠ 0. É só pensar que f(x) também é um produto:( ) ′ ( ) ′ ( ) ′ u(x) 11f(x) = = u(x) · = u ′ (x)v(x) + u(x) .v(x) v(x)v(x)1Só que precisamos saber calcular a <strong>de</strong>rivada <strong>de</strong>v(x)! Para isso lançamos mão da Regra da1Ca<strong>de</strong>ia:v(x) é a função 1 x aplicada após a função v(x). Como a <strong>de</strong>rivada <strong>de</strong> 1 x é −1x, então 2Logo( ) ′ 1= v ′ −1(x) ·v(x) v(x) 2 .( ) ′ u(x)= u′ (x)v(x) v(x) + u(x) · −v′ (x)v(x) 2 .Colocando sob o mesmo <strong>de</strong>nominador,( ) ′ u(x)= u′ (x)v(x) − u(x)v ′ (x)v(x) v(x) 2 .


B.11. TRUQUES DE PRIMITIVIZAÇÃO: INTEGRAÇÃO POR PARTES 237Essa expressão também é conhecida como Regra do Quociente.Sugere-se ao leitor testar seus conhecimentos <strong>de</strong> técnicas <strong>de</strong> <strong>de</strong>rivação com as funçõestrigonométricas, já sabendo as <strong>de</strong>rivadas <strong>de</strong> seno e cosseno. Por exemplo, a função tangente,que é seno sobre cosseno, po<strong>de</strong> ser <strong>de</strong>rivada com a Regra do Quociente. Obter as <strong>de</strong>rivadasdas funções secante, cossecante e cotangente. Obter as <strong>de</strong>rivadas das inversas das funçõestrigonométricas, arcsin, arctan, etc. Em todos os casos procurar <strong>de</strong>senhar o gráfico <strong>de</strong>ssasfunções e interpretar as expressões obtidas!!B.11 Truques <strong>de</strong> primitivização: integração por partesSe rearranjarmos a expressão da Regra do Produto, teremosu(x)v ′ (x) = (u(x)v(x)) ′ − u ′ (x)v(x) .Havendo a igualda<strong>de</strong>, os dois lados da equação terão as mesmas primitivas (que diferem nomáximo por uma constante):∫∫∫u(x)v ′ (x)dx = (u(x)v(x)) ′ dx − u ′ (x)v(x)dx + C .Como ∫ (u(x)v(x)) ′ dx = u(x)v(x) + C então∫∫u(x)v ′ (x)dx = u(x)v(x) −u ′ (x)v(x)dx + C .Essa é a conhecida fórmula <strong>de</strong> Integração por Partes!Por exemplo, queremos achar uma primitiva <strong>de</strong> xe x . Se chamarmos u(x) = x e v ′ (x) = e xentão u ′ (x) = 1 e v(x) = e x (na verda<strong>de</strong> e x +C, mas isso não fará diferença, confira!!). Então∫∫xe x dx = xe x − 1e x dx + C = xe x − e x + C = e x (x − 1) + C .Para conferir, basta <strong>de</strong>rivar a primitiva obtida:(e x (x − 1)) ′ = e x (x − 1) + e x = xe x .Há que se tomar cuidado para não se escolher u <strong>de</strong> forma errada. Se chamássemosu(x) = e x e v ′ (x) = x teríamos u ′ (x) = e x e v(x) = 1 2 x2 , e então∫e x xdx = 1 2 x2 e x −∫ 12 x2 e x dx ,o que não melhora nossa situação, pois agora precisamos achar a primitiva <strong>de</strong> x 2 e x !B.12 Truques <strong>de</strong> primitivização: substituiçãoSe da Regra do Produto <strong>de</strong>corre a Integração por Partes, da Regra da Ca<strong>de</strong>ia segue a técnica<strong>de</strong> Substituição. A Regra da Ca<strong>de</strong>ia diz quef(g(x)) ′ = f ′ (g(x))f ′ (x) .


238Em termos <strong>de</strong> primitivas, temos∫∫f ′ (g(x))f ′ (x)dx =APÊNDICE B. REVISÃO DE CÁLCULOf(g(x)) ′ dx + C = f(g(x)) + C .Por exemplo, po<strong>de</strong>mos nos <strong>de</strong>parar com∫h(g(x))g ′ (x)dx .Se acharmos f tal que f ′ (x) = h(x) (isto é, uma primitiva <strong>de</strong> h) então∫∫h(g(x))g ′ (x)dx = f ′ (g(x))g ′ (x)dx = f(g(x)) + C .Embora ao leitor não pareça acrescentar nada nesse caso, esse processo po<strong>de</strong> ser automatizadoda seguinte forma:1. Definir nova variável u = g(x), com du = g ′ (x)dx.2. Substituir na integral a nova variável: ∫ h(u)du.3. Resolver o novo problema, que é o mesmo que achar uma primitiva <strong>de</strong> h:∫h(u)du = f(u) + C .4. Retornar o valor <strong>de</strong> u = g(x), obtendof(g(x)) + C .Por exemplo, queremos calcular ∫ x √ 1 + x 2 dx. Fazemos u = x 2 , don<strong>de</strong> du = 2xdx.Ficamos com ∫ 1 √1 + udu .2Só precisamos saber uma primitiva <strong>de</strong> (1 + u) 1/2 . Mas esta é fácil: tentemos23 (1 + u)3/2 .Substituindo u = x 2 na resposta, obtemos∫x √ 1 + x 2 dx = 1 3 (1 + x2 ) 3/2 + C .Em algumas situações não é evi<strong>de</strong>nte a substituição a ser feita. Seja ∫ H(x)dx a primitivaa calcular. Chame u = g(x), escolha que é apenas uma tentativa e <strong>de</strong>pen<strong>de</strong> do ’feeling’ emrelação ao problema. Se for possível inverter a função g então teremos x = g −1 (u). Agoradu = g ′ (x)dx, isto é,du = g ′ (g −1 (u))dx ,


B.12. TRUQUES DE PRIMITIVIZAÇÃO: SUBSTITUIÇÃO 239logodx =dug ′ (g −1 (u)) = (g−1 ) ′ (u)du .Então a substituição pela nova variável leva a∫H(g −1 (u)) · (g −1 ) ′ (u)du .Eventualmente é mais fácil calcular a primitiva <strong>de</strong>H(g −1 (u)) · (g −1 ) ′ (u)do que a primitiva <strong>de</strong> H(x). Se F(u) for a tal primitiva, então basta substituir u = g(x) paraobter a primitiva <strong>de</strong>sejada <strong>de</strong> H:∫H(x)dx = F(g(x)) + C .Vejamos um exemplo. Queremos <strong>de</strong>terminar ∫ x 2√ x + 1dx. Po<strong>de</strong>mos fazer a substituiçãou = √ x + 1. Então invertemos e obtemos x = u 2 − 1, com dx = 2udu. Em seguida fazemosa substituição na integral, obtendo∫2(u 2 − 1) 2 u 2 du .Essa primitiva é fácil <strong>de</strong> achar, pois trata-se <strong>de</strong> um polinômio: basta integrar termo a termo,para obteru 3 ( 2 3 − 4 5 u2 + 2 7 u4 ) + C .Substituindo novamente u por (x + 1) 1/2 , chegamos à primitiva procurada:(2 87 (x + 1)3/2 15 − 4 )5 x + x2 + C .


240APÊNDICE B. REVISÃO DE CÁLCULO


Apêndice CFórmula <strong>de</strong> TaylorC.1 IntroduçãoNa Parte II <strong>de</strong>ste livro é abordada a questão da aproximação <strong>de</strong> uma função por polinômios:dado um número inteiro n maior ou igual a zero, qual é o melhor polinômio, entre aqueles<strong>de</strong> grau menor ou igual a n, a aproximar uma certa função contínua f <strong>de</strong>finida no intervalo[a, b]?Ali a questão só po<strong>de</strong> ser respondida se antes se <strong>de</strong>finir um critério (relativo) <strong>de</strong> proximida<strong>de</strong>.Isto é, uma maneira <strong>de</strong> dizer o quanto um polinômio está distante <strong>de</strong> f, que permita<strong>de</strong>cidir, entre dois dados polinômios, qual é aquele que está mais perto <strong>de</strong> f. O critérioadotado é o do “qui-quadrado”: se p é o polinômio então me<strong>de</strong>-seQ(p) =∫ ba(f(x) − p(x)) 2 dx ,que é sempre um número maior ou igual a zero.Esse critério leva em conta a proximida<strong>de</strong> <strong>de</strong> f e p em todo o intervalo [a, b]. De nadaadianta que p seja exatamente igual a f em certa parte do intervalo se em outra a diferençase torna enorme, fazendo aumentar o valor da integral.Neste Apêndice estamos interessados em outro ponto <strong>de</strong> vista para se <strong>de</strong>finir a melhoraproximação polinomial <strong>de</strong> f. Agora não estamos preocupados em aproximar f num dadointervalo fixo, mas sim “na vizinhança <strong>de</strong> um ponto”. Fixado um ponto w, não nos interessaráo que acontece com a função “longe” do ponto w.Tentemos precisar melhor os conceitos. Seja f uma função, para começar contínua, e wum ponto on<strong>de</strong> ela esteja <strong>de</strong>finida. Sejam p e q dois polinômios. Diremos que p aproxima fem w melhor do que q sep(x) − f(x)∣q(x) − f(x) ∣ < 1quando x está suficientemente perto <strong>de</strong> w. Ou seja, se tomarmos x suficientemente próximo<strong>de</strong> w então a diferença |p(x) −f(x)| fica menor do que a diferença |q(x) −f(x)|. Obviamentea fração só é tomada quando o <strong>de</strong>nominador for não nulo.241


242APÊNDICE C. FÓRMULA DE TAYLOREm geral, teremos que essa fração vai a zero, o que po<strong>de</strong> ser expresso da seguinte maneira:p(x) − f(x)limx→w q(x) − f(x) = 0 .Po<strong>de</strong>mos ver alguns exemplos simples, para aos poucos chegarmos a enunciados maisgerais.C.1.1Polinômios <strong>de</strong> grau zeroPor exemplo, suponha que f seja uma função (contínua) que assume o valor A em w. Esuponha que p e q sejam polinômios <strong>de</strong> grau zero, isto é, são polinômios constantes: p(x) = a 0e p(x) = b 0 , para todo x, com a 0 ≠ b 0 . Para sabermos qual dos polinômios aproxima melhora função f em w, temos que olhar para o quociente∣ p(x) − f(x)∣∣∣ ∣q(x) − f(x) ∣ = a 0 − f(x)b 0 − f(x) ∣Como f(x) ten<strong>de</strong> a A à medida que x ten<strong>de</strong> a w, po<strong>de</strong>mos ver quais são as possibilida<strong>de</strong>s.Primeiro, se tanto a 0 quanto b 0 forem diferentes <strong>de</strong> A, então o quociente ten<strong>de</strong> aa 0 − A∣b 0 − A∣ ,que será menor do que 1 se a 0 estiver mais próximo <strong>de</strong> A do que b 0 . Neste caso, como esse éo valor limite, quando x estiver bem próximo <strong>de</strong> w o quociente será também menor do que1, e então p aproximará melhor do que q em w. Se for o contrário, isto é, b 0 mais perto <strong>de</strong>A do que a 0 então será q que aproximará melhor.Se a 0 = A então teremos que a diferença a 0 − f(x) ten<strong>de</strong> a zero quando x ten<strong>de</strong> a w,enquanto b 0 − f(x) ten<strong>de</strong> a b 0 − a 0 . Neste caso a fração irá a zero.Conclui-se portanto que o melhor polinômio <strong>de</strong> grau zero que aproxima f em w é p(x) =f(w) = A.C.1.2Aproximação da função nulaVale a pena enten<strong>de</strong>r também o que se passa com a função f(x) ≡ 0, a função nula, tomando,para facilitar, o ponto w = 0. Pela Subseção anterior, o melhor polinômio <strong>de</strong> grau zero queaproxima f em w é p(x) ≡ 0. Também p(x) ≡ 0 = 0 + 0 · x é o melhor polinômio <strong>de</strong> grau 1a aproximar f, <strong>de</strong> fato, para qualquer n é o melhor polinômio <strong>de</strong> grau n.Fica para o leitor se divertir em <strong>de</strong>monstrar (ou verificar) isso.C.1.3 Aproximação <strong>de</strong> grau 1Vejamos como melhor aproximar uma função f em w por um polinômio <strong>de</strong> grau 1, supondoque ela seja <strong>de</strong>rivável.Em primeiro lugar, é fácil ver que o polinômio p(x) <strong>de</strong>ve ter, como termo <strong>de</strong> grau zero, ovalor <strong>de</strong> f em w, pela mesma razão com que o melhor polinômio <strong>de</strong> grau zero tinha que serigual a f(w). Entãop(x) = f(w) + α(x − w)


C.2.POLINÔMIO E FÓRMULA DE TAYLOR 243(lembrando que polinômios <strong>de</strong> grau 1 têm retas como gráfico, e esta é uma maneira <strong>de</strong> seescrever a reta que passa por (w, f(w)) e tem inclinação α), ou seja, precisamos apenasprocurar o valor <strong>de</strong> α.Como f é <strong>de</strong>rivável, então existe o limiteIsto é o mesmo que dizer que a diferençaf ′ f(x) − f(w)(w) = lim .x→w x − wf ′ (w) −f(x) − f(w)x − wten<strong>de</strong> a zero quando x ten<strong>de</strong> a w.Afirmamos que p(x) = f(w)+f ′ (w)(x −w) é o melhor polinômio <strong>de</strong> grau 1 que aproximaf em w, em <strong>de</strong>trimento <strong>de</strong> outros polinômios q(x) = f(w)+α(x −w), com α ≠ f ′ (w). Bastaolharmos para a fraçãof(x) − p(x)f(x) − q(x) = f(x) − f(w) − f ′ (w)(x − w).f(x) − f(w) − α(x − w)Colocando x − w em evidência no numerador e no <strong>de</strong>nominador, ficamos comf(x)−f(w)x−w− f ′ (w)f(x)−f(w)x−w− α .Quando x ten<strong>de</strong> a w, o numerador ten<strong>de</strong> a zero, pelas consi<strong>de</strong>rações acima, enquanto que o<strong>de</strong>nominador ten<strong>de</strong> a f ′ (w) − α, que é diferente <strong>de</strong> zero. Portanto a fração toda vai a zero,mostrando o que havíamos afirmado.Conclui-se então que a melhor aproximação <strong>de</strong> grau 1 <strong>de</strong> f em w correspon<strong>de</strong> à (única)reta que passa por w e tem inclinação f ′ (w).C.2 Polinômio e Fórmula <strong>de</strong> TaylorA última afirmação da Seção anterior é mais ou menos intuitiva. Ela diz que a melhor retaque aproxima um gráfico em dado ponto é a reta tangente ao gráfico nesse ponto.Outra maneira <strong>de</strong> se ler essa conclusão é a seguinte. O polinômio p(x) <strong>de</strong> grau 1 quemelhor aproxima f em w é aquele tal que p(w) = f(w) e p ′ (w) = f ′ (w).Esta segunda maneira <strong>de</strong> pensar se presta facilmente a generalizações. De fato, po<strong>de</strong>-semostrar (e o faremos logo abaixo) que o polinômio <strong>de</strong> grau n que melhor aproxima f em wé aquele (único) tal quep(w) = f(w) , p ′ (w) = f ′ (w) , p ′′ (w) = f ′′ (w) , . . ., p (n) (w) = f (n) (w) ,ou seja, cujas <strong>de</strong>rivadas até or<strong>de</strong>m n coinci<strong>de</strong>m com as <strong>de</strong>rivadas <strong>de</strong> f em w.É claro que ao fazermos tal afirmação estamos automaticamente supondo que f po<strong>de</strong> serdiferenciada n vezes em w! Para facilitar as coisas iremos supor que a função f é tantas vezes


244APÊNDICE C. FÓRMULA DE TAYLORdiferenciável quanto queiramos, e além do mais todas as suas <strong>de</strong>rivadas <strong>de</strong> qualquer or<strong>de</strong>msão funções contínuas. Esse é, <strong>de</strong> fato, o caso da maioria das funções com que iremos nos<strong>de</strong>parar em aplicações (obviamente há exceções, e nesses casos há que se tomar os <strong>de</strong>vidoscuidados).O leitor po<strong>de</strong> facilmente verificar, usando as regras <strong>de</strong> <strong>de</strong>rivação, que o polinômiop n (x) = f(w) + f ′ (w)(x − w) + f ′′ (w)2(x − w) 2 + . . . + f(n) (w)(x − w) nn!satisfaz as exigências acima. Este é o chamado polinômio <strong>de</strong> Taylor <strong>de</strong> or<strong>de</strong>m n <strong>de</strong> f em w.Antes <strong>de</strong> examinarmos a veracida<strong>de</strong> da generalização feita acima, po<strong>de</strong>mos também nosperguntar em que grau é boa a aproximação por polinômios, em w, da função f. Maisespecificamente, po<strong>de</strong>mos investigar a diferença f(x) − p n (x) quando x se aproxima <strong>de</strong> w.De fato, respon<strong>de</strong>remos todas as indagações <strong>de</strong> uma só vez. Comecemos examinandoa diferença entre f(x) e a aproximação <strong>de</strong> primeira or<strong>de</strong>m p 1 (x) = f(w) + f ′ (w)(x − w).Chamemos <strong>de</strong> R 1 (x) (“R” <strong>de</strong> resto) essa diferença. EntãoR 1 (x) = f(x) − f(w) − f ′ (w)(x − w) .A idéia é reescrever essa expressão <strong>de</strong> forma que possamos avaliar o tamanho <strong>de</strong> R 1 (x). PeloTeorema Fundamental do Cálculo, temosR 1 (x) =∫ xwf ′ (t)dt − f ′ (w)(x − w)e, nesta nova expressão, po<strong>de</strong>mos reconhecer a integração por partesR 1 (x) =∫ xw(x − t)f ′′ (t)dt .Po<strong>de</strong>mos agora estimar R 1 (x), usando o Teorema do Valor Médio, em sua versão integral.Ou seja, existe ξ entre w e x, que <strong>de</strong>pen<strong>de</strong> <strong>de</strong> x, tal quePortanto temosR 1 (x) = (x − w)(x − ξ)f ′′ (ξ) .|R 1 (x)||x − w| = |x − ξ| · |f ′′ (ξ)| .Quando x ten<strong>de</strong> a w a diferença |x − ξ| ten<strong>de</strong> a zero, uma vez que ξ está entre w e x. Alémdisso, como estamos supondo que todas as <strong>de</strong>rivadas <strong>de</strong> f sejam contínuas, f ′′ (ξ) ten<strong>de</strong> af ′′ (w). Logo|R 1 (x)|limx→w |x − w| = 0 .Conclui-se então que o resto não só ten<strong>de</strong> a zero quando x ten<strong>de</strong> a w como ten<strong>de</strong> a zeromais rapidamente do que a diferença x − w.A segunda etapa é ver o que acontece com or<strong>de</strong>ns mais altas. Vejamos o que acontece aopassarmos para or<strong>de</strong>m 2. Comop 2 (x) = p 1 (x) + f ′′ (w)(x − w) 2 ,2


C.2.POLINÔMIO E FÓRMULA DE TAYLOR 245temosR 2 (x) = f(x) − p 2 (x) = f(x) − p 1 (x) − f ′′ (w)(x − w) 2 .2Mas f(x) − p 1 (x) = R 1 (x), <strong>de</strong> forma queR 2 (x) =∫ xexpressão esta que sai da integração por partes <strong>de</strong>wR 2 (x) = 1 2(x − t)f ′′ (t)dt − f ′′ (w)(x − w) 2 ,2∫ xw(x − t) 2 f ′′′ (t)dt .Usando novamente o Teorema do Valor Médio para a integral, conseguimos mostrar quelimx→w|R 2 (x)||x − w| 2 = 0 .Prosseguindo indutivamente (fica para o leitor se certificar disto), conclui-se quef(x) = p n (x) + R n (x) ,conhecida como fórmula <strong>de</strong> Taylor <strong>de</strong> or<strong>de</strong>m n para f em w, on<strong>de</strong>R n (x) = 1 n!A função R n tem a proprieda<strong>de</strong> <strong>de</strong> quelimx→w∫ xw(x − t) n f (n+1) (t)dt .|R n (x)||x − w| n = 0 .Se <strong>de</strong>limitarmos um intervalo on<strong>de</strong> a (n + 1)-ésima <strong>de</strong>rivada <strong>de</strong> f seja contínua, seumódulo terá um máximo nesse intervalo, que <strong>de</strong>notaremos por max |f (n+1) |. Como o móduloda integral é menor ou igual à integral do módulo (em um intervalo orientado positivamente),temos|R n (x)| ≤ 1 ∫ xn! ∣ |x − t| n |f (n+1) (t)|dt∣ew|R n (x)| ≤ max |f(n+1) |n!∣∫ xw|x − t| n dt∣ .Fazendo um gráfico <strong>de</strong> |x − t| n entre w e x, e prevendo as possibilida<strong>de</strong>s <strong>de</strong> que x < w ew < x, o leitor po<strong>de</strong> verificar facilmente que∫ x∫ |x−w|∣ |x − t| n dt∣ = u n |x − w|n+1du = .n + 1Entãow0|R n (x)| ≤ max |f(n+1) ||x − w| n+1 .(n + 1)!


246APÊNDICE C. FÓRMULA DE TAYLORPo<strong>de</strong>mos agora enten<strong>de</strong>r a razão pela qual o polinômio <strong>de</strong> Taylor p n é a melhor aproximação<strong>de</strong> grau n <strong>de</strong> f em w. Primeiro notamos quelimx→wR n (x)(x − w) m = 0para qualquer m menor ou igual a n (tiramos os módulos para facilitar as coisas, uma vezque o limite <strong>de</strong> uma expressão é zero se e somente se o limite do módulo da mesma expressãoé zero). Basta multiplicar o numerador e o <strong>de</strong>nominador por (x − w) n−m , ficando comR n (x)(x − w) n (x − w)n−m ,que vai a zero porque é um produto <strong>de</strong> dois termos que vão a zero.Suponhamos agora outro polinômio q <strong>de</strong> grau (no máximo) n. Como q e p n não sãoiguais, a diferença entre eles é um polinômio <strong>de</strong> grau no máximo n, que po<strong>de</strong>mos escrevercomoa m (x − w) m + a m+1 (x − w) m+1 + . . . + a n (x − w) n .O número m é o grau correspon<strong>de</strong>nte ao primeiro coeficiente não-nulo do polinômio (quandoescrito nessa forma), e po<strong>de</strong> ser qualquer inteiro entre 0 e n. Entãop n (x) − q(x) = (x − w) m (a m + Q(x)) ,on<strong>de</strong> Q(x) = a m+1 (x − w) + a m+2 (x − w) 2 + . . . + a n (x − w) n−m , polinômio que vai a zeroquando x ten<strong>de</strong> a w.Finalmente comparamos a proximida<strong>de</strong> <strong>de</strong> p n e q com f, para mostrar que p n está maispróximo <strong>de</strong> f em w do que q. Temosf(x) − p n (x)f(x) − q(x) =R n (x)R n (x) + p n (x) − q(x) ,lembrando da própria <strong>de</strong>finição <strong>de</strong> R n . A partir das consi<strong>de</strong>rações acima, essa fração po<strong>de</strong>ser escrita comoR n (x)(x − w) m (a m + Q(x) + Rn(x)(x−w)) ,m<strong>de</strong> on<strong>de</strong> nota-se que ela <strong>de</strong>ve ir a zero quando x ten<strong>de</strong> a w.


Apêndice DRespostas <strong>de</strong> exercíciosselecionados1.1 O polinômio interpolador é p(x) = a 0 + a 1 x + a 2 x 2 + a 3 x 3 on<strong>de</strong> os coeficientes sãocalculados pelo sistema linear⎛⎜⎝1 −1 1 −11 0 0 01 3 9 271 4 16 64⎞⎛⎟⎜⎠⎝cuja solução é a 0 = 1, a 1 = 112 , a 2 = − 3 4 e a 3 = 1 6 .1.2 p(x) = x 3 − 2x 2 + 3x + 12.3 x 1 = 0.258 e x 2 = 3.29⎞ ⎛a 0a 1⎟a 2⎠ = ⎜⎝a 32.4 No loop à esquerda temos −19 + 6I 1 + I 3 + 6 + 4I 1 = 0 e no loop à direita temos4I 2 +2−I ⎛ 3 −6 = 0. Com a equação I 1 = I 2 +I 3 , obtemos o sistema linear AI = b on<strong>de</strong>A = ⎝ 10 0 1 ⎞ ⎛0 4 −1 ⎠ e b = ⎝ 13 ⎞4 ⎠ Depois do escalonamento com 2 algarismos1 −1 −1⎛0⎞10 0 1.0significativos, obtemos à = ⎝ 0 4.0 −1.0 ⎠ com vetor <strong>de</strong> permutações⎛ ⎞ ⎛ ⎞0.10 −0.25 −1.4p =2.5 à = ⎛⎝⎝ 1 23⎠ e ˜b =⎝ 13 4.0−0.30−4.3 −4.2 1.1−0.16 −4.1 0.080−0.21 0.80 −0.5301−10⎞⎟⎠⎠. A resposta final é I 1 = 1.3A, I 2 = 1.1A e I 3 = 0.21A.⎞⎠, p =⎛⎝ 1 32247⎞⎠, ˜b =⎛⎝ 3.4−2.85.0⎞⎠, ˜x =⎛⎝ −3.70.51−9.4⎞⎠


248APÊNDICE D. RESPOSTAS DE EXERCÍCIOS SELECIONADOS2.12r (0) =⎛⎝ 1.52.20.94⎞⎠ ˜r (0) =⎛⎝ 1.50.230.59⎞⎠ c (0) =⎛⎝ −1.00.65−0.37⎞⎠ x (1) =⎛⎝ 3.4−6.95.2⎞⎠3.6 (a) A matriz não satisfaz o Critério das Linhas para qualquer permutação <strong>de</strong> linhas.⎛ ⎞(b) Com a permutação p = ⎝ 3 12⎛ ⎞−0.50000(c) x (1) = ⎝ 0.87500 ⎠.−0.35938(d) O erro inicial é estimado por 5 e n ≥ 147.⎠, temos β 1 = 5 6 , β 2 = 2324 , β 3 = 169192 e M = 2324 < 1.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!