4 Método dos quadrados mínimos

4.7 - AJUSTE DE CURVAS PELO MÉTODO DOS QUADRADOS MÍNIMOS 

Introdução 

Vimos, no capítulo anterior, que uma forma de se trabalhar com uma função 

definida por uma tabela de valores é a interpolação polinomial. 

Contudo, a interpolação não é aconselhável quando: 

a) é preciso obter um valor aproximado da função em algum ponto fora do 

intervalo de tabelamento, ou seja, quando se quer extrapolar; 

b) os valores tabelados são resultados de algum experimento físico ou de alguma 

pesquisa, porque, nestes casos, estes valores poderão conter erros inerentes 

que, em geral, não são previsíveis. 

Surge então a necessidade de se ajustar a estas funções tabeladas uma função que 

seja uma “boa aproximação” para os valores tabelados e que nos permita “extrapolar” com 

certa margem de segurança. 

4.7.1 - Método dos quadrados mínimos 

4.7.1.1- O Caso discreto 

Sejam dados os pontos (x 1 , f(x 1 )), (x 2 , f(x 2 )), ..., (x m , f(x m )) e as n funções g 1 (x), 

g2(x), ..., gn(x) escolhidas de alguma forma. 

Consideraremos que o número de pontos m, tabelados, é sempre maior ou igual a n 

o número de funções escolhidas ou o número de coeficientes α i a se determinar. 

Nosso objetivo é encontrar os coeficientes α 1 , α 2 , ..., α n tais que a função ϕ(x) = 

α 1 g 1 (x) + α 2 g 2 (x) + ... + α n g n (x) se aproxime ao máximo de f(x). 

Seja dk = f(xk) – ϕ(xk) o desvio em xk. Vamos observar que, um conceito de 

proximidade é que d k seja mínimo para todo k = 1, 2, ..., m. 

O método dos quadrados mínimos consiste em escolher os α j´s de tal forma que a 

soma dos quadrados dos desvios seja mínima. É claro que se a soma 

m m 

2 

2 

∑ d k = ∑ (f (x k ) − ϕ(xk 

)) é mínima, teremos que cada parcela [f(x k ) – ϕ(x k )] 2 é 

k= 

1 k= 

1 

pequena, donde cada desvio [f(xk) – ϕ(xk)] é pequeno. 

Portanto, dentro do critério dos quadrados mínimos, os coeficientes α k , que fazem 

com que ϕ(x) se aproxime ao máximo de f(x), são os que minimizam a função 

m 

F( 

α α α = ∑ − ϕ 2 

1 , 2, 

K , n ) [f (xk 

) (x k )] = 

k= 

1 

m 

= ∑[ f (x − α − α − − α 

2 

k ) 1g1(xk 

) 2g2 

(x k ) K ng 

n (xk 

)] . 

k = 1 

96

Observamos que, se o modelo ajustar exatamente os dados, o mínimo da função 

acima será zero e, portanto, a interpolação é um caso especial dentro do método dos 

quadrados mínimos. 

Usando o Cálculo Diferencial, sabemos que, para obter um ponto de mínimo de 

F(α 1, α 2, ..., α n), temos de, inicialmente, encontrar seus pontos críticos, ou seja, os (α 1, α 2, 

..., α n ) tais que 

temos 

∂F 

= 0 , j = 1, 2, ..., n. 

∂α j ( α1, 

α2 

, K, 

αn 

) 

Calculando estas derivadas parciais para cada j = 1, 2, ..., n, temos 

m 

∂F 

= 2∑[f (xk 

) − α1g1(xk 

) − K − α ngn 

(x k )] 

∂α j ( α , α , , α ) k = 1 

1 2 K n 

Impondo a condição 

∂F 

∂α j ( α1, 

α2 

, K, 

αn 

) 

= 0 , j = 1, 2, ..., n. 

m 

∑[ f (x k ) − α1g1(x 

k ) −K − αng 

n (xk 

)][g j (x k )] = 0 , j = 1, 2, ..., n. 

k = 1 

Assim, 

m 

⎫ 

∑[f(x 

k ) − α1g1(x 

k ) −... 

− αngn 

(xk 

)]g1(x 

k ) = 0⎪ 

k= 

1 

⎪ 

m 

⎪ 

∑[f 

(xk 

) − α1g1(x 

k ) − ... − α ngn 

(x k )]g2 

(x k ) = 0⎪ 

⎬ ⇒ 

k = 1 

⎪ 

M 

m 

⎪ 

⎪ 

∑[f(x 

k ) − α1g1(xk 

) − ... − αng 

n (xk 

)]g n (x k ) = 0 

⎪ 

k= 

1 

⎭ 

⎧ m 

m 

⎪ [ ∑ g1(x 

k )g1(xk 

)] α1 

+ K + [ ∑g 

n (xk 

)g1(xk 

)] α n 

⎪ k= 

1 

k= 

1 

⎪ m 

m 

⎪ 

⇒ 

[ 

α + + 

α 

⎨ ∑ g1(x 

k )g 2 (x k )] 1 K [ ∑ gn 

(x k )g2 

(xk 

)] n 

⎪ k= 

1 

k= 

1 

⎪ m 

m 

⎪ 

⎪ 

[ ∑ gn 

(x k )g1(xk 

)] α1 

+ K + [ ∑g 

n (xk 

)gn 

(xk 

)] α n 

⎩ k= 

1 

k= 

1 

m 

= ∑ f (x k )g1(x 

k ) 

k = 1 

m 

= ∑ f (x k )g2 

(xk 

) 

k = 1 

M 

m 

= ∑ f (x k )gn 

(x k ) 

k = 1 

que é um sistema linear com n equações e n incógnitas: α 1, α 2, ..., α n. 

97

As equações deste sistema linear são as chamadas equações normais. 

O sistema linear acima pode ser escrito na forma matricial Aα = b: 

⎧ a11α1 

+ a12α 

2 + K + a1n 

αn 

⎪ 

a 21α1 

+ a 22α2 

+ K + a 2n αn 

⎨ 

⎪ 

⎪ 

⎩a 

n1α1 

+ a n 2α 

2 + K + a nnαn 

= b1 

= b 2 

M 

= b n 

m 

onde A = (a ij ) é tal que a ij = ∑ g j(xk 

)gi 

(xk 

) = aij 

(ou seja, A é simétrica) 

k= 

1 

α = (α 1 , α 2 , ..., α n ) t e b = (b 1 , b 2 , ..., b n ) t é tal que 

m 

bi = ∑ f (xk )gi 

(x k ) . 

k = 1 

Lembramos que, dados os vetores x e y ∈ R m , o número real 

chamado de produto escalar de x por y. 

Usando esta notação, o sistema normal Aα = b ficará expresso por 

x , y = ∑ 

m 

x i y i é 

i= 

1 

A = 

( a ij) 

= gi, 

g j e b = (b i ) = f , gi 

onde 

g l é o vetor (g l (x1)g l (x2) ... g l (xm)) T e f, o vetor (f(x1)f(x2) ... f(xm)) T . 

Demonstra-se que, se as funções g 1 (x), ..., g n (x) forem tais que os vetores 

g1, 

g 2, 

K , g n sejam linearmente independentes, então o determinante da matriz A é 

diferente de zero e, portanto, o sistema linear 

⎧ m 

m 

⎪ [ ∑g1(xk 

)g1(x 

k )] α1 

+ K+ 

[ ∑ gn 

(x k )g1(xk 

)] αn 

⎪ k= 

1 

k= 

1 

⎪ m 

m 

⎪[ 

α + + 

α 

⎨ 

∑g1(xk 

)g2 

(x k )] 1 K [ ∑g 

n (xk 

)g2 

(xk 

)] n 

k= 

1 

k = 1 

⎪ 

⎪ m 

m 

⎪ 

⎪ 

[ ∑g 

n (xk 

)g1(x 

k )] α1 

+ K+ 

[ ∑ gn 

(x k )g n (xk 

)] αn 

⎩ k = 1 

k= 

1 

m 

= ∑ f (x k )g1(x 

k ) 

k = 1 

m 

= ∑ f (x k )g2 

(x k ) 

k = 1 

M 

m 

= ∑ f (x k )gn 

(x k ) 

k = 1 

98

admite solução única: 

α K . Ainda mais, demonstra-se também que esta solução 

1 , , αn 

α1 , K , αn 

é o ponto em que a função F( 1 , , αn 

α K ) atinge seu valor mínimo. 

Observamos que, se os vetores g1, 

g 2, 

K , g n tiverem uma propriedade 

suplementar de serem tais que g i , g j : ⎨ ⎧ = 0, i ≠ j 

⎩ ≠ 0,i = , o que, em linguagem de álgebra linear 

j 

se diz “se os vetores g1,g 

2, 

K , g n forem ortogonais entre si”, então a matriz A do sistema 

normal será matriz diagonal, com aii ≠ 0 e, portanto, o sistema terá solução única, a qual 

será facilmente determinada. 

Felizmente, dado um conjunto de pontos {x1, x2, ..., xm} é fácil construir 

polinômios de grau 0, 1, ..., n que são ortogonais, no sentido acima, em relação ao produto 

escalar 

g i , g j = ∑ 

m 

g i (x k )g j(xk 

) . 

k = 1 

Polinômios ortogonais constituem uma classe particular de funções ortogonais. 

Tais funções possuem várias propriedades muito interessantes e úteis. O leitor interessado 

em aprender sobre o assunto pode pesquisar, por exemplo, nos livros [5] e [27]. O estudo 

de funções ortogonais, em particular de polinômios ortogonais, merece um capítulo 

especial, o que será feito aqui. 

Exemplo 4.7.1: 

Seja o conjunto de pontos X5 = {–1, – ½, 0, ½, 1} e os polinômios 

g 0 (x) = 1; g 1 (x) = x, g 2 (x) = x 2 – ½ 

Então, os polinômios g 0 (x), g 1 (x) e g 2 (x) são funções ortogonais em X 5 com 

relação ao produto escalar g i , g j = ∑ 

m 

g i (x k )g j(xk 

) pois os vetores 

k = 1 

g 0 = (g 0 (x i )) = (1 1 1 1 1) T 

g 1 

= (g 1 (x i )) = (–1 – ½ 0 ½ 1) T e 

g 2 = (g 2 (x i )) = ( ½ – ¼ – ½ –¼ ½ ) T são ortogonais entre si, o que se verifica 

facilmente: 

g 0 , g 0 = 5 ≠ 0 

g 0 , g 1 = 1(– 1) + 1(–½ ) + 1(0) + 1(½) + 1(1) = 0 

g 0 , g 2 = 1(½) + 1(–¼) + 1(–½) + 1(–¼) + 1(½) = 0 

Fica a cargo do leitor fazer as demais verificações. 

99

P = 

Os polinômios citados são conhecidos como polinômios de Gram, { im} m i 0 

2 i 

ortogonais em conjuntos de pontos eqüidistantes, xi = –1 + . m 

Assim, 

Pi 

,m , Pj, 

m 

⎧= 

0 

⎨ 

⎩≠ 

0 

se i ≠ 

j 

≠ 


Seja a função tabelada 

x –1.0 –0.75 –0.6 –0.5 –0.3 0 0.2 0.4 0.5 0.7 1.0 

f(x) 2.05 1.153 0.45 0.4 0.5 0 0.2 0.6 0.512 1.2 2.05 

Feito o diagrama de dispersão, deve ser ajustada por uma parábola passando pela 

origem, ou seja, f(x) = ϕ(x) = αx 2 (neste caso temos apenas uma função g(x) = x 2 ). 

Temos, pois, de resolver apenas a equação 

11 

11 

[ ∑ g(xk )g(x k )] α = ∑ f (x k )g(xk 

) 

k= 

1 

k = 1 

11 

11 

2 

[ ∑g(x 

k ) ] α = ∑f 

(xk 

)g(x k ) 

k−1 

k= 

1 

11 

11 

[ ∑(x 

2 ) 2] 

α = 2 

∑ (x )f (x 

k 

k k ) 

k= 

1 

k = 1 

Continuando a tabela com g(xk)g(xk) e g(xk)f(xk), temos 

x –1.0 –0.75 –0.6 –0.5 –0.3 0 0.2 0.4 0.5 0.7 1.0 

Somas 

(x 2 )(x 2 ) 1 0.3164 0.1296 0.0625 0.0081 0 0.0016 0.0256 0.0625 0.2401 1.0 2.8464 

f(x)x 2 2.05 0.6486 0.162 0.1 0.045 0 0.008 0.096 0.128 0.0588 2.05 5.8756 

5.8756 

Assim, nossa equação é 2.0642α = 5.8756 ⇒ α = ≈ 2.0642 

2.8464 

Então ϕ(x) =2.0642x 2 é a parábola que melhor se aproxima, no sentido dos 

quadrados mínimos, da função tabelada. 

4.7.1.2- O Caso Contínuo 

Para simplificar a notação, desenvolveremos aqui o caso em que “escolhemos” 

apenas duas funções. 

100

Sejam então f(x) contínua em um intervalo [a, b] e g 1 (x) e g 2 (x) duas funções 

contínuas em [a, b] que foram escolhidas de alguma forma. É preciso encontrar duas 

constantes reais α 1 e α 2 tais que ϕ(x) = α 1 g 1 (x) + α 2 g 2 (x) esteja o “mais próximo possível” 

de f(x). 

Seguindo o critério dos quadrados mínimos para o conceito de proximidade entre 

ϕ(x) e f(x), os coeficientes α 1 e α 2 a serem obtidos deverão ser tais que o valor de 

b 

∫ [ f(x) − ϕ (x)] 

2 dx seja o menor possível. 

a 

Geometricamente, isto significa que a área entre as curvas f(x) e ϕ(x) seja mínima. 

Portanto, o problema consiste em obter o mínimo para 

b 

b 

2 

2 

2 

∫ [ f(x) − ϕ(x)] 

dx = ∫[f(x) 

− 2f (x) ϕ(x) 

+ ϕ(x) 

]dx = 

a 

a 

b 

2 

2 2 

= ∫ { f (x) − 2f(x)[ α1g1(x) 

+ α2g2 

(x)] + α1 

g1 

(x) + 

a 

2 2 

+ 2α1α2g1(x)g2 

(x) + α2g2 

(x)}dx 

b 

b 

b 

= 2 

∫f 

(x) dx − [2∫ 

f (x)g1(x)dx] 

α1 

− [2 ∫ f(x)g2 

(x)dx] α2 

+ 

a 

a 

a 

b 

b 

b 

+ 2 2 

2 

[ ∫ g1 (x)dx] α1 

+ [2∫ 

g1(x)g2 

(x)dx] α1α2 

+ [ ∫ g 2(x)dx] 

= F( α1, 

α2 

) 

a 

a 

a 

b 

⇒ 

2 

∫ [ f (x) − ϕ(x)] 

dx = F( α1, 

α2 

) 

a 

Com o mesmo argumento do caso discreto, temos de achar os pontos críticos de F, 

ou seja, achar (α 1, α 2) tal que 

∂F 

∂αi 

( α1, 

α2 

) 

= 0 , i = 1, 2. 

b 

b 

∂F 

2 

i = 1 ⇒ = −2 

+ 

α + 

∂α ∫f 

(x)g1(x)dx 

[2∫ 

g1 

(2)dx] 1 

1 ( α , α ) a 

a 

1 

2 

+ [ 2∫ g 1 (x)g 2 (x)dx] 

α 2 

Assim, 

∂F 

∂α1 

∂F 

= = 0 ⇒ 

∂α 

( α1, 

α2 

) 2 ( α1, 

α2 

) 

101

⎧ b 

b 

2 

⎪[ 

∫g1 

(x)dx] α1 

+ [ ∫ g1(x)g2 

(x)dx] α2 

⎪ 

a 

a 

⎨ 

b 

b 

⎪ 

⎪[ 

∫g 

α + 2 

1(x)g2(x)dx] 

1 [ ∫ g2 

(x)dx] α2 

⎪⎩ 

a 

a 

b 

= ∫ f(x)g1(x)dx 

a 

b 

= ∫ f(x)g2 

(x)dx 

a 

b 

b 

b 

2 

Se a 11 = ∫ g1 

(x) dx , a 12 = ∫ g1(x)g2(x)dx = ∫ g 2(x)g1(x)dx 

= a 21 

a 

a 

a 

b 

2 

a 22 = ∫g 

2(x) 

dx 

a 

b 

b 

b 1 = ∫ f (x)g1(x) 

dx e b 2 = ∫ f(x)g2 

(x) dx , 

a 

a 

podemos escrever o sistema linear acima como 

⎧a11α1 

+ a12α2 

= b1 

⎨ 

⎩a 

21α1 

+ a 22α2 

= b2 

⎛ a11 

ou Aα = b, onde A = ⎜ 

⎝ a 21 

a12 

a 22 

⎞ 

⎟ 

⎠ 

α = (α 1 α 2 ) T , b = (b 1 b 2 ) T . 

Demonstra-se que, se as funções escolhidas g1(x) e g2(x) forem linearmente 

independentes, o determinante da matriz A é diferente de zero, o que implica que o sistema 

linear admite única solução ( α 1, 

α2) 

. Ainda mais, demonstra-se também que esta solução 

é o ponto em que a função F(α 1, α 2) atinge seu valor mínimo. 

Usando aqui a definição de produto escalar de duas funções p(x) e q(x) no 

intervalo [a, b] por 

b 

p , q = ∫ p(x)q(x)dx , 

a 

teremos que, no caso em que queremos aproximar 

f(x) ≈ α 1 g 1 (x) + ... + α n g n (x) o sistema normal Aα = b fica 

A = (a ij ) = g i , g j 

b 

= ∫ gi 

(x)g j(x)dx 

= 

a 

b 

b = (bi) = f , gi 

= ∫f 

(x)gi 

(x) dx . 

a 

g j, 

gi 

102

Da mesma forma que no caso discreto, temos funções ortogonais com relação ao 

produto escalar, como mostrará o exemplo abaixo. 


Os polinômios de Legendre, definidos por 

(k) 

1 d 

P 0 (x) ≡ 2 k 

1, P k (x) = 

[(x − 1)] , k = 1, 2, ... 

k (k) 

2 k! dx 

b 

são ortogonais em [–1, 1], com relação ao produto escalar p , q = ∫ p(x)q(x)dx . 

a 

Fica como exercício a verificação de que os três primeiros polinômios de Legendre 

P0(x) ≡ 1, P1(x) = x e P2(x) = 1 (3x 

2 − 1) 

são ortogonais entre si. 

2 

Uma observação interessante é que, em geral, polinômios ortogonais satisfazem 

uma fórmula de recorrência de 3 termos, ou seja, dados P 0 (x) e P 1 (x), conseguimos 

construir P k (x), k = 2, 3, ... 

No caso dos polinômios de Legendre, a fórmula de recorrência é 

⎛ 2j + 1⎞ 

⎛ j ⎞ 

P j + 1 (x) = ⎜ ⎟xP 

j(x) 

− ⎜ ⎟Pj−1 

(x) 

, j = 1, 2, ... 

⎝ j + 1 ⎠ ⎝ j + 1⎠ 


Vamos aproximar f(x) = 4x 3 

intervalo [a, b] = [0, 1]. 

por um polinômio do primeiro grau, uma reta, no 

ϕ(x) = α 1 g 1 (x) + α 2 g 2 (x) = α 1 + α 2 x, α 1 , α 2 ∈ R 

(g 1 (x) ≡ 1 g 2 (x) = x). 

Pelo que vimos, (α 1 , α 2 ) é a única solução de Aα = b onde 

A = 

⎡a11 

⎢ 

⎣a21 

a12 

⎤ 

a 

⎥ 

22 ⎦ 

α = 

⎡α1 

⎤ 

⎢ ⎥ 

⎣α2 

⎦ 

b = 

⎡b1 

⎤ 

⎢ ⎥ , sendo 

⎣b2 

⎦ 

a 11 = 

a 12 = 

b 

1 

2 

1 = 1 

∫ g (x)dx ∫1dx 

= 

a 

b 

0 

1 2 

1 

x 1 

1 a 21 

2 2 

0 

0 

∫ g (x)g2 

(x)dx = ∫ xdx = = = 

a 

103

a 22 = 

b 

1 3 

1 

2 

2 x 

∫ g 2 (x)dx = ∫ x dx = = 

3 

a 

0 

0 

1 

3 

b 

1 

4 

1 

3 4x 

b1 = ∫ f (x)g1(x)dx 

= ∫ 4x dx = = 1 

4 

a 

0 

0 

b 

1 

5 

1 

3 4x 4 

b2 = ∫ f (x)g2 

(x)dx = ∫ 4x xdx = = 

5 5 

a 

0 

0 

Temos então o sistema 

⎧ 1 

⎪ 

1α 

1 + α2 

= 1 

2 

⎨ 

⎪1 

1 4 

α + α = 

1 2 

⎩ 2 3 5 

4 18 

⇒ α1 = − , α2 

= . 

5 5 

Logo, a aproximação por quadrados mínimos de f(x) = 4x 3 no intervalo [0, 1], por 

18 4 

um polinômio de grau 1, é a reta ϕ(x) = x − . 

5 5 

4.7.3- O Caso Não Linear 

Em alguns casos, a família de funções escolhidas pode ser não linear nos 

parâmetros, como, por exemplo, se ao diagrama de dispersão de uma determinada função se 

ajustar uma exponencial do tipo f(x) ≈ ϕ(x) = α1e –α 2 x , α 1 e α 2 positivos. 

Para se aplicar o método dos quadrados mínimos, é necessário que se efetue uma 

linearização do problema através de alguma transformação conveniente. 

Por exemplo: 

y ≈ α 1 e –α 2 x ⇒ z = ln(y) ≈ ln(α 1 ) – α 2 x. 

Se a1 = ln(α 1) e a2 = – α 2 ⇒ ln(y) ≈ a1 – a2x = φ(x) que é um problema linear nos 

parâmetros a 1 e a 2 . 

O método dos quadrados mínimos pode então ser aplicado na resolução do 

problema linearizado. Obtidos os parâmetros deste problema, usaremos estes valores para 

calcular os parâmetros originais. 

É importante observar que os parâmetros assim obtidos não são ótimos dentro do 

critério dos quadrados mínimos, isto porque estamos ajustando o problema linearizado por 

quadrados mínimos e não o problema original. 

Portanto, no exemplo, os parâmetros a 1 e a 2 são os que ajustam a função φ(x) à 

função z(x) no sentido dos quadrados mínimos; não se pode afirmar que os parâmetros α 1 e 

α 2 (obtidos através de a 1 e a 2 ) são os que ajustam ϕ(x) à f(x) dentro do critério dos 

quadrados mínimos. 

104


Suponhamos que num laboratório obtivemos experimentalmente os seguintes 

valores para f(x) sobre os pontos x i , i = 1, 2, ..., 8: 

x –1.0 –0.7 –0.4 –0.1 0.2 0.5 0.8 1.0 

f(x) 36.547 17.264 8.155 3.852 1.820 0.860 0.406 0.246 

Fazendo o diagrama de dispersão dos dados acima, obtemos 

y 

Figura 4.7.1 – diagrama de dispersão dos dados da tabela dada. 

x 

Os dados nos sugere um ajuste y ≈ ϕ(x) = α 1 e –α 2 x . 

Conforme vimos anteriormente, a “linearização” a ser feita é 

z = ln(y) ≈ ln(α 1e –α 2 x ) = ln(α 1) – α 2x = φ(x). 

Assim, em vez de ajustarmos y por quadrados mínimos, ajustaremos z = ln(y) por 

quadrados mínimos, encontrando φ(x) = a 1 + a 2 x, onde a 1 = ln (α 1 ) e a 2 = –α 2 . (Aqui g 1 (x) 

= 1 e g 2 (x) = x). 

Temos pois: 

x –1.0 –0.7 –0.4 –0.1 0.2 0.5 0.8 1.0 

z = ln(y) 3.599 2.849 2.099 1.349 0.599 –0.151 –0.901 –1.402 

e a1 e a2 serão a solução do sistema: 

105

⎧ 8 

8 

8 

⎪[ 

∑g1(xk 

)g1(x 

k )]a1 

+ [ ∑ g2 

(xk 

)g1(x 

k )]a 2 = ∑ z(xk 

)g1(xk 

) 

⎪ k = 1 

k= 

1 

k= 

1 

⎨ 

8 

8 

8 

⎪ 

⎪[ 

∑g1(xk 

)g2 

(xk 

)]a 1 + [ ∑ g 2(x 

k )g 2(x 

k )]a 2 = ∑ z(xk 

)g2 

(xk 

) 

⎩ k = 1 

k = 1 

k= 

1 

8 

g 1 (x) = 1 ⇒ ∑ g1 (x k )g1(x 

k ) = ∑1= 

a11 

= 8 

k = 1 

k = 1 

8 

8 

g (x )g (x ) x2 

∑ 2 k 2 k = ∑ = a 22 = 3. 

k 

k = 1 

k= 

1 

g2(x) = x ⇒ 59 

8 

donde 

8 

8 

∑ g1(xk 

)g2 

(xk 

) = ∑1x 

k = a12 

= a 21 = 0.3 

k = 1 

k= 

1 

8 

8 

b 1 = ∑ z(x k )g1(x 

k ) = ∑ z(xk 

) = 8. 041 

k= 

1 

k= 

1 

8 

8 

b 2 = ∑ z (x k )g2 

(x k ) = ∑ z(xk 

)xk 

= −8. 

646 

k= 

1 

k= 

1 

⎡ 8 0.3 ⎤ 

⎡ 8.041⎤ 

A = ⎢ ⎥ b = ⎢ ⎥ 

⎣0.3 

3.59⎦ 

⎣− 8. 646 ⎦ 

e o sistema fica 

⎧ 8.0a1 

+ 0.3a 2 

⎨ 

⎩0.3a1 

+ 3.59a 2 

= 8.041 

= −8.646 

⇒ a 1 = 1. 099 e a 2 − 2. 5 

Agora, α 1 = e a 1 ⇒ α 1 = e 1.099 = 3.001 

α 2 = –a 2 ⇒ α 2 = 2.5. 

Assim, a função ϕ(x) = α 1e –α 2 x = 3.001e –2.5x 

Assim, como no exemplo anterior, onde ajustamos aos dados a curva y ≈ α 1 e –α 2 x , é 

comum encontrarmos casos em que os dados tabelados, feito o diagrama de dispersão, 

devem ser ajustados por 

1 

1) Uma hipérbole: y ≈ = ϕ(x) 

α1 

+ α 2x 

106

1 

( z = ≈ α1 + α2x) 

x 

x 

2) Uma curva exponencial: y ≈ α 1 α 2 = ϕ(x) 

(se y > 0, z = ln(y) ≈ ln( α + α = 

123 1 ) x ln( 

14243 

2 ) a 1 + a 2 x = φ(x)). 

a 

1 a 2 

3) Uma curva geométrica: y ≈ α 1 x α 2 = ϕ(x) 

(se x > 0 e y > 0, z = ln(y) ≈ ln( α1 ) + α 

{ 2 ln( x) 

= a 12 

3 1 + a 2{ 

ln( x) 

a1 a2 

t 

⇒ z = ln(y) ≈ a 1 + a 2 t = φ(t)).(Aqui minimizamos a soma dos quadrados dos 

desvios nos logaritmos de y, para os logaritmos de x.) 

4) Uma curva trigonométrica: y ≈ α 1 + α 2 cos(wx) = ϕ(x).(t = cos(wx) ⇒ ϕ(t) = α 1 

+ α 2t e, neste caso, estamos minimizando a soma dos quadrados dos desvios 

em y.) 

4.7.4- Teste de Alinhamento 

Uma vez escolhida uma função linear em α 1, α 2, ..., α n para ajustar uma função 

dada, uma forma de verificarmos se a escolha feita foi razoável é aplicarmos o teste de 

alinhamento, que consiste em: 

i) fazer a “linearização” da função não linear escolhida; 

ii) fazer o diagrama de dispersão dos novos dados; 

iii)se os pontos do diagrama (ii) estiverem alinhados, isto significará que a função 

não linear escolhida foi uma “boa escolha”. 

Observamos que, devido aos erros de observação, e cálculos aproximados, 

consideramos satisfatório o diagrama de dispersão onde os pontos se distribuem 

aleatoriamente em torno de uma reta média. 

No exemplo 4.7.5, temos 

x –1.0 –0.7 –0.4 –0.1 0.2 0.5 0.8 1.0 

y 36.547 17.264 8.155 3.852 1.820 0.860 0.406 0.246 

z = ln(y) 3.599 2.849 2.099 1.349 0.599 –0.151 –0.901 –1.402 

107

z 

x 

Figura 4.7.2- diagrama de dispersão dos dados da tabela dada. 

4.7.5- Exercícios 

Ver Ruggiero (página 287 a 291 – exercícios 01 ao 13) 

108

4 Método dos quadrados mínimos

Create successful ePaper yourself

Delete template?

Save as template?