02.11.2014 Views

Fymm IIb luentojen betaversio

Fymm IIb luentojen betaversio

Fymm IIb luentojen betaversio

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1<br />

Fysiikan matemaattiset menetelmät<br />

Luentomuistiinpanot 2013<br />

19. huhtikuuta 2013


2<br />

Sisältö<br />

1 Johdanto 3<br />

2 Variaatiolaskenta 3<br />

2.1 Kertausta: Funktion ääriarvot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

2.2 Funktionaalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

2.3 Eulerin yhtälö . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2.3.1 Yleistys monen funktion funktionaaliin . . . . . . . . . . . . . . . . . . . . . . . 8<br />

2.3.2 Yleistys monen muuttujan funktioihin . . . . . . . . . . . . . . . . . . . . . . . 9<br />

2.4 Sidottu (Ehdollinen) variaatioprobleema . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

2.5 Isoperimetrinen ongelma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.6 Toinen variaatio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

2.7 Funktionaaliderivaatta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

2.8 Ritzin menetelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

3 Sturm-Liouville-Teoria 17<br />

3.1 Perusominaisuudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.1.1 Erikoisfunktiot ja Sturm-Liouville yhtälöt . . . . . . . . . . . . . . . . . . . . . 18<br />

3.1.2 Yksinkertainen esimerkki S-L ongelmasta . . . . . . . . . . . . . . . . . . . . . 19<br />

3.2 Itseadjungoidut operaattorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

3.3 Sturmin ja Liouvillen lause . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

3.4 S-L operaattorin Greenin funktio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

3.5 Sturm-Liouville -ongelma variaatio-ongelmana . . . . . . . . . . . . . . . . . . . . . . . 29<br />

3.6 Rayleighin ja Ritzin menetelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

3.6.1 Esimerkki: Patarummun säveltaajuus . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

4 Hilbertavaruuksista 32<br />

4.1 Vektori-, normi- ja sisätuloavaruudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

4.2 Gram-Schmidt ja projektio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

4.3 Hilbert avaruudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4.4 Aliavaruudet ja separoituvuus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

4.5 Hilbertin avaruuden jatkuvat funktionaalit . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

5 Operaattorit 46<br />

5.1 Perusominaisuudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

5.2 Adjungoitu operaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />

5.3 Hermiittiset ja unitaariset operaattorit, projektio . . . . . . . . . . . . . . . . . . . . . 50<br />

6 Spektraaliteoriaa 52<br />

6.1 Ominaisvektorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52<br />

6.2 Rajoitetun operaattorin spektri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />

6.3 Hermiittisen operaattorin spektri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

6.4 Spektraaliesitys . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

6.5 Rajoittamattomat operaattorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60<br />

6.6 Adjungoitu operaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />

6.7 Käänteisoperaattorin yleistys . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />

6.8 Itseadjungoidun operaattorin spetkristä . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />

6.9 Yhteys kvanttimekaniikkaan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65<br />

6.10 Paikkaoperaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65<br />

6.11 Diracin merkintätapa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />

6.12 Impulssioperaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67


3<br />

1 Johdanto<br />

FyMM <strong>IIb</strong>:n sisältö jakaantuu kolmeen pääaiheeseen. Kurssi jatkaa siitä mihin FyMM IIa päättyi,<br />

eli syventää erikoisfunktioiden takana olevaa teoriaa. Aluksi tosin tehdään poikkeama variaatiolaskentaan.<br />

Variaatiolaskenta on erittäin hyödyllinen matematiikan ala. Monet käytännön ongelmat voidaan<br />

ratkaista sen avulla. Fyysikon näkökulmasta erityisen tärkeää on klassisen mekaniikan modernimpi<br />

Lagrangen esitys, joka perustuu siihen että tarkasteltavan systeemin dynamiikka kiteytetään vaikutusintegraaliin<br />

S = ∫ dtL(q, ˙q, t), missä q(t) kuvaa systeemin vapausasteita. Liikeyhtälöt johdetaan sen<br />

jälkeen variaatiolaskennan kautta etsimällä vaikutusintegraalin minimi, eli soveltamalla Mapertuisin<br />

periaatetta<br />

δS = 0 . (1.1)<br />

Tarkasteltava systeemi voi olla mikä tahansa: tasolla vierivä sylinteri, sähkömagneettinen kenttä lähteineen,<br />

painovoimakenttä Einsteinin yleisessä suhteellisuusteoriassa, hiukkasfysiikan Standardimalli,<br />

säieteoria. Useimmat fysiikan teoriat rakennetaan lähtien liikkeelle Mapertuisin periaatteesta, niinpä<br />

(1.1) on – vain osittain leikillisesti sanoen – Kaiken Teoria (TOE) (kunhan vain aktio S on tunnetaan).<br />

Variaatiolaskennan jälkeen siirrytään Sturm-Liouville ongelman analysointiin. Lähes kaikki toisen asteen<br />

differentiaaliyhtälöt voidaan kirjoittaa ns. Sturm-Liouville -muodossa. Yhtälöiden ohella tärkeitä<br />

ovat myös reunaehdot. Jos ne ovat tiettyä tyyppiä, kyseessä on Sturm-Liouville -ongelma, jonka ratkaisut<br />

muodostavat ortogonaalisen kannan reunaehdot toteuttavien funktioiden avaruudessa. FyMM<br />

IIa:lla erikoisfunktioille hieman yllättäen löydetyt samankaltaiset ominaisuudet heijastavat tätä yleisempää<br />

teoriaa.<br />

Kurssin viimeinen teema – Hilbert-avaruudet, operaattorit ja spektraaliteoria – suuntaa sovelluksiin<br />

kvanttifysiikassa. Kvanttimekaniikassa kutakin havaittavaa suuretta vastaa Hermiittinen operaattori.<br />

Aaltofunktioiden avaruudessa ne palautuvat yleisesti differentiaalioperaattoreiksi. Niiden ominaisarvot<br />

vastaavat mahdollisia mittaustuloksia ja muodostavat ns. spektrin. Aaltofunktioiden avaruudella taas<br />

on ominaisuuksia (esim. sisätulo ja siihen pohjautuva normi, joilla muotoillaan kvanttimekaniikan<br />

todennäköisyystulkinta) joiden perusteella se on erityinen vektoriavaruus, ns. Hilbert-avaruus. Nämä<br />

käsitteet esitellään kurssin viimeisessä osassa.<br />

2 Variaatiolaskenta<br />

2.1 Kertausta: Funktion ääriarvot<br />

Määritelmä 2.1 Olkoon f(x 1 , x 2 , .., x n ) ∈ C 2 (Ω), Ω ⊂ R n ja x 0 = (x 0 1 , x0 2 , ..., x0 n) ∈ Ω. Sanomme,<br />

että f(x 0 ) on lokaali maksimi (minimi), jos on olemassa avoin ympäristö U x 0 s.e. f(x) ≤ f(x 0 )<br />

(f(x) ≥ f(x 0 )) kaikilla x ∈ U x 0 \ {x 0 }.<br />

Yleisesti maksimeja ja minimejä kutsutaan ääriarvoiksi ja pisteitä, joissa ne saavutetaan ääriarvokohdiksi<br />

tai ääriarvopisteiksi. Välttämätön ehto lokaalille ääriarvolle saadaan funktion Taylor-kehitelmästä<br />

pisteen ympäristössä:<br />

f(x 0 + h) = f(x 0 ) +<br />

n∑<br />

i=1<br />

∂f<br />

x i<br />

∣ ∣∣∣x<br />

0h i + 1 2<br />

n∑<br />

i,j=1<br />

Olkoon f(x 0 ) lokaali maksimi, h = (0, .., 0, h i , 0, .., 0) ja oletetaan ∂f<br />

∂x i<br />

∂ 2 ∣<br />

f ∣∣∣x<br />

h i h j + . . . (2.1)<br />

∂x i ∂x j 0<br />

> 0 ( < 0). Tällöin<br />

f(x 0 + h) ≈ f(x 0 ) + ∂f ∣ ∣∣∣x<br />

· h i > f(x 0 ), kun h i > 0 ( < 0),<br />

∂x i 0


4<br />

eli f(x 0 ) ei olekaan maksimi, mikä on ristiriidassa oletuksen kanssa. Vastaavasti päätellään minimin<br />

tapauksessa, että täytyy siis olla:<br />

( ) ∂f<br />

f(x 0 ) ääriarvo =⇒<br />

= 0 kaikilla i = 1, . . . , n. (2.2)<br />

∂x i x=x 0<br />

Pisteitä, joissa kaikki osittaisderivaatat häviävät kutsutaan stationaarisiksi pisteiksi tai kriittisiksi pisteiksi,<br />

mutta ne eivät välttämättä ole ääriarvokohtia vaan pisteen laatu on selvitettävä toisista osittasiderivaatoista.<br />

Suoraviivainen tapa selvittää pisteen laatu on neliömuotojen<br />

A(h) =<br />

n∑<br />

A ij h i h j<br />

i,j=1<br />

tutkiminen. Jos A(h) ≠ 0, kun h ≠ ¯0, niin neliömuoto on definiitti, muuten sitä kutsutaan indefiniitiksi<br />

(Huom. A(¯0) = 0 kaikilla neliömuodoilla). Seuraavan lauseen todistus ohitetaan.<br />

Lause 2.1 Stationaarinen piste x 0 on maksimi (minimi), jos<br />

D(h) :=<br />

n∑<br />

i,j=1<br />

∂ 2 ∣<br />

f ∣∣∣x<br />

h i h j (2.3)<br />

∂x i ∂x j 0<br />

on negatiivinen (positiivinen) definiitti muoto. Jos muoto on indefiniitti, niin kyseessä on ns. satulapiste.<br />

Jos x 0 on satulapiste, niin f saa jokaisessa sen ympäristö sekä f(x 0 ):aa suurempia, että pienempiä<br />

arvoja kuten seuraavassa esimerkissä.<br />

Esimerkki 2.1 Olkoon f(x, y) = x 2 − y 2 ja Ω = R 2 . Nyt<br />

∂f ∂f<br />

= 2x ja<br />

∂x ∂y<br />

= −2y eli (0,0) on stationaarinen.<br />

Kuitenkin D(h) = 2(h 2 1 − h2 2 ) on indefiniitti eli f(0, 0) ei ole ääriarvo, kuten ei kuulukaan.<br />

Olemme edellä olettaneet, että tarkasteltava funktio on vähintään kaksi kertaa derivoituva, joten lausetta<br />

2.1 ei voi soveltaa alueen reunapisteissä, eikä pisteissä, joissa funktio ei ole derivoituva ja tähän<br />

liittyviä ongelmia valaiskoon seuraavat esimerkit:<br />

Esimerkki 2.2 Olkoon f(x, y) = √ x 2 + y 2 ja Ω = R 2 .<br />

Selvästikin f(x, y) ≥ 0 kaikilla (x, y) ∈ R 2 , joten ilmeisesti minimi on f(0, 0) = 0. Kuitenkin<br />

∂f<br />

∂x =<br />

x ∂f<br />

√ ja<br />

x 2 + y2 ∂y =<br />

y<br />

√<br />

x 2 + y 2 ,<br />

joten derivaattoja ei ole olemassa pisteessä (0, 0). Emme siis voi päätellä pisteen laatua muuten, kuin<br />

tietämällä että f on origoa lukuunottamatta aidosti positiivinen.<br />

Esimerkki 2.3 Olkoon f(x, y) = x 2 − y 2 ja Ω = {¯x ∈ R 2 : |¯x| ≤ 1}.<br />

Napakoordinaateissa f(x, y) = r 2 (cos 2 (θ) − sin 2 (θ)) = r 2 cos(2θ), joten<br />

päätellään:<br />

Maksimit: r = 1, θ = 0, π, jolloin f(1, 0) = f(−1, 0) = 1.<br />

Minimit: r = 1, θ = π/2, 2π/3, jolloin f(0, 1) = f(0, −1) = −1.<br />

Kuitenkin esim. ∂f<br />

∣<br />

(1,0)<br />

= 2 ≠ 0 jne.<br />

∂x<br />

|f| ≤ 1 joukossa Ω. Tästä


5<br />

Esimerkin 2.2 kaltaisiin tilanteisiin ei ole systemaattista menetelmää, jolla pisteiden laatu selvitetään,<br />

vaan ne on tarkastettava tapauskohtaisesti, kuten esimerkissä tehtiin. Esimerkissä 2.3 ongelmana oli<br />

maksimin saaminen alueen reunalla, mutta tämä voidaan välttää seuraavilla menetelmillä.<br />

Sidotut ääriarvot<br />

Etsitään funktion f(x 1 , x 2 , . . . , x n ) ääriarvot sidosehdoilla (m < n)<br />

ϕ 1 (x 1 , x 2 , . . . , x n ) = 0<br />

ϕ 2 (x 1 , x 2 , . . . , x n ) = 0<br />

.<br />

ϕ m (x 1 , x 2 , . . . , x n ) = 0.<br />

Yksi mahdollisuus on ratkaista sidosehdoista m muuttujaa m-n:n jäljelle jäävän muuttujan funktioina.<br />

Voi esimerkiksi ratkaista m ensimmäistä x 1 = x 1 (x m+1 , . . . , x n ), . . ., x m = x m (x m+1 , . . . , x n ), ja etsiä<br />

funktion<br />

g(x m+1 , ..., x n ) := f(x 1 (x m+1 , ..., x n ), ..., x m (x m+1 , ..., x n ), x m+1 , ..., x n )<br />

ääriarvot, jolloin sidosehdot on automaattisesti huomioitu.<br />

Esimerkki 2.4 funktion f(x, y) = x 2 + y 2 ääriarvot sidosehdolla<br />

ϕ(x, y) = x + y − 1 = 0. Eli suoran y = 1 − x suurin ja pienin etäisyys origosta.<br />

Ratkaistaan y = 1 − x ja sijoitetaan: f(x, 1 − x) = x 2 + (1 − x) 2 = 2x 2 − 2x + 1 = g(x). g:n kuvaaja<br />

ylöspäin aukeava paraabeli eli ei maksimia, mutta yksi minimi: g ′ (x) = 4x−2 = 0 ⇐⇒ x = 1/2, jolloin<br />

y = 1 − 1/2 = 1/2. Minimi saavutetaan siis pisteessä (1/2, 1/2) ja sen arvo on f(1/2, 1/2) = 1/2.<br />

Yhtälöiden kääntäminen voi olla työlästä tai käytännössä mahdotonta yksinkertaisillakin sidosehdoilla,<br />

joten usein on kätevämpi käyttää Lagrangen kertoimia:<br />

Määritellään<br />

Φ(x 1 , . . . , x n , λ 1 , . . . , λ m ) = f(x 1 , . . . , x n ) +<br />

ja etsitään Φ:n ääriarvot, i = 1, . . . , n, j = 1, . . . , m:<br />

∂Φ<br />

∂x i<br />

= ∂f<br />

∂x i<br />

+<br />

m∑<br />

j=1<br />

m∑<br />

λ i ϕ i (x 1 , x 2 , . . . , x n ),<br />

i=1<br />

λ j<br />

∂ϕ j<br />

∂x i<br />

= 0<br />

∂Φ<br />

∂λ j<br />

= ϕ j (x 1 , x 2 , . . . , x n ) = 0 (2.4)<br />

Sidokset siis muuttavat hieman stationaarisehtoa 2.2 ja yhtälöt 2.4 antavat alkuperäiset sidosehdot.<br />

Esimerkki 2.5 Jatkoa esimerkkiin 2.4<br />

Φ(x, y, λ) = x 2 + y 2 + λ(x + y − 1), (x,y) stationaarinen:<br />

Lisäksi ∂Φ/∂λ = x + y − 1 = 0 =⇒ x = y = 1/2.<br />

∂Φ<br />

∂x = 2x + λ = 0<br />

}<br />

∂Φ<br />

∂y = 2y + λ = 0 =⇒ x = y


6<br />

2.2 Funktionaalit<br />

Funktionaalilla (funktio funktiosta) tarkoitetaan kuvausta jostain funktioluokasta M reaaliluvuille.<br />

Merkitään F : M → R ja F:n arvoa hakasuluilla F[y]. Yleensä funktioluokka M 1 on<br />

Esimerkkejä:<br />

K := ”kompaktikantajaiset funktiot”<br />

C k := ”(paloittain) k kertaa jatkuvasti derivoituvat funktiot”<br />

L p (Ω) := ”p-integroituvat funktiot Ω:ssa, Ω ⊂ R n ”<br />

S := ”nopeasti häviävät funktiot”<br />

• Distribuutiot eli lineaariset funktionaalit, kuten δ-funktio:<br />

• F : L p ([a, b]) → R,<br />

• ”Funktionaalin Taylor-sarja”<br />

F [y] =<br />

δ x0 : y ↦→ y(x 0 ) =<br />

F [y] = ∫ b<br />

a [y(x)]p dx<br />

∞∑<br />

n=0<br />

1<br />

n!<br />

∫ b<br />

a<br />

· · ·<br />

∫ b<br />

a<br />

∫ ∞<br />

−∞<br />

δ(x − x 0 )y(x)dx<br />

dx 1 · · · dx n K n (x 1 , . . . , x n )y(x 1 ) · · · y(x n ) (2.5)<br />

Ylläoleva funktionaalin esitys 2.5 on itseasiassa varsin yleinen, jos ydinfunktioiksi K n sallitaan myös<br />

distribuutiot.<br />

Esimerkki 2.6 F [y] = ∫ ∞<br />

−∞ [y′ (x)] 2 dx, y ∈ K voidaan esittää<br />

F [y] =<br />

∫ ∞ ∫ ∞<br />

−∞<br />

−∞<br />

kun valitaan K 2 (x 1 , x 2 ) = −δ ′′ (x 1 − x 2 ). Perustelu:<br />

=⇒<br />

= −<br />

∫ ∞<br />

−∞<br />

∫ ∞ ∫ ∞<br />

dx 1 dx 2 K 2 (x 1 , x 2 )y(x 1 )y(x 2 ),<br />

dx 1 δ(x 1 − x 2 )y(x 1 ) = y ′′ (x 2 )<br />

−∞ −∞<br />

∫ ∞<br />

−∞<br />

/ ∞<br />

= −<br />

−∞<br />

=<br />

dx 1 dx 2 (−δ ′′ (x 1 − x 2 ))y(x 1 )y(x 2 )<br />

dx 2 y ′′ (x 2 )y(x 2 )<br />

dx 2 y ′ (x 2 )y(x 2 )<br />

} {{ }<br />

∫ ∞<br />

−∞<br />

=0<br />

dx 2 [y ′ (x 2 )] 2 .<br />

Variaatiolaskennassa tutkitaan funktionaaleja, jotka ovat muotoa<br />

J[y] =<br />

∫ b<br />

a<br />

∫ ∞<br />

+ dx 2 [y ′ (x 2 )] 2<br />

−∞<br />

ja perusongelma kuuluu: Mitkä ovat funktionaalin J ääriarvot joukossa<br />

{<br />

y ∈ C 2 ([a, b]) : y(a) = y a , y(b) = y b kiinteät } ?<br />

f(y(x), y ′ (x), x)dx (2.6)<br />

1 Kts. S:n määritelmää jossain???


7<br />

2.3 Eulerin yhtälö<br />

Johdamme välttämättömän ehdon funktionaalin J (2.6) ääriarvolle ts. löydämme ne y = y(x), joille<br />

J[y] on stationaarinen.<br />

Määritelmä 2.2 J[y] on stationaarinen, jos sen muutos häviää ensimmäisessä kertaluvussa, kun<br />

muutetaan y → y(x) + η(x), missä η on y:n ”pieni” variaatio ja η(a) = η(b) = 0. Toisin sanoen<br />

J[y] stationaarinen ⇔ δJ := J[y + η] − J[y] = 0 + O(η 2 ) kaikilla η.<br />

Apulause 2.1 Jos y on jatkuva ja ∫ b<br />

a<br />

η(x)y(x)dx = 0 kaikilla jatkuvilla η, niin y(x) = 0 kaikilla<br />

x ∈ [a, b].<br />

Todistus 2.1 Oletetaan y(x 0 ) ≠ 0, jossakin x 0 ∈ [a, b]. y on jatkuva, joten on olemassa ɛ s.e. y(x) ei<br />

vaihda merkkiä kun x ∈ [x 0 −ɛ, x 0 +ɛ]. Valitaan η(x) = (x−x 0 +ɛ) 2 (x−x 0 −ɛ) 2 , kun x ∈ [x 0 −ɛ, x 0 +ɛ]<br />

ja η(x) = 0 muuten. Nyt<br />

∫ b<br />

∫ x0 +ɛ<br />

{ > 0 , jos y(x0 ) > 0<br />

η(x)y(x)dx = η(x)y(x)dx =<br />

< 0 , jos y(x 0 ) < 0 ,<br />

a<br />

x 0 −ɛ<br />

josta seuraa ristiriita. On siis oltava y(x) = 0 kaikilla x ∈ [a, b].<br />

Olettaen f sopivan monesti derivoituvaksi voimme laskea J:n variaation f:n Taylor-kehitelmän avulla:<br />

J[y + η] =<br />

=<br />

∫ b<br />

a<br />

∫ b<br />

f(y + η, y ′ + η ′ , x)dx<br />

f(y, y ′ , x)dx<br />

a<br />

} {{ }<br />

=J[y]<br />

∫ b<br />

∂f<br />

+<br />

a ∂y η + ∂f<br />

∂y ′ η′ dx + O(η 2 )<br />

Osittaisintegroidaan viimeinen termi (sijoitus häviää, koska η(a) = η(b) = 0):<br />

∫ b<br />

/<br />

∂f<br />

b ∫<br />

∂f b<br />

a ∂y ′ η′ dx =<br />

a<br />

∂y ′ η − η d<br />

∫<br />

∂f<br />

b<br />

a dx ∂y ′ dx = − η d ∂f<br />

dx , josta<br />

a dx ∂y ′<br />

∫ b<br />

( ∂f<br />

δJ = J[y + η] − J[y] = η<br />

a ∂y − d )<br />

∂f<br />

dx ∂y ′ dx = 0<br />

Jotta tämä pätisi kaikilla variaatioilla η, yo. apulauseesta seuraa Eulerin yhtälö:<br />

∂f<br />

∂y − d<br />

dx<br />

Esimerkki 2.7 Lyhin tason pisteet (a, y a ) ja (b, y b ) yhdistävä käyrä.<br />

Pituuselementti: ds = √ dx 2 + dy 2 = √ 1 + (y ′ ) 2 dx. Käyrän pituus on<br />

∫ (b,yb )<br />

∫ b<br />

∂f<br />

∂y ′ = 0. (2.7)<br />

√<br />

J[y] = ds = 1 + (y ′ ) 2 dx , jolle Euler:<br />

(a,y a) a } {{ }<br />

f(y,y ′ ,x)<br />

∂f<br />

∂y − d ∂f<br />

dx ∂y ′ = − d ∂f<br />

dx ∂y ′ = 0<br />

=⇒ d y ′<br />

√<br />

dx 1 + (y ′ ) = 0 2<br />

=⇒<br />

y ′<br />

√<br />

1 + (y ′ ) 2 = C = vakio<br />

=⇒<br />

dy<br />

dx = α = vakio<br />

=⇒ y = αx + β Suora!


8<br />

Vakiot α ja β määräytyvät ehdoista y(a) = y a ja y(b) = y b . On selvää, että ääriarvo on minimi eikä<br />

maksimi.<br />

Jos varioitava integrandi ei riipu eksplisiittisesti x:stä, Eulerin yhtälö redusoituu ensimmäisen asteen<br />

yhtälöksi (Beltramin identiteetti):<br />

df<br />

dx<br />

=<br />

Euler<br />

{}}{<br />

=<br />

Koska oletuksen mukaan ∂f/∂x = 0, saadaan:<br />

d<br />

dx<br />

=<br />

(<br />

f − y ′ ∂f<br />

∂y ′ )<br />

∂f<br />

∂x + ∂f<br />

∂y y′ + ∂f<br />

∂y ′ y′′<br />

∂f<br />

∂x + d ∂f<br />

y′<br />

dx ∂y ′ + ∂f<br />

∂f<br />

∂x + d (<br />

y ′ ∂f )<br />

dx ∂y ′ .<br />

= 0<br />

joka on ensimmäisen kertaluvun DY y(x):lle (f annettu).<br />

Esimerkki 2.8 Pienimmän pinta-alan pyörähdyskappale.<br />

A[y]<br />

= 2π<br />

∂y ′ y′′<br />

eli f − y ′ ∂f<br />

∂y ′ = C = vakio, (2.8)<br />

∫ b<br />

a<br />

y √ 1 + (y ′ ) 2 dx , jolloin<br />

δA = 0 =⇒ f − y ′ ∂f<br />

∂y ′ = C<br />

⇐⇒<br />

y ′<br />

y √ 1 + (y ′ ) 2 − y ′ y √<br />

1 + (y ′ ) = 2<br />

⇐⇒ y ′ = 1 C<br />

√<br />

y 2 − C 2 separoituu<br />

=⇒ cosh −1 ( y C ) = (x − C 2)/C<br />

⇐⇒ y = C · cosh( x − C 2<br />

C<br />

) ”katenoidi”.<br />

y<br />

√<br />

1 + (y ′ ) 2 = C<br />

Taas C ja C 2 määräytyvät reunaehdoista ja on selvää, että kyseessä on minimi eikä maksimi.<br />

2.3.1 Yleistys monen funktion funktionaaliin<br />

Tutkittava funktionaali on nyt:<br />

ehdolla<br />

J = J[y 1 , y 2 , . . . , y n ] =<br />

∫ b<br />

a<br />

f(y 1 , . . . , y n , y ′ 1, . . . , y ′ n, x)dx, (2.9)<br />

y i (a) = y ia<br />

y i (b) = y ib<br />

kiinnitetyt, i = 1,...,n .<br />

Varioidaan y i (x) → y i (x) + η i (x) (η i (a) = η i (b) = 0), jolloin:<br />

∫ b n∑<br />

( ∂f<br />

δJ = η i (x) − d ∂f<br />

∂y i dx<br />

a<br />

i=1<br />

=⇒ ∂f − d<br />

∂y i dx<br />

∂f<br />

∂y ′ i<br />

∂y ′ i<br />

)<br />

dx = 0<br />

= 0 i = 1,...,n. (2.10)


9<br />

Yhtälöiden 2.10 (Euler-Lagrange yhtälöt) tärkeä sovellus: Lagrangen mekaniikka.<br />

Massapiste (massa m, paikka ⃗r(t)) liikkuu potentiaalissa V (⃗r). Sillä on liike-energia 1 2 m ˙⃗r 2 , ( ˙⃗r = d⃗r<br />

dt ) ja<br />

potentiaalienergia V (⃗r).<br />

Pienimmän vaikutuksen periaate: Massapisteen rata ⃗r(t), t ∈ [t a , t b ] minimoi (tarkemmin stationarisoi)<br />

vaikutusfunktionaalin S, joka määritellään Lagrangen funktion L aikaintegraalina:<br />

S =<br />

∫ tb<br />

(T − V ) dt. (2.11)<br />

t a<br />

} {{ }<br />

Oletetaan, että massapiste liikkuu vapaasti potentiaalissa V (⃗r). Tällöin:<br />

∫ tb<br />

( )<br />

1<br />

S =<br />

2 m ˙⃗r 2 − V (⃗r) dx , ja Euler-Lagrange:<br />

t a<br />

:=L<br />

δS = 0 ⇐⇒ 1 2 m d dt (2 ˙⃗r) + ∇V (⃗r) = 0<br />

⇐⇒ m¨⃗r = −∇V (⃗r) = ⃗ F (Newton!)<br />

Esimerkki 2.9 (1-ul.) harmoninen värähtelijä.<br />

∫ tb<br />

( 1<br />

S =<br />

t a<br />

2 mẋ2 − 1 )<br />

2 x2 dt<br />

δS = 0 ⇐⇒ mẍ = −kx , merk. k/m =ω 2<br />

⇐⇒<br />

⇐⇒<br />

ẍ = −ω 2 x<br />

A ja B määrätään ehdoista x(t a ) = x a , x(t b ) = x b .<br />

x(t) = A · sin(ωt) + B · cos(ωt)<br />

2.3.2 Yleistys monen muuttujan funktioihin<br />

Olkoon nyt y(¯x) : R n → R, y x1 := ∂y/∂x 1 jne. Nyt 1-ulotteiselle tapaukselle analoginen variaatioongelma<br />

on löytää funktionaalin<br />

∫<br />

J[y] = d n xf(y, y x1 , . . . , y xn , ¯x) , Ω ⊂ R n (2.12)<br />

Ω<br />

ääriarvot, kun y| ∂Ω (x) = y 0 (x), ts. y:n arvot alueen reunalla on kiinitetty. Varioidaan kuten aiemmin<br />

y(¯x) → y(¯x) + η(¯x), missä η(¯x) = 0, kun ¯x ∈ ∂Ω.<br />

∫<br />

J[y + η] = d n xf(y + η, y x1 + η x1 , . . . , y xn + η xn , ¯x)<br />

=<br />

Ω<br />

∫ (<br />

)<br />

J[y] + d n ∂f<br />

n∑<br />

x<br />

∂y η + ∂f<br />

η x1 + O(η 2 )<br />

∂y xi<br />

Osittaisintegroidaan summa-termiä ja käytetään divergenssiteoreemaa:<br />

=<br />

=<br />

∫<br />

∫<br />

∫<br />

Ω<br />

Ω<br />

∂Ω<br />

d n x<br />

d n x<br />

d ¯S ·<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

(<br />

Ω<br />

∂f<br />

∂y xi<br />

η x1<br />

∂<br />

∂x 1<br />

( ∂f<br />

∂y xi<br />

η<br />

η<br />

n∑<br />

i=1<br />

)<br />

)<br />

∂f<br />

ê xi −<br />

∂y xi<br />

i=1<br />

∫ (<br />

− d n x η<br />

Ω<br />

∫ (<br />

Ω<br />

d n x<br />

η<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

( ) )<br />

∂ ∂f<br />

∂x i ∂y xi<br />

( ) ) ∂ ∂f<br />

.<br />

∂x i ∂y xi


10<br />

Näistä ensimmäinen termi on 0, sillä η(¯x) ≡ 0 reunalla, joten<br />

∫ ( (<br />

J[y + η] − J[y] = d n ∂f<br />

n∑<br />

( ) ))<br />

x η<br />

∂y − ∂ ∂f<br />

∂x i ∂y xi<br />

= 0<br />

Ω<br />

⇐⇒<br />

∂f n∑<br />

∂y −<br />

i=1<br />

i=1<br />

( )<br />

∂ ∂f<br />

∂x i ∂(∂y/∂x i )<br />

Luonnollisesti tulos yleistyy monen funktion funktionaalille. Tällöin Eulerin yhtälöt ovat<br />

∂f<br />

∂y k<br />

−<br />

i=1<br />

kaikilla k = 1, . . . , n, jos<br />

∫<br />

J = J[y 1 , . . . , y k ] =<br />

= 0. (2.13)<br />

n∑<br />

(<br />

)<br />

∂ ∂f<br />

= 0 (2.14)<br />

∂x i ∂(∂y k /∂x i )<br />

Ω<br />

d n xf(y 1 , . . . , y k , . . . , ∂y l<br />

∂x m<br />

, . . . , ¯x),<br />

missä käydään läpi kaikkien funktioiden kaikki osittaisderivaatat.<br />

Esimerkki 2.10 Skalaarikenttä minkowski-avaruudessa.<br />

x 0 = ct, x 1 = x, x 2 = y ja x 3 = z sekä vaikutus<br />

∫ ( ( ) )<br />

S = dtd 3 1 ∂ϕ 2<br />

x<br />

− 1 2c ∂t 2 (∇ϕ)2 − 1 2 m2 ϕ 2 .<br />

Jolloin:<br />

δS = 0<br />

⇐⇒ −m 2 ϕ − 1 ∂ ∂ϕ<br />

c 2 ∂t ∂t + ∂2 ϕ<br />

∂x 2 + ∂2 ϕ<br />

∂y 2 + ∂2 ϕ<br />

∂z 2 = 0<br />

⇐⇒ ( 1 ∂ 2<br />

c 2 ∂t 2 − ∆)ϕ + m2 ϕ = 0 (Klein-Gordon-yhtälö!)<br />

2.4 Sidottu (Ehdollinen) variaatioprobleema<br />

Etsittävä funktionaalin (taas käydään läpi kaikki osittaisderivaatat ja x ∈ R n )<br />

∫<br />

J[y] = d n xf(y 1 , . . . , y k , . . . , ∂y l<br />

, . . . , ¯x) (2.15)<br />

∂x m<br />

stationaariset arvot ehtojen (k = 1, . . . , K)<br />

Ω<br />

ϕ k (y j , ∂y j<br />

∂x i<br />

, ¯x) := ϕ k (y 1 , . . . , y n , . . . , ∂y l<br />

∂x m<br />

, . . . , ¯x) = 0 (2.16)<br />

valitessa. Ehtoja 2.16 kutsutaan holonomisiksi, jos ϕ ei riipu y i :n derivaatoista (muuten ne ovat eiholonomisia).<br />

Taas ratkaisu löytyy Lagrangen kertojien avulla ts. tutkimalla funktionaalia<br />

∫<br />

K[y] =<br />

Ω<br />

d n x<br />

(<br />

f +<br />

K∑<br />

k=1<br />

λ k (¯x)ϕ k (y j , ∂y j<br />

∂x i<br />

, ¯x)<br />

)<br />

. (2.17)


11<br />

Stationaaristen arvojen selvittämiseksi varioidaan funktiot y j ja λ k , jolloin Euler-Lagrange yhtälöt ovat<br />

(merk. g = f + ∑ λ k ϕ k )<br />

∂g<br />

∂y j<br />

−<br />

∂g<br />

∂λ k<br />

−<br />

⇐⇒<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

∂<br />

∂x i<br />

∂<br />

∂x i<br />

Esimerkki 2.11 Sylinteri kaltevalla tasolla.<br />

∂g<br />

∂(∂y j /∂x i )<br />

∂g<br />

∂(∂λ k /∂x i )<br />

= 0 , kaikilla j sekä<br />

= 0 , kaikilla k<br />

ϕ k (y j , ∂y j<br />

∂x i<br />

, x i ) = 0 , kaikilla k<br />

Kappaleella massa m, hitausmomentti I, x-taso pinnan suuntainen (x etäisyys huipulta) ja α pinnan<br />

ja vaakatason välinen kulma:<br />

T = 1 2 mẋ2 + 1 2 I ˙θ 2<br />

V = mg(l − x)sin(α),<br />

missä l on levyn pituus ja α kulma. Sidosehtona tietysti vierimisehto ẋ = R ˙θ. On siis minimoitava<br />

S =<br />

=<br />

∫ t1<br />

∫ t1 (<br />

t 0<br />

Ldt = T − V + λ(t)(ẋ − R ˙θ)<br />

)<br />

dt<br />

t 0<br />

( 1<br />

2 mẋ2 + 1 2 I ˙θ 2 − mg(l − x)sin(α) + λ(t)(ẋ − R ˙θ)<br />

∫ t1<br />

jolle Euler-Lagrange yhtälöt ovat<br />

t 0<br />

d<br />

dt<br />

( ∂L<br />

∂ẋ<br />

d<br />

dt<br />

d<br />

dt<br />

)<br />

− ∂L<br />

Nyt 2.19 ⇒ ˙λ = I/R¨θ, sijoitetaan yhtälöön 2.18, jolloin<br />

)<br />

dt,<br />

∂x = mẍ + ˙λ − mgsin(α) = 0 (2.18)<br />

( ) ∂L<br />

∂ ˙θ<br />

− ∂L<br />

∂θ = I ¨θ − R ˙λ = 0 (2.19)<br />

( ) ∂L<br />

∂ ˙λ<br />

− ∂L<br />

∂λ = R ˙θ − ẋ = 0. (2.20)<br />

mẍ + I/R¨θ − mgsin(α) = 0.<br />

2.20:sta seuraa ¨θ = ẍ/R ja sijoittamalla tämä saatuun yhtälöön saadaan<br />

missä integroimisvakiot määrätään alkuehdoista.<br />

2.5 Isoperimetrinen ongelma<br />

(m + I/R 2 )ẍ = mgsin(α)<br />

=⇒ x(t) = 1 mgsin(α)<br />

2 m + I/R 2 t2 + v 0 t + x 0 ,<br />

Vastaa sidottua variaatio-ongelmaa, mutta sidosehtona on toinen funktionaali. Toisin sanoen, mitkä<br />

ovat funktionaalin<br />

J[y] =<br />

∫ b<br />

a<br />

dxf(y, y ′ , x) (2.21)


12<br />

ääriarvot, kun vaaditaan, että<br />

K[y] =<br />

∫ b<br />

a<br />

dxg(y ′ , y, x) = C = vakio. (2.22)<br />

Tämä(kin!) ratkeaa kätevimmin Lagrangen kertojien avulla, tosin nyt kerroin on luku eikä funktio.<br />

Etsittävä funktionaalin<br />

L λ [y] = J[y] + λ(K[y] − C) (2.23)<br />

stationaariset pisteet. Eulerin yhtälöt tälle ovat:<br />

∂(f + λg)<br />

− d<br />

∂y dx<br />

∂(f + λg)<br />

∂y ′ = 0<br />

∂L λ<br />

∂λ = K[y] − C = 0<br />

Esimerkki 2.12 Yhdistettävä pisteet (a, 0) ja (b, 0) annetun pituisella käyrällä (y ≥ 0) s.e. käyrän ja<br />

x-akselin rajoittama pinta-ala on mahdollisimman suuri.<br />

Nyt 2.21, 2.22 ja 2.23 ovat vastaavasti<br />

Jolloin Eulerin yhtälöstä<br />

J[y] =<br />

K[y] =<br />

L λ [y] =<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

y(x)dx<br />

( )<br />

λ d y ′<br />

√ = 1<br />

dx 1 + (y ′ ) 2<br />

=⇒<br />

√<br />

1 + (y ′ ) 2 dx = l<br />

y ′<br />

√<br />

1 + (y ′ ) 2 = λ−1 (x − C 1 )<br />

y(x) + λ √ 1 + (y ′ ) 2 dx − λl.<br />

⇐⇒ dy<br />

dx = ± x − C<br />

√ 1<br />

λ 2 − (x − C 1 ) = ± d √<br />

λ 2 dx<br />

2 − (x − C 1 ) 2<br />

=⇒ y − C 2 = ± √ λ 2 − (x − C 1 ) 2<br />

=⇒ (x − C 1 ) 2 + (y − C 2 ) 2 = λ 2 (2.24)<br />

2.24 on ympyrän yhtälö. Lisäki y(a) = y(b) = 0, joten (muutaman välivaiheen jälkeen)<br />

C 1 = a + b<br />

√<br />

ja C 2 = − λ<br />

2<br />

2 (b − a)2<br />

− .<br />

4<br />

Lisäksi λ määräytyy ehdosta<br />

∫ b<br />

dx<br />

K[y] = λ √<br />

λ 2 − (x − C 1 ) 2<br />

= λ<br />

a<br />

∫ (b−a)/2λ<br />

−(b−a)/2λ<br />

sij. t = (x − C 1 )/λ<br />

( )<br />

dt<br />

(b − a)<br />

√ = 1 − t 2 2λsin−1 = l. (2.25)<br />


13<br />

2.6 Toinen variaatio<br />

Tässä luvussa johdamme välttämättömän ehdon sille, että funktionaalin<br />

J[y] =<br />

∫ b<br />

a<br />

f(y, y ′ , x)dx (2.26)<br />

stationaarinen piste y 0 = y 0 (x) (ts. Eulerin yhtälön ratkaisu) on minimi tai maksimi. Oletetaan,<br />

että f:n toiset osittaisderivaatat y:n ja y’:n suhteen ovat jatkuvia. Lasketaan J pisteessä y = y(x) =<br />

y 0 (x) + αη(x), missä α on ”pieni” ja η(a) = η(b) = 0:<br />

J[y 0 + αη]<br />

∫ b<br />

( ∂f<br />

= J[y 0 ] + α<br />

a ∂y − d )<br />

∂f<br />

dx ∂y ′ η(x)dx<br />

y=y } {{ } 0<br />

=0 (Euler)<br />

+ 1 ∫ b<br />

( ∂ 2 )<br />

f<br />

2 α2 a ∂y 2 η2 (x) + 2 ∂2 f<br />

∂y∂y ′ η(x)η′ (x) +<br />

∂2 f<br />

∂(y ′ ) 2 (η′ (x)) 2 dx<br />

y=y<br />

} {{ 0<br />

}<br />

δ 2 J<br />

+ O(α 3 ).<br />

Huomataan 2ηη ′ = (η 2 ) ′ ja osittaisintegroidaan δ 2 J:n keskimmäinen termi jolloin saadaan ”toinen<br />

variaatio”<br />

∫ b<br />

(<br />

δ 2 J = α2 ∂ 2 f<br />

2 a ∂y 2 − d ∂ 2 ) (<br />

f<br />

∂<br />

dx ∂y∂y ′ η 2 2 )<br />

f<br />

+<br />

y=y } {{ } 0<br />

∂(y ′ ) 2 (η ′ ) 2 dx.<br />

y=y } {{ } 0<br />

=:S(x)<br />

=:R(x)<br />

Jos nyt oletamme, että y 0 antaa J:n minimin, tällöin tietysti δ 2 J ≥ 0 kaikilla η(x). Väitämme, että<br />

tällöin on välttämättä oltava R(x) ≥ 0, a < x < b.<br />

Tehdään vastaoletus: löytyy x = c ∈ (a, b) s.e. R(c) < 0. Koska R on jatkuva, on olemassa δ s.e.<br />

R(x) < 0 kaikilla c − δ ≤ x ≤ c + δ. Valitaan ɛ s.e. 0 < ɛ < δ ja määritellään<br />

η(x) = (x − (c − ɛ)) 2 (x − (c + ɛ)) 2 , x ∈ [c − ɛ, c + ɛ] , 0 muuten.<br />

Valitsemalla ɛ tarpeeksi pieneksi saamme<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

S(x)η 2 (x)dx ≈ S(c)<br />

R(x)(η ′ ) 2 (x)dx ≈ R(c)<br />

∫ c+ɛ<br />

c−ɛ<br />

∫ c+ɛ<br />

Valitsemalla ɛ riittävän pieneksi (ɛ 9


14<br />

2.7 Funktionaaliderivaatta<br />

Variaatiolaskenta voidaan muotoilla tavallista differentiaalilaskentaa vastaavaan muotoon funktionaaleille<br />

F [y], joiden määrittelyjouko on funktioavaruus S (nopeasti häviävät funktiot) tai K (kompaktin<br />

kantajan funktiot). Määritellään tätä varten δ-jono:<br />

Määritelmä 2.3 Funktiot δ 1 (x), δ 2 (x),... muodostavat δ-jonon jos<br />

1)<br />

∫ ∞<br />

2) lim<br />

n→∞<br />

dxδ n (x) = 1<br />

−∞<br />

∫ ∞<br />

−∞<br />

∀ n ∈ N<br />

dxf(x)δ n (x) = f(0)<br />

, kun f ∈ K tai f ∈ S<br />

δ-jonoja on useita, esimerkiksi<br />

⎧<br />

⎨ 0 , x < −(2n) −1<br />

1) δ n (x) = n , −(2n) −1 ≤ x ≤ (2n) −1<br />

⎩<br />

0 , (2n) −1 < x<br />

2) δ n (x) = √ n e −n2 x 2<br />

π<br />

3) δ n (x) = sin(nx)<br />

πx<br />

4) δ n (x) = n 1<br />

π 1 + n 2 x 2 .<br />

Haluamme tietää kuinka paljon F [y] muuttuu, kun y(x) muutetaan hieman x = x ′ :n ympäristössä.<br />

Tavanomaiselle tapaukselle analogisesti määritellään funktionaaliderivaatta:<br />

Määritelmä 2.4 (Funktionaaliderivaatta)<br />

Ja tästä heti muutama esimerkki:<br />

δF<br />

δy(x ′ ) = lim lim 1 (<br />

F [y + ɛδn (x − x ′ )] − F [y] ) (2.30)<br />

n→∞ ɛ→0 ɛ<br />

Esimerkki 2.13<br />

F 1 [y] =<br />

F 1 [y + ɛδ n (x − x ′ )] =<br />

=<br />

∫ ∞<br />

−∞<br />

∫ ∞<br />

dx[y(x)] p + ɛp<br />

−∞<br />

∫ ∞<br />

−∞<br />

∫ ∞<br />

dx[y(x)] p p ≥ 1<br />

dx[y(x) + ɛδ n (x − x ′ )] p<br />

−∞<br />

dxy p−1 (x)δ n (x − x ′ ) + O(ɛ 2 ),<br />

joten<br />

(<br />

F1 [y + ɛδ n (x − x ′ )<br />

)] − F 1 [y]<br />

ɛ<br />

=⇒ δF 1<br />

δy(x ′ )<br />

−→<br />

ɛ→0<br />

∫ ∞<br />

p dxy p−1 (x)δ n (x − x ′ )<br />

−∞<br />

−→<br />

n→∞ pyp−1 (x ′ )<br />

= py p−1 (x ′ )


15<br />

Esimerkki 2.14<br />

F 1 [y + ɛδ n (x − x ′ )] − F 1 [y]<br />

ɛ<br />

F 2 [y] =<br />

−→<br />

ɛ→0<br />

−→<br />

n→∞<br />

∫ ∞<br />

p<br />

−∞<br />

∫ ∞<br />

−∞<br />

dx[y ′ (x)] p p ≥ 1<br />

dx[y ′ (x)] p−1 δ ′ n(x − x ′ )<br />

∫ ∞<br />

p dx[y ′ (x)] p−1 δ ′ (x − x ′ )<br />

−∞<br />

= −p d<br />

dx [y′ (x)] p−1 ∣<br />

∣∣∣x=x<br />

′<br />

= −p(p − 1)[y ′ (x ′ )] p−2 y ′′ (x ′ )<br />

Huomaa (mm. yo. esimerkeissä), että käytännössä voidaan käyttää<br />

δF<br />

δy(x ′ ) = lim<br />

ɛ→0<br />

F [y + ɛδ(x − x ′ )] − F [y]<br />

, (2.31)<br />

ɛ<br />

kunhan sovitaan, että F [y(x) + ɛδ(x − x ′ )] kehitetään vain 1. kertaluvun tarkkuudella ɛ:n suhteen.<br />

Luonnollinen kysymys: milloin δJ/δy = 0, kun J on kuten 2.26:ssa ja miten se on tulkittava?<br />

J[y] =<br />

=⇒ δJ<br />

δy(x ′ )<br />

=<br />

=<br />

∫ ∞<br />

−∞<br />

∫ ∞<br />

−∞<br />

f(y, y ′ , x)dx<br />

dx<br />

( ∂f<br />

∂y − d<br />

dx<br />

[ ∂f<br />

∂y δ(x − x′ ) + ∂f<br />

∂y ′ δ′ (x − x ′ )<br />

∂f<br />

∂y ′ )x=x ′<br />

Eli ehto δF/δy = 0 on ekvivalentti aiemmin saadun Eulerin yhtälön kanssa, kuten tietysti kuuluukin.<br />

2.8 Ritzin menetelmä<br />

Menetelmä variaatio-ongelman<br />

∫<br />

J[y] =<br />

Ω<br />

d n xf(y, y x1 , . . . , y xn , ¯x) , Ω ⊂ R n (2.32)<br />

likimääräiselle ratkaisemiselle, s.o. menetelmä etsiä Eulerin osittaisdifferentiaaliyhtälön<br />

∂f<br />

n∑<br />

( )<br />

∂y − ∂ ∂f<br />

= 0 (2.33)<br />

∂x i ∂(∂y/∂x i )<br />

likimääräinen ratkaisu, kun y| ∂Ω = g on annettu. Ritzin menetelmä:<br />

i=1<br />

1) Etsitään N riippumatonta ratkaisua ϕ 1 , . . . , ϕ N , jotka toteuttavat ϕ i | ∂Ω = g kaikilla i = 1, . . . , N.<br />

2) Ratkaisuyrite: u N (x) = ∑ N<br />

i=1 a iϕ i (x).<br />

3) Lasketaan J[u] = j(a 1 , a 2 , . . . , a n ).<br />

4) Etsitään funktion j stationaariset pisteet (ā 1 , ā 2 , . . . , ā N ) luvun 2.1 menetelmin (myös min. max.<br />

tarkastelu).<br />

5) Likim. ratkaisu on ū N (x) = ∑ N<br />

i=1 āiϕ i (x) ja J[ū N ] = j(ā 1 , ā 2 , . . . , ā N )<br />

Esimerkki 2.15 Poisson yhtälö (ρ annettu).<br />

Ratkaistaan<br />

∆u = ρ(x, y) (2.34)<br />

]


16<br />

likimääräisesti yksikköneliössä Ω = (0, 1) × (0, 1), kun u(x, y) = 0 reunalla. Huomataan, että 2.34 on<br />

Eulerin yhtälö funktionaalille<br />

∫ 1 ∫ (<br />

1<br />

(∂u ) 2 ( ) ∂u 2<br />

J[u] = dxdy + + 2ρ(x, y)u(x, y))<br />

∂x ∂y<br />

Euler :<br />

Yritefunktioiksi ϕ i voidaan valita esim.<br />

0<br />

0<br />

∂ ∂f<br />

+ ∂ ∂f<br />

− ∂f<br />

∂x ∂u x ∂y ∂u y ∂u = 2u xx + 2u yy − 2ρ(x, y) = 0<br />

ϕ 1 (x, y) = xy(1 − x)(1 − y) , (selvästi ϕ| ∂Ω = 0)<br />

0<br />

ϕ 2 (x, y) = xϕ 1 (x, y) , ϕ 3 (x, y) = yϕ 1 (x, y)<br />

ϕ 4 (x, y) = x 2 ϕ 1 (x, y) , ϕ 5 (x, y) = y 2 ϕ 1 (x, y)<br />

ϕ 6 (x, y) = xyϕ 1 (x, y)<br />

0<br />

i,j<br />

jne. jne.<br />

niin pitkälle kuin sielu sietää. Nyt yrite on u N (x, y) = ∑ N<br />

i=1 a iϕ i (x) ja<br />

⎛<br />

∫ 1 ∫ 1<br />

N∑<br />

(<br />

J[u N ] = dxdy ⎝ ∂ϕi ∂ϕ j<br />

a i a j<br />

∂x ∂x + ∂ϕ )<br />

i ∂ϕ j<br />

+ 2<br />

∂y ∂y<br />

missä<br />

=<br />

N∑<br />

N∑<br />

A ij a i a j + 2 b i a i = j(a 1 , a 2 , . . . , a N ),<br />

i,j<br />

A ij =<br />

b i =<br />

Etsitään j:n stationaariset pisteet:<br />

∫ 1 ∫ 1<br />

0 0<br />

∫ 1 ∫ 1<br />

0<br />

0<br />

∂j<br />

∂a i<br />

=<br />

i<br />

( ∂ϕi ∂ϕ j<br />

dxdy<br />

∂x ∂x + ∂ϕ i<br />

∂y<br />

⎞<br />

N∑<br />

a i ϕ i ρ⎠<br />

i<br />

)<br />

∂ϕ j<br />

= A ji (2.35)<br />

∂y<br />

dxdyρ(x, y)ϕ i (x, y) (2.36)<br />

N∑<br />

(A ij a j + A ji a j ) + 2b i<br />

j<br />

⎛<br />

= 2 ⎝b i +<br />

kun A ij :t ja b i :t kerätään matriiseiksi. Ratkaisu on siis<br />

ū(x, y) =<br />

N∑<br />

j<br />

A ij a j<br />

⎞<br />

⎠ = 0<br />

⇐⇒ Aa = −b, (2.37)<br />

ā = −A −1 b ts. a i = −<br />

N∑<br />

(A −1 ) ij b j (2.38)<br />

j=1<br />

N∑<br />

ā i ϕ i (x, y) (2.39)<br />

i=1<br />

Matriisien alkioiden laskeminen ja matriisin kääntäminen onnistuu helposti tietokoneella.


17<br />

3 Sturm-Liouville-Teoria<br />

3.1 Perusominaisuudet<br />

Yleinen Sturm-Liouville (S-L) yhtälö 2<br />

(<br />

d<br />

p(x) du(x) )<br />

+ (−q(x) + λw(x)) u(x) = 0, a ≤ x ≤ b. (3.1)<br />

dx dx<br />

Sallitaan myös arvot a = −∞, b = ∞. Lisäksi kerroinfunktioilta vaaditaan<br />

1) p(x),q(x),w(x) reaalisia.<br />

2) q ja w vähintään jatkuvia.<br />

3) p jatkuvasti derivoituva ja p(x) ≠ 0, x ∈ (a, b) sekä p(x) > 0. (Tarvittaessa yhtälö kerrotaan -1:llä.)<br />

4) w(x) > 0 x ∈ [a, b]. (Tarvittaessa λ → −λ.)<br />

Lisäksi<br />

jos a ≠ −∞, b ≠ ∞ ja p(a) ≠ 0 ≠ p(b), niin kyseessä on säännöllinen S-L ongelma.<br />

Jos p(a) = 0 ja/tai p(b) = 0, S-L ongelma on singulaarinen, samoin jos a = −∞ ja/tai b = ∞.<br />

(3.1):n lisäksi asetetaan homogeeniset reunaehdot:<br />

Säännöllinen S-L:<br />

Singulaarinen S-L:<br />

A 1 u(a) + A 2 u ′ (a) = 0 (A 1 , A 2 ) ≠ (0, 0) (3.2)<br />

B 1 u(b) + B 2 u ′ (b) = 0 (B 1 , B 2 ) ≠ (0, 0) (3.3)<br />

p(a) ≠ 0, p(b) = 0 : (3.2) sekä |u(b)| < ∞ (3.4)<br />

p(a) = 0, p(b) ≠ 0 : (3.3) sekä |u(b)| < ∞ (3.5)<br />

p(a) = 0, p(b) = 0 : |u(x)| < ∞, a < x < b. (3.6)<br />

Osoittautuu, että S-L yhtälöllä 3.1 on tilanteen mukaisilla reunaehdoilla nollasta eroavia ratkaisuja<br />

vain tietyillä λ = λ k . Näitä kutsutaan Sturm-Liouville-operaattorin<br />

L := − d<br />

dx p(x) d + q(x) (3.7)<br />

dx<br />

ominaisarvoiksi (engl. eigenvalues). Vastaavat ratkaisut u k ovat (vakiokerrointa vaille) ominaisarvoja<br />

vastaavat ominaisfunktiot (engl. eigenfunctions). Huomaa, että myös vakiolla kerrottu u k ratkaisee<br />

S-L:n:<br />

Lu = λ k wu k =⇒ LCu = λ k wCu k .<br />

On hyödyllistä huomata, että mikä tahansa 2-kertaluvun DY voidaan muuttaa S-L-yhtälöksi, toisin<br />

sanoen mikä tahansa operaattori<br />

L = a 2 (x) d2<br />

dx 2 + a 1(x) d<br />

dx + a 0(x) (3.8)<br />

2 q:n etumerkki Cronströmin kirjan mukainen. Esimerkiksi Arfken ja Weber käyttää +-etumerkkiä.


18<br />

voidaan kirjoittaa muodossa L = ϕ(x)L. Kuinka?<br />

ϕ(x)L = −ϕ(x)p(x) d2<br />

dx 2 − ϕ(x)p′ (x) d<br />

dx + ϕ(x)q(x)<br />

=⇒ p′ (x)<br />

p(x) = a 1(x)<br />

a 2 (x)<br />

(∫ x<br />

=⇒ p(x) = exp<br />

=⇒ ϕ(x) = − a 2(x)<br />

p(x) = −a 2(x)exp<br />

a 1 (x ′ )<br />

)<br />

x 0<br />

a 2 (x ′ ) dx′ ( ∫ x<br />

−<br />

a 1 (x ′ )<br />

)<br />

x 0<br />

a 2 (x ′ ) dx′<br />

=⇒ q(x) = a 0(x)<br />

ϕ(x) = −a 0(x)<br />

a 2 (x) exp (∫ x<br />

x 0<br />

a 1 (x ′ )<br />

a 2 (x ′ ) dx′ )<br />

3.1.1 Erikoisfunktiot ja Sturm-Liouville yhtälöt<br />

Legendren polynomit<br />

Legendren liittofunktiot<br />

− d [<br />

(1 − x 2 ) dP ]<br />

l(x)<br />

= l(l + 1)P l (x) (3.9)<br />

dx<br />

dx<br />

a = −1, b = 1, p(x) = 1 − x 2 , q(x) = 0, w(x) = 1, λ = l(l + 1)<br />

− d<br />

dx<br />

[(1 − x 2 ) dP l<br />

m<br />

dx<br />

]<br />

(x)<br />

+ m<br />

1 − x 2 P l<br />

m (x) = l(l + 1)Pl m (x) (3.10)<br />

a = −1, b = 1, p(x) = 1 − x 2 , q(x) = m2<br />

, w(x) = 1, λ = l(l + 1)<br />

1 − x2 Besselin funktiot (R > 0 J ν :n 0-kohta, ξ = x/R ∈ [0, 1])<br />

[<br />

d<br />

ξ dJ ]<br />

ν(ξR)<br />

+ ν2<br />

dξ dξ ξ J ν(ξR) = R 2 ξJ ν (ξR) (3.11)<br />

Laguerren polynomit<br />

Laguerren liittopolynomit<br />

Hermiten polynomit<br />

a = 0, b = 1, p(ξ) = ξ, q(ξ) = ν2<br />

, w(ξ) = ξ, λ = R2<br />

ξ<br />

− d [<br />

xe −x dL ]<br />

n<br />

= ne −x L n (x) (3.12)<br />

dx dx<br />

a = 0, b = ∞, p(x) = xe −x , q(x) = 0, w(x) = e −x , λ = n<br />

− d (<br />

)<br />

x k+1 e −x dLk l<br />

= x k e −x nL k<br />

dx dx<br />

n(x) (3.13)<br />

a = 0, b = ∞, p(x) = x k+1 e −x , q(x) = 0, w(x) = x k e −x , λ = n<br />

− d [<br />

e dH ]<br />

−x2 n<br />

= 2ne −x2 H n (x) (3.14)<br />

dx dx<br />

a = −∞, b = ∞, p(x) = e −x2 , q(x) = 0, w(x) = e −x2 , λ = 2n


19<br />

3.1.2 Yksinkertainen esimerkki S-L ongelmasta<br />

d 2 u<br />

+ λu = 0 (3.15)<br />

dx2 Eli S-L yhtälö, missä p(x) = 1, q(x) = 0, w(x) = 1. Asetetaan vielä reunaehdot u(0) = u(π) = 0. Millä<br />

λ:n arvoilla löydetään 0:sta eroavia ratkaisuja? (3.15):n yleinen ratkaisu on<br />

jolloin reunaehdoista seuraa<br />

u(x) = C 1 e √ −λx + C 2 e −√ −λx ,<br />

C 1 + C 2 = 0 (x = 0)<br />

e √ −λπ C 1 + e −√ −λπ C 2 = 0 (x = π)<br />

Yhtälöparilla on 0:sta eroavia ratkaisuja vain jos kerroindeterminantti on nolla<br />

1 1<br />

∣ e √ −λπ<br />

e −√ −λπ ∣ = e√ −λπ − e −√−λπ = 0<br />

⇐⇒ e 2√ −λπ = 1<br />

=⇒ 2 √ −λπ = 2nπi , n ∈ Z<br />

=⇒ λ n = n 2<br />

Vastaavat ominaisfunktiot (merk. C 1 = C/(2i) (⇒ C 2 = −C/(2i)) ovat<br />

u n = C 2i<br />

(<br />

e inx − e −inx) = Csin(x) (3.16)<br />

Lisäksi huomataan, että n = 0, u 0 ei ole ratkaisu ja -n ja n antavat saman λ n :n, jota vastaavat u n ja<br />

u −n = −u n eivät ole lineaarisesti riippumattomat, eli ratkaisu:<br />

Huomioita:<br />

• Ominaisarvot reaalisia.<br />

Ominaisarvot λ n = n 2<br />

Ominaisfunktiot u n = sin(nx)<br />

• Ominaisarvot alhaalta, muttei ylhäältä rajoitettuja<br />

, n ∈ N<br />

• Jokaista ominaisarvoa vastaa yksi ominaisfunktio. Jos useampia lin. riippumattomia,<br />

niin ominaisarvo on degeneroitunut.<br />

• u n :llä n-1 nollakohtaa välillä (a, b).<br />

• u n+1 :llä täsmälleen yksi nollakohta u n :n kahden peräkkäisen 0-kohdan välillä.<br />

• Eri ominaisarvoihin liittyvät ominaisfunktiot ortogonaalisia (L 2 :ssa), ts. m ≠ n ⇒<br />

∫ b<br />

a u n(x)u m (x)dx = 0 (w(x)=1).<br />

• Ominaisfunktiot u n , n = 1, 2, . . . muodostavat täydellisen funktiojoukon (FyMM Ib).<br />

”Mikä tahansa” F voidaan kehittää F (x) = ∑ a k u k (x) (Fourier’n sinisarja).


20<br />

3.2 Itseadjungoidut operaattorit<br />

Kompleksiarvoisille funktioille voidaan määritellä skalaaritulo eli sisätulo<br />

〈f|g〉 =<br />

∫ b<br />

a<br />

f ∗ (x)g(x)dx (3.17)<br />

Nyt jokaiselle lineaariselle operaattorille A voidaan määritellä adjungoitu operaattori A † , jolle<br />

kaikille annetut reunaehdot toteuttaville f ja g.<br />

Esimerkki 3.1 A = d<br />

dx<br />

, reunaehdot f(a) = f(b) = 0.<br />

〈f|Ag〉 =<br />

〈f|Ag〉 = 〈A † f|g〉 (3.18)<br />

∫ b<br />

a<br />

/ b<br />

a<br />

f ∗ (x) dg(x)<br />

dx<br />

dx<br />

= f ∗ g −<br />

} {{ }<br />

0<br />

∫ b<br />

a<br />

df ∗ (x)<br />

dx<br />

g(x)dx<br />

= −〈 df<br />

dx |g〉 =⇒ A† = − d<br />

dx<br />

Esimerkki 3.2 A = d2<br />

dx 2 , reunaehdot f(a) = f(b) = 0.<br />

〈f|Ag〉 =<br />

∫ b<br />

a<br />

/ b<br />

a<br />

f ∗ (x) d2 g(x)<br />

dx 2 dx<br />

= f ∗ dg −<br />

dx<br />

} {{ }<br />

0<br />

/ b<br />

df ∗<br />

= −<br />

a<br />

dx g<br />

} {{ }<br />

0<br />

∫ b<br />

a<br />

∫ b<br />

+<br />

a<br />

df ∗ (x)<br />

dx<br />

= 〈Af|g〉 =⇒ A † = A<br />

dg(x)<br />

dx<br />

dx<br />

d 2 f ∗ (x)<br />

dx 2 g(x)dx<br />

Operaattori A, jolle A † = A, kuten yo. esimerkissä on itseadjungoitu eli hermiittinen. Matemaatikot<br />

tosin tekevät eron näiden käsitteiden välillä liittyen operaattoreiden määrittelyjoukkoihin (palataan<br />

myöhemmin). S-L-operaattorille (3.1) (p(x),q(x) reaalisia) pätee<br />

〈Lu|v〉 − 〈u|Lv〉 =<br />

ja lisäksi ”Lagrangen identiteetti” (FyMM IIa):<br />

Yhdistämällä nämä saadaan<br />

Reunaehdot:<br />

∫ b<br />

v(Lu) ∗ − u ∗ (Lv) = vLu ∗ − u ∗ Lv = d<br />

dx<br />

〈Lu|v〉 − 〈u|Lv〉 = −<br />

a<br />

/ a<br />

b<br />

v(Lu) ∗ − u ∗ (Lv)dx. (3.19)<br />

[<br />

)]<br />

−p(x)<br />

(v du∗ dv<br />

− u∗ . (3.20)<br />

dx dx<br />

)<br />

p(x)<br />

(v du∗ dv<br />

− u∗ . (3.21)<br />

dx dx


21<br />

1) Säännöllinen S-L ongelma<br />

A 1 u ∗ (a) + A 2 u ′ (a) ∗ = 0<br />

A 1 v(a) + A 2 v ′ (a) = 0.<br />

Olkoon ensin A 2 ≠ 0, jolloin u ′ (a) ∗ = −A 1 /A 2 u ∗ (a) ja v ′ (a) = −A 1 /A 2 v(a) ja<br />

v(a)u ′ (a) ∗ − u(a) ∗ v ′ (a) = − A 1<br />

A 2<br />

(v(a)u(a) ∗ −u(a) ∗ v(a)) = 0.<br />

Jos taas A 2 = 0, A 1 ≠ 0, niin reunaehto on u(a) = v(a) = 0 jolloin<br />

Vastaavalla tavalla päätellään, että<br />

2) Singulaarinen S-L ongelma<br />

v(a)u ′ (a) ∗ −u(a) ∗ v ′ (a) = 0. (3.22)<br />

v(b)u ′ (b) ∗ − u(b) ∗ v ′ (b) = 0. (3.23)<br />

• p(b) = 0, jolloin 3.2:sta seuraa<br />

/ a )<br />

− p(x)<br />

(v du∗ dv<br />

− u∗ = 0 · (v(b)u ′ (b) ∗ − u(b) ∗ v ′ (b)) − p(a) · 0 = 0.<br />

b<br />

dx dx<br />

• p(a) = 0, jolloin 3.3:sta seuraa<br />

/ a )<br />

− p(x)<br />

(v du∗ dv<br />

− u∗ = 0 · p(b) − 0 · (v(a)u ′ (a) ∗ − u(a) ∗ v ′ (a)) = 0.<br />

b<br />

dx dx<br />

• p(a) = p(b) = 0, jolloin sijoitustermi on triviaalisti 0.<br />

Kaikissa tapauksissa siis<br />

〈Lu|v〉 = 〈u|Lv〉, (3.24)<br />

eli S-L-operaattori on itseadjungoitu luvun alussa annetuilla reunaehdoilla. Huomaa, että muilla reunaehdoilla<br />

näin ei välttämättä ole. Lopuksi vielä pari huomiota, jotka ovat osa Sturmin-Liouvillen<br />

lausetta (seuraava kappale).<br />

Lause 3.1 Itseadjungoidun differentiaalioperaattorin ominaisarvot ovat reaalisia<br />

Todistus 3.1 Olkoon ϕ ominaisfunktio, jolloin<br />

mistä väite tietysti seuraa.<br />

Lϕ = λwϕ<br />

(3.24) =⇒ 〈Lϕ|ϕ〉 − 〈ϕ|Lϕ〉 = 0<br />

=⇒ λ ∗ 〈wϕ|ϕ〉 − λ〈ϕ|wϕ〉 = 0<br />

=⇒ (λ ∗ − λ)<br />

∫ b<br />

a<br />

dxw(x)|ϕ(x)| 2 = 0<br />

w(x) > 0 =⇒ λ ∗ − λ = 0, (3.25)<br />

Lause 3.2 Kahteen erisuureen ominaisarvoon liittyvät ominaisfunktiot ovat (tietyssä mielessä) ortogonaaliset.


22<br />

Todistus 3.2 Olkoon ϕ 1 ja ϕ 2 kahteen erisuureen ominaisarvoon λ 1 ja λ 2 liittyvät ominaisfunktiot.<br />

Nyt (vrt. edellisen lauseen todistus)<br />

λ 1 ≠ λ 2 =⇒<br />

〈Lϕ 1 |ϕ 2 〉 − 〈ϕ 1 |Lϕ 2 〉 = 0<br />

=⇒(λ 1 − λ 2 )<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

dxw(x)ϕ 1 (x) ∗ ϕ 2 (x) = 0<br />

dxw(x)ϕ 1 (x) ∗ ϕ 2 (x) = 0<br />

eli<br />

〈 √ wϕ 1 | √ wϕ 2 〉 = 0. (3.26)<br />

Tyypillisempää on muuttaa Hilbert-avaruuden 3 L 2 [a, b] sisätuloa S-L ongelmaan sopivampaan muotoon<br />

(f|g) :=<br />

∫ b<br />

a<br />

dxw(x)f(x) ∗ g(x), (3.27)<br />

jolloin ominaisfunktiot ovat ortogonaalisia perinteisessä mielessä, kun ne tulkitaan painotetun L 2 -<br />

avaruuden alkioiksi, missä kaava (3.27) määrää sisätulon.<br />

3.3 Sturmin ja Liouvillen lause<br />

Lause 3.3 (Sturm & Liouville) Säännöllisen Sturm-Liouville-yhtälön Lu = λwu ratkaisuilla on<br />

ainakin seuraavat ominaisuudet:<br />

1. Ratkaisuja on olemassa (vain) kun λ = λ k , missä λ k , k = 1, 2, 3, . . . on ääretön jono reaalisia<br />

ominaisarvoja (λ k < λ k+1 ) ja λ k → ∞, kun k → ∞.<br />

2. Jokaista ominaisarvoa vastaa vakiokerrointa vaille yksikäsitteinen ratkaisu u k (”ominaisfunktio”).<br />

3. Ominaisfunktiot ovat ortogonaalisia sisätulon (3.27) suhteen.<br />

4. Ominaisfunktiolla u n on täsmälleen n 0-kohtaa välillä [a,b]. Ominaisfunktion u n+1 jokainen 0-<br />

kohta on kahden u n :n peräkkäisen 0-kohdan välissä.<br />

5. Ominaisfunktioiden joukko muodostaa kannan avaruuteen L 2 ([a, b]) eli jos f ∈ L 2 ([a, b]) ts. f on<br />

neliöintegroituva kyseisellä välillä ja<br />

a k = (u k|f)<br />

(u k |u k ) = ∫ b<br />

a dxw(x)u k(x)f(x)<br />

∫ b<br />

a dxw(x)(u k(x)) 2 ,<br />

niin<br />

∫ b<br />

lim<br />

N→∞ a<br />

∫ b<br />

a<br />

N dx<br />

∣ f(x) − ∑<br />

a k u k (x)<br />

∣<br />

k=1<br />

∞ dx<br />

∣ f(x) − ∑<br />

a k u k (x)<br />

∣<br />

k=1<br />

2<br />

2<br />

=0, eli<br />

=0.<br />

Siis f ja yo. sarjakehitelmä ovat sama funktio L 2 -mielessä.<br />

3 Näistä lisää myöhemmin


23<br />

Lauseen tarkka todistus löytyy oppikirjoista (Esim. N. Young: An Introduction to Hilber Space, Cambridge<br />

University Press, 1988).<br />

FyMM I:llä esitetty Parsevalin kaava Fourier-sarjoille yleistyy Sturmin-Liouvillen lauseen avulla myös<br />

S-L yhtälön ominaisfunktioille:<br />

(f|f) =<br />

=<br />

=<br />

=<br />

∫ b<br />

a<br />

dxw(x)|f(x)| 2<br />

∞∑<br />

a ∗ k a l<br />

k,l=1<br />

∫ b<br />

a<br />

∞∑<br />

(u k |u k )|a k | 2<br />

k=1<br />

dxw(x)u ∗ k u l<br />

∞∑<br />

||u k || 2 |a k | 2 , (3.28)<br />

k=1<br />

missä on otettu käyttöön myös sisätulon (·|·) määräämä normi.<br />

Pyritään tässä todistamaan 0-kohtien olemassaolo, eli 1-kohta, niin 4-kohta seuraa todistuksesta itsestään.<br />

Kohdat 2 ja 3 todistimme jo aiemmin. Tätä varten muutetaan S-L yhtälö Lu = λwu sijoituksella<br />

z(x) = √ p(x)u(x) muotoon<br />

d 2 z(x)<br />

dx 2 + (Q(x) + λR(x)) z(x) = 0, missä (3.29)<br />

Q(x) = 1 (<br />

(p ′<br />

4p(x) 2 (x)) 2 − 2p(x)p ′ (x) − 4p(x)q(x) )<br />

ja<br />

R(x) = w(x)<br />

p(x) . (3.30)<br />

Huomaa, että kerroinfunktioille asetetuista ehdoista seuraa, että Q ja R hyvin määriteltyjä ja jatkuvia<br />

sekä lisäksi R(x) ≥ 0. Cronströmin ($ 6.4.1-2) todistuksen rakenne:<br />

1. Kiinnitetään λ ∈ C ja ratkaistaan 3.29 alkuehtona z(a) = 0, z ′ (a) = 1, josta saadaan ratkaisu<br />

z(λ, x) (Diff.yhtälöiden olemassaolo- ja yksikäsitteisyyslause).<br />

2. Osoitetaan, että kiinteällä x z(λ, x) on λ:n kokonainen funktio (ei napoja tai muita singulariteettejä).<br />

3. Huomataan, että jos λ on ominaisarvo, niin z(λ, b) = 0.<br />

4. Funktioteoriasta tuttu lause: Nollasta eroavalla kokonaisella funktiolla on korkeintaa numeroituva<br />

määrä 0-kohtia. Lisäksi ∞ on ainoa mahdollinen kasautumispiste. Eli jos ominaisarvoja on<br />

ääretön määrä, niin ne voidaan järjestää jonoon s.e. |λ k | → ∞.<br />

5. Tiedetään jo, että λ k ∈ R, joten osoitetaan että on olemassa ¯λ s.e. ¯λ < λ n kaikilla n, jolloin<br />

λ 1 < λ 2 < λ 3 < . . ., kun ominaisarvot numeroidaan sopivasti.<br />

Todistetaan tässä sama tulos käyttämättä funktioteoriaa (ja huomataan samalla tapa laskea ominaisarvoja<br />

numeerisesti). Todistetaan ensin muutama aputulos.<br />

Lause 3.4 (1. nollakohtalause) Olkoot y(x) ja Y(x) differentiaaliyhtälöiden<br />

d 2 y(x)<br />

dx 2 + q(x)y(x) = 0 ja<br />

d 2 Y (x)<br />

dx 2 + Q(x)Y (x) = 0<br />

ratkaisuja. Jos nyt a ja b (a < b) ovat kaksi ratkaiun Y 0-kohtaa (Y (a) = Y (b) = 0) ja kaikilla<br />

x ∈ [a, b] pätee q(x) ≥ Q(x) eikä yhtäsuuruus päde identtisesti, niin tällöin ratkaisulla y on vähintään<br />

yksi 0-kohta välillä [a, b].


24<br />

Todistus 3.3 Tehdään vastaoletus y(x) ≠ 0 välillä [a,b], eli voidaan jakaa y:llä ja pätee<br />

[<br />

d Y (<br />

yY ′ − y ′ Y )] ∣ ∣∣x<br />

dx y<br />

∣<br />

= Y ′2 + Y }{{} Y ′′ − y′′<br />

Y 2 + y′2<br />

y y<br />

−QY }{{}<br />

2 Y 2 − 2 y′ ∣∣∣x<br />

y Y Y ′<br />

) 2 ∣<br />

= Y 2 (q − Q) +<br />

(Y ′ − y′ ∣∣∣x<br />

y Y<br />

q<br />

Oletuksen mukaan q(x) − Q(x) ≤ 0 joten yo. derivaatta on epänegatiivinen, ja koska q(x) = Q(x) ei<br />

päde identtisesti, niin ainakin jollain välillä se on aidosti positiivinen. Nyt integroimalla a:sta b:hen<br />

saadaan<br />

0 <<br />

∫ b<br />

a<br />

/ b<br />

=<br />

a<br />

dx d<br />

dx<br />

[ Y (x)<br />

y(x)<br />

[ Y (x)<br />

y(x)<br />

(<br />

y(x)Y ′ (x) − y ′ (x)Y (x) )]<br />

(<br />

y(x)Y ′ (x) − y ′ (x)Y (x) )] = 0,<br />

koska Y (a) = Y (b) = 0, mikä on tietysti ristiriita ja täytyy olla y(x) = 0 jossakin välin pisteessä.<br />

Lause 3.5 (2. nollakohtalause) Jokaisella differentiaaliyhtälön<br />

d 2 y(x)<br />

dx 2 + f(x)y(x) = 0<br />

ratkaisulla on välillä a ≤ x < ∞ äärettömän monta nollakohtaa, mikäli f on jatkuva ja f(x) ≥ m 2 > 0<br />

jollakin m tällä välillä. Lisäksi kahden peräkkäisen nollakohdan välinen etäisyys on korkeintaan π/m.<br />

Toisaalta, jos f(x) ≤ −m 2 < 0 jollakin m tällä välillä, niin jokaisella ratkaisulla on korkeintaan yksi<br />

nollakohta samalla välillä.<br />

Todistus 3.4 f(x) ≥ m 2 . Verrataan yhtälöitä y ′′ + fy = 0 ja Y ′′ + m 2 Y = 0, joista jälkimmäisen<br />

ratkaisu on Y (x) = sin(m(x − δ)). Y:n nollakohdat ovat pisteissä x k = δ + kπ m<br />

, k ∈ Z. Koska oletuksen<br />

mukaan f(x) ≥ m 2 on yhtälön y ′′ +fy = 0 ratkaisulla 1. nollakohtalauseen mukaan 1 nollakohta välillä<br />

[x k , x k+1 ] (k valittu s.e. x k ≥ a), toinen välillä [x k+1 , x k+2 ] jne., eli äärettömän monta nollakohtaa.<br />

Lisäksi kahden peräkkäisen nollakohdan väli < π/m, sillä muuten δ:n sopivalla valinnalla voitaisiin<br />

konstruoida tilanne, jossa y:n nollakohdista yksikään ei osuisi välille [x n , x n+1 ] jollakin n.<br />

f(x) ≤ −m 2 . Verrataan yhtälöitä y ′′ + fy = 0 ja Y ′′ − m 2 Y = 0. Jos ensimmäisen yhtälön ratkaisulla<br />

olisi 2 nollakohtaa x 1 ja x 2 (x 1 < x 2 ), niin 1. nollakohtalauseen mukaan jälkimmäisen yhtälön jokaisella<br />

ratkaisulla olisi ainakin yksi nollakohta välillä [x 1 , x 2 ]. Kuitenkaan esimerkiksi funktiolla Y (x) = e mx ,<br />

joka ratkaisee jälkimmäisen yhtälön, ei ole nollakohtaa millään reaaliluvulla, eikä siis myöskään välillä<br />

[x 1 , x 2 ]. y:llä voi siis olla korkeintaan yksi nollakohta.<br />

Palataan taas S-L yhtälön pariin, joka oltiin jo muutettu muotoon (3.29), missä R ja Q jatkuvia ja R<br />

epänegatiivinen. Jatketaan R ja Q (jatkuvasti) alueeseen x > b kaavoilla<br />

R(x) = R(b) ja Q(x) = Q(b) , kun x > b.<br />

Nyt differentiaaliyhtälöiden olemassaolo- ja yksikäsitteisyyslauseen mukaan yhtälöllä (3.29) on jokaisella<br />

λ välillä [a,B] B > b yksikäsitteinen ratkaisu z(λ, x), joka toteuttaa ehdot z(a) = 0, z ′ (a) = 1.<br />

Koska Q ja R ovat jatkuvia ja siten rajoitettuja, löytyy aina ¯λ s.e. Q(x) + ¯λR(x) ≤ −m 2 < 0 välillä


25<br />

[a,B]. 2. nollakohtalauseen mukaan ratkaisuilla z(λ, x) ei ole toista nollakohtaa (z(λ, a) = 0) kun λ ≤ ¯λ,<br />

joten ei löydy ¯λ:a pienempiä ominaisarvoja. Toisaalta löydetään myös ¯λ, jolle<br />

( ) π 2<br />

Q(x) + ¯λR(x) ≥ > 0.<br />

B − a<br />

2. nollakohtalauseen nojalla z(¯λ, x):llä on väh. yksi nollakohta x0 välillä [a,B], aluksi välillä [b,B]. Kun<br />

λ kasvaa x 0 lähestyy b:tä ylhäältä ja kun λ = λ 1 , x 0 = b. Nyt λ 1 on ominaisarvo ja z(λ 1 , x) on sitä<br />

vastaava ominaisfunktio, jolla on nollakohdat a:ssa ja b:ssä (muttei niiden välissä). Annetaan λ:n kasvaa<br />

edelleen. z(λ, x):n 3. nollakohta lähestyy x = b:tä, ja kun λ = λ 2 z(λ 2 , b) = 0. Nyt z 2 (x) := z(λ 2 , x)<br />

on ominaisfunktio, jolla on yksi nollakohta välillä [a,b]. Jatkamalla iterointia saadaan ääretön määrä<br />

ominaisarvoja ja -funktioita. Nyt λ k :t ovat S-L yhtälön ominaisarvot ja funktiot u k = z(λ k , x)/ √ p(x)<br />

niitä vastaavat ominaisfunktiot.<br />

Ominaisarvojen löytäminen ”shooting-metodilla”.<br />

Arvataan jokin λ ja integroidaan numeerisesti diff.yhtälöä (3.29) alueeseen x > b jatketuilla Q ja R ja<br />

alkuarvoilla z(a)=0, z’(a)=1. Muutetaan λ:aa kunnes 0-kohta osuu b:hen (merkitään tätä λ:aa ˆλ:lla.<br />

Tarkastetaan, kuinka monta nollakohtaa zˆλ:lla on välillä (a,b). Jos zˆλ:lla oli n nollakohtaa, niin löysimme<br />

(n+1):nnen ominaisfunktion. Nyt voidaan pienentää λ:aa ja etsiä n:s,(n-1):s,(n-2):s,... ja ensimmäinen<br />

ominaisfunktio. Tämän jälkeen voidaan kasvattaa λ:aa ja etsiä korkeampia ominaisfunktioita<br />

niin paljon kuin tarvitsee.<br />

Huomautus 3.1 Sturmin ja Liouvillen lause ei päde yleisesti singulaarisille S-L ongelmille! Esimerkiksi<br />

periodisilla reunaehdoilla ei voi olettaa, että Sturmin Liouvillen lauseen tulokset olisivat voimassa.<br />

Yllä olevasta huomautuksesta vielä esimerkki, eli vastaesimerkki sille, että Sturmin Liouvillen lause<br />

yleistyisi koskemaan myös singulaarisia ongelmia.<br />

Esimerkki 3.3 Tutkitaan yhtälöä<br />

(<br />

d<br />

x 2 du )<br />

+ λu = 0 (3.31)<br />

dx dx<br />

välillä x ∈ [0, 1], eli a = 0 ja b = 1. Koska p(a) = 0, yhtälö on singulaarinen. Otetaan vielä reunaehdoiksi<br />

u(b) = 0 ja |u(0)| < ∞. Nyt<br />

(3.31) ⇐⇒ x 2 u ′′ + 2xu ′ + λu = 0<br />

Yrite u(x) = x n =⇒p(p − 1) + 2p + λ = p 2 + p + λ = 0<br />

=⇒p = − 1 2 ± √<br />

1<br />

4 − λ<br />

λ ≠ 1 4 . p − = − 1 2 − √ 1/4 − λ ja p + = − 1 2 + √ 1/4 − λ erisuuret. Yleinen ratkaisu on<br />

ja reunaehdosta u(1) = 0 saadaan<br />

u(x) = C 1 x p −<br />

+ C 2 x p +<br />

C 1 + C 2 = 0 ⇐⇒ C 1 = −C 2 .<br />

Ratkaisu on siis u(x) = C(x p −<br />

−x p +<br />

). Kuitenkin jos λ < 1/4, niin p − < 0, joten x → 0 ⇒ u(x) → ±∞.<br />

Toisaalta jos λ > 1/4, niin Re(p − ) = Re(p + ) = −1/2, joten |u(x)| ≈ 1/ √ x → ∞, kun x → 0. Ei siis<br />

löydy reunaehtoja toteuttavia ratkaisuja jos λ ≠ 1/4.<br />

λ = 1 4 . Toinen ratkaisu on u 1(x) = √ 1<br />

x<br />

ja toinen saadaan vakion varioinnilla:<br />

u(x) = C(x)/ √ x ⇒ C(x) = ln(x).


26<br />

Yleinen ratkaisu on siis u(x) = 1 √ x<br />

(C 1 + C 2 ln(x)). Lisäksi reunaehto<br />

u(1) = C 1<br />

√<br />

1<br />

= 0 ⇒ C 1 = 0,<br />

eli<br />

u(x) = Cln(x)/ √ x , joten |u(x)| −→ ∞ , kun x → 0.<br />

Yhtälöllä ei siis ole ominaisarvoja eikä -funktioita.<br />

Kuitenkin koska L on itseadjungoitu, aina pätee: Jos ominaisarvo on olemassa, se on reaalinen ja<br />

erisuuria ominaisarvoja vastaavat ominaisfunktioit ovat ortogonaalisia.<br />

Esimerkki 3.4 Periodiset reunaehdot.<br />

Tutkitaan yhtälöä<br />

välillä x ∈ [0, π], reunaehdoilla<br />

d 2 u<br />

+ λu = 0 (3.32)<br />

dx2 u(0) = u(π) (3.33)<br />

u ′ (0) = u ′ (π). (3.34)<br />

Merk. α = √ −λ, jolloin yleinen ratkaisu on u(x) = C 1 e αx + C 2 e −αx . Reunaehdot:<br />

(3.33) =⇒ C 1 + C 2 = C 1 e απ + C 2 e −απ<br />

(3.34) =⇒ α(C 1 − C 2 ) = α(C 1 e απ − C 2 e −απ )<br />

α = 0 kelpaa ja tätä vastaava ominaisfunktio on u ≡ C = vakio. Oletetaan sitten, että α ≠ 0 ja jaetaan<br />

se pois toisesta reunaehdosta:<br />

(3.33) =⇒ C 1 (1 − e απ ) + C 2<br />

(<br />

1 − e<br />

−απ ) = 0<br />

(3.34) =⇒ C 1 (1 − e απ ) − C 2<br />

(<br />

1 − e<br />

−απ ) = 0<br />

Jotta olisi nollasta eroava ((C 1 , C 2 ) ≠ ¯0) ratkaisu, ryhmän determinantin on oltava nolla, eli<br />

−2 (1 − e απ ) ( 1 − e −απ) = 0<br />

⇐⇒ e ±απ = 1<br />

⇐⇒ απ = 2nπi<br />

n ∈ Z<br />

=⇒ λ n = −α 2 n = 4n 2 .<br />

Ominaisarvoa λ = 4n 2 vastaa kaksi riippumatonta ominaisfunktiota<br />

u n+ = e 2nix ja u n− = e −2nix<br />

tai reaaliset<br />

u (1)<br />

n = cos(2nx) ja u (2)<br />

n = sin(2nx)<br />

Edellisessä esimerkissä ominaisarvot n ≠ 0 olivat kahdesti degeneroituneet. Monelle singulaariselle S-L<br />

ongelmalle ja sekareunaehto-ongelmalle voidaan kuitenkin johtaa Sturmin Liouvillen lauseen kaltaisia<br />

tuloksia mm. variaatiolaskennan keinoin (Katso esim. R. Courant, D. Hilbert: Methods of Mathematical<br />

Physics, vol.1, luku 6)


27<br />

3.4 S-L operaattorin Greenin funktio<br />

Seuraavaksi tavoitteena on löytää yleiselle S-L operaattorille Greenin funktio. Aputuloksena tarvitsemme<br />

aluksi ominaisfunktiokehitelmän δ-funktiolle. Olkoon f ∈ L 2 ([a, b]), jolloin<br />

f(x) =<br />

∞∑<br />

a n ϕ n (3.35)<br />

n=1<br />

L x ϕ n (x) = λ n w(x)ϕ n (x) (3.36)<br />

a n = (ϕ n, f)<br />

(ϕ k , ϕ k ) := ∫ b<br />

a dxw(x)ϕ k(x)f(x)<br />

∫ b<br />

a dxw(x)ϕ k(x) 2 (3.37)<br />

Sijoittamalla a n :n lauseke(3.37) f:n sarjakehitelmään (3.35) ja vaihtamalla summauksen ja integroinnin<br />

järjestystä saamme<br />

∫ b<br />

∞∑ ϕ n (y)ϕ n (x)<br />

f(x) = dyw(y)<br />

f(y), (3.38)<br />

(ϕ n , ϕ n )<br />

mistä päättelemme<br />

a<br />

n=1<br />

∞∑ ϕ n (y)ϕ n (x)<br />

δ(x − y) = w(y)<br />

(ϕ<br />

n=1 n , ϕ n )<br />

(3.39)<br />

∞∑ ϕ n (y)ϕ n (x)<br />

= w(x)<br />

(ϕ<br />

n=1 n , ϕ n )<br />

(3.40)<br />

= √ ∞∑ ϕ n (y)ϕ n (x)<br />

w(x)w(y)<br />

.<br />

(ϕ n , ϕ n )<br />

(3.41)<br />

Kaksi alinta yhtälöä seuraavat δ-funktion ominaisuudesta f(x)δ(x − y) = f(y)δ(x − y).<br />

Sturm-Liouville -operaattorin Greenin funktio. Muistellaan aluksi että epähomogeenisen differentiaaliyhtälön<br />

L x u(x) = f(x) (3.42)<br />

erikoisratkaisu löydettiin etsimällä ensin operaattorin Greenin funktio G joka toteuttaa<br />

n=1<br />

L x G(x, y) = δ(x − y) . (3.43)<br />

Sen jälkeen erikoisratkaisu u E (x) saatiin kaavasta<br />

∫<br />

u E (x) = dy G(x, y)f(y) . (3.44)<br />

(Lisäksi täytyy tarkistaa että u E (x) toteuttaa siltä vaaditut reunaehdot, ratkaisua voitiin "säätää"muuttamalla<br />

Greenin funktiota käyttämällä homogeenisen yhtälön ratkaisuja.)<br />

Olkoon nyt L x Sturm-Liouville differentiaalioperaattori<br />

L x = − d<br />

dx<br />

[<br />

p(x) d<br />

dx<br />

]<br />

+ q(x) . (3.45)<br />

Etsitään epähomogeenisen differentiaaliyhtälön ratkaisu u E joka toteuttaa S-L reunaehdot<br />

A 1 u E (a) + A 2 u ′ E(a) = 0 (3.46)<br />

B 1 u E (b) + B 2 u ′ E(b) = 0 . (3.47)


28<br />

Muistetaan ensin että myös L x :n ominaisfunktiot ϕ k (x),<br />

L x ϕ k (x) = λw(x)ϕ k (x) (3.48)<br />

toteuttavat nämä reunaehdot.<br />

Arvataan että oikea Greenin funktio on muotoa<br />

G(x, y) = ∑ k<br />

1 ϕ k (x)ϕ k (y)<br />

λ k (ϕ k , ϕ k )<br />

. (3.49)<br />

Yksi perustelu tälle arvaukselle löytyy luentokalvoista. Tässä tyydymme vain tarkistamaan että arvaus<br />

on OK. Ensin joitakin kommentteja:<br />

1. Kaavassa (3.49) summataan yli kaikkien ominaisfunktioiden ja -arvojen.<br />

2. (3.49) on hyvin määritelty vain jos kaikki ominaisarvot λ k ≠ 0.<br />

3. Normitustekijä (ϕ k , ϕ k ) = ∫ dx w(x)ϕ ∗ k (x)ϕ k(x) sisällytetään kaavaan jos ϕ k ei ole vielä normitettu<br />

siten että (ϕ k , ϕ k ) = 1.<br />

Nyt sitten tarkistus:<br />

L x G(x, y) = ∑ k<br />

= w(x) ∑ k<br />

1 (L x ϕ k (x))ϕ k (y)<br />

λ k (ϕ k , ϕ k )<br />

ϕ k (x)ϕ k (y)<br />

(ϕ k , ϕ k )<br />

= δ(x − y) , (3.50)<br />

siis (3.49) totetuttaa ehdon (3.43). Edelleen, koska ominaisfunktiot ϕ k toteuttavat S-L reunaehdot<br />

(3.46), seuraa helposti<br />

A 1 G(a, y) + A 2 ∂ x G(a, y) = 0 (3.51)<br />

B 1 G(b, y) + B 2 ∂ x G(b, y) = 0 . (3.52)<br />

Siispä erikoisratkaisu u E (x) = ∫ dy G(x, y)f(y) toteuttaa myös S-L reunaehdot. Esim:<br />

∫<br />

A 1 u E (a) + A 2 u ′ E(a) = dy (A 1 G(a, y) + A 2 ∂ x G(a, y))f(y) = 0 . (3.53)<br />

Mitä sitten tapahtuu jos jokin ominaisarvoista häviää, λ k = 0? (Käytetään vastaavasta ominaisfunktiosta<br />

merkintää ϕ 0 ja ominaisarvosta merkintää λ 0 . Näistä käytetään usein nimitystä nollamoodi (engl.<br />

zero mode.) Huomaa että S-L teoriassa on korkeintaan yksi nollamoodi, sillä S-L reunaehdoilla ominaisarvot<br />

ja -funktiot eivät ole degeneroituneita.) Kokeillaan onnistuisiko yksinkertainen muokkaus, eli<br />

kävisikö<br />

Ḡ(x, y) = ∑ 1 (L x ϕ k (x))ϕ k (y)<br />

(3.54)<br />

λ k (ϕ k , ϕ k )<br />

λ k ≠0<br />

Greenin funktioksi. (Summaan sisältyvät siis kaikki ominaismoodit paitsi nollamoodi.) Kokeillaan toteuttaako<br />

u(x) = ∫ dy Ḡ(x, y)f(y) epähomogeenisen yhtälön:<br />

∫<br />

L x u(x) = = dy L x Ḡ(x, y)f(y) = ∑ ∫<br />

1<br />

dy (L xϕ k (x))ϕ k (y)<br />

f(y)<br />

λ k (ϕ k , ϕ k )<br />

λ k ≠0<br />

= w(x) ∑ ∫<br />

dy ϕ ∫<br />

∫<br />

k(x)ϕ k (y)<br />

f(y) = dy δ(x − y)f(y) − dy w(x)ϕ 0(x)ϕ 0 (y)<br />

f(y)<br />

(ϕ k , ϕ k )<br />

(ϕ 0 , ϕ 0 )<br />

λ k ≠0<br />

= f(x) − w(x)ϕ 0(x)<br />

(ϕ 0 , ϕ 0 ) 〈ϕ 0|f〉 , (3.55)


29<br />

missä<br />

∫<br />

〈ϕ 0 |f〉 =<br />

dy ϕ 0 (y)f(y) . (3.56)<br />

(Huom. 〈f|g〉 on eri integraali kuin (f, g), jälkimmäinen sisältää painofunktion w.) Tulos kertoo sen<br />

että (3.54) käy Greenin funktioksi nollamooditapauksessa vain jos epähomogeenisen yhtälön lähteen<br />

projektio nollamoodille (3.56) on nolla.<br />

3.5 Sturm-Liouville -ongelma variaatio-ongelmana<br />

Esitämme seuraavaksi miten Sturm-Liouville -ongelmaa voi lähestyä variaatiolaskennan kautta. Ideana<br />

on ensinnäkin löytää funktionaali jota varioimalla S-L ongelman differentiaaliyhtälö saadaan Eulerin<br />

yhtälönä. Toisaalta tiedämme että ongelman ratkaisufunktiot muodostavat ortonormaalin kannan painotetun<br />

sisätulon suhteen. Kanta voidaan edelleen ortonormittaa, jolloin normeeraus voidaan tulkita<br />

sidosehtona. Koska normeeraus sisältää integraalin, se voidaan tulkita globaalina sidosehtona. Näin<br />

päädytään isoperimetriseen ongelmaan. Funktionaali jonka variaatio johtaa S-L yhtälöön on<br />

J S−L [y] =<br />

∫ b<br />

a<br />

dx ( p(x)(y ′ (x)) 2 + q(x)y(x) 2) . (3.57)<br />

Ominaisfunktioden ortonormitus painoten sisätulon kanssa taas johtaa ehtoon<br />

K[y] =<br />

Otetaan käyttöön Lagrangen kertoja λ ja etsitään funktionaalin<br />

L λ [y] =<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

dxw(x)(y(x)) 2 = 1. (3.58)<br />

(<br />

p(x)(y ′ (x)) 2 + (q(x) − λw(x))y(x) 2) + λ<br />

ääriarvot. Tälle funktionaalille Eulerin yhtälön on<br />

(<br />

d<br />

p(x) dy(x) )<br />

+ (q(x) − λw(x))y(x) = 0, (3.59)<br />

dx dx<br />

eli Sturm-Liouville yhtälö kuten edellä todettiin. Lisäksi λ on ominaisarvo ja K[y] = 1 on ominaisfunktion<br />

normitusehto. Nyt on kuitenkin oltava tarkkana reunaehtojen kanssa. Varioidaan y → y + η<br />

ja tutkitaan termin<br />

muutosta.<br />

δ<br />

∫ b<br />

a<br />

dxp(x)(y ′ (x)) 2 = 2<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

p(x)(y ′ (x)) 2<br />

dxp(x)y ′ (x)η ′ (x)<br />

/ b<br />

= 2 p(x)y(x)η(x) − 2<br />

a<br />

∫ b<br />

a<br />

dxη(x) d (<br />

p(x)y ′ (x) ) .<br />

dx<br />

Eulerin yhtälö ääriarvon ehtona pitää siis paikkansa vain jos p(a)y ′ (a)η(a) = p(b)y ′ (b)η(b) = 0. Singulaariselle<br />

ongelmalla p(a) ja/tai p(b) = 0, jolloin η(a) ja/tai η(b) voivat olla mielivaltaisia. Säännölliselle<br />

ongelmalle (p = a tai b) y(p) = 0 ⇒ η(p) = 0 ja y ′ (p) = 0 ⇒ η(p) voi olla mielivaltainen. Kuitenkin<br />

yleiselle homog. reunaehdolle<br />

A 1 y(p) + A 2 y ′ (p) = 0<br />

myös variaatio toteuttaa tämän eikä sijoitustermi välttämättä häviä. Kun S-L yhtälöä halutaan käsitellä<br />

variaatio-ongelman Eulerin yhtälönä on siis rajoituttava reunaehtoihin<br />

p(a)y(a)y ′ (a) = p(b)y(b)y ′ (b) = 0. (3.60)


30<br />

Oletamme jatkossa, että reunaehdot ovat voimassa 4 .<br />

Funktiot u k , jotka stationarisoivat J S−L [y]:n ovat siis S-L ongelman ominaisfunktiot, eli toteuttavat<br />

− d (<br />

p(x) du )<br />

k(x)<br />

+ q(x)u k (x) = λ k w(x)u k (x) ja<br />

dx dx<br />

∫ b<br />

a<br />

dxw(x)u m (x)u n (x) = δ nm .<br />

Ominaisfunktiot muodostavat täydellisen funktiojoukon, joten voidaan kehittää<br />

y(x) = ∑ k<br />

=⇒ J[y] = ∑ k,l<br />

= ∑ k<br />

a k u k (x)<br />

∫ b<br />

a k λ l a l dxw(x)u k (x)u l (x)<br />

a<br />

λ k a 2 k (3.61)<br />

ja<br />

K[y] = ∑ k<br />

a 2 k = 1 (3.62)<br />

Olkoon λ 0 pienin ominaisarvo (λ k ≥ λ 0 kaikilla k). Jos λ 0 ei ole degeneroitunut J[y] saavuttaa globaalin<br />

miniminsä λ 0 , kun y(x) = u 0 (x) (a 2 0 = 1)5 . Voidaan siis kirjoittaa<br />

λ 0 = inf u∈D(L)<br />

J[u]<br />

K[u] ,<br />

missä D(u) on joukko funktioita joille vastaava S-L operaattori L on hyvin määritelty. Huom! funktioluokan<br />

yleien alkio u ei ole ominaisfunktio, joten K[u] ≠ 1 yleensä. Pienintä ominaisarvoa voidaan yrittää<br />

etsiä rajoittumalla sopiviin yritefunktiohin u(α 1 , . . . , α p ) jotka riippuvat parametreista α 1 , . . . , α p<br />

ja jotka toteuttavat vaaditut reunaehdot, ja varioimalla parametrejä. Tätä likiarvomenetelmää kutsutaan<br />

Rayleighin ja Ritzin menetelmäksi. Samantapaista menetelmää käytetään kvanttimekaniikassa<br />

Hamilton-operaattorin pienimmän ominaiarvon (eli systeemin perustilan energian) etsintään.<br />

3.6 Rayleighin ja Ritzin menetelmä<br />

Etsitään pienimmälle ominaisarvolle λ 0 likiarvoa aloittamalla parametreista (α 1 , . . . , α p ) riippuvasta<br />

yritteestä u(α 1 , . . . , α p ). Lasketaan ensin<br />

J[u(α 1 , . . . , α p )] = F (α 1 , . . . , α p )<br />

K[u(α 1 , . . . , α p )] = G(α 1 , . . . , α p )<br />

, sekä<br />

ja minimoidaan tämän jälkeen F (α 1 , . . . , α p ) ehdolla G(α 1 , . . . , α p ) = 1. Otetaan käyttöön Lagrangen<br />

kerroin λ. Eulerin yhtälöt ovat:<br />

Ratkaisu antaa ylärajan miniarvolle.<br />

∂<br />

∂a j<br />

(F (α 1 , . . . , α p ) + λG(α 1 , . . . , α p )) = 0 (3.63)<br />

G(α 1 , . . . , α p ) − 1 = 0 (3.64)<br />

4 Periaatteessa pintatermi voitaisiin hävitää myös ehdolla p(a)y(a)y ′ (a) − p(b)y(b)y ′ (b) = 0. Tämän ehdon ongelma<br />

on se että se on oleellisesti periodinen reunaehto, jonka ominaisarvot saattavat olla degeneroituneita kuten yllä näimme.<br />

S-L ongelmassahan asetettiin reunaehdot erikseen päätepisteissä x = a, b, joten siksi teemme samantapaisen rajoituksen<br />

variaatio-ongelman reunaehtoihin.<br />

5 Jos λ 0 olisi deneroitunut ja sitä vastaa ominaisfunktiot u (1)<br />

0 , u(2) 0 , . . . , u(N) 0 , niin mikä tahansa näiden lineaarikombinaatio<br />

minimoi J:n.


31<br />

3.6.1 Esimerkki: Patarummun säveltaajuus<br />

Orkesterin patarummut ovat rumpuja jotka on suunniteltu niin että värisevän kalvon perustaajuus (eli<br />

matalin ominaistaajuus) vahvistuu siten että rummun äänessä erottuu selvä säveltaajuus. Patarummut<br />

viritetään eri taajuuksiin ja orkesteripartituurissa ne nuotinnetaan sävelinä kuten muut instrumentit.<br />

Rumpukalvo on kiekon muotoinen ja kiinni reunoistaan. Sen värähtelyjä kuvaa siten 2+1 ulotteinen<br />

aaltoyhtälö joka on luontevaa ratkaista napakoordinaateissa, Dirichlet’n reunaehdolla u(R, φ) = 0<br />

missä R on rumpukalvon säde. Kuten <strong>Fymm</strong> IIa:lla opittiin, yhtälön separointi johtaa radiaaliselle<br />

osalle Besselin yhtälöön<br />

y ′′ + 1 x + λy = 0 ,<br />

missä x = r/R on uudelleen skaalattu radiaalinen koordinaatti. Reunaehdot ovat nyt y(1) = 0 ja y(x)<br />

säännöllinen origossa (muuten kalvo repeää). Ominaisarvo λ = R 2 ω 2 /v 2 missä v on äänen nopeus<br />

kalvolla, ja ω = 2πf missä f on kuultava taajuus. <strong>Fymm</strong> IIa:lla opimme toki ratkaisemaan Besselin<br />

yhtälön ja sen ominaisarvot eksaktisti, mutta seuraavaksi harjoittelemme Rayleighin ja Ritzin menetelmää.<br />

Kirjoitetaan ensin Besselin yhtälö standardissa S-L muodossa:<br />

− d<br />

dx<br />

(<br />

x dy<br />

dx<br />

)<br />

= λxy .<br />

Näin ollen p(x) = x, q(x) = 0 ja w(x) = x. Etsitään seuraavaksi sopiva yritefunktio. Kalvon värähdellessä<br />

sen profiili vaihtelee x = 0:ssa maksimipoikkeaman ja minimipoikkeaman välillä. Profiilin<br />

Taylor-sarja ääripoikkeamalla on<br />

y(x) = y(0) + 1 2 y′′ (0)x 2 + 1 4! y′′′′ (0)x 4 + · · · ,<br />

parittomat termit häviävät sillä ääriprofiili on parillinen funktio. Näin motivoimme R-R menetelmän<br />

yritefunktioiksi neljännen asteen parilliset polynomit<br />

y(x) = a + bx 2 + cx 4 .<br />

Vaadimme nyt että ne myös toteuttavat annetut reunaehdot. Ehdosta y(1) = 0 seuraa relaatio a+b+c =<br />

0. Valitaan riippumattomiksi parametreiksi b, c. Lasketaan seuraavaksi<br />

ja<br />

J[y] =<br />

K[y] =<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

dx xy ′2 = b 2 + 8 3 bc + 22 = F (b, c)<br />

dx xy 2 = 1 6 b2 + 5<br />

12 bc + 4 15 c2 = G(b, c) .<br />

Etsitään nyt funktionaalin J[y] + λK[y] = F (b, c) + λG(b, c) stationääriset pisteet:<br />

ja<br />

0 = ∂ ∂b (F + λG) = (2 + 1 3 λ)b + (8 3 + 5<br />

12 λ)c<br />

0 = ∂ ∂c (F + λG) = (8 3 + 5 12 λ)b + (4 + 8 15 λ)c .<br />

Eliminoimalla b ja c saadaan yhtälö<br />

3λ 2 − 128λ + 640 = 0 ,<br />

jonka pienin juuri on<br />

λ = 1 3 (64 − √ 2176) ≈ 5, 7841 ,


32<br />

joka ei ole kovin kaukana eksaktista ratkaisusta 5, 7832.<br />

Lopetamme tämän kappaleen pienellä lisätarkastelulla. Olkoon L Sturm-Liouville-operaattori (3.7). Mitkä ovat funktionaalin<br />

F RR [u] = N[u]<br />

D[u]<br />

(3.65)<br />

stationaariset pisteet, kun<br />

∫ b<br />

N[u] = dxu(x)Lu(x)<br />

a<br />

∫ b<br />

=<br />

a<br />

−<br />

dx<br />

[p(x)(u ′ (x)) 2 + q(x)u(x) 2]<br />

(<br />

p(b)u ′ (b)u(b) − p(a)u ′ (a)u(a)<br />

)<br />

(3.66)<br />

ja<br />

∫ b<br />

D[u] = dxw(x)u(x) 2 . (3.67)<br />

a<br />

Olkoon λ n L-operaattorin ominaisarvot ja ϕ n niitä vastaavat normitetut ( ∫ b<br />

a dxw(x)ϕ n(x) 2 = 1) ominaisfunktiot (n ∈ N). Tällöin siis<br />

Lϕ n(x) = λ nw(x)ϕ n(x)<br />

∫ b<br />

dxw(x)ϕ n(x)ϕ m(x) = δ nm.<br />

a<br />

ja<br />

Jos kyseessä on säännöllinen ongelma, niin ϕ n : n ∈ N on täydellinen ja voidaan kirjoittaa<br />

∞∑<br />

u(x) = a nϕ n(x), (3.68)<br />

n=1<br />

joten<br />

∞∑ ∞∑<br />

∫ b<br />

N[u] =<br />

a ma n dxϕ m(x)Lϕ m(x)<br />

n=1 m=1<br />

a<br />

∞∑ ∞∑<br />

=<br />

a ma nλ nδ mn<br />

n=1 m=1<br />

=<br />

∞∑<br />

λ na 2 n (3.69)<br />

n=1<br />

ja<br />

sekä<br />

Stationaariset pisteet:<br />

eli<br />

∞∑<br />

D[u] = a 2 n (3.70)<br />

n=1<br />

F RR [u] = N[u] ∑ ∞n=1<br />

D[u] = λ na 2 n<br />

∑ ∞n=1 a 2 =: f RR (a 1 , a 2 , . . .). (3.71)<br />

n<br />

∂f RR<br />

∂a i<br />

= 2λ ia i<br />

∑ ∞n=1 a 2 n<br />

2a i<br />

− F RR [u] ∑ ∞n=1 a 2 = 0<br />

n<br />

∑ ∞n=1<br />

λ na 2 n<br />

λ i = F RR [u] = ∑ ∞n=1 a 2 . (3.72)<br />

n<br />

Ratkaisu: a n = 0, kun n ≠ i ja a i mielivaltainen sekä u(x) = a i ϕ i (x). Lisäksi F [a i ϕ i ] = λ i riippumatta a i :n arvosta. Minimin F [a 1 ϕ 1 ] = λ 1 antava<br />

ϕ 1 on vakiokerrointa vaille yksikäsitteinen ja muut ratkaisut ovat satulapisteitä. Kuitenkin funktiot a nϕ n on funktionaalin F RR minimejä avaruudessa<br />

{<br />

F n = u(x) :<br />

∫ b<br />

a<br />

}<br />

dxw(x)u(x)ϕ k (x) = 0, k = 1, 2, . . . , n − 1<br />

(3.73)<br />

4 Hilbertavaruuksista<br />

4.1 Vektori-, normi- ja sisätuloavaruudet<br />

Tästä eteenpäin skalaarikunta on K = C tai R. Määritellään, että joukko V on (K-kertoiminen)<br />

vektoriavaruus, jos jokaista paria ¯v, ū ∈ V vastaa kolmas alkio ū + ¯v, sekä jokaista paria ū ∈ V ja<br />

a ∈ K vastaa kolmas alkio aū ∈ V s.e.<br />

1. ū + ¯v = ¯v + ū<br />

2. ū + (¯v + ¯w) = (ū + ¯v) + ¯w<br />

3. a(ū + ¯v) = aū + a¯v


33<br />

4. (a + b)ū = aū + bū<br />

5. a(bū) = (ab)ū<br />

6. 1ū = ū<br />

7. ∃ ¯0 s.e. ū + ¯0 = ū ∀ ū ∈ V<br />

8. ∃ − ū s.e. ū + (−ū) = 0.<br />

Näistä seuraa tutut vektoreiden laskulait, kuten 0 · ū = ¯0 ja −1 · ū = −ū jne. Vektorit ¯v 1 , ¯v 2 , . . . , ¯v N<br />

ovat lineaarisesti riippumattomat, jos ∑ N<br />

n=1 a n¯v n = ¯0 jos ja vain jos a 1 = a 2 = . . . = a N = 0. Huom.<br />

jos yksikin ¯v n = ¯0, niin vektorit eivät ole lin. riippumattomia. Joukko {u 1 , u 2 , . . .} virittää V :n, jos<br />

jokainen ū ∈ V voidaan lausua muodossa<br />

ū = ∑ k<br />

a k ū k . (4.1)<br />

Jos {u 1 , u 2 , . . .} on lisäksi lineaarisesti riippumaton, niin sen vektorit muodostavat avaruuden V kannan.<br />

Kannassa on aina sama määrä vektoreita ja tätä määrää kutsutaan V :n dimensioksi dim(V ).<br />

Esimerkki 4.1 K n := n tai C n<br />

¯x = (x 1 , x 2 , . . . , x n ) x i ∈ K<br />

¯x + ȳ = (x 1 + y 1 , x 2 + y 2 , . . . , x n + y n )<br />

a¯x = (ax 1 , ax 2 , . . . , ax n )<br />

¯0 = (0, 0, . . . , 0)<br />

−¯x = (−x 1 , −x 2 , . . . , −x n )<br />

Kanta = {ē 1 , ē 2 , . . . , e¯<br />

n } , missä<br />

ē i = (0, . . . , 0, }{{} 1 , 0, . . . , 0).<br />

i:s<br />

Huom. dim(K n ) = n ja myös n = ∞ on mielekäs!<br />

Esimerkki 4.2 V = funktiot f : A → C, A ⊂ C<br />

(f + g)(z) = f(z) + g(z)<br />

(af)(z) = af(z), a ∈ C<br />

¯0(z) = 0 ∀ z ∈ A<br />

(−f)(z) = −f(z)<br />

Huom. dim(V ) = ∞, lisäksi V :llä ei ole luonnollista kantaa.<br />

Esimerkki 4.3 V = astetta n-1 olevat polynomit P : A → C, A ⊂ C<br />

n−1<br />

∑<br />

P (z) = a k z k<br />

k=0<br />

Laskutoimitukset kuten edellisessä esimerkissä, mutta nyt dim(V ) = n. Eräs kanta on {1, z, z 2 , . . . , z n−1 }.<br />

Vektoriavaruus on normitettu, eli normiavaruus, jos on lisäksi olemassa kuvaus ‖·‖ : V → R s.e.<br />

1. ‖¯v‖ ≥ 0 ∀ ¯v ∈ V<br />

2. ‖¯v‖ = 0 ⇐⇒ ¯v = ¯0


34<br />

3. ‖¯v + ū‖ ≤ ‖¯v‖ + ‖ū‖ (”kolmioepäyhtälö”, ∆ − ey.)<br />

4. ‖a¯v‖ = |a| ‖¯v‖<br />

Esimerkki 4.4 Esimerkiksi K n (esimerkki 4.1) varustettuna normilla<br />

∑<br />

‖x‖ = ‖(x 1 , x 2 , . . . , x n )‖ = √ n |x k | 2 (4.2)<br />

ja polynomien avaruus V (esimerkki 4.3) varustettuna normilla<br />

ovat normiavaruuksia. Tarkista!<br />

Normi määrää avaruuteen myös etäisyyden eli metriikan<br />

k=1<br />

‖f‖ = sup |f(x)| (4.3)<br />

x∈A<br />

d(ū, ¯v) = ‖u − v‖ . (4.4)<br />

Metriikka puolestaan määrää suppenemisen: Sanomme, että jono ¯v 1 , ¯v 2 , . . . suppenee kohti ¯v ∈ V jos<br />

ja merkitsemme<br />

lim ‖¯v n − v‖ = 0 (4.5)<br />

n→∞<br />

Määritelmä 4.1 (Cauchyn jono) Jono (¯v n ) ∞ n=1 on Caychyn jono, jos<br />

¯v = lim<br />

n→∞ ¯v n (4.6)<br />

‖¯v n − ¯v m ‖ −→ 0, kun n, m → ∞<br />

Huomataan, että jokainen suppeneva jono on Cauchyn jono, sillä<br />

‖¯v n − ¯v m ‖ = ‖(¯v n − ¯v) + (¯v − ¯v m )‖ ≤ ‖¯v n − ¯v‖ + ‖¯v − ¯v m ‖ → 0, mutta päinvastainen ei ole välttämättä<br />

voimassa kaikissa vektoriavaruuksissa. Tätä varten määritellään täydelliset normitetut vektoriavaruudet<br />

eli Banachin avaruudet.<br />

Määritelmä 4.2 Normitettu vektoriavaruus on täydellinen, jos jokainen Cauchyn jono suppenee eli<br />

lim ‖¯v n − ¯v m ‖ = 0 =⇒ ∃ ¯v ∈ V s.e.<br />

n,m→∞<br />

lim ¯v n = ¯v<br />

n→∞<br />

Vektoriavaruuteen V saadaan vielä enemmän rakennetta, jos siinä on määritelty sisätulo eli skalaaritulo.<br />

Määritelmä 4.3 (Skalaaritulo) Kuvaus V ∗ V → C, (ū, ¯v) ↦→ 〈ū|¯v〉 on skalaaritulo, jos<br />

1. 〈ū|ū〉 ∈ R ja 〈ū|ū〉 ≥ 0 ∀ ū ∈ V .<br />

2. 〈ū|ū〉 = 0 ⇐⇒ ū = ¯0.<br />

3. 〈ū|¯v〉 = 〈¯v|ū〉 ∗ .<br />

4. 〈ū|¯v + ¯w〉 = 〈ū|¯v〉 + 〈ū| ¯w〉<br />

5. 〈ū|a¯v〉 = a〈ū|ū〉


35<br />

Esimerkiksi ”pistetulo” C n ∗ C n → C.<br />

x · y := 〈(x 1 , . . . , x n )|(y 1 , . . . , y n )〉 =<br />

n∑<br />

x ∗ i y i (4.7)<br />

on sisätulo. Vektoriavaruutta, jossa on määritelty sisätulo kutsutaan sisätuloavaruudeksi.<br />

Lause 4.1 (Schwarzin epäyhtälö) Sisätuloavaruudessa pätee aina<br />

ja yhtäsuuruus pätee vain jos vektorit ovat lin. riippuvia.<br />

i=1<br />

|〈ū|¯v〉| 2 ≤ 〈ū|ū〉〈¯v|¯v〉 (4.8)<br />

Todistus 4.1 Koska väite pätee kun ¯v = ¯0 (0 = 0), niin riittää tutkia tapaus ¯v ≠ ¯0, jolloin erityisesti<br />

〈¯v|¯v〉 > 0. Olkoon<br />

¯w = ū − 〈¯v|ū〉<br />

〈¯v|¯v〉 ¯v.<br />

Nyt sisätulon 1. ominaisuuden nojalla<br />

mistä väite tietysti seuraa.<br />

〈 ¯w| ¯w〉 = 〈ū|ū〉 − 〈ū|¯v〉〈¯v|ū〉<br />

〈¯v|¯v〉<br />

= 〈ū|ū〉 − |〈ū|¯v〉|2<br />

〈¯v|¯v〉<br />

≥ 0,<br />

− 〈¯v|ū〉〈ū|¯v〉<br />

〈¯v|¯v〉<br />

Schwarzin epäyhtälön avulla saadaan todistettua tärkeä tulos:<br />

Lause 4.2 Sisätuloavaruus on normiavaruus, kun normiksi otetaan<br />

Todistus 4.2 Muut ominaisuudet ilmeisiä, paitsi kolmioepäyhtälö:<br />

mistä väite seuraa ottamalla neliöjuuri.<br />

+ |〈ū|¯v〉|2 〈¯v|¯v〉<br />

〈¯v|¯v〉 2<br />

‖ū‖ = √ 〈ū|ū〉. (4.9)<br />

‖ū + ¯v‖ 2 = 〈ū + ¯v|ū + ¯v〉<br />

= 〈ū|ū〉 + 〈ū|¯v〉 + 〈¯v|ū〉 + 〈¯v|¯v〉<br />

= ‖ū‖ 2 + ‖¯v‖ 2 + 2Re(〈ū|¯v〉)<br />

≤ ‖ū‖ 2 + ‖¯v‖ 2 + 2|〈ū|¯v〉|<br />

Schwarz → ≤ ‖ū‖ 2 + ‖¯v‖ 2 + 2 ‖ū‖ ‖¯v‖<br />

= (‖ū‖ + ‖¯v‖) 2 ,<br />

Hilbertin avaruudet ovat täydellisiä sisätuloavaruuksia. Esimerkiksi C n ja R n ovat Hilbertin avaruuksia<br />

sisätulona pistetulo (4.7).<br />

Esimerkki 4.5 (l 2 ) Jonot x = (x 1 , x 2 , . . .), x i ∈ C, joille<br />

Sisätulo:<br />

∞∑<br />

|x i | 2 < ∞.<br />

i=1<br />

∞∑<br />

〈x|y〉 = x ∗ i y i (4.10)<br />

i=1


36<br />

Normi:<br />

Kantana {e i : i ∈ N}, missä<br />

‖x‖ =<br />

∞∑<br />

|x i | 2 (4.11)<br />

i=1<br />

e i = (0, . . . , 0, }{{} 1 , 0, . . .)<br />

i:s<br />

Esimerkki 4.6 (L 2 (a, b)) Funktiot [a, b] → C, joille<br />

Sisätulo:<br />

Normi:<br />

∫ b<br />

a<br />

〈f|g〉 =<br />

‖f‖ =<br />

dx|f(x)| 2 < ∞.<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

dxf(x) ∗ g(x) (4.12)<br />

dx|f(x)| 2 (4.13)<br />

Koska on oltava ‖f − g‖ = 0 ⇔ f = g, niin on samaistettava funktiot joilla ∫ b<br />

a dx|f(x) − g(x)|2 = 0<br />

t.s. f(x) = g(x) melkein kaikkialla. Eräs avaruuden L 2 kanta on trigonometriset funktiot (todistus<br />

epätriviaali).<br />

Huomautus 4.1 l p - ja L p -avaruudet voidaan määritellä vastaavasti myös, kun p ≠ 2. Tällöin avaruuksissa<br />

ei ole sisätuloa, mutta ne ovat Banach avaruuksina varsin käyttökelpoisia.<br />

4.2 Gram-Schmidt ja projektio<br />

Olkoon V sisätuloavaruus ja {¯v 1 , ¯v 2 , . . .} joukko lineaarisesti riippumattomia vektoreita. Voimme rakentaa<br />

niistä ortonormitetun joukon<br />

{ē 1 , ē 2 , . . .}, joille 〈ē i |ē j 〉 = δ ij seuraavasti:<br />

Valitaan<br />

ē 1 = ¯v 1<br />

‖¯v 1 ‖ (⇒ 〈ē 1|ē 1 〉 = 1).<br />

Nyt<br />

ja k 2 määrätään ehdosta<br />

e 2 = k 2 (¯v − 〈ē 1 |¯v 2 〉ē 1 ) toteuttaa<br />

⎛<br />

⎞<br />

〈ē 1 |ē 2 〉 = k 2<br />

⎝〈ē 1 |¯v 2 〉 − 〈ē 1 |¯v 2 〉 〈ē 1 |ē 1 〉 ⎠ = 0<br />

} {{ }<br />

=1<br />

1 = 〈ē 2 |ē 2 〉 = |k 2 | 2 ( ‖ ¯v 2 ‖ 2 − |〈ē 1 |¯v 2 〉| 2) .<br />

Jatketaan induktiivisesti: Olkoon ē 1 , . . . , ē n jo rakennettu. Asetetaan<br />

)<br />

n∑<br />

ē n+1 = k n+1<br />

(¯v n+1 − 〈ē i |¯v n+1 〉ē i , (4.14)<br />

joka toteuttaa 〈ē n+1 |ē i 〉 = 0, i = 1, 2, . . . , n ja k n+1 määrätään ehdosta<br />

〈ē n+1 |ē n+1 〉 = 1. (4.15)<br />

Jatkamalla näin saadaan ortonormitettu jono.<br />

i=1


37<br />

Olkoon nyt ē 1 , ē 2 , . . . , ē n ortonormitettu (o.n.) joukko V:n alkioita. Vektoreiden virittämä aliavaruus<br />

L koostuu kaikista vektoreista ū ∈ V , jotka ovat muotoa<br />

ū =<br />

n∑<br />

a i ē i . (4.16)<br />

i=1<br />

Approksimointiongelma: Olkoon ¯v ∈ V annettu. Mikä L:n vektori ū approksimoi ¯v:tä parhaiten, s.o.<br />

mille ū ‖ū − ¯v‖ saa miniminsä?<br />

Kirjoitetaan u = ∑ n<br />

i=1 a iē i ja muodostetaan<br />

F (a 1 , a 2 , . . . , a n ) = ‖ū − ¯v‖ 2<br />

= 〈ū − ¯v|ū − ¯v〉<br />

n∑<br />

= ‖¯v‖ 2 − (a ∗ i 〈ē i |¯v〉 + a i 〈¯v|ē i 〉) +<br />

i=1<br />

Kirjoitetaan a j = b j + ic j , missä b j , c j ∈ R, jolloin<br />

F = ‖¯v‖ 2 +<br />

n∑<br />

|a i | 2 (4.17)<br />

n∑ [<br />

b<br />

2<br />

j + c 2 j − (b j − ic j )〈ē i |¯v〉 − (b j + ic j )〈¯v|ē i 〉 ] , (4.18)<br />

j=1<br />

i=1<br />

jonka stationaariset pisteet:<br />

sekä<br />

∂F<br />

∂b j<br />

= 2b j − (〈ē j |¯v〉 + 〈¯v|ē j 〉)<br />

= 2(b j − Re(〈ē j |¯v〉)) = 0<br />

=⇒ b j = Re(〈ē j |¯v〉),<br />

∂F<br />

∂c j<br />

= 2c j + i(〈ē j |¯v〉 − 〈¯v|ē j 〉)<br />

= 2(c j − Im(〈ē j |¯v〉)) = 0<br />

=⇒ c j = Im(〈ē j |¯v〉).<br />

Nyt siis a j = 〈ē j |¯v〉 eli paras approksimaatio on<br />

n∑<br />

¯v L = 〈ē j |¯v〉ē j . (4.19)<br />

j=1<br />

Voidaan myös määritellä projektio-operaattori P L kaavalla<br />

n∑<br />

P L¯v = ¯v L = 〈ē i |¯v〉ē i , (4.20)<br />

joka on ¯v : n projektio aliavaruudelle L. Kuvaus todellakin on projektio, sillä kaikilla v pätee<br />

PL¯v 2 = P L¯v L<br />

n∑ n∑<br />

= 〈ē i | 〈ē j |¯v〉ē j 〉ē i<br />

=<br />

i=1<br />

i=1<br />

j=1<br />

n∑<br />

〈ē i |¯v〉ē i<br />

i=1<br />

= ¯v L ,


38<br />

eli P 2 L = P L. Määritellään sitten ¯v ⊥ = ¯v − ¯v L , ”¯v:n L:ää vastaan kohtisuora komponentti”, jolle<br />

Lisäksi, jos ū ∈ L, niin ū = ∑ n<br />

j=1 u jē j ja<br />

P L¯v ⊥ = P L¯v − P L¯v L = ¯v L − ¯v L = ¯0.<br />

〈¯v ⊥ |ū〉 =<br />

=<br />

n∑<br />

u i 〈¯v ⊥ |ē i 〉<br />

i=1<br />

n∑<br />

u i<br />

(〈¯v|ē i 〉 −<br />

i=1<br />

= 0,<br />

eli ¯v ⊥ on kohtisuorassa jokaista ū ∈ L kohtaan, erityisesti<br />

Lisäksi tästä seuraa<br />

eli (Besselin epäyhtälö)<br />

)<br />

n∑<br />

〈ē k |¯v〉 ∗ δ kj<br />

k=1<br />

〈¯v ⊥ |¯v L 〉 = 0. (4.21)<br />

‖¯v‖ 2 = ‖¯v ⊥ + ¯v L ‖ 2 = ‖¯v L ‖ 2 + ‖¯v ⊥ ‖ 2 ≥ ‖¯v L ‖ 2<br />

‖¯v‖ 2 ≥<br />

n∑<br />

|〈ē i |¯v〉| 2 . (4.22)<br />

i=1<br />

Otetaan ilman todistusta käyttöön tulos: Separoituvalla 6 Hilbertin avaruudella H on numeroituva<br />

kanta, joka voidaan olettaa ortonormaaliksi. Tällöin jokainen ¯v ∈ H voidaan lausua muodossa<br />

¯v = ∑ k<br />

v k ē k . (4.23)<br />

Nyt<br />

〈ē j |¯v〉 = ∑ k<br />

v k 〈ē j |ē k 〉 = v j<br />

eli<br />

¯v = ∑ k<br />

〈ē k |¯v〉ē k . (4.24)<br />

Lisäksi<br />

‖¯v‖ 2 = ∑ k,l<br />

v ∗ k v l〈ē k |ē l 〉 = ∑ k<br />

|v k | 2<br />

eli<br />

‖¯v‖ 2 = ∑ k<br />

|〈ē k |¯v〉| 2 , (4.25)<br />

joka tunnetaan Parsevalin kaavana.<br />

Huom. Esimerkiksi l 2 , L 2 , C n ja R n ovat separoituvia.<br />

Huom. Erikoistapauksena saamme Parsevalin kaavan Fourier-sarjoille (vrt. FyMM Ib).<br />

6 Avaruus on separoituva jos siihen sisältyy numeroituva tiheä joukko. Esim. R on separoituva, sillä Q on tiheä ja<br />

numeroituva.


39<br />

4.3 Hilbert avaruudet<br />

Kertausta:<br />

– V on C-kertoiminen vektoriavaruus<br />

– Normi: kuvaus ‖·‖ : V → R, jolle<br />

1. ‖u‖ ≥ 0, ‖u‖ = 0 ⇔ u = ¯0.<br />

2. ‖au‖ = |a| ‖u‖, a ∈ C<br />

3. ‖u + v‖ ≤ ‖u‖ + ‖v‖<br />

– Suppeneminen: u n → u ⇔ ‖u n − u‖ → 0<br />

– Cauchyn jono: ‖u n − u m ‖ → 0, n, m → ∞<br />

– Banach-avaruus: Normiavaruus, jonka jokainen Cauchyn jono myös suppenee. (Täydellinen normiavaruus)<br />

– Sisätulo: kuvaus V × V → C, jolle<br />

1. 〈u|v〉 = 〈v|u〉 ∗<br />

2. 〈u|av + bw〉 = a〈u|v〉 + b〈u|w〉<br />

3. 〈u|u〉 ≥ 0, 〈u|u〉 = 0 ⇔ u = ¯0<br />

– Sisätuloavaruus on normiavaruus: ‖u‖ = √ 〈u|u〉<br />

– Hilbert avaruus: Täydellinen sisätuloavaruus.<br />

Lisäksi palautetaan mieleen funktion jatkuvuus<br />

Määritelmä 4.4 Funktio f : V → C on jatkuva (pisteessä u) jos<br />

tai<br />

u n → u =⇒ f(u n ) → f(u) (4.26)<br />

∀ ɛ ∃ δ s.e. ‖u − v‖ < δ =⇒ |f(u) − f(v)| < ɛ. (4.27)<br />

Funktio on jatkuva joukossa A, jos se on jatkuva jokaisessa joukon pisteessä.<br />

Kuvausta ϕ : V → C sanotaan (lineeariseksi) funktionaaliksi, jos se on sekä jatkuva että lineaarinen.<br />

Toisin sanoen ϕ on jatkuva ja ϕ(au + bv) = aϕ(u) + bϕ(v). (Lineaariset) Funktionaalit muodostavat<br />

myös vektoriavaruuden, duaaliavaruuden V ∗ , kun määritellään<br />

(ϕ + ψ)(u) = ϕ(u) + ψ(u)<br />

(aϕ)(u) = aϕ(u)<br />

¯0(u) = 0 ∀ u ∈ V


40<br />

Määritelmä 4.5 Kuvaus ϕ on rajoitettu jos on olemassa M > 0 s.e.<br />

|ϕ(u)| ≤ M ‖u‖ ∀ u ∈ V (4.28)<br />

Lause 4.3 Olkoon V Banach avaruus. Lineaarinen funktionaali ϕ : V → C on jatkuva jos ja vain jos<br />

se on rajoitettu.<br />

Todistus 4.3 ”⇒”. Koska ϕ on jatkuva, se on jatkuva erityisesti origossa. On siis olemassa δ s.e.<br />

|ϕ(u)| < 1, kun ‖u‖ < δ. Olkoon ¯0 ≠ u ∈ V ja δ kuten edellä, jolloin<br />

( )∣ |ϕ(u)| =<br />

2 ‖u‖ δu ∣∣∣<br />

∣ ϕ < 2 ‖u‖ · 1,<br />

δ 2 ‖u‖ δ<br />

sillä<br />

∥ ∥∥∥ δu<br />

2 ‖u‖ ∥ = δ 2 < δ.<br />

M:ksi voidaan siis valita esimerksi 2/δ.<br />

”⇐”. Olkoon ɛ > 0. Jos |ϕ(u)| ≤ M ‖u‖ ∀u ∈ V , niin<br />

joten ϕ on jatkuva.<br />

‖u − v‖ < ɛ M ⇒ |ϕ(u) − ϕ(v)| = |ϕ(u − v)| ≤ M ‖u − v‖ < M · ɛ<br />

M = ɛ,<br />

Esimerkki 4.7 V = l 1 eli jonot (x 1 , x 2 , . . .), joille<br />

‖x‖ =<br />

∞∑<br />

|x k | < ∞. (4.29)<br />

Olkoon c = (c 1 , c 2 , . . .) jono kompleksilukuja ja ϕ c : l 1 → C määritelty kaavalla<br />

k=1<br />

ϕ c (x) =<br />

∞∑<br />

c k x k . (4.30)<br />

ϕ c on selvästi lineaarinen. Jos |c k | < K kaikilla i, niin ϕ c on rajoitettu, sillä<br />

|ϕ c (x)| ≤<br />

k=1<br />

k=1<br />

∞∑<br />

∞∑<br />

|c k x k | ≤ K |x k | = K ‖x‖ .<br />

ϕ on siis jatkuva jos c on rajoitettu. Osoitetaan vielä, että muussa tapauksessa ϕ c ei ole jatkuva. Jos<br />

|c i | ei ole ylhäältä rajoitettu on olemassa osajono (c ij ) ∞ j=1 s.e. |c i j<br />

| → ∞, kun i j → ∞. Käytetään<br />

jatkuvuuden jonomääritelmää, ja muodostetaan jono (x (j) ) ⊂ l 1 , missä<br />

Nyt ∥ ∥x (j)∥ ∥ = 1/|c ij | → 0, koska |c ij | → ∞, mutta<br />

k=1<br />

x (j) = (0, 0, . . . , 0, 1/c ij , 0 . . .).<br />

} {{ }<br />

i j :s<br />

ϕ c (x (j) ) =<br />

∞∑<br />

i=1<br />

c i x (j)<br />

i<br />

= c ij · 1/c ij = 1<br />

kaikilla i, mikä on ristiriita, sillä jatkuvuuden nojalla pitäisi ϕ(x (j) ) → 0 = ϕ x (¯0), koska x (j) → ¯0.


41<br />

Lause 4.4 (Suunnikassääntö) Hilbert avaruudessa pätee<br />

Todistus 4.4 Suora lasku:<br />

‖u + v‖ 2 + ‖u − v‖ 2 = 2 ‖u‖ 2 + 2 ‖v‖ 2<br />

‖u + v‖ 2 + ‖u − v‖ 2 = 〈u + v|u + v〉 + 〈u − v|u − v〉<br />

= 2 ‖u‖ 2 + 2 ‖v‖ 2 + 〈u|v〉 + 〈v|u〉 − 〈u|v〉 − 〈v|u〉<br />

= 2 ‖u‖ 2 + 2 ‖v‖ 2 .<br />

Tästä seuraa mm. ‖u + v‖ 2 ≤ 2 ‖u‖ 2 + 2 ‖v‖ 2 . Suunnikassäännön avulla on myös helppo osoittaa, ettei<br />

jokin normi ole sisätulon määräämä ts. että jokin Banach avaruus ei ole Hilbert avaruus. Esim l p - ja<br />

L p -avaruudet eivät ole Hilbert-avaruuksia, kun p ≠ 2.<br />

Eräs tärkeä Hilbertin avaruus on L 2 (Ω), missä Ω ⊂ R n ja<br />

∫<br />

f ∈ L 2 (Ω) ⇐⇒ ‖f‖ 2 := d n x|f(x)| 2 < ∞.<br />

Sisätulo on<br />

∫<br />

〈f|g〉 =<br />

Ω<br />

Ω<br />

d n xf(x) ∗ g(x).<br />

Samaistetaan f ja g jos ‖f − g‖ = 0 (”f = g melkein kaikkialla”). Seuraava lause on osa Riesz-Fischerin<br />

lauseesta.<br />

Lause 4.5 (Riesz-Fischer, p = 2.)<br />

Jos f 1 , f 2 , . . . on Cauchyn jono L 2 (Ω):ssa, niin on olemassa f ∈ L 2 (Ω) jolle ‖f n − f‖ → 0, kun n → ∞<br />

Todistuksen pääpiirteet. (f n ) Cauchyn jono, joten voidaan siirtyä osajonoon (f nk ), jolle<br />

‖f nk − f nk −1‖ < 2 −n .<br />

Indeksöidään osajono uudelleen, merk. (f k ). Muodostetaan sitten<br />

ja koska<br />

‖h‖ ≤<br />

h(x) =<br />

∞∑<br />

|f k (x) − f k−1 (x)|<br />

k=1<br />

∞∑<br />

‖f k (x) − f k−1 (x)‖ ≤<br />

k=1<br />

∞∑<br />

2 −n = 1<br />

on h 2 integroituva ja tällöin |h(x)| < ∞ melkein kaikkialla. Määritellään<br />

{<br />

fn (x) − f<br />

g n (x) =<br />

n−1 (x), kun |h(x)| < ∞<br />

0 , kun |h(x)| = ∞ .<br />

Nyt haluttu f on ∑ n g n. Näin määritelty f kuuluu L 2 :een, sillä<br />

∥ ∞∑ ∥∥∥∥ ∞∑<br />

‖f‖ =<br />

g n ≤<br />

|g n |<br />

= ‖h‖ (4.31)<br />

∥ ∥ ∥<br />

n=1<br />

n=1<br />

k=1<br />

ja h ∈ L 2 . Lisäksi<br />

‖f − f n ‖ =<br />

∥<br />

∥<br />

∞∑ ∥∥∥∥ ∞∑<br />

∞∑<br />

g k ≤ ‖g k ‖ < 2 −k = 2 −n → 0.<br />

k=n+1<br />

k=n+1 k=n+1


42<br />

4.4 Aliavaruudet ja separoituvuus<br />

Vektoriavaruuden V vektorialiavaruus on mikä tahansa joukko W ⊂ V , jonka alkioille pätee u, v ∈<br />

W ⇒ αu + βv ∈ W kaikilla α, β ∈ C. Hilbert avaruudessa määritellään: Hilbertin avaruuden H<br />

aliavaruus H ′ on H:n vektorialiavaruus, joka on lisäksi joukkona suljettu, t.s. jos u n ∈ H ′ ∀ n ja<br />

‖u n − u‖ → 0, niin u ∈ H ′ . Jos W on H:n vektorialiavaruus, sen sulkeuma W on pienin H:n aliavaruus,<br />

joka sisältää W :n. Oleellisesti W saadaan lisäämällä W :hen kaikkien W :n alkioista muodostettujen<br />

suppenevien jonojen raja-arvot. Olkoon K H:n mielivaltainen osajoukko. K:n generoima<br />

vektorialivaruus L(K) on<br />

{ n∑<br />

}<br />

L(K) = α i u i : α i ∈ C, u i ∈ K . (4.32)<br />

i=1<br />

Vastaavasti K:n generoima H:n aliavaruus on L(K).<br />

Kuten aiemmin todettin (ilman todistusta), jos H on separoituva on olemassa numeroituva joukko<br />

K = {u 1 , u 2 , . . .} ⊂ H s.e. H = L(K). Jos H on separoituva, niin lähtien vektoreista u i voimme<br />

Gram-Schmidtin menetelmää käyttäen ja jättäen pois lineaarisesti riippuvia vektoreita muodostaa<br />

ortonormitetun joukon {e 1 , e 2 , . . .} (〈e i |e j 〉 = δ ij ) ja tällöin<br />

H = L(K) ⇐⇒ H = L({e 1 , e 2 , . . .})<br />

eli separoituvalla Hilbert avaruudella on numeroituva ortonormaali kanta.<br />

Lause 4.6 Jos H on separoituva Hilbert avaruus ja {e 1 , e 2 , . . .} on o.n. kanta, niin jokainen u ∈ H<br />

voidaan esittää yksikäsitteisesti muodossa<br />

u =<br />

∞∑<br />

c i e i , (4.33)<br />

i=1<br />

missä c i = 〈e i |u〉.<br />

Lauseen todistamiseksi ensin kaksi aputulosta.<br />

Apulause 4.1 Hilbert avaruuden sisätulo on jatkuva, t.s. kaikilla u ∈ H pätee<br />

lim v n = v =⇒ lim 〈u|v n〉 = 〈u|v〉.<br />

n→∞ n→∞<br />

Todistus 4.5 |〈u|v n 〉−〈u|v〉| = |〈u|v n −v〉| ≤ ‖u‖ ‖v n − v‖ → 0, missä epäyhtälö on Cauchy-Schwarzin<br />

epäyhtälö (4.8). Oikeastaan pelkkä Cauchy-Schwarzin epäyhtälö riittää kun huomaa että sisätulo on<br />

rajoitettu funktionaali.<br />

Apulause 4.2 Jos {e 1 , e 2 , . . .} on Hilbert avaruuden H o.n. kanta ja 〈v|e k 〉 = 0 kaikilla k, niin v = ¯0<br />

Todistus 4.6 Koska H = L({e 1 , e 2 , . . .}), niin v = lim n→∞ v n , missä v n = ∑ N n<br />

i=1 v n,ie i . Lisäksi<br />

〈v|e k 〉 = 0 ∀ k =⇒ 〈v|v n 〉 = 0.<br />

Nyt aputuloksen 4.1 mukaan<br />

eli v = ¯0.<br />

‖v‖ 2 = 〈v|v〉 = lim<br />

n→∞ 〈v|v n〉 = 0


43<br />

Todistus 4.7 (Lauseen 4.6 todistus) Besselin epäyhtälön mukaan<br />

N∑<br />

|〈e n |u〉| 2 ≤ ‖u‖ 2<br />

n=1<br />

∀ N ∈ N<br />

eli sarja ∑ k |〈e n|u〉| 2 suppenee. Määritellään nyt<br />

jolloin (u n ) on Cauchyn jono, sillä<br />

u N =<br />

‖u N − u M ‖ 2 =<br />

N∑<br />

〈e n |u〉e n ,<br />

n=1<br />

N∑<br />

n=M+1<br />

|〈e n |u〉| 2 −→ 0<br />

osana suppenevan sarjan häntää. Koska H on täydellinen on olemassa u ′ , jolle u n → u ′ . Nyt aputuloksen<br />

4.1 mukaan<br />

Kuitenkin 〈e k |u N 〉 = 〈e k |u〉, kun N ≥ k, joten<br />

〈e k |u − u ′ 〉 = 〈e k |u〉 − 〈e k |u ′ 〉<br />

= 〈e k |u ′ 〉 − lim<br />

N→∞ 〈e k|u N 〉.<br />

lim 〈e k|u N 〉 = 〈e k |u〉 ja 〈e k |u − u ′ 〉 = 0.<br />

N→∞<br />

Koska tämä pätee kaikilla k ∈ N on aputuloksen 4.2 mukaan oltava u − u ′ = ¯0 eli<br />

mikä kuuluikin todistaa.<br />

u = u ′ =<br />

∞∑<br />

〈e n |u〉e n , (4.34)<br />

n=1<br />

Voidaan osoittaa, että esimerkiksi L 2 ([a, b]), L 2 (R) ja L 2 (R n ) ovat separoituvia.<br />

Todistuksn idea. Weierstrassin approksimaatiolauseen mukaan jokaista f ∈ L 2 ([a, b]) voidaan approksimoida<br />

mielivaltaisen tarkasti polynomeilla. Eli kaikilla f ∈ L 2 ([a, b]) on olemassa polynomi<br />

P s.e. ‖f − P ‖ < ɛ. Pätee siis L 2 ([a, b]) = L({1, x, x 2 , . . .}). Monomien joukkoon voi soveltaa Gram-<br />

Schmidtiä tai o.n. kannan voi rakentaa vaikka suoraan Legendren polynomeista. Vastaavasti L 2 (R) =<br />

L({ϕ 0 , ϕ 1 , . . .}, missä<br />

ϕ n (x) =<br />

1<br />

√<br />

2 n n! √ π H n(x)exp<br />

) (− x2<br />

2<br />

ja H n on Hermiten n:s polynomi. Tästä seuraa myös L 2 (R d ):n separoituvuus:<br />

ϕ n1 n 2···n d<br />

(x 1 , x 2 , . . . , x d ) = ϕ n1 (x 1 )ϕ n2 (x 2 ) · · · ϕ nd (x d )<br />

Jotta saisimme todistettua vielä Plancherelin kaavan separoituvissa Hilbert avaruuksissa todistetaan<br />

ensin skalaaritulon jatkuvuus kahden muuttujan funktiona.<br />

Apulause 4.3 Jos u n → u ja v n → v, niin<br />

〈v n |u n 〉 −→ 〈v|u〉


44<br />

Todistus 4.8<br />

|〈v n |u n 〉 − 〈v|u〉| = |〈v n |u n 〉 − 〈v|u n 〉 + 〈v|u n 〉 − 〈v|u〉|<br />

≤ |〈v n |u n 〉 − 〈v|u n 〉| + |〈v|u n 〉 − 〈v|u〉|<br />

≤ ‖u n ‖ ‖v n − v‖ + ‖u n − u‖ ‖v‖<br />

−→ 0,<br />

kun n → ∞.<br />

Lause 4.7 (Plancherel) Olkoon {e 1 , e 2 , . . .} Hilbertin avaruuden H o.n. kanta. Tällöin kaikilla u, v ∈<br />

H pätee<br />

∞∑<br />

〈u|v〉 = 〈u|e n 〉〈e n |v〉. (4.35)<br />

n=1<br />

Todistus 4.9 Määritellään<br />

Nyt apulauseen 4.3 mukaan<br />

u n =<br />

v n =<br />

n∑<br />

〈e i |u〉e i (−→ u) ja<br />

i=1<br />

n∑<br />

〈e i |v〉e i (−→ v).<br />

i=1<br />

〈u|v〉 = lim 〈u n|v n 〉<br />

n→∞<br />

n∑ n∑<br />

= lim 〈u|e i 〉〈e i |e j 〉〈e j |v〉<br />

n→∞<br />

= lim<br />

n→∞<br />

=<br />

i=1 j=1<br />

n∑<br />

〈u|e i 〉〈e i |v〉<br />

i=1<br />

∞∑<br />

〈u|e i 〉〈e i |v〉.<br />

Huom. erikoistapaus u = v, jolloin ‖u‖ = ∑ i |〈e i|u〉| 2 (Parseval).<br />

i=1<br />

Kertauksena u, v ∈ H ovat ortogonaalisia (u⊥v) jos 〈u|v〉 = 0. Olkoon V H:n aliavaruus, sen ortogonaalinen<br />

komplementti on<br />

V ⊥ = {u : u⊥v ∀ v ∈ V } . (4.36)<br />

Myös V ⊥ on H:n aliavaruus:<br />

Se on vektoriavaruus, koska<br />

u, u ′ ∈ V ⊥ =⇒ 〈au + bu ′ |v〉 = a ∗ 〈u|v〉 + b ∗ 〈u ′ |v〉 = 0 + 0 = 0<br />

kaikilla v ∈ V eli au + bu ′ ∈ V ⊥ . Lisäksi se on suljettu, sillä jos u n ∈ V ⊥ ja u n → u, niin<br />

〈u|v〉 = lim<br />

n→∞ 〈u n|v〉 = lim<br />

n→∞ 0 = 0<br />

eli u ∈ V ⊥ .<br />

Huom. V ∩ V ⊥ = {¯0}, sillä jos v ∈ V ∩ V ⊥ , niin 〈v|v〉 = 0 eli v = ¯0.<br />

Lause 4.8 Jos V on Hilbert avaruuden H aliavararuus, niin jokainen u ∈ H voidaan yksikäsitteisesti<br />

hajoittaa muotoon u = u ′ + u ′′ , missä u ′ ∈ V ja u ′′ ∈ V ⊥ .


45<br />

Todistus 4.10 (Olemme jo todistaneet lauseen äärellisulotteisen aliavaruuden tapauksessa ja nyt tehdään<br />

se yleisesti.) Olkoon u ∈ H annettu, merkitään<br />

d = inf {‖u − v‖ : v ∈ V } (4.37)<br />

Olkoon (v n ) jokin V:n jono jolle ‖u − v n ‖ → d. (v n ) on Cauchyn jono, sillä suunnikassäänön mukaan<br />

‖u − v m ‖ 2 + ‖u − v n ‖ 2 =<br />

∥ u − 1 2 (v n + v m ) + 1 2 (v 2<br />

n − v m )<br />

∥<br />

+<br />

∥ u − 1 2 (v n + v m ) − 1 2 (v 2<br />

n − v m )<br />

∥<br />

= 2<br />

∥ u − 1 2 (v 2<br />

n + v m )<br />

∥ + 2<br />

1<br />

∥2 (v n − v m )<br />

∥<br />

2<br />

,<br />

joten<br />

‖v n − v m ‖ 2 = 2 ‖u − v n ‖ 2 + 2 ‖u − v m ‖ 2 − 4<br />

∥ u − 1 2 (v n + v m )<br />

∥<br />

2<br />

joka lähestyy nollaa, kun n, m → ∞, sillä<br />

‖u − v n ‖ 2 −→ d 2<br />

‖u − v m ‖ 2 −→ d 2<br />

∥ u − 1 2 (v 2<br />

n + v m )<br />

∥ −→ d 2 .<br />

V on suljettu joten on olemassa u ′ ∈ V s.e. v n → u ′ . Määritellän u ′′ = u − u ′ (‖u ′′ ‖ = d). Osoitetaan,<br />

että u ′′ ∈ V ⊥ . Olkoon v ∈ V ja v 0 = v/ ‖v‖. Koska V on vektoriavaruus ja u ′ , v 0 ∈ V , niin u ′ +<br />

〈v 0 |u ′′ 〉v 0 ∈ V . Tällöin<br />

d 2 ≤ ∥ ∥ u − (u ′ + 〈v 0 |u ′′ 〉v 0 ) ∥ ∥ 2<br />

= ∥ ∥u ′′ − 〈v 0 |u ′′ 〉v 0<br />

∥ ∥<br />

2<br />

= ∥ ∥u ′′∥ ∥ 2 − |〈v 0 |u ′′ 〉| 2<br />

= d 2 − |〈v 0 |u ′′ 〉| 2 .<br />

Tämä on mahdollista vain jos 〈v 0 |u ′′ 〉 = 0 eli 〈v|u ′′ 〉 = 0, joten u ′′ ∈ V ⊥ ja u = u ′ − u ′′ on haluttu<br />

esitys. Lisäksi esitys on yksikäsitteinen: Oletetaan, että on olemassa u ′ , v ′ ∈ V ja u ′′ , v ′′ ∈ V ⊥ s.e.<br />

u = u ′ + u ′′ = v ′ + v ′′ . Tällöin<br />

u<br />

} ′ {{<br />

− v<br />

}<br />

′ =<br />

}<br />

u ′′ {{<br />

− v ′′<br />

}<br />

∈V ∈V ⊥<br />

eli u ′ − v ′ = u ′′ − v ′′ = ¯0, sillä V ∩ V ⊥ = {¯0}.<br />

Seuraus 4.1 (V ⊥ ) ⊥ = V .<br />

Todistus 4.11 ”⊇”. Jos v ∈ V , niin 〈v|u〉 = 0 ∀ u ∈ V ⊥ ⇒ v ∈ (V ⊥ ) ⊥ ⇒ V ⊆ (V ⊥ ) ⊥ .<br />

”⊆”. Olkoon v ∈ (V ⊥ ) ⊥ . v = v ′ + v ′′ joillakin v ′ ∈ V, v ′′ ∈ V ⊥ . Edellisen kohdan mukaan v ′ ∈ V ⊆<br />

(V ⊥ ) ⊥ , joten v ′′ = v − v ′ ∈ (V ⊥ ) ⊥ sekä (V ⊥ ) joten v ′′ = ¯0 ja siis v ∈ V eli (V ⊥ ) ⊥ ⊆ V .<br />

Nyt V ⊆ (V ⊥ ) ⊥ & (V ⊥ ) ⊥ ⊆ V =⇒ (V ⊥ ) ⊥ = V .


46<br />

4.5 Hilbertin avaruuden jatkuvat funktionaalit<br />

Olemme jo kahdesti (4.8 ja 4.1) osoittaneet, että kuvaus u ↦→ 〈v|u〉 on jatkuva kaikilla v ∈ H ja<br />

lisäksi se on määritelmänsä mukaan lineaarinen. Seuraava lause osoittaa että kaikki Hilbert avaruuden<br />

jatkuvat funktionaalit ovat tätä muotoa.<br />

Lause 4.9 (Rieszin esityslause) Jos ϕ on Hilbert avaruuden jatkuva funktionaali, niin on olemassa<br />

yksikäsitteinen vektori v ∈ H s.e. ϕ(u) = 〈v|u〉 ∀ u ∈ H.<br />

Todistus. Olkoon V = Ker(ϕ) := {x ∈ H : ϕ(x) = 0}, joka on H:n aliavaruus: x, y ∈ V ⇒ ϕ(ax+by) =<br />

aϕ(x) + bϕ(y) = 0. Lisäksi V on ϕ:n jatkuvuuden nojalla suljettu.<br />

Jos V = H, niin ϕ(u) = 0 ∀ u ∈ H ja voidaan valita v = ¯0. Tämä on yksikäsitteinen, sillä 〈v|u〉 =<br />

0 ∀ u ∈ H vain kun v = ¯0.<br />

Jos V ≠ H, niin on olemassa ¯0 ≠ w ∈ H \ V , joka voidaan esittää w = w ′ + w ′′ , missä w ′ ∈ V ja<br />

w ′′ ∈ V ⊥ . Huomataan<br />

joten mielivaltaiselle u ∈ H voidaan kirjoittaa<br />

ϕ(w ′′ ) = ϕ(w − w ′ ) = ϕ(w) − ϕ(w ′ ) = ϕ(w) ≠ 0,<br />

u = u − ϕ(u)<br />

ϕ(w ′′ ) w′′ + ϕ(u)<br />

ϕ(w<br />

} {{ }<br />

′′ ) w′′ . (4.38)<br />

} {{ }<br />

∈V<br />

∈V ⊥<br />

Olkoon nyt v = ϕ(w ′′ ) ∗<br />

w′′<br />

‖w ′′ ‖ 2<br />

∈ V ⊥ , jolloin<br />

〈v|u〉 = ϕ(w′′ )<br />

‖w ′′ ‖ 2 〈w′′ | ϕ(u)<br />

ϕ(w ′′ ) w′′ 〉<br />

= ϕ(u)<br />

‖w ′′ ‖ 2 〈w′′ |w ′′ 〉<br />

= ϕ(u). (4.39)<br />

Lisäksi löydetty v on yksikäsitteinen, sillä jos 〈v|u〉 = 〈v ′ |u〉 ∀ u ∈ H, niin valitsemalla u = v − v ′<br />

saadaan ‖v − v ′ ‖ 2 = 0 eli v − v ′ = ¯0.<br />

Rieszin esityslause sanoo siis, että on olemassa 1-1 vastaavuus H:n ja sen duaalin H ∗ välillä (ϕ ↔ v).<br />

5 Operaattorit<br />

5.1 Perusominaisuudet<br />

Olkoon V normitettu vektoriavaruus. Operaattori A on lineaarinen kuvaus A : V → V , u ↦→ Au ja<br />

A(αu + βv) = αAu + βAv.<br />

Lisäksi operaattori A on jatkuva jos u n → u ⇒ Au n → Au t.s. ∀ ɛ > 0 ∃ δ > 0 s.e. ‖u − v‖ < δ ⇒<br />

‖Au − Av‖ < ɛ.<br />

Operaattori on rajoitettu jos on olemassa K > 0 s.e. ‖Au‖ ≤ K ‖u‖ kaikilla u ∈ V ja aivan kuten<br />

funktionaaleilla nämä kaksi ovat yhtäpitäviä ominaisuuksia.<br />

Lause 5.1 A on rajoitettu ⇐⇒ A on jatkuva.<br />

Todistus 5.1 ”⇒”. Olkoon ɛ > 0. Nyt<br />

‖u − v‖ < ɛ K ⇒ ‖Au − Av‖ = ‖A(u − v)‖ < ɛ K K = ɛ.


47<br />

”⇐”. Jos A ei olisi rajoitettu pitäisi jokaiselle K > 0 löytyä u K s.e ‖Au K ‖ ≥ K ‖u K ‖. Määritellään<br />

jolloin<br />

w K =<br />

‖Aw K ‖ ≥<br />

u K<br />

K ‖u K ‖ ⇒ ‖w K‖ = 1 K ,<br />

1<br />

K ‖u K ‖ K ‖u K‖ = 1.<br />

Kun K → ∞, niin w K → ¯0, mutta ‖Aw K ‖ → 1 ≠ 0, mikä on ristiriidassa jatkuvuuden kanssa, joten<br />

A:n täytyy olla rajoitettu.<br />

Määritellään rajoitetun operaattorin normi:<br />

Pätee<br />

‖A‖ = sup ‖Au‖ . (5.1)<br />

‖u‖≤1<br />

( )∥ ‖Au‖ = ‖u‖<br />

u ∥∥∥<br />

∥ A ≤ ‖u‖ ‖A‖ ,<br />

‖u‖<br />

joten A on rajoitettu (eli jatkuva) jos ja vain jos sen normi on äärellinen.<br />

Esimerkki 5.1 V = l 2 eli jonot x = (x 1 , x 2 , . . .), joille<br />

Määritellään siirto-operaattorit S − ja S + :<br />

Nyt<br />

‖x‖ 2 =<br />

∞∑<br />

|x i | 2 < ∞<br />

i=1<br />

S + (x 1 , x 2 , x 3 , x 4 , . . .) = (0, x 1 , x 2 , x 3 , . . .) (5.2)<br />

S − (x 1 , x 2 , x 3 , x 4 , . . .) = (x 2 , x 3 , x 4 , . . .) (5.3)<br />

‖S + x‖ 2 = 0 +<br />

‖S − x‖ 2 =<br />

∞∑<br />

|x n | 2 = ‖x‖ 2<br />

n=1<br />

∞∑<br />

|x n | 2 = ‖x‖ 2 − |x 1 | ≤ ‖x‖ 2 ,<br />

n=2<br />

joten molemmat ovat rajoitettuja. Ilmeisesti ‖S + ‖ = 1, mutta myös ‖S − ‖ = 1, sillä esimerkiksi<br />

‖S − (0, 1, 0, 0, . . .)‖ = ‖(1, 0, 0, . . .)‖ = 1 = ‖(0, 1, 0, 0, . . .)‖ .<br />

Operaattoreiden A : V → V ja B : V → V tulo määritellään kaavalla (AB)u = A(Bu). Määritelmästä<br />

seuraa A(BC) = (AB)C (”assosiatiivisuus”). Ilmeisesti pätee id V A = Aid V = A, A 2 = AA, A k =<br />

AA k−1 = A k−1 A (sovitaan A 0 = id V ).<br />

Jos A on rajoitettu ja löytyy rajoitettu operaattori A −1 s.e. AA −1 = A −1 A = id V (Huom. molempien<br />

on oltava voimassa!), niin A −1 on A:n käänteisoperaattori. Jos käänteisoperaattori on olemassa, se on<br />

yksikäsitteinen, sillä jos BA = A −1 A = id V , niin BA = BAA −1 = A −1 AA −1 = A −1 .<br />

Esimerkki 5.2 Jatkoa esimerkkiin 5.1. Kaikilla x ∈ l 2 pätee<br />

S − S + x = S − S + (x 1 , x 2 , x 3 , x 4 , . . .)<br />

= S − (0, x 1 , x 2 , x 3 , . . .)<br />

= (x 1 , x 2 , x 3 , x 4 , . . .)<br />

= x<br />

⇒ S − S + = id l 2.


48<br />

Mutta<br />

S + S − x = S + S − (x 1 , x 2 , x 3 , x 4 )<br />

= S + (x 2 , x 3 , x 4 , x 5 , . . .)<br />

= (0, x 2 , x 3 , x 4 , . . .)<br />

≠ x<br />

⇒ S + S − ≠ id l 2.<br />

S + ja S − eivät siis ole toistensa käänteisoperaattoreita.<br />

Lause 5.2 (Neumannin sarja) Jos V on Banach avaruus ja A V :n operaattori s.e. ‖A‖ < 1, niin<br />

id V − A:lla on käänteisoperaattori<br />

∞∑<br />

(id V − A) −1 = A n . (5.4)<br />

Todistus 5.2 Kaikilla x ∈ V pätee<br />

∥<br />

∥A k ∥<br />

x∥ ≤ ‖A‖ ∥A k−1 ∥ x∥ ≤ ‖A‖ 2 ∥A k−2 x∥ ≤ . . . ≤ ‖A‖ k ‖x‖ ,<br />

joten A k on rajoitettu ja ∥ ∥A k∥ ∥ ≤ ‖A‖ k . Huomataan, että vektorit u n = (id V + A + A 2 + . . . + A n )x<br />

muodostavat Cauchyn jonon (n ≥ m):<br />

n=0<br />

‖u n − u m ‖ = ∥ ∥(A m+1 + A m+2 + . . . + A n )x ∥ ∥<br />

= (‖A‖ m+1 + ‖A‖ m+2 + . . . + ‖A‖ n ) ‖x‖<br />

≤ ‖A‖m+1<br />

1 − ‖A‖ ‖x‖<br />

−→ 0.<br />

Koska V on täydellinen, on olemassa u ∈ V s.e. u n → u. Määritellään operaattori T : V → V kaavalla<br />

T x = u, joka on lineearinen ja<br />

M∑<br />

(T − A n )x = u − u M → ¯0.<br />

Voimme siis kirjoittaa<br />

Lisäksi nähdään<br />

eli T = (id V − A) −1 .<br />

5.2 Adjungoitu operaattori<br />

n=0<br />

T =<br />

∞∑<br />

A n .<br />

n=0<br />

(id V − A)T = id V + A + A 2 + . . . − A − A 2 − . . .<br />

= id V<br />

= T (id V − A)<br />

Olkoon H Hilbert avaruus ja A : H → H rajoitettu operaattori H:lla. Operaattorin adjungoitu operaattori<br />

A † : H → H määritellään yhtälön<br />

〈u|Av〉 = 〈A † u|v〉 ∀ u, v ∈ H (5.5)


49<br />

avulla. Määritelmä on mielekäs, sillä kun u on annettu, funktionaali ϕ u (v) = 〈u|Av〉 on selvästi lineaarinen<br />

ja lisäksi jatkuva, koska<br />

|ϕ u (v)| = |〈u|Av〉| ≤ ‖u‖ ‖Av‖ ≤ ‖u‖ ‖A‖ ‖v‖ =: K ‖v‖ .<br />

Rieszin esityslauseen nojalla on olemassa yksikäsitteinen vektori A † u ∈ H s.e. ϕ u (v) = 〈A † u|v〉. Lisäksi<br />

A † on lineaarinen:<br />

〈A † (au + bw)|v〉 = 〈au + bw|Av〉<br />

= a ∗ 〈u|Av〉 + b ∗ 〈w|Av〉<br />

= a ∗ 〈A † u|v〉 + b ∗ 〈A † w|v〉<br />

= 〈aA † u + bA † w|v〉.<br />

Sekä jatkuva:<br />

∥<br />

∥A † u∥ 2 = 〈A † u|A † u〉<br />

= 〈u|AA † u〉<br />

∥<br />

(Schwarz) → ≤ ‖u‖ ∥AA † u∥<br />

∥<br />

≤ ‖u‖ ‖A‖ ∥A † u∥<br />

∥<br />

⇒ ∥A † u∥ ≤ ‖A‖ ‖u‖ .<br />

Esimerkki 5.3 (l 2 :n siirto-operaattoreiden adjungaatit)<br />

S + (x 1 , x 2 , x 3 , x 4 , . . .) = (0, x 1 , x 2 , x 3 , . . .)<br />

S − (x 1 , x 2 , x 3 , x 4 , . . .) = (x 2 , x 3 , x 4 , . . .).<br />

Huomataan, että pätee<br />

〈y|S + x〉 =<br />

〈S − y|x〉 =<br />

∞∑<br />

yi ∗ (S + x) i =<br />

i=1<br />

∞∑<br />

(S − y) ∗ i x i =<br />

∞∑<br />

i=1<br />

i=1<br />

i=1<br />

y ∗ i+1x i<br />

∞∑<br />

yi+1x ∗ i ,<br />

joten S − = S † + . Ilmeisesti myös S + = S † − (itse asiassa aina pätee (A† ) † = A).<br />

Esimerkki 5.4 Olkoon H = L 2 (X) ja α : X → C rajoitettu (|α(x)| ≤ M ∀ x ∈ X). Määritellään<br />

kertomisoperaattori A α kaavalla (A α f)(x) = α(x)f(x). Se on rajoitettu:<br />

∫<br />

∫<br />

‖A α f‖ 2 = dx |α(x)| 2 |f(x)| 2 ≤ M 2 dx|f(x)| 2 = M 2 ‖f‖ 2 .<br />

X } {{ }<br />

X<br />

≤M 2<br />

Lisäksi kaikilla f, g ∈ L 2 (X) pätee<br />

∫<br />

∫<br />

〈f|A α g〉 = dxf(x) ∗ α(x)g(x) =<br />

eli (A † αf)(x) = α(x) ∗ f(x).<br />

X<br />

X<br />

dx(f(x)α(x) ∗ ) ∗ g(x) = 〈α ∗ f|g〉


50<br />

Operaattorin A matriisielementti vektoreiden u ja v välillä on 〈u|Av〉. Jos H on separoituva ja<br />

{e i : i ∈ N} on sen o.n. kanta, voidaan kirjoittaa<br />

∞∑<br />

Ae j = e i a ij<br />

missä a ij on matriisielementti 〈e i |Ae j 〉. Jos taas<br />

u =<br />

i=1<br />

∞∑<br />

u i e i ja v =<br />

i=1<br />

niin (vrt. vektori-matriisitoimituksiin A · v ja u ∗ · A · v)<br />

ja<br />

Operaattoritulolle<br />

Av =<br />

∞∑<br />

v i Ae i =<br />

i=1<br />

∞∑<br />

j=1 i=1<br />

〈u|Av〉 =<br />

∞∑<br />

v i e i ,<br />

i=1<br />

∞∑<br />

v i a ji e j =<br />

∞∑<br />

j=1 i=1<br />

(<br />

∞∑ ∑ ∞<br />

)<br />

a ji v i e j (5.6)<br />

j=1<br />

i=1<br />

〈e i |ABe j 〉 = 〈A † e i |Be j 〉<br />

∞∑<br />

(Parseval) → = 〈A † e i |e k 〉〈e k |Be j 〉<br />

=<br />

=<br />

k=1<br />

∞∑<br />

u ∗ ja ji v i . (5.7)<br />

∞∑<br />

〈e i |Ae k 〉〈e k |Be j 〉<br />

k=1<br />

∞∑<br />

a ik b kj (5.8)<br />

k=1<br />

= (AB) ij<br />

Annetussa kannassa voidaan siis operaattoria kuvata (yl. ∞×∞) matriisilla. Adjungoidun operaattorin<br />

matriisi:<br />

a ij = 〈e i |Ae j 〉 = 〈A † e i |e j 〉 = 〈e j |A † e i 〉 ∗ = (a † ji )∗<br />

(<br />

)<br />

eli adjungoidun operaattorin matriisi on siis operaattorin matriisin hermiittinen konjugaatti (M † ) ij = (M) ∗ ji .<br />

5.3 Hermiittiset ja unitaariset operaattorit, projektio<br />

Operaattori on hermiittinen jos A † = A. Tästä seuraa<br />

Separoituvassa Hilbert avaruudessa ({e i } o.n. kanta)<br />

〈u|Av〉 = 〈A † u|v〉 = 〈Au|v〉. (5.9)<br />

a ij = 〈e i |Ae j 〉 = 〈Ae i |e j 〉 = 〈e j |Ae i 〉 ∗ = a ∗ ji,<br />

toisin sanoen hermiittisen operaattorin matriisi on hermiittinen (matriisi on hermiittinen jos M ij =<br />

M ∗ ji ).<br />

Aikaisemmin todistimme: Jos M on Hilbert avaruuden H aliavaruus niin kaikilla u ∈ H on yksikäsitteinen<br />

hajoitelma u = u ′ + u ′′ , missä u ′ ∈ M ja u ′′ ∈ M ⊥ . Määrittelemme projektio-operaattorin:<br />

P M : H → H, P M u = u ′<br />

ja kutsumme u ′ :a vektorin u kohtisuoraksi projektioksi aliavaruudelle M.


51<br />

Lause 5.3 Jokaiselle aliavaruudelle M projektio-operaattori P M on rajoitettu, hermiittinen ja toteuttaa<br />

P 2 M = P M. Kääntäen jokainen yhtälön P 2 = P toteuttava hermiittinen operaattori on projektio jollekin<br />

H:n aliavaruudelle.<br />

Todistus 5.3 P M on hermiittinen:<br />

P M on rajoitettu:<br />

eli ‖P M ‖ 2 ≤ 1.P 2 M = P M:<br />

〈u|P M v〉 = 〈u|v ′ 〉 = 〈u ′ + u ′′ |v ′ 〉 = 〈u ′ |v ′ 〉 = 〈u ′ |v ′ + v ′′ 〉 = 〈P M u|v〉.<br />

‖P M u‖ 2 = ∥ ∥ u<br />

′ ∥ ∥ 2 ≤ ∥ ∥ u<br />

′ ∥ ∥ 2 + ∥ ∥u ′′∥ ∥ 2 = ∥ ∥u ′ + u ′′∥ ∥ 2 = ‖u‖ 2 .<br />

P 2 Mu = P M u ′ = u ′ = P M u ∀ u ∈ H ⇒ P 2 M = P M .<br />

Käänteinen puoli: Olkoon P † = P = P 2 . P on rajoitettu, koska<br />

‖P u‖ 2 = |〈P u|P u〉| = |〈u|P 2 u〉| = |〈u|P u〉| ≤ ‖u‖ ‖P u‖<br />

eli ‖P u‖ ≤ ‖u‖. P projektio-operaattori: Olkoon M = {u : u = P u}. M on vektoriavaruus, sillä<br />

u = P u & v = P v ⇒ P (au + bv) = aP u + bP v = au + bv. Lisäksi M on suljettu: jos u n → u ja<br />

P u n = u n , niin<br />

u = lim u n = lim P u n =<br />

n→∞ n→∞ }{{} P u.<br />

P jva.<br />

M on siis H:n aliavaruus. Olkoon v ∈ H, määritellään<br />

Nyt v ′′ ∈ M ⊥ , sillä jos w ∈ M, niin<br />

Siis P on projektio M:lle.<br />

U : H → H on unitaarinen, jos<br />

v ′ = P v<br />

v ′′ = (id H − P )v = v − v ′ .<br />

〈v ′′ |w〉 = 〈v − P v|w〉<br />

= 〈v|w〉 − 〈P v|w〉<br />

= 〈v|w〉 − 〈v|P w〉<br />

= 〈v|w〉 − 〈v|w〉<br />

= 0.<br />

ja U −1 on olemassa. Suoraan määritelmästä seuraa:<br />

joten<br />

Lisäksi<br />

〈Uu|Uv〉 = 〈u|v〉 ∀ u, v ∈ H (5.10)<br />

〈U † Uu|v〉 = 〈u|v〉 ∀ u, v ∈ H,<br />

U † U = id H eli U −1 = U † .<br />

‖Uu‖ 2 = 〈Uu|Uu〉 = 〈u|u〉 = ‖u‖ 2 (5.11)<br />

eli U on isometrinen (säilyttää normin). Kääntäen jokainen isometrinen operaattori S on unitaarinen:<br />

〈S(u + v)|S(u + v)〉 − i〈S(u + iv)|S(u + iv)〉<br />

= 〈u + v|u + v〉 − i〈u + iv|u + iv〉. (5.12)


52<br />

Purkamalla sisätulot auki ja käyttämällä isometrisyyttä uudelleen saadaan:<br />

Pätee siis<br />

Oikea puoli = 〈u|u〉 + 〈u|v〉 + 〈v|u〉 + 〈v|v〉<br />

− i〈u|u〉 + 〈u|v〉 − 〈v|u〉 − i〈v|v〉<br />

= (1 − i)〈u|v〉 + (1 − i)〈v|v〉 + 2〈u|v〉.<br />

Vasen puoli = 〈Su|Su〉 + 〈Su|Sv〉 + 〈Sv|Su〉 + 〈Su|Sv〉<br />

− i〈Su|Su〉 + 〈Su|Sv〉 − 〈Sv|Su〉 − i〈Sv|Sv〉<br />

= (1 − i)〈Su|Su〉 + (1 − i)〈Sv|Sv〉 + 2〈Su|Sv〉<br />

(S isom. →) = (1 − i)〈u|u〉 + (1 − i)〈v|v〉 + 2〈Su|Sv〉.<br />

5.12 ⇐⇒ 2〈Su|Sv〉 = 2〈u|v〉<br />

jakamalla tämä 2:lla saadaan 〈Su|Sv〉 = 〈u|v〉 eli S on unitaarinen.<br />

Olkoon nyt H separoituva, {e k } o.n. kanta sekä U unitaarinen operaattori H:lla. Tällöin myös vektorit<br />

e ′ i = Ue i muodostavat o.n. kannan, sillä<br />

〈e ′ i|e ′ j〉 = 〈Ue i |Ue j 〉 = 〈e i |e j 〉 = δ ij .<br />

Kääntäen jos {e ′ k } ja {e k} ovat kaksi o.n. kantaa ja määritellään operaattori U s.e. Ue i = e ′ i ∀ i ∈ N,<br />

niin U on unitaarinen: Olkoon<br />

∞∑<br />

∞∑<br />

u = u i e i ja v = v i e i .<br />

Tällöin<br />

i=1<br />

i=1<br />

i=1<br />

∞∑ ∞∑<br />

〈Uu|Uv〉 = 〈 u i Ue i | v j Ue j 〉 =<br />

=<br />

j=1<br />

∞∑<br />

u ∗ i v j δ ij =<br />

i,j=1<br />

∞∑<br />

u ∗ i v j 〈e ′ i|e ′ j〉<br />

i,j=1<br />

∞∑<br />

u ∗ i v i = 〈u|v〉<br />

i=1<br />

eli U on unitaarinen.<br />

6 Spektraaliteoriaa<br />

6.1 Ominaisvektorit<br />

Määritelmä 6.1 α ∈ C on rajoitetun operaattorin A : H → H ominaisarvo, jos on olemassa ¯0 ≠ u ∈<br />

H s.e. Au = αu. Tällöin u on operaattorin A ominaisvektori.<br />

Huom. Au = αu → A(βu) = α(βu). Monikäsitteisyyttä voidaan rajoittaa vaatimalla esimerkiksi<br />

‖u‖ 2 = 1. Voi olla myös v ≠ βu, jolle Av = αv. Tällöin ominaisarvo on degeneroitunut.<br />

Lause 6.1 Hermiittisen operaattorin ominaisarvot ovat reaalisia ja erisuuria ominaisarvoja vastaavat<br />

ominaisvektorit ovat ortogonaalisia. (vrt. Sturm-Liouville)<br />

Todistus 6.1 Olkoon α ja u s.e. Au = αu. Nyt<br />

ja koska 〈u|u〉 ≠ 0 (u ≠ ¯0) on oltava α = α ∗ .<br />

Jos lisäksi Av = βv, α ≠ β, niin<br />

α〈u|u〉 = 〈u|Au〉 = 〈A † u|u〉 = 〈Au|u〉 = α ∗ 〈u|u〉<br />

β〈u|v〉 = 〈u|Av〉 = 〈A † u|v〉 = α〈u|v〉<br />

eli (α − β)〈u|v〉 = 0, ja koska α ≠ β on oltava 〈u|v〉 = 0.


53<br />

Sanomme, että operaattori A on täydellinen, jos sen ominaisvektorit muodostavat täydellisen o.n.<br />

joukon, eli mielivaltainen u ∈ H voidaan esittää<br />

u = ∑ α<br />

c α u α , (6.1)<br />

missä Au α = αu α .<br />

Esimerkki 6.1 (Projektio-operaattorin täydellisyys) Projektioille P 2 = P , joten jos P u = αu,<br />

niin<br />

αu = P u = P 2 u = αP u = α 2 u.<br />

Tällöin siis α 2 = α eli α = 1 tai 0. P projisoi jollekin aliavaruudelle M:<br />

u ∈ M =⇒ P u = u (ominaisarvo 1)<br />

u ∈ M 2 =⇒ P u = 0 (ominaisarvo 0).<br />

Todistimme aiemmin, että mikä tahansa u ∈ H voidaan esittää u = u ′ + u ′′ , missä u ′ ∈ M ja u ′′ ∈<br />

M ⊥ . Erityisesti nämä ovat P M :n ominaisvektoreita ja ortogonaalisia, joten projektio-operaattorit ovat<br />

täydellisiä.<br />

Lause 6.2 Unitaarisen operaattorin ominaisarvot ovat muotoa α = e ia , missä a ∈ R, ja erisuuria<br />

ominaisarvoja vastaavat ominaisvektorit ovat ortogonaalisia.<br />

Todistus 6.2 Jos Uu = αu, niin<br />

eli |α| = 1 t.s. α = e ia , jollakin a ∈ R.<br />

Olkoon lisäksi Uv = βv, α ≠ β. Tällöin<br />

Lisäksi<br />

eli U † u = α −1 u = α ∗ u (|α| = 1). Pätee siis<br />

ja koska α ≠ β on oltava 〈u|v〉 = 0.<br />

6.2 Rajoitetun operaattorin spektri<br />

‖u‖ = ‖Uu‖ = ‖αu‖ = |a| ‖u‖ ,<br />

β〈u|v〉 = 〈u|Uv〉 = 〈U † u|v〉.<br />

U † U = id H =⇒ u = U † Uu = αU † u,<br />

β〈u|v〉 = 〈α ∗ u|v〉<br />

⇐⇒ (α − β)〈u|v〉 = 0,<br />

Äärellisulotteisessa sisätuloavaruudessa (dim(V ) = n) on kannan valinnan jälkeen ”operaattori ⇔ n×n<br />

matriisi”. (Äärellisulotteisella) Matriisilla on aina ominaisarvoja: det(M − λI) on n:nnen asteen yhtälö<br />

λ:lle ja algebran peruslauseen mukaan sillä on aina juuri(a). Ääretönulotteisessa avaruudessa tilanne<br />

on monimutkaisempi.<br />

Esimerkki 6.2 H = l 2 . Tutkitaan Siirto-operaattoreita S + , S − : l 2 → l 2<br />

S + (x 1 , x 2 , x 3 , . . .) = (0, x 1 , x 2 , . . .) (6.2)<br />

S − (x 1 , x 2 , x 3 , . . .) = (x 2 , x 3 , x 4 , . . .) (6.3)<br />

Jos (0, x 1 , x 2 , . . .) = S + (x 1 , x 2 , . . .) = α(x 1 , x 2 , . . .), niin on oltava αx 1 = 0.


54<br />

Jos x 1 = 0, niin x 2 = 0, joten x 3 = 0, joten x 4 = 0 jne. x i = 0 ∀ i ∈ N. ¯0 ei kuitenkaan kelpaa<br />

ominaisvektoriksi.<br />

Jos taas α = 0, niin x 1 = αx 2 = 0, x 2 = αx 3 = 0 jne. a i = αx i+1 = 0 ∀ i ∈ N. ¯0 ei kuitenkaan kelpaa<br />

ominaisvektoriksi, joten S + :lla ei ole ominaisvektoreita!<br />

Jos (x 2 , x 3 , . . .) = S − (x 1 , x 2 , . . .) = α(x 1 , x 2 , . . .), niin on oltava<br />

x 2 = αx 1<br />

x 3 = αx 2 = α 2 x 1<br />

x 4 = αx 3 = α 3 x 1<br />

.<br />

x i = αx i−1 = α i−1 x 1 ,<br />

joten ominais vektori on muotoa x = x 1 (1, α, α 2 , . . .). Lisäksi jotta<br />

‖x‖ 2 = |x 1 | 2<br />

∞ ∑<br />

n=0<br />

|α| 2n < ∞,<br />

on oltava |α| < 1. Jokainen α ∈ C, jolle |α| < 1 on siis ominaisarvo! Huomaa ero (vaikka S − = S † + )!<br />

Esimerkki 6.3 H = L 2 ([a, b])<br />

Määritellään operaattori X : L 2 → L 2 :<br />

Huomataan:<br />

‖Xf‖ 2 =<br />

∫ b<br />

a<br />

(Xf)(x) = xf(x) (6.4)<br />

∫ b<br />

x 2 |f(x)| 2 ≤ M 2 |f(x)| 2 = M 2 ‖f‖ 2 ,<br />

missä M = max{|a|, |b|}, joten X on rajoitettu. Lisäksi X on myös hermiittinen (Tarkista!). X:n<br />

ominaisfunktio toteuttaisi<br />

xf λ (x) = λf λ (x) m.k. x ∈ [a, b],<br />

joten täytyy olla f λ (x) = 0 m.k. x ∈ [a, b], mutta ¯0 ei käy ominaisvektoriksi. (Toisaalta distribuutio<br />

f λ (x) = δ(x − λ) kävisi, muttei kuulu L 2 :een)<br />

Tarvitaan siis uusi käsite spektri, joka yleistää ominaisarvot ja ottaisi huomioon edellisen esimerkin<br />

kaltaiset tilanteet. Huomataan, että jos λ on A:n ominaisarvo, niin (A − λid H ) −1 ei ole olemassa: Jos<br />

(A − λid H ) −1 olisi olemassa ja Au = λu, niin<br />

u = (A − λid H ) −1 (A − λid H )u = (A − λid H ) −1¯0 = ¯0.<br />

Määritelmä 6.2 λ ∈ C on operaattorin A säännöllinen arvo (engl. regular value) jos (A − λid H ) −1<br />

on olemassa ja rajoitettu.<br />

Määritelmä 6.3 Operaattorin A spektri on joukko<br />

a<br />

∑<br />

(A) = {λ ∈ C : λ ei ole A:n säännöllinen arvo} (6.5)<br />

Ainakin A:n kaikki ominaisarvot kuuluvat spektriin. ominaisarvot = ”pistespektri”, muut spektrin piteet<br />

= ”jatkuva spektri”.


55<br />

Esimerkki 6.4 (jatkoa esimerkkiin 6.3) Tarkastellaan siis L 2 :n operaattoria (Xf)(x) = xf(x).<br />

Jos λ /∈ [a, b] (siis Im(λ) ≠ 0 tai Im(λ) = 0 ja λ < a tai λ > b) niin x − λ ≠ 0 kaikilla x ∈ [a, b] ja<br />

sillä voidaan jakaa:<br />

Lisäksi käänteisoperaattori on rajoitettu:<br />

∥<br />

∥(A − λid L 2) −1 f ∥ ∫ b<br />

2 =<br />

a<br />

((X − λid L 2)f)(x) = (x − λ)f(x)<br />

=⇒ ((X − λid L 2) −1 f)(x) = 1<br />

x − λ f(x)<br />

dx<br />

|x − λ| 2 |f(x)|2 ≤ 1 ∫ b<br />

d 2 dx|f(x)| 2 = 1 d 2 ‖f‖2 ,<br />

missä 0 < d = inf x∈[a,b] |x − λ| = ”λ:n etäisyys janasta [a,b]”. Jokainen λ /∈ [a, b] on siis X:n säännöllinen<br />

arvo. Jos taas λ ∈ [a, b], niin (X − λid L ) −1 ei ole rajoitettu (Osoita!), joten<br />

∑<br />

(A) = {λ : a ≤ λ ≤ b} = [a, b].<br />

a<br />

Lause 6.3 Olkoon A Hilbert avaruuden rajoitettu operaattori. Tällöin<br />

1. λ ∈ ∑ (A) ⇒ |λ| ≤ ‖A‖.<br />

2. A:n säännöllisten arvojen joukko on avoin.<br />

3. ∑ (A) on C:n kompakti osajoukko.<br />

Todistus 6.3 (1) Olkoon λ s.e. |λ| > ‖A‖. Operaattorin A/λ normi on tällöin < 1, joten<br />

(id H − 1 λ A)−1 =<br />

∞∑<br />

( ) A n<br />

λ<br />

on olemassa ja rajoitettu. (A − λid H ) = λ(A/λ − id H ), joten (A − λid H ) −1 = −1/λ(id H − A/λ) −1 on<br />

olemassa ja λ on säännöllinen. Siis jos λ ∈ ∑ (A) on oltava λ ≤ ‖A‖.<br />

(2) Olkoon λ 0 säännöllinen arvo ja λ ∈ C. Muodostetaan<br />

jolle<br />

Tällöin on olemassa ja rajoitettu<br />

n=0<br />

B = id H − (A − λ 0 id H ) −1 (A − λid H )<br />

= (A − λ 0 id H ) −1 [(A − λ 0 id H ) − (A − λid H )]<br />

= (A − λ 0 id H ) −1 (λ − λ 0 )id H ,<br />

‖B‖ = |λ − λ 0 | ∥ ∥(A − λ 0 id H ) −1∥ ∥ < 1<br />

1<br />

kun |λ − λ 0 | <<br />

‖(A − λ 0 id H ) −1 ‖ .<br />

(id H − B) −1 = [(A − λ 0 id H )(A − λid H )] −1<br />

= (A − λid H ) −1 (A − λ 0 id H ),<br />

joten myös λ on säännöllinen. On siis olemassa λ 0 :n ympäristö, jossa kaikki λ:t ovat säännöllisiä,<br />

joten säännöllisten arvojen joukko on avoin.<br />

(3) ∑ (A) on (1)-kohdan nojalla rajoitettu ja (2)-kohdan nojalla suljettu (avoimen joukon komplementtina),<br />

joten se on Heine-Borelin lauseen nojalla kompakti.


56<br />

6.3 Hermiittisen operaattorin spektri<br />

Lause 6.4 Rajoitetun hermiittisen operaattorin spektri on reaalinen.<br />

Todistus 6.4 Olkoon λ = a + ib, b ≠ 0 ja<br />

V = {(A − λid H )u : u ∈ H} . (6.6)<br />

Osoitetaan ensin että V on H:n aliavaruus. V on selvästi vektorialiavaruus, joten riittää osoittaa, että<br />

se on suljettu. Olkoon v n = (A−λid H )u n → v jono V:n vektoreita. On osoitettava, että v ∈ V . Kaikilla<br />

w ∈ H pätee:<br />

joten<br />

‖(A − id H )w‖ 2 = 〈(A − id H )w|(A − id H )w〉<br />

= ‖Aw‖ 2 + |λ| 2 ‖w‖ 2 − λ〈Aw|w〉 − λ ∗ 〈w|Aw〉<br />

= ‖Aw‖ 2 + |λ| 2 ‖w‖ 2 − (λ + λ ∗ )〈w|Aw〉<br />

} {{ }<br />

2a<br />

= ‖Aw‖ 2 + (a 2 + b 2 ) ‖w‖ 2 − a (〈w|Aw〉 + 〈Aw|w〉)<br />

= ‖(A − aid H )w‖ 2 + b 2 ‖w‖ 2<br />

=⇒ ‖w‖ 2 = 1 b 2 (<br />

‖(A − λid H )w‖ 2 − ‖(A − aid H )w‖ 2)<br />

≤ 1 b 2 ‖(A − λid H)w‖ 2<br />

⇐⇒ ‖w‖ ≤ 1<br />

|b| ‖(A − λid H)w‖ , (6.7)<br />

‖u n − u m ‖ ≤ 1<br />

|b| ‖(A − λid H)(u n − u m )‖ = 1<br />

|b| ‖v n − v m ‖ −→ 0,<br />

koska (v n ) on suppeneva (erityisesti Cauhcy) jono. Myös u n on siis Cauchyn jono, joten se on myös<br />

suppeneva (H täydellinen) eli on olemassa lim n u n = u. Mutta A − λid H on jatkuva operaattori, joten<br />

siis v ∈ V .<br />

Olkoon nyt w ∈ V ⊥ eli<br />

(A − λid H )u = lim<br />

n→∞ (A − λid H)u n = lim<br />

n→∞ v n = v<br />

〈(A − λid H )u|w〉 = 〈u|(A − λ ∗ id h )w〉 = 0 ∀ u ∈ H.<br />

Valinnalla u = (A − λ ∗ id H )w seuraa Aw = λ ∗ w. Jos w ≠ ¯0 on siis λ ∗ = a − ib, b ≠ 0 A:n ominaisarvo.<br />

Mutta A † = A ja kaikki ominaisarvot ovat reaalisia, joten w = ¯0 on ainoa mahdollisuus. On siis<br />

V ⊥ = {¯0} eli V = H.<br />

Olemme siis osoittaneet, että jokainen v ∈ H voidaan kirjoittaa v = (A − λid H )u, jollakin u ∈ H.<br />

Tässä u on yksikäsitteinen, sillä jos (A − λid H )u 1 = (A − λid H )u 2 , niin A(u 1 − u 2 ) = λ(u 1 − u 2 ).<br />

Koska λ /∈ R, se ei voi olla ominaisarvo, joten on oltava u 1 − u 2 = ¯0 eli u 1 = u 2 .<br />

Koska yo. u on yksikäsitteinen, voidaan määritellä operaattori B kaavalla Bv = u. Ilmeisesti B(A −<br />

λid H ) = (A − λid H )B = id H , joten B = (A − λid H ) −1 ja todistuksen alkuosan (6.7) mukaan se on<br />

rajoitettu, joten λ on säännöllinen arvo. Pätee siis ∑ (A) ⊂ R.<br />

6.4 Spektraaliesitys<br />

Kvanttimekaniikkaa tunteville on varmaankin avuksi tarkastella ensiksi pienenä alkumotivaationa kvanttimekaanisen<br />

systeemin Hamiltonin operaattoria H. Olkoon systeemillä ominaisenergiat E n , n = 0, . . ..


57<br />

Oletetaan että kaikkien mahdollinen degeneraatioaste on sama, eli kutakin energian ominaisarvoa vastaa<br />

K ominaistilaa |n k 〉:<br />

H|n k 〉 = E n |n k 〉 , k = 1, . . . , K ,<br />

jotka ovat ortogonaaleja,<br />

〈n k |m l 〉 = δ n,m δ k,l .<br />

Energian ominaistilat muodostavat ortonormaalin kannan jossa systeemin tilat |ψ〉 voidaan esittää,<br />

missä kertoimet<br />

|ψ〉 =<br />

∞∑<br />

n=0 k=1<br />

K∑<br />

c nk |n k 〉 ,<br />

c nk = 〈n k |ψ〉 .<br />

Koska tilat |n k 〉 muodostavat ortonormaalin kannan, pätee täydellisyysrelaatio<br />

Voimme nyt kirjoittaa<br />

H = id H id =<br />

Määritelemällä operaattori<br />

∞∑<br />

voidaan siis kirjoittaa H muodossa<br />

K∑<br />

id =<br />

∞∑<br />

n=0 k=1 m=0 l=1<br />

∞∑<br />

n=0 k=1<br />

K∑<br />

|n k 〉〈n k | .<br />

K∑<br />

|n k 〉〈n k |H|m l 〉〈m l | =<br />

P n ≡<br />

H =<br />

K∑<br />

|n k 〉〈n k |<br />

k=1<br />

∞∑<br />

E n P n ,<br />

n=0<br />

∞∑<br />

n=0<br />

E n<br />

K ∑<br />

k=1<br />

|n k 〉〈n k |<br />

tämä on Hamiltonin operaattorin ns. spektraalihajotelma eli spektraaliesitys. On helppo tarkistaa että<br />

P n on projektio-operaattori ominaisarvoa E n vastaavaan (K-ulottaiseen) ominaisavaruuteen, jonka<br />

virittävät tilat {n k }, =˛1 . . . K.<br />

Siirrymme nyt takaisin matematiikkaan ja johdamme spektraaliesityksen yleisemmin hermiittisille ja<br />

täydellisille operaattoreille A. Aiheen täsmällinen esitys on varsin tekninen, joten tyydymme tässä<br />

vain luonnostelemaan teoriaa. Aloitetaan yksinkertaisesta tapauksesta: A : H → H hermiittinen,<br />

täydellinen ja H separoituva. A:n ominaisvektoreista voidaan rakentaa kanta {e nk }<br />

Ae nk = λ n e nk , k = 1, 2, . . . , K n ,<br />

missä K on n:nnen ominaisarvon degeneraatioaste.<br />

ja jokainen u ∈ H voidaan esittää<br />

u =<br />

〈e nk |e ml 〉 = δ nm δ kl (6.8)<br />

∞∑<br />

n=1<br />

(<br />

Kn<br />

)<br />

∑<br />

u nk e nk . (6.9)<br />

k=1<br />

Ominaisarvot λ n ovat diskreettejä, joten ne voidaan järjestää kasvavaan jonoon λ 1 < λ 2 < λ 3 < . . ..<br />

Olkoon P n projektio-operaattori aliavaruuteen, joka vastaa ominaisarvoa λ n (”λ n :n ominaisavaruus”,<br />

vektoreiden e n1 , e n2 , . . ., e nKn virittämä):<br />

P n u = P n<br />

( ∞<br />

∑<br />

n=1<br />

(<br />

Kn<br />

))<br />

∑<br />

∑K n<br />

u nk e nk = u nk e nk . (6.10)<br />

k=1<br />

k=1


58<br />

Helposti nähdään Pn 2 = P n . Operaattorit P n toteuttavat lisäksi P n P m = δ nm P n sekä ∑ n P n = id H .<br />

Lasketaan (formaalisti):<br />

(<br />

)<br />

∞∑<br />

∞∑ ∑K n<br />

( λ n P n )u = λ n u nk e nk (6.11)<br />

Toisaalta<br />

joten<br />

Au = A<br />

( ∞<br />

∑<br />

n=1<br />

(<br />

Kn<br />

n=1<br />

))<br />

∑<br />

u nk e nk =<br />

k=1<br />

∞∑<br />

n=1<br />

A =<br />

n=1<br />

(<br />

Kn<br />

k=1<br />

)<br />

∑<br />

u nk Ae nk =<br />

k=1<br />

(<br />

∞∑<br />

n=1<br />

)<br />

∑<br />

u nk e nk ,<br />

λ n<br />

K n<br />

k=1<br />

∞∑<br />

λ n P n . (6.12)<br />

n=1<br />

Tämä on operaattorin A spektraaliesitys. Kirjoitetaan (6.12) toiseen muotoon. Tätä varten tarvitaan<br />

uusi käsite, Stieltjesin integraali:<br />

∫ b<br />

a<br />

f(x)dg(x) = lim<br />

N→∞<br />

N∑<br />

f(c i ) (g(x i+1 ) − g(x i ))<br />

i=0<br />

= lim<br />

|∆x i |→0<br />

N∑<br />

f(c i ) (g(x i+1 ) − g(x i )) , (6.13)<br />

i=0<br />

missä a = x 0 < x 1 < . . . < x N < x N+1 = b on välin [a, b] jako, c i ∈ [x i , x i+1 ] ja |∆x i | = |x i+1 − x i |.<br />

Jos g on differentioituva, niin<br />

∫ b<br />

a<br />

f(x)dg(x) =<br />

∫ b<br />

Erityisesti valinta g(x) = x antaa Riemannin integraalin<br />

∫ b<br />

a<br />

a<br />

f(x)g ′ (x)dx. (6.14)<br />

f(x)dx. (6.15)<br />

Stieltjesin integraali on hyvin määritelty laajemmalle funktiojoukolle. Esimerkiksi jos<br />

{ 0 , x < 0<br />

g(x) = θ(x) =<br />

1 , x ≥ 0<br />

ja a < 0 < b, niin<br />

∫ b<br />

a<br />

f(x)dθ(x) = f(0).<br />

(Mikä on yhtäpitävää kaavan θ ′ (x) = δ(x) kanssa.) Tulos seuraa siitä että määritelmän (6.13) oikean<br />

puolen summassa ainoa ei-häviävä termi tulee sillä indeksin i arvolla jolla x i+1 > 0 > x i , tällöin<br />

g(x i+1 ) − g(x i ) = 1 − 0, muulloin joko 0 − 0 tai 1 − 1.<br />

Kaikkien operaattorien spektrissä ei ole ollenkaan ominaisarvoja, mutta edellinen tulos voidaan yleistää<br />

käyttämättä eksplisiittisesti ominaisavaruuksien projektio-operaattoreita: Jos g on paloittain vakio<br />

välillä [a, b]:<br />

⎧<br />

g 0 , a < x < y 1<br />

g 1 = g 0 + h 1 , y 1 ≤ x < y 2<br />

⎪⎨<br />

· · ·<br />

g(x) =<br />

,<br />

g i = g i−1 + h i , y i ≤ x < y i+1<br />

· · · ⎪⎩<br />

g p = g p−1 + h p , y p ≥ x ≤ b


59<br />

funktion g(x) arvo hyppää siis p kertaa, aina askeleen h i kohdassa x = y i . Vastaavaan tapaan kuin<br />

askelfunktiolle θ nähdään että<br />

∫ b<br />

p∑<br />

f(x)dg(x) = h i f(y i ) .<br />

a<br />

Operaattorin A ominaisarvot kuuluvat spektriin ∑ (A) (⊂ R), joka on kompakti, joten on ¯λ 0 =<br />

inf ∑ (A) ja ¯λ 0 = sup ∑ (A), joilla ¯λ 0 ≤ λ n ≤ ¯λ M . Määritellään operaattoriarvoinen funktio E A (λ):<br />

i=1<br />

⎧<br />

⎨ ¯0 , λ < λ<br />

∑ 1<br />

E A (λ) = k<br />

⎩ ∑ i=1 P i , λ k ≤ λ < λ k+1 , (6.16)<br />

i P i = id , λ ≥ λ M<br />

missä ¯0 on siis 0-operaattori. E A toteuttaa<br />

E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 )),<br />

koska projektioille P i P j = δ ij P i . Tästä seuraa E A (λ) 2 = E A (λ) eli E A on projektio-operaattori. Määritellään<br />

seuraavaksi operaattoriarvoinen Stieltjesin integraali:<br />

∫ ¯λM<br />

¯λ 0<br />

f(λ)dE A (λ) = lim<br />

N→∞<br />

N∑<br />

f(c i )(E A (λ i+1 ) − E A (λ i ))<br />

i=1<br />

= lim<br />

|∆λ i |→∞<br />

N∑<br />

f(c i )(E A (λ i+1 ) − E A (λ i )), (6.17)<br />

i=1<br />

missä taas λ i : i = 1, . . . , N on välin [¯λ 0 , ¯λ M ] jako, c i ∈ [λ i , λ i+1 ] ja |∆λ i | = |λ i+1 −λ i |. Ilmeisesti pätee:<br />

∫ λ<br />

¯λ 0<br />

dE A (λ) = E A (λ) (6.18)<br />

∫ ¯λM<br />

¯λ 0<br />

λdE A (λ) = A. (6.19)<br />

Tämä esitys yleistyy: Rajoitetun, hermiittisen operaattorin spektraaliesitys:<br />

A =<br />

∫ sup<br />

∑ (A)<br />

inf ∑ (A)<br />

missä E A on operaattoriarvoinen funktio, joka toteuttaa:<br />

E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 ))<br />

lim E A(λ) = ¯0<br />

λ→−∞<br />

∫ sup<br />

∑ (A)<br />

inf ∑ (A)<br />

lim E A(λ) = id<br />

λ→∞<br />

dE A (λ) = id.<br />

λdE A (λ), (6.20)<br />

Esimerkki 6.5 Operaattori X L 2 [a, b]:ssa (kts. esimerkki 6.3).<br />

Määritelllään operaattoriarvoinen funktio E kaavalla<br />

{ f(y) , y ≤ x<br />

(E(x)f)(y) =<br />

0 , y > x . (6.21)


60<br />

Jaetaan osaväli N:ään osaväliin a = x 0 < x 1 < . . . < x N−1 < x N = b. Olkoon y ∈ [a, b] annettu,<br />

jolloin y ∈ [x k−1 , x k ] jollakin k. Nyt<br />

[(<br />

∑ N<br />

) ]<br />

c i (E(x i ) − E(x i−1 ) f (y)<br />

i=1<br />

= 0 + 0 + . . . + c k (f(y) − 0)<br />

+ c k+1 (f(y) − f(y)) + . . . + c N (f(y) − f(y))<br />

= c k f(y) −→ yf(y) = (Xf)(y)<br />

( ∑N<br />

)<br />

eli operaattori<br />

i=1 c i(E(x i ) − E(x i−1 ) lähestyy operaattoria X, toisaalta se myös määrittelee Stieltjesintegraalin<br />

(6.13) jonka integrandissa esiintyy funktio f(x) = x. Kaiken kaikkiaan siis<br />

X =<br />

∫ b<br />

a<br />

xdE(x) . (6.22)<br />

Näin saatiin paikkaoperaattorille X spektraaliesitys, vaikka sillä ei ole lainkaan ominaisarvoja, ainoastaan<br />

jatkuva spektri.<br />

6.5 Rajoittamattomat operaattorit<br />

A on rajoittamaton jos jokaiselle M > 0 löytyy u ∈ H se. ‖Au‖ ≥ M ‖u‖. Kiinnostavat rajoittamattomat<br />

operaattorit A eivät ole määriteltyjä koko H:lla vaan määrittelyjoukossa (engl. domain) D A ⊂ H.<br />

Operaattorin täydellinen määrittely sisältää myös D A :n, merk. (A, D A ). Huom:<br />

(A, D A ) ≠ (A, D ′ A) jos D A ≠ D ′ A.<br />

Vastaavasti R A = A(D A ) = {u ∈ H|u = Av, v ∈ D A } on A:n maalijoukko (engl. range).<br />

D A on H:n tiheä (dense) osajoukko, jos jokaiselle u ∈ H ja jokaiselle ɛ > 0 löytyy v ∈ D A s.e.<br />

‖u − v‖ < ɛ. A on tällöin tiheästi määritelty.<br />

A on operaattorin B laajennus (extension), merkit. B ≤ A jos D B ⊂ D A ja Au = Bu, kun u ∈ D B .<br />

Merkitään myös A| DB = B.<br />

(A, D A ) = (B, D B ) tarkoittaa siis, että D A = D B ja Au = Bu ∀ u ∈ D A .<br />

Huom. Selvästikin<br />

D A+B = D A ∩ D B<br />

D AB = B −1 (R B ∩ D A ),<br />

joten operaattorit eivät yleensä muodosta vektoriavaruutta tai algebraa.<br />

Esimerkki 6.6 H = l 2 , x = (x 1 , x 2 , . . .) ∈ H<br />

Ax = (x 1 , x 2<br />

2 , x 3<br />

3 , . . . , x n<br />

, . . .) (6.23)<br />

n<br />

A on rajoitettu ja hermiittinen, joten voidaan ottaa D A = H = l 2 . Huomataan lisäksi<br />

{<br />

}<br />

∞∑<br />

R A = y ∈ l 2 : n 2 |y n | 2 < ∞ ⊂ l 2 (6.24)<br />

n=1<br />

ja R A on tiheä l 2 :ssa: Olkoon x ∈ l 2 ja ɛ > 0 annettu. Koska x ∈ l 2 löytyy N s.e. ∑ ∞<br />

i=N+1 |x i| 2 < ɛ 2 .<br />

Valitaan y n = x n , kun 0 < n ≤ N ja y n = 0 kun n > N. Nyt y ∈ R A ja ‖x − y‖ ≤ ɛ.<br />

A:lla on käänteisoperaattori, jonka määrittelyjoukko on D A −1 = R A ja (A −1 x) n = nx n . A −1 on<br />

rajoittamaton, sillä:<br />

||A(0, 0, . . . , 0 , 1, 0, . . .)|| = ||n(0, 0, . . . , 0 , 1, 0, . . .)|| = n −→ ∞<br />

}{{}<br />

}{{}<br />

n:s<br />

n:s


61<br />

Esimerkki 6.7 H = L 2 (R) ja X kuten esimerkki 6.3:ssa.<br />

X on rajoittamaton: Olkoon f n (x) = 1, kun x ∈ [n, n + 1), 0 muuten. Tällöin<br />

||f n || = 1, mutta ||Xf|| = n 2 + n + 1 3<br />

−→ ∞.<br />

Laajin mahdollinen määrittelyjoukko on<br />

{ ∫<br />

D X = f ∈ L 2 :<br />

R<br />

}<br />

dx|xf(x)| 2 < ∞ ⊂ L 2 . (6.25)<br />

Huom. esimerkiksi f(x) = 1/(1 + |x|) ∈ L 2 \ D X .<br />

D X on tiheä L 2 :ssa (vrt. edelliseen esimerkkiin l 2 :ssa): Olkoon g ∈ L 2 (R) mielivaltainen. Määritellään<br />

{ g(x) , |x| ≤ n<br />

g n (x) =<br />

0 , |x| > n , (6.26)<br />

jolloin g n ∈ D X ja g n −→ g, joten D X on tiheä. On muitakin L 2 :ssa tiheitä määrittelyjoukkoja, esim.<br />

testifunktioavaruudet<br />

D(R) = {f ∈ C ∞ (R) : ∃ M s.e. |x| > M ⇒ f(x) = 0} (6.27)<br />

{<br />

}<br />

S(R) = f ∈ C ∞ (R) : |x| p f(x) |x|→∞<br />

−→ 0, |x| −→ ∞ ∀p > 0<br />

(6.28)<br />

Ilmeisesti (X, D) ≤ (X, S) ≤ (X, D X ) ja kaikki nämä ovat rajoittamattomia.<br />

Esimerkki 6.8 X = L 2 (R) ja P = −i d<br />

dx , eli (P f)(x) = −if ′ (x).<br />

Laajin määrittelyjoukko ilmeisesti<br />

D P = { f ∈ L 2 : f differentiotuva m.k. ja f ′ ∈ L 2} ⊂ L 2 (6.29)<br />

Esim f(x) = 4√ xe −x2 /∈ D P , sillä f ′ /∈ L 2 . Se, että f ′ (0) ei ole olemassa ei haittaa. Toisaalta voimme<br />

myös ottaa määrittelyjoukoksi S:n tai D:n jolloin (P, D) ≤ (P, S) ≤ (P, P D ).<br />

6.6 Adjungoitu operaattori<br />

Apulause 6.1 Olkoon V tiheä H:ssa. Jos 〈u|v〉 = 0 kaikille v ∈ V ,niin u = ¯0.<br />

Todistus 6.5 Olk. w ∈ H, ɛ > 0. V tiheä, joten on olemassa v ∈ V s.e. ||v − w|| < ɛ. Nyt<br />

〈u|w〉 = 〈u|w − v〉 ≤ ||u||||w − v|| < ɛ||u||.<br />

ɛ > 0 mielivaltainen, joten 〈u|w〉 = 0. w ∈ H mielivaltainen, joten u = ¯0.<br />

Olkoon (A, D A ) tiheästi määritelty operaattori H:ssa. Määrittelemme joukon D A †<br />

seuraavasti:<br />

Jos u † on olemassa, se on yksikäsitteinen:<br />

u ∈ D A † ⇐⇒ ∃ u † s.e. 〈u † |v〉 = 〈u|Av〉 ∀ v ∈ D A .<br />

〈u † 1 |v〉 = 〈u† 2 ∀ v ∈ D A =⇒ 〈u † 1 − u† 2 |v〉 = 0 ∀ v ∈ D A =⇒ 〈u † 1 − u† 2 = ¯0<br />

edellisen apulauseen nojalla.<br />

Vektoreille u ∈ D A † määrittelemme<br />

(A † , D A †) on (A, D A ):n adjungoitu operaattori.<br />

Huom. Jos A on rajoitettu ja D A = H, niin määritelmä yhtyy aiempaan.<br />

Huom. (A † , D A †) voidaan määritellä vain jos D A on tiheä.<br />

Huom. (A † , D A †) riippuu myös D A :sta!<br />

A † u = u † . (6.30)


62<br />

Määritelmä 6.4 Operaattori on suljettu (engl. closed) jos jokaiselle jonolle (u n ) ⊂ D A s.e. u n → u<br />

ja Au n → v pätee u ∈ D A ja v = Au.<br />

Määritelmästä seuraa suoraan, että jokainen jatkuva operaattori on myös suljettu, mutta suljettu<br />

operaattori ei välttämättä ole jatkuva.<br />

Lause 6.5 Jos (A, D A ) on tiheästi määritelty, niin (A † , D A †) on suljettu<br />

Todistus 6.6 Olkoon y n ∈ D A †<br />

jono s.e. y n → y ja A † y n → z. Tällöin kaikille x ∈ D A<br />

〈y|Ax〉 = lim 〈y|Ax〉 = lim<br />

n→∞ n→∞ 〈A† y n |x〉 = 〈z|x〉,<br />

joten y ∈ D A † ja z = A † y.<br />

Esimerkki 6.9 H = l 2 , x = (x 0 , x 1 , x 2 , . . .) ∈ l 2 . Kanta {ē i : i ≥ 0}, (ē i ) j = δ ij .<br />

Määritellään operaattori a:<br />

eli<br />

Voimme valita<br />

ax =<br />

∞∑<br />

x i aē i =<br />

i=0<br />

aē n = √ nē n−1 , n ≥ 1 (6.31)<br />

aē 0 = ¯0, (6.32)<br />

∞∑ √<br />

i + 1x+1 ē i = (x 1 , √ 2x 2 , √ 3x 3 , . . . , √ nx n , . . .).<br />

i=0<br />

D a =<br />

{<br />

x :<br />

}<br />

∞∑<br />

n|x n | 2 < ∞ , (6.33)<br />

n=1<br />

joka on tiheä l 2 :ssa (todistus kuten esimerkissä 6.6). R a = l 2 , koska jos y ∈ l 2 , niin y = ax, missä<br />

x n = √ yn<br />

n<br />

, n ≥ 1 (x 0 mieliv.).<br />

On siis operaattori (a, D a ), missä D a kuten (6.33):ssa, mikä on (a † , D a †)?<br />

Etsitään y † s.e.<br />

∞∑<br />

(y † ) ∗ nax n = 〈y † |x〉 = 〈y|ax〉 =<br />

n=0<br />

Kandidaatti: y † 0 = 0 ja y† n = √ ny n−1 muuten, jolle<br />

||y † || =<br />

∞∑<br />

yn(ax) ∗ n =<br />

n=0<br />

∞∑<br />

yn√ ∗ n + 1xn+1 .<br />

n=0<br />

†∑<br />

(n + 1)|y n | 2 . (6.34)<br />

n=0<br />

Jos ||y † || < ∞, niin |〈y † |x〉 ≤ ∥ ∥y †∥ ∥ ‖x‖ < ∞, joten<br />

{<br />

} {<br />

∞∑<br />

D a † = x : (n + 1)|x n | 2 < ∞ = x :<br />

n=1<br />

sekä (a † y) n = y † n = √ ny n−1 eli a † ē n = √ n + 1ē n+1 ts.<br />

}<br />

∞∑<br />

n|x n | 2 < ∞ = D a<br />

n=1<br />

a † y = (0, y 0 , √ 2y 1 , √ 3y 2 , . . . , √ n + 1y n , . . .). (6.35)<br />

Sekä a että a † suljettuja, mutta R a † = {x ∈ l 2 : x 0 = 0} ≠ R a . Tarkastellaan vielä tuloja a † a ja aa † :<br />

a † ax = a † (x 1 , √ 2x 2 , √ 3x 3 , . . .) = (0, x 1 , 2x 2 , 3x 3 , . . .) (6.36)<br />

aa † x = a(0, x 0 , √ 2x 1 , √ 3x 2 , . . .) = (x 0 , 2x 1 , 3x 2 , . . .). (6.37)


63<br />

Lisäksi<br />

D a † a = {x ∈ l 2 : ∑ n<br />

D aa † = {x ∈ l 2 : ∑ n<br />

n 2 |x n | 2 < ∞} (6.38)<br />

n 2 |x n | 2 < ∞} = D a † a (6.39)<br />

Vähentämällä (6.36) ja (6.37) toisistaan saadaan:<br />

[a, a † ]x := (aa † − a † a)x = x,<br />

joten<br />

[a, a † ] = (id l 2, D a † a) = (id l 2, l 2 ) = id l 2.<br />

Helposti nähdään että jos (A, D A ) ja (B, D B ) ovat tiheästi määriteltyjä ja A ≤ B, niin B † ≤ A † :<br />

Otetaan u ∈ D A ja v ∈ D B †:<br />

〈v|Au〉 }{{} = 〈v|Bu〉 = 〈B † v|u〉,<br />

A≤B<br />

eli v ∈ D a † ja A † v = B † v, kun v ∈ D B †, joten D B † ⊂ D A † ja B † ≤ A † .<br />

Määritelmä 6.5 Olkoon D A tiheä H:ssa.<br />

• A on itseadjungoitu (engl. self-adjoint), jos (A, D A ) = (A † , D A †. (Huom. D A = D A †)<br />

• A on symmetrinen jos A ≤ A † .<br />

Lisäksi kertaus: A on hermiittinen jos A on rajoitettu, A † = A ja D a †<br />

Hilbertin avaruudessa<br />

= D A = H. Eli annetussa<br />

{A : A hermiittinen} ⊂ {A : A itseadj.} ⊂ {A : A symmetrinen}.<br />

Seuraava lause karakterisoi symmetriset operaattorit toisella tavalla.<br />

Lause 6.6 A symmetrinen ⇐⇒ 〈u|Av〉 = 〈Au|v〉 ∀ u, v ∈ D A<br />

Todistus 6.7 ”⇒”. u, v ∈ D A :<br />

〈u|Av〉 }{{} = 〈A † u|v〉 }{{} = 〈Au|v〉.<br />

D A =D A † A≤A †<br />

”⇐”. Koska 〈u|Av〉 = 〈Au|v〉 ∀ u, v ∈ D A ja D A on tiheä, on oltava Au = A † u ∀ u ∈ H. Toisaalta<br />

〈u|Av〉 = 〈A † u|v〉, joten u ∈ D A † ja A ≤ A † .<br />

Esimerkki 6.10 H = L 2 (R), Tarkastellaa operaattoria (X, D(R)), missä X on kuten esimerkki 6.3:ssa<br />

ja D(R) on määritelty yhtälöllä (6.27). Kun ϕ, ψ ∈ D(R), pätee<br />

∫<br />

〈ϕ|Xψ〉 =<br />

R<br />

dxϕ ∗ (x)xψ(x) =<br />

∫ <br />

dx(xϕ(x)) ∗ ψ(x) = 〈Xϕ|ψ〉,<br />

joten (X, D) on symmetrinen. X ei kuitenkaan ole itseadjungoitu: löytyy funktioita f /∈ D, joille on<br />

olemassa f † s.e. 〈f|Xg〉 = 〈f † |g〉 ∀ g ∈ D, esim.<br />

{ 1 , |x| ≤ 1<br />

f(x) =<br />

0 , |x| > 1 ,


64<br />

jolloin<br />

f † (x) =<br />

{ x , |x| ≤ 1<br />

0 , |x| > 1 .<br />

Samalla tavalla osoitetaan, ettei myöskään (X, S(R)) ole itseadjungoitu. Mutta onko (X, D X )? Palautetaan<br />

mieliin että<br />

{ ∫<br />

}<br />

D X = f ∈ L 2 : dx|xf(x)| 2 < ∞ , (6.40)<br />

R<br />

joka on L 2 :n tiheä osajoukko. Kuten yllä (X, D X ) on symmetrinen, joten D X ⊂ D X †. Jotta D X = D X †<br />

ja X olisi itseadjungoitu, riittää osoittaa inkluusio toiseen suuntaan.<br />

{<br />

D X † = f ∈ L 2 : ∃ f † s.e. 〈f|Xg〉 = 〈f † |g〉 ∀ g ∈ L 2} (6.41)<br />

Olkoon g ∈ D X †. Jos ∀ f ∈ D X pätee<br />

niin<br />

∫<br />

R<br />

〈g|Xf〉 = 〈g † |f〉,<br />

dx(xg ∗ (x) − g † (x))f(x) = 0, (6.42)<br />

eli apulauseen 6.1 nojalla g † (x) = xg ∗ (x) m.k. x ∈ R. g † ∈ L 2 =⇒ Xg(x) ∈ L 2 eli g ∈ D X †. Pätee siis<br />

D X † ⊂ D X , joten (X, D X ) on itseadjungoitu.<br />

6.7 Käänteisoperaattorin yleistys<br />

Olkoon A : D A → R A .<br />

Määritellään operaattorin A ydin (engl. kernel)<br />

Ker(A) = {u ∈ D A : Au = ¯0}. (6.43)<br />

¯0 ∈ Ker(A) aina, mutta jos tämä on ainoa mahdollisuus, eli jos Ker(A) = {¯0}, niin voimme määritellä<br />

operaattorin (A −1 , R A ) asettmalla<br />

A −1 u = v ⇐⇒ Av = u, (6.44)<br />

eli A −1 : R A → D A . Tämä on hyvin määritelty:<br />

Av 1 = Av 2 = u<br />

=⇒A(v 1 − v 2 ) = ¯0<br />

=⇒v 1 − v 2 ∈ Ker(A) = ¯0<br />

=⇒v 1 = v 2<br />

6.8 Itseadjungoidun operaattorin spetkristä<br />

(A, D A ) Itseadjungoitu ⇒ ominaisarvot (jos niitä on) ovat reaalisia ja erisuuria ominaisarvoja vastaavat<br />

ominaisvektorit ovat ortogonaalisia (tod. kuten hermiittisille operaattoreille). Jokaiselle λ ∈ C<br />

määritellään resolventtijoukko<br />

∆ λ = R A−λid . (6.45)<br />

Jos λ ei ole ominaisarvo ((A − λid) −1 , R A−λid ) on olemassa (u ∈ Ker(A − λid) =⇒ Au = λu, mutta<br />

λ ei ole ominaisarvo, joten u = ¯0 ja Ker(A) = {¯0}) ja D (A−λid) −1 = R A−λid = ∆ λ .<br />

λ ∈ C on säännöllinen arvo jos ∆ λ = H.<br />

C \ {säännölliset arvot} = ∑ (A) = A:n spektri.<br />

Lause 6.7 λ ∈ C on itseadjungoidun operaattorin ominaisarvo jos ja vain jos ∆ λ ei ole tiheä H:ssa.


65<br />

Todistus 6.8 1) Jos Au = λu, ¯0 ≠ u ∈ D A , λ ∈ R pätee<br />

0 = 〈(A − λid)u|v〉) = 〈u| (A − λid)v〉 ∀ v ∈ D<br />

} {{ }<br />

A<br />

=:w∈∆ λ<br />

eli 〈u|w〉 = 0 ∀ u ∈ ∆ λ . jos ∆ λ olisi tiheä, tästä seuraisi u = ¯0, mikä on ristiriita eli ∆ λ ei ole tiheä<br />

(H:ssa).<br />

2) Ol. ∆ λ ei ole tiheä. ∆ λ ( sulkeuma ) on H:n aliavaruus ja ∆ λ<br />

⊥<br />

≠ {¯0}. On siis olemassa ¯0 ≠ u s.e.<br />

D A on tiheä, joten (A − λid)u = ¯0 eli Au = λu.<br />

〈u|(A − λid)v〉 = 0 ∀ v ∈ D A<br />

t.s. 〈(A − λid)u|v〉 = 0 ∀ v ∈ D A .<br />

Spektraaliesityslause. Olkoon (A, D A ) itseadjungoitu. On olemassa operaattoriarvoinen funktio E A (λ) (λ ∈<br />

R) s.e.<br />

E A (−∞) = 0<br />

E A (∞) = id<br />

E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 ))<br />

∫<br />

λdE A (λ) = A<br />

∫<br />

R<br />

λd〈u|E A (λ)v〉 = 〈u|Av〉 ∀ u, v ∈ D A .<br />

R<br />

Todistus vaikea (sivuutetaan tässä). Spektraaliesitys mahdollistaa operaattorifunktioide määritelmän<br />

∫<br />

f(A) = f(λ)dE A (λ). (6.46)<br />

6.9 Yhteys kvanttimekaniikkaan<br />

6.10 Paikkaoperaattori<br />

( ˆX, D ˆX)<br />

D ˆX<br />

=<br />

( ˆX, D ˆX<br />

itseadjungoitu. Spektraaliesitys:<br />

Määr. operaattorit Êx, x ∈ R<br />

eli<br />

R<br />

( ˆXΨ)(x) = xΨ(x) Ψ ∈ L 2 (R) (6.47)<br />

{ ∫<br />

}<br />

ϕ ∈ L 2 : dx|xϕ(x)| 2 < ∞<br />

R<br />

(ÊxΨ)(y) =<br />

(ÊxΨ)(y) =<br />

{ Ψ(y) , y ≤ x<br />

0 , y > x<br />

∫ z<br />

−∞<br />

Huomaa, että Êx on projektio-operaattori aliavaruudelle<br />

dzΨ(z)δ(y − z).<br />

(6.48)<br />

(6.49)<br />

V x = {Ψ ∈ L 2 : Ψ(y) = 0, x < y} (6.50)<br />

ja lisäksi Ê −∞ = 0 ja E ∞ = id.{Êx} toteuttaa spektraaliesityslauseen ehdot: Olkoon x ′ ≤ x, jolloin<br />

{ { Ψ(y) , y ≤ x<br />

(ÊxÊx ′)(y) = E ′ Ψ(y) , y ≤ x<br />

′<br />

x(<br />

0 , y > x ′ ) =<br />

0 , y > x ′


66<br />

ja<br />

{ { Ψ(y) , y ≤ x Ψ(y) , y ≤ x<br />

(Êx ′Ê x )(y) = E x (<br />

0 , y > x ) = ′<br />

0 , y > x ′ ,<br />

eli E x ′E x = E x E x ′ = E x ′′, missä x ′′ = min(x, x ′ ).<br />

Väitämme nyt, että<br />

∫<br />

ˆX =<br />

tarkoittaen<br />

kaikille ϕ, Ψ ∈ L 2 . Tosiaan:<br />

∫<br />

〈ϕ|ÊxΨ〉 =<br />

f differentioituva ja<br />

R<br />

R<br />

∫<br />

〈ϕ| ˆXΨ〉 =<br />

R<br />

dyϕ ∗ (y)(Êx)(y) =<br />

xdÊx, (6.51)<br />

xd〈ϕ|ÊxΨ〉 (6.52)<br />

∫ x<br />

−∞<br />

dxϕ ∗ (y)Ψ(y) =: f(x)<br />

f ′ (x) = df<br />

dx (x) = ϕ∗ (x)Ψ(x)<br />

∫<br />

∫<br />

=⇒ xd〈ϕ|ÊxΨ〉 = xdf(x)<br />

R<br />

∫R<br />

= ϕ ∗ (x)xΨ(x)dx<br />

∫R<br />

= dxϕ ∗ (x)( ˆXΨ)(x)<br />

R<br />

= 〈ϕ| ˆXΨ〉.<br />

Toimii!<br />

Spektraaliesityksen avulla voidaan määritellä operaattori (F ( ˆX), D F ( ˆX)<br />

)<br />

jolle<br />

laajimmillaan.<br />

D F ( ˆX)<br />

=<br />

6.11 Diracin merkintätapa<br />

∫<br />

F ( ˆX) =<br />

R<br />

F (x)dÊx, (6.53)<br />

{ ∫<br />

}<br />

Ψ ∈ L 2 : dx|F (x)Ψ(x)| 2 < ∞<br />

R<br />

Vektori H:ssa: |u〉 ”ket” ja vektori H ∗ :ssä (H:n duaaliavaruudessa): 〈v| ”bra”. Rieszin esityslauseesta:<br />

v(u) =<br />

(6.54)<br />

〈v|u〉<br />

} {{ }<br />

. (6.55)<br />

skalaaritulo<br />

Olkoon H separoituva ja {|e i 〉} o.n. kanta: 〈e i |e j 〉 = δ ij . u:n esitys tässä kannassa on<br />

joten<br />

∞∑<br />

|u〉 = |e 1 〉〈e 1 |u〉 = id H |u〉 (6.56)<br />

n=1<br />

∞∑<br />

id H = |e 1 〉〈e 1 | (6.57)<br />

n=1


67<br />

”täydellisyysrelaatio”. Â operaattori<br />

missä<br />

Â|e i 〉 =<br />

Voidaan siis kirjoittaa operaattorin matrisiiesitys<br />

∞∑<br />

|e j 〉a ji ,<br />

j=1<br />

a ji = 〈e j |Âe i〉 =: 〈e j |Â|e i〉.<br />

 =<br />

∞∑<br />

|e j 〉a ji 〈e i |. (6.58)<br />

i,j=1<br />

Laajennetaan H sisältämää ”vektoreita” |x〉, x ∈ R, jotka toteuttavat<br />

Ψ ∈ L ( R), merkitään<br />

Tällöin voimme kirjoittaa<br />

koska<br />

(ÊxΨ)(y) = 〈y|ÊxΨ〉 =<br />

〈x|y〉 = δ(x − y). (6.59)<br />

Ψ(x) = 〈x|y〉.<br />

Ê x =<br />

∫ x<br />

−∞<br />

∫ x<br />

−∞<br />

dz|z〉〈z| (6.60)<br />

dz 〈y|z〉 〈z|Ψ〉 =<br />

} {{ } } {{ }<br />

δ(y−z) Ψ(z)<br />

∫ x<br />

−∞<br />

dzδ(y − z)Ψ(z).<br />

Huom. E ∞ = id = ∫ R dx|x〉〈x| ”täydellisyysrelaatio”. Nyt dÊx = |x〉〈x| ja spektraaliesitys<br />

Tarkistus<br />

6.12 Impulssioperaattori<br />

( ˆP , D ˆP<br />

), = 1,<br />

∫<br />

ˆX =<br />

R<br />

∫<br />

dxx|x〉〈x| =<br />

∫<br />

( ˆXΨ)(y) = 〈y| ˆX|Ψ〉) dx 〈y|x〉 x 〈x|Ψ〉 = yΨ(y).<br />

R } {{ } } {{ }<br />

δ(y−x) Ψ(x)<br />

Dˆp =<br />

R<br />

dx|x〉x〈x|. (6.61)<br />

( ˆP Ψ)(x) = −i dΨ<br />

dx , (6.62)<br />

{<br />

∫ ∞<br />

}<br />

Ψ ∈ L 2 (R) : dx|Ψ ′ (x)| 2 < ∞ . (6.63)<br />

−∞<br />

ˆp itseadjungoitu. ˆp:n spektraaliesitys rakennetaan yksinkertaisimmin Fourier’n muunnoksen avulla:<br />

Määritellään operaattori ˆF : L 2 (R) → R,<br />

( ˆFΨ)(k) = √ 1 ∫<br />

dxe −ikx Ψ(x) =: ˆΨ(k). (6.64)<br />

2π<br />

R<br />

ˆFΨ todellakin kuuluu L 2 (R):ään, kun Ψ on L 2 (R):n alkio. Todistus epätriviaali, mutta löytyy useista<br />

L p -avaruuksia käsittelevistä kirjoista. Fourier muunnokselle pätee Plancherelin kaava<br />

〈ϕ|Ψ〉 = 〈 ˆFϕ| ˆFΨ〉, (6.65)


68<br />

eli ˆF on isometrinen. Lisäksi ˆF:llä on käänteisoperaattori<br />

∫<br />

( ˆF −1 1<br />

ˆΨ)(x) = √ dke ikx ˆΨ(k) = Ψ(x). (6.66)<br />

2π<br />

Nämä yhdistämällä seuraa, että ˆF on jopa unitaarinen. Honkonen, Lause 6.4:<br />

eli<br />

(<br />

R<br />

dΨ ˆF(−i ))(k) = k ˆΨ(k)<br />

dx<br />

( ˆF ˆP Ψ)(k) = k ˆΨ(k) = ( ˆX ˆΨ)(k) = ˆX ˆFΨ(k) (6.67)<br />

operoimalla tähän ˆF −1 :llä ja huomaamalla, että Ψ ∈ L 2 on mielivaltainen, saadaan ˆP :n esitys:<br />

ˆP = ˆF −1 ˆX ˆF. (6.68)<br />

Lisäksi ˆX:n spektraaliesityksestä saadaan vastaava myös ˆP :lle:<br />

∫<br />

ˆP = kd( ˆF −1 ˆX ˆF). (6.69)<br />

Lisäki<br />

Konsinstenssi vaatii siis<br />

∫<br />

1<br />

√<br />

2π<br />

R<br />

R<br />

∫<br />

dxe −ikx Ψ(x) = ˆΨ(k) = 〈k|Ψ〉 =<br />

R<br />

dx〈k|x〉Ψ(x).<br />

〈k|x〉 = 1 √<br />

2π<br />

e −ikx (6.70)<br />

eli<br />

ϕ k (x) = 〈x|k〉 = 1 √<br />

2π<br />

e ikx (6.71)<br />

”impulssioperaattorin ominaisfunktio” (/∈ L 2 (R)).<br />

Tarkistetaan vielä:<br />

∫<br />

〈ϕ| ˆP |Ψ〉 = kd〈ϕ| ˆF −1 Ê k ˆF|Ψ〉. (6.72)<br />

Nyt (, koska ˆF † = ˆF −1 )<br />

joten<br />

〈ϕ| ˆF −1 Ê k ˆF|Ψ〉 = 〈 ˆFϕ| Ê k | ˆFΨ〉 =<br />

∫<br />

〈ϕ| ˆP |Ψ〉 =<br />

R<br />

R<br />

∫<br />

dk ˆϕ(k) ∗ k ˆΨ(k) =<br />

R<br />

∫ k<br />

−∞<br />

dk ′ ˆϕ(k ′ ) ∗ ˆΨ(k ′ ),<br />

dxϕ(x) ∗ (<br />

−i dΨ<br />

dx (x) )<br />

,<br />

missä viimeineinen yhtäsuuruus seuraa Plancherelin kaavasta.<br />

Diracin merkintätavassa otetaan käyttöön ”vektoreita” |k〉 s.e. 〈k|k ′ 〉 = δ(k − k ′ ) ja<br />

ˆΨ(k) = 〈k|Ψ〉 = √ 1 ∫<br />

dxe −ikx Ψ(x),<br />

2π<br />

sekä<br />

∫<br />

|Ψ〉 = id|Ψ〉 =<br />

R<br />

R<br />

∫<br />

dx|x〉〈x|Ψ〉 =<br />

R<br />

dx|x〉Ψ(x).


69<br />

Tässä notaatiossa<br />

〈ϕ| ˆF −1 Ê k ˆF|Ψ〉<br />

= 〈 ˆFϕ|Êk| ˆFΨ〉<br />

∫<br />

= dk ′ ˆϕ(k ′ ) ∗ Ê k ˆΨ(k ′ )<br />

=<br />

=<br />

R<br />

∫ k<br />

−∞<br />

∫ k<br />

−∞<br />

dk ′ ˆϕ(k ′ ) ∗ ˆΨ(k ′ )<br />

dk ′ 〈ϕ|k ′ 〉〈k ′ |Ψ〉<br />

eli<br />

Tarkistus:<br />

Toimii!<br />

∫<br />

〈x ′ |x〉 =<br />

R<br />

ˆF −1 Ê k ˆF =<br />

∫ k<br />

ˆF −1 Ê ∞ ˆF =<br />

∫<br />

R<br />

−∞<br />

dk ′ |k ′ 〉〈k ′ | (6.73)<br />

dk ′ |k ′ 〉〈k ′ | = id. (6.74)<br />

dk〈x|k〉〈k|x ′ 〉 = 1 ∫<br />

dke ik(x−x′) = δ(x − x ′ )<br />

2π R

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!