12.07.2015 Views

Elementy analizy tensorowej - Uniwersytet Jagielloński

Elementy analizy tensorowej - Uniwersytet Jagielloński

Elementy analizy tensorowej - Uniwersytet Jagielloński

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Spis treściPrzedmowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91. Preliminaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.1. Przestrzeń i czasoprzestrzeń w matematyce . . . . . . . . . . . . . . . . . . . 131.2. Wektory na rozmaitości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.3. Tensory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.4. Przestrzenie R n i E n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.4.1. Afiniczna przestrzeń euklidesowa E n . . . . . . . . . . . . . . . . . . . . 211.5. Odwzorowania przestrzeni R n . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.6. Transformacje współrzędnych . . . . . . . . . . . . . . . . . . . . . . . . . . . 291.6.1. Współrzędne biegunowe na płaszczyźnie . . . . . . . . . . . . . . . . . . 331.7. Wymiar przestrzeni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351.8. Notacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372. Rozmaitości różniczkowe . . . . . . . . . . . . . . . . . . . . . . . 392.1. Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.2. Definicja rozmaitości różniczkowej . . . . . . . . . . . . . . . . . . . . . . . . . 412.2.1. Rozmaitość . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492.3. Przykłady rozmaitości gładkich . . . . . . . . . . . . . . . . . . . . . . . . . . 522.4. Rozmaitości gładkie w R n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 592.5. Rozmaitości indukowane i iloczynowe . . . . . . . . . . . . . . . . . . . . . . . 652.6. Powierzchnie jednostronne. Wstęga Möbiusa i butelka Kleina . . . . . . . . . 672.7. Odwzorowania rozmaitości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 732.8. Krzywe gładkie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802.9. Klasyfikacja rozmaitości . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 843. Wektory i tensory . . . . . . . . . . . . . . . . . . . . . . . . . . . 863.1. Geometryczny opis wektora . . . . . . . . . . . . . . . . . . . . . . . . . . . . 863.2. Przestrzeń styczna do E n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 893.3. Liniowa transformacja współrzędnych w E n i zmiana bazy w T pE n . . . . . . 913.4. Wektor jako operator różniczkowy . . . . . . . . . . . . . . . . . . . . . . . . 933.5. Przestrzeń styczna do rozmaitości . . . . . . . . . . . . . . . . . . . . . . . . . 953.6. Gładkie pola wektorowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99


6 Spis treści3.7. Wektory kowariantne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1023.8. Pola kowektorów i gradient funkcji . . . . . . . . . . . . . . . . . . . . . . . . 1053.8.1. Graficzne przedstawienie kowektora . . . . . . . . . . . . . . . . . . . . 1093.9. Tensory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1123.10. Składowe i bazy tensorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1143.11. Pola tensorowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1163.12. Działania na tensorach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1213.13. Komutator pól wektorowych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1233.14. Tensor metryczny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1273.15. Operacje na tensorach za pomocą metryki . . . . . . . . . . . . . . . . . . . . 1363.16. Wyznaczniki i symbol Leviego–Civity . . . . . . . . . . . . . . . . . . . . . . . 1393.17. Uogólniony symbol Kroneckera . . . . . . . . . . . . . . . . . . . . . . . . . . 1453.18. Tensory względne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1483.19. Rozmaitości dwuwymiarowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1493.20. Metryka hiperpowierzchni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1513.20.1. Sfera S n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1563.21. Przestrzenie hiperboliczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1583.21.1. Wstęp historyczny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1583.21.2. Płaszczyzna hiperboliczna jako sfera w przestrzeni Minkowskiego . . . . 1593.21.3. Model Kleina płaszczyzny Łobaczewskiego . . . . . . . . . . . . . . . . 1603.21.4. Model Poincarégo płaszczyzny hiperbolicznej . . . . . . . . . . . . . . . 1623.21.5. Pseudosfera Beltramiego . . . . . . . . . . . . . . . . . . . . . . . . . . 1633.21.6. Przekształcenia modeli . . . . . . . . . . . . . . . . . . . . . . . . . . . 1663.22. Orientowalność rozmaitości . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1674. Odwzorowania tensorów i pochodna Liego . . . . . . . . . . . . 1714.1. Odwzorowania styczne funkcji i wektorów . . . . . . . . . . . . . . . . . . . . 1714.2. Odwzorowania styczne dla kowektorów . . . . . . . . . . . . . . . . . . . . . . 1754.3. Odwzorowania styczne dla dowolnych tensorów . . . . . . . . . . . . . . . . . 1764.4. Transformacje czynne i bierne . . . . . . . . . . . . . . . . . . . . . . . . . . . 1784.5. Symetrie i przeniesienie według Liego . . . . . . . . . . . . . . . . . . . . . . . 1794.6. Pochodna Liego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1824.7. Ogólne własności pochodnej Liego . . . . . . . . . . . . . . . . . . . . . . . . 1864.8. Pochodna Liego tensorów względnych . . . . . . . . . . . . . . . . . . . . . . . 1904.9. Symetrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1945. Pochodna absolutna i kowariantna . . . . . . . . . . . . . . . . . 1975.1. Pochodna absolutna wektora . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1985.2. Pochodna kowariantna wektora . . . . . . . . . . . . . . . . . . . . . . . . . . 2005.3. Transformacje koneksji afinicznej . . . . . . . . . . . . . . . . . . . . . . . . . 2035.4. Pochodna kowariantna i absolutna tensora . . . . . . . . . . . . . . . . . . . . 2055.5. Pochodne wyższych rzędów . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2105.6. Pochodne kowariantne tensorów względnych . . . . . . . . . . . . . . . . . . . 2115.7. Przestrzeń z koneksją afiniczną . . . . . . . . . . . . . . . . . . . . . . . . . . 2135.7.1. Koneksja symetryczna i pochodna Liego . . . . . . . . . . . . . . . . . . 2145.8. Przeniesienie równoległe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2165.9. Linie geodezyjne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2195.9.1. Przekształcenia geodezyjne koneksji afinicznej . . . . . . . . . . . . . . 224


Spis treści 75.9.2. Interpretacja geometryczna skręcenia koneksji . . . . . . . . . . . . . . 2265.10. Odwzorowanie eksponencjalne i współrzędne riemannowskie . . . . . . . . . . 2285.11. Krzywizna przestrzeni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2325.12. Tensor krzywizny . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2335.13. Interpretacja geometryczna tensora krzywizny . . . . . . . . . . . . . . . . . . 2415.14. Przestrzenie afinicznie płaskie . . . . . . . . . . . . . . . . . . . . . . . . . . . 2435.15. Pochodna Liego koneksji i krzywizny . . . . . . . . . . . . . . . . . . . . . . . 2486. Różniczkowanie w przestrzeni Riemanna . . . . . . . . . . . . . 2536.1. Koneksja metryczna i symetryczna . . . . . . . . . . . . . . . . . . . . . . . . 2536.2. Kowariantne operatory różniczkowe . . . . . . . . . . . . . . . . . . . . . . . . 2596.3. Tożsamości różniczkowe pierwszego rzędu dla metryki . . . . . . . . . . . . . 2636.4. Różniczkowanie tensorów względnych i pochodna Liego . . . . . . . . . . . . . 2666.5. Geodetyki jako linie najkrótsze . . . . . . . . . . . . . . . . . . . . . . . . . . 2676.5.1. Form–inwariantność funkcjonału długości . . . . . . . . . . . . . . . . . 2736.5.2. Ekstremum warunkowe . . . . . . . . . . . . . . . . . . . . . . . . . . . 2766.6. Własności metryczne geodetyk . . . . . . . . . . . . . . . . . . . . . . . . . . 2806.7. Przykłady linii geodezyjnych . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2856.8. Współrzędne normalne riemannowskie . . . . . . . . . . . . . . . . . . . . . . 2956.9. Współrzędne normalne geodezyjne Gaussa . . . . . . . . . . . . . . . . . . . . 3037. Krzywizna i izometrie przestrzeni Riemanna . . . . . . . . . . 3087.1. Tensory Riemanna i Ricciego oraz skalar krzywizny . . . . . . . . . . . . . . . 3087.2. Przestrzenie metrycznie płaskie . . . . . . . . . . . . . . . . . . . . . . . . . . 3117.3. Pola wektorowe kowariantnie stałe . . . . . . . . . . . . . . . . . . . . . . . . 3137.4. Krzywizna przestrzeni w wymiarach 1, 2 i 3 . . . . . . . . . . . . . . . . . . . 3157.5. Krzywizna przestrzeni S 2 , H 2 , T 2 , S 3 i H 3 . . . . . . . . . . . . . . . . . . . 3187.6. Krzywizna przestrzeni wielowymiarowych. Tensor Weyla . . . . . . . . . . . . 3207.7. Czasoprzestrzenie czterowymiarowe . . . . . . . . . . . . . . . . . . . . . . . . 3247.7.1. Przestrzeń de Sittera . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3247.7.2. Przestrzeń anty–de Sittera . . . . . . . . . . . . . . . . . . . . . . . . . 3297.7.3. Czasoprzestrzenie Robertsona–Walkera . . . . . . . . . . . . . . . . . . 3317.7.4. Płaska fala grawitacyjna . . . . . . . . . . . . . . . . . . . . . . . . . . 3337.8. Tensory krzywizny i tensory Weyla dla różnych metryk . . . . . . . . . . . . 3367.9. Niezmienniki tensora krzywizny . . . . . . . . . . . . . . . . . . . . . . . . . . 3387.10. Tożsamości Bianchiego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3427.10.1. Całkowe tożsamości Bianchiego . . . . . . . . . . . . . . . . . . . . . . . 3447.11. Dewiacja geodezyjna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3487.12. Krzywizna sekcyjna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3547.13. Krzywizna a metryka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3577.14. Izometrie i przestrzenie symetryczne . . . . . . . . . . . . . . . . . . . . . . . 3587.14.1. Przestrzenie o stałej krzywiźnie . . . . . . . . . . . . . . . . . . . . . . . 3607.14.2. Jednorodność i izotropowość . . . . . . . . . . . . . . . . . . . . . . . . 3637.14.3. Symetria odbiciowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3657.15. Wektory Killinga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3707.15.1. Klasyczna konstrukcja wektora Killinga . . . . . . . . . . . . . . . . . . 3727.16. Wyznaczenie izometrii z wektorów Killinga . . . . . . . . . . . . . . . . . . . . 374


8 Spis treści7.17. Własności wektorów Killinga . . . . . . . . . . . . . . . . . . . . . . . . . . . 3767.18. Warunki całkowalności równań Killinga . . . . . . . . . . . . . . . . . . . . . . 3847.19. Wektory Killinga a jednorodność i izotropowość . . . . . . . . . . . . . . . . . 3877.20. Przykłady wektorów Killinga . . . . . . . . . . . . . . . . . . . . . . . . . . . 3907.21. Wektory ortogonalne do hiperpowierzchni . . . . . . . . . . . . . . . . . . . . 3987.22. Izometrie przestrzeni zamkniętych . . . . . . . . . . . . . . . . . . . . . . . . . 401Skorowidz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404Skorowidz nazwisk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410


PrzedmowaPodręcznik ten jest znacznym rozwinięciem wykładów, jakie w Uniwersytecie<strong>Jagielloński</strong>m prowadziłem przez wiele lat dla studentów astronomii i przezkilka lat dla studentów fizyki. Wielka kariera rachunku tensorowego zaczęła sięz powstaniem teorii względności. Obecnie stał się on niemal uniwersalnym aparatemmatematycznym fizyki i wykroczył poza jej właściwy obszar, znajdujączastosowania w najszerzej pojętej mechanice ośrodków ciągłych. Z tego powoduadresuję podręcznik do szerokiego kręgu odbiorców: fizyków, astronomów,geofizyków oraz studiujących hydrodynamikę i teorię sprężystości (i nie wyróżniamteorii względności). Ze względu na to, że adresuję go do czytelników stosującychrachunek tensorowy w rozmaitych działach nauk ścisłych, nie podajężadnych zastosowań, każdy bowiem wybór byłby arbitralny i sugerowałby, żeten obszar zastosowań jest najistotniejszy. Czytelnik sam zorientuje się, gdzieanalizę tensorową należy stosować, np. rozpozna, że gdy równania Newtonawyrażające drugą zasadę dynamiki zapisze się we współrzędnych krzywoliniowych,takich jak sferyczne, to pochodną zwyczajną względem czasu trzebazastąpić pochodną absolutną.Książka ta ma spełniać dwa cele. Po pierwsze, jest podręcznikiem, co uzasadniajej dużą objętość: daję studentowi sporo objaśnień i komentarzy, przezco treść nie jest zbyt skondensowana. Po drugie, mając podręcznikowy, czytelnycharakter, jest monografią dla bardziej zaawansowanych użytkowników,bowiem znaczna część materiału, zwłaszcza w rozdziałach 4, 5 i 6 oraz większośćrozdziału 7, jest tym użytkownikom potrzebna, a zarazem dostępna tylkow wysoce specjalistycznej literaturze i po polsku ukazuje się po raz pierwszy.Znaczenie rachunku tensorowego kontrastuje z luką na polskim rynku wydawniczym.Ostatnie książki na ten temat ukazały się ponad czterdzieści lattemu i są trudno dostępne. Po nich wydano kilka podręczników teorii względnościzaczynających się od zwięzłego wykładu <strong>analizy</strong> <strong>tensorowej</strong> ukierunkowanegona teorię Einsteina, zwykle niekompletnego — korzystają więc z niegotylko fizycy relatywiści. Co więcej, klasyczne podręczniki rachunku tensorowegosą przestarzałe w sformułowaniu jego podstaw i nie pasują do kursu <strong>analizy</strong>matematycznej na politechnikach i uniwersytetach (nauki fizyczne), a tym bar-


10 Przedmowadziej odstają od wykładów dla studentów matematyki. To jest główny powódnapisania tego podręcznika.Rachunek tensorowy jest metodą analityczną geometrii różniczkowej, jestzatem kwestią konwencji, a przede wszystkim gustu autora, ile w książce będziegeometrii, a ile samych tensorów. Aby uniknąć nieporozumień, podkreślam,że jest to podręcznik <strong>analizy</strong> <strong>tensorowej</strong>, a nie zastosowań geometriiw naukach fizycznych. O geometrii mówię więc tyle, ile potrzeba, by pokazaćmoc i użyteczność tej <strong>analizy</strong>. Jeśli chodzi o poziom abstrakcji i nowoczesności,to przyjąłem tutaj etap pośredni między nowoczesną geometrią formułowanąbez użycia współrzędnych a klasycznym podejściem do tensorów, w którymwszystko wyraża się za pomocą składowych. Ujęcie klasyczne okazało się, poniemal stu latach używania tensorów, bardziej praktyczne, lecz trudno w nimwyrazić, czym właściwie jest tensor i w jakich przestrzeniach istnieje. Tegodostarcza ujęcie nowoczesne.Tradycyjnie mówi się, że tensor działa w n–wymiarowej przestrzeni Riemannalub przestrzeni niemetrycznej. Chcę pokazać ogromne bogactwo tychprzestrzeni i dlatego przeznaczyłem cały obszerny rozdział na zdefiniowaniei przedstawienie rozmaitości różniczkowych. Wektor definiuję jako operatorróżniczkowy działający w przestrzeni funkcji gładkich na rozmaitości, bo topozwala zrozumieć wiele rzeczy i jest naturalne nie tylko dla fizyków zaznajomionychz mechaniką kwantową. Z doświadczenia wiem, że przejście od czystoalgebraicznego pojęcia wektora do obiektu geometrycznego w przestrzenistycznej sprawia wielu uczącym się trudności i omawiam tę kwestię bardzoszczegółowo.Definicje i podstawowe twierdzenia podaję w języku geometrii, natomiastwiększość rachunków najprościej jest prowadzić dla składowych tensorów. Caływykład algebry i <strong>analizy</strong> <strong>tensorowej</strong> prowadzę od podstaw, bez zakładaniajakiejś znajomości przedmiotu u czytelnika.Styl tej książki różni się od rozpowszechnionego i przez wiele lat modnego,suchego i skrajnie lakonicznego stylu prezentacji matematyki nowoczesnej;w niektórych miejscach tekst może się wydać przegadany. Nie przestrzegałemrównież zasady, by jakąś informację podawać tylko raz, jest tu szereg powtórzeń,co z pewnego punktu widzenia jest mniej eleganckie, za to ułatwia lekturęczytelnikowi. Ponadto niektóre zagadnienia omawiam z paru różnych punktówwidzenia, np. przestrzeń izotropową definiuję i opisuję na trzy różne sposoby,a potem jej własności wyrażam jeszcze za pomocą wektorów Killinga.Wielkim nieobecnym są tu formy różniczkowe. Wywodzą się z rachunkutensorowego, a obecnie są niezależnym i rozbudowanym aparatem geometriiróżniczkowej, mającym szerokie zastosowania w całej matematyce i fizyce.Umieszczanie ich w książce o analizie <strong>tensorowej</strong> byłoby więc niewłaściwe,nie mówiąc o tym, że ogromnie powiększyłoby jej objętość. Formy różniczkowew R n są obecnie przedstawione w standardowych podręcznikach z <strong>analizy</strong>matematycznej, a dla form na rozmaitościach istnieje znakomita książka Flan-


Przedmowa 11dersa, która zupełnie się nie zestarzała, mimo że została napisana w 1963 r.(polskie wydanie ukazało się w 1969 r.). W konsekwencji zrezygnowałem z podawaniatwierdzeń całkowych, które obecnie formułuje się za pomocą form różniczkowych.Zrezygnowałem również z języka wiązek, gdyż poza samą geometriąich praktyczne zastosowania są niewielkie. Sporo miejsca za to poświęcampochodnej Liego ze względu na jej związek z wielkościami zachowywanymi.Dla profesjonalnego matematyka przedstawiony tu wykład jest momentamizbyt drobiazgowy, ogólnie za mało zalgebraizowany i za mało ścisły. Ze ścisłościzrezygnowałem świadomie tam, gdzie przysłania jasność wywodu i gdziefachowiec jest w stanie bez trudu ją przywrócić. Przyjmuję też za intuicyjnieoczywiste istnienie pewnych obiektów i ich własności tam, gdzie matematykniebanalnym rozumowaniem tego istnienia dowodzi. Starałem się natomiast,w miarę możności, przestrzegać ścisłości w kwestiach, gdzie intuicja zawodzi:w konstruowaniu rozmaitości różniczkowych, definiowaniu wektorów, odwzorowaństycznych i pochodnej Liego oraz paru innych miejscach. Chcę dać czytelnikowirozumienie, a nie tylko technikę rachunkową. Być może i dla matematykainteresujące będzie zobaczyć, jak wiele można zasadnie osiągnąć za pomocąniewielkiej tylko części potężnego aparatu abstrakcyjnej geometrii różniczkowej.Zakładam, że czytelnik zna analizę matematyczną w przestrzeni euklidesowejna poziomie standardowego wykładu na politechnice lub uniwersyteciena kierunkach ścisłych (lecz nie na matematyce); przede wszystkim znajomośćrachunku różniczkowego funkcji wielu zmiennych i podawanych w ramach takiegowykładu najbardziej elementarnych pojęć topologii. Zakładam, że mastandardową wiedzę z algebry liniowej: macierze, wyznaczniki, układy równańliniowych, przestrzenie liniowe i ich odwzorowania. Zadań jest niewiele, podajęnatomiast sporo szczegółowo przeliczonych przykładów i czytelnik może jetraktować jak zadania rozwiązane.Pragnę podziękować przede wszystkim dr Wojciechowi Jurczakowi, MarcinowiSobocińskiemu i Dorocie Krochmalczyk, lekarzom z Kliniki Hematologii<strong>Uniwersytet</strong>u <strong>Jagielloński</strong>ego. Bez ich aktywnego działania ta książka napewno nie powstałaby. Miłym obowiązkiem jest wyrażenie wdzięczności zawyjaśnienia i wskazówki matematykom z <strong>Uniwersytet</strong>u <strong>Jagielloński</strong>ego, ZofiiDenkowskiej i Adamowi Janikowi oraz Zdzisławowi Pogodzie, który objaśniałmi zawiłości klasyfikacji rozmaitości i podawał materiały o historii geometrii.Andrzejowi Derdzińskiemu z Ohio State University zawdzięczam informacjeo przestrzeniach, do których stosuje się twierdzenie Bochnera. Wyrazy podziękowaniakieruję do obu recenzentów, których uwagi umożliwiły mi usunięcieszeregu niedostatków tekstu. Na koniec pragnę docenić starania żony, którawielokrotnie wymuszała poprawienie stylu i jasności wykładu.<strong>Uniwersytet</strong> <strong>Jagielloński</strong>i Centrum KopernikaBadań Interdyscyplinarnych,Kraków, styczeń 2010 r.


1. Preliminaria1.1. Przestrzeń i czasoprzestrzeń w matematyceNajważniejszą przestrzenią, z jaką wszyscy mamy do czynienia, jest czasoprzestrzeń.Najbardziej elementarnym i niezbędnym składnikiem opisu dowolnegozjawiska fizycznego jest podanie, gdzie i kiedy zaszło. Zbiór wszystkichmiejsc i momentów zdarzeń, które traktujemy jako punktowe, czyli nie przypisujemyim rozciągłości przestrzennej ani czasowej, tworzy czasoprzestrzeń.Intuicja psychologiczna i tradycja kulturowa odróżniają czas od przestrzeni.Czas to następstwo zdarzeń, natomiast przestrzeń jest zbiorem równoczesnychpołożeń wszelkich ciał materialnych, przy czym istotne są tylko wzajemne relacjetych położeń, niezależne od fizycznych własności ciał. Dopiero nowożytnafizyka wykazała istnienie głębszego, a nie tylko powierzchownego związku czasui przestrzeni i pomimo intuicyjnej odrębności złączyła je w jeden obiekt fizyczny.Według teorii względności czas i przestrzeń są jedynie pewnymi aspektamitego obiektu, który matematycznie modelowany jest za pomocą czasoprzestrzeni,a ta jest pewnego rodzaju przestrzenią matematyczną. W tej książcebędziemy stosować jednolite podejście do wszystkich przestrzeni i tylko tam,gdzie jest to konieczne, będziemy wskazywać odmienność czasoprzestrzeni odpozostałych przestrzeni używanych w matematyce i innych naukach ścisłych.Fizyczna przestrzeń, którą postrzegamy zmysłami, stała się prototypembardzo ogólnego i fundamentalnego dla całej matematyki pojęcia przestrzeniabstrakcyjnej. Najbliższa intuicji jest przestrzeń euklidesowa E n , o którejprzez długi czas sądzono, że jest jedyną możliwą przestrzenią w geometrii,a w przypadku trzech wymiarów przedstawia przestrzeń fizyczną. Dopierow XIX wieku pojawiły się przestrzenie nieeuklidesowe. Z algebry znane jestpojęcie przestrzeni liniowej, czyli wektorowej. Jej elementami nie są punktypojmowane geometrycznie, lecz wektory określone jedynie własnościami algebraicznymi— mogą to zatem być bardzo odmienne obiekty matematyczne.Ten fundamentalny fakt, że z punktu widzenia algebry wektor nie musibyć strzałką łączącą dwa punkty w E n , sprawił, że w analizie matematycznejwprowadzono bardzo ważne pojęcie przestrzeni funkcyjnej, której elementa-


14 1. Preliminariami (wektorami) są funkcje o określonych własnościach, np. L 2 (a,b) jest przestrzeniąliniową funkcji rzeczywistych całkowalnych z kwadratem na odcinku[a,b] osi liczbowej. W ten sposób powstała analiza funkcjonalna, w której badasię abstrakcyjne przestrzenie wektorowe mające nieskończenie wiele wymiarówi niedające się przedstawić graficznie.Uogólnienie pojęcia przestrzeni poszło nie tylko w kierunku wektorowychprzestrzeni funkcyjnych. Drugi kierunek, który nas tu bardziej interesuje, wychodzize spostrzeżenia, iż przestrzeń euklidesowa jest przestrzenią liniową,a powierzchnie w E 3 — takie jak sfera, torus, elipsoida, hiperboloida itp. —przestrzeniami wektorowymi już nie są. (Suma dwóch wektorów na płaszczyźniejest wektorem leżącym na niej, natomiast nie jest wcale oczywiste, jakzdefiniować wektory leżące na sferze. Gdyby sferę zdefiniować w E 3 jako zbiórwektorów jednakowej długości zaczepionych w jej środku, to suma dwu takichwektorów wyjdzie poza nią). Tradycyjnie do czasów Riemanna powierzchniei hiperpowierzchnie (czyli powierzchnie o wymiarze wyższym niż 2) pojmowanojako podzbiory przestrzeni euklidesowej E n . Takie ujęcie zwykle nie jestnajwygodniejsze w konkretnych rozważaniach, a nawet okazało się utrudnieniemw badaniach pewnych przestrzeni. Mocnym argumentem przeciwko temuujęciu jest einsteinowska ogólna teoria względności: według niej fizycznaczasoprzestrzeń może być modelowana jako 4–wymiarowa hiperpowierzchniaw pewnej 10–wymiarowej przestrzeni wektorowej (przestrzeni Minkowskiego),lecz ta zanurzająca ją przestrzeń fizycznie nie istnieje. Czasoprzestrzeń istniejefizycznie sama w sobie, jako samodzielna przestrzeń geometryczna, nie zaśjako hiperpowierzchnia w przestrzeni o większej liczbie wymiarów. Na potrzebyzarówno fizyki, jak i samej geometrii podano ogólną definicję przestrzenigeometrycznej, która nie jest liniowa i która traktuje wszystkie możliwe (znanei nieznane) hiperpowierzchnie w E n jako samodzielne przestrzenie, i ściśleujmuje to, co intuicyjnie nazywamy powierzchnią zakrzywioną.Najogólniejszego, dającego fundament dla niemal całej matematyki pojęciaprzestrzeni dostarcza topologia. Wprowadza ona przestrzeń topologiczną,będącą rodziną (zbiorem) zbiorów otwartych. Wszystkie przestrzenie liniowew algebrze, funkcyjne w analizie i „geometryczne” w geometrii są przestrzeniamitopologicznymi. Ponieważ wybór zbiorów otwartych w danym zbiorzepunktów jest w dużej mierze arbitralny, różnice między odmiennymi przestrzeniamitopologicznymi mogą być ogromne. Spośród nich wybieramy klasę,dość wąską z punktu widzenia topologii, tych przestrzeni, które lokalnie sąhomeomorficzne 1 z kawałkami przestrzeni R n ; z punktu widzenia zastosowańw samej matematyce i naukach przyrodniczych klasa ta jest bardzo szeroka.Są to rozmaitości różniczkowe (różniczkowalne). One właśnie są „przestrzeniami”,w których będziemy uprawiać analizę tensorową. Jeden z głównychprogramów badawczych fizyki dotyczy sformułowania fundamentalnych teoriifizycznych na odpowiednich rozmaitościach różniczkowych. Rozmaitościami są1 Homeomorfizm definiujemy w podrozdz. 1.5.


1.2. Wektory na rozmaitości 15też przestrzenie pojawiające się w innych naukach ścisłych i technicznych. Tupodamy uproszczoną definicję rozmaitości, nieodwołującą się bezpośrednio dotopologii.1.2. Wektory na rozmaitościPierwszym krokiem jest przeniesienie znanej nam <strong>analizy</strong> wektorowej w liniowejprzestrzeni R n na dowolną rozmaitość, która jest „zakrzywiona”, tj. nieliniowa.Pojęcie wektora pochodzi z geometrii analitycznej, a jego prototypemjest odcinek skierowany −→PQ w E n łączący punkt początkowy (zaczepienia) Pz punktem końcowym Q. Mamy dwa rodzaje wektorów: wektory zaczepionew punkcie początkowym oraz wektory swobodne — reprezentowane przez całąklasę równoważności [ −→PQ] odcinków skierowanych. W obu wypadkach wektorjest wyznaczony przez parę (lub nieskończony zbiór par) punktów w E n . Tookreślenie wektora jest niewystarczające dla większości problemów geometrii,nauk ścisłych i techniki. Wektor prędkości v planety (traktowanej jako punktmaterialny) jest zaczepiony w punkcie P orbity, w którym w danej chwili planetasię znajduje, a punkt końcowy Q jest nieokreślony i fizycznie nie ma sensu.To, że wektor v nie jest odcinkiem skierowanym, widać z faktu, że nie zgadzająsię wymiary 2 . Współrzędne (kartezjańskie) mają wymiar długości i ten samwymiar ma odcinek skierowany, a więc różny od wymiaru prędkości. Wektorprędkości (i każdej innej wielkości fizycznej) jest jedynie proporcjonalny dopewnego odcinka skierowanego, a współczynnik proporcjonalności jest wielkościąwymiarową i ma dowolną wartość. Rzeczywiście, z definicji prędkościpiszemy v = ∆x/∆t, gdzie ∆x jest odcinkiem skierowanym od położenia planetyw chwili t do położenia w chwili t + ∆t, ale ponieważ (infinitezymalny)interwał ∆t jest dowolny, ten sam zatem wektor v dostajemy, biorąc wielkościa∆x i a∆t, gdzie a ≠ 0 jest dowolną liczbą. Ta niezgodność wymiarów sygnalizuje,że na ogół wektor nie leży w tej przestrzeni, w której jest zaczepiony.Zauważmy natomiast, że wektor prędkości jest zdefiniowany jako wektor stycznydo krzywej (trajektorii planety). Jest to własność ogólna: wektory będziemydefiniować jako obiekty styczne do krzywych na rozmaitości, czyli określoneprzez kierunek prostej stycznej. Tym samym dany wektor jest związany z jednympunktem przestrzeni — wybranym punktem styczności.W przestrzeni zakrzywionej, np. na sferze, wektor w ogóle nie może byćodcinkiem prostej złożonej z punktów tej przestrzeni, gdyż nie ma tam liniiprostych i strzałka by się wygięła. Wynika stąd, że wektor na sferze — nazywa-2 Terminem „wymiar” określamy dwa odrębne pojęcia. W matematyce wymiar (lub liczba wymiarów)to liczba współrzędnych niezbędnych do jednoznacznego zdefiniowania punktu w przestrzeni,wymiar przestrzeni R n jest zatem równy n. W naukach ścisłych wymiar (lub miano) wielkości fizycznejto wyrażenie jej w postaci iloczynu potęg jednostek wielkości podstawowych, czyli długościL, czasu T i masy M; prędkość ma wymiar L/T.


16 1. Preliminariamy go wektorem stycznym (w danym punkcie) do sfery — nie należy do niej,lecz do innej przestrzeni, zwanej przestrzenią styczną (w tym punkcie) do sfery.Przestrzeń styczna jest zbiorem wektorów stycznych w jednym punkcie do sfery,jest więc przestrzenią liniową, gdyż wektory zaczepione w tym samym punkciemożna dodawać. Jak zobaczymy dalej, przestrzeń styczną przedstawiamygraficznie jako płaszczyznę styczną w danym punkcie do sfery. Przedstawienieto nie jest matematycznie w pełni ścisłe, bowiem przestrzeń styczna jest tylkoprzestrzenią wektorową (w przypadku sfery dwuwymiarową), natomiast płaszczyznastyczna jest (jak każda przestrzeń E n ) euklidesową przestrzenią afiniczną.Co więcej, płaszczyzny styczne do sfery na ogół się przecinają, a wektoroweprzestrzenie styczne z definicji nie mogą się przecinać, ponieważ równość dwuwektorów zaczepionych w różnych punktach nie jest określona.W przypadku rozmaitości będących przestrzeniami liniowymi (E n ,przestrzeń Minkowskiego 3 szczególnej teorii względności itp.) przestrzeń stycznanakłada się na rozmaitość i stąd bierze się przekonanie — ukształtowanew przestrzeni fizycznej utożsamianej niegdyś z E 3 — że wektory leżą na samejrozmaitości.Kluczowe jest pojęcie wektora w jednym punkcie rozmaitości. W następnymkroku wprowadza się gładkie pola wektorowe, tj. z każdym punktem rozmaitości(lub pewnego jej obszaru) stowarzysza się jeden wektor w taki sposób,by wektory te zmieniały się gładko przy przejściu do sąsiednich punktów.Przykładów pól jest mnóstwo: natężenie jednorodnego pola grawitacyjnegoprzy powierzchni Ziemi, zmienne w przestrzeni (i wolno w czasie) natężeniepola grawitacyjnego w obszarze Układu Słonecznego, rozmaite pola elektrycznei magnetyczne, pole prędkości wody w bystrym strumieniu górskim, poleprędkości planety wzdłuż jej trajektorii. W R n obliczanie pochodnych polawektorowego przebiega podobnie jak funkcji rzeczywistych: różniczkuje sięoddzielnie każdą składową wektora. Na rozmaitości, która nie jest przestrzeniąliniową, tak postępować nie można — okazało się, że podanie zadowalającejdefinicji pochodnej pola wektorowego było największą trudnością <strong>analizy</strong> <strong>tensorowej</strong>i zajęło wiele lat. Pojawia się tu nowa wielkość: koneksja afiniczna. Jejwłasności stanowią treść rozdziału 5.1.3. TensoryLinie, powierzchnie, figury płaskie i bryły rozmaitych wymiarów oraz polawektorowe nie wyczerpują wszystkich obiektów geometrycznych, jakie możnai trzeba skonstruować w przestrzeniach euklidesowych i ogólniejszych. Polaelektryczne i magnetyczne są częściami jednego obiektu fizycznego — polaelektromagnetycznego — które powinno być opisane jednym tworem matema-3 Terminy „przestrzeń Minkowskiego” i „czasoprzestrzeń Minkowskiego” są synonimami. Ten drugijest używany częściej w literaturze fizycznej.


1.4. Przestrzenie R n i E n 17tycznym. Jednak jedno pole wektorowe nie wystarczy i musimy wprowadzićtwór ogólniejszy, antysymetryczny tensor natężenia pola elektromagnetycznegookreślony w czterowymiarowej czasoprzestrzeni. Ten i wiele innych ważnychw zastosowaniach tensorów można przedstawić jako macierze kwadratoweo wymiarze równym wymiarowi przestrzeni, w której są określone. Za pomocątakich tensorów (ściślej — pól tensorowych) opisujemy naprężenia w skorupieziemskiej (zmienne w momencie trzęsienia ziemi), rozmieszczenie gęstościenergii, pędu i ciśnienia w płynącej cieczy (huragan lub fale morskie) oraz własnościoptyczne kryształów. W samej geometrii określenie iloczynu skalarnegowektorów i odległości punktów bliskich wymaga wprowadzenia symetrycznegotensora metrycznego, który tym samym staje się fundamentalnym obiektemgeometrycznym dla danej rozmaitości. Są też tensory bardziej złożone, najważniejszymz nich jest tensor krzywizny dla rozmaitości z koneksją afiniczną.Tradycyjne podejście do tensorów opierało się na pojęciu obiektu geometrycznego,któremu nie nadawano precyzyjnej treści w postaci aksjomatycznejdefinicji, lecz jedynie podawano jego własności transformacyjne przy zmianieukładu współrzędnych. Podejście to okazało się niezadowalające i obecnie tensorydefiniuje się jako odwzorowania wieloliniowe. W tej książce będziemy odczasu do czasu posługiwać się pojęciem obiektu, nadając mu czysto intuicyjnysens: jest to twór matematyczny, który ma treść geometryczną, a więc niejest całkowicie zależny od wyboru układu współrzędnych. Do obiektów geometrycznychzaliczamy wszelkie figury geometryczne (to, czy punkty przestrzenisą obiektami, jest kwestią konwencji), funkcje, odcinki skierowane, wektory,formy liniowe (odwzorowania wektorów w liczby), jak również metodę przesuwaniarównoległego wektora z jednego miejsca w inne oraz tensory. Tensory sątakim uogólnieniem wektorów i funkcji rzeczywistych, że różniczkowanie póltensorowych jest jednoznacznie określone przez różniczkowanie wektorów.Przez rachunek tensorowy rozumiemy zatem analizę tensorową na dowolnejrozmaitości różniczkowej. Najpierw trzeba zdefiniować rozmaitość. Robimyto za pomocą przestrzeni R n . Zaczynamy od przypomnienia potrzebnych tuwiadomości z <strong>analizy</strong>.1.4. Przestrzenie R n i E nW analizie matematycznej występuje kilka różnych przestrzeni R n powstającychprzez nakładanie dodatkowych struktur na przestrzenie o mniejszej liczbiewłasności.• Arytmetyczna przestrzeń R n . Jest to zbiór arytmetycznych ciągów n liczbrzeczywistych, R n = {(x 1 ,x 2 ,... ,x n ) : x i ∈ R}, bez żadnej dodatkowej struktury.Ciągi te nazywamy punktami, a liczby x i , i = 1,... ,n, są współrzędnymipunktu x = (x i ) = (x 1 ,x 2 ,... ,x n ) ∈ R n . Zbiór R n ma strukturę iloczynu kartezjańskiegon egzemplarzy zbioru liczb rzeczywistych, R n = R × R... × R,R 1 ≡ R.


18 1. Preliminaria• Wektorowa przestrzeń R n . W R n wyróżniony jest punkt 0 = (0,... ,0),naturalne jest więc nałożyć na nią strukturę przestrzeni liniowej 4 : punkty traktujemyjak wektory. Wektorowa przestrzeń R n to n–wymiarowa rzeczywistaprzestrzeń liniowa, której elementami są ciągi x = (x 1 ,...,x n ). Operacja liniowaax + by, dla a,b ∈ R, daje wektor będący ciągiem (ax i + by i ). Współrzędnex i punktu stają się teraz składowymi wektora. Wektor jest tożsamyz ciągiem swoich składowych. Aby mieć zgodność z zapisem macierzowym,przyjmujemy regułę, że składowe wektora, zarówno w R n , jak i na dowolnejrozmaitości, tworzą macierz jednokolumnową. W tej przestrzeni wprowadzamybazę naturalną złożoną z n wyróżnionych, liniowo niezależnych wektorów 5e 1 = (1,0,... ,0) T , e 2 = (0,1,0,... ,0) T , ..., e n = (0,... ,0,1) T . W bazie {e i },i = 1,... ,n, dowolny wektor x jest kombinacją liniową x = ∑ ni=1 xi e i . Wynikastąd fundamentalneTWIERDZENIE 1.1. Każda rzeczywista n–wymiarowa przestrzeń liniowaV n jest izomorficzna z wektorową przestrzenią R n . Izomorfizm oznacza tuwzajemnie jednoznaczne i zachowujące operacje algebraiczne odwzorowanieliniowe V n na R n .Rzeczywiście, niech {E i }, i = 1,... ,n, będzie pewną bazą wektorowąw V n , czyli każdy wektor v ∈ V n ma w tej bazie reprezentację v = ∑ ni=1 xi E i .Wprowadzamy odwzorowanie liniowe f : V n → R n zdefiniowane jego działaniemna wektory bazowe 6 , f(E i ) := e i . Wówczasn∑n∑f(v) = x i f(E i ) = x i e i = xi=1i mamy wzajemnie jednoznaczne przyporządkowanie v ↔ x będące liniowymizomorfizmem obu przestrzeni.• Topologiczna przestrzeń wektorowa R n . W liniowej przestrzeni R n możnawprowadzić topologię, czyli zdefiniować rodzinę zbiorów otwartych, którełącznie pokrywają całą przestrzeń. Można to zrobić na wiele nierównoważnychsposobów. W praktyce zawsze wprowadza się topologię naturalną, w którejpierwotnymi zbiorami otwartymi są kule otwarte o środku w dowolnym punkciex 0 = (x i 0 ) i o dowolnym promieniu r > 0:{ n∑K(x 0 ,r) := x : (x i − x i 0 )2 < r};2i=1kule te nie zawierają brzegowej sfery. Dowolny zbiór otwarty jest sumą mnogo-4 Terminy „przestrzeń liniowa” i „przestrzeń wektorowa” traktujemy jak ścisłe synonimy.5 Ze względów typograficznych będziemy czasem pisać wektory jako transponowane macierze jednowierszowe;górny indeks T oznacza transpozycję macierzy.6 Notacja: symbol „:=” oznacza definicję, czyli wielkość stojąca po lewej stronie jest definiowanawyrażeniem po prawej stronie tego symbolu.i=1


1.4. Przestrzenie R n i E n 19ściową skończonej, przeliczalnej lub nieprzeliczalnej ilości kul otwartych. Wynikastąd, że jeżeli punkt x należy do zbioru otwartego, to zawiera się w nim wrazz otaczającą go kulą otwartą o dostatecznie małym promieniu. Nazwanie tejtopologii „naturalną” nabiera sensu, gdy w liniowej przestrzeni R n wprowadzisię iloczyn skalarny i w konsekwencji normę wektora. (Pojęcia te są historyczniewcześniejsze i bardziej intuicyjne od abstrakcyjnego zbioru otwartego).• Wektorowa przestrzeń euklidesowa R n . Jest to topologiczna przestrzeńwektorowa R n , w której wprowadzamy euklidesowy iloczyn skalarny, czyli odwzorowaniepary wektorów na liczbę rzeczywistą, dany wzorem〈x,y〉 ≡ x · y :=Iloczyn ten ma własności:n∑x i y i = x 1 y 1 + x 2 y 2 + ... + x n y n .i=1— x · y = y · x,— jest liniowy w każdym argumencie,— x · x 0 oraz x · x = 0 wtedy i tylko wtedy, gdy x = 0 = (0,... ,0). (E)Iloczyn skalarny określa normę (długość) wektora 7‖x‖ := √ ∑〈x,x〉 = √ n (x i ) 2oraz odległość punktów x i y:∑d(x,y) ≡ ‖x − y‖ := √ n (x i − y i ) 2 .Dla dowolnych wektorów w R n zachodzi nierówność Cauchy’ego–Schwarzai=1i=1(x · y) 2 ‖x‖ 2 · ‖y‖ 2 ,a z niej wynika nierówność będąca szczególnym przypadkiem nierówności Minkowskiego:‖x + y‖ ‖x‖ + ‖y‖.Aby udowodnić pierwszą nierówność, bierzemy dwa dowolne wektory x i yoraz dowolną liczbę λ ∈ R. Wówczas zachodzi(x + λy) · (x + λy) = ‖y‖ 2 λ 2 + 2x · yλ + ‖x‖ 2 .7 Zależnie od wygody wektory tej przestrzeni będziemy oznaczać x, a ich długość ‖x‖ albo pismempogrubionym x i ich długość |x|.


20 1. PreliminariaRzeczywisty trójmian kwadratowy (względem λ) jest wszędzie nieujemny tylkowtedy, gdy nie ma rzeczywistych pierwiastków lub jest jeden pierwiastekpodwójny (rzeczywisty), czyli gdy wyróżnik ∆ = (2x · y) 2 − 4‖y‖ 2 ‖x‖ 2 0.Stąd wynika nierówność Cauchy’ego–Schwarza. Staje się ona równością albogdy x = 0, albo gdy y = ax, a ∈ R. Dalej, jeżeli x + y = 0, to nierównośćMinkowskiego jest trywialnie spełniona. Niech zatem x + y ≠ 0, wtedy‖x + y‖ 2 = (x + y) · (x + y) = ‖x‖ 2 + ‖y‖ 2 + 2x · y.Stosując nierówność Schwarza x · y |x · y| ‖x‖ · ‖y‖, dostajemy‖x + y‖ 2 ‖x‖ 2 + ‖y‖ 2 + 2‖x‖ · ‖y‖ = (‖x‖ + ‖y‖) 2 ,i pierwiastkując, otrzymujemy nierówność Minkowskiego. Przechodzi onaw równość albo dla x = 0, albo dla y = 0, albo dla y = ax przy a > 0.Zauważmy, że w dowodzie nie korzystaliśmy w ogóle z jawnej postaci iloczynuskalarnego, a tylko z zespołu własności (E). Dlatego też w rozmaitychprzestrzeniach liniowych, zwłaszcza w analizie funkcjonalnej, wprowadza sięiloczyn skalarny na różne sposoby, wymagając jedynie, by miał własności (E);często też te iloczyny nazywane są euklidesowymi. W geometrii wyróżnionyjest powyższy euklidesowy iloczyn skalarny. Dodajmy również, że kolejnośćnakładania struktury wektorowej i topologicznej jest dowolna. O ile nie będziepowiedziane inaczej, przez R n będziemy rozumieć wektorową przestrzeńeuklidesową.DEFINICJA 1.2. Wektorowa przestrzeń euklidesowa V n to n–wymiarowarzeczywista przestrzeń liniowa, w której wprowadzono euklidesowy iloczyn skalarnyw następujący sposób:Istnieje w niej baza ortonormalna {E i }, czyli taka, że iloczyny skalarne jejwektorów są z definicji równe E i · E j = δ ij , gdzie δ ij = 1 dla i = j oraz 0dla i ≠ j (jest to znany z algebry symbol Kroneckera). Wtedy dla dowolnychwektorów u = ∑ ni=1 ui E i oraz v = ∑ ni=1 vi E i ich iloczyn skalarny w tej baziejest równyn∑u · v = u i v i .Norma wektora jest równai=1‖v‖ := √ v · v.W tej przestrzeni obowiązują nierówności Cauchy’ego–Schwarza i Minkowskiego.Uwaga 1.1 (terminologiczna). Nazwa „składowa” oznacza dwa spokrewnione,lecz różne pojęcia. Należy rozróżniać wektory składowe i składowe wektora.Dowolny wektor v możemy rozłożyć na „składową równoległą” v ‖ i „skła-


1.4. Przestrzenie R n i E n 21dową prostopadłą” v ⊥ do wybranego kierunku w przestrzeni, czyli napisaćv = v ‖ + v ⊥ . Te „składowe” wektora są wektorami i poprawnie należy je nazywaćwektorami składowymi w rozwinięciu danego wektora na pewne wyróżnionewektory; uproszczona nazwa „składowe” jest popularna w fizyce elementarnej.Drugie znaczenie „składowych” narzuca algebra liniowa. Ten wybranykierunek indukuje bazę wektorową zbudowaną z wektorów jednostkowych dosiebie ortogonalnych i w niej dany wektor ma rozłożenie v = v 1 E ‖ + v 2 E ⊥ , jegoskładowymi są liczby v 1 i v 2 . Ogólnie, składowymi wektora v w bazie {E i }są liczby v 1 , v 2 ,..., v n będące współczynnikami w rozwinięciu tego wektoraw tej bazie, v = v 1 E 1 + v 2 E 2 + ... + v n E n . Będziemy mówić wyłącznie o składowychwektora (oraz tensora) i będzie to jednoznacznie oznaczać ciąg liczbzwiązanych z konkretną bazą wektorową przestrzeni liniowej. Niektórzy autorzyużywają terminu „składowe” w pierwszym znaczeniu (wektory składowe),a składowe wektora nazywają „współrzędnymi wektora w bazie”. Tę ostatniąnazwę uważamy za bardzo mylącą; zob. uwagę na końcu podrozdz. 3.5.1.4.1. Afiniczna przestrzeń euklidesowa E nW przestrzeniach R n punkt jest tożsamy z ciągiem swoich współrzędnych.Pojęcie przestrzeni oraz wzajemnych relacji między figurami (podzbiorami)w przestrzeni formułujemy za pomocą geometrycznych punktów, które są pierwotnei niezależne od wyboru ich współrzędnych. Ideę tę w elementarnej formiewyraża szkolna geometria syntetyczna (tak jak ją w Elementach sformułowałEuklides), która w ogóle nie odwołuje się do współrzędnych i operuje punktami,liniami i powierzchniami, a operacje liniowe (tzn. na wektorach) schodząna dalszy plan. Prototypem geometrii jest geometria euklidesowa, gdyż „przestrzeńeuklidesowa preegzystuje w formowaniu się naszych czynności umysłowych”8 . To, co w szkolnej matematyce nazywamy „geometrią euklidesową”,a w matematyce wyższej — przestrzenią euklidesową, jest faktycznie trójwymiarowąafiniczną przestrzenią euklidesową. Przestrzeń afiniczna 9 zbudowanajest z punktów i wektorów. Ogólnej definicji tu nie potrzebujemy, łatwo jąodtworzyć z przypadku euklidesowego.DEFINICJA 1.3. Afiniczną przestrzenią euklidesową nazywamy parę(A,V n ), gdzie A jest zbiorem punktów geometrycznych (zwanych czasem zbiorembazowym), A = {p}, a V n = {v} jest stowarzyszoną z A euklidesowąprzestrzenią wektorową, która działa w A jak abelowa (tj. przemienna) grupaprzesunięć równoległych, czyli jest odwzorowaniem iloczynu kartezjańskiegoA × V n na A postaci:każdemu p ∈ A i każdemu v ∈ V n przyporządkowany jest punkt q ∈ Arówny q = p + v.8 René Thom, „Matematyka a rozumienie”, Wiadomości Matematyczne 23 (1980–81), s. 205.9 Z łac. affinitas — pokrewieństwo, powinowactwo. Przekształcenia afiniczne zachowują podobieństwofigur.


22 1. PreliminariaZnak „+” nie oznacza tu dodawania wektorów, lecz przesunięcie o wektor vz punktu p do q, czyli v = −→ pq, co zapisujemy też jako v = q −p. Odwzorowanieto ma własności:1) (p + v) + u = p + (v + u) dla każdego p ∈ A i v,u ∈ V n ;2) p + 0 = p dla każdego p;3) dla każdej pary p,q ∈ A istnieje jednoznaczny wektor v ∈ V n taki, żeq = p + v.Wynika stąd:a) własność Chaslesa 10 : dla dowolnych punktów p, q i r łączące je wektoryspełniają relację −→ pq + −→ qr + −→ rp ≡ q − p + r − q + p − r = 0;b) dla każdego p, jeżeli p + v = p, to v = 0.Odległość dowolnych punktów p,q ∈ A jest równa długości łączącego jewektora v = q − p,d(p,q) := ‖v‖ = √ v · v.Wymiarem przestrzeni euklidesowej (A,V n ) nazywamy liczbę n równą wymiarowiprzestrzeni wektorowej V n . Afiniczną przestrzeń euklidesową oznaczamyE n = (A,V n ).Przestrzeń stowarzyszona V n pozwala dotrzeć do każdego punktu p ∈ A,wychodząc z dowolnie wybranego punktu p 0 . Tym samym cały zbiór bazowy Amożna odtworzyć, zadając jeden jego punkt, A = {p : p = p 0 + v}, gdzie wektoryv przebiegają całą V n , co zapisujemy równoważnie A = p 0 + V n , a zatemE n = (p 0 +V n ,V n ). Oznacza to izomorfizm E n i V n , a tym samym izomorfizmE n i R n — w sensie operacji algebraicznych, które wykonujemy na przestrzenistowarzyszonej. Obie przestrzenie są algebraicznie identyczne, różnica jestgeometryczna. Istnienie tego izomorfizmu sprawia, że w wielu podręcznikachwektorowa przestrzeń euklidesowa R n jest utożsamiana z afiniczną przestrzeniąE n . Rachunkowo nie prowadzi to do błędów, natomiast pojęciowo nie jestpoprawne, gdyż różnica między nimi jest subtelna, lecz wyraźna: przestrzeńE n jest całkowicie jednorodna, czyli żaden jej punkt nie jest wyróżniony i niema ona naturalnego „początku”. Przestrzeń R n , jak każda przestrzeń wektorowa,ma wyróżniony punkt (wektor) 0 = (0,... ,0). Co równie istotne,przestrzeń afiniczna nadaje sens geometryczny punktom, uniezależniając je odwspółrzędnych. Aby ten sens uzyskać, w definicji E n stosuje się ogólną wektorowąprzestrzeń euklidesową V n , a nie przestrzeń R n . Rzeczywiście, wybierzmydwa punkty, p i q, na płaszczyźnie euklidesowej; wyznaczają one wektor−→pq ≡ q − p. Gdyby przestrzenią stowarzyszoną była R 2 , to wektor ten byłbytożsamy z dwuelementowym ciągiem liczb, np. (−3,8). Geometrycznie jestoczywiste, że para punktów przestrzeni euklidesowej (ogólniej: afinicznej) definiujewektor jako odcinek skierowany, natomiast nie wyróżnia żadnego ciąguliczb.10 Michel Chasles (1793–1880), francuski matematyk, główne prace z geometrii.


1.4. Przestrzenie R n i E n 23W E n wprowadzamy układ współrzędnych afinicznych. Jest to para(O, {E i }), gdzie O ∈ A jest dowolnie wybranym punktem, zwanym punktempoczątkowym układu afinicznego, a {E i }, i = 1,... ,n, jest dowolną baząortonormalną w stowarzyszonej przestrzeni V n . Każdy punkt p ∈ A ma w tymukładzie jednoznaczne przedstawienien∑p = O + v = O + x i E i .Liczby x i (składowe wektora v) tworzą ciąg współrzędnych afinicznych punktup. Jeżeli q = O+v+u, gdzie wektory v i u mają odpowiednio składowe (x i )i (y i ), to q ma współrzędne afiniczne (x i +y i ). Odległość punktów p 1 = O +v 1oraz p 2 = O + v 2 jest równa∑d(p 1 ,p 2 ) = ‖v 2 − v 1 ‖ = √ n (v2 i − v1) i 2 .W przestrzeni V n istnieje nieskończenie wiele baz ortonormalnych i żadnanie jest wyróżniona, gdyż w odróżnieniu od R n nie ma ona bazy naturalnej.Dowolnośćwyborubazy ortonormalnej imożliwośćjej zmiany (zapomocątransformacjiortogonalnej) pociąga transformacje współrzędnych afinicznych w E n .Afiniczna przestrzeń E n nadaje głębszy sens znanym z elementarnego kursugeometrii analitycznej pojęciom wektorów umiejscowionych i swobodnych.Wektor umiejscowiony to odcinek skierowany −→ pq łączący dwa punkty „przestrzeni”,którą rozumie się jako intuicyjnie pojmowaną przestrzeń euklidesową.Wektor taki ma trzy własności: długość, kierunek i zwrot. Jeżeli bierzemy poduwagę tylko te własności i pomijamy punkt zaczepienia p, to istnieje nieskończeniewiele takich samych odcinków skierowanych, które względem nich sąrównoważne: odcinki −−→ p 1 q 1 i −−→ p 2 q 2 są równoważne, jeżeli mają tę samą długość,kierunek i zwrot, co zapisujemy −−→ p 1 q 1 ∼ −−→ p 2 q 2 . Klasą równoważności odcinkówskierowanych nazywamy zbiór wszystkich odcinków, które są w tym sensierównoważne: [ −−→ p 0 q 0 ] := { −→ pq :−→ pq ∼−−→ p0 q 0 }. Klasę równoważności reprezentujedowolny jej element. Wektorem swobodnym nazywamy klasę równoważnościodcinków skierowanych. Zauważmy, że aby określić długość odcinka, trzebamieć pojęcie odległości punktów, a pojęcie kierunku odcinka jest intuicyjne;to określenie równoważności odcinków jest niezadowalające. Pojęciem fundamentalnymjest wektor umiejscowiony. Wektorową przestrzeń R n , jak równieżkażdą wektorową przestrzeń V n , możemy przedstawić jako zbudowaną z wektorówumiejscowionych zaczepionych w punkcie wyróżnionym — wektorze 0;punkty przestrzeni to końce tych wektorów. Zarazem, kiedy przestrzeń V ndziała jak grupa przesunięć równoległych w afinicznej przestrzeni euklidesowej(A,V n ), wtedy umiejscowione wektory z V n stają się swobodnymi wektoramiw A, jeżeli bowiem q = p + v oraz q ′ = p ′ + v, v ∈ V n , to v = q − p = q ′ − p ′ ,czyli v jest swobodny jako klasa równoważności odcinków skierowanych.i=1i=1


24 1. Preliminaria1.5. Odwzorowania przestrzeni R nPonieważ przestrzeń E n jest konstruowana za pomocą R n lub izomorficznejdo niej V n , zajmiemy się przestrzenią R n i jej odwzorowaniami. W ogólnościmożna rozpatrywać odwzorowania między przestrzeniami różnych wymiarów,tj. R n na R m , gdzie n ≠ m. Potrzebne nam będą odwzorowania R n na R n orazfunkcje rzeczywiste, tj. odwzorowania R n na R 1 . Niech U, V będą zbioramiotwartymi w R n i niech f będzie odwzorowaniem U na V , tj. jeżeli x ∈ U,to f(x) ∈ V . Zbiór U nazywamy dziedziną odwzorowania, a zbiór f(U) :={f(x) : x ∈ U} ⊂ V jest obrazem zbioru U przy odwzorowaniu f. Jeżeli zbiórW ⊂ f(U), to zbiór f −1 (W) := {x ∈ U : f(x) ∈ W } ⊂ U jest przeciwobrazemzbioru W.Przypominamy, że ciągłość odwzorowania f : U → V definiujemy podobniejak dla funkcji jednej zmiennej: odwzorowanie f jest ciągłe w punkcie x 0 ∈ U,jeżeli dla każdego ε > 0 istnieje δ > 0 takie, że jeżeli ‖x − x 0 ‖ < δ, to‖f(x)−f(x 0 )‖ < ε, i f jest ciągła na U, jeżeli jest ciągła w każdym punkcie tegozbioru. Ciągłość można wyrazić bez użycia pojęcia granicy, za pomocą zbiorówotwartych. Równoważna definicja ciągłości brzmi bowiem: odwzorowanie fzbioru U na V jest ciągłe w punkcie x 0 ∈ U, jeżeli dla każdego otwartegootoczenia W ⊂ V punktu f(x 0 ) istnieje takie otoczenie U 0 punktu x 0 , żef(U 0 ) ⊂ W.Wynika z niejTWIERDZENIE 1.4. Odwzorowanie f zbioru U na zbiór V w R n jest ciągłena U wtedy i tylko wtedy, gdy dla każdego zbioru otwartego W ⊂ V jegoprzeciwobraz f −1 (W) ⊂ U jest otwarty.Twierdzenie to jest słuszne w przestrzeniach ogólniejszych niż R n , jeżeli tylkozdefiniowane są w nich zbiory otwarte pokrywające łącznie taką przestrzeń(są to przestrzenie topologiczne). Symbol f −1 oznacza tutaj przeciwobraz pewnegozbioru, a nie odwzorowanie odwrotne. Interesują nas odwzorowania, któresą odwracalne.DEFINICJA 1.5. Odwzorowanie f : U → V jest bijekcją, jeżeli:— jest różnowartościowe (iniekcja), tzn. ∀x,y ∈ U, jeżeli x ≠ y, to f(x) ≠≠ f(y),— jest odwzorowaniem U na V (suriekcja), tj. obrazem U jest cały zbiórV , f(U) = V , tzn. ∀y ∈ V istnieje co najmniej jeden punkt x ∈ U taki, żey = f(x).Istnieje wówczas odwzorowanie odwrotne f −1 : V → naf −1 (V ) = U. Jeżelibijekcja f jest ciągła na U i odwzorowanie odwrotne f −1 jest ciągłe na V == f(U), to f nazywamy homeomorfizmem 11 U na V .11 Pojęcie homeomorfizmu (z greckiego homoios — podobny, morphe — kształt) wprowadził HenriPoincaré w 1895 r. w dziele Analysis situs.


1.5. Odwzorowania przestrzeni R n 25Przykład 1.1 (homeomorfizmu). Niech U będzie prostą rzeczywistą, −∞


26 1. Preliminaria( ) ( )∂f ∂fi≡ :=∂x ∂x k⎛⎜⎝∂f 1...∂x 1 .. .. .∂f n...∂x 1⎞∂f 1∂x n∂f n∂x npochodne bierzemy w punkcie x ∈ U. Dla przejrzystości zapisu elementy tejmacierzy oznaczamy J i k i trzymamy się konwencji, że indeks lewy (górny) inumeruje wiersze, a indeks prawy (dolny) k numeruje kolumny macierzy. Jakobianemodwzorowania f w x ∈ U nazywamy wyznacznik macierzy Jacobiego:( ) ∂fiJ f := det =∂x kDla jakobianu stosowane są też zapisy( ) ∂yiD(y 1 ,...,y n )det ,∂x k D(x 1 ,...,x n )∂f 1...∂x 1 . . .. .∣ ∂f n...∂x 1oraz∂f 1∂x n⎟⎠ ,∣ ∣∣∣∣∣∣.∂f n∂x n∂(y 1 ,... ,y n )∂(x 1 ,... ,x n ) .Odpowiedzi na pytanie o odwracalność f udziela znane z <strong>analizy</strong>TWIERDZENIE O FUNKCJI ODWROTNEJ 1.6. Niech f : U → w R ni U — otwarty w R n . Jeżeli:1) f jest klasy C 1 na U;2) f jest różnowartościowe na U;3) jakobian J f (x) jest różny od zera na U;to wtedya) f(U) jest zbiorem otwartym w R n ;b) f jest homeomorfizmem U na f(U), tzn. istnieje odwzorowanie odwrotnef −1 : f(U) → naU i jest ciągłe na f(U);c) odwzorowanie odwrotne f −1 jest klasy C 1 na f(U) i ma macierz Jacobiegorówną ( ) [( ] ∂f−1 ∂f ∣∣∣ −1=,∂y ∂x)∣x=f −1 (y)czyli jest to macierz odwrotna do ( ∂f∂x ), w której należy podstawić x = f −1 (y).Jeżeli odwzorowanie f jest gładkie (klasy C ∞ ), to również f −1 jest gładkie.Wszystkie założenia twierdzenia są konieczne, by zachodziły jego trzy tezy.Podajemy trzy przykłady sytuacji, gdy któreś z założeń nie jest spełnione.Przykład 1.2. Niech f : R 2 → R 2 dane jest wzorem f(x,y) = (e x cos y,e x sin y). Jakobian J f ≠ 0 dla wszystkich x i y, lecz f nie jest różnowartościowe,


1.5. Odwzorowania przestrzeni R n 27przyjmuje bowiem te same wartości dla (x,y) i (x,y+2nπ). Odwzorowanie f −1nie istnieje zatem na całej płaszczyźnie R 2 , lecz tylko w pasach x ∈ (−∞,+∞)i y ∈ (y 0 ,y 0 + 2π) dla dowolnego y 0 .Przykład 1.3. Jeżeli jakobian znika w pewnych punktach, to odwzorowanieodwrotne może istnieć w ich obrazach, lecz nie jest w nich różniczkowalne.Niech f : R 1 → R 1 , f(x) = y := x 3 . Jakobian J f = f ′ (x) = 3x 2 i J f (0) = 0.Odwzorowanie odwrotne f −1 (y) = 3√ y istnieje również w punkcie y = f(0) == 0, lecz nie jest tam różniczkowalne.Przykład 1.4. Bierzemy na płaszczyźnie zbiór U w kształcie półkola o promieniu1 znajdującego się na półpłaszczyźnie x > 0, rys. 1.1. Zbiór U jestotwarty, więc jego brzeg złożony z półokręgu i średnicy AOB nie należy doniego. Na R 2 wprowadzamy współrzędne biegunowe r i ϕ, a punkty płaszczyznytraktujemy jak liczby zespolone, z = x + iy = r e iϕ . Dla punktów z ∈ Umamy −π/2 < ϕ < +π/2, dla argumentu ϕ przyjmujemy bowiem konwencję,że jest nieciągły na ujemnej półosi Ox. Odwzorowanie f(z) := z 2 przekształcato półkole w otwarte koło jednostkowe V na płaszczyźnie w = u + iv, z któregooprócz brzegowego okręgu usunięto odcinek OC, −1 < u < 0, na którymargument f(z) jest równy ±π i który jest wspólnym obrazem odcinków AOi OB. Odwzorowanie f jest różnowartościowe na U i jest odwzorowaniem Una V = f(U), jest też ciągłe na U. Wydaje się, że odwzorowanie f −1 nie jestciągłe na V , gdyż bliskim punktom p i q, leżącym po obu stronach odcinkaOC, przyporządkowuje ich obrazy f −1 (p) i f −1 (q), które w U są daleko odsiebie.Rysunek 1.1Wrażenie to jest mylne. Odwzorowanie f ma współrzędne u = x 2 − y 2 ,v = 2xy, będące funkcjami klasy C 1 , i macierz Jacobiego


28 1. Preliminaria(x −y2y xktórej wyznacznik J f = 4(x 2 + y 2 ) jest dodatni w U. Ponieważ różnowartościowośćf jest oczywista, więc założenia twierdzenia o funkcji odwrotnej sąspełnione i f −1 jest ciągła na V . Rzeczywiście, niech g = f −1 i niech p leżyblisko odcinka OC, tzn. v(p) = δ, 0 < δ ≪ 1. Niech W p będzie otoczeniemotwartym punktu g(p) w U w kształcie koła o promieniu ε. Z własności funkcjipierwiastek kwadratowy, z = g(w) = √ w wynika, że dla dowolnie małego εistnieje koło otwarte K p o środku w p i promieniu mniejszym od δ, a więcnieprzecinające odcinka OC i będące tym samym zbiorem spójnym w V , takieże g(K p ) ⊂ W p . Wynika stąd, że odwzorowanie g jest ciągłe w p i z takiegosamego powodu jest ciągłe w punkcie q leżącym tuż poniżej usuniętegoodcinka.Fakt, że obrazy punktów bliskich leżą w U daleko od siebie, pokazuje, żefunkcja √ w, ciągła na zbiorze V , nie ma na nim własności silniejszej — niejest jednostajnie ciągła. Jednostajna ciągłość odwzorowań w R n , podobnie jakdla funkcji jednej zmiennej, jest własnością interesującą, jednak dla naszychcelów jest zbędna, istotna jest tylko zwykła ciągłość.Odwzorowanie f(z) = z 2 przestaje być homeomorfizmem, gdy jego dziedzinęU uzupełnić o otwarty odcinek brzegowy OA (lub OB); U staje sięwtedy zbiorem nieotwartym i jego obrazem na płaszczyźnie w jest otwartekoło jednostkowe zawierające odcinek OC będący obrazem odcinka OA. Odwzorowanief jest nadal różnowartościowe, klasy C 1 i ma dodatni jakobian,punkt O nie należy bowiem do dziedziny U, a f −1 nie jest ciągłe. Punktynieciągłości leżą na odcinku OC osi Ou. Rzeczywiście, każdy punkt p 0 tegoodcinka ma kołowe otoczenie i f −1 przekształca górne półkole tego otoczeniana zbiór leżący blisko odcinka OA w U oraz dolne półkole na zbiór leżącyblisko odcinka OB.Uwaga 1.2. Ze względu na przejrzystość twierdzenia o funkcji odwrotnej, macierzJacobiego została zdefiniowana jako macierz pochodnych odwzorowaniaf. W praktyce mamy zwykle do czynienia z sytuacją, gdy J f znika tylkona podzbiorach niższego wymiaru niż dziedzina f. Wówczas wygodniej jest definiowaćjakobian jako wyznacznik macierzy pochodnych f −1 , np. przy zmianiezmiennych w całce wielokrotnej ze współrzędnych kartezjańskich na sferycznewyrażenie podcałkowe mnożone jest przez jakobian ∂(x,y,z)/∂(r,θ,ϕ). Odtądprzyjmujemy konwencję, że jakobian jest wyznacznikiem macierzy pochodnych„starych zmiennych” x i względem „nowych zmiennych” y k ,( ) ∂xiJ = det .∂y kWśród odwzorowań ciągłych wyróżnione są homeomorfizmy, podobniewśród odwzorowań różniczkowalnych wyróżnione są dyfeomorfizmy.),


1.6. Transformacje współrzędnych 29DEFINICJA 1.7. Niech U, V będą zbiorami otwartymi w R n i niechf : U → naV będzie różnowartościowe. Jeżeli f jest klasy C k , k 1, na U,a odwzorowanie odwrotne f −1 jest klasy C k na V = f(U), to f nazywamydyfeomorfizmem klasy C k zbioru U na V .Zachodzi twierdzenie: kula otwarta w R n jest dyfeomorficzna z całą przestrzeniąR n . Rzeczywiście, niech K n (0,1) będzie n–wymiarową kulą otwartąo środku w punkcie (wektorze) 0 i promieniu 1, x = (x 1 ,... ,x n ) ∈ K n orazy = (y 1 ,... ,y n ) ∈ R n . Szukany dyfeomorfizm jest zadany np. przezy =x√ , x = y√ ,1 − |x|2 1 + |y|2gdzie |x| 2 = ∑ ni=1 (xi ) 2 < 1 oraz |y| 2 = ∑ ni=1 (yi ) 2 .Dyfeomorfizm jest oczywiście homeomorfizmem, lecz nie na odwrót: f i f −1nie muszą być różniczkowalne. Nawet jeżeli homeomorfizm f jest różniczkowalny,to odwzorowanie f −1 nie musi być różniczkowalne. Twierdzenie o funkcjiodwrotnej wymaga, by jakobian J f nie znikał nigdzie na U. Z przykładu 1.3wynika, że homeomorfizm R 1 na R 1 , y = x 3 , jest klasy C ∞ , a mimo to odwzorowanieodwrotne nie jest różniczkowalne w y = 0.1.6. Transformacje współrzędnychDowolny punkt x ∈ R n jest utożsamiony z ciągiem swoich współrzędnychkartezjańskich 13 x 1 ,...,x n , natomiast punkt p ∈ E n ma sens geometrycznyi jego współrzędne afiniczne zależą od wyboru punktu początkowegoO oraz bazy w stowarzyszonej przestrzeni liniowej V n . Wybór bazy w V noznacza, że wektor v = ∑ i xi E i zostaje utożsamiony z punktem–wektoremx = (x i ) ∈ R n , a punkt p = O + v = O + x w E n jest reprezentowany przezpunkt x w R n . Zmiana bazy w V n powoduje, że teraz v = ∑ i x′i E ′ i i punkt pjest reprezentowany przez x ′ = (x ′i ); jest to ortogonalna transformacja współrzędnychafinicznych. Możemy wyjść poza transformacje liniowe i współrzędneafiniczne, zastępując je dowolnymi współrzędnymi. W danym obszarze w E nwprowadzamy krzywoliniowy układ współrzędnych, czyli dokonujemy dowolnejtransformacji współrzędnych; jest to jedna z najczęstszych operacji matematycznychw geometrii, fizyce i technice. Transformacja ta oznacza, że obszarw E n , reprezentowany przez pewien obszar w stowarzyszonej przestrzeni R n ,po transformacji jest reprezentowany przez inny obszar w R n , będący dyfeo-13 Geometrycznie, przez układ współrzędnych kartezjańskich rozumiemy tu, zgodnie z rozpowszechnionymzwyczajem, układ prostoliniowy prostokątny. Natomiast podręcznik M. Starka Geometriaanalityczna, PWN, Warszawa 1967, s. 57, nazwą „współrzędne kartezjańskie” obejmujewszystkie układy prostoliniowe, czyli zarówno prostokątne, jak i ukośnokątne.


30 1. Preliminariamorficznym obrazem pierwszego. Jeśli dyfeomorfizm ten nie jest liniowy, to niemożna go interpretować jako zmiany bazy w przestrzeni stowarzyszonej; niejest to też transformacja współrzędnych punktu w R n , bo nie ma ona sensu.Transformacja współrzędnych jest odwzorowaniem punktów w R n będącychróżnymi reprezentacjami punktu w E n . We współrzędnych krzywoliniowychwektorowa struktura przestrzeni E n staje się niejawna, bowiem teraz relacjamiędzy punktem p i reprezentującym go punktem x ′ w R n nie ma postacip = O+x ′ . Aby czytelnie rozróżnić oba rodzaje współrzędnych, bierzemy dwaegzemplarze (co nie jest konieczne) przestrzeni R n : R n = {(x i )}, którą traktujemyjako przestrzeń stowarzyszoną z E n oraz R ′n = {(x ′k )}, i,k = 1,... ,n.Niech U ⊂ R n i V ⊂ R ′n będą zbiorami otwartymi i niech f : V → Ubędzie dyfeomorfizmem. Odwrotny dyfeomorfizm f −1 przyporządkowuje każdemupunktowi x ∈ U jego przeciwobraz x ′ ∈ V , x ′ = f −1 (x). Współrzędnekartezjańskie punktu x ′ są współrzędnymi krzywoliniowymi punktu p ∈ E nwyznaczonego przez punkt początkowy O i wektor x, p = O + x. Ujmuje to:DEFINICJA 1.8. Krzywoliniowym układem współrzędnych w otwartymzbiorze O + U w E n nazywamy gładki dyfeomorfizm f zbioru V := f −1 (U)na U. Obszar V jest dziedziną krzywoliniowego układu współrzędnych.Niech punkt x 0 w U ma współrzędne kartezjańskie a 1 ,a 2 ,... ,a n . Geometrycznieoznacza to, że n hiperpłaszczyzn współrzędnych (mających wymiarn −1), danych kolejno równaniami x 1 = a 1 , x 2 = a 2 , ..., x n = a n , przecina sięw punkcie x 0 (rys. 1.2). Podobnie punkt x ′ 0 w V ma współrzędne b 1 ,b 2 ,... ,b n ,gdy hiperpłaszczyzny współrzędnych o równaniach x ′1 = b 1 ,... ,x ′n = b n , przecinająsię w tym punkcie. Niech x 0 = f(x ′ 0 ). Wtedy ai = f i (b 1 ,b 2 ,... ,b n ), czyliwspółrzędne kartezjańskie punktu p 0 = O + x 0 są funkcjami jego współrzędnychkrzywoliniowych b 1 ,... ,b n . (Oczywiście p 0 nie wyraża się przez O + x ′ 0 ,bo wektory x ′ nie wyznaczają struktury afinicznej). W ogólności transformacjawspółrzędnych ma postać x i = f i (x ′1 ,x ′2 ,...,x ′n ) — współrzędne „stare” sąfunkcjami „nowych” współrzędnych. W praktyce często transformację współrzędnychwyraża się za pomocą odwzorowania f −1 , wtedy nowe współrzędnesą funkcjami starych.Dyfeomorfizm f przekształca hiperpłaszczyzny współrzędnych w obszarzeV w zakrzywione hiperpowierzchnie w U (na rys. 1.2 powierzchnie te są zaznaczoneliniami przerywanymi). Stąd bierze się nazwa „współrzędne krzywoliniowe”.Są one powierzchniami stałych wartości współrzędnych krzywoliniowychx ′k . Powierzchnie o równaniach x ′k = b k , k = 1,... ,n, przecinają się w punkciex 0 , wyznaczając geometrycznie współrzędne krzywoliniowe punktu p 0 .Transformacja współrzędnych musi być odwracalna, musi więc być homeomorfizmem.Ponieważ w R n chcemy mieć możliwość swobodnego różniczkowaniarozmaitych funkcji i transformacja współrzędnych nie może tego popsuć,wymagamy, by ten homeomorfizm był dyfeomorfizmem (zwykle gładkim).Zwykle transformacja współrzędnych ma prostą interpretację geome-


1.6. Transformacje współrzędnych 31Rysunek 1.2


32 1. Preliminariatryczną, np. w R 3 najczęstszą transformacją jest przejście do współrzędnychsferycznych:x = r sin θ cos ϕ, y = r sin θ sin ϕ, z = r cos θ,gdzie r 0, 0 θ π i 0 ϕ < 2π (zgodnie z konwencją przyjętą w fizyce,kąt θ = 0 na dodatniej półosi Oz, w literaturze matematycznej częstodefiniuje się kąt biegunowy jako θ ′ = π/2 − θ). Poniżej omawiamy dokładnietransformację do współrzędnych biegunowych na płaszczyźnie.Jeżeli na U ⊂ R n mamy gładką funkcję rzeczywistą g : U → R 1 , topo transformacji współrzędnych na U zastępujemy ją funkcją określoną naV := f −1 (U); jest nią funkcja złożona g ◦ f : V → R 1 . Jeżeli x = f(x ′ ), to(g ◦ f)(x ′ ) = g(f 1 (x ′ ),f 2 (x ′ ),... ,f n (x ′ )).Często pisze się skrótowo g(x ′ ), ale w celu uniknięcia pomyłek należy pamiętać,że x ′ są współrzędnymi krzywoliniowymi. Podobnie dokonujemy zamianyzmiennych x → x ′ w każdej współrzędnej odwzorowania g : R n → R m dladowolnego wymiaru m 1. Jeżeli g : R n → R m jest odwzorowaniem gładkimna U ⊂ R n , to po zmianie współrzędnych odwzorowanie złożone g ◦ f jestgładkie na zbiorze f −1 (U).Uwaga 1.3. W niektórych podręcznikach 14 podana jest uproszczona definicjatransformacji współrzędnych, wprowadzana w przestrzeni R n . W R n rozpatrujesię dwa obszary: D x ze współrzędnymi (x 1 ,... ,x n ) i D z ze współrzędnymi(z 1 ,...,z n na). Jeżeli istnieje dyfeomorfizm ϕ : D x → D z , czyli x i = f i (z k ) orazz k = (f −1 ) k (x i ), oraz jeżeli obszary te się pokrywają, D x = D z := D, to dyfeomorfizmϕ : D → naD jest przekształceniem obszaru D i jest transformacjąwspółrzędnych (x i ) ↔ (z k ).Ta intuicyjnie jasna definicja budzi wątpliwości. Jeżeli (x i ) i (z k ) są współrzędnymikartezjańskimi w R n , to nie jest jasne, co to znaczy, że D x = D z .Jeżeli obszar D := D x = D z zdefiniujemy geometrycznie, np. jako kulę jednostkowąo środku w punkcie 0, to nie jest jasne, co to znaczy, że w tym obszarzesą dwa różne układy współrzędnych — zakłada się to, co należy zdefiniować.W praktyce, gdy obszar D ⊂ R n jest określony geometrycznie, każdy dyfeomorfizmD na D można uznać za transformację współrzędnych. Ale niena odwrót: jak zobaczymy poniżej, dla współrzędnych biegunowych (r,ϕ) naR 2 mamy dyfeomorfizm pasa r > 0, −π < ϕ < +π na płaszczyźnie kartezjańskiej(r,ϕ) na płaszczyznę (x,y) z usuniętą ujemną półosią Ox. Ogólnie,w definicji rozmaitości różniczkowej transformacja współrzędnych będzie zwykledyfeomorfizmem różnych obszarów w R n .14 Na przykład B. Dubrovin, A. Fomenko, S. Novikov, Modern Geometry — Methods and Applications,Springer, New York 1992, p. 4.1.


1.6. Transformacje współrzędnych 331.6.1. Współrzędne biegunowe na płaszczyźnieTransformacja f(r,ϕ) = (x,y) ze współrzędnych biegunowych do kartezjańskichma postaćx = r cos ϕ, y = r sin ϕ. (1.1)Rysunek 1.3Geometrycznie odwzorowanie f definiujemy za pomocą promienia r i kątaϕ na płaszczyźnie (x,y), rys. 1.3. Dla y = 0 i x > 0 (dodatnia półoś Ox)mamy ϕ = 0, a na ujemnej półosi R − := {(x,y) : x < 0 i y = 0} mamyϕ = ±π zależnie od tego, czy podchodzimy do niej od góry, czy od dołu, tapółprosta jest miejscem (konwencjonalnym) nieciągłości kąta ϕ jako funkcjipunktu na R 2 . Odwzorowanie f jest zatem różnowartościowe dla −π < ϕ 0. Płaszczyznę(x,y) dzielimy na cztery kwadranty osiami Ox i Oy — są to zbiory otwarte(bez brzegowych półosi). Bierzemy najpierw kwadrant I: x > 0 i y > 0.Z (1.1) mamy y/x = tg ϕ > 0, zatem w tym kwadrancie odwzorowanie f −1


34 1. Preliminariama postać F I ,(r,ϕ) = F I (x,y) =(+ √ x 2 + y 2 ,arctg y ). (1.2)xJeżeli punkt (x,y) leży w kwadrancie I, to punkt (−x, −y) należy do kwadrantuIII i odwzorowanie F I nie jest różnowartościowe w obu kwadrantach,F I (−x, −y) = F I (x,y). Odwzorowania f −1 nie można zatem wyrazić w całymobszarze U za pomocą F I ; w każdym kwadrancie f −1 dane jest innym wzorem.Aby je znaleźć, wygodnie jest rozpatrywać półpłaszczyzny z uwzględnieniemrozdzielającej je półosi — są to spójne zbiory otwarte.Kwadrant I i IV. x > 0, y/x = tg ϕ ∈ (−∞, ∞). Kąt ϕ ∈ (−π/2,+π/2)i jest to cały zakres głównej wartości funkcji arctg. Zatem w tym obszarze f −1dane jest tym samym wzorem (1.2), tyle że kąt ϕ ma inny zakres.Kwadrant I i II. y > 0, więc bierzemy iloraz x/y = ctg ϕ ∈ (−∞,+∞).Kąt ϕ zmienia się od 0 do π i jest to cały zakres główny wartości funkcjiarcctg. W tym obszarzer = √ x 2 + y 2 , ϕ = arcctg x y . (1.3)Kwadrant III i IV. y < 0, wybieramy zatem x/y = ctg ϕ ∈ (−∞,+∞).Kąt ϕ ∈ (−π,0) i jest to zakres główny wartości funkcji arcctg przesuniętyw dół o π, czyli ϕ = arcctg x/y − π.Dziedzina V odwzorowania f jest przedstawiona na rys. 1.4. W kwadrantachI i IV transformacja f −1 dana jest dwoma wzorami. Stosując tożsamościRysunek 1.4


1.7. Wymiar przestrzeni 35arctg x = − arctg(−x), arcctg x = π−arcctg(−x) oraz arcctg x = arctg 1/x(słuszną dla x > 0), dostajemy ostateczne postaci odwzorowania f −1 w Uwyrażone jednolicie za pomocą funkcji arctg: r = + √ x 2 + y 2 orazkwadrant I : ϕ = arctg y ∣ ∣∣x , kwadrant II : ϕ = π − arctg y∣∣,xkwadrant III : ϕ = arctg y ∣ ∣∣x − π, kwadrant IV : ϕ = − arctg y∣∣.xWzory te są zgodne na granicznych półosiach.1.7. Wymiar przestrzeni 15Wymiarem przestrzeni R n nazywamy liczbę współrzędnych dowolnego jejpunktu; oczywiście jest ona równa n. Tym samym wymiar przestrzeni liniowejjest liczbą wektorów bazowych; stosuje się to również do nieskończeniewymiarowychprzestrzeni funkcyjnych, np. do przestrzeni Hilberta. W większościdziałów matematyki i w naukach ścisłych rozpatruje się przestrzenie, którychwymiar równy jest liczbie współrzędnych koniecznych do jednoznacznego zidentyfikowaniakażdego z ich punktów. Są to rozmaitości różniczkowe. Jednakpojęcie wymiaru nie ogranicza się do tej klasy przestrzeni i można je wprowadzićw szerokiej klasie przestrzeni topologicznych, aczkolwiek nie dla przestrzeninajogólniejszych. Wymiar jest pojęciem topologicznym (jest niezmiennikiemprzekształceń topologicznych) i jako taki jest jednym z najważniejszych pojęćw matematyce. W tej książce zajmujemy się tylko rozmaitościami różniczkowymii ograniczamy do minimum stosowanie topologii, toteż podanie topologicznejdefinicji wymiaru jest zarówno zbędne, jak i niemożliwe. Jednak nawetw przypadku rozmaitości pewne wiadomości z teorii wymiaru pozwalają zrozumiećlepiej te przestrzenie, więc w tym miejscu podamy kilka najprostszychinformacji.Dla przestrzeni R n wymiar topologiczny pokrywa się z liczbą współrzędnych16 , czyli dimR n = n. Jest to twierdzenie udowodnione w 1911 r. przezwspomnianego już matematyka holenderskiego Luitzena Brouwera, któregodowód nie jest łatwy. Nie jest bowiem oczywiste, że do identyfikacji punktuw R n potrzebujemy n liczb. Wzajemnie jednoznaczne odwzorowanie Cantoraprostej R 1 na płaszczyznę R 2 , wykazujące równoliczność obu zbiorów, możebyć użyte do numeracji punktów płaszczyzny, która w tym sensie ma wymiar15 Informacje zawarte w tym podrozdziale nie są potrzebne w dalszym wykładzie.16 Poza topologią ogólną, gdzie problem wymiaru jest złożony, wymiar prostych przestrzenitopologicznych, takich jak rozmaitości różniczkowe, oznacza się symbolem „dim”, z łacińskiegodimensio — odmierzanie, rozciągłość, dimetiri — odmierzać, oraz z angielskiego dimension —wymiar.


36 1. Preliminaria1. Dalej, krzywa Peano jest odwzorowaniem odcinka [0,1] w R 2 , które wypełniajednostkowy kwadrat. To odwzorowanie jest ciągłe, lecz nieodwracalne(krzywa wielokrotnie przechodzi przez każdy punkt kwadratu). Gdyby więcnie żądać, by wymiar był inwariantem topologicznym, to każda przestrzeńR n miałaby wymiar jeden. Topologiczna definicja wymiaru i twierdzenie Brouwerawykluczają to. Wynika stąd bardzo ważny wniosek: nie istnieje odwzorowaniehomeomorficzne (w sensie topologii) przestrzeni R n na R m , gdyn ≠ m.O tym, że nie istnieje wzajemnie jednoznaczne i obustronnie ciągłe (czylihomeomorficzne) odwzorowanie R 1 na R 2 , przekonujemy się, przeprowadzającproste rozumowanie. Niech istnieje taki homeomorfizm f. Usuwamy z prostejR 1 punkt 0, wówczas f będzie odwzorowaniem przestrzeni X := R 1 − {0}na przestrzeń Y := R 2 − {f(0)}. Przestrzeń X jest niespójna, składa się bowiemz dwóch półprostych x < 0 i x > 0, natomiast Y jest spójna 17 . Spójnośćjest pojęciem topologicznym, czyli niezmiennikiem przekształceń homeomorficznych,X i Y nie mogą być zatem homeomorficzne, a tym samym nie mahomeomorfizmu prostej na płaszczyznę.Innym niezmiennikiem topologicznym jest jednospójność przestrzeni. Przestrzeńjest jednospójna, jeżeli każdą linię zamkniętą (pętlę) można ściągnąć(wyobrażamy sobie, że pętla jest wykonana z doskonale kurczliwej gumy)do punktu, który należy do tej przestrzeni. Jednospójna jest płaszczyzna,przestrzeń E n , sfera, elipsoida, hiperboloida dwupowłokowa (każda powłokaoddzielnie). Niejednospójny jest walec, nie da się bowiem ściągnąć obejmującejgo pętli, torus, hiperboloida jednopowłokowa, płaszczyzna z usuniętympunktem (z „dziurą”), przestrzeń E 3 , z której usunięto prostą lub krzywą zamkniętą,itd. Za pomocą tego pojęcia łatwo można wykazać, że nie istniejehomeomorfizm R 2 na R 3 . Jest to ponownie rozumowanie nie wprost. Z płaszczyznyusuwamy jeden punkt, np. (0,0). Gdyby taki homeomorfizm istniał, toobrazem płaszczyzny bez punktu byłaby przestrzeń R 3 bez pewnego punktu.Zbiór R 2 − {(0,0)} jest spójny, lecz nie jednospójny (pętli obejmującej (0,0)nie można ściągnąć do punktu), natomiast R 3 z usuniętym jednym punktemjest oczywiście jednospójna. Podobnych argumentów można użyć w wyższychwymiarach.Z tego rozumowania wynika, że przestrzeń R n ma pewną własność, którajest niezmiennikiem przy przekształceniach homeomorficznych. Zidentyfikowanietej własności i nadanie jej definicji pasującej do szerokiej klasy przestrzenitopologicznych zajęło matematykom kilkadziesiąt lat — jest nią właśnie wymiartopologiczny wprowadzony w najprostszej wersji w 1922 r. niezależnieprzez Karla Mengera i Pawła Urysohna.17 Przypominamy, że zbiór otwarty w R n jest spójny, jeżeli nie można go przedstawić w postacisumy mnogościowej dwóch zbiorów otwartych, które są rozłączne, tj. ich część wspólna jest zbiorempustym.


1.8. Notacja 371.8. NotacjaW książce stosujemy oznaczenia przyjęte w podręcznikach klasycznego rachunkutensorowego, gdyż są one najbardziej praktyczne. Współrzędne w dowolnejmapie na rozmaitości oznaczamy x i , gdzie i = 1,2,... ,n oraz n jest wymiaremrozmaitości. Numer współrzędnej zapisujemy jako indeks górny (zwanykontrawariantnym), co początkowo może mylić się z potęgą liczby x, jednakpotęgi różne od kwadratowej występować będą sporadycznie, a zalety tego zapisustaną się oczywiste, gdy przejdziemy do transformacji tensorów. Rachunektensorowy bazuje na algebrze liniowej, w której mamy do czynienia z macierzamio wielu wskaźnikach pisanych jako górne lub dolne (kowariantne), np. A ijk ,B ijkl . Indeksy oznaczone literami i, j, k, l, ... zawsze przebiegają wartości od1 do n. Oprócz zwykłych macierzy (tablic kwadratowych n × n) o elementachA ij oraz B ij będziemy zatem rozważać macierze, których elementy A ijktworzą układ „sześcienny” n × n × n oraz, ogólniej, tworzące k–wymiarowyukład macierze o elementach A i1i 2...i k(elementów tych jest n k ), gdzie k > 2jest dowolną liczbą naturalną. Jak zobaczymy dalej, macierze te są uporządkowanymizbiorami składowych tensorów na rozmaitości. <strong>Elementy</strong> macierzy(A ij ) i (A ij ) mają te same wartości, natomiast macierze te reprezentują różnetensory, mają bowiem odmienne prawa transformacyjne. Będziemy zajmowaćsię też macierzami mieszanymi o elementach T i1i2...i k j1j 2...j m, k,m 1, w którychkolejność indeksów górnych i dolnych jest ważna, tj. T i j ≠ T j i . Zapis T i jjest niejednoznaczny i nie należy go stosować; wyjątkiem jest delta Kroneckeraδ i j (później poznamy inne wyjątki).Funkcję (odwzorowanie) f z argumentem (punktem) p oznaczamy zwyczajowof(p), jednak w pewnych sytuacjach ta notacja jest dwuznaczna i abywyeksponować argument, będziemy pisać f| p. Pochodne cząstkowe wielkościT względem współrzędnych x i będziemy zapisywać w postaci uproszczonej∂T∂x i ≡ ∂ iT ≡ T ,i ;notacja ta sygnalizuje, że pochodna cząstkowa wprowadza indeks kowariantny.Operacje wykonywane na macierzach tensorów są najczęściej wieloliniowei polegają na mnożeniu macierzy lub braniu ich śladu, co sprowadza się dozsumowania od 1 do n po wybranej parze lub kilku parach indeksów. Abyotrzymany w ten sposób obiekt był tensorem, czyli miał poprawne własnościtransformacyjne, sumowanie jest zawsze po jednym indeksie kontrawariantnymi jednym kowariantnym w danej parze.Pisanie znaków wielokrotnych sum wydłuża wzory i zmniejsza ich czytelność,toteż przyjmujemy konwencję sumacyjną Einsteina: jeżeli w jakimśwyrażeniu występuje para jednakowych indeksów, jeden górny i jeden dolny, topo tych indeksach należy wykonać sumowanie,a i b i := a 1 b 1 + a 2 b 2 + ... + a n b n ,


38 1. PreliminariaA ijl B klm C pm :=n∑l=1 m=1n∑A ijl B klm C pm == A ij1 B k11 C p1 + ... + A ijn B kn1 C p1 + ... + A ijn B knn C pn ,T ilj lk := T i1j 1k + ... + T inj nk.Indeksy, po których się sumuje, nazywamy niemymi, pozostałe indeksysą swobodne. Indeksy nieme, w odróżnieniu od swobodnych, można dowolniezmieniać w trakcie rachunków, bowiem a i b i ≡ a k b k itp.Notacja jest tak dobrana, by wyeksponować dwie zasadnicze cechy rachunkutensorowego: wszystkie wzory wyglądają tak samo we wszystkich układachwspółrzędnych. To oznacza, że żaden wybór map na rozmaitości nie jest wyróżnionyi wszystkie wzory wyglądają tak samo niezależnie od wymiaru przestrzeni,czyli rachunki na tensorach przebiegają tak samo zarówno dla n = 2,jak i dla n = 1000. Nawet na płaszczyźnie wzory stają się skomplikowanei nieprzejrzyste, jeżeli zamiast notacji <strong>tensorowej</strong> każdy element macierzy rozpatrywaćosobno.Wymiar przestrzeni n będzie zawsze parametrem swobodnym.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!