30.01.2015 Views

1 Pierścienie i ich homomorfizmy. Ideał, pierścień ilorazowy. Ide- ały ...

1 Pierścienie i ich homomorfizmy. Ideał, pierścień ilorazowy. Ide- ały ...

1 Pierścienie i ich homomorfizmy. Ideał, pierścień ilorazowy. Ide- ały ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Tekst ten jest dostępny na stronie http://www-users.mat.umk.pl/∼cstefan/ . W razie potrzeby tam<br />

będą znajdow<strong>ały</strong> się ewentualne poprawki i uzupełnienia.<br />

1 <strong>Pierścienie</strong> i <strong>ich</strong> <strong>homomorfizmy</strong>. <strong><strong>Ide</strong>ał</strong>, <strong>pierścień</strong> <strong>ilorazowy</strong>. <strong><strong>Ide</strong>ał</strong>y<br />

pierwsze i maksymalne, dziedziny i ciała - definicje i przykłady<br />

Definicja 1.1. Niech X będzie zbiorem. Działaniem dwuargumentowym na zbiorze X nazywamy dowolne<br />

odwzorowanie α: X × X → X. Zamiast α(x, y) piszemy xαy, zamiast pisać działanie dwuargumentowe<br />

piszemy po prostu działanie.<br />

Definicja 1.2. Niech R będzie dowolnym zbiorem, θ ∈ R elementem wyróżnionym (nazywanym elementem<br />

neutralnym działania ⊕) oraz ⊕, ⊙ będą dwoma działaniami na tym zbiorze o następujących własnościach:<br />

1. Działanie ⊕ jest łączne, to znaczy: ∀ x,y,z∈X (x ⊕ y) ⊕ z = x ⊕ (y ⊕ z),<br />

2. Działanie ⊕ jest przemienne, to znaczy: ∀ x,y∈X x ⊕ y = y ⊕ x.<br />

3. Dla każdego x ∈ R istnieje element y ∈ R taki, że x ⊕ y = θ. Oznaczamy go −x.<br />

4. Działanie ⊙ jest łączne, to znaczy ∀ x,y,z∈X (x ⊙ y) ⊙ z = x ⊙ (y ⊙ z).<br />

5. Działanie ⊙ jest rozdzielne względem działania ⊕, to znaczy:<br />

∀ x,y,z∈X x ⊙ (y ⊕ z) = (x ⊙ y) ⊕ (x ⊙ z).<br />

Wówczas (R, ⊕, ⊙, θ) nazywamy pierścieniem. Ponadto, jeżeli istnieje e ∈ R takie, że dla każdego x ∈ R<br />

zachodzi równość x ⊙ e = x = e ⊙ x, to element e nazywamy elementem neutralnym działania ⊙ lub po<br />

prostu jedynką a (R, ⊕, ⊙, θ, e) nazywamy pierścieniem z jedynką. Jeżeli działanie ⊙ jest przemienne, to<br />

(R, ⊕, ⊙, θ) nazywamy pierścieniem przemiennym.<br />

Uwaga 1.1. Zauważmy, że powyższą definicję można sformułować krócej w języku teorii grup: jeżeli mamy<br />

zbiór R, działania ⊙, ⊕ na R oraz elementy wyróżnione θ (oraz e), to (R, ⊕, ⊙, θ) ((R, ⊕, ⊙, θ, e)) nazywamy<br />

pierścieniem (z jedynką), jeżeli (R, ⊕, θ) jest grupą abelową, działanie ⊙ jest łączne i rozdzielne względem<br />

działania ⊕ (oraz e jest elementem neutralnym działania ⊙).<br />

Przykład 1.1. <strong>Pierścienie</strong>m przemiennym bez jedynki jest zbiór liczb parzystych ze zwykłymi działaniami<br />

dodawania i mnożenia liczb całkowitych. Zauważmy też, że zbiór liczb nieparzystych z takimi działaniami<br />

nie tworzy pierścienia gdyż nie jest zamknięty na dodawanie.<br />

W dalszym ciągu będziemy zakładali, że każdy rozważany <strong>pierścień</strong> jest pierścieniem z jedynką (różną<br />

od zera), chyba, że będzie wyraźnie zaznaczone inaczej. Będziemy też pisać <strong>pierścień</strong> R zamiast <strong>pierścień</strong><br />

(R, ⊕, ⊙, θ, e), ale z formalnego punktu widzenia są to różne pojęcia.<br />

Przykład 1.2. Kilka przykładów pierścieni:<br />

1. Niech R = {a} będzie zbiorem. Określamy na nim działania ⊕, ⊙ następująco: a ⊕ a = a oraz<br />

a ⊙ a = a. Łatwo sprawdzić, że jest to <strong>pierścień</strong> przemienny z jedynką. Co więcej, łatwo pokazać, że<br />

jeżeli mamy <strong>pierścień</strong> (R, ⊕, ⊙, θ, e) taki, że e = θ, to R = {θ}. Taki <strong>pierścień</strong> nazywamy pierścieniem<br />

trywialnym.<br />

2. Najbardziej znanymi przykładami pierścieni są zbiory Z, Q, R (odpowiednio: zbiór liczb całkowitych,<br />

wymiernych i rzeczywistych )ze zwykłymi działaniami +, · dodawania i mnożenia liczb (będziemy<br />

stosowali skrót ab = a · b). Zbiór liczb naturalnych z takimi działaniami nie tworzy pierścienia.<br />

1


3. W zbiorze liczb zespolonych C = R × R działania określamy następująco: dla<br />

(x 1 , y 1 ), (x 2 , y 2 ) ∈ C , gdzie x 1 , x 2 , y 1 , y 2 ∈ R określamy:<br />

(x 1 , y 1 ) ⊕ (x 2 , y 2 ) = (x 1 + x 2 , y 1 + y 2 ),<br />

(x 1 , y 1 ) ⊙ (x 2 , y 2 ) = (x 1 x 2 − y 1 y 2 , x 1 y 2 + y 1 x 2 )<br />

Oznaczmy i = (0, 1) i zauważmy, że i 2 = (0, 1) ⊙ (0, 1) = (−1, 0). Zauważmy, że dla dowolnego y ∈ R<br />

mamy: (0, y) = (0, 1) ⊙ (y, 0). Jeżeli utożsamimy elementy postaci (x, 0) ∈ C z x ∈ R to dostaniemy,<br />

że dla dowolnego (x, y) ∈ C mamy równość:<br />

(x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1) ⊙ (y, 0) = x + iy<br />

W postaci x + iy zapisuje się zazwyczaj liczbę zespoloną.<br />

4. Pierścień macierzy M(n, R) z działaniami dodawania i mnożenia macierzy jest pierścieniem (z jedynką),<br />

ale nie jest przemienny.<br />

5. Rozważmy zbiór liczb całkowitych Z z działaniami ⊕, ⊙ określonymi wzorami: jeżeli a, b ∈ Z, to<br />

a ⊕ b = a + b + 1 oraz a ⊙ b = a + b + ab. Łatwo sprawdzić, że jest to <strong>pierścień</strong> przemienny z<br />

elementami neutralnymi: θ = −1, e = 0.<br />

6. Niech p ∈ N. Rozważmy zbiór Z p = {0, 1, . . . , p − 1} oraz działania a ⊕ b = a + b mod p,<br />

a ⊙ b = ab mod p. Wówczas (Z p , ⊕, ⊙, 0, 1) jest pierścieniem przemiennym.<br />

Definicja 1.3. Podzbiór S pierścienia R nazywamy jego podpierścieniem, jeżeli jest on pierścieniem ze<br />

względu na te same działania, co <strong>pierścień</strong> R.<br />

Przykład 1.3. Kilka przykładów podpierścieni:<br />

1. Oczywiście <strong>pierścień</strong> Z jest podpierścieniem Q, R oraz C; Q jest podpierścieniem R, C; R jest podpierścieniem<br />

C.<br />

2. Zbiór Z p jest podpierścieniem Z r wtedy i tylko wtedy, gdy p dzieli r.<br />

3. Jeżeli R jest pierścieniem to ma zawsze przynajmniej dwa podpierścienie: <strong>pierścień</strong> trywialny {θ}<br />

oraz R.<br />

4. Zbiór Z p nie jest pierścieniem ze względu na działania z Z zatem Z p nie jest podpierścieniem pierścienia<br />

Z<br />

W dalszym ciągu, jeżeli nie będzie to prowadzić do nieporozumień, działania będziemy oznaczali +<br />

oraz · (a nawet będziemy stosowali skrót ab = a · b) oraz będziemy je nazywać dodawaniem i mnożeniem<br />

(odpowiednio).<br />

Definicja 1.4. Niech R i S będą pierścieniami. Funkcję f : R → S nazywamy homomorfizmem, jeśli<br />

spełnione są warunki: dla dowolnych a, b ∈ R<br />

1. f(a + b) = f(a) + f(b)<br />

2. f(ab) = f(a)f(b)<br />

Warto odnotować, że a + b jest dodawaniem w pierścieniu R zaś f(a) + f(b) jest dodawaniem w<br />

pierścieniu S.<br />

Definicja 1.5. Załóżmy, że R i S są pierścieniami i niech f : R → S będzie homomorfizmem. Jądrem<br />

homomorfizmu nazywamy zbiór ker f = {a ∈: f(a) = 0} zaś obrazem nazywamy zbiór<br />

Im f = {b ∈ S : ∃ a∈R f(a) = b}. Ponadto homomorfizm f : R → S nazywamy:<br />

1. endomorfizmem, jeżeli jest surjekcją (lub równoważnie Im f = S),<br />

2. monomorfizmem, jeżeli jest injekcją (lub równoważnie ker f = {θ}),<br />

2


3. izomorfizmem, jeżeli istnieje homomorfizm g : S → R taki, że g ◦ f = Id R oraz f ◦ g = Id S (lub<br />

równoważnie f jest endomorfizmem i monomorfizmem). Mówimy wtedy, że pierścienie R i S są izomorficzne.<br />

Przykład 1.4. Kilka przykładów homomorfizmów:<br />

1. W przykładzie 3 pokazaliśmy, że <strong>pierścień</strong> C jest izomorficzny z pierścieniem R(i) = {a+bi : a, b ∈ R}<br />

2. Można pokazać, że odwzorowanie f : Z → Z p dane wzorem f(a) = a mod p jest homomorfizmem<br />

pierścieni.<br />

3. Niech S będzie podpierścieniem pierścienia R. Wówczas włożenie j : S → R dane wzorem j(x) = x<br />

jest homomorfizmem pierścieni.<br />

Definicja 1.6. Niepusty podzbiór I pierścienia R nazywa się ideałem, jeśli:<br />

1. ∀ a,b∈I a − b ∈ I,<br />

2. ∀ a∈I ∀ b∈R (ab ∈ I ∧ ba ∈ I) (jeżeli <strong>pierścień</strong> jest przemienny to wystarczy pisać jeden z warunków).<br />

Jeżeli I jest ideałem pierścienia R, to oznaczamy to I ⊳ R<br />

Z definicji natychmiast wynika, że jeżeli I jest ideałem pierścienia R, to I jest podpierścieniem pierścienia<br />

R. Z drugiej strony, nie każdy pod<strong>pierścień</strong> musi być ideałem: wystarczy rozważyć pod<strong>pierścień</strong> Q<br />

pierścienia R.<br />

Przykład 1.5. Podamy kilka przykładów ideałów:<br />

1. Każdy <strong>pierścień</strong> R zawiera ide<strong>ały</strong> trywialne {θ} i R. Nazywamy je ideałami niewłaściwymi, każdy<br />

zaś różny od n<strong>ich</strong> nazywamy ideałem właściwym.<br />

2. Podzbiór liczb parzystych jest ideałem pierścienia liczb całkowitych. W ogóle każdy zbiór wielokrotności<br />

ustalonej liczby naturalnej n jest ideałem pierścienia Z<br />

3. Jeśli f : R → S jest homomorfizmem pierścieni, to jego jądro ker f jest ideałem w pierścieniu R<br />

(obraz jest podpierścieniem pierścienia S).<br />

Niech I będzie ideałem pierścienia R. Dla a, b ∈ R określamy relację: a ∼ b ⇐⇒ a − b ∈ I. Łatwo<br />

sprawdzić, że jest to relacja równoważności. Klasę abstrakcji [a] ∼ oznaczamy a + I, zbiór klas abstrakcji<br />

R/ ∼ oznaczamy R/I. Na zbiorze R/I określamy działania: (a+I)⊕(b+I) = (a+b)+I oraz (a+I)⊙(b+I) =<br />

(ab) + I. Łatwo sprawdzić, że R/I z tak określonymi działaniami oraz elementami neutralnymi θ ′ = θ + I<br />

oraz e ′ = e + I jest pierścieniem. Nazywamy go pierścieniem <strong>ilorazowy</strong>m.<br />

W dalszym ciągu działania w pierścieniu <strong>ilorazowy</strong>m będziemy oznaczali tak jak w wyjściowym pierścieniu.<br />

Twierdzenie 1.2 (Pierwsze twierdzenie o izomorfizmie dla pierścieni). Jeśli f : R → S jest homomorfizmem<br />

pierścieni oraz I jest ideałem w pierścieniu R takim, że I ⊂ ker f, to funkcja g : R/I → S dana<br />

wzorem g(a+I) = f(a) jest dobrze określonym homomorfizmem. Ponadto, jeżeli I = ker f, to tak określone<br />

odwzorowanie g jest izomorfizmem.<br />

Przykład 1.6. Z powyższego twierdzenia wynika, że pierścienie Z/Zm i Z m są izomorficzne, gdzie<br />

Zm = {zm : z ∈ Z}.<br />

Definicja 1.7. <strong><strong>Ide</strong>ał</strong> I pierścienia R nazywa się ideałem pierwszym, jeśli z tego, że iloczyn dwóch elementów<br />

pierścienia R należy do I, wynika, że przynajmniej jeden z n<strong>ich</strong> należy do I. Symbolicznie:<br />

∀ a,b∈R [(ab ∈ I) =⇒ (a ∈ I ∨ b ∈ I).<br />

<strong><strong>Ide</strong>ał</strong> właściwy I pierścienia R nazywamy ideałem maksymalnym, jeśli nie zawiera się w żadnym różnym<br />

od siebie ideale właściwym pierścienia R. Symbolicznie:<br />

I ⊂ J =⇒ (I = J ∨ J = R).<br />

3


Definicja 1.8. Element a pierścienia R nazywamy dzielnikiem zera, jeśli a ≠ θ oraz istnieje element b ∈ R,<br />

b ≠ θ, taki, że ab = θ<br />

Pierścień R nazywa się dziedziną (całkowitości), jeśli θ ≠ e oraz w pierścieniu R nie ma dzielników zera.<br />

Fakt 1.3. Jeżeli a, b, c są elementami dziedziny R takimi, że ac = bc oraz c ≠ θ, to a = b<br />

Definicja 1.9. Element a pierścienia R nazywamy odwracalnym, jeśli istnieje element b ∈ R taki, że<br />

ab = e (taki element b oznaczamy przez a −1 ) Jeżeli a ≠ θ nie jest odwracalny, to nazywamy go elementem<br />

nieodwracalnym.<br />

Definicja 1.10. Mówimy, że <strong>pierścień</strong> przemienny z jedynką (K, ⊕, ⊙, θ, e) jest ciałem jeżeli każdy<br />

x ∈ K\{θ} jest odwracalny. Taki element będziemy oznaczali x −1 .<br />

Równoważnie, możemy powiedzieć, że (K, ⊕, ⊙, θ, e) jest ciałem, jeżeli (K, ⊕, θ), (K\{θ}, ⊙, e) są grupami<br />

oraz działanie ⊙ jest rozdzielne względem działania ⊕. Grupę (K, ⊕, θ) nazywamy grupą addytywną<br />

ciała K zaś (K\{θ}, ⊙, e) nazywamy grupą multiplikatywną ciała K<br />

Definicja 1.11. Najmniejszy ideał pierścienia R zawierający podzbiór X ⊂ R nazywamy ideałem generowanym<br />

przez zbiór X i oznaczamy (X)<br />

<strong><strong>Ide</strong>ał</strong> I pierścienia R nazywamy głównym, jeśli istnieje element a ∈ R taki, że I = (a).<br />

Dziedzinę R nazywa się dziedziną ideałów głównych, jeśli wszystkie ide<strong>ały</strong> w pierścieniu R są główne.<br />

Uwaga 1.4. Niech R będzie pierścieniem przemiennym oraz I ⊳ R. Wówczas:<br />

1. I jest pierwszy wtedy i tylko wtedy, gdy <strong>pierścień</strong> R/I jest dziedziną.<br />

2. I jest maksymalny wtedy i tylko wtedy, gdy <strong>pierścień</strong> R/I jest ciałem.<br />

Ponadto każdy ideał maksymalny w pierścieniu R jest pierwszy.<br />

Przykład 1.7. Rozważmy następujące przykłady:<br />

1. W pierścieniu liczb całkowitych jedynymi ideałami maksymalnymi są ide<strong>ały</strong> postaci (p), gdzie p jest<br />

liczbą pierwszą. Ponadto, jedynymi ideałami pierwszymi są ide<strong>ały</strong> takiej postaci dla p = 0, 1 lub jeżeli<br />

p jest liczbą pierwszą.<br />

2. Jeżeli K jest ciałem, to jedynymi ideałami w K są ide<strong>ały</strong> niewłaściwe. Zatem każde ciało jest dziedziną<br />

ideałów głównych.<br />

3. W pierścieniu liczb całkowitych każdy ideał jest główny, zatem jest to dziedzina ideałów głównych.<br />

Dziedziną ideałów głównych jest także <strong>pierścień</strong> Z p .<br />

4. Jeżeli K jest ciałem to <strong>pierścień</strong> wielomianów jednej zmiennej K[X] jest dziedziną ideałów głównych.<br />

Kilka przykładów ciał:<br />

5. Oczywiście, pierścienie Q, R, C są ciałami, <strong>pierścień</strong> Z nie jest ciałem.<br />

6. Pierścień Z p jest ciałem wtedy i tylko wtedy, gdy p jest liczbą pierwszą.<br />

2 Pierścień wielomianów o współczynnikach w danym pierścieniu<br />

przemiennym. <strong><strong>Ide</strong>ał</strong>y w pierścieniu K[X] (K jest ciałem).<br />

Wielomiany nierozkładalne. Pierwiastki wielomianu, twierdzenie<br />

Bezouta.<br />

Przez c<strong>ały</strong> paragraf zakładamy, że (R, +, ·, 1, 0) jest pierścieniem przemiennym oraz K jest ciałem. Zakładamy,<br />

że N = {0, 1, . . .}<br />

4


Definicja 2.1. <strong>Pierścienie</strong>m wielomianów jednej zmiennej o współczynnikach w pierścieniu R nazywamy<br />

zbiór:<br />

R = {f : N → R : #{n ∈ N : f(n) ≠ 0} < ∞}<br />

wraz z działaniami (f +g)(n) = f(n)+g(n), fg(n) = f(0)g(n)+f(1)g(n−1)+. { . .+f(n−1)g(1)+f(n)g(0)<br />

1 jeżeli n = 0<br />

dla n ∈ N, f, g ∈ R oraz elementami neutralnymi: 0(n) = 0 oraz 1(n) =<br />

. Elementy zbioru<br />

0 jeżeli n = 1<br />

R nazywamy wielomianami.<br />

Łatwo sprawdzić, że jest to rzeczywiście <strong>pierścień</strong>.<br />

{<br />

a jeżeli n = 0<br />

Uwaga 2.1. Dla dowolnego elementu a ∈ R definiujemy a ∈ R wzorem a(n) =<br />

0 jeżeli n = 1 .<br />

Odwzorowanie przyporządkowujące elementowi a ∈ R element a ∈ R jest homomorfizmem pierścieni.<br />

Będziemy odtąd traktować <strong>pierścień</strong> R jako pod<strong>pierścień</strong> R.<br />

Definicja 2.2. Stopniem wielomianu f ∈ R nazywamy deg f = max{n ∈ N : f(n) ≠ 0} (przyjmujemy, że<br />

max ∅ = −∞).<br />

{<br />

1 jeżeli n = 1<br />

Definiujemy X ∈ R wzorem: X(n) =<br />

. Łatwo pokazać, że dla dowolnego m ∈ N<br />

0 jeżeli n ≠ 1<br />

{<br />

mamy: X m 1 jeżeli n = m<br />

(n) =<br />

0 jeżeli n ≠ m .<br />

Można pokazać, że każdy element pierścienia R ma jednoznaczne przedstawienie f = ∑ ∞<br />

i=0 f iX i , gdzie<br />

prawie wszystkie f i są równe 0. Możemy zatem <strong>pierścień</strong> R określić jako najmniejszy <strong>pierścień</strong> zawierający<br />

<strong>pierścień</strong> R oraz odwzorowanie X. Dlatego <strong>pierścień</strong> wielomianów oznaczamy przez R[X] Otrzymujemy<br />

zatem, że<br />

∞∑<br />

R[X] = { a i X i : a i = 0 dla prawie wszystk<strong>ich</strong> i ∈ N}<br />

i=0<br />

Działania możemy zapisać następująco: jeżeli f = ∑ n<br />

i=0 f iX i , g = ∑ m<br />

i=0 g iX i , to określamy:<br />

f + g =<br />

max{n,m}<br />

∑<br />

i=0<br />

n+m<br />

∑ i∑<br />

(f i + g i )X i oraz fg = ( f k g k−i )X i<br />

Dla wielomianu f = ∑ n<br />

i=0 f iX i ∈ R[X] element f i nazywamy współczynnikiem wielomianu f. Zauważmy,<br />

że f i = f(i).<br />

Definicja 2.3. <strong>Pierścienie</strong>m wielomianów wielu zmiennych o współczynnikach w R nazywamy zbiór<br />

z działaniami określonymi następująco:<br />

i=0<br />

k=0<br />

R n = {g : N n → R : g(α) = 0 dla prawie wszystk<strong>ich</strong> α ∈ N n }<br />

(f + g)(α) = f(α) + g(α) oraz fg(γ) = ∑<br />

α+β=γ<br />

f(α)g(β)<br />

{<br />

1 if α = (0, . . . , 0)<br />

Łatwo sprawdzamy, że otrzymujemy w ten sposób <strong>pierścień</strong> z 1(α) =<br />

0 if α ≠ (0, . . . , 0) Podobnie<br />

jak poprzednio <strong>pierścień</strong> R traktujemy jako pod<strong>pierścień</strong> tak zdefiniowanego pierścienia. W N n wyróżniamy<br />

elementy ɛ i = (0,{<br />

. . . , 0, 1, 0, . . . , 0) (1 jest na i-tym miejscu). Definiujemy elementy X 1 , . . . , X n ∈ R n<br />

1 jeżeli α = ɛ i<br />

wzorem: X i (n) =<br />

.<br />

0 jeżeli α ≠ ɛ i<br />

5


Lemat 2.2. Każdy wielomian f ∈ R n ma jednoznaczne przedstawienie: f = ∑ α=(α 1,...,α n) f αX α1 . . . Xα n<br />

Ponadto f α = f(α) dla każdego α ∈ N n oraz f α = 0 dla prawie wszystk<strong>ich</strong> α ∈ N n .<br />

Podobnie jak wcześniej, <strong>pierścień</strong> wielomianów można określić jako najmniejszy <strong>pierścień</strong> zawierający<br />

<strong>pierścień</strong> R oraz odwzorowania X 1 , . . . , X n . Dlatego zapisujemy ten <strong>pierścień</strong> R[X 1 , . . . , X n ]. Pierścień<br />

R[X 1 , . . . , X n ] można też określać indukcyjnie, to znaczy określić go następująco: R[X 1 ] jak wcześniej oraz<br />

R[X 1 , . . . , X n ] = R[X 1 , . . . , X n−1 ][X n ].<br />

Załóżmy, że K jest ciałem i rozważmy <strong>pierścień</strong> K[X]<br />

Definicja 2.4. Wielomian f ∈ K[X] nazywa się nierozkładalnym, jeśli deg f > 0 oraz f nie jest iloczynem<br />

dwóch wielomianów stopni mniejszych niż stopień f.<br />

Największym wspólnym dzielnikiem wielomianów f, g ≠ 0 ∈ K[X] nazywamy wielomian d ∈ K[X] taki,<br />

że spełnione są następujące warunki:<br />

1. d|a ∧ d|b,<br />

2. Jeżeli d ′ |a ∧ d ′ |b, to d ′ |d.<br />

Oznaczamy go NW D(f, g).<br />

Prosta indukcja pokazuje, że każdy wielomian z K[X] jest iloczynem wielomianów nierozkładalnych.<br />

Ponadto, jedynymi elementami odwracalnymi w K[X] są niezerowe wielomiany stopnia 0<br />

Twierdzenie 2.3. Niech K będzie ciałem. Wówczas:<br />

1. Każdy ideał w I w pierścieniu K[X] jest główny. Jeśli I ≠ 0, to I jest generowany przez wielomian<br />

z I\{0} najniższego stopnia<br />

2. Niech f, g ∈ K[X]. Wówczas NW D(f, g) istnieje i jest to generator ideału (f, g). W szczególności,<br />

NW D(f, g) = uf + vg dla pewnych u, v ∈ K[X]<br />

3. Niech f ∈ K[X] będzie wielomianem nierozkładalnym oraz niech f|gh dla pewnych g, h ∈ K[X].<br />

Wówczas f|g lub f|h<br />

4. Niech f ∈ K[X]. Wówczas ideał (f) jest pierwszy wtedy i tylko wtedy, gdy f = 0 lub f jest nierozkładalny.<br />

Ponadto, każdy niezerowy ideał pierwszy w K[X] jest maksymalny.<br />

5. Jeśli f ∈ K[X] i deg f > 0, to f jest iloczynem wielomianów nierozkładalnych, przy czym jeśli<br />

f = f 1 . . . f s = g 1 . . . g r są dwoma rozkładami f na iloczyn wielomianów nierozkładalnych to s = r<br />

oraz istnieje permutacja σ i t 1 , . . . t r ∈ K\{0} takie, że f i = t i g σ(i) dla i = 1, . . . , r<br />

Definicja 2.5. Niech f = ∑ n<br />

i=0 f iX i . Wartością wielomianu f dla argumentu c ∈ K nazywamy element<br />

tego ciała ∑ n<br />

i=0 f ic i . Oznaczamy go f(c).<br />

Element c ∈ K nazywa się pierwiastkiem wielomianu f, jeśli f(c) = 0.<br />

Twierdzenie 2.4 (Bezouta). Niech f ∈ K[X]. Element c ∈ K jest pierwiastkiem wielomianu f wtedy i<br />

tylko wtedy, gdy (X − c)|f<br />

Definicja 2.6. Krotnością pierwiastka c ∈ K wielomianu f ∈ K[X] nazywamy liczbę k ∈ N taką, że<br />

(X − c) k |f i (X − c) k+1 ∤ f.<br />

Twierdzenie 2.5. Wielomian f ∈ K[X] ma co najwyżej deg f pierwiastków. Jeżeli ciało jest algebraicznie<br />

zamknięte (to znaczy każdy wielomian nad tym ciałem ma pierwiastek) to wielomian f ∈ K[X] ma<br />

dokładnie deg f pierwiastków.<br />

Przykład 2.1. Kilka przykładów:<br />

1. W pierścieniu K[X, Y ] nie każdy ideał jest główny.<br />

6


2. Wielomian X 2 + 1 ∈ R[X] jest nierozkładalny, natomiast wielomian X 2 + 1 ∈ C[X] jest rozkładalny.<br />

Co więcej, jednymi wielomianami nierozkładalnymi nad C są wielomiany stopnia pierwszego, nad R<br />

są to wielomiany stopnia 1 i 2.<br />

3. Dowodzi się, że jeżeli p jest liczbą pierwszą, to wielomian X p−1 + . . . + X + 1 ∈ Q[X] jest nierozkładalny.<br />

3 Przestrzenie i przekształcenia liniowe. Baza i wymiar przestrzeni,<br />

macierz przekształcenia - definicje i przykłady<br />

Przypuśćmy, że dane są: ciało K, niepusty zbiór E oraz dwa działania:<br />

+: E × E → E (działanie wewnętrzne w zbiorze E)<br />

⊙: K × E → E (działanie zewnętrzne w zbiorze E)<br />

Będziemy stosować zapis +(x, y) = x + y, ⊙(r, x) = r ⊙ x = rx<br />

Definicja 3.1. Czwórkę (E, K, +, ⊙) nazywamy przestrzenią liniową nad ciałem K, jeżeli spełnione są<br />

warunki:<br />

1. ∀ x,y∈E x + y = y + x,<br />

2. ∀ x,y,z∈E (x + y) + z = (x + y) + z,<br />

3. ∃ 0∈E ∀ x∈E takie, że 0 + x = x,<br />

4. ∀ x∈E ∃ y∈E x + y = 0, taki element y oznaczamy −x,<br />

5. ∀ x∈E 1x = x<br />

6. ∀ a1,a 2∈K∀ x∈E (a 1 a 2 )x = a 1 (a 2 x)<br />

7. ∀ a1,a 2∈K∀ x∈E (a 1 + a 2 )x = a 1 x + a 2 x<br />

8. ∀ a∈K ∀ x,y∈E a(x + y) = ax + ay<br />

Pierwsze 4 warunki powyższej definicji mówią, że (E, +, 0) jest grupą abelową. W dalszym ciągu przestrzeń<br />

(E, K, +, ⊙) oznaczać będziemy krótko przez E, zakładając, że przestrzeń E jest nad pewnym<br />

ustalonym ciałem K.<br />

Definicja 3.2. Niepusty podzbiór E ′ przestrzeni liniowej E nazywamy podprzestrzenią przestrzeni E,<br />

jeżeli<br />

1. ∀ x,y∈E ′ x + y ∈ E ′ ,<br />

2. ∀ x∈E ′∀ a∈K ax ∈ E ′<br />

Definicja 3.3. Niech x 1 , . . . x n ∈ E. Mówimy, że wektory x 1 , . . . x n są liniowo niezależne, jeżeli z równości<br />

a 1 x 1 + . . . + a n x n = 0 wynika, że a 1 = . . . = a n = 0. Mówimy, że wektory x 1 , . . . x n są liniowo zależne,<br />

jeżeli nie są liniowo niezależne, to znaczy, jeżeli istnieją a 1 , . . . a n ∈ K nie wszystkie równe zeru takie, że<br />

a 1 x 1 + . . . + a n x n = 0.<br />

Niech X = {x t } t∈T ⊂ E. Przez span X oznaczamy przestrzeń liniową składającą się z wszystk<strong>ich</strong><br />

skończonych kombinacji liniowych wektorów X, to znaczy przestrzeń: { ∑ n<br />

i=1 a ix i : a i ∈ K, n = 1, 2, . . .}.<br />

Oczywiście, jeżeli X jest podzbiorem przestrzeni liniowej E, to span X jest podprzestrzenią liniową<br />

przestrzeni E.<br />

7


Definicja 3.4. Niech X = {x t } t∈T ⊂ E. Mówimy, że zbiór X jest bazą przestrzeni E jeżeli span X = E<br />

oraz każdy skończony podzbiór zbioru X jest liniowo niezależny.<br />

Twierdzenie 3.1 (Steinitza). Niech E będzie przestrzenią liniową z bazą {x 1 , . . . , x n } oraz niech wektory<br />

y 1 , . . . , y s ∈ E będą liniowo niezależne. Wówczas s n oraz spośród wektorów x 1 , . . . x n można wybrać<br />

n − s wektorów, które wraz z wektorami y 1 , . . . y n tworzą bazę przestrzeni E.<br />

Z twierdzenia Steinitza wynika, że jeżeli przestrzeń E ma bazę n-elementową to każda baza w E ma<br />

dokładnie n elementów.<br />

Definicja 3.5. Jeżeli przestrzeń liniowa E nad ciałem K ma skończoną bazę, to liczbę elementów tej bazy<br />

nazywamy wymiarem przestrzeni E i oznaczamy dim K E. Jeżeli przestrzeń E nie ma skończonej bazy, to<br />

przyjmujemy dim K E = ∞.<br />

Przyjmuje się, że bazą przestrzeni zerowej jest układ pusty i że wymiar przestrzeni zerowej jest 0.<br />

Istnienie bazy w dowolnej przestrzeni liniowej wynika z lematu Kuratowskiego - Zorna.<br />

Przykład 3.1. Rozważmy kilka przykładów przestrzeni liniowych:<br />

1. Oczywiście każde ciało K jest jednowymiarową przestrzenią liniową nad K z bazą złożoną z elementu<br />

neutralnego.<br />

2. Jeżeli 1 jest elementem neutralnym ciała K, to w zbiorze K n określamy wektory: e i = (0, . . . , 1, . . . , 0)<br />

(1 na i-tym miejscu) dla i = 1, . . . , n. Dla x = (x 1 , . . . , x n ), y = (y 1 , . . . , y n ), a ∈ K określamy<br />

działania: x + y = (x 1 + y 1 , . . . , x n + y n ) oraz ax = (ax 1 , . . . , ax n ). Wówczas jest to przestrzeń<br />

liniowa z bazą e 1 , . . . , e n . Stąd dim K K n = n<br />

W szczególności C n (R n ) jest przestrzenią liniową nad C(R) wymiaru n.<br />

3. Przestrzeń C n jest przestrzenią liniową nad R wymiaru 2n.<br />

4. Jeżeli m n, to K m jest podprzestrzenią przestrzeni liniowej K n<br />

5. Przestrzeń R jest przestrzenią liniową nad Q nieskończonego wymiaru.<br />

6. Można pokazać, że zbiór C(X) = {f : f : X → R, f - ciągła} jest przestrzenią liniową nad R, jeżeli<br />

działania określimy następująco: dla f, g ∈ C(X), a ∈ R (f + g)(x) = f(x) + g(x), (rf)(x) = rf(x).<br />

Wymiar przestrzeni C(X) zależy od wymiaru przestrzeni X. Na przykład, w skrajnym przypadku,<br />

gdy X jest przestrzenią jednopunktową, to dim R C(X) = 1. Na ogół C(X) jest jednak przestrzenią<br />

nieskończenie wiele wymiarową, na przykład jeśli X = [a, b], to ciąg funkcji {f n }, f n (x) = x n stanowi<br />

układ liniowo niezależny.<br />

W podobny sposób można wprowadzić strukturę przestrzeni liniowej na innych przestrzeniach funkcyjnych,<br />

na przykład na zbiorze funkcji całkowalnych oraz na zbiorze funkcji k-krotnie różniczkowalnych<br />

w sposób ciągły C k (X). Co więcej C k (X) ⊂ . . . C 1 (X) ⊂ C(X) są kolejnymi podprzestrzeniami<br />

liniowymi.<br />

Definicja 3.6. Niech E, E ′ będą przestrzeniami liniowymi nad ciałem K. Odwzorowanie T : E → E ′<br />

nazywamy liniowym, jeżeli dla dowolnych x 1 , x 2 ∈ E i dla dowolnego a 1 , a 2 ∈ K zachodzi równość:<br />

T (a 1 x 1 + a 2 x 2 ) = a 1 T (x 1 ) + a 2 T (x 2 ).<br />

Definicja 3.7. Niech E, E ′ będą przestrzeniami liniowymi oraz niech T : E → E ′ będzie odwzorowaniem<br />

liniowym. Jądrem odwzorowania T nazywamy zbiór ker T = {x ∈ E : T (x) = 0}. Obrazem odwzorowania<br />

T nazywamy zbiór Im T = {y ∈ E ′ : ∃ x∈E T (x) = y}<br />

Odwzorowanie liniowe T nazywamy monomorfizmem, jeśli ker T = {0}; epimorfizmem, jeśli Im T = E ′ ,<br />

izomorfizmem, jeżeli T jest monomorfizmem i epimorfizmem.<br />

Zauważmy, że izomorfizm jest odwzorowaniem odwracalnym.<br />

8


Twierdzenie 3.2. Niech T : E → E ′ będzie odwzorowaniem liniowym. Im T jest podprzestrzenią przestrzeni<br />

E ′ , ker T jest podprzestrzenią przestrzeni E.<br />

Twierdzenie 3.3. Dwie skończenie wymiarowe przestrzenie liniowe nad tym samym ciałem , mające ten<br />

sam wymiar, są izomorficzne.<br />

Uwaga 3.4. Niech L(E, E ′ ) = {T : E → E ′ : T - odwzorowanie liniowe}. Określamy działania:<br />

(T + S)(x) = T (x) + S(x), (aT )(x) = aT (x) dla T, S ∈ L(E, E ′ ) oraz a ∈ K, x ∈ E. Można sprawdzić, że<br />

zbiór L(E, E ′ ) wraz z podanymi działaniami stanowi przestrzeń liniową.<br />

Niech A będzie bazą przestrzeni E oraz niech T : E → E ′ będzie odwzorowaniem liniowym. Wówczas,<br />

dla dowolnego x ∈ X istnieją x 1 , . . . , x n ∈ A, a 1 , . . . , a n ∈ K takie, że<br />

T (x) = a 1 T (x 1 ) + . . . + a n T (x n ). (1)<br />

Stąd wynika, że odwzorowanie liniowe jest jednoznacznie określone przez wartości na elementach pewnej<br />

bazy.<br />

Niech E, E ′ będą skończenie wymiarowymi przestrzeniami liniowymi nad ciałem K z bazami {e 1 , . . . , e n }<br />

oraz {e ′ 1, . . . , e ′ m}. Niech T : E → E ′ będzie odwzorowaniem liniowym. Wówczas, ze wzoru (1) mamy,<br />

że T (x) = a 1 T (e 1 ) + . . . + a n T (e n ) dla dowolnego x ∈ E. Ponadto, z tego, że T (e i ) ∈ E ′ wynika, że<br />

a i T (e i ) = a i1 e ′ 1 + . . . + a im e ′ m dla dowolnego i = 1, . . . , m. Macierz:<br />

⎡<br />

⎤<br />

a 11 a 12 . . . a 1n<br />

⎢<br />

⎣<br />

.<br />

. . ..<br />

⎥<br />

. ⎦<br />

a m1 a m2 . . . a mn<br />

nazywamy macierzą przekształcenia liniowego T .<br />

Stąd wynika w szczególności:<br />

Twierdzenie 3.5. Niech E, E ′ będą przestrzeniami liniowymi nad ciałem K takimi, że dim E = n,<br />

dim E ′ = m. Wówczas przestrzeń L(E, E ′ ) jest izomorficzna z przestrzenią macierzy wymiaru n × m<br />

nad ciałem K.<br />

Twierdzenie 3.6. Jeżeli E, E ′ są przestrzeniami liniowymi skończonego wymiaru, to odwzorowanie liniowe<br />

T : E → E ′ jest izomorfizmem wtedy i tylko wtedy, gdy macierz tego odwzorowania jest macierzą<br />

kwadratową o niezerowym wyznaczniku.<br />

Przykład 3.2. Rozważmy:<br />

1. Jeżeli m n, to określamy odwzorowanie j : K m → K n wzorem: j(e i ) = e i dla i = 1 . . . m. Macierz<br />

tego odwzorowania jest następująca:<br />

⎡<br />

⎤<br />

1 0 . . . 0 0 . . . 0<br />

0 1 . . . 0 0 . . . 0<br />

. . . .. . . . .. .<br />

0 0 . . . 1 0 . . . 0<br />

0 0 . . . 0 0 . . . 0<br />

⎢<br />

⎣<br />

.<br />

.<br />

. .. . ⎥<br />

. . .. . ⎦<br />

0 0 . . . 0 0 . . . 0<br />

Ogólniej, jeżeli E ′ jest podprzestrzenią liniową przestrzeni E, to możemy w ten sposób określić monomorfizm.<br />

2. Odwzorowanie I : C([a, b]) → R, dane wzorem I(f) =<br />

∫ b<br />

a<br />

f(x)dx, jest przekształceniem liniowym.<br />

9


Twierdzenie 3.7. Niech będą dane dwie przestrzenie liniowe E i E ′ nad ciałem K, przy czym<br />

dim E = n < ∞. Jeśli e 1 , . . . e n jest bazą przestrzeni E i g 1 , . . . , g n jest dowolnym układem n-elementowym<br />

wektorów przestrzeni E ′ , to istnieje dokładnie jedno odwzorowanie liniowe T : E → E ′ takie, że T (e i ) = g i<br />

dla i = 1, . . . n. Ponadto, odwzorowanie T jest izomorfizmem wtedy i tylko wtedy, gdy wektory g 1 , . . . , g n<br />

są liniowo niezależne.<br />

Dowód. Dla x = a 1 x 1 + . . . a n x n ∈ E określamy T : E → E ′ wzorem: T (x) = x 1 g 1 + . . . + x n g n .<br />

Stąd w szczególności wynika, że jeżeli na przestrzeni skończenie wymiarowej mamy dwie bazy: e 1 , . . . e n<br />

oraz e ′ 1, . . . e ′ n, to odwzorowanie T : E → E dane wzorem T (x) = x 1 e ′ 1 + . . . + x n e ′ n dla x = a 1 x 1 + . . . a n x n<br />

jest jedynym odwzorowaniem liniowym takim, że T (e i ) = e ′ i . Macierz tego przekształcenia nazywamy<br />

macierzą przejścia i oznaczamy ją S.<br />

Twierdzenie 3.8. Niech E będzie przestrzenią liniową oraz niech e = (e 1 , . . . e n ), e ′ = (e ′ 1, . . . e ′ n) będą<br />

dwoma bazami tej przestrzeni oraz niech T : E → E będzie odwzorowaniem liniowym. Jeżeli odwzorowanie<br />

T ma w bazie e macierz A oraz w bazie e ′ ma macierz B, to B = S −1 AS.<br />

4 Układy równań liniowych i metody <strong>ich</strong> rozwiązywania<br />

Przez c<strong>ały</strong> rozdział zakładamy, że K jest ustalonym ciałem oraz wszystkie skalary należą do tego ciała.<br />

Układ ⎧⎪ ⎨<br />

⎪ ⎩<br />

a 11 x 1 + a 12 x 2 + . . . + a 1n x n = b 1<br />

a 21 x 1 + a 22 x 2 + . . . + a 2n x n = b 2<br />

. (2)<br />

.<br />

. .. . .<br />

a m1 x 1 + a m2 x 2 + . . . + a mn x n = b m<br />

nazywamy liniowym układem m równań z n niewiadomymi (nad ciałem K), skalary a ij - współczynnikami<br />

przy niewiadomych, a b i - wyrazami wolnymi. Ciąg skalarów (r 1 , r 2 , . . . , r n ) nazywamy rozwiązaniem układu<br />

(2), jeśli zachodzą równości:<br />

⎧<br />

a 11 r 1 + a 12 r 2 + . . . + a 1n r n = b 1<br />

⎪⎨ a 21 r 1 + a 22 r 2 + . . . + a 2n r n = b 2<br />

.<br />

.<br />

. .. . .<br />

⎪⎩<br />

a m1 r 1 + a m2 r 2 + . . . + a mn r n = b m<br />

Mówimy wówczas, że skalary r 1 , r 2 , . . . , r n spełniają układ (2).<br />

Macierz<br />

⎡<br />

⎤<br />

a 11 a 12 · · · a 1n<br />

a 21 a 22 · · · a 2n<br />

A = ⎢<br />

⎣<br />

.<br />

. . ..<br />

⎥<br />

. ⎦<br />

a m1 a m2 · · · a mn<br />

nazywamy macierzą główną układu (1) zaś macierz<br />

⎡<br />

∣ ⎤<br />

a 11 a 12 · · · a 1n ∣∣∣∣∣∣∣∣ b 1<br />

a 21 a 22 · · · a 2n b 2 U = ⎢<br />

⎣<br />

.<br />

. . ..<br />

⎥<br />

. . ⎦<br />

a m1 a m2 · · · a mn b m<br />

nazywamy macierzą rozszerzoną (uzupełnioną) układu (2).<br />

(3)<br />

(4)<br />

10


Układ 2 nazywamy jednorodnym, jeżeli b 1 = . . . = b n = 0, w przeciwnym wypadku mówimy, że układ<br />

jest niejednorodny. Oznaczmy:<br />

⎡ ⎤ ⎡ ⎤<br />

b 1 x 1<br />

b 2 B = ⎢ ⎥<br />

⎣ . ⎦ , X = x 2<br />

⎢ ⎥<br />

⎣ . ⎦<br />

b m x m<br />

Wówczas równanie (2) jest równoważne z równaniem macierzowym:<br />

AX = B (5)<br />

Jeżeli w układzie (2) n = m oraz det A ≠ 0, to układ ten nazywamy układem Cramera. Zauważmy, że<br />

wtedy X = A −1 B jest jedynym rozwiązaniem układu (5).<br />

Przez A i oznaczymy macierz otrzymaną przez zamianę w macierzy głównej układu i-tej kolumny na<br />

kolumnę wyrazów wolnych układu równań:<br />

⎡<br />

⎤<br />

a 11 a 12 . . . a 1 i−1 b 1 a 1 i+1 . . . a 1n<br />

a 21 a 22 . . . a 2 i−1 b 2 a 2 i+1 . . . a 2n<br />

A i = ⎢<br />

⎣<br />

.<br />

. . .. . . . . ..<br />

⎥<br />

. ⎦<br />

a n1 a n2 . . . a n i−1 b n a n i+1 . . . a nn<br />

Twierdzenie 4.1 (Cramera). Jeżeli układ (2) jest układem Cramera, to ma dokładnie jedno rozwiązanie<br />

określone wzorami: x j = dla j = 1, . . . n.<br />

det Aj<br />

det A<br />

Wniosek 4.2. Jedynym rozwiązaniem jednorodnego układu Cramera jest rozwiązanie x 1 = . . . = x n = 0.<br />

Definicja 4.1. Rzędem macierzy A = [A 1 , . . . , A n ] nazywamy maksymalną liczbę liniowo niezależnych<br />

wektorów spośród A 1 , . . . , A n . Oznaczamy go rz A.<br />

Równoważnie, jest to wymiar maksymalnego minora o niezerowym wyznaczniku.<br />

Twierdzenie 4.3 (Kroneckera-Capellego). Układ równań (2) ma co najmniej jedno rozwiązanie wtedy i<br />

tylko wtedy, gdy rz A = rz U.<br />

Załóżmy teraz, że rz A = rz U = k. Bez zmniejszenia ogólności, możemy założyć, że układ składający<br />

się z pierwszych k wierszy macierzy A jest liniowo niezależny. Wówczas układ składający się z pierwszych<br />

k wierszy macierzy U także jest liniowo niezależny. Z tego, że rz U = k wynika, że ostatnie n−k wierszy da<br />

się przedstawić jako liniowe kombinacje pierwszych k wierszy. Zatem, jeżeli x 1 , . . . , x n jest rozwiązaniem<br />

pierwszych k równań, to spełnia także ostatnie n − k równań. Wystarczy zatem rozważać układ<br />

⎧<br />

a 11 x 1 + a 12 x 2 + . . . + a 1n x n = b 1<br />

⎪⎨ a 21 x 1 + a 22 x 2 + . . . + a 2n x n = b 2<br />

. (6)<br />

. . .. . .<br />

⎪⎩<br />

a k1 x 1 + a k2 x 2 + . . . + a kn x n = b k<br />

Rozważmy 2 przypadki:<br />

1. Jeżeli k = n, to układ (6) jest układem Cramera.<br />

2. Załóżmy, że k < n. Bez zmniejszenia ogólności możemy założyć, że pierwszych k kolumn macierzy<br />

stowarzyszonej z układem (6) jest liniowo niezależnych. Podstawiając za x k+1 , . . . x n dowolne skalary<br />

r k+1 , . . . r n z ciała otrzymujemy układ:<br />

⎧<br />

a 11 x 1 + a 12 x 2 + . . . + a 1k x k = b 1 − a 1 k+1 r k+1 − . . . − a 1 n r n<br />

⎪⎨ a 21 x 1 + a 22 x 2 + . . . + a 2k x k = b 2 − a 2 k+1 r k+1 − . . . − a 2 n r n<br />

. (7)<br />

. . .. .<br />

.<br />

⎪⎩<br />

a k1 x 1 + a k2 x 2 + . . . + a kk x k = b k − a k k+1 r k+1 − . . . − a k n r n<br />

11


Układ (12) jest układem Cramera (przy ustalonych r k+1 , . . . , r n ) więc znane są jego rozwiązania. Co<br />

więcej, jeżeli ciało K jest nieskończone to układ ten ma nieskończenie wiele rozwiązań.<br />

Twierdzenie 4.4. Układ (2) ma dokładnie jedno rozwiązanie wtedy i tylko, gdy rz A = n, to znaczy rząd<br />

macierzy układu jest równy ilości niewiadomych.<br />

Metoda eliminacji Gaussa polega na sprowadzeniu macierzy uzupełnionej układu U do prostszej macierzy<br />

(z większą ilością zer) poprzez operacje elementarne na wierszach macierzy U, to znaczy mnożenie<br />

przez skalar, zamiana miejsc dowolnych dwóch wierszy oraz dodanie do dowolnego wiersza kombinacji liniowej<br />

pozost<strong>ały</strong>ch wierszy. Łatwo pokazać, że takie operacje nie zmieniają rozwiązań wyjściowego układu<br />

(mówi się o równoważności układów).<br />

Załóżmy, że rz A = rz U = k i rozważmy macierz<br />

⎡<br />

∣ ⎤<br />

a 11 a 12 · · · a 1n∣∣∣∣∣∣∣∣<br />

b 1<br />

a 21 a 22 · · · a 2n b 2 U 1 = ⎢<br />

⎣<br />

.<br />

. . ..<br />

⎥<br />

(8)<br />

. . ⎦<br />

a k1 a k2 · · · a kn b k<br />

Bez zmniejszenia ogólności możemy założyć, że a 11 ≠ 0. Mnożąc pierwszy wiersz przez a −1<br />

11 a i1 i dodając<br />

do i-tego wiersza (dla i = 2, . . . k) otrzymujemy macierz:<br />

⎡<br />

⎤<br />

a 11 a 12 · · · a 1n<br />

b 1<br />

0 a ′ 22 · · · a ′ 2n<br />

b ′ ⎢<br />

⎣<br />

.<br />

. . .. ⎥<br />

(9)<br />

.<br />

2. ⎦<br />

0 a ′ k2<br />

· · · a ′ ∣<br />

kn<br />

b ′ k<br />

Po skończonej liczbie tego rodzaju przekształceń otrzymujemy macierz:<br />

⎡<br />

⎤<br />

a 11 a 12 a 13 · · · a 1n<br />

b 1<br />

0 a (1)<br />

22 a (1)<br />

23 · · · a (1)<br />

2n<br />

b (1)<br />

0 0 a (2)<br />

33 · · · a (2)<br />

2<br />

2n<br />

b (2)<br />

⎢<br />

.<br />

⎣ . . . .. ⎥<br />

.<br />

3. ⎦<br />

0 · · · 0 a (k−1)<br />

kk<br />

· · · a (k−1)<br />

∣<br />

kn<br />

b (k−1)<br />

k<br />

Tej macierzy odpowiada układ<br />

⎧<br />

a 11 x 1 + a 12 x 2 + a 13 x 3 + . . . + a 1n x n = b 1<br />

⎪⎨<br />

a (1)<br />

22 x 2 + a (1)<br />

23 x 3 + . . . + a (1)<br />

2n x n = b (1)<br />

2<br />

.<br />

.<br />

.. . .<br />

⎪⎩<br />

a (k−1)<br />

kk<br />

x k + . . . + a (k−1)<br />

mn x n = b (k−1)<br />

m<br />

(10)<br />

(11)<br />

Rozważmy 2 przypadki:<br />

1. Jeżeli k = n, to z ostatniego równania wyznaczamy x k , podstawiamy do przedostatniego, następnie<br />

z przedostatniego wyznaczamy x k−1 , i tak dalej, aż do wyznaczenia x 1 z pierwszego równania.<br />

2. Jeżeli k < n to ustalamy dowolne skalary r k+1 , . . . r n , wstawiamy je za x r+1 , . . . , x n i rozwiązujemy<br />

układ jak w pierwszym przypadku.<br />

5 Formy kwadratowe i klasyfikacja stożkowych<br />

Przez c<strong>ały</strong> rozdział zakładamy, że E jest przestrzenią liniową nad ciałem K.<br />

12


Definicja 5.1. Funkcjonałem dwuliniowym określonym na przestrzeni liniowej E nazywamy funkcję<br />

ϕ: E × E → K, spełniającą następujący warunek:<br />

∀ x1,x 2∈E∀ a1,a 2∈E ϕ(a 1 x 1 + a 2 x 2 ) = a 1 ϕ(x 1 ) + a 2 ϕ(x 2 )<br />

Przestrzeń wszystk<strong>ich</strong> funkcjonałów dwuliniowych na przestrzeni E oznaczamy: L(E 2 , K).<br />

Twierdzenie 5.1. Niech dim E = n i niech e 1 , . . . , e n będzie bazą przestrzeni E oraz ψ, ϕ ∈ L(E 2 , K).<br />

Jeżeli dla dowolnych 1 i, j n, ψ(e i , e j ) = ϕ(e i , e j ), to ψ = ϕ.<br />

Niech e 1 , . . . , e n będzie bazą przestrzeni E. Wówczas dla dowolnych x, y ∈ E istnieją x 1 , . . . , x n oraz<br />

y 1 , . . . , y n takie, że x = ∑ n<br />

i=1 x ie i oraz y = ∑ n<br />

i=1 y ie i . Wówczas ϕ(x, y) = ∑ n<br />

i=1 x iy i jest funkcjonałem<br />

dwuliniowym. Ponadto, jeżeli ϕ jest dowolnym funkcjonałem dwuliniowym, to<br />

gdzie a ij = ϕ(e i , e j ).<br />

ϕ(x, y) =<br />

n∑<br />

a ij x i y i , (12)<br />

i,j=1<br />

Twierdzenie 5.2. Jeśli dim E = n i [a ij ] ∈ M n (K) (to znaczy jest macierzą kwadratową, wymiaru n<br />

o współczynnikach w ciele K), to istnieje dokładnie jeden funkcjonał dwuliniowy ϕ ∈ L(E 2 , K) taki, że<br />

dla dowolnie wybranej bazy przestrzeni E zachodzi równość ϕ(e i , e j ) = a ij (1 i, j n), przy czym ϕ<br />

przedstawia się w postaci (12).<br />

Prawa strona wyrażenia (12) nazywa się formą dwuliniową, a skalary a ij współczynnikami formy dwuliniowej.<br />

Twierdzenie 5.3. Niech dim E = n oraz e = (e 1 , . . . , e n ), e ′ = (e ′ 1, . . . , e ′ n) będą dwoma bazami przestrzeni<br />

E. Jeżeli ϕ ma w bazie e macierz A oraz w bazie e ′ ma macierz B, to B = S T AS, gdzie S jest macierzą<br />

przejścia z bazy e do bazy e ′ .<br />

Definicja 5.2. Funkcjonał dwuliniowy ϕ nazywa się symetrycznym, jeśli dla każdych x, y ∈ E zachodzi<br />

równość: ϕ(x, y) = ϕ(y, x).<br />

Mówimy, że macierz A ∈ M n (K) jest symetryczna, jeżeli A = A T .<br />

Twierdzenie 5.4. Niech dim E = n.<br />

Jeśli funkcjonał ϕ ∈ L(E 2 , K) jest symetryczny, to jego macierz w dowolnej bazie jest symetryczna.<br />

Jeśli macierz funkcjonału dwuliniowego ϕ ∈ L(E 2 , K) w pewnej bazie jest symetryczna, ϕ jest funkcjonałem<br />

symetrycznym.<br />

Od tej pory zakładamy, że ciało K jest charakterystyki różnej niż 2, to znaczy 2 = 1 + 1 ≠ 0<br />

Definicja 5.3. Niech ϕ ∈ L(E 2 , K) będzie funkcjonałem symetrycznym. Funkcja F : V → K określona w<br />

następujący sposób: F (x) = ϕ(x, x) nazywa się funkcjonałem kwadratowym danym na przestrzeni V .<br />

Dla danego funkcjonału kwadratowego F określamy ϕ(x, y) = 1 2<br />

(F (x + y) − F (x) − F (y)). Zatem<br />

istnieje wzajemnie jednoznaczna odpowiedniość między funkcjonałami kwadratowymi a funkcjonałami<br />

dwuliniowymi symetrycznymi.<br />

Jeżeli ϕ ′ nie jest funkcjonałem symetrycznym to określamy ϕ(x, y) = 1 2 (ϕ′ (y, x) + ϕ ′ (x, y)). Oczywiście<br />

ϕ(x, x) = ϕ ′ (x, x). Dlatego od tej pory zakładamy, że omawiane funkcjon<strong>ały</strong> są symetryczne.<br />

W dalszym ciągu będziemy zawsze zakładać, że dim E = n.<br />

Niech e 1 , . . . , e n będzie bazą V oraz x = ∑ n<br />

i=1 x ie i , y = ∑ n<br />

i=1 y ie i . Wówczas ϕ przedstawia się w<br />

postaci (12), gdzie a ij = a ji . Otrzymujemy stąd ogólną postać funkcjonału kwadratowego w przestrzeni<br />

skończonego wymiaru:<br />

n∑<br />

F (x) = a ij x i x j , (13)<br />

i,j=1<br />

gdzie a ij = a ji . Prawa strona we wzorze (13) nazywa się formą kwadratową. Macierz A = [a ij ] zbudowaną<br />

ze współczynników formy (13) nazywamy macierzą formy kwadratowej (13).<br />

13


Twierdzenie 5.5. Niech e = (e 1 , . . . , e n ), e ′ = (e ′ 1, . . . , e ′ n) będą dwoma bazami przestrzeni E. Jeżeli<br />

forma kwadratowa (13) funkcjonału kwadratowego F ma w bazie e macierz A oraz w bazie e ′ ma macierz<br />

B, to B = S T AS, gdzie S jest macierzą przejścia z bazy e do bazy e ′ .<br />

Definicja 5.4. Rzędem formy kwadratowej nazywa się rząd jej macierzy.<br />

Z 5.5 wynika, że rząd formy kwadratowej nie zależy od wyboru bazy.<br />

Definicja 5.5. Mówimy, że forma kwadratowa (13) funkcjonału kwadratowego F ma w bazie e = (e 1 , . . . , e n )<br />

postać kanoniczną, jeśli a ij = 0 dla i ≠ j. Taka baza e nazywa się bazą kanoniczną funkcjonału F .<br />

Funkcjonał kwadratowy F zapisuje się w bazie kanonicznej w postaci:<br />

F (x) =<br />

n∑<br />

a i x 2 i , (14)<br />

Stąd wynika, że e jest bazą kanoniczną funkcjonału F wtedy i tylko wtedy, gdy macierz tego funkcjonału<br />

w bazie e jest diagonalna.<br />

Twierdzenie 5.6. Niech F będzie funkcjonałem kwadratowym określonym na przestrzeni E. Istnieje wówczas<br />

baza w przestrzeni E, będąca bazą kanoniczną funkcjonału F .<br />

i=1<br />

Niech teraz E będzie przestrzenią liniową nad R wymiaru n oraz F będzie funkcjonałem kwadratowym<br />

określonym na przestrzeni E.<br />

Mówimy, że forma kwadratowa (14) jest w postaci normalnej, jeżeli jej współczynniki są równe 0, 1 lub<br />

-1.<br />

Twierdzenie 5.7. W przestrzeni E istnieje baza, w której funkcjonał F ma postać normalną.<br />

Twierdzenie 5.8 (o bezwładności). Ilość współczynników dodatn<strong>ich</strong>, ujemnych oraz zerowych formy kwadratowej<br />

(14) nie zależy od wyboru bazy kanonicznej funkcjonału F .<br />

Definicja 5.6. Mówimy, że funkcjonał kwadratowy F jest dodatnio (ujemnie) określony, jeżeli dla dowolnego<br />

x ∈ X, x ≠ 0 zachodzi: F (x) > 0 (F (x) < 0).<br />

Twierdzenie 5.9. Funkcjonał kwadratowy F jest dodatnio określony wtedy i tylko wtedy, gdy liczba<br />

dodatn<strong>ich</strong> współczynników jego formy kwadratowej w postaci kanonicznej jest równa wymiarowi przestrzeni<br />

E. Ponadto, jest ujemnie określona wtedy i tylko wtedy, gdy dla każdego k = 1, . . . , n zachodzi:<br />

(−1) k a 1 · . . . · a k > 0.<br />

Przykład 5.1. Przykłady funkcjonałów i form kwadratowych:<br />

1. Niech E będzie przestrzenią liniową nad R. Wówczas iloczyn skalarny 〈·, ·〉 jest funkcjonałem dwuliniowym<br />

symetrycznym, zaś norma jest funkcjonałem kwadratowym dodatnio określonym generowanym<br />

przez 〈·, ·〉.<br />

2. Niech E będzie przestrzenią liniową nad R oraz niech A ∈ M n (R) będzie macierzą symetryczną.<br />

Wówczas odwzorowanie F : E × E → R dane wzorem F (x) = 1 2<br />

〈Ax, x〉, gdzie 〈·, ·〉 jest dowolnym<br />

iloczynem skalarnym w E, jest funkcjonałem kwadratowym.<br />

3. Niech E będzie przestrzenią liniową nad R oraz niech A ∈ M n (R). Wówczas odwzorowanie<br />

F 1 : E × E → R dane wzorem F 1 (x) = 1 2 〈 1 2 (A + AT )x, x〉, gdzie 〈·, ·〉 jest dowolnym iloczynem<br />

skalarnym w E, jest funkcjonałem kwadratowym.<br />

Krzywą stożkową nazywamy zbiór punktów powst<strong>ały</strong>ch na przecięciu stożka (a dokładniej powierzchni<br />

bocznej stożka) i płaszczyzny.<br />

Wyróżnia się następujące krzywe stożkowe, zależnie od kąta, jaki tworzy płaszczyzna przecinająca z<br />

osią stożka i jego tworzącą:<br />

14


1. W przypadku, gdy kąt pomiędzy płaszczyzną przecinającą a osią stożka jest większy od kąta między<br />

tworzącą a osią stożka, wówczas krzywą stożkową jest elipsa.<br />

Szczególnym przypadkiem elipsy jest okrąg, który powstaje, gdy wspomniany kąt jest prosty, czyli<br />

płaszczyzna tnąca jest prostopadła do osi stożka.<br />

2. Jeżeli kąt pomiędzy płaszczyzną tnącą a osią stożka jest równy kątowi pomiędzy osią stożka a jego<br />

tworzącą, czyli tworząca jest równoległa do płaszczyzny tnącej, to krzywą stożkową jest parabola.<br />

W szczególnym przypadku, gdy płaszczyzna tnąca pokrywa się z tworzącą, otrzymuje się prostą (nie<br />

zaliczaną do krzywych stożkowych).<br />

3. Jeżeli kąt pomiędzy płaszczyzną tnącą a osią stożka jest mniejszy od kąta pomiędzy osią stożka a<br />

jego tworzącą, to otrzymana krzywa stożkowa jest hiperbolą.<br />

Hiperbola powstaje również, gdy płaszczyzna tnąca jest równoległa do osi stożka, ale nie obejmuje<br />

tej osi. W szczególnym przypadku, gdy oś stożka jest zawarta w płaszczyźnie tnącej, otrzymuje się<br />

parę przecinających się prostych, nie zaliczaną do stożkowych.<br />

Krzywe stożkowe i <strong>ich</strong> równania:<br />

1. okrąg x 2 + y 2 = r 2 ,<br />

2. elipsa x2<br />

a<br />

+ y2<br />

2 b<br />

= 1; x2<br />

2 b<br />

+ y2<br />

2 a<br />

= 1,<br />

2<br />

3. parabola y 2 = 4ax ; x 2 = 4ay<br />

4. hiperbola x2<br />

a<br />

− y2<br />

2 b<br />

= 1; x2<br />

2 b<br />

− y2<br />

2 a<br />

= 1 2<br />

Obrazek:<br />

http://upload.wikimedia.org/wikipedia/commons/d/d3/Conic sections with plane.svg<br />

15

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!