31.01.2014 Aufrufe

Seminar: Galois-Theorie SS 2007 Resultanten

Seminar: Galois-Theorie SS 2007 Resultanten

Seminar: Galois-Theorie SS 2007 Resultanten

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Seminar</strong>: <strong>Galois</strong>-<strong>Theorie</strong><br />

<strong>SS</strong> <strong>2007</strong><br />

<strong>Resultanten</strong><br />

Sabrina Haase<br />

13.09.<strong>2007</strong>


Zusammenfassung<br />

Dies ist die schriftliche Ausarbeitung des <strong>Seminar</strong>vortrags, den ich am 23.05.07<br />

innerhalb des Vorlesung ”<br />

<strong>Galois</strong>-<strong>Theorie</strong>“ gehalten habe. Es werden <strong>Resultanten</strong><br />

definiert, ihre Anwendungsmöglichkeiten dargestellt und einige Eigenschaften<br />

bewiesen. Hauptsächlich wurde als Quelle das Buch ”<br />

Algebra“ von<br />

S. Lang benutzt.


Inhaltsverzeichnis<br />

1 Definition 1<br />

2 Eigenschaften 3<br />

2.1 Nullstellen der Resultante . . . . . . . . . . . . . . . . . . . . 5<br />

2.2 Resultante und Diskriminante . . . . . . . . . . . . . . . . . . 8<br />

3 Beispiele 10<br />

Literaturverzeichnis 12


1 Definition<br />

Definition 1.1 (Resultante). Sei A ein kommutativer Ring und seien v 0 , . . . , v n , w 0 , . . . , w m<br />

algebraisch unabhängig über A.<br />

Wir betrachten folgende zwei Polynome:<br />

f v (X) = v 0 X n + . . . + v n<br />

g w (X) = w 0 X m + . . . + w m<br />

Die Resultante wird nun definiert als Determinante der Sylvesterschen Matrix<br />

von f v und g w :<br />

⎛<br />

⎞<br />

v 0 v 1 · · · v n<br />

v 0 v 1 · · · v n<br />

. .. . ..<br />

v 0 · · · v n<br />

Sylv(f v , g w ) =<br />

w 0 w 1 · · · w m<br />

w 0 w 1 · · · w m<br />

. .. . ..<br />

⎜<br />

⎟<br />

⎝<br />

w 0 · · · w m<br />

⎠<br />

Die Sylvestersche Matrix ist eine (m + n) × (m + n)-Matrix. In den ersten m<br />

Zeilen stehen die Koeffizienten von f v , in jeder Zeile jeweils um eine Stelle<br />

nach rechts versetzt; analog sind die letzten n Zeilen gebildet. Alle übrigen<br />

Stellen werden mit Nullen aufgefüllt. Also können wir als Definition der Resultante<br />

notieren:<br />

R(f v , g w ) = R(v, w) = det(Sylv(f v , g w ))<br />

Beispiel 1.2. Als Beispiel wählen wir jetzt n = 2 und m = 3. Die Sylvestersche<br />

Matrix lautet dann:<br />

⎛<br />

⎞<br />

v 0 v 1 v 2 0 0<br />

0 v 0 v 1 v 2 0<br />

Sylv(f v , g w ) =<br />

⎜ 0 0 v 0 v 1 v 2<br />

⎟<br />

⎝w 0 w 1 w 2 w 3 0 ⎠<br />

0 w 0 w 1 w 2 w 3<br />

Bemerkung 1.3. Wenn wir Elemente (a) = (a 0 , . . . , a n ) und (b) = (b 0 , . . . , b m )<br />

in A für (v,w) bzw. die Koeffizienten von f v und g w einsetzen, erhalten wir<br />

Polynome f a und g b mit Koeffizienten in A, und wir definieren die Resultante<br />

als die durch Ersetzen von (a) für (v) und (b) für (w) erhaltene Determinante.<br />

1


Bemerkung 1.4. Zu beachten ist: Die spezialisierten Polynome haben nicht<br />

notwendigerweise die Grade n bzw. m, denn auch v 0 = 0 oder w 0 = 0 ist<br />

zugelassen. Bei v 0 = 0 und w 0 = 0 erhält man R(f v , g w ) = 0.<br />

Bemerkung 1.5. Die Resultante ist ein Polynom mit ganzen Koeffizienten<br />

in den Unbestimmten v i und w j ; wir dürfen also zum Beispiel A = Z wählen.<br />

Für ein beliebig gewähltes z gilt:<br />

R(zv, w) = z m R(v, w) und R(v, zw) = z n R(v, w) Dieses gilt aufgrund der<br />

Rechenregeln für Determinanten.<br />

Also gilt ebenfalls<br />

R(λf v , µg w ) = λ m µ n R(f v , g w )<br />

Bemerkung 1.6. Weiterhin sieht man anhand der Diagonalen der Sylvesterschen<br />

Matrix, dass R(v,w) das Monom v m 0 w n m mit Koeffizient 1 enthält.<br />

2


2 Eigenschaften<br />

Proposition 2.1. Wir arbeiten über Z. Dann ist f v ∈ Z[v][X], g w ∈ Z[w][X]<br />

und R(v, w) ∈ Z[v, w].Es gibt Polynome ϕ v,w und ψ v,w in Z[v, w][X], so dass<br />

sich die Resultante als Linearkombination darstellen lässt, d.h.<br />

R(f v , g w ) = ϕ v,w f v + ψ v,w g w<br />

Zu beachten ist hier, dass auf der linken Seite ein Polynom in den v, w steht<br />

und auf der rechten Seite noch zusätzlich X auftaucht.<br />

Beweis. Wir betrachten folgendes lineares Gleichungssystem<br />

X m−1 f v (X) = v 0 X n+m−1 + v 1 X n+m−2 + . . . + v n X m−1<br />

X m−2 f v (X) = v 0 X n+m−2 + . . . + v n X m−2<br />

.<br />

f v (X) =<br />

v 0 X n + . . . + v n<br />

X n−1 g w (X) = w 0 X n+m−1 + w 1 X n+m−2 + . . . + w m X n−1<br />

X n−2 g w (X) = w 0 X n+m−2 + . . . + w m X n−2<br />

.<br />

g w (X) =<br />

w 0 X m + . . . + w m<br />

Sei C der Spaltenvektor auf der linken Seite des Gleichungssystems und seien<br />

C 0 , . . . , C n+m−1 die Spaltenvektoren der Koeffizienten. Also können unsere<br />

Gleichungen geschrieben werden als<br />

C = X n+m−1 C 0 + . . . + 1 · C n+m−1<br />

Man hat Sylv(f v , g w ) = (C 0 , . . . , C n+m−1 ). Ersetzt man hier die letzte Spalte<br />

durch C, so folgt durch multilineares Rechnen:<br />

det(C 0 , . . . , C n+m−2 , C) = det(C 0 , . . . , C n+m−2 , C n+m−1 +<br />

n+m−1<br />

∑<br />

j=1<br />

= det(C 0 , . . . , C n+m−2 , C n+m−1 ) = R(v, w)<br />

X n+m−j C j−1 )<br />

Den linken Term kann man jetzt mit Hilfe der Additionsregel von Determinanten<br />

anders darstellen:<br />

3


⎛<br />

⎞<br />

. . . . X m−1 f v<br />

. . . . X m−2 f v<br />

C 0 C 1 . . . C m+n−1 .<br />

det(C 0 , . . . , C n+m−1 , C) = det<br />

. . . . f v<br />

. . . . 0<br />

⎜<br />

⎟<br />

⎝ . . . . . ⎠<br />

0<br />

⎛<br />

⎞<br />

. . . . 0<br />

. . . . 0<br />

C 0 C 1 . . . C m+n−1 .<br />

+ det<br />

. . . . 0<br />

. . . . X n−1 g w<br />

⎜<br />

⎟<br />

⎝ . . . . . ⎠<br />

g w<br />

⇒ es existieren ϕ v,w und ψ v,w in Z[v, w][X], so dass<br />

R(f v , g w ) = ϕ v,w f v + ψ v,w g w<br />

Beispiel 2.2. . Seien<br />

f v = X 2 + X + 1<br />

g w X = 5X 2 + X<br />

g w = 5X + 1<br />

⎛ ⎞ ⎛ ⎞ ⎛ ⎞<br />

1 1 1<br />

C 0 = ⎝5⎠ , C 1 = ⎝1⎠ , C 2 = ⎝0⎠<br />

0 5 1<br />

⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞<br />

f v 1 1 1<br />

⇒ ⎝g w X⎠ = ⎝5⎠ X 2 + ⎝1⎠ X + ⎝0⎠<br />

g w 0 5 1<br />

4


R(f v , g w ) = det(C 0 , . . . , C n+m−1 , C)<br />

⎛ ⎞<br />

1 1 f v<br />

= det ⎝5 1 g w X⎠<br />

0 5 g w<br />

= g w + 25f v − 5g w − 5g w X<br />

= (−4 − 5X) g<br />

} {{ } w + }{{} 25<br />

ψ<br />

ϕ v,w<br />

v,w<br />

Die Resultante hat in diesem Beispiel den Wert 21.<br />

Bemerkung 2.3. Falls λ : Z[v, w] → A ein Homomorphismus in einen kommutativen<br />

Ring A ist und λ(v) = (a), λ(w) = (b), dann gilt<br />

f v<br />

ϕ a,b f a + ψ a,b g b = R(a, b) = R(f a , g b )<br />

2.1 Nullstellen der Resultante<br />

Jetzt möchte ich auf den Verwendungszweck von <strong>Resultanten</strong> näher eingehen.<br />

Proposition 2.4. Sei L ein Teilkörper eines Körpers K. Seien weiterhin f a ,<br />

g b zwei Polynome in K[X] mit gemeinsamer Nullstelle ξ ∈ L. Dann gilt<br />

R(a, b) = 0.<br />

Beweis. Dass f a und g b eine gemeinsame Nullstelle ξ haben, bedeutet gerad,<br />

dass<br />

f a (ξ) = g b (ξ) = 0.<br />

Wird in der Formel von Prop. 2.1 ξ für X eingesetzt, folgt sofort, dass<br />

R(a, b) = 0.<br />

Als nächstes soll der Zusammenhang zwischen der Resultante und den<br />

Nullstellen unserer Polynome f v und g w untersucht werden. Hierzu benötigen<br />

wir ein Lemma.<br />

Lemma 2.5. Sei h(X 1 , . . . X n ) ein Polynom in n Variablen über Z. Falls h<br />

den Wert 0 annimmt, wenn wir X 1 durch X 2 ersetzen und die anderen X i<br />

festhalten, dann wird h(X 1 , . . . , X n ) von X 1 − X 2 in Z[X 1 , . . . , X n ] geteilt.<br />

5


Beweis. Zur Vereinfachung der Schreibweise betrachten wir nur den Fall<br />

n = 2, d.h. Polynome in Z[X, Y ], die durch X − Y teilbar sind.<br />

Der durch X ↦→ X, Y ↦→ X − Y gegebene Isomorphismus<br />

α : Z[X, Y ] → Z[X, Y ] liefert, dass die α(X i Y i ) = X i (X − Y ) j eine Z-Basis<br />

von Z[X, Y ] bilden, d.h. für alle h ∈ Z[X, Y ]:<br />

h(X, Y ) = ∑ a ij X i (X − Y ) j eindeutig<br />

(mit nur endlich vielen Koeffizienten a ij ≠ 0)<br />

Also: h(X, X) = ∑ i a i0X i , so dass<br />

h(X, X) = 0 ⇔ alle a i0 = 0<br />

⇔ h(X, Y ) = ∑ i∈N a ijX i (X − Y ) j = (X − Y )( ∑ j>0 a ijX i (X − Y ) j−1 )<br />

⇒ X − Y teilt h(X, Y )<br />

Bemerkung 2.6. Seien v 0 , t 1 , . . . , t n , w 0 , u 1 , . . . , u m algebraisch unabhängig<br />

über Z und f v , g w gegeben als<br />

f v = v 0 (X − t 1 ) · · · (X − t n ) = v 0 X n + · · · + v n<br />

g w = w 0 (X − u 1 ) · · · (X − u m ) = w 0 X m + · · · + w m<br />

Die Koeffizienten berechnen sich mit<br />

n∏<br />

(X−t i ) = X n −(t 1 + . . . + t n ) X n−1 +( ∑ t<br />

} {{ }<br />

i t j ) X n−2 −. . . =<br />

i≠j<br />

s 1 (t)<br />

} {{ }<br />

s 2 (t)<br />

i=1<br />

n∑<br />

(−1) i s i (t)X n−i<br />

i=0<br />

zu v i = (−1) i v 0 s i (t) mit den elementarsymmetrischen Funktionen<br />

s 0 = 1<br />

s 1 = t 1 + . . . + t n<br />

s 2 = t 1 t 2 + t 1 t 3 + . . . + t n−1 t n<br />

.<br />

s n = t 1 · · · t n<br />

Analog findet man w j = (−1) j w 0 s j (u).<br />

Da s 1 , . . . , s n algebraisch unabhängig sind und diese auch algebraisch unabhängig<br />

von v 0 und w 0 sind, folgt:<br />

v 0 , . . . , v n , w 0 , . . . , w m algebraisch unabhängig über Z.<br />

Proposition 2.7. Mit obiger Notation gilt:<br />

R(f v , g w ) = v m 0 w n 0<br />

n∏ m∏<br />

(t i − u j )<br />

i=1 j=1<br />

6


Beweis. Sei S := v m 0 w n 0<br />

∏ n<br />

i=1<br />

∏ m<br />

j=1 (t i − u j ).<br />

Da R(v, w) homogen vom Grad m in den ersten Variablen ist und homogen<br />

vom Grad n in den zweiten Variablen, folgt, dass<br />

R = v m 0 w n 0 h(t, u)<br />

mit h(t, u) ∈ Z[t, u].<br />

Benutzt man jetzt Prop. 2.4, so verschwindet die Resultante, wenn man u j<br />

durch t i , i = 1, . . . , n, j = 1, . . . , m ersetzt.<br />

Sieht man R als Element von Z[t, u] an, so folgt mit Lemma 2.5:<br />

R ist teilbar durch jedes t i − u j<br />

Somit wird R in Z[t, u] von S geteilt, denn die t i −u j sind paarweise verschiedene<br />

Primelemente.<br />

Aus<br />

S = v m 0 w n 0<br />

n∏<br />

i=1 j=1<br />

m∏<br />

(t i − u j ) (1)<br />

erhalten wir<br />

∏<br />

g(ti ) = w n 0<br />

n∏ m∏<br />

(t i − u j )<br />

i=1 j=1<br />

⇒ S = v m 0<br />

n∏<br />

g(t i ) (2)<br />

i=1<br />

Und mit Hilfe von<br />

R(f, g) = (−1) mn R(g, f)<br />

S = (−1) mn w n 0<br />

m∏<br />

f(u j ) (3)<br />

j=1<br />

Bei (2) sieht man, dass S homogen vom Grad n in (w) ist und bei (3) sehen<br />

wir, dass S homogen ist vom Grad m in (v).<br />

Da R die gleichen Eigenschaften hat und da R teilbar durch S ist, folgt, dass<br />

R = cS für eine Zahl c.<br />

Da sowohl R und S das Monom v m 0 w n m enthalten, welches jeweils mit Koeffizient<br />

1 auftritt, folgt, dass c = 1 ist. Das gibt in der Tat R = S.<br />

Aus diesem Satz haben wir jetzt verschiedene Darstellungen für S gefunden.<br />

Diese sind eine Faktorisierung von R.<br />

7


Korollar 2.8. f a und g b seien Polynome in K[X]. Hat man a 0 b 0 ≠ 0 und<br />

zerfallen f a und g b über K vollständig in Linearfaktoren, so gilt:<br />

R(f a , g b ) = 0 ⇔ f a und g b haben eine gemeinsame Nullstelle.<br />

Beweis. “ ⇒ “ Wir nehmen an, dass R(f a , g b ) = 0 ist. Seien<br />

f a = a 0 (X − α 1 ) · · · (X − α n )<br />

g b = b 0 (X − β 1 ) · · · (X − β n )<br />

die Faktorisierungen von f a und g b , so benutzen wir den Homomorphismus<br />

Z[v 0 , t, w 0 , u] → K<br />

mit v 0 ↦→ a 0 , w 0 ↦→ b 0 , t i ↦→ α i und u j ↦→ β j . Dann ist<br />

∏ ∏<br />

0 = R(f a , g b ) = a m 0 b n 0 (α i − β j )<br />

Dieses ist aber genau Null, wenn f a und g b eine gemeinsame Nullstelle haben.<br />

“ ⇐ “ Die Aussage wurde schon in Proposition 2.4 bewiesen.<br />

2.2 Resultante und Diskriminante<br />

Jetzt folgern wie eine weitere Beziehung für die Resultante in einem<br />

Spezialfall. Sei f v wieder gegeben durch<br />

Aus (2) wissen wir:<br />

f v (X) = v 0 X n + . . . + v n = v 0 (X − t 1 ) · · · (X − t n )<br />

wobei f ′ v die Ableitung zu f v ist.<br />

Mit Hilfe der Produktregel folgt:<br />

R(f v , f ′ v) = v n−1<br />

0<br />

i<br />

j<br />

∏<br />

f ′ (t i ),<br />

i<br />

f ′ v(X) = ∑ i<br />

v 0 (X − t 1 ) · · · (X −ˆ<br />

t i ) · · · (X − t n )<br />

f v(t ′ i ) = v 0 (t i − t 1 ) · · · (t i −ˆ<br />

t i ) · · · (t i − t n ),<br />

wobei das Dach die Auslassung des betreffenden Faktors bedeutet.<br />

Die Diskriminante sei hier definiert als<br />

∏<br />

D(f v ) = D(v) = v0<br />

2n−2 (t i − t j )<br />

8<br />

i≠j


Dieses unterscheidet sich von der üblichen Definition um ein Vorzeichen:<br />

∏<br />

∏<br />

(t i − t j ) 2 = (−1) n(n−1)<br />

2 t i − t j<br />

i


3 Beispiele<br />

Beispiel 3.1.<br />

f(X) = aX 2 + bX + c<br />

Zu bestimmen ist die Diskriminante mit Hilfe der Resultante.<br />

Beispiel 3.2.<br />

f ′ (X) = 2aX + b<br />

aD(f) = −R(f, f ′ )<br />

⎛ ⎞<br />

a b c<br />

= − det ⎝2a b 0⎠<br />

0 2a b<br />

= −(ab 2 + 4a 2 c − 2ab 2 )<br />

= ab 2 − 4a 2 c<br />

⇒ D(f) = b 2 − 4ac<br />

f(X) = x 3 + bX + c<br />

Zu bestimmen ist die Diskriminante mit Hilfe der Resultante.<br />

f ′ (X) = 3X 2 + b<br />

D(f) = −R(f, f ′ )<br />

⎛<br />

⎞<br />

1 0 b c 0<br />

0 1 0 b c<br />

= − det<br />

⎜3 0 b 0 0<br />

⎟<br />

⎝0 3 0 b 0⎠<br />

0 0 3 0 b<br />

⎛ ⎞ ⎛ ⎞<br />

1 0 b c<br />

0 b c 0<br />

= −(det ⎜0 b 0 0<br />

⎟<br />

⎝3 0 b 0⎠ + 3 det ⎜1 0 b c<br />

⎟<br />

⎝3 0 b 0⎠ )<br />

0 3 0 b<br />

0 3 0 b<br />

⎛ ⎞ ⎛ ⎞<br />

⎛ ⎞ ⎛ ⎞<br />

b 0 0<br />

0 b c<br />

b c 0<br />

b c 0<br />

= −(det ⎝0 b 0⎠ + 3 det ⎝b 0 0⎠ + 3 · (− det ⎝0 b 0⎠ + 3 · det ⎝0 b c⎠))<br />

3 0 b<br />

3 0 b<br />

3 0 b<br />

3 0 b<br />

= −(b 3 + 3 · (−b 3 ) + 3 · (−b 3 ) + 3 · (b 3 + 3c 2 ))<br />

= −b 3 + 3b 3 + 3b 3 − 9b 3 − 27c 2<br />

= −4b 3 − 27c 2<br />

⇒ D(f) = −4b 3 − 27c 2 10


Beispiel 3.3.<br />

f(X) = a 0 X 3 + a 1 X 2 + a 2 X + a 3<br />

Zu bestimmen ist die Diskriminante mit Hilfe der Resultante.<br />

f ′ (X) = 3a 0 X 2 + 2a 1 X + a 2<br />

a 0 D(f) = −R(f, f ′ )<br />

⎛<br />

⎞<br />

a 0 a 1 a 2 a 3 0<br />

0 a 0 a 1 a 2 a 3<br />

= − det<br />

⎜3a 0 2a 1 a 2 0 0<br />

⎟<br />

⎝ 0 3a 0 2a 1 a 2 0 ⎠<br />

0 0 3a 0 2a 1 a 2<br />

⎛<br />

⎞ ⎛<br />

⎞<br />

a 0 a 1 a 2 a 3<br />

a 1 a 2 a 3 0<br />

= −(a 0 · det ⎜2a 1 a 2 0 0<br />

⎟<br />

⎝3a 0 2a 1 a 2<br />

⎠ + 3a 0 · det ⎜ a 0 a 1 a 2 a 3<br />

⎟<br />

⎝3a 0 2a 1 a 2 0 ⎠ )<br />

0 3a 0 2a 1 a 2 0 3a 0 2a 1 a 2<br />

⎛<br />

⎞<br />

⎛<br />

⎞<br />

2a 1 a 2 0<br />

a 0 a 1 a 2<br />

= −(−a 0 a 3 · det ⎝3a 0 2a 1 a 2<br />

⎠ + a 0 a 2 · det ⎝2a 1 a 2 0 ⎠<br />

0 3a 0 2a 1 3a 0 2a 1 a 2<br />

⎛<br />

⎞<br />

⎛<br />

⎞<br />

a 1 a 2 a 3<br />

a 1 a 2 a 3<br />

+ 3a 0 a 3 · det ⎝3a 0 2a 1 a 2<br />

⎠ + 3a 0 a 2 · det ⎝ a 0 a 1 a 2<br />

⎠)<br />

0 3a 0 2a 1 3a 0 62a 1 a 2<br />

= −(−a 0 a 3 · (8a 3 1 − 6a 0 a 1 a 2 − 6a 0 a 1 a 2 ) + a 0 a 2 (a 0 a 2 2 + 4a 2 1a 2 − 3a 0 a 2 2 − 2a 2 1a 2 )<br />

+ 3a 0 a 2 (a 2 1a 2 + 3a 0 a 2 2 + 2a 0 a 1 a 3 − 3a 0 a 1 a 3 − a 0 a 2 2 − 2a 2 1a 2 ))<br />

= −(12a 2 0a 1 a 2 a 3 − 8a 0 a 3 1a 3 − 2a 2 0a 3 2 + 2a 0 a 2 1a 2 2 + 12a 0 a 3 1a 3 + 27a 3 0a 2 3 − 18a 2 0a 1 a 2 a 3<br />

− 9a 2 0a 1 a 2 a 3 − 3a 0 a 2 1a 2 2 + 6a 2 0a 3 2 − 3a 2 0a 1 a 2 a 3 )<br />

= −(4a 0 a 3 1a 3 + 27a 3 0a 2 3 + 4a 2 0a 3 2 − a 0 a 2 1a 2 2 − 18a 2 0a 1 a 2 a 3 )<br />

= a 0 a 2 1a 2 2 − 4a 2 0a 3 2 − 4a 0 a 3 1a 3 − 27a 3 0a 2 3 + 18a 2 0a 1 a 2 a 3<br />

⇒ D(f) = a 2 1a 2 2 − 4a 0 a 3 2 − 4a 3 1a 3 − 27a 2 0a 2 3 + 18a 0 a 1 a 2 a 3<br />

11


Literatur<br />

[1] Lang: Algebra (New York: Springer, 2002)<br />

[2] Wüstholz: Algebra (Wiesbaden: Vieweg, 2004)<br />

12

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!