Seminar: Galois-Theorie SS 2007 Resultanten
Seminar: Galois-Theorie SS 2007 Resultanten
Seminar: Galois-Theorie SS 2007 Resultanten
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Seminar</strong>: <strong>Galois</strong>-<strong>Theorie</strong><br />
<strong>SS</strong> <strong>2007</strong><br />
<strong>Resultanten</strong><br />
Sabrina Haase<br />
13.09.<strong>2007</strong>
Zusammenfassung<br />
Dies ist die schriftliche Ausarbeitung des <strong>Seminar</strong>vortrags, den ich am 23.05.07<br />
innerhalb des Vorlesung ”<br />
<strong>Galois</strong>-<strong>Theorie</strong>“ gehalten habe. Es werden <strong>Resultanten</strong><br />
definiert, ihre Anwendungsmöglichkeiten dargestellt und einige Eigenschaften<br />
bewiesen. Hauptsächlich wurde als Quelle das Buch ”<br />
Algebra“ von<br />
S. Lang benutzt.
Inhaltsverzeichnis<br />
1 Definition 1<br />
2 Eigenschaften 3<br />
2.1 Nullstellen der Resultante . . . . . . . . . . . . . . . . . . . . 5<br />
2.2 Resultante und Diskriminante . . . . . . . . . . . . . . . . . . 8<br />
3 Beispiele 10<br />
Literaturverzeichnis 12
1 Definition<br />
Definition 1.1 (Resultante). Sei A ein kommutativer Ring und seien v 0 , . . . , v n , w 0 , . . . , w m<br />
algebraisch unabhängig über A.<br />
Wir betrachten folgende zwei Polynome:<br />
f v (X) = v 0 X n + . . . + v n<br />
g w (X) = w 0 X m + . . . + w m<br />
Die Resultante wird nun definiert als Determinante der Sylvesterschen Matrix<br />
von f v und g w :<br />
⎛<br />
⎞<br />
v 0 v 1 · · · v n<br />
v 0 v 1 · · · v n<br />
. .. . ..<br />
v 0 · · · v n<br />
Sylv(f v , g w ) =<br />
w 0 w 1 · · · w m<br />
w 0 w 1 · · · w m<br />
. .. . ..<br />
⎜<br />
⎟<br />
⎝<br />
w 0 · · · w m<br />
⎠<br />
Die Sylvestersche Matrix ist eine (m + n) × (m + n)-Matrix. In den ersten m<br />
Zeilen stehen die Koeffizienten von f v , in jeder Zeile jeweils um eine Stelle<br />
nach rechts versetzt; analog sind die letzten n Zeilen gebildet. Alle übrigen<br />
Stellen werden mit Nullen aufgefüllt. Also können wir als Definition der Resultante<br />
notieren:<br />
R(f v , g w ) = R(v, w) = det(Sylv(f v , g w ))<br />
Beispiel 1.2. Als Beispiel wählen wir jetzt n = 2 und m = 3. Die Sylvestersche<br />
Matrix lautet dann:<br />
⎛<br />
⎞<br />
v 0 v 1 v 2 0 0<br />
0 v 0 v 1 v 2 0<br />
Sylv(f v , g w ) =<br />
⎜ 0 0 v 0 v 1 v 2<br />
⎟<br />
⎝w 0 w 1 w 2 w 3 0 ⎠<br />
0 w 0 w 1 w 2 w 3<br />
Bemerkung 1.3. Wenn wir Elemente (a) = (a 0 , . . . , a n ) und (b) = (b 0 , . . . , b m )<br />
in A für (v,w) bzw. die Koeffizienten von f v und g w einsetzen, erhalten wir<br />
Polynome f a und g b mit Koeffizienten in A, und wir definieren die Resultante<br />
als die durch Ersetzen von (a) für (v) und (b) für (w) erhaltene Determinante.<br />
1
Bemerkung 1.4. Zu beachten ist: Die spezialisierten Polynome haben nicht<br />
notwendigerweise die Grade n bzw. m, denn auch v 0 = 0 oder w 0 = 0 ist<br />
zugelassen. Bei v 0 = 0 und w 0 = 0 erhält man R(f v , g w ) = 0.<br />
Bemerkung 1.5. Die Resultante ist ein Polynom mit ganzen Koeffizienten<br />
in den Unbestimmten v i und w j ; wir dürfen also zum Beispiel A = Z wählen.<br />
Für ein beliebig gewähltes z gilt:<br />
R(zv, w) = z m R(v, w) und R(v, zw) = z n R(v, w) Dieses gilt aufgrund der<br />
Rechenregeln für Determinanten.<br />
Also gilt ebenfalls<br />
R(λf v , µg w ) = λ m µ n R(f v , g w )<br />
Bemerkung 1.6. Weiterhin sieht man anhand der Diagonalen der Sylvesterschen<br />
Matrix, dass R(v,w) das Monom v m 0 w n m mit Koeffizient 1 enthält.<br />
2
2 Eigenschaften<br />
Proposition 2.1. Wir arbeiten über Z. Dann ist f v ∈ Z[v][X], g w ∈ Z[w][X]<br />
und R(v, w) ∈ Z[v, w].Es gibt Polynome ϕ v,w und ψ v,w in Z[v, w][X], so dass<br />
sich die Resultante als Linearkombination darstellen lässt, d.h.<br />
R(f v , g w ) = ϕ v,w f v + ψ v,w g w<br />
Zu beachten ist hier, dass auf der linken Seite ein Polynom in den v, w steht<br />
und auf der rechten Seite noch zusätzlich X auftaucht.<br />
Beweis. Wir betrachten folgendes lineares Gleichungssystem<br />
X m−1 f v (X) = v 0 X n+m−1 + v 1 X n+m−2 + . . . + v n X m−1<br />
X m−2 f v (X) = v 0 X n+m−2 + . . . + v n X m−2<br />
.<br />
f v (X) =<br />
v 0 X n + . . . + v n<br />
X n−1 g w (X) = w 0 X n+m−1 + w 1 X n+m−2 + . . . + w m X n−1<br />
X n−2 g w (X) = w 0 X n+m−2 + . . . + w m X n−2<br />
.<br />
g w (X) =<br />
w 0 X m + . . . + w m<br />
Sei C der Spaltenvektor auf der linken Seite des Gleichungssystems und seien<br />
C 0 , . . . , C n+m−1 die Spaltenvektoren der Koeffizienten. Also können unsere<br />
Gleichungen geschrieben werden als<br />
C = X n+m−1 C 0 + . . . + 1 · C n+m−1<br />
Man hat Sylv(f v , g w ) = (C 0 , . . . , C n+m−1 ). Ersetzt man hier die letzte Spalte<br />
durch C, so folgt durch multilineares Rechnen:<br />
det(C 0 , . . . , C n+m−2 , C) = det(C 0 , . . . , C n+m−2 , C n+m−1 +<br />
n+m−1<br />
∑<br />
j=1<br />
= det(C 0 , . . . , C n+m−2 , C n+m−1 ) = R(v, w)<br />
X n+m−j C j−1 )<br />
Den linken Term kann man jetzt mit Hilfe der Additionsregel von Determinanten<br />
anders darstellen:<br />
3
⎛<br />
⎞<br />
. . . . X m−1 f v<br />
. . . . X m−2 f v<br />
C 0 C 1 . . . C m+n−1 .<br />
det(C 0 , . . . , C n+m−1 , C) = det<br />
. . . . f v<br />
. . . . 0<br />
⎜<br />
⎟<br />
⎝ . . . . . ⎠<br />
0<br />
⎛<br />
⎞<br />
. . . . 0<br />
. . . . 0<br />
C 0 C 1 . . . C m+n−1 .<br />
+ det<br />
. . . . 0<br />
. . . . X n−1 g w<br />
⎜<br />
⎟<br />
⎝ . . . . . ⎠<br />
g w<br />
⇒ es existieren ϕ v,w und ψ v,w in Z[v, w][X], so dass<br />
R(f v , g w ) = ϕ v,w f v + ψ v,w g w<br />
Beispiel 2.2. . Seien<br />
f v = X 2 + X + 1<br />
g w X = 5X 2 + X<br />
g w = 5X + 1<br />
⎛ ⎞ ⎛ ⎞ ⎛ ⎞<br />
1 1 1<br />
C 0 = ⎝5⎠ , C 1 = ⎝1⎠ , C 2 = ⎝0⎠<br />
0 5 1<br />
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞<br />
f v 1 1 1<br />
⇒ ⎝g w X⎠ = ⎝5⎠ X 2 + ⎝1⎠ X + ⎝0⎠<br />
g w 0 5 1<br />
4
R(f v , g w ) = det(C 0 , . . . , C n+m−1 , C)<br />
⎛ ⎞<br />
1 1 f v<br />
= det ⎝5 1 g w X⎠<br />
0 5 g w<br />
= g w + 25f v − 5g w − 5g w X<br />
= (−4 − 5X) g<br />
} {{ } w + }{{} 25<br />
ψ<br />
ϕ v,w<br />
v,w<br />
Die Resultante hat in diesem Beispiel den Wert 21.<br />
Bemerkung 2.3. Falls λ : Z[v, w] → A ein Homomorphismus in einen kommutativen<br />
Ring A ist und λ(v) = (a), λ(w) = (b), dann gilt<br />
f v<br />
ϕ a,b f a + ψ a,b g b = R(a, b) = R(f a , g b )<br />
2.1 Nullstellen der Resultante<br />
Jetzt möchte ich auf den Verwendungszweck von <strong>Resultanten</strong> näher eingehen.<br />
Proposition 2.4. Sei L ein Teilkörper eines Körpers K. Seien weiterhin f a ,<br />
g b zwei Polynome in K[X] mit gemeinsamer Nullstelle ξ ∈ L. Dann gilt<br />
R(a, b) = 0.<br />
Beweis. Dass f a und g b eine gemeinsame Nullstelle ξ haben, bedeutet gerad,<br />
dass<br />
f a (ξ) = g b (ξ) = 0.<br />
Wird in der Formel von Prop. 2.1 ξ für X eingesetzt, folgt sofort, dass<br />
R(a, b) = 0.<br />
Als nächstes soll der Zusammenhang zwischen der Resultante und den<br />
Nullstellen unserer Polynome f v und g w untersucht werden. Hierzu benötigen<br />
wir ein Lemma.<br />
Lemma 2.5. Sei h(X 1 , . . . X n ) ein Polynom in n Variablen über Z. Falls h<br />
den Wert 0 annimmt, wenn wir X 1 durch X 2 ersetzen und die anderen X i<br />
festhalten, dann wird h(X 1 , . . . , X n ) von X 1 − X 2 in Z[X 1 , . . . , X n ] geteilt.<br />
5
Beweis. Zur Vereinfachung der Schreibweise betrachten wir nur den Fall<br />
n = 2, d.h. Polynome in Z[X, Y ], die durch X − Y teilbar sind.<br />
Der durch X ↦→ X, Y ↦→ X − Y gegebene Isomorphismus<br />
α : Z[X, Y ] → Z[X, Y ] liefert, dass die α(X i Y i ) = X i (X − Y ) j eine Z-Basis<br />
von Z[X, Y ] bilden, d.h. für alle h ∈ Z[X, Y ]:<br />
h(X, Y ) = ∑ a ij X i (X − Y ) j eindeutig<br />
(mit nur endlich vielen Koeffizienten a ij ≠ 0)<br />
Also: h(X, X) = ∑ i a i0X i , so dass<br />
h(X, X) = 0 ⇔ alle a i0 = 0<br />
⇔ h(X, Y ) = ∑ i∈N a ijX i (X − Y ) j = (X − Y )( ∑ j>0 a ijX i (X − Y ) j−1 )<br />
⇒ X − Y teilt h(X, Y )<br />
Bemerkung 2.6. Seien v 0 , t 1 , . . . , t n , w 0 , u 1 , . . . , u m algebraisch unabhängig<br />
über Z und f v , g w gegeben als<br />
f v = v 0 (X − t 1 ) · · · (X − t n ) = v 0 X n + · · · + v n<br />
g w = w 0 (X − u 1 ) · · · (X − u m ) = w 0 X m + · · · + w m<br />
Die Koeffizienten berechnen sich mit<br />
n∏<br />
(X−t i ) = X n −(t 1 + . . . + t n ) X n−1 +( ∑ t<br />
} {{ }<br />
i t j ) X n−2 −. . . =<br />
i≠j<br />
s 1 (t)<br />
} {{ }<br />
s 2 (t)<br />
i=1<br />
n∑<br />
(−1) i s i (t)X n−i<br />
i=0<br />
zu v i = (−1) i v 0 s i (t) mit den elementarsymmetrischen Funktionen<br />
s 0 = 1<br />
s 1 = t 1 + . . . + t n<br />
s 2 = t 1 t 2 + t 1 t 3 + . . . + t n−1 t n<br />
.<br />
s n = t 1 · · · t n<br />
Analog findet man w j = (−1) j w 0 s j (u).<br />
Da s 1 , . . . , s n algebraisch unabhängig sind und diese auch algebraisch unabhängig<br />
von v 0 und w 0 sind, folgt:<br />
v 0 , . . . , v n , w 0 , . . . , w m algebraisch unabhängig über Z.<br />
Proposition 2.7. Mit obiger Notation gilt:<br />
R(f v , g w ) = v m 0 w n 0<br />
n∏ m∏<br />
(t i − u j )<br />
i=1 j=1<br />
6
Beweis. Sei S := v m 0 w n 0<br />
∏ n<br />
i=1<br />
∏ m<br />
j=1 (t i − u j ).<br />
Da R(v, w) homogen vom Grad m in den ersten Variablen ist und homogen<br />
vom Grad n in den zweiten Variablen, folgt, dass<br />
R = v m 0 w n 0 h(t, u)<br />
mit h(t, u) ∈ Z[t, u].<br />
Benutzt man jetzt Prop. 2.4, so verschwindet die Resultante, wenn man u j<br />
durch t i , i = 1, . . . , n, j = 1, . . . , m ersetzt.<br />
Sieht man R als Element von Z[t, u] an, so folgt mit Lemma 2.5:<br />
R ist teilbar durch jedes t i − u j<br />
Somit wird R in Z[t, u] von S geteilt, denn die t i −u j sind paarweise verschiedene<br />
Primelemente.<br />
Aus<br />
S = v m 0 w n 0<br />
n∏<br />
i=1 j=1<br />
m∏<br />
(t i − u j ) (1)<br />
erhalten wir<br />
∏<br />
g(ti ) = w n 0<br />
n∏ m∏<br />
(t i − u j )<br />
i=1 j=1<br />
⇒ S = v m 0<br />
n∏<br />
g(t i ) (2)<br />
i=1<br />
Und mit Hilfe von<br />
R(f, g) = (−1) mn R(g, f)<br />
S = (−1) mn w n 0<br />
m∏<br />
f(u j ) (3)<br />
j=1<br />
Bei (2) sieht man, dass S homogen vom Grad n in (w) ist und bei (3) sehen<br />
wir, dass S homogen ist vom Grad m in (v).<br />
Da R die gleichen Eigenschaften hat und da R teilbar durch S ist, folgt, dass<br />
R = cS für eine Zahl c.<br />
Da sowohl R und S das Monom v m 0 w n m enthalten, welches jeweils mit Koeffizient<br />
1 auftritt, folgt, dass c = 1 ist. Das gibt in der Tat R = S.<br />
Aus diesem Satz haben wir jetzt verschiedene Darstellungen für S gefunden.<br />
Diese sind eine Faktorisierung von R.<br />
7
Korollar 2.8. f a und g b seien Polynome in K[X]. Hat man a 0 b 0 ≠ 0 und<br />
zerfallen f a und g b über K vollständig in Linearfaktoren, so gilt:<br />
R(f a , g b ) = 0 ⇔ f a und g b haben eine gemeinsame Nullstelle.<br />
Beweis. “ ⇒ “ Wir nehmen an, dass R(f a , g b ) = 0 ist. Seien<br />
f a = a 0 (X − α 1 ) · · · (X − α n )<br />
g b = b 0 (X − β 1 ) · · · (X − β n )<br />
die Faktorisierungen von f a und g b , so benutzen wir den Homomorphismus<br />
Z[v 0 , t, w 0 , u] → K<br />
mit v 0 ↦→ a 0 , w 0 ↦→ b 0 , t i ↦→ α i und u j ↦→ β j . Dann ist<br />
∏ ∏<br />
0 = R(f a , g b ) = a m 0 b n 0 (α i − β j )<br />
Dieses ist aber genau Null, wenn f a und g b eine gemeinsame Nullstelle haben.<br />
“ ⇐ “ Die Aussage wurde schon in Proposition 2.4 bewiesen.<br />
2.2 Resultante und Diskriminante<br />
Jetzt folgern wie eine weitere Beziehung für die Resultante in einem<br />
Spezialfall. Sei f v wieder gegeben durch<br />
Aus (2) wissen wir:<br />
f v (X) = v 0 X n + . . . + v n = v 0 (X − t 1 ) · · · (X − t n )<br />
wobei f ′ v die Ableitung zu f v ist.<br />
Mit Hilfe der Produktregel folgt:<br />
R(f v , f ′ v) = v n−1<br />
0<br />
i<br />
j<br />
∏<br />
f ′ (t i ),<br />
i<br />
f ′ v(X) = ∑ i<br />
v 0 (X − t 1 ) · · · (X −ˆ<br />
t i ) · · · (X − t n )<br />
f v(t ′ i ) = v 0 (t i − t 1 ) · · · (t i −ˆ<br />
t i ) · · · (t i − t n ),<br />
wobei das Dach die Auslassung des betreffenden Faktors bedeutet.<br />
Die Diskriminante sei hier definiert als<br />
∏<br />
D(f v ) = D(v) = v0<br />
2n−2 (t i − t j )<br />
8<br />
i≠j
Dieses unterscheidet sich von der üblichen Definition um ein Vorzeichen:<br />
∏<br />
∏<br />
(t i − t j ) 2 = (−1) n(n−1)<br />
2 t i − t j<br />
i
3 Beispiele<br />
Beispiel 3.1.<br />
f(X) = aX 2 + bX + c<br />
Zu bestimmen ist die Diskriminante mit Hilfe der Resultante.<br />
Beispiel 3.2.<br />
f ′ (X) = 2aX + b<br />
aD(f) = −R(f, f ′ )<br />
⎛ ⎞<br />
a b c<br />
= − det ⎝2a b 0⎠<br />
0 2a b<br />
= −(ab 2 + 4a 2 c − 2ab 2 )<br />
= ab 2 − 4a 2 c<br />
⇒ D(f) = b 2 − 4ac<br />
f(X) = x 3 + bX + c<br />
Zu bestimmen ist die Diskriminante mit Hilfe der Resultante.<br />
f ′ (X) = 3X 2 + b<br />
D(f) = −R(f, f ′ )<br />
⎛<br />
⎞<br />
1 0 b c 0<br />
0 1 0 b c<br />
= − det<br />
⎜3 0 b 0 0<br />
⎟<br />
⎝0 3 0 b 0⎠<br />
0 0 3 0 b<br />
⎛ ⎞ ⎛ ⎞<br />
1 0 b c<br />
0 b c 0<br />
= −(det ⎜0 b 0 0<br />
⎟<br />
⎝3 0 b 0⎠ + 3 det ⎜1 0 b c<br />
⎟<br />
⎝3 0 b 0⎠ )<br />
0 3 0 b<br />
0 3 0 b<br />
⎛ ⎞ ⎛ ⎞<br />
⎛ ⎞ ⎛ ⎞<br />
b 0 0<br />
0 b c<br />
b c 0<br />
b c 0<br />
= −(det ⎝0 b 0⎠ + 3 det ⎝b 0 0⎠ + 3 · (− det ⎝0 b 0⎠ + 3 · det ⎝0 b c⎠))<br />
3 0 b<br />
3 0 b<br />
3 0 b<br />
3 0 b<br />
= −(b 3 + 3 · (−b 3 ) + 3 · (−b 3 ) + 3 · (b 3 + 3c 2 ))<br />
= −b 3 + 3b 3 + 3b 3 − 9b 3 − 27c 2<br />
= −4b 3 − 27c 2<br />
⇒ D(f) = −4b 3 − 27c 2 10
Beispiel 3.3.<br />
f(X) = a 0 X 3 + a 1 X 2 + a 2 X + a 3<br />
Zu bestimmen ist die Diskriminante mit Hilfe der Resultante.<br />
f ′ (X) = 3a 0 X 2 + 2a 1 X + a 2<br />
a 0 D(f) = −R(f, f ′ )<br />
⎛<br />
⎞<br />
a 0 a 1 a 2 a 3 0<br />
0 a 0 a 1 a 2 a 3<br />
= − det<br />
⎜3a 0 2a 1 a 2 0 0<br />
⎟<br />
⎝ 0 3a 0 2a 1 a 2 0 ⎠<br />
0 0 3a 0 2a 1 a 2<br />
⎛<br />
⎞ ⎛<br />
⎞<br />
a 0 a 1 a 2 a 3<br />
a 1 a 2 a 3 0<br />
= −(a 0 · det ⎜2a 1 a 2 0 0<br />
⎟<br />
⎝3a 0 2a 1 a 2<br />
⎠ + 3a 0 · det ⎜ a 0 a 1 a 2 a 3<br />
⎟<br />
⎝3a 0 2a 1 a 2 0 ⎠ )<br />
0 3a 0 2a 1 a 2 0 3a 0 2a 1 a 2<br />
⎛<br />
⎞<br />
⎛<br />
⎞<br />
2a 1 a 2 0<br />
a 0 a 1 a 2<br />
= −(−a 0 a 3 · det ⎝3a 0 2a 1 a 2<br />
⎠ + a 0 a 2 · det ⎝2a 1 a 2 0 ⎠<br />
0 3a 0 2a 1 3a 0 2a 1 a 2<br />
⎛<br />
⎞<br />
⎛<br />
⎞<br />
a 1 a 2 a 3<br />
a 1 a 2 a 3<br />
+ 3a 0 a 3 · det ⎝3a 0 2a 1 a 2<br />
⎠ + 3a 0 a 2 · det ⎝ a 0 a 1 a 2<br />
⎠)<br />
0 3a 0 2a 1 3a 0 62a 1 a 2<br />
= −(−a 0 a 3 · (8a 3 1 − 6a 0 a 1 a 2 − 6a 0 a 1 a 2 ) + a 0 a 2 (a 0 a 2 2 + 4a 2 1a 2 − 3a 0 a 2 2 − 2a 2 1a 2 )<br />
+ 3a 0 a 2 (a 2 1a 2 + 3a 0 a 2 2 + 2a 0 a 1 a 3 − 3a 0 a 1 a 3 − a 0 a 2 2 − 2a 2 1a 2 ))<br />
= −(12a 2 0a 1 a 2 a 3 − 8a 0 a 3 1a 3 − 2a 2 0a 3 2 + 2a 0 a 2 1a 2 2 + 12a 0 a 3 1a 3 + 27a 3 0a 2 3 − 18a 2 0a 1 a 2 a 3<br />
− 9a 2 0a 1 a 2 a 3 − 3a 0 a 2 1a 2 2 + 6a 2 0a 3 2 − 3a 2 0a 1 a 2 a 3 )<br />
= −(4a 0 a 3 1a 3 + 27a 3 0a 2 3 + 4a 2 0a 3 2 − a 0 a 2 1a 2 2 − 18a 2 0a 1 a 2 a 3 )<br />
= a 0 a 2 1a 2 2 − 4a 2 0a 3 2 − 4a 0 a 3 1a 3 − 27a 3 0a 2 3 + 18a 2 0a 1 a 2 a 3<br />
⇒ D(f) = a 2 1a 2 2 − 4a 0 a 3 2 − 4a 3 1a 3 − 27a 2 0a 2 3 + 18a 0 a 1 a 2 a 3<br />
11
Literatur<br />
[1] Lang: Algebra (New York: Springer, 2002)<br />
[2] Wüstholz: Algebra (Wiesbaden: Vieweg, 2004)<br />
12