pdf-file, 2.03 Mbyte - Torsten Schütze
pdf-file, 2.03 Mbyte - Torsten Schütze
pdf-file, 2.03 Mbyte - Torsten Schütze
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2.3 Separable Quadratmittelprobleme 25<br />
Nun können wir das Gauß-Newton-Modell für das reduzierte Problem (2.22) bilden:<br />
(2.27) µGP (t + s) := 1 <br />
<br />
′<br />
F(t) + F (t)s2 .<br />
2<br />
Im weiteren werden wir dieses Modell als Golub/Pereyra-Modell bezeichnen. In der Originalarbeit<br />
von Golub/Pereyra [GP73] wird anstatt mit der Pseudoinversen B + mit einer<br />
symmetrischen verallgemeinerten Inversen B − , welche nur die Bedingungen (P1), (P2) und<br />
(P3) erfüllt, gearbeitet. Diese verallgemeinerte Inverse wird über eine QR-Transformation<br />
auf Trapezform berechnet.<br />
Damit sind wir in der Lage, das Gauß-Newton-Verfahren für das reduzierte Problem<br />
(2.22) zu formulieren.<br />
Algorithmus II (Golub/Pereyra-Modell).S1: Wähle Startpunkt t (0) ∈ R l<br />
S2: For ν = 0, 1, . . . do<br />
S2.1: Konvergenztest, Falls Konvergenz goto S3;<br />
S2.2: Berechne s (ν)<br />
t<br />
:= −<br />
<br />
−<br />
S2.3: Setze t (ν+1) := t (ν) + s (ν)<br />
t<br />
S3: Setze α ∗ := B(t ∗ ) + y<br />
<br />
P ⊥ B (∂B)B+ + P ⊥ B (∂B)B+ T <br />
y<br />
Eine effiziente Implementierung dieses Verfahrens findet sich in Krogh [Kro74]. Dort wird<br />
angenommen, daß B Vollrang hat. Sowohl in den Implementierungen von Golub/Pereyra<br />
als auch in der von Krogh muß der Tensor ∂B gebildet werden, da er einmal als ∂B als<br />
auch als (∂B) T auftritt. Dies erschwert eine effiziente Implementierung erheblich. In den<br />
meisten Fällen ist noch dazu ∂B schwach besetzt. Wie in (2.24) gezeigt wurde, trägt der<br />
Term (A(t)) T y jedoch gar nicht zum Gradienten ∇f bei. Eine genaue Analyse zeigt, daß<br />
für das Modell (2.27) gilt<br />
wobei die Matrix TF gemäß<br />
u T TF v :=<br />
+<br />
P ⊥ B y<br />
<br />
F(t) + F ′ (t)s 2 = F(t) + A(t)[s]y 2 + s T TF s,<br />
<br />
(A[u]) T T <br />
y (A[v]) T <br />
y = F T (∂B[u]) B + B +T T l<br />
(∂B[v]) F ∀u, v ∈ R<br />
definiert ist. Der Beitrag des Terms (A[s]) T y zur Hesse-Matrix ∇2 f des reduzierten Funktionals<br />
ist TF , dieser ist aber von der Größenordnung O F 2<br />
. Er ist somit für kleines F<br />
kleiner als der beim Gauß-Newton-Verfahren ohnehin weggelassene Term S = F ◦ F ′′ . Entsprechend<br />
der Gauß-Newton-Philosophie wird der Term TF daher ebenfalls vernachlässigt.<br />
Dies führt auf das vereinfachte Modell<br />
(2.28)<br />
mit<br />
(2.29)<br />
µK(t + s) := 1<br />
2<br />
F(t) + JK(t)s<br />
2<br />
JK(t)s := A(t)[s]y = − I − B(t)B(t) + (∂B(t)[s]) B(t) + y.