23.12.2012 Aufrufe

pdf-file, 2.03 Mbyte - Torsten Schütze

pdf-file, 2.03 Mbyte - Torsten Schütze

pdf-file, 2.03 Mbyte - Torsten Schütze

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.3 Separable Quadratmittelprobleme 25<br />

Nun können wir das Gauß-Newton-Modell für das reduzierte Problem (2.22) bilden:<br />

(2.27) µGP (t + s) := 1 <br />

<br />

′<br />

F(t) + F (t)s2 .<br />

2<br />

Im weiteren werden wir dieses Modell als Golub/Pereyra-Modell bezeichnen. In der Originalarbeit<br />

von Golub/Pereyra [GP73] wird anstatt mit der Pseudoinversen B + mit einer<br />

symmetrischen verallgemeinerten Inversen B − , welche nur die Bedingungen (P1), (P2) und<br />

(P3) erfüllt, gearbeitet. Diese verallgemeinerte Inverse wird über eine QR-Transformation<br />

auf Trapezform berechnet.<br />

Damit sind wir in der Lage, das Gauß-Newton-Verfahren für das reduzierte Problem<br />

(2.22) zu formulieren.<br />

Algorithmus II (Golub/Pereyra-Modell).S1: Wähle Startpunkt t (0) ∈ R l<br />

S2: For ν = 0, 1, . . . do<br />

S2.1: Konvergenztest, Falls Konvergenz goto S3;<br />

S2.2: Berechne s (ν)<br />

t<br />

:= −<br />

<br />

−<br />

S2.3: Setze t (ν+1) := t (ν) + s (ν)<br />

t<br />

S3: Setze α ∗ := B(t ∗ ) + y<br />

<br />

P ⊥ B (∂B)B+ + P ⊥ B (∂B)B+ T <br />

y<br />

Eine effiziente Implementierung dieses Verfahrens findet sich in Krogh [Kro74]. Dort wird<br />

angenommen, daß B Vollrang hat. Sowohl in den Implementierungen von Golub/Pereyra<br />

als auch in der von Krogh muß der Tensor ∂B gebildet werden, da er einmal als ∂B als<br />

auch als (∂B) T auftritt. Dies erschwert eine effiziente Implementierung erheblich. In den<br />

meisten Fällen ist noch dazu ∂B schwach besetzt. Wie in (2.24) gezeigt wurde, trägt der<br />

Term (A(t)) T y jedoch gar nicht zum Gradienten ∇f bei. Eine genaue Analyse zeigt, daß<br />

für das Modell (2.27) gilt<br />

wobei die Matrix TF gemäß<br />

u T TF v :=<br />

+<br />

P ⊥ B y<br />

<br />

F(t) + F ′ (t)s 2 = F(t) + A(t)[s]y 2 + s T TF s,<br />

<br />

(A[u]) T T <br />

y (A[v]) T <br />

y = F T (∂B[u]) B + B +T T l<br />

(∂B[v]) F ∀u, v ∈ R<br />

definiert ist. Der Beitrag des Terms (A[s]) T y zur Hesse-Matrix ∇2 f des reduzierten Funktionals<br />

ist TF , dieser ist aber von der Größenordnung O F 2<br />

. Er ist somit für kleines F<br />

kleiner als der beim Gauß-Newton-Verfahren ohnehin weggelassene Term S = F ◦ F ′′ . Entsprechend<br />

der Gauß-Newton-Philosophie wird der Term TF daher ebenfalls vernachlässigt.<br />

Dies führt auf das vereinfachte Modell<br />

(2.28)<br />

mit<br />

(2.29)<br />

µK(t + s) := 1<br />

2<br />

F(t) + JK(t)s<br />

2<br />

JK(t)s := A(t)[s]y = − I − B(t)B(t) + (∂B(t)[s]) B(t) + y.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!