Fachbereich Mathematik - GSI

Technische Universität Darmstadt 

- Fachbereich Mathematik - 

GSI 

Helmholtzzentrum für Schwerionenforschung 

- Abteilung Biophysik - 

Master-Thesis 

Theorie und Numerik zur nichtlinearen 

Dosisoptimierung in der Schwerionentherapie 

Angefertigt von 

Michael Horcicka 

Referent: Prof. Dr. Christian Meyer 

Korreferent: Prof. Dr. Stefan Ulbrich 

Darmstadt 2011

Diese Arbeit wurde mit dem Textsatzsystem L ATEX erstellt.

Abstract 

In the GSI therapy pilot project from 1997 until 2008 about 450 cancer patients 

were successfully treated with carbon ions. Because of the promising healing rates 

the clinical radiotherapy facility HIT was opened in 2009. However, research for the 

heavy-ion therapy is still in progress at GSI. 

For the treatment planning the software TRiP is used. An essential part of the 

treatment planning ist the dose optimization. The aim of the dose optimization is 

to achieve a homogeneous target dose distribution as close as possible to the prescribed 

dose distribution by an appropriate sparing of healthy tissue and critical 

structures like the brainstem. These requirements can be mathematically expressed 

by an optimization problem, where the free optimization parameters are the particle 

numbers for the rasterspots. If biological effects are taken into account, the optimization 

problem leads to a nonlinear, finite dimensional and restricted minimization 

problem. A theoretical examination and a solution of the optimization problem is 

the core area of this master-thesis. 

By utilizing a special variant of the Weierstraß extreme value theorem, which 

requires the lower semi-continuity and radial unboundness of the objective function, 

the existence of a global minimum of the optimization problem can be proofed. Due 

to the nonconvexity of the objective funtion the uniqueness of a global minimum 

can not be proofed straightforward because standard techniques for such proofs can 

not be applied. A numerical approach, which indicates, that the minimum of the 

objective function is unique, is discussed. Furthermore, the objective function is 

approximated with an appropriate smooth function. This is necessary to derive the 

Karush-Kuhn-Tucker-conditions for the optimization problem. 

Due to the nonlinearity of the objective function the optimization problem can 

only be solved with numerical methods. For this purpose the Linesearch-Techniques 

method of steepest descent, conjugated gradients and the inverse BFGS-method were 

implemented and examined. Several variants of these numerical solvers are presented 

in this work. The convergence results show, that the Fletcher-Reeves variant of 

the conjugated gradient method has the best numerical properties. The results of 

the inverse BFGS-method are similar concerning the iteration steps but require by 

a factor of 1.5 more computation time. The method of steepest descent is slow 

concerning the iteration steps and computation time. 

The convergence results show, that currently the Fletcher-Reeves variant of the 

conjugated gradient method is the best algorithm for the optimization step in the 

treatment planning procedure. With this method complete patient plans can be 

optimized in an acceptable computation time. Furthermore, this method doesn’t 

require much memory space and is robust. 

3

Inhaltsverzeichnis 

Abbildungsverzeichnis 7 

Abkürzungsverzeichnis 8 

1 Einleitung 10 

1.1 Die Krankheit Krebs . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 

1.2 Strahlentherapie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 

1.3 Physikalische Grundlagen ionisierender Strahlung . . . . . . . . . . . 12 

1.4 Strahlenbiologische Grundlagen . . . . . . . . . . . . . . . . . . . . . 15 

1.5 Das Kohlenstoff-Therapieprojekt der GSI . . . . . . . . . . . . . . . . 17 

1.5.1 Technik der Therapie . . . . . . . . . . . . . . . . . . . . . . . 18 

1.5.2 Ablauf der Therapie . . . . . . . . . . . . . . . . . . . . . . . 20 

2 Optimierung der Dosis in der Schwerionentherapie 22 

2.1 Bestrahlungsplanung mit TRiP . . . . . . . . . . . . . . . . . . . . . 22 

2.2 Berechnung der Dosis . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 

2.2.1 Berechnung der physikalischen Dosis . . . . . . . . . . . . . . 25 

2.2.2 Berechnung der RBW-gewichteten Dosis . . . . . . . . . . . . 27 

2.3 Mathematische Formulierung der Optimierung . . . . . . . . . . . . . 29 

2.3.1 Physikalische und technische Betrachtung . . . . . . . . . . . 31 

2.3.2 Mathematische Betrachtung . . . . . . . . . . . . . . . . . . . 32 

2.4 Experimentelle Verifikation . . . . . . . . . . . . . . . . . . . . . . . . 34 

3 Theoretische Betrachtung des Optimierungsproblems 36 

3.1 Stetigkeits- und Differenzierbarkeitseigenschaften der Zielfunktion . . 36 

3.2 Existenz und Eindeutigkeit eines Minimums . . . . . . . . . . . . . . 38 

3.2.1 Existenz eines Minimums . . . . . . . . . . . . . . . . . . . . . 38 

3.2.1.1 Unterhalbstetigkeit der Zielfunktion . . . . . . . . . 38 

3.2.1.2 Radiale Unbeschränktheit der Zielfunktion . . . . . . 40 

3.2.1.3 Anwendung auf den Extremwertsatz von Weierstraß 42 

3.2.2 Eindeutigkeit eines Minimums . . . . . . . . . . . . . . . . . . 42 

3.3 Glättung der Zielfunktion . . . . . . . . . . . . . . . . . . . . . . . . 43 

3.4 Karush-Kuhn-Tucker-Bedingungen . . . . . . . . . . . . . . . . . . . 45 

4 Nichtlineare Optimierung 49 

4.1 Numerische Minimierung mit Linesearch-Verfahren . . . . . . . . . . 49 

4.2 Schrittweitenstrategien . . . . . . . . . . . . . . . . . . . . . . . . . . 52 

4


4.2.1 Schrittweitenbestimmung über Dämpfung der Physik-Schrittweite 

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 

4.2.2 Die Schrittweitenregel von Armijo . . . . . . . . . . . . . . . . 53 

4.3 Voroptimierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 

4.4 Ressourcen, Daten und Bemerkungen zur Optimierung . . . . . . . . 55 

4.4.1 Verwendete Rechnerarchitektur . . . . . . . . . . . . . . . . . 55 

4.4.2 Verwendeter Patientenplan . . . . . . . . . . . . . . . . . . . . 55 

4.4.3 Bewertung der Algorithmen . . . . . . . . . . . . . . . . . . . 56 

4.4.4 Bemerkungen und Details zur Implementierung . . . . . . . . 56 

5 Gradientenverfahren und konjugiertes Gradientenverfahren 58 

5.1 Das Gradientenverfahren . . . . . . . . . . . . . . . . . . . . . . . . . 58 

5.2 Das konjugierte Gradientenverfahren . . . . . . . . . . . . . . . . . . 59 

5.3 Konvergenzergebnisse und Diskussion . . . . . . . . . . . . . . . . . . 60 

6 BFGS-Verfahren 63 

6.1 Das Newton-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . 63 

6.2 Quasi-Newton-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . 66 

6.3 Das BFGS-Update . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 

6.4 Das inverse BFGS-Verfahren mit Armijo-Schrittweite und Winkeltest 69 

6.5 Konvergenzergebnisse und Diskussion . . . . . . . . . . . . . . . . . . 71 

6.6 Weitere implementierte und ausgewertete Varianten des inversen BFGS- 

Verfahrens und zusätzliche Bemerkungen . . . . . . . . . . . . . . . . 74 

7 Zusammenfassung und Ausblick 77 

7.1 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 

7.2 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 

8 Anhang 81 

8.1 Beschleunigeranlage der GSI . . . . . . . . . . . . . . . . . . . . . . . 81 

8.2 Gradient und Hesse-Matrix der Dosis . . . . . . . . . . . . . . . . . . 82 

8.2.1 Gradient und Hesse-Matrix der physikalischen Dosis . . . . . . 82 

8.2.2 Gradient und Hesse-Matrix der RBW-gewichteten Dosis . . . 82 

8.2.3 Gradient und Hesse-Matrix des analytischen Ausdrucks für die 

RBW-gewichtete Dosis . . . . . . . . . . . . . . . . . . . . . . 83 

8.3 Gradient und Hesse-Matrix der Zielfunktion . . . . . . . . . . . . . . 83 

8.3.1 Gradient und Hesse-Matrix bei Optimierung der physikalischen 

Dosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 

8.3.2 Gradient und Hesse-Matrix bei Optimierung der RBW-gewichteten 

Dosis . . . . . . . . . . . . . . . . . . . . . . . . . . 84 

8.3.3 Gradient und Hesse-Matrix bei Optimierung mit dem analytischen 

Ausdruck für die RBW-gewichtete Dosis . . . . . . . . 85 

8.4 Der Extremwertsatz von Weierstraß . . . . . . . . . . . . . . . . . . . 85 

8.5 Unterhalbstetigkeit einer Funktion . . . . . . . . . . . . . . . . . . . . 86 

5


8.6 Radiale Unbeschränktheit einer Funktion . . . . . . . . . . . . . . . . 88 

8.7 Erweiterungen des Extremwertsatzes von Weierstraß . . . . . . . . . . 88 

8.8 Eindeutigkeit eines Minimums . . . . . . . . . . . . . . . . . . . . . . 89 

8.9 Exakte Schrittweitenbestimmung bei Optimierung der physikalischen 

Dosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 

Literaturverzeichnis 92 

6

Abbildungsverzeichnis 

1.1 Überlagerung von Bestrahlungsfeldern bei der Photonentherapie . . . 11 

1.2 Dosisverteilung bei IMRT und Kohlenstofftherapie im Schädelinneren 12 

1.3 Tiefendosisprofil für Photonen, Protonen und 12 C in Wasser . . . . . 13 

1.4 Laterales Streuverhalten von Photonen-, Protonen- und 12 C-Strahlen 

in Wasser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

1.5 Überlebenskurven von Zellen nach Röntgen- und Kohlenstoffbestrahlung 

mit verschiedenen RBW-Werten . . . . . . . . . . . . . . . . . . 15 

1.6 Vergleich der simulierten Bahnspuren von 12 C-Ionen und Röntgen mit 

der schematischen Darstellung einer DNA-Doppelhelix . . . . . . . . 16 

1.7 Illustration des Rasterscan-Verfahrens . . . . . . . . . . . . . . . . . . 17 

1.8 Darstellung einer ausgedehnten Bragg-Peak Zone im Tumorbereich . 18 

1.9 Schematische Darstellung der PET-Analyse . . . . . . . . . . . . . . 19 

1.10 Fixierter Patient im Therapieraum der GSI . . . . . . . . . . . . . . . 21 

1.11 Thermoplastische Maske zur Fixierung des Kopfes des Patientens . . 21 

2.1 CT-Scheibe des Patientenplanes #135 mit eingezeichnetem Target 

und Hirnstamm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 

2.2 Modellhafte Darstellung eines Zielvolumens mit Isoenergieschichten 

und den dazugehörigen Rasterpunkten . . . . . . . . . . . . . . . . . 24 

2.3 Vergleich zweier optimierter Dosisverteilungen in einer CT-Scheibe . . 25 

2.4 Modellrechnung der physikalischen und RBW-gewichteten Dosis mit 

korrespondierenden Überlebensraten aus Zellexperimenten . . . . . . 27 

2.5 Foto des präparierten Biophantoms vor der Bestrahlung . . . . . . . . 34 

2.6 Vergleich von gemessenem Zellüberleben und berechnetem Zellüberleben 

mit TRiP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 

3.1 Graphische Veranschaulichung der Heaviside-Funktion . . . . . . . . . 39 

3.2 Graphische Veranschaulichung der Glättung der Heaviside-Funktion . 44 

4.1 "Ideale" Skalierungswerte für die Physik-Schrittweite . . . . . . . . . 53 

5.1 Minimierung mit dem GRV und KGV als Funktion der Iterationen . 62 

5.2 Minimierung mit dem GRV und KGV als Funktion der Rechenzeit . . 62 

6.1 Minimierung mit BFGS und KGV als Funktion der Iterationen . . . . 73 

6.2 Minimierung mit BFGS und KGV als Funktion der Rechenzeit . . . . 73 

8.1 Beispiel einer unstetigen Funktion, die unterhalbstetig ist . . . . . . . 88 

7

Abkürzungsverzeichnis 

12C Atomkern des Kohlenstoffes mit 6 Protonen und 6 Neutronen 

16O Atomkern des Sauerstoffes mit 8 Protonen und 8 Neutronen 

BED Biologisch effektive Dosis 

BFGS BFGS-Verfahren: Optimierungsalgorithmus benannt nach seinen Entwicklern 

Broyden, Fletcher, Goldfarb und Shanno 

CT Computertomographie, Computertomogramm 

DKFZ Deutsches Krebsforschungszentrum 

EFO Einzelfeldoptimierung 

Feld Bestrahlungsfeld (bestrahlter Bereich aus einer Einstrahlrichtung) 

GRV Gradientenverfahren 

GSI GSI Helmholtzzentrum für Schwerionenforschung GmbH 

Gy SI-Einheit Gray[ J 

GyE 

] (Energiedosis verursacht durch Strahlung) 

kg 

Gray-Equivalent (Einheit der biologisch effektiven Dosis) 

Gy (RBW) Einheit der RBW-gewichteten Dosis 

HIT Heidelberger Ionenstrahl-Therapiezentrum 

IES Isoenergieschicht 

IMRT Intensitätsmodulierte Photonentherapie 

KGV Konjugiertes Gradientenverfahren 

KKT Karush-Kuhn-Tucker (meist KKT-Punkt, -Bedingungen oder -Theorie) 

LEM Local-Effect-Model (Biophysikalisches Modell zur RBW-Bestimmung) 

LET Linearer Energietransfer 

MFO Mehrfelderoptimierung 

min f Minimiere die Funktion f 

NDF Anzahl der Freiheitsgrade 

NV Newton-Verfahren 

OAR Organ-At-Risk (Risikoorgan) 

PET Positronen-Emissions-Tomographie 

RBW Relative biologische Wirksamkeit 

Target Zielvolumen bei der Bestrahlungsplanung 

TRiP Treatment Planning for Particles (Bestrahlungsplanungssoftware) 

u. d. N. unter der Nebenbedingung 

VOI Volume of Interest 

Voxel Volumenpixel in einer CT 

8

1 Einleitung 

1.1 Die Krankheit Krebs 

Jährlich wird die Anzahl der neudiagnostizierten Krebserkrankungen weltweit auf 

über 12 Millionen geschätzt. In einem Jahr sterben ca. 7.6 Millionen Menschen an 

den Folgen einer Krebserkrankung, davon ca. fünf Millionen in den Entwicklungsländern. 

Damit ist Krebs, nach den Herz-Kreislauferkrankungen, die zweithäufigste 

Todesursache. Experten schätzen, dass in den folgenden Jahren, auch bedingt durch 

den demografischen Wandel, die Zahl der Krebserkrankungen deutlich steigen wird. 

[Wik11] 

Unter dem Krankeitsbild Krebs versteht man eine bösartige Gewebeneubildung 

(Tumor) im menschlichen Körper. Krebszellen wachsen und teilen sich unkontrolliert, 

was zu einer Verdrängung oder Zerstörung des umliegenden Gewebes führen 

kann. Dabei handelt es sich immer um eine Störung vom genetisch geregelten Zellwachstum 

und Apoptose (selbstprogrammierter Zelltod). Krebs hat eine Vielzahl 

von Ursachen, prinzipiell können alle menschlichen Organe befallen sein. 

Eine Krebstherapie richtet sich nach Tumorart, Tumorgröße, Lokalisation des 

Tumors und dem Allgemeinzustand des Patienten. Als Therapieformen werden in 

der Regel Chemotherapie, operative Entfernung des Tumors und Strahlentherapie 

angewendet. Häufig werden diese drei Therapieformen miteinander kombiniert. 

Im Therapieprojekt des GSI Helmholtzzentrums für Schwerionenforschung GmbH 

(GSI) [Kra08] wurden in den meisten Fällen Gehirntumore behandelt. Bei diesem 

Pilotprojekt handelte es sich um eine neue Form der Strahlentherapie mit Teilchenstrahlung. 

Details zu dieser speziellen Methode werden im letzten Abschnitt dieses 

Kapitels beschrieben. Im nächsten Abschnitt werden die Grundlagen der Strahlentherapie, 

in Anwendung auf Kopf- und Nackentumore, näher dargestellt. Anschließend 

werden die physikalischen und biologischen Eigenschaften von Strahlung 

erläutert. 

1.2 Strahlentherapie 

Zur Strahlentherapie gehören zum Beispiel die Photonentherapie, Teilchentherapie 

oder Brachytherapie [D + 06]. Etwa jede zweite Tumorerkrankung wird mit einer 

Strahlentherapie behandelt. Das Ziel der Strahlentherapie ist den Tumor mit einer 

Dosis zu bestrahlen, die die Reparaturfähigkeit der Tumorzellen überschreitet 

[HB97]. Dabei soll das umliegende Normalgewebe bestmöglich geschont werden. Vor- 

10

1.2 Strahlentherapie 

Abbildung 1.1: Überlagerung von Bestrahlungsfeldern bei der Photonentherapie. Um mit einem 

Bestrahlungsfeld die vorgeschriebene Dosis (Anteil in Prozent) im Tumor (roter Bereich) zu deponieren, 

müsste im Eingangsbereich eine höhere Dosis erzeugt werden (linke Seite). Schon bei der 

Hinzunahme eines zweiten Feldes kann dieser nachteilige Effekt halbiert werden (rechte Seite). 

aussetzung für eine erfolgreiche Strahlentherapie ist ein Bestrahlungsplan, der für 

jeden Patienten individuell erstellt wird. Bei einer Bestrahlungsplanung werden in 

der Regel auf Basis einer dreidimensionalen Computertomographie (CT) die notwendigen 

Bestrahlungsparameter festgelegt. Die Gesamtdosis für den Tumor wird meistens 

auf tägliche Einzeldosen verteilt (Fraktionierung). Dabei wird die schlechtere 

Reparaturfähigkeit von Tumorzellen ausgenutzt. Eine gesamte Bestrahlungstherapie 

kann bis zu 30 Fraktionen betragen. 

Die konventionelle Form der Strahlentherapie ist die Photonentherapie. Photonen 

besitzen die Eigenschaft, dass wenige Millimeter nach dem Eintreten in Gewebe die 

Dosisdeposition ihr Maximum erreicht und anschließend exponentiell abfällt [KP88]. 

Um bei der Tumorbestrahlung das umliegende Normalgewebe zu schonen, werden 

in tiefsitzenden Tumoren mehrere (6-12) Einstrahlrichtungen (sog. Bestrahlungsfelder) 

überlagert. In Abbildung 1.1 wird dies Anhand von zwei Bestrahlungsfeldern 

demonstriert. Die fortgeschrittenste Methode der Photonentherapie ist die Intensitätsmodulierte 

Photonentherapie (IMRT) [Gro01]. Hier wird mit speziell geformten 

Kompensatoren im Strahlweg gearbeitet, wodurch eine bessere Dosiskonformität im 

Zielvolumen erreicht werden kann. 

Bei der Teilchentherapie [DL10] (auch Partikeltherapie genannt) werden Protonen 

und Schwerionen 1 verwendet. Bei der Schwerionentherapie [SESE10] zeigten 

besonders 12 C-Ionen ideale Eigenschaften [Kra00]. Gegenwärtig wird Forschung betrieben, 

ob sich auch andere Teilchensorten, wie z.B. Helium-, Lithium- oder Sauerstoffionen, 

für die Teilchentherapie eignen. Teilchenstrahlen besitzen ein vorteilhaftes 

Tiefendosisprofil gegenüber Photonenstrahlen [Wil46]. Der Teilchenstrahl entfaltet 

erst am Ende seiner Reichweite ein scharfes Dosis-Maximum, während im Eingangskanal 

eine geringe Dosis appliziert wird. Dieses Phänomen wird als das Inverse 

Dosisprofil bezeichnet. Dadurch kann das Gewebe vor und nach dem Tumor überwiegend 

geschont werden. Desweiteren besitzen Teilchenstrahlen beim Eindringen 

in lebendes Gewebe eine höhere biologische Wirksamkeit gegenüber Photonen (ge- 

1 In der Strahlentherapie werden alle Ionen mit einer größeren Ordnungszahl als Wasserstoff als 

schwere Ionen bezeichnet. 

11

1 Einleitung 

Abbildung 1.2: Dosisverteilung erzeugt durch Kohlenstofftherapie mit zwei Bestrahlungsfeldern 

(rechts) und IMRT mit sieben Feldern (links). Die Farbskalierung reicht von rot, entsprechend 

100% der vorgeschriebenen Zieldosis, bis zu blau mit 10%. Mit beiden Methoden kann eine gute 

Dosisapplikation im Tumorbereich (weiße Kontur) erzielt werden. Die Dosisbelastung des gesunden 

Gewebes ist bei der Therapie mit Teilchen wesentlich geringer als bei Photonen. 

naueres in Abschnitt 1.4) [KKWS03]. In der Regel reichen bei der Teilchenstrahlung 

2-3 Bestrahlungsfelder aus, um die Dosis im Tumorvolumen zu verteilen. Einen Vergleich 

zwischen der Dosisverteilung bei IMRT und Kohlenstofftherapie zeigt Abbildung 

1.2. Damit die Teilchen genug Energie besitzen, um tiefer in Gewebe eindringen 

zu können, müssen sie in Teilchenbeschleunigern (Zyklotron, Synchrotron) auf hohe 

Geschwindigkeit gebracht werden. Dies ist ein Nachteil der Teilchentherapie, denn 

solche Beschleunigeranlagen stellen hohe technische und finanzielle Anforderungen. 

Hingegen werden bei der Photonentherapie lediglich Elektronen-Linearbeschleuniger 

benötigt. 

1.3 Physikalische Grundlagen ionisierender 

Strahlung 

Ionisierende Strahlung setzt beim Eintreten in Materie Elektronen aus den Atomhüllen 

frei (sog. Ionisation), so dass positiv geladene Ionen zurückbleiben. Ionisierende 

Strahlung wird in Teilchenstrahlung und elektromagnetische Strahlung unterteilt, 

wobei letztere auch Photonenstrahlung genannt wird. Messgröße für die applizierte 

Energiedosis D ist die SI-Einheit Gray (Gy), welche die absorbierte Energie E pro 

Masse m beschreibt: 

D[Gy] = dE 

dm 

= 1 

ρ 

dE 

dV 

, 1Gy = 1 J 

kg 

. (1.1) 

Hier ist ρ die Dichte und V das Volumen des bestrahlten Materials. Die Dosis, die aus 

Gleichung (1.1) resultiert, wird als physikalische oder absorbierte Dosis bezeichnet. 

12

1.3 Physikalische Grundlagen ionisierender Strahlung 

Abbildung 1.3: Tiefendosisprofil für Photonen, Protonen und 12 C in Wasser. Bei Photonen ist 

nach einem anfänglichen Anstieg ein exponentieller Abfall zu beobachten. Teilchenstrahlen deponieren 

am Anfang wenig Dosis und am Ende ihrer Reichweite das Dosismaximum (Bragg-Peak), 

welches bei 12 C noch ausgeprägter ist als bei Protonen. Die Lage des Bragg-Peaks kann durch die 

Anfangsenergie der Strahlen kontrolliert werden. Durch Projektilfragmente entsteht bei 12 C hinter 

dem Bragg-Peak noch ein kleiner Dosisanteil. 

Photonen, die auf Materie treffen, lösen unterschiedliche Prozesse aus, welche von 

der Energie der Photonen abhängen. Die fundamentalsten sind der Photoeffekt, der 

Compton-Effekt und die Paarbildung [GM06]. Die dabei entstehende Schwächung 

der Strahlungsintensität I ist durch das Beersche Absorptionsgesetz gegeben: 

I(x) = I0 · e −µx , (1.2) 

mit der Anfangsintensität I0, der Eindringtiefe x und Materialabsorptionskonstante 

µ. Die Tiefendosiskurve für Photonenstrahlung (siehe Abbildung 1.3) zeigt einen 

Anstieg im Bereich der ersten Zentimeter und erst anschließend einen exponentiellen 

Abfall. Der anfängliche Anstieg kann mit dem Aufbaueffekt erklärt werden, bei dem 

Sekundärelektronen vorwiegend in Vorwärtsrichtung emittiert werden, bis sich ein 

Gleichgewicht zwischen Energiedeposition und Produktion weiterer Sekundärelektronen 

einstellt. 

Teilchenstrahlen interagieren mit dem Targetmaterial hauptsächlich durch inelastische 

Kollisionen mit den Hüllenelektronen. Dabei erleiden die durchgehenden 

13

1 Einleitung 

Strahlaufweitung [mm] 

Photonen (21MV) 

12 C (270MeV/u) 

Protonen (148MeV/u) 

Eindringtiefe in Wasser [mm] 

Abbildung 1.4: Laterales Streuverhalten von Photonen-, Protonen- und 12 C-Strahlen in Wasser. 

Photonenstrahlen besitzen anfangs die größte Aufweitung, welche jedoch bei weiterem Eindringen 

wenig ansteigt. Protonen streuen bis zum dreifachen stärker als 12 C-Ionen. Abbildung aus [Web96]. 

Teilchen pro Weglängeneinheit dx einen Energieverlust, der von der Bethe-Bloch- 

Formel [Bet30, Blo33] beschrieben wird: 

− dE 

dx = 4π e4z2 eff 

mev 

2 nZ 

 

2mev 

ln 

2 

+ relativistische Korrekturen , (1.3) 

I 

wobei e die Elementarladung des Elektrons und me seine Ruhemasse, v die Teilchengeschwindigkeit, 

zeff die effektive Projektilladung, n die Dichte der Targetatome, Z 

die Atomnummer und I das Targetionisationspotential darstellen. Der Energieverlust 

ist bei hohen Geschwindigkeiten gering und steigt mit Geschwindigkeitsabnahme 

kontinuierlich an. Kurz bevor die Teilchen zum Ende ihrer Reichweite gelangen, 

kommt es zu einem starken Anstieg des Energieverlustes. Dabei erreicht die deponierte 

Dosis ein scharfes Maximum (Bragg-Peak) und fällt unmittelbar danach steil 

ab. Der Verlauf der Tiefendosisprofile wird von den Bragg-Kurven beschrieben. Die 

zugehörigen Bragg-Kurven für 12C-Strahlen und Protonenstrahlen sind in Abbildung 

1.3 zu sehen. Bei Schwerionen kommt es, im Gegensatz zu Protonen, zur Projektil- 

Fragmentation. Diese verursacht hinter dem Bragg-Peak den Fragmentschwanz. 

Häufig wird die Wirkung von Strahlung auf biologisches Gewebe mit dem linearen 

Energietransfer (LET) angegeben. Dieser beschreibt, wie viel Energie ein 

durchquerendes Teilchen pro Längeneinheit an das Material abgibt. Der LET wird 

in Kiloelektronenvolt pro Mikrometer gemessen und ist mit der Dosis verbunden 

über: 

D[Gy] = 1.6 · 10 −9 · dE 

 

keV 

 

g 

· ρ 

dx µm cm 

 

LET 

3 

−1 · F cm −2 , (1.4) 

mit der Materialdichte ρ und Teilchenfluenz F . 

14

1.4 Strahlenbiologische Grundlagen 

250 kV 

Abbildung 1.5: Überlebenskurven von Zellen nach der Bestrahlung mit Röntgenstrahlen bzw. 

Kohlenstoffionen in Abhängigkeit der Dosis. RBW-Werte sind für verschiedene prozentuale Überlebensanteile 

angegeben. Um ein Überleben von 10% zu erreichen muss hier mit Röntgenstrahlen, 

im Vergleich zu Kohlenstoffstrahlen, eine 4.2-fache physikalische Dosis appliziert werden. Bei steigender 

Dosis fällt die RBW. [Mit freundlicher Genehmigung Dr. W. Kraft-Weyrather]. 

Das grundsätzlich unterschiedliche Tiefendosisprofil von Teilchenstrahlung gegenüber 

Photonenstrahlung ist für die Strahlentherapie von großer Bedeutung. Besonders 

der scharfe Bragg-Peak bei 12 C erlaubt eine konzentrierte Dosisapplikation im 

Tumor. Ein weiterer physikalischer Effekt, der in der Strahlentherapie berücksichtigt 

werden muss, ist die laterale Aufweitung des Strahlenbündels beim Eintreten 

in Materie (siehe Abb. 1.4). Die geringe Aufweitung des 12 C-Strahlenbündels ist ein 

weiterer Vorteil der Kohlenstofftherapie. 

1.4 Strahlenbiologische Grundlagen 

Beim Eintritt ionisierender Strahlung in biologisches Gewebe kommt es im mikroskopischen 

Bereich zur Schädigung der DNA (Desoxyribonukleinsäure). Die im Zellkern 

liegende DNA kann dabei so stark geschädigt werden, dass die zahlreichen Reparaturprozesse 

der Zelle nicht mehr greifen können und es kommt zur Apoptose (programmierter 

Zelltod) [A + 99]. Besonders eine hohe Anzahl an Doppelstrangbrüchen, 

in der DNA-Doppelhelix, führt zur Zellinaktivierung. 

Die Strahlenwirkung auf zelluläres Gewebe wird anhand von Überlebenskurven 

gemessen. Diese beschreiben die Wahrscheinlichkeit des Zellenüberlebens S als Funktion 

der absorbierten Dosis D. Messungen haben das folgende "linear-quadratische" 

Modell motiviert [Hal94]: 

S(D) = e −(αD+βD2 ) , α ≥ 0 , β ≥ 0 , (1.5) 

15

1 Einleitung 

z [nm] 

12 C-Ionen Röntgen 

x [nm] 

z [nm] 

x [nm] 

Abbildung 1.6: Vergleich der simulierten Bahnspuren von 12 C-Ionen und Röntgen mit der schematischen 

Darstellung einer DNA-Doppelhelix. Die farbigen Linien repräsentieren die Spuren der 

emittierten Sekundärelektronen. Die höhere Ionisationsdichte kann bei der Teilchenstrahlung deutlich 

beobachtet werden. Der dabei entstehende DNA-Schaden ist schwierig zu reparieren. Die geringe 

Ionisationsdichte von der Röntgenstrahlung verursacht meist reparable Einzelstrangbrüche. 

wobei die Konstanten α und β von der bestrahlten Zelllinie abhängen. Ein großes 

α-Verhältnis 

steht für ein geringes Reparaturvermögen der Zelllinie, während ein 

β 

kleines α-Verhältnis 

ein hohes Reparaturvermögen bedeutet. 

β 

Die gleiche absorbierte Dosis kann bei verschiedenen Strahlarten unterschiedliche 

biologische Effekte auslösen. Ein Maß dafür ist die relative biologische Wirksamkeit 

(RBW). Die RBW ist definiert als das Verhältnis der Dosis einer Bezugsstrahlung 

zu der Dosis einer zu vergleichenden Strahlung, wobei mit beiden Dosen die gleiche 

biologische Wirkung erreicht wird: 

RBW = 

DBezugsstrahlung 

Dzu vergleichende Strahlung 

 

 

 

Isoeffekt 

. (1.6) 

Verschiedene RBW-Werte von 12 C-Ionen, mit Röntgen als Bezugsstrahlung, können 

aus den entsprechenden Überlebenskurven in Abbildung 1.5 entnommen werden. 

Dabei ist stets eine RBW von > 1 zu beobachten. D.h., dass Kohlenstoff, bei gleicher 

physikalischer Dosis, eine höhere biologische Wirkung als Photonen besitzt. Dies 

kann unter anderem dadurch erklärt werden, dass die Bahnstruktur von Teilchenstrahlen 

eine höhere Ionisationsdichte aufweist, was zahlreiche Doppelstrangbrüche 

induziert (siehe Abb. 1.6) [KK94]. 

Wegen der höheren biologischen Wirksamkeit können Tumorzellen mit 12 C-Ionen 

effizienter inaktiviert werden als mit Photonen oder Protonen. Dies ist ein weiterer 

Vorteil der Kohlenstofftherapie [WK09]. Da die RBW von vielen Eingangsparametern 

abhängt, wie z.B. Art der Strahlung, bestrahlter Gewebetyp, Dosis und Energie, 

ist die Berechnung sehr komplex. Dafür wurde an der GSI das Local-Effect-Model 

(LEM) entwickelt, mit dem die relevanten RBW-Werte bestimmt werden können. 

Auf das LEM wird in dieser Arbeit nicht näher eingegangen. Details befinden sich, 

neben zahlreichen anderen Veröffentlichungen, in [Sch03, EKS08, Gem09]. 

16

1.5 Das Kohlenstoff-Therapieprojekt der GSI 

Abbildung 1.7: Illustration des Rasterscan-Verfahrens. Der Teilchenstrahl wird von den Dipolmagneten 

vertikal und horizontal abgelenkt. Das Monitorsystem misst die Position und die Anzahl der 

durchquerenden Teilchen. Informationen aus einem ständigen Soll-Ist-Vergleich werden an die Magnete 

rückgekoppelt. Durch Energiemodulation des Beschleunigers werden die IESen des Tumors, 

beginnend mit der hintersten, mit Bragg-Peaks angesteuert. In einer IES erhält ein bestimmter Rasterpunkt 

(rot) Teilchenbeiträge von anderen Rasterpunkten. Dies wird bei dem Soll-Ist-Vergleich 

der Teilchenzahlen vollständig beachtet. 


Das Pilotprojekt der GSI entstand in enger Kooperation mit dem Forschungszentrum 

Rossendorf, dem Deutschen Krebsforschungszentrum (DKFZ) und dem Universitätsklinikum 

Heidelberg. Dabei handelte es sich um die weltweit erste intensitätsmodulierte 

Schwerionentherapie. Von 1997 bis 2008 wurden über 440 Patienten 

mit 12 C-Ionen bestrahlt. Dabei wurden meist strahlenresistente und tiefsitzende Tumorarten 

gewählt, die im Kopf- oder Nackenbereich lagen. Ab dem Jahr 2006 wurden 

auch Prostatakarzinome behandelt. 

Die Erfolgsquoten im GSI-Pilotprojekt waren so vielversprechend [SE + 04], dass 

diese neue Art der Tumortherapie in den klinischen Routinebetrieb übergehen soll. 

Im November 2009 nahm das Heidelberger Ionenstrahl-Therapiezentrum HIT [H + 04] 

seinen Betrieb auf. Gegenwärtig befinden sich in Kiel, Marburg und Pavia (Italien) 

Kohlenstoff-Protonen-Therapiezentren im Bau oder Erprobung und weltweit weitere 

in Planung. In den Strahlentherapiezentren sollen jährlich 1500-2000 Patienten 

behandelt werden. 

Obwohl die Patientenbestrahlung an das HIT übergegangen ist, ist die Schwerionentherapie 

weiterhin Gegenstand intensiver Forschung an der GSI. Neben Verbesserungen 

und Erweiterungen der physikalischen, biologischen und technischen 

Aspekte, sowie in der Bestrahlungsplanung, liegt der Fokus auf der Bestrahlung von 

17

1 Einleitung 

Relative Dosis [%] 

Ausgedehnter 

Bragg-Peak 

✛ Tumorzone ✲ 

✟✟✟✟✟✟ 

Eindringtiefe [cm] 

Abbildung 1.8: Überlagerung einzelner Bragg-Peaks (rote Kurven) zu einer resultierenden Dosis 

(blaue Kurve). In der Tumorzone kann mit dem ausgedehnten Bragg-Peak eine homogene Dosisverteilung 

erzielt werden. Die Dominanz des hintersten Bragg-Peaks ist dabei deutlich zu erkennen. 

bewegten Zielvolumina. Dies sind Tumore, die im Thorax oder Bauchbereich liegen, 

und sich unter Einfluss der Atmung und des Herzschlages bewegen. Näheres dazu 

ist z.B. in [Grö04, Ber06, RB10, B + 06] zu finden. 

1.5.1 Technik der Therapie 

Bei der GSI werden die Kohlenstoffionen in Ionenquellen erzeugt und anschließend 

in die Beschleunigeranlage injiziert. Nachdem die Teilchen dort hohe Geschwindigkeiten 

erreicht hatten (ca. 50% der Lichtgeschwindigkeit), wurden sie in den Therapieraum 

weitergeführt. Eine Grundrissskizze der Beschleunigeranlage der GSI und 

des Therapieraumes befindet sich im Anhang. 

Bei der Erfassung des Tumorvolumens wird es in Schichten gleicher Strahlreichweite, 

sog. Isoenergieschichten (IES), aufgeteilt. Jede IES wird mit einem Punkteraster 

diskretisiert. Damit alle Rasterpunkte einer IES mit dem Strahl abgetastet 

werden können, wurde an der GSI das Rasterscan-Verfahren [H + 93] entwickelt. 

Beim Rasterscannen wird das geladene Teilchenbündel von zwei Dipolmagneten 

(Scanmagnete), unter Einwirkung der Lorentz-Kraft [GM06], horizontal und vertikal 

abgelenkt. Abbildung 1.7 illustriert das Rasterscan-Verfahren. Nachdem in einem 

Rasterpunkt die vorher festgelegte Teilchenanzahl erreicht wurde, wird der 

Strahl weitergelenkt. Die Messung der Teilchenzahlen erfolgt mit einer Ionisationskammer. 

Strahlreichweite, und damit der Bragg-Peak, wird mit aktiver Energiemodulation 

des Beschleunigers gesteuert. Zuerst wird die hinterste IES bestrahlt, 

anschließend erfolgt eine Verringerung der Energiestufe um die vordere Scheibe zu 

bestrahlen. Eine homogene Dosis in der Tumorzone entsteht durch Überlagerung 

einzelner Bragg-Peaks unterschiedlicher Anfangsenergie (siehe Abb. 1.8). Die GSI- 

18

12C-Strahl ✏✏ 

✏✏ 

11C-Teilchen ✏ 


Gammaquant 

Detektoren 

✑✑ 

✑ 

Abbildung 1.9: Schematische Darstellung der PET-Analyse. Oben: Fragmentation zwischen einem 

12 C-Teilchen und 16 O-Teilchen. Dabei kann es vorkommen, dass nach der Kollision ein radioaktives 

11 C-Teilchen entsteht. Flugrichtung und Geschwindigkeit des 11 C-Teilchens unterscheidet sich 

kaum zu der vom vorhergehenden 12 C-Teilchen. Unten: Durch Zerfall des 11 C-Teilchens am Endpunkt 

werden zwei Gammaquanten ausgesendet, die von den Detektoren gemessen werden. Durch 

Rückrechnung kann die Reichweite des ursprünglichen 12 C-Strahls im Patienten gemessen werden. 

Beschleunigeranlage stellt 253 verschiedene Energien (80MeV/u - 430MeV/u) des 

12 C-Strahls zur Verfügung, was einer wasseräquivalenten Reichweite von ca. 2-31cm 

entspricht. Des Weiteren können sieben Strahldurchmesser (4-12mm) eingestellt werden. 

Mit dieser Technik kann ein dünner Strahl präzise über das dreidimensionale 

Zielvolumen geführt werden. 

Ein Interlocksystem kontrollierte im Submillisekundenbereich den Bestrahlungsablauf 

und sorgte, bei einem Fehlverhalten, für einen sofortigen Abbruch der Bestrahlung. 

Zur Verifikation der Bestrahlung wurde die sog. Positronen-Emissions-Tomographie 

(PET) verwendet [E + 99]. Die PET bietet die Möglichkeit, ohne zusätzliche 

Dosisbelastung, den Strahl im Patienten zu verfolgen. Eine PET-Analyse fand nach 

jeder Bestrahlungsfraktion statt. Die PET basiert darauf, dass bei der Passage des 

12 C-Strahls durch das Gewebe ein kleiner Teil der 12 C-Teilchen in instabile 11 C- 

Isotope 2 umgewandelt wird. Die Reichweite des 11 C-Teilchens unterscheidet sich nur 

minimal zur Reichweite des 12 C-Teilchens, das 11 C-Teilchen zerfällt jedoch am Endpunkt. 

Beim Zerfall der 11 C-Teilchen entstehen β + -Emitter (Positronen 3 ). Durch 

Annihilation 4 der Positronen mit Elektronen werden Gammaquanten 5 ausgesendet, 

die von der PET-Kamera detektiert werden. Durch Rückrechnung kann dann die Position 

des Zerfalls des 11 C-Isotops, und damit die Strahlreichweite, bestimmt werden. 

2 Isotope sind Atome mit gleicher Protonenanzahl aber unterschiedlicher Neutronenanzahl. 

3 Das Positron ist das Antiteilchen des Elektrons (also positiv geladen). 

4 Unter Annihilation versteht man in der Teilchenphysik die Paarvernichtung eines Teilchens mit 

seinem Antiteilchen. 

5 Gammaquanten sind elektromagnetische Strahlen. 

19

1 Einleitung 

Eine schematische Darstellung der PET-Analyse zeigt Abbildung 1.9. 

1.5.2 Ablauf der Therapie 

Um eine präzise Bestrahlung zu erreichen wird der Patient vor dem Strahlaustrittsfenster 

fixiert (siehe Abbildung 1.10). Bei der Behandlung eines Schädel- oder Nackentumors 

wurde für die Fixierung, für jeden Patienten individuell, eine Kopfmaske 

aus selbsthärtendem Kunststoff angefertigt, wie sie in Abbildung 1.11 zu sehen ist. 

Die Maske wurde dann an der Patientenliege verschraubt. Bei der Therapie von Prostatakarzinomen 

wurde diese Technik dem Beckenbereich angepasst. Die Lagerung 

des Patienten wurde vor jeder Bestrahlungsfraktion mit zwei zueinander senkrechten 

Röntgenaufnahmen überprüft. 

Die Gesamtzeit, die für eine Fraktion benötigt wurde, lag bei ca. 30-40 Minuten. 

Die reine Bestrahlungszeit dauerte etwa 5-10 Minuten. Fixierung und Positionierung 

des Patienten nahmen die meiste Zeit in Anspruch. Bei Schädeltumoren wurden 20 

Fraktionen in 20 aufeinanderfolgenden Tagen verabreicht. Die Gesamtdosis einer 

Therapie lag dabei bei 60-70Gy. Bei Prostatakarzinomen wurden an der GSI 18Gy 

auf sechs Fraktionen verteilt. Eine Tagesdosis lag somit bei ca. 3Gy. 

Die Möglichkeit der Rotation des Patiententisches erlaubte einen Wechsel der 

Bestrahlungsfelder. In der Regel waren zwei gegenüberliegende Felder ausreichend, 

selten wurde noch ein drittes verwendet. 

20

Austrittsfenster 

des Strahls 

Fixierte 

Kopfmaske 

Patient 


Verstellbare 

Patientenliege 

Positionierbarer 

Tisch 

Abbildung 1.10: Fixierter Patient im Therapieraum der GSI. Die Kopfmaske ist an die Tischauflage 

direkt vor dem Strahlaustrittsfenster geschraubt. Der Tisch kann entlang der kreisförmigen 

Schiene im Boden rotiert werden. Damit kann ein automatischer Wechsel des Bestrahlungsfeldes 

stattfinden. Hinter der weißen Abschirmung über- und unterhalb des Patientens befindet sich die 

PET-Kamera. Mit dem "Buzzer" in der rechten Hand kann der Patient die Bestrahlung jederzeit 

eigenständig abbrechen. 

Abbildung 1.11: Thermoplastische Maske zur Fixierung des Kopfes des Patienten. 

21

2 Optimierung der Dosis in der 

Schwerionentherapie 

Dieses Kapitel widmet sich der Optimierung der Dosis in der Schwerionentherapie. 

Als erstes wird die Bestrahlungsplanungssoftware, die an der GSI entwickelt und 

für die Kohlenstofftherapie verwendet wurde, vorgestellt. In Abschnitt 2.2 werden 

Details zur Berechnung der Dosis geschildert. Abschnitt 2.3 geht ausführlich auf 

die mathematische Formulierung des Optimierungsproblems ein. Die theoretische 

Betrachtung und Lösung des Optimierungsproblems ist Schwerpunkt dieser Master- 

Thesis. Im letzten Abschnitt dieses Kapitels wird gezeigt, wie eine optimierte Dosisverteilung 

experimentell nachgewiesen werden kann. 

2.1 Bestrahlungsplanung mit TRiP 

Das Rasterscan-Verfahren erfordert eine präzise Vorberechnung mehrerer zehntausend 

Strahlpositionen, Strahlenergien und Teilchenzahlen, um die vom Arzt vorgeschriebene 

Dosisverteilung zu erreichen. Hierzu dient die Bestrahlungsplanungssoftware 

Treatment Planning for Particles (TRiP) [K + 00, J + 01]. Sie wurde an der GSI 

für die intensitätsmodulierte Schwerionentherapie, in der Programmiersprache C, 

entwickelt. Des Weiteren wird TRiP auch zu Forschungszwecken eingesetzt. An der 

GSI ist TRiP selbst Forschungsgegenstand und wird stets weiterentwickelt. 

Bei der Erstellung eines Bestrahlungsplanes führt TRiP im wesentlichen vier Schritte 

aus: 

1. Die modifizierten CT-Daten des Patienten werden eingelesen. 

2. Im Target wird ein dreidimensionales Rastergitter generiert. 

3. Optimierung der Dosis. Dabei werden für jeden Rasterpunkt Teilchenfluenzen 

bestimmt, aus denen eine optimale Dosisverteilung resultiert. 

4. Eine Kontrolldatei für den Rasterscanner wird erstellt. 

Der genauere Ablauf der ersten drei Schritte wird im folgenden beschrieben. 

Die Auflösung eines CT’s ist 3mm in z-Richtung (Tiefe) und 1mm in x- bzw. y- 

Richtung. Eine solche Volumeneinheit wird Voxel (Volumenpixel) genannt und kann 

als Bildpunkt interpretiert werden. Bei der Dosisberechnung und -optimierung wird 

22

2.1 Bestrahlungsplanung mit TRiP 

Abbildung 2.1: CT-Scheibe des Patientenplanes #135. Tumor (rote Kontur) und Hirnstamm (grüne 

Kontur) wurden mit Konturen markiert. Vor der Bestrahlungsplanung wird jede CT-Scheibe 

auf diese Art und Weise bearbeitet. 

jedes Voxel mit einem Dosiswert belegt. Bevor TRiP die CT’s verarbeitet, werden 

von einem Medizin-Physiker die Volumes of Interest (VOI) bestimmt und in jeder 

CT-Scheibe mit einer Kontur umlegt. Die VOI’s umfassen Tumor (Target) und Organs 

at Risk (OAR). Bei einem OAR kann es sich z.B. um Hirnstamm, Chiasma 

oder Sehnerv handeln, welche bei der Bestrahlungsplanung besonders berücksichtigt 

werden müssen. Eine bearbeitete CT-Scheibe zeigt Abbildung 2.1. 

Die Anzahl der Bestrahlungsfelder und deren Richtungen werden bei der Bestrahlungsplanung 

manuell eingestellt. TRiP generiert, relativ zum Strahleintritt, 

in jedem Feld die Isoenergieschichten. In jeder IES wird ein Punkteraster gelegt 

und die x- bzw. y-Koordinaten der einzelnen Rasterpunkte werden berechnet. Die z- 

Koordinaten der Rasterpunkte werden über die Anfangsenergien des Strahls, welche 

aus den verfügbaren Beschleunigerenergien gewählt werden, bestimmt. Die Abstände 

der Rasterpunkte in x-,y- und z-Richtung können vom Benutzer definiert werden. 

Typische Abstände für die Therapie sind 2-3mm in alle drei Richtungen. Die Überlagerung 

der Rasterpunkte, aus allen Scheiben und Feldern, definiert ein 3D-Gitter 

im Target, welches bei der Bestrahlung abgefahren wird. In Abbilldung 2.2 ist das 

23

2 Optimierung der Dosis in der Schwerionentherapie 

Strahl 

✏ ✏✏✏✶ 

y 

x 

Reichweite/Energie 

Abbildung 2.2: Modellhafte Darstellung eines Zielvolumens (Ellipsoid) mit Isoenergieschichten 

(gestrichelt) und den dazugehörigen Rasterpunkten. Die Größe der Rasterpunkte repräsentiert die 

benötigte Teilchenfluenz um eine optimierte Dosis zu erhalten. Die hinterste IES (aus Sicht des 

Strahls) bedarf der höchsten Teilchenfluenz. Wegen der Vorbestrahlung werden für die vorderste 

IES lediglich geringe Teilchenzahlen benötigt. [Mit freundlicher Genehmigung Dr. C. Bert]. 

Modell eines Zielvolumens, mit Isoenergieschichten und den dazugehörigen Rasterpunkten, 

zu sehen. 

Ein wesentlicher Bestandteil der Bestrahlungsplanung ist der Optimierungsschritt. 

In diesem werden mit implementierten Algorithmen die Teilchenzahlen für mehrere 

zehntausend Rasterpunkte berechnet. Ziel der Optimierung ist eine adäquate Dosisverteilung 

zu erhalten bei tragbarem Zeit- und Speicheraufwand. Die Kriterien für 

eine gute Dosisverteilung sind die folgenden [B + 90]: 

z 

• Die applizierte Dosis im Target sollte sehr nahe an der vorgeschriebenen Dosis 

liegen. 

• Die Dosis sollte im Target homogen verteilt sein. 

• In jedem OAR sollte die festgelegte tolerierbare Dosisgrenze nicht überschritten 

werden. 

• In dem umliegenden Gewebe, welches an das Target angrenzt, sollte wenig 

Dosis appliziert werden. 

Mit der mathematischen Formulierung des Optimierungsproblems beschäftigt sich 

Abschnitt 2.3. Theoretische Diskussion und numerische Lösung des Optimierungsproblems 

sind Schwerpunkt dieser Master-Thesis. Davor behandelt der folgende Abschnitt 

noch Details zur Dosisberechnung. 

24

2.2 Berechnung der Dosis 

Abbildung 2.3: Vergleich zweier optimierten Dosisverteilungen in einer CT-Scheibe des Patientenplanes 

#135. Die Farbskalierung entspricht dem prozentualen Anteil der vorgeschriebenen Dosis. 

Da hier der Tumor (starke Kontur) um den Hirnstamm (schwache kreisförmige Kontur) herumwächst, 

handelt es sich um einen komplexen Fall. In beiden Fällen kann im Target eine gute 

Dosisverteilung beobachtet werden. Linkes Bild zeigt insgesamt dennoch eine unzufriedenstellende 

Dosisverteilung, da im Hirnstamm relativ viel Dosis appliziert wird. Durch Änderungen in der 

Bestrahlungsplanung und neuer Optimierung kann das gewünschte Resultat auf der rechten Seite 

erreicht werden. 

Als Ergebnis der Optimierung erzeugt TRiP einen Dosis-Würfel, der die dreidimensionale 

Dosisverteilung im CT enthält. Dabei enthält jedes Voxel einen Dosiswert. 

Für eine bessere Übersicht können Dosisverteilungen in den einzelnen CT- 

Scheiben betrachtet werden. Bevor ein Bestrahlungsplan für einen Patienten verwendet 

wird muss die Eignung des Plans überprüft werden. Dies geschieht, indem sich 

ein Arzt oder Medizin-Physiker die Dosisverteilung in jeder einzelnen CT-Schicht ansieht 

(siehe Abbildung 2.3). Bei deutlichen Abweichungen zu den oberen Kriterien 

müssen gegebenenfalls Optimierungsparameter, technische Einstellungen, Bestrahlungsgeometrien 

oder sonstiges geändert werden. Anschließend ist in der Regel eine 

Wiederholung der Optimierung notwendig. 


2.2.1 Berechnung der physikalischen Dosis 

Das folgende Strahlmodell, mit dem TRiP die physikalische Dosis (absorbierte Dosis) 

berechnet, wurde speziell für 12 C-Ionenstrahlen entwickelt. Die partielle Dosis, die 

ein einzelnes Strahlenbündel der Energie ES an Position r0 ∈ R 3 in Position r ∈ R 3 

appliziert, ist gegeben durch [K + 00]: 

D(ES, r)[Gy] = 1.6 · 10 −8 

MeV 

· d(ES, z) 

gcm−2 

1 

· 

2πσ 

 

Tiefenbeitrag 

2 [mm2 

· exp − 

] r2 

2σ2 

·N , (2.1) 

 

Lateralbeitrag 

wobei N die Anzahl der Teilchen, σ die Strahlbreite, r 2 = ||r − r0|| 2 2 der euklidische 

Abstand und d(ES, z) die eindimensionale Tiefendosisverteilung ist. Dabei 

25


wird angenommen, dass der Strahl lateral ein gaußförmiges Profil besitzt. Die eindimensionale 

Tiefendosisverteilung d(ES, z) beschreibt, welche Dosis ein Strahl der 

Anfangsenergie ES in Abhängigkeit der Tiefe z deponiert. Die Berechnung erfolgt 

nach dem YIELD-Transportmodell. Dies wird detailiert in [K + 00] geschildert und 

ist vollständiger Bestandteil von TRiP. 

Die Gesamtdosis in einem CT-Voxel resultiert aus der Superposition von vielen 

Dosisbeiträgen, die sich aus den jeweiligen Einzelstrahlen gemäß (2.1) ergeben. Dabei 

repräsentiert jeder Rasterpunkt des Bestrahlungsplanes einen Einzelstrahl. In 

TRiP werden prinzipiell in jedem Voxel die Dosisbeiträge der Strahlenbündel aller 

Rasterpunkte aufsummiert. Dafür wird zu jedem Voxel i, von jedem Rasterpunkt j, 

ein Lateral- und ein Tiefenbeitrag berechnet. Der Wert, der die Stärke dieser Dosis-Korrelation 

angibt, wird mit cij bezeichnet. Mathematisch gesehen werden alle 

Korrelationen, zwischen allen Voxeln und Rasterpunkten, in einer Dosis-Korrelations-Matrix 

C zusammengefasst und cij sind dann dementsprechend die Matrixelemente: 

C ∈ R q×p 

≥0 , (cij)i=1,...,q ; j=1,...,p , (2.2) 

wobei q der größte Voxelindex und p der größte Rasterpunktindex ist. Diese Definition 

von q und p bleibt für den Rest dieser Master-Thesis bestehen. Die Zeilenanzahl 

der Dosis-Korrelations-Matrix ist also gleich der Anzahl der Voxel und die Spaltenanzahl 

ist gleich der Anzahl der Rasterpunkte im Bestrahlungsplan. Die Voxelanzahl 

q setzt sich hier aus allen Target- und OAR-Voxeln zusammen, denn nur diese gehen 

später in die Optimierung ein. 

Mit der Dosis-Korrelations-Matrix C kann dann die gesamte physikalische Dosis 

D i Phys , für alle Voxel i, als Funktion der Teilchenzahlen N aller Rasterpunkte, wie 

folgt berechnet werden: 

mit D i Phys 

D i Phys( N)[Gy] = 

p 

j=1 

cijNj = c T i · N , ci ∈ R p 

≥0 , N ∈ R p 

≥0 1 , (2.3) 

: Rp 

≥0 → R≥0 ∀ i. Die physikalische Dosis für ein Voxel i ergibt sich somit 

aus dem kanonischen Skalarprodukt der i-ten Zeile von C mit dem Teilchenzahlvektor 

N. Die Funktionalanalysis zeigt, dass ein Skalarprodukt stetig ist. 2 D.h., das 

Funktional D i Phys ist stetig für alle i. Linearität der physikalischen Dosis in N ist offensichtlich. 

Die Berechnung des Gradienten von (2.3), der später in der Optimierung 

benötigt wird, befindet sich im Anhang in Unterabschnitt 8.2.1. 

Da ein typischer Bestrahlungsplan mehrere zehntausend Rasterpunkte sowie Voxel 

beinhaltet, würde die Implementation der vollständigen Dosis-Korrelations-Matrix 

C zu einem großen Speicheraufwand führen. Ein Voxel i, welches lateral und in 

der Tiefe von einem Rasterpunkt j weit entfernt liegt, erhält von diesem einen vernachlässigbaren 

oder sogar gar keinen Beitrag. TRiP erlaubt die Einstellung eines 

1In Abschnitt 2.3 wird erklärt, warum der Teilchenzahlvektor N p 

im Raum R≥0 betrachtet wird. 

2Die Stetigkeit des Skalarproduktes folgt aus dem Folgenkriterium und kann mit der Cauchy- 

Schwarzschen-Ungleichung bewiesen werden [Heu92, Kre07]. 

26

Dosis [Gy (RBW)] 

Überleben 

✻ 

RBW 

❄ 

Eindringtiefe [mm] 


RBW-g. Dosis 

Phys. Dosis 

Abbildung 2.4: Oben: Modellrechnung von TRiP mit zwei gegenüberliegenden Feldern. Physikalische 

und RBW-gewichtete Dosis sind als Funktion der Eindringtiefe aufgetragen. Die Kohlenstoffstrahlen 

variieren zwischen einer Anfangsenergie von 160 und 230MeV/u. Man beachte den starken 

Beitrag der RBW auf die RBW-gewichtete Dosis. Unten: Experimentell gemessenes (Punkte) und 

kalkuliertes Überleben (Linie) der Zellen, korrespondierend zu dem oberen Tiefendosisprofil. Die 

weißen und schwarzen Punkte repräsentieren die Ergebnisse von zwei unabhängigen Experimenten. 

Berechnetes und gemessenes Überleben ist in diesem Beispiel in guter Übereinstimmung. Abbildung 

aus [Krä01]. 

Parameters ɛc, der eine obere Schranke darstellt, bis zu der die Dosis-Korrelations- 

Werte cij nicht beachtet werden. Dabei entsteht eine dünnbesetzte (schwachbesetzte) 

Matrix, die TRiP als Elementliste speichert. Bei der Wahl von ɛc = 2 · 10 −3 erhält 

durchschnittlich jedes Voxel von ca. 1000 Rasterpunkten Beiträge. Die Vernachlässigung 

der restlichen Rasterpunkte induziert einen geringen Dosisfehler von 0.5-1%, 

der in der Bestrahlungsplanung akzeptabel ist [G + 08]. Das Speichern der Elementliste 

kann bei größeren Bestrahlungsplänen dennoch mehrere Gigabytes erfordern. 

2.2.2 Berechnung der RBW-gewichteten Dosis 

Bei der Teilchentherapie müssen neben den physikalischen auch die biologischen 

Effekte der Teilchenstrahlung berücksichtigt werden. D.h., die RBW muss in die 

Bestrahlungsplanung integriert sein. Dies geschieht, indem die physikalische Dosis 

mit der RBW gewichtet (multipliziert) wird. Wie bereits erwähnt wurde, die RBW 

setzt sich in komplizierter Weise aus vielen physikalischen und biologischen Parametern 

zusammen. Durch die Komplexität des Bestrahlungsfeldes ändert sich die 

RBW von Punkt zu Punkt, also von Voxel zu Voxel, und kann deshalb nicht mit 

einem globalen Wert belegt werden. Im Gegensatz dazu besitzen Protonen nur eine 

schwach erhöhte biologische Wirksamkeit, die in der klinischen Anwendung mit ei- 

27


ner konstanten RBW von 1.1 festgesetzt wird [Pag03]. Die Stärke des Beitrages der 

RBW zur physikalischen Dosis, im Falle von 12C-Ionen, zeigt Abbildung 2.4. 

Für die Berechnung der biologischen Effekte von 12C-Ionen ist das LEM in TRiP 

implementiert [KS00]. Über das LEM kann in jedem Voxel i, in Abhängigkeit des 

Teilchenzahlvektors N, die RBW bestimmt werden [Krä09]. Die RBW-gewichtete 

Dosis wird mit Di Bio bezeichnet und mit der Einheit Gy (RBW) angegeben. Für die 

RBW-gewichtete Dosis ergibt sich somit der folgende Ausdruck: 

mit D i Bio 

D i Bio( N)[Gy (RBW)] = D i Phys( N) 

 

Gleichung (2.3) 

· RBW i ( N) , N ∈ R p 

≥0 

: Rp 

≥0 → R≥0 ∀ i, wobei für Kohlenstoffteilchen stets die Beziehung 

, (2.4) 

RBW i ( N) ≥ 1 ∀ i , (2.5) 

mit RBW i 

: R p 

≥0 → R≥0 ∀ i, gilt. Gradient und Hesse-Matrix von (2.4) befinden 

sich im Anhang in 8.2.2. Oftmals wird in der Literatur die Bezeichnung "Biologisch 

Effektive Dosis" (BED), mit der Einheit GyE (Gray-Equivalent), für Di Bio verwendet. 

In der Veröffentlichung [W + 07] der internationalen Atomenergieorganisation (IAEA) 

wird der Begriff RBW-gewichtete Dosis mit der Einheit Gy (RBW) empfohlen, der 

in dieser Master-Thesis verwendet wird. 

Im weiteren Verlauf dieser Arbeit wird die RBW-gewichtete Dosis unter folgenden 

Voraussetzungen betrachtet: 

• Als Teilchensorte wird ausschließlich 12 C betrachtet. 

• Als Dosen werden nur therapierelevante Werte betrachtet. Diese liegen in einem 

Intervall von 0 bis ca. 10Gy (RBW). 

• Für die Berechnung der RBW wird die sogenannte "lowdose-approximation" 

verwendet. Mit dieser Methode können für therapierelevante Dosen die RBW- 

Werte schnell berechnet werden. Eine genauere Metheode ist der sog. "classical 

approach", der zwar exaktere RBW-Werte liefert, jedoch wesentlich zeitaufwändiger 

ist. Mit der "lowdose-approximation" wird, gegenüber dem "classical 

approach", lediglich ein tolerabler Fehler von 5% begangen. [KS06] 

Unter den oberen Voraussetzungen kann für die RBW-gewichtete Dosis, in guter Approximation, 

ein analytischer Ausdruck betrachtet werden. Dieser wird mit D i Bio(ana) 

bezeichnet und sieht wie folgt aus: 

28 

D i Bio(ana)( N)[Gy (RBW)] = 

 

αi · (c T i · N) + βi · (c T i · N) 2 

βx 

+ 

2 αx 

2βx 

− αx 

, (2.6) 

2βx 

αx ∈ R>0 , βx ∈ R>0 , αi ∈ R>0 ∀ i , βi ∈ R>0 ∀ i , ci ∈ R p 

≥0 , N ∈ R p 

≥0

und D i Bio(ana) 

Bezeichnungen: 

: Rp 

≥0 → R≥0 ∀ i. 

2.3 Mathematische Formulierung der Optimierung 

αx und βx : alpha- und beta-Wert aus der Photon-Survival-Curve. 

αi und βi : alpha- und beta-Werte für jedes Voxel i. 

Diese werden mit dem LEM berechnet. 

ci : i-te Zeile aus der Dosis-Korrelations-Matrix C. 

N : Teilchenzahlvektor für alle Rasterpunkte. 

Eine genaue Herleitung des Ausdrucks (2.6) findet sich in [KS06]. Dass alle alphaoder 

beta-Werte gleich Null wären, würde den Fall repräsentieren, dass keine Strahlung 

auf Materie trifft, was im Hinblick auf die Therapie keinen Sinn ergeben würde. 

Unter der Wurzel befinden sich ausschließlich nichtnegative Werte, die addiert, multipliziert 

oder quadriert werden. Daher kann unter der Wurzel kein negativer Ausdruck 

entstehen. Das Funktional Di Bio(ana) ist stetig, da es sich um eine Verkettung 

handelt, in der alle Anteile stetig sind3 . In diesem Fall ist das Funktional sogar glatt, 

also stetig differenzierbar. Die Nichtlinearität von Di Bio(ana) bzgl. N ist offensichtlich, 

die Ableitungen befinden sich im Anhang in 8.2.3. 


Aufgabe der Optimierung ist die Bestimmung der Teilchenzahlen für alle Rasterpunkte 

im Bestrahlungsplan. Die daraus resultierende Dosisverteilung soll die Qualitätskriterien 

eines Bestrahlungsplanes (siehe Abschnitt 2.1) möglichst gut erfüllen. 

Die Optimierung ist der aufwendigste Teil in der Bestrahlungsplanung. 

Die mathematische Formulierung des Optimierungsproblems entspricht der Minimierung 

einer endlichdimensionalen nichtlinearen Zielfunktion. Die Idee dabei ist, 

die quadratischen Abweichungen, zwischen der vorgeschriebenen/tolerierbaren und 

tatsächlich erzeugten Dosis, in allen Target/OAR-Voxeln, zu minimieren. Dabei sind 

die Teilchenzahlen für alle Rasterpunkte die zu optimierenden Parameter. 

Dieser Abschnitt ist folgendermaßen unterteilt: 

1. Formulierung der Zielfunktion. 

2. Formulierung des Optimierungsproblems. 

3. Physikalische und technische Betrachtung des Optimierungsproblems. 

4. Mathematische Betrachtung des Optimierungsproblems. 

3 Aus der Analysis ist bekannt, dass eine Verkettung stetiger Funktionen stetig ist. 

29


Den beiden letzten Punkten ist jeweils ein eigener Unterabschnitt gewidmet. 

Die Zielfunktion hat folgende Gestalt: 

χ 2 ( N) = 

mit χ2 : R p 

≥0 → R≥0. 

Bezeichnungen: 

 

Di pre − Di act( 2 N) 

∆D 

i∈Target 

2 pre 

 

Di max − Di act( 2 N) 

+ 

i∈OAR 

χ 2 

∆D 2 max 

 

· Θ D i act( N) − D i 

max 

, 

(2.7) 

: Bezeichnung der Zielfunktion 

N ∈ R p 

≥0 : Vektor, dessen j-te Komponente die Teilchenzahl 

für den j-ten Rasterpunkt enthält 

i ∈ Target/OAR, i = 1, . . . , q : Voxel aus dem Target/OAR-Volumen 

Bemerkungen: 

D i pre ∈ R≥0 : Vorgeschriebene Dosis im i-ten Target-Voxel 

D i max ∈ R≥0 : Maximale Dosisgrenze im i-ten OAR-Voxel 

D i act : R p 

≥0 → R≥0 : Tatsächlich erzeugte Dosis im Voxel i 

∆Dpre/max ∈ R>0 : Gewichtungsfaktor 

Θ : Heaviside-Funktion 

• Bei D i act handelt es sich um einen Platzhalter für eine Dosisfunktion aus Abschnitt 

2.2. "act" ist eine Abkürzung für das englische Wort "actual", mit D i act 

ist also die tatsächlich erzeugte Dosis gemeint. 

• Die genaue Definition der Heaviside-Funktion Θ wird im folgenden Unterabschnitt 

angegeben. 

• Die obigen Bezeichnungen für die Parameter der Zielfunktion gelten für den 

Rest dieser Master-Thesis. Die mathematischen Forderungen an die Parameter 

werden im weiteren Verlauf nicht mehr explizit angegeben. 

Das Optimierungsproblem lautet dann: 

min χ 2 ( N) , (2.8) 

u. d. N. Nj ≥ 0 ⇔ −Nj ≤ 0 ∀ j = 1, . . . , p . (2.9) 

Bemerkung: Mit "min" ist "minimiere" gemeint und "u. d. N." bedeutet "unter der 

Nebenbedingung". 

30


2.3.1 Physikalische und technische Betrachtung 

Im weiteren Verlauf folgt die physikalische und technische Betrachtung des Optimierungsproblems. 

• Die Zielfunktion setzt sich aus einer Target- und einer OAR-Summe zusammen. 

Letztere wird für jedes OAR im Bestrahlungsplan einmal hinzugefügt. 

Ein Bestrahlungsplan kann mehrere OAR’s enthalten (z.B. Auge links, Auge 

rechts, Sehnerv links, Sehnerv rechts, Chiasma, Hirnstamm, Rückenmark, 

etc.). 

• Bei Dmax handelt es sich um die maximal tolerierbare Dosisgrenze für das 

entsprechende OAR und wird stets als Anteil von Dpre angegeben: 

Dmax = dfrac · Dpre , dfrac ∈ [0.3 ; 0.7] . (2.10) 

Zu jedem OAR gehört ein eigenes dfrac. 

• Im Target werden in jedem Voxel Über- und Unterdosierungen mit quadratischen 

Abweichungen quantifiziert. Unterdosierungen in einem OAR spielen 

keine Rolle und können daher bei der Optimierung vernachlässigt werden. Dies 

wird mit der Heaviside-Funktion kontrolliert, die hier wie folgt definiert ist: 

 

Θ D i act( N) − D i 

max = 

 

1 : D i act( N) > D i max , 

0 : D i act( N) ≤ D i max . 

(2.11) 

Weitere Betrachtungen der Heaviside-Funktion folgen im kommenden Unterabschnitt. 

• Die Gewichtungsfaktoren ∆Dpre und ∆Dmax kontrollieren den Einfluss der 

quadratischen Abweichungen. Damit eine Abweichung stärker gewichtet wird, 

werden beide Faktoren mit kleinen Werten von 

∆Dpre = 0.025 · Dpre bzw. ∆Dmax = 0.025 · Dmax (2.12) 

belegt. Durch (2.10) besteht zwischen ihnen stets die Größenbeziehung: 

∆Dmax < ∆Dpre . (2.13) 

Somit wird eine Abweichung im OAR "härter bestraft" als im Target. 

• In Abschnitt 2.1 wurden die vier Kriterien für eine gute Dosisverteilung gennant. 

Mit der obigen Zielfunktion werden nur die ersten drei Kriterien modelliert. 

Der vierte Punkt, dass die Dosis im umliegenden gesunden Gewebe, 

welches an das Target angrenzt, so niedrig wie möglich sein sollte, geht nicht 

in die Zielfunktion ein. Einbeziehung der Voxel aus dem umliegenden Gewebe 

würde den Optimierungsaufwand deutlich erhöhen. Falls doch Voxel aus diesem 

Bereich einbezogen werden sollen, so könnte bei der Bestrahlungsplanung 

im gesunden Gewebe ein "künstliches" OAR-Volumen definiert werden. 

31


• In die Zielfunktion (2.7) sind alle Bestrahlungsfelder einbezogen. D.h., der Teilchenzahlvektor 

N setzt sich aus allen Rasterpunkten aus den entsprechenden 

Feldern zusammen. Somit werden alle Felder simultan optimiert. Diese Methode 

wird Mehrfelderoptimierung (MFO) genannt. Es gibt noch die Einzelfeldoptimierung 

(EFO), bei der die Felder einzeln und unabhängig voneinander 

optimiert werden. Bei der EFO wird ein anderer Ansatz für die Zielfunktion 

verwendet. In [G + 08] wurde gezeigt, dass mit der MFO, im Gegensatz zur 

EFO, bessere Optimierungsergebnisse erzielt werden können. Die EFO wird 

noch bei der Voroptimierung eine Rolle spielen, die in Abschnitt 4.3 beschrieben 

wird. 

• Ein Bestrahlungsplan besteht typischerweise aus mehreren zehntausend Voxeln 

als auch Rasterpunkten (bis zu 100000 bei sehr großen Bestrahlungsplänen). 

Bei Auswertung der Zielfunktion muss die RBW für jedes Voxel berechnet 

werden. Dabei handelt es sich um den zeitaufwändigsten Teil bei der Dosisberechnung. 

In dieser Arbeit wird für die RBW-Berechnung die schnelle 

"lowdose-approximation" verwendet. Dennoch ist die Auswertung der Zielfunktion 

relativ zeitaufwändig. 

• Bei der Optimierung ist der Gradient und die Hesse-Matrix der Zielfunktion 

von großer Bedeutung. Durch die hohe Dimension des Teilchenzahlvektors N 

entsteht für die Ableitungen ein großer Speicherbedarf. Dies gilt vor allem 

für die Hesse-Matrix. Dieser Speicheraufwand kommt zusätzlich zu dem der 

Dosis-Korrelations-Matrix C hinzu. 

• An dieser Stelle wird die "Anzahl der Freiheitsgrade" (NDF) eingeführt. NDF 

ist die Differenz zwischen der Anzahl der Voxel q und der Anzahl der Rasterpunkte 

p: 

NDF = q − p . (2.14) 

In der Regel sind bei der Bestrahlungsplanung mehr Target- und OAR-Voxel 

als Rasterpunkte enthalten. Damit ist NDF positiv. Die Verwendung von NDF 

wird im Unterabschnitt 4.4.3 erklärt. 

2.3.2 Mathematische Betrachtung 

Als erstes soll das Optimierungsproblem (2.8)-(2.9) klassifiziert werden. Dafür wird 

zuerst die zulässige Menge Z des Optimierungsproblems betrachtet. Diese wird von 

den Nebenbedingungen (2.9) beschrieben und sieht damit wie folgt aus: 

Z = R p 

≥0 . (2.15) 

Die Nebenbedingungen sind offensichtlich, da es keine negativen Teilchenzahlen für 

einen Rasterpunkt geben kann. Für die Klassifizierung spielen folgende Punkte eine 

Rolle: 

32


• Optimierung der RBW-gewichteten Dosis, diese ist relevant für die Therapie, 

verlangt das Einsetzen von D i Bio oder Di Bio(ana) für Di act in die Zielfunktion. 

Aus der Nichtlinearität der RBW-gewichteten Dosis folgt die Nichtlinearität 

der Zielfunktion in N und somit liegt ein nichtlineares Optimierungsproblem 

vor. 

• Z wird ausschließlich durch Ungleichungen beschrieben. Damit ist Z nicht der 

gesamte R p und hiermit ist ein ungleichungsrestringiertes Optimierungsproblem 

vorhanden. 

• Die Dimension des Optimierungsproblems ist p, also die Anzahl der Rasterpunkte 

im Bestrahlungsplan. Da p nicht unendlich werden kann handelt es 

sich um ein endlichdimensionales Optimierungsproblem. 

• Streng gesehen müsste das Optimierungsproblem als ganzzahliges Optimierungsproblem 

angesehen werden, da nur ganze Teilchen betrachtet werden 

können. Das Optimierungsproblem wird dennoch als kontinuierliches Optimierungsproblem 

(Optimierung mit reellen Zahlen) betrachtet. Ein ganzzahliges 

Optimierungsproblem gehört zum Teilgebiet der "Diskreten Optimierung", 

welche eine ganz andere und komplexere Herangehensweise als die kontinuierliche 

Optimierung ist. Die Teilchenzahlen für einen Rasterpunkt liegen in Bereichen 

von 5000 bis 500000. Bei so großen Zahlen kann das Optimierungsproblem 

als ein kontinuierliches angesehen werden und die Optimierungskomponenten 

können nach dem Optimierungsprozess gerundet werden. Dabei entsteht ein 

vernachlässigbarer Fehler. 

Bei dem Optimierungsproblem (2.8)-(2.9) handelt es sich somit um ein 

nichtlineares ungleichungsrestringiertes endlichdimensionales kontinuierliches 

Minimierungsproblem 

. 

Des Weiteren sind in der mathematischen Betrachtung noch folgende Punkte von 

Interesse: 

• Die zulässige Menge Z ist eine konvexe Menge. Die Diskussion, ob die Zielfunktion 

eine konvexe Funktion ist, und ob damit ein konvexes Optimierungsproblem 

vorliegt, findet in Unterabschnitt 3.2.2 statt. Konvexität eines Optimierungsproblems 

spielt im Hinblick auf Eindeutigkeitsaussagen über eine 

Lösung eine wesentliche Rolle. 

• Die Heaviside-Funktion ist im klassischen/starken Sinne nicht differenzierbar. 

Über die mathematische Theorie der Distributionen kann eine Ableitung 

mit der Diracschen Delta-Funktion angegeben werden. Im Rahmen der 

Optimierung wird dies nicht benötigt. Deshalb wird die Heaviside-Funktion 

33


Abbildung 2.5: Foto des präparierten Biophantoms, welches direkt vor dem Strahlaustrittsfenster 

platziert ist. Auf den Stäbchen wachsen die Zellen, die in das Nährmedium (rote Flüssigkeit) 

eingetaucht sind. 

beim Differenzieren der Zielfunktion als konstanter Faktor behandelt. Gradient 

und Hesse-Matrix der Zielfunktion, die in der Optimierung eine essentielle 

Rolle spielen, befinden sich im Anhang in Abschnitt 8.3. Bei der Herleitung 

von notwendigen Optimalitätsbedingungen wird das Problem der nicht- 

Differenzierbarkeit mit einer lokalen Glättung der Zielfunktion umgangen. 

• Weitere Stetigkeits- und Differenzierbarkeitseigenschaften, als auch eine Glättung 

der Zielfunktion, werden in Kapitel 3 betrachtet. 

Im weiteren Verlauf dieser Arbeit liegt der Fokus auf der Lösung des Optimierungsproblems 

(2.8)-(2.9). Ziel ist es, in adäquater Rechenzeit, das Minimum der Zielfunktion 

zu ermitteln. In dem Minimum liegen die optimalen Teilchenzahlen, also: 

NOpt := Optimale Teilchenzahlen . (2.16) 

Dabei muss NOpt ein zulässiger Punkt sein, d.h. NOpt ∈ Z muss erfüllt sein. 

Das nächste Kapitel widmet sich der theoretischen Diskussion des Optimierungsproblems. 

Da die Zielfunktion nichtlinear in N ist, kann NOpt analytisch nicht bestimmt 

werden und muss mit iterativen Verfahren angenähert werden. Mit der allgemeinen 

Lösungsstrategie beschäftigt sich Kapitel 4. Auf die verwendeten Verfahren 

und deren Ergebnisse sowie numerische Bewertung geht Kapitel 5 und 6 ein. 

2.4 Experimentelle Verifikation 

An der GSI wurde ein sog. Biophantom entwickelt [vN + 06]. Abbildung 2.5 zeigt das 

Biophantom. Mit diesem kann über Messungen von Zellüberleben die Dosis in einem 

Bestrahlungsplan experimentell verifiziert werden. 

34

2.4 Experimentelle Verifikation 

Zellüberleben (Messung) Zellüberleben (TRiP) 

Abbildung 2.6: Vergleich von gemessenem Zellüberleben nach Bestrahlung mit 12 C-Ionen (linke 

Seite) und berechnetem Zellüberleben mit TRiP (rechte Seite). Die Ansicht ist von oben auf das 

Modell des Biophantoms. Auf der linken Seite repräsentiert ein Kästchen ein Stäbchen in dem Biophantom. 

Die Farbskalierung entspricht dem prozentualem Überleben in Abhängigkeit des Ortes. 

Hier handelt es sich um einen Bestrahlungsplan mit zwei Feldern, der eine komplexe Bestrahlungssituation 

simuliert. Das gemessene ist mit dem berechneten Zellüberleben in guter Übereinstimmung. 

Abbildung aus [Krä09]. 

In dem Biophantom können auf Stäbchen Zellen kultiviert werden. Die Stäbchen 

sind senkrecht in einem Nährmedium platziert. Das präparierte Biophantom kann 

anschließend unter Therapiebedingungen bestrahlt werden. Nach der Bestrahlung 

wird an jedem einzelnen Stäbchen die Überlebensrate bestimmt. Aus dem Zellüberleben 

können Rückschlüsse über die Dosis, an der Stelle wo das Stäbchen in dem 

Biophantom platziert war, gemacht werden. 

Abbildung 2.6 zeigt Zellüberlebenswerte aus dem Biophantom im Vergleich mit 

einem optimierten Plan mit zwei Bestrahlungsfeldern. In diesem Beispiel handelt 

es sich um einen komplexen Plan, da sich zwischen dem Targetvolumen gesundes 

Gewebe befindet. Die Resultate zeigen, dass das gemessene Zellüberleben mit dem 

berechneten Zellüberleben von TRiP in guter Übereinstimmung ist. 

Näheres zum Biophantom und zur experimentellen Dosisverifikation befindet sich 

in [KD10, Krä09, G + 08]. 

35

3 Theoretische Betrachtung des 

Optimierungsproblems 

In diesem Kapitel wird das Optimierungsproblem (2.8)-(2.9) theoretisch betrachtet. 

Eine theoretische Betrachtung des Optimierungsproblemes ist wichtig. Einerseits 

helfen die theoretischen Betrachtungen das Optimierungsproblem besser zu 

verstehen und andererseits sind die dabei gewonnenen Erkenntnisse später bei der 

numerischen Lösung des Optimierungsproblemes von Bedeutung. 

Im ersten Abschnitt werden von der Zielfunktion die Stetigkeits- und Differenzierbarkeitseigenschaften 

betrachtet, da diese im weiteren Verlauf eine bedeutende Rolle 

einnehmen. In Abschnitt 3.2 folgt die Diskussion der Existenz und Eindeutigkeit eines 

globalen Minimums des Optimierungsproblemes. Dabei muss eine Erweiterung 

des Extremwertsatzes von Weierstraß verwendet werden, die die Unterhalbstetigkeit 

und radiale Unbeschränktheit der Zielfunktion benötigt. Diese beiden Eigenschaften 

der Zielfunktion werden in diesem Kapitel bewiesen. Im letzten Abschnitt werden 

die Karush-Kuhn-Tucker-Bedingungen für das Optimierungsproblem angegeben, die 

die notwendige Optimalitätsbedingung erster Ordnung darstellen. Diese besitzen jedoch 

nur ihre Gültigkeit, wenn die Zielfunktion stetig-differenzierbar ist. Da dies 

nicht der Fall ist, wird vor der Herleitung der Karush-Kuhn-Tucker-Bedingungen 

die χ 2 -Funktion in Abschnitt 3.3 geeignet geglättet. 

3.1 Stetigkeits- und 

Differenzierbarkeitseigenschaften der 

Zielfunktion 

In diesem Abschnitt werden die Stetigkeits- und Differenzierbarkeitseigenschaften 

der Zielfunktion diskutiert. Diese Eigenschaften sind von großer Bedeutung bei der 

theoretischen Analyse des Optimierungsproblems (2.8)-(2.9). Dabei soll die Zielfunktion 

bei Optimierung mit dem analytischen Ausdruck für die RBW-gewichtete 

Dosis betrachtet werden. Dies erfordert das Einsetzen von Di Bio(ana) (siehe (2.6)) für 

Di act in der Zielfunktion. Die Zielfunktion wird dann mit χ2 Bio(ana) bezeichnet und 

36

hat folgende Gestalt: 

χ 2 Bio(ana)( N) = 

3.1 Stetigkeits- und Differenzierbarkeitseigenschaften der Zielfunktion 

 

Di pre − Di Bio(ana) ( 2 N) 

∆D 

i∈Target 

2 pre 

 

Di max − Di Bio(ana) ( 2 N) 

+ 

i∈OAR 

∆D 2 max 

 

· Θ D i Bio(ana)( N) − D i 

max 

, 

(3.1) 

mit χ2 Bio(ana) : Rp≥0 

→ R≥0. 

Zuerst wird die Stetigkeit von χ2 Bio(ana) betrachtet. Dabei wird der Target- und 

der OAR-Term seperat diskutiert. Anschließend folgt eine Zusammenfassung der 

Stetigkeitseigenschaften der gesamten χ2 Bio(ana) -Funktion mit Angabe der Differenzierbarkeitseigenschaften. 

Stetigkeitsbetrachtung des Target-Terms 

Es ist ausreichend, die Stetigkeit für ein Target-Voxel i zu zeigen, denn für jedes 

Target-Voxel i ist die Struktur im Target-Term die Gleiche. Ist die Stetigkeit für 

alle Target-Voxel i gezeigt, kann für den Target-Term die Eigenschaft angewendet 

werden, dass eine endliche Summe stetiger Funktionen stetig ist. 

Wie bereits in Abschnitt 2.2.2 erwähnt wurde, das Funktional Di Bio(ana) ist stetig 

für alle i. Di pre und ∆D2 pre sind Zahlen, die trivialerweise stetig sind. Die Differenz 

im Zähler ist auch stetig. Die Differenz im Quadrat kann als quadratische Funktion 

interpretiert werden, die ebenfalls stetig ist. Damit liegt in jedem Target-Voxel i eine 

stetige Funktion vor, denn es handelt sich um eine Verkettung von ausschließlich 

stetigen Teilen. Dies führt zur Stetigkeit des Target-Terms. 1 

Stetigkeitsbetrachtung des OAR-Terms 

Betrachtet man den OAR-Term ohne die Heaviside-Funktion Θ, dann gilt das Gleiche 

wie oben, es muss nur D i pre und ∆D 2 pre mit D i max und ∆D 2 max ersetzt werden. 

Da aber für jedes OAR-Voxel i die Heaviside-Funktion als Faktor vorkommt, ist der 

OAR-Term unstetig, da die Heaviside-Funktion eine Sprungfunktion ist. 

Zusammenfassung und Differenzierbarkeitseigenschaften 

Da der OAR-Term unstetig ist, ist die χ2 Bio(ana) -Funktion unstetig. Die Unstetigkeit 

wird ausschließlich durch die Heaviside-Funktion Θ induziert. Da die Heaviside- 

Funktion eine Sprungfunktion ist, ist die χ2 Bio(ana) -Funktion im klassischen Sinne 

nicht differenzierbar. 

1 Alle hier getroffenen Aussagen zur Stetigkeit sind z.B. in [Heu84] zu finden. 

37

3 Theoretische Betrachtung des Optimierungsproblems 

3.2 Existenz und Eindeutigkeit eines Minimums 

3.2.1 Existenz eines Minimums 

In diesem Unterabschnitt soll die Existenz eines globalen Minimums von dem Optimierungsproblem 

(2.8)-(2.9) gezeigt werden. Dabei wird die χ2 Bio(ana) -Funktion als 

Zielfunktion verwendet. Das Standardargument für die Existenz eines Minimums ist 

der Extremwertsatz von Weierstraß (siehe Satz 8.1 im Anhang). Dieser setzt die Stetigkeit 

der Funktion und Kompaktheit der Menge, auf der die Funktion betrachtet 

wird, voraus. Da die χ2 Bio(ana) -Funktion unstetig und die zulässige Menge (2.9) nicht 

kompakt ist, so kann nicht der Extremwertsatz von Weierstraß, weder in der Form 

in Satz 8.1 noch mit Betrachtung von Niveau-Mengen wie in Satz 8.3, als Existenzkriterium 

verwendet werden. Ist jedoch die Zielfunktion unterhalbstetig und radial 

unbeschränkt, kann die erweiterte Version des Extremwertsatzes von Weierstraß aus 

Abschnitt 8.7 angewendet werden. Dies ist das Ziel in diesem Unterabschnitt. 

Im Weiteren wird in 3.2.1.1 die Unterhalbstetigkeit und in 3.2.1.2 die radiale 

Unbeschränktheit der χ2 Bio(ana) -Funktion bewiesen. Mit diesen Ergebnissen wird dann 

in 3.2.1.3 die Existenz mindestens eines globalen Minimums gezeigt. 

3.2.1.1 Unterhalbstetigkeit der Zielfunktion 

An dieser Stelle soll gezeigt werden, dass die χ2 Bio(ana) -Funktion unterhalbstetig ist. 

Die dafür benötigten Definitionen, Eigenschaften und Veranschaulichungen zu unterhalbstetigen 

Funktionen befinden sich im Anhang in Abschnitt 8.5. 

Als erstes wird gezeigt, dass die Heaviside-Funktion Θ unterhalbstetig ist. Dabei 

genügt es, die Unterhalbstetigkeit für ein beliebiges OAR-Voxel i zu zeigen, denn 

die Struktur der Heaviside-Funktion ist in jedem OAR-Voxel die Gleiche. Für eine 

bessere Übersicht wird die Heaviside-Funktion hier nochmals angegeben: 

 

Θ D i Bio(ana)( N) − D i 

max = 

1 : D i Bio(ana) ( N) > D i max , 

0 : D i Bio(ana) ( N) ≤ D i max . 

(3.2) 

Eine graphische Veranschaulichung der obigen Heaviside-Funktion zeigt Abbildung 

3.1. 

Satz 3.1 

Die äußere Heaviside-Funktion Θ mit der inneren Verkettung D i Bio(ana) ( N) − D i max 

in (3.2) ist unterhalbstetig. 

Beweis: Für das Argument der Heaviside-Funktion wird die Hilfsvariable ξ eingeführt, 

also: 

ξ := D i Bio(ana)( N) − D i max . (3.3) 

In diesem Beweis wird dann Θ(ξ) betrachtet. Man kann im weiteren Verlauf dieses 

Beweises mit der Substitution (3.3) arbeiten. Ist die Unterhalbstetigkeit für die 

38


Θ 

Abbildung 3.1: Graphische Veranschaulichung der Heaviside-Funktion aus (3.2) in Abhängigkeit 

der Hilfsvariable ξ. Die Heaviside-Funktion in dieser Form ist unterhalbstetig. Die Unterhalbstetigkeit 

ist unter anderem daran zu erkennen, dass die Funktion an keiner Stelle nach unten springt. 

aüßere Funktion Θ gezeigt, dann bleibt diese mit der inneren Verkettung unterhalbstetig, 

da der innere Teil D i Bio(ana) ( N) − D i max stetig ist. Eine unterhalbstetige 

Funktion mit einer inneren verkettet, wobei die innere Funktion stetig ist, bleibt 

unterhalbstetig. Die Heaviside-Funktion ist überall stetig mit Ausnahme der Stelle 

ξ = 0. Diese Stelle wird mit ξ0 bezeichnet. Sie repräsentiert den Fall: 

ξ0 

ξ0 := 0 =⇒ D i Bio(ana)( N) = D i max . (3.4) 

Wegen der Stetigkeit der Heaviside-Funktion außerhalb der Stelle ξ0 ist sie dort 

auch unterhalbstetig (siehe Eigenschaften in Abschnitt 8.5). Jetzt muss nur noch 

Unterhalbstetigkeit in ξ0 gezeigt werden und die Unterhalbstetigkeit der Heaviside- 

Funktion ist bewiesen. Unterhalbstetigkeit in ξ0 lässt sich dann aus Definition 8.4 

folgern. Für jedes ɛ > 0 existiert eine beliebige Umgebung U von ξ0, so dass 

Θ(y) > Θ(ξ0) − ɛ (3.5) 

für ein beliebiges y ∈ U gilt. Θ(y) kann nur die Werte 1 oder 0 annehmen und daraus 

können sich in (3.5) lediglich die beiden folgenden Fälle ergeben: 

1 > 0 − ɛ , (3.6) 

0 > 0 − ɛ . (3.7) 

Bei Betrachtung von Abbildung 3.1 sieht man, dass die Heaviside-Funktion aus 

(3.2) an keiner Stelle nach unten springt, was die anschauliche Bedeutung einer unterhalbstetigen 

Funktion ist. 

Aus der Unterhalbstetigkeit der Heaviside-Funktion in jedem OAR-Voxel i folgt: 

ξ 

 

39


Satz 3.2 

Die Zielfunktion χ 2 Bio(ana) 

ist unterhalbstetig. 

Beweis: Hier kann mit den Eigenschaften unterhalbstetiger Funktionen aus Abschnitt 

8.5 argumentiert werden. Der Target-Term und der OAR-Term (ohne die 

Heaviside-Funktion Θ) sind unterhalbstetig, da diese stetig sind. Der gesamte OAR- 

Term ist unterhalbstetig, da dieser ein Produkt von zwei nichtnegativen und unterhalbstetigen 

Funktionen ist. Die χ2 Bio(ana) -Funktion ist damit eine Summe zweier 

unterhalbstetiger Funktionen, die wiederum unterhalbstetig ist. 

 

3.2.1.2 Radiale Unbeschränktheit der Zielfunktion 

Hier soll die radiale Unbeschränktheit der χ2 Bio(ana) -Funktion gezeigt werden. Die Definition 

einer radial unbeschränkten Funktion befindet sich im Anhang in Abschnitt 

8.6. Für die radiale Unbeschränktheit der χ2 Bio(ana) -Funktion wird noch der folgende 

Satz benötigt: 

Satz 3.3 

Der analytische Ausdruck für die RBW-gewichtete Dosis D i Bio(ana) ( N) aus (2.6) ist 

auf der zulässigen Menge Z radial unbeschränkt. 

Beweis: Der Beweis wird wieder für ein beliebiges Voxel i gezeigt, denn in jedem 

Voxel hat D i Bio(ana) ( N) die gleiche Struktur. Für die radiale Unbeschränktheit kön- 

nen in dem Ausdruck für D i Bio(ana) ( N) alle αx, βx, αi und βi vernachlässigt werden, 

da diese positive Konstanten sind. Daher kann man sich auf folgenden Ausdruck 

beschränken: 

D i Bio(ana)( N) = 

 

(c T i · N) + (c T i · N) 2 . (3.8) 

Als erstes soll der Ausdruck unter der Wurzel betrachtet werden, also: 

lim 

|| 

(c 

N||→∞ 

T i · N) + (c T i · N) 2 

 

. (3.9) 

Aus den Gesetzen der Grenzwertbildung folgt: 

lim 

|| (c 

N||→∞ 

T i · N) + lim 

|| (c 

N||→∞ 

T i · N) 2 

. (3.10) 

Die Komponenten von c T i sind alle nichtnegativ und es gilt die Einschränkung N ∈ 

R p 

≥0 . Man muss hier noch den Fall ausschließen, dass bei einem cT i alle Komponenten 

Null sind. c T i sind Zeilen aus der Dosis-Korrelations-Matrix C. Würden in den Zeilen 

alle Komponenten den Wert 0 haben, dann würde dass den Fall repräsentieren, 

dass keine Strahlung auf irgendeine Materie trifft, was im Hinblick auf die Therapie 

keinen Sinn ergeben würde. Daher werden in dem kanonischen Skalarprodukt c T i · N 

40


positive Zahlen miteinander multipliziert und addiert. Daraus folgt, wenn man N 

gegen unendlich laufen lässt: 

lim 

|| (c 

N||→∞ 

T i · N) + lim 

|| (c 

N||→∞ 

T i · N) 2 = ∞ + ∞ = ∞ . (3.11) 

Dieses Ergebnis und das streng monotone Wachstum der Wurzelfunktion ergibt: 

lim 

|| D 

N||→∞ 

i Bio(ana)( N) = +∞ . (3.12) 

Damit ist der Satz bewiesen, denn aus der radialen Unbeschränktheit von D i Bio(ana)( N) 

folgt die radiale Unbeschränktheit von D i Bio(ana) ( N). 

 

Mit der radialen Unbeschränktheit von D i Bio(ana) ( N) kann nun der folgende Satz 

angegeben und bewiesen werden: 

Satz 3.4 

Die Zielfunktion χ 2 Bio(ana) 

ist radial unbeschränkt. 

Beweis: Da der OAR-Term eine nichtnegative Funktion ist, kann er bei der Betrachtung 

der radialen Unbeschränktheit der χ2 Bio(ana) -Funktion vernachlässigt werden 

und man kann sich auf folgenden Ausdruck beschränken: 

χ 2 Bio(ana)( N) = 

i∈Target 

 


∆D 2 pre 

. (3.13) 

Aus der radialen Unbeschränktheit von χ2 Bio(ana) folgt die radiale Unbeschränktheit 

von χ2 Bio(ana) . Es ist ausreichend, die radiale Unbeschränktheit für ein Target-Voxel 

i zu zeigen, also für: 

 


, (3.14) 

∆D 2 pre 

denn in jedem i liegt die gleiche Struktur vor. Da ∆D 2 pre eine positive Konstante 

ist, so ist der Ausdruck in (3.14) eine positive quadratische Funktion 2 , mit dem 

Argument 

D i pre − D i Bio(ana)( N) . (3.15) 

D i pre ist ebenfalls eine positive Konstante. Da D i Bio(ana) ( N) radial unbeschränkt ist 

und wegen der radialen Unbeschränktheit einer positiven quadratischen Funktion 

gilt: 

lim 

|| N||→∞ 

 


∆D 2 pre 

= +∞ . (3.16) 

2 Mit einer positiv quadratischen Funktion ist eine nach oben geöffnete Parabel gemeint. 

41


Damit ist in jedem Target-Voxel i eine radial unbeschränkte Funktion vorhanden. 

Die Summe von radial unbeschränkten Funktionen ist wiederum radial unbeschränkt 

(siehe Bemerkungen in Abschnitt 8.6) und somit folgt: 

lim 

|| χ 

N||→∞ 

2 Bio(ana)( N) = +∞ . (3.17) 

Da aus der radialen Unbeschränktheit von χ2 Bio(ana) die radiale Unbeschränktheit 

von χ2 Bio(ana) folgt, ist der Satz bewiesen. 

 

3.2.1.3 Anwendung auf den Extremwertsatz von Weierstraß 

Mit dem Ergebnis, dass die χ2 Bio(ana) -Funktion unterhalbstetig und radial unbeschränkt 

ist, kann folgende Existenzaussage getroffen und bewiesen werden: 

Satz 3.5 

Das Optimierungsproblem 

min χ 2 Bio(ana)( N) , (3.18) 

u. d. N. 

N ∈ Z = R p 

≥0 

, (3.19) 

besitzt mindestens ein globales Minimum auf der zulässigen Menge Z. 

Beweis: Hier kann der erweiterte Satz von Weierstraß (Satz 8.8) aus dem Anhang 

angewendet werden. Die zulässige Menge Z ist nichtleer und abgeschlossen. Des Weiteren 

ist die Zielfunktion χ2 Bio(ana) unterhalbstetig (Satz 3.2) und radial unbeschränkt 

(Satz 3.4) auf Z. Dies sind alle Forderungen, die in Satz 8.8 gestellt werden. Damit 

besitzt die χ2 Bio(ana) -Funktion mindestens ein globales Minimum auf Z. 

 

3.2.2 Eindeutigkeit eines Minimums 

Die iterativen Verfahren, die zur numerischen Lösung des Optimierungsproblems 

verwendet werden (siehe Abschnitt 4.1), können nur lokale Minima ermitteln. Da die 

Existenz mindestens eines Minimums gezeigt ist, ist es von großer Bedeutung, ob das 

Minimum eindeutig ist oder ob noch andere existieren können. Dies ist wichtig, denn 

bei mehreren Minima könnte der entsprechende Algorithmus bei unterschiedlichen 

Startpunkten gegen unterschiedliche Lösungen konvergieren. 

Ob ein lokales Minimum gleichzeitig globales Minimum ist, wird in der Regel 

über die Konvexität der Zielfunktion gezeigt. Für den Nachweis der Eindeutigkeit 

des Minimums wird die strengere Bedingung der strikten Konvexität benötigt. Der 

entsprechene Satz dazu befindet sich im Anhang in Abschnitt 8.8. Der Nachweis der 

strikten Konvexität einer Zielfunktion ist alles andere als trivial, da zum Beispiel 

die positive Definitheit der Hesse-Matrix der Zielfunktion auf der zulässigen Menge 

42

3.3 Glättung der Zielfunktion 

gezeigt werden muss3 . Bei hochgradig nichtlinearen Optimierungsproblemen ist dies 

oft nicht möglich. 

Ist die Zielfunktion nicht konvex, heißt es nicht notwendigerweise, dass mehrere 

Minima existieren müssen. Funktionen, die nicht konvex sind, können ein eindeutiges 

Minimum haben, der Nachweis davon ist allerdings noch schwieriger als im strikt 

konvexen Fall. Dies ist jedoch die Situation bei der χ2 Bio(ana) -Funktion. Im OAR-Term 

ist die Heaviside-Funktion enthalten, diese ist nicht konvex und damit ist dann auch 

im Optimierungsproblem die Zielfunktion χ 2 Bio(ana) 

nicht konvex. Aufgrund dieser 

komplexen Situation wird auf den Nachweis der Eindeutigkeit eines Minimums im 

weiteren verzichtet. 

In [Sch06] konnte gezeigt werden, dass ein iteratives Verfahren bei unterschiedlichen 

Sartwerten in das gleiche Minimum läuft. Dies ist zwar kein mathematischer 

Nachweis der Eindeutigkiet eines Minimums, lässt dies aber vermuten. 

3.3 Glättung der Zielfunktion 

Im nächsten Abschnitt soll für das Optimierungsproblem (2.8)-(2.9) die notwendige 

Optimalitätsbedingung erster Ordnung hergeleitet werden. Bei einem restringierten 

Optimierungsproblem sind das die bekannten Karush-Kuhn-Tucker-Bedingungen 

(KKT-Bedingungen). Diese besitzen jedoch nur ihre Gültigkeit, wenn die Zielfunktion 

stetig differenzierbar4 , also eine C1-Funktion, ist [GK02]. 

Betrachtung der Stetigkeits- und Differenzierbarkeitseigenschaften der χ2 Bio(ana) - 

Funktion fand in Abschnitt 3.1 statt, mit dem Resultat, dass der Target-Term und 

der OAR-Term, ohne die Heaviside-Funktion Θ, stetig ist. Bei genauerem hinsehen 

erkennt man schnell, dass diese beiden Objekte auch stetig-differenzierbar sind, 

da sie sich ausschließlich aus stetig-differenzierbaren Teilen zusammensetzen. Lediglich 

die Heaviside-Funktion Θ ist nicht stetig, da diese eine Sprungfunktion ist. In 

diesem Abschnitt soll diese adäquat geglättet, also mit einer glatten Funktion approximiert, 

werden. Mit einer hinreichend5 guten Glättung der Heaviside-Funktion 

Θ kann eine hinreichend gute Approximation der χ2 Bio(ana) -Funktion erreicht werden, 

die stetig-differenzierbar ist. Für die geglättete Zielfunktion können dann anschließend 

im folgenden Abschnitt die KKT-Bedingungen hergeleitet werden. 

Es gibt mehrere Möglichkeiten, die Heaviside-Funktion Θ hinreichend gut zu glätten. 

Eine Möglichkeit wäre, sie mit einem Polynom, z.B. einem Polynom dritten Grades, 

zu glätten. In dieser Arbeit soll die Heaviside-Funktion Θ mit einer angepassten Tangens 

Hyperbolicus-Funktion geglättet werden, da sich diese dafür relativ gut eignet. 

Eine Tangens Hyperbolicus-Funktion ist glatt und damit stetig-differenzierbar. 

3 Der Nachweis der positiven Definitheit einer Matrix kann oft nur über die Eigenwerte gezeigt 

werden. Bei großen Matrizen ist die Eigenwertberechnung extrem aufwendig. 

4 Eine stetig differenzierbare Funktion besitzt die Eigenschaft, dass ihre Ableitung mindestens 

stetig ist. 

5 Mit hinreichend glatt ist gemeint, dass eine Funktion hinreichend oft differenzierbar ist. 

43


a = 1 

a = 2 

a = 10 

Θ(x) 

1.0 

0.8 

0.6 

0.4 

0.2 

4 2 2 4 

0 

Abbildung 3.2: Graphische Veranschaulichung der Glättung der Heaviside-Funktion Θ(x). Die 

Heaviside-Funktion ist die rote Funktion, die Tangens Hyperbolicus-Funktionen werden von den 

anderen Farben repräsentiert. Es ist zu erkennen, dass die Heaviside-Funktion Θ(x) gut mit der 

tanh-Funktion aus (3.20) im glatten Sinne approximiert werden kann. Je größer der Parameter 

a > 0 gewählt wird, desto besser ist die Approximation der Heaviside-Funktion Θ(x). Bereits 

mit a = 10 erhält man eine relativ gute Approximation, da der Sprung an der Stelle x = 0 gut 

nachgestellt werden kann. 

Eine Heaviside-Funktion Θ(x), x ∈ R, kann mit folgender Funktion im glatten 

Sinne hinreichend gut approximiert werden: 

Θ(x) ≈ 1 1 

+ · tanh(a · x) = 

2 2 

1 

1 + e −2a·x , x ∈ R , a ∈ R>0 . (3.20) 

Je größer der Parameter a, desto besser ist diese Approximation, da der vertikale 

Sprung an der Stelle x = 0 besser nachgestellt werden kann (siehe Abbildung 3.2). 

Des weiteren gilt, wenn x = 0 vorausgesetzt wird: 

 

1 1 

Θ(x) = lim + · tanh(a · x) . (3.21) 

a→∞ 2 2 

Die Konvergenzgeschwindigkeit in (3.21) hängt von der Variablen x ab. 

Obiges kann dann einfach auf die Heaviside-Funktion Θ in der Zielfunktion 

aus (3.1) folgendermaßen übertragen werden: 

χ 2 Bio(ana) 

 

Θ D i Bio(ana)( N) − D i 

max ≈ 1 1 

 

+ · tanh a · D 

2 2 i Bio(ana)( N) − D i 

max 

x 

, (3.22) 

mit einem hinreichend großen a > 0. Jetzt ist es möglich eine hinreichend gute 

Approximation der Zielfunktion χ2 Bio(ana) mit einer stetig-differenzierbaren Funktion 

anzugeben. Die Approximierende wird mit χ2 Bio(glatt) bezeichnet und hat folgende 

44

Struktur: 

χ 2 Bio(glatt)( N) = 

+ 

i∈OAR 

mit χ 2 Bio(glatt) 

 


∆D 

i∈Target 

2 pre 

 

Di max − Di Bio(ana) ( 2 N) 

∆D 2 max 

· 

3.4 Karush-Kuhn-Tucker-Bedingungen 

 

1 1 

 

+ · tanh a · D 

2 2 i Bio(ana)( N) − D i 

max 

 

: Rp 

≥0 → R≥0. Bei einem hinreichend großen a > 0 gilt dann: 

, 

(3.23) 

χ 2 Bio(ana)( N) ≈ χ 2 Bio(glatt)( N) . (3.24) 

Es ist offensichtlich, dass je größer der Parameter a > 0 gewählt wird, desto besser 

ist die Approximation in (3.24). 

Die χ2 Bio(glatt) -Funktion ist glatt, da sie ausschließlich aus glatten Teilen besteht. 

Eine Komposition von glatten Funktionen induziert wiederum eine glatte Funktion. 

Daher kann mindestens davon ausgegangen werden, dass die χ2 Bio(glatt) -Funktion 

stetig-differenzierbar ist, also dass mindestens 

und damit 

χ 2 Bio(glatt) ∈ C 1 ( N) (3.25) 

∇χ 2 Bio(glatt) ∈ C 0 ( N) p 

(3.26) 

gilt. Die Bedingungen (3.25) und (3.26) sind mathematisch ausreichend für die im 

folgenden stattfindende Herleitung und Diskussion der KKT-Bedingungen. 


In der Optimierung spielen die notwendigen Optimalitätsbedingungen eine bedeutende 

Rolle. Notwendige Optimalitätsbedingungen sind Kriterien, die notwendigerweise 

von einem lokal optimalen Punkt NOpt erfüllt werden müssen. 

Bei der unrestringierten Optimierung ist die notwendige Optimalitätsbedingung 

erster Ordnung einfach. Diese ist nichts weiter, als das ein lokal optimaler Punkt 

NOpt stationär 6 sein muss, also dass folgendes gilt: 

∇χ 2 ( NOpt) = 0 . (3.27) 

Für die restringierte Optimierung kann die notwendige Optimalitätsbedingung erster 

Ordnung aus (3.27) nicht einfach so übernommen werden. Der Grund ist, dass bei 

der restringierten Optimierung lokal optimale Punkte nicht notwendigerweise (3.27) 

6 Mit Stationarität ist der geometrisch anschauliche Fall gemeint, dass in einem Punkt die Tangenten 

in alle möglichen Richtungen keine Steigung haben. 

45


erfüllen müssen. Daher muss (3.27) geeignet erweitert werden, was zu den Karush- 

Kuhn-Tucker-Bedingungen (KKT-Bedingungen) führt. 

Bevor die KKT-Bedingungen hergeleitet werden, wird hier nochmals für eine bessere 

Übersicht das Optimierungsproblem aufgeschrieben. Dabei wird als Zielfunktion 

χ 2 Bio(glatt) betrachtet: 

min χ 2 Bio(glatt)( N) , (3.28) 

u. d. N. Nj ≥ 0 ⇔ −Nj ≤ 0 ∀ j = 1, . . . , p , (3.29) 

p ist der größte/letzte Index eines Rasterpunktes. 

Die KKT-Bedingungen lassen sich übersichtlicher mit der Lagrange-Funktion 

aufstellen. Zu dem obigen Optimierungsproblem (3.28)-(3.29) sieht die Lagrange- 

Funktion L wie folgt aus: 

L( N, λ) = χ 2 Bio(glatt)( N) + 

p 

λj · (−Nj) , (3.30) 

mit L : R p × R p → R. λ ist der sogenannte Lagrange-Multiplikator. Die Lagrange- 

Funktion fasst somit ein allgemeines Optimierungsproblem (also Zielfunktion und 

alle Nebenbedingungen) in einer Funktion L zusammen. Weiteres zur Lagrange- 

Funktion findet sich z.B. in [Ulb07, GK02]. 

Mit Hilfe der Lagrange-Funktion L aus (3.30) können jetzt die KKT-Bedingungen 

angegeben werden: 

Karush-Kuhn-Tucker-Bedingungen zu (3.28)-(3.29) 

Es existiert ein ¯ λ ∈ R p mit 

1) −N Opt 

j 

j=1 

≤ 0 ∀ j = 1, . . . , p (Zulässigkeit) , (3.31) 

2) ∇ N L( NOpt, ¯ λ) = 0 (Multiplikatorregel) , (3.32) 

3) ¯ λ ≥ 0 , ¯ λ T · (− NOpt) = 0 (Komplementaritätsbedingung) . (3.33) 

1) ist offensichtlich und besagt nichts weiter, als dass alle Optimierungskomponenten 

in der zulässigen Menge (3.29) liegen müssen. Die Ungleichung in 3) ist komponentenweise 

zu verstehen. Der Ausdruck in 2) 

∇ N L( NOpt, ¯ λ) (3.34) 

ist der Gradient der Lagrange-Funktion bzgl. der Variablen N. Ausgeschrieben sieht 

dieser folgendermaßen aus: 

∇ N L( NOpt, ¯ λ) = ∇χ 2 Bio(glatt)( NOpt) − ¯ λ . (3.35) 

Mit den obigen KKT-Bedingungen kann jetzt für das Optimierungsproblem (3.28)- 

(3.29) die notwendige Optimalitätsbedingung erster Ordnung angegeben werden: 

46


Satz 3.6 

Sei NOpt ein lokales Minimum des Optimierungsproblemes (3.28)-(3.29). Sind zudem 

die Zielfunktion und alle auftretenden Nebenbedingungen stetig-differenzierbar, 

dann gelten für NOpt die KKT-Bedingungen (3.31)-(3.33). 

Bemerkungen: 

• Das Resultat, dass die Zielfunktion (3.28) stetig-differenzierbar ist, befindet 

sich in Abschnitt 3.3. Dass die Nebenbedingungen (3.29) stetig-differenzierbar 

sind, ist trivial. 

• Ein Punkt NOpt, der (3.31)-(3.33) erfüllt, wird KKT-Punkt oder stationärer 

Punkt des Optimierungsproblems genannt. 

• Die KKT-Bedingungen können als eine Art der Abstraktion des geometrischen 

Begriffes der Stationarität interpretiert werden. 

• Das KKT-System kann, weil die Nebenbedingungen in (3.29) einfach sind, in 

die äquivalente und anschaulichere Form umformuliert werden: 

∇χ 2 Bio(glatt)( NOpt)j = 

 

0 falls − N Opt 

j 

≥ 0 sonst . 

< 0 , 

(3.36) 

Bei der ersten Zeile in (3.36) ist die Optimierungskomponente j im strikt inneren 

der zulässigen Menge und bei der zweiten Zeile liegt die Optimierungskomponente 

j auf dem Rand der zulässigen Menge. 

(3.36) kann in einem numerischen Optimierungsverfahren, in leicht abgewandelter 

Form, als Abbruchkriterium verwendet werden. Dazu mehr am Ende 

von Abschnitt 4.1. 

• In der KKT-Theorie spielt der Begriff "Abadie Constraint Qualification" eine 

wesentliche Rolle. Dabei sind die Begriffe Tangentialkegel und Linearisierungskegel, 

als auch deren Beziehung zueinander, von großer Bedeutung. Die 

KKT-Bedingungen gelten nämlich nur, wenn für ein lokales Optimum NOpt 

die "Abadie Constraint Qualification" erfüllt ist. Bedingungen, die die "Abadie 

Constraint Qualification" sicherstellen, werden in der Optimierung als 

"Constraint Qualifications" bezeichnet, von denen mehrere existieren. Eine 

von den "Constraint Qualifications" ist, dass in einem nichtlinearen Optimierungsproblem 

alle auftretenden Nebenbedingungen linear sind. Dies ist bei 

dem Optimierungsproblem (3.28)-(3.29) der Fall und damit gilt die "Abadie 

Constraint Qualification" für ein lokales Minimum NOpt. Daher besitzen die 

KKT-Bedingungen (3.31)-(3.33) für das Optimierungsproblem (3.28)-(3.29) 

ihre Gültigkeit. 

47


48 

Weiter soll hier auf die "Abadie Constraint Qualification" und "Constraint 

Qualifications" nicht eingegangen werden, da dies umfangreich ist und im weiteren 

Verlauf dieser Arbeit nicht mehr benötigt wird. Näheres dazu findet sich 

z.B in [Ulb07, GK02].

4 Nichtlineare Optimierung 

In diesem Kapitel wird das Wichtigste zur numerischen Lösung des Optimierungsproblems 

(2.8)-(2.9) zusammengefasst. Der erste Abschnitt gibt eine Einführung in 

die sogenannten Linesearch-Verfahren. Im darauffolgenden Abschnitt werden zwei 

Schrittweitenstrategien vorgestellt. In Abschnitt 4.3 wird die Voroptimierung erklärt. 

Diese ist wichtig, den das Ergebnis der Voroptimierung wird als Startpunkt 

für die Linesearch-Verfahren verwendet. Der letzte Abschnitt behandelt noch einige 

Details zur numerischen Optimierung, wie z.B. die verwendete Rechnerarchitektur 

und der verwendete Bestrahlungsplan, über die Bewertung der Verfahren und abschließend 

zwei Bemerkungen zur Implementierung der Verfahren. 

Bemerkung: Die Kapitel 4, 5 und 6 beschäftigen sich mit der numerischen Lösung des 

Optimierungsproblemes (2.8)-(2.9). Dabei wird ausschließlich die RBW-gewichtete 

Dosis optimiert. Die RBW-Werte werden in dieser Arbeit mit der ersten Version 

des LEMs, das LEM I, berechnet. Aus Platzgründen wird die Zielfunktion in den 

Kapiteln 4, 5 und 6 nicht mehr mit χ2 Bio(ana) oder χ2Bio bezeichnet, sondern nur noch 

mit χ2 . 

4.1 Numerische Minimierung mit 

Linesearch-Verfahren 

Die Nichtlinearität des Optimierungsproblemes (2.8)-(2.9) lässt keine analytische 

Lösung zu. Die einzige Möglichkeit, einen Lösungsvektor NOpt zu erhalten, ist eine 

Lösung mit numerischen Methoden. Da die Zielfunktion minimiert werden soll, ist 

es naheligend, mit einem Iterationsverfahren ein Abstiegsverfahren zu erzeugen. Bei 

einem Abstiegsverfahren erüllt eine Folge Nk, ausgehend von einem Startpunkt N0, 

die folgende Bedingung: 

χ 2 ( Nk+1) < χ 2 ( Nk) , k = 0, 1, 2, 3, . . . . (4.1) 

k ist der Iterationsindex des Verfahrens. Ziel ist es, dass die Folge Nk gegen ein 

NOpt konvergiert. Es gibt zwei Klassen von Abstiegsverfahren, die sogenannten 

Linesearch-Verfahren und die Trust-Region-Verfahren [Ulb07]. In dieser Arbeit werden 

nur Linesearch-Verfahren verwendet. Linesearch-Verfahren sind die klassischen 

Verfahren zur Lösung nichtlinearer Optimierungsaufgaben und sind bis jetzt besser 

untersucht. Trust-Region-Verfahren spielen eher bei neueren Verfahrenskonzepten 

eine Rolle [Alt02]. 

49


Ein Linesearch-Verfahren verwendet bei der Berechnung von Nk+1 eine Abstiegsrichtung 

dk mit der Eigenschaft 

∇χ 2 ( Nk) T · dk < 0 , dk ∈ R p 

. (4.2) 

Bei dem Ausdruck in (4.2) handelt es sich um die Richtungsableitung der Funktion 

χ 2 an der Stelle Nk in Richtung dk. Ist diese Richtungsableitung negativ, dann heißt 

das, dass wenn man an der Stelle Nk in Richtung dk losläuft, man sich zumindest 

anfangs in der Zielfunktionstopologie nach unten bewegt. Des Weiteren wird noch 

eine Schrittweite µk benötigt, so dass 

gilt und die Abnahme 

χ 2 ( Nk + µk dk) < χ 2 ( Nk) , µk ∈ R>0 , (4.3) 

χ 2 ( Nk) − χ 2 ( Nk + µk dk) (4.4) 

ausreichend groß ist. Berechnung der Schrittweite wird als Schrittweitenbestimmung 

oder -steuerung bezeichnet. Auf diese wird im nächsten Abschnitt näher eingegangen. 

Bemerkung: Die mathematischen Forderungen k = 0, 1, 2, 3, . . ., dk ∈ R p und µk ∈ 

R>0 gelten für den Rest dieser Arbeit und werden im weiteren Verlauf nicht mehr 

explizit angegeben. 

Ohne die Berechnung von Abstiegsrichtungen dk und Schrittweiten µk zu spezifizieren, 

hat ein Linesearch-Verfahren im allgemeinen folgende Verfahrensvorschrift: 

Algorithmus: Allgemeines Linesearch-Verfahren 

1. Wähle einen Startpunkt N0 und setze k := 0. 

2. Falls eine Abbruchbedingung erfüllt ist, dann steige mit der Lösung Nk aus. 

3. Bestimme eine Abstiegsrichtung dk. 

4. Berechne eine Schrittweite µk. 

5. Berechne einen neuen Teilchenzahlenvektor Nk+1 = Nk + µk dk. 

6. Setze k := k + 1 und gehe zurück zu Schritt 2. 

Bemerkungen: 

50 

• Sind die Abstiegsrichtungen dk hinreichend gut und die Schrittweiten µk realisieren 

einen ausreichenden Abstieg, dann ist in der Regel die Konvergenz eines 

Linesearch-Verfahrens gewährleistet. 

• Mit einem Linesearch-Verfahren können nur lokale Minima bestimmt werden.

4.1 Numerische Minimierung mit Linesearch-Verfahren 

Üblicherweise wird im zweiten Punkt des allgemeinen Linesearch-Verfahrens als 

Abbruchkriterium die Stationarität an der Stelle Nk getestet, also: 

∇χ 2 ( Nk) = 0 . (4.5) 

Dieses Abbruchkriterium ist zum einem numerisch nicht realisierbar und zum anderen 

kann es bei restringierten Optimierungsproblemen nicht verwendet werden, da in 

diesem Fall Minima nicht notwendigerweise (4.5) erfüllen müssen. Dieser Fall kann 

zum Beispiel eintreten, wenn das Minimum auf dem Rand der zulässigen Menge liegt. 

Dies wurde bereits in Abschnitt 3.4 angesprochen. Um unnötig lange Rechenzeiten 

zu vermeiden, können folgende Abbruchkriterien verwendet werden: 

• Die relative Änderung der Zielfunktionswerte unterscheidet in aufeinanderfolgenden 

Iterationsschritten einen bestimmten Wert: 

|χ 2 ( Nk−1) − χ 2 ( Nk)| 

χ 2 ( Nk−1) 

< ɛ1 , χ 2 ( Nk−1) = 0 ∀ k . (4.6) 

• Wenn der Abstand zwischen zweier aufeinanderfolgender Schritte einen bestimmten 

Wert unterschreitet: 

|| Nk−1 − Nk|| < ɛ2 . (4.7) 

Als Norm wird irgendeine von den p-Normen für endlichdimensionale Vektorräume 

R n verwendet. In der Regel wird p = 2 (Euklidische Norm) oder p = ∞ 

(Maximumsnorm) bevorzugt. 

• Ein Abbruchtest, ob mit einem Verfahren ein stationärer Punkt erreicht wurde, 

muss wie folgt implementiert werden: 

∇χ 2 ( 

< ɛ3 falls (−Nk)j < 0 , 

Nk)j = 

(4.8) 

≥ 0 sonst . 

Hierbei handelt es sich um eine numerische Umsetzung der KKT-Bedingungen 

aus (3.36). 

• Wird keines der oberen Abbruchkriterien erfüllt, dann steigt das Verfahren 

nach einer festgelegten Anzahl an Iterationsschritten aus. 

Bemerkungen: 

• Für ɛ1, ɛ2 und ɛ3 werden üblicherweise Werte aus dem Intervall [10 −2 , 10 −8 ] 

gewählt. 

• Die ersten zwei Abbruchbedingungen können erst ab der zweiten Iteration des 

Linesearch-Verfahrens geprüft werden. 

51


4.2 Schrittweitenstrategien 

Um konvergente Linesearch-Verfahren zu erhalten, müssen effiziente Schrittweiten 1 

berechnet werden. Es ist naheliegend, die Schrittweite µk über das eindimensionale 

Optimierungsproblem 

µk = argmin µ∈[0, µmax] χ 2 ( Nk + µ dk) , µmax ∈ (0, ∞] , (4.9) 

zu berechnen. Diese Schrittweite wird exakte Schrittweite genannt [Alt02]. In der 

Regel kann bei nichtlinearen Optimierungsproblemen die exakte Schrittweite analytisch 

nicht berechnet werden. Eine numerische Lösung ist prinzipiell möglich, jedoch 

zu zeitaufwendig. 

Im folgenden werden zwei Schrittweitenstrategien beschrieben, mit denen eine gute 

Näherung der exakten Schrittweite berechnet werden kann, ohne den Ausdruck 

(4.9) numerisch lösen zu müssen. Mit beiden Varianten kann viel Rechenzeit gespart 

werden. 

4.2.1 Schrittweitenbestimmung über Dämpfung der 

Physik-Schrittweite 

Vorab werden für diesen Unterabschnitt die folgenden Bezeichnungen eingeführt: 

• Exakte Schrittweite bei Optimierung der RBW-gewichteten Dosis := µBio. 

• Exakte Schrittweite bei Optimierung der physikalischen Dosis und Vernachlässigung 

des OAR-Terms := µPhys. 

Optimierung der RBW-gewichteten Dosis ist nichtlinear und das daraus resultierende 

eindimensionale Optimierungsproblem (4.9) für die exakte Schrittweite µBio kann 

analytisch nicht gelöst werden. Bei Optimierung der linearen physikalischen Dosis 

und Vernachlässigung des OAR-Terms in der Zielfunktion (OAR-Term muss wegen 

der Heaviside-Funktion weggelassen werden) liegt ein quadratisches Optimerungsproblem 

vor. In diesem Fall ergibt sich dann für (4.9) ebenfalls ein quadratisches 

Optimierungsproblem. Dieses ist sogar streng konvex und das eindeutige µPhys kann 

analytisch berechnet werden. Ziel ist es hier, über die Schrittweite µPhys durch Skalierung 

an eine gute Schrittweite µBio zu gelangen. 

Die genaue Berechnungsvorschrift von µPhys befindet sich im Anhang in Abschnitt 

8.9. Die Idee bei der hier beschriebenen Schrittweitenstrategie ist, µPhys zu berechnen 

und anschließend mit einem Faktor fµ zu skalieren um an eine gute Approximation 

von µBio zu gelangen. Die Approximation von µBio wird mit µBio bezeichnet und 

berechnet sich demnach wie folgt: 

µBio = fµ · µPhys , fµ ∈ R>0 . (4.10) 

1 Effiziente Schrittweiten implizieren sog. zulässige Schrittweiten. Die Definition von effizienten 

und zulässigen Schrittweiten findet sich z.B. in [Ulb07]. 

52

fµ 

Dosis [Gy (RBW)] 

4.2 Schrittweitenstrategien 

Abbildung 4.1: "Ideale" Skalierungswerte fµ für µPhys in Abhängigkeit der vorgeschriebenen Dosis. 

Die Daten wurden aus zwei verschiedenen Patientenplänen mit zwei unterschiedlichen Methoden 

ermittelt. Die "Dreicek"-Daten wurden aus einem Patientenplan mit einem dynamischen Suchalgorithmus 

gewonnen. Dies ist detailliert in [Hor08] beschrieben. Die "Quadrat"-Daten wurden in 

einem anderen Patientenplan mit vielen statistischen Auswertungen ermittelt. Näheres hierzu ist in 

[Sch06] veröffentlicht. Die gute Übereinstimmung beider Datensätze und gute Konvergenzergebnisse 

mit diesen Daten in anderen Patientenplänen deuten auf deren allgemeine Gültigkeit. Deutlich 

ist zu erkennen, dass bei steigender vorgeschriebener Dosis der Skalierungsfaktor fµ erhöht werden 

sollte. 

Es hat sich gezeigt, dass ein guter Parameter fµ von der vorgeschriebenen Dosis 

Dpre abhängt. Zum Beispiel werden die besten Konvergenzergebnisse bei einer vorgeschriebenen 

Dosis von 3Gy (RBW) mit dem Dämpfungsfaktor fµ = 0.5 erreicht. 

Weitere "Idealwerte" von fµ zu verschiedenen vorgeschriebenen Dosen können aus 

Abbildung 4.1 entnommen werden. Weitere Details und die Beschaffung der Werte 

aus dieser Abbildung befinden sich in [Sch06] und [Hor08]. 

4.2.2 Die Schrittweitenregel von Armijo 

Die Armijo-Regel ist ein einfach zu implementierendes Schrittweitenverfahren mit 

dem relativ schnell eine geeignete Schrittweite µk berechnet werden kann. Sie wird 

oft bei nichtlinearen Optimierungsproblemen zur Schrittweitensteuerung verwendet. 

Hier wird nur das Nötigste zur Armijo-Regel angegeben. Eine ausführlichere Behandlung 

findet sich z.B. in [Alt02, Ulb07]. 

Armijo-Verfahren: 

Es wird eine hinreichend große Startschrittweite benötigt, die als µmax bezeichnet 

wird. Des Weiteren seien δ ∈ (0, 1) und γ ∈ (0, 1) fest gewählte Konstanten. 

Bestimme die größte Schrittweite µk ∈ {µmax, µmaxδ, µmaxδ 2 , . . .}, für welche die 

53


folgende Ungleichung erfüllt ist: 

Bemerkungen: 

χ 2 ( Nk) − χ 2 ( Nk + µk dk) ≥ −γµk∇χ 2 ( Nk) T · dk . (4.11) 

• Häufig wird für die Parameter δ = 0.5 und γ = 10 −2 gewählt [Alt02]. Beide 

Konstanten sind unabhängig von Nk und dk. 

• Bei bestimmten Voraussetzungen ist das Armijo-Verfahren wohldefiniert und 

liefert nach endlich vielen Schritten eine effiziente Schrittweite. 

• Die Startschrittweite µmax sollte hinreichend groß gewählt werden, da das 

Armijo-Verfahren die Schrittweite nur verkleinern kann. 

• Das Armijo-Verfahren greift in der Regel schnell, wenn für µmax eine gute 

Approximation der exakten Schrittweite gewählt wird. 

• Als Startschrittweite kann zum Beispiel µPhys oder µBio (siehe vorherigen Unterabschnitt) 

gewählt werden. 

• Die Schrittweite 

µmax,k = − 

∇χ 2 ( Nk) T · dk 

2(χ 2 ( Nk + dk) − χ 2 ( Nk) − ∇χ 2 ( Nk) T · dk) 

(4.12) 

ist eine Approximation der exakten Schrittweite und damit geeignet als Startschrittweite 

für das Armijo-Verfahren. Setzt man 

ϕk(µ) = χ 2 ( Nk + µ dk) , (4.13) 

mit ϕk : R≥0 → R≥0 ∀k, so ist die Schrittweite (4.12) die exakte Schrittweite 

des quadratischen Interpolationspolynomes von (4.13) durch die Punkte 

ϕ(0) = χ 2 ( Nk) , ϕ ′ (0) = ∇χ 2 ( Nk) T · dk , ϕ(1) = χ 2 ( Nk + dk) . (4.14) 

4.3 Voroptimierung 

Linesearch-Verfahren arbeiten ausgehend von einem Startpunkt N0. Generell hat 

die Wahl des Startvektors einen großen Einfluss auf das Konvergenzverhalten des 

entsprechenden Verfahrens. Sind bei einer Zielfunktion mehrere Minima vorhanden, 

dann läuft der Algorithmus in der Regel vom Startpunkt in das nächstgelegene Minimum. 

Je näher der Startvektor an einem Minimum liegt, desto schneller konvergiert 

in der Regel das Verfahren. Die besten Konvergenzergebnisse können erwartet werden, 

wenn der Startvektor eine gute Approximation des gesuchten Minimums ist, 

also: 

N0 ≈ NOpt . (4.15) 

54

4.4 Ressourcen, Daten und Bemerkungen zur Optimierung 

Da der Startvektor für das Konvergenzverhalten des Verfahrens von großer Bedeutung 

ist, wird er nicht willkürlich gewählt. Bevor die eigentliche Optimierung 

beginnt, ist in TRiP ein Voroptimierung implementiert, die einen geeigneten Startvektor 

N0 generiert. Die Voroptimierung läuft als Einzelfeldoptimierung ab, wo die 

Felder einzeln und unabhängig voneinander optimiert werden. Dabei werden OAR’s 

nicht berücksichtigt. Mit dem aus der Voroptimierung resultierendem Startvektor 

N0 kann bereits eine gute Dosisverteilung im Targetvolumen erzeugt werden, jedoch 

eine hohe Dosis in den OAR’s. Die Voroptimierung dauert in der Regel weniger als 

eine Minute. Details zur Voroptimierung finden sich in [G + 08, K + 00]. 

4.4 Ressourcen, Daten und Bemerkungen zur 

Optimierung 

4.4.1 Verwendete Rechnerarchitektur 

Alle Berechnungen wurden mit einem IBM PS701 Blade Server Rechner auf einem 

3GHz Power7 Prozessor ausgeführt. 

4.4.2 Verwendeter Patientenplan 

Als Referenz für die Minimierungsergebnisse der χ 2 -Funktion wird der Patientenplan 

#135 verwendet. Eine bearbeitete CT-Scheibe dieses Patientenplans ist in Abbildung 

2.1 zu sehen. Neben dem Tumor (Targetvolumen) wird als OAR lediglich 

der Hirnstamm betrachtet. Dies ist ein vereinfachter Patientenplan, da bei der Bestrahlungsplanung 

oft mehrere OAR’s betrachtet werden müssen. Die Hinzunahme 

weiterer OAR’s ändert jedoch nicht die mathematische Struktur der Zielfunktion. 

Die vorgeschriebene Dosis D i pre wird in jedem Target-Voxel i auf 3Gy (RBW) gesetzt. 

Die maximale Dosisgrenze D i max wird für jedes OAR-Voxel i auf 1.5Gy (RBW) 

gesetzt. Dies sind typische Werte für einzelne Fraktionen in der Therapie. Minimierungsergebnisse 

in anderen Patientenplänen mit diesen Einstellungen sind alle ähnlich. 

Es folgen noch einige Daten zum hier verwendeten Patientenplan #135: 

Anzahl der Voxel im Targetvolumen : 19200 

Anzahl der Voxel im OAR-Volumen : 4400 

Anzahl der Rasterpunkte : 19600 

Anzahl der Bestrahlungsfelder : 2 

Speicher für die Dosis-Korrelations-Matrix : 440MB 

Bemerkung: Die Anzahl der Rasterpunkte in einem Patientenplan ist zugleich die 

Dimension des Optimierungsproblems p. Bei p = 19600, wie im oberen Beispiel, 

55


handelt es sich eher um einen kleineren Tumor. Bis zu 100000 Rasterpunkte als 

auch Voxel können in der Bestrahlungsplanung auftreten. 

4.4.3 Bewertung der Algorithmen 

In den folgenden Kapiteln werden verschiedene Linesearch-Verfahren auf das Optimierungsproblem 

(2.8)-(2.9) angewendet bei Verwendung des obigen Patientenplanes. 

Für die einzelnen Verfahren werden in dieser Arbeit die folgenden Bewertungsmaßstäbe 

betrachtet: 

• Minimierung der Zielfunktion als Funktion der Iterationsschritte. 

• Minimierung der Zielfunktion als Funktion der Rechenzeit. 

• Speicheranforderung des entsprechenden Verfahrens. 

Bei den Minimierungsplots werden auf der Ordinatenachse die Funktionswerte der 

χ 2 -Funktion dividiert durch die Anzahl der Freiheitsgrade, also NDF (siehe Unterabschnitt 

2.3.1), dargestellt. Dies kann als eine Art "Normierung" interpretiert 

werden. Des Weiteren wird die Ordinatenachse logarithmisch angezeigt. 

4.4.4 Bemerkungen und Details zur Implementierung 

Detektionslimit der Ionisationskammern 

Bei der Bestrahlung werden die Teilchenzahlen für die Rasterpunkte werden mit 

Ionisationskammern gemessen (siehe Abschnitt 1.5). Ionisationskammern besitzen 

ein unteres Detektionslimit. Unter dem Detektionslimit kann die genaue Anzahl der 

durchquerenden Teilchen nicht mehr sicher bestimmt werden. Das untere Detektionslimit, 

der bei GSI verwendeten Ionisationskammern, beträgt 5000. Dieses muss 

bei der Bestrahlungsplanung berücksichtigt werden und ist daher in TRiP eingearbeitet. 

[G + 08] 

In jedem Iterationsschritt werden am Ende neue Teilchenzahlen Nk+1 berechnet. 

Ist von dem neuen Teilchenzahlenvektor Nk+1 eine Komponente kleiner als 5000, 

dann wird diese auf 0 gesetzt. Im darauffolgenden Iterationsschritt besteht für die 

Komponente wieder die Möglichkeit auf mindestens 5000 zu gelangen. Es hat sich 

jedoch gezeigt, dass wenn eine Komponente während der Iteration auf 0 fällt, dass 

diese fast immer in den darauffolgenden Iterationsschritten unter 5000 bleibt. Auswertungen 

haben ergeben, dass von diesem Effekt weniger als 5% der Rasterpunkte 

(also Komponenten von Nk+1) betroffen sind [Sch06]. Daher würde sich eine Dimensionsverkleinerung 

des Optimierungsproblems, während dem Optimierungsprozess, 

um Rechenzeit zu sparen, nicht besonders lohnen. 

56

Abbruchkriterien für die Iteration 

4.4 Ressourcen, Daten und Bemerkungen zur Optimierung 

Am Ende von Abschnitt 4.1 werden mögliche numerische Abbruchkriterien für ein 

Linesearch-Verfahren genannt. Gegenwärtig ist in TRiP nur das erste implementiert, 

also (4.6). Dabei wird ɛ1 = 10 −8 gewählt. Die Abbruchschranke ɛ1 wird hier 

bewusst so klein gewählt, damit die Algorithmen länger "ausgereizt" werden und ihr 

Konvergenzverhalten kann in einem längeren Iterationsprozess beobachtet werden. 

Es ist geplant, in naher Zukunft, auch das zweite und dritte Abbruchkriterium, also 

(4.7) und (4.8), zu implementieren. 

Falls nicht anders erwähnt, wird die maximale Anzahl der Iterationsschritte auf 

100 gesetzt. 

57

5 Gradientenverfahren und 

konjugiertes 

Gradientenverfahren 

Dieses Kapitel beschäftigt sich mit den Gradientenverfahren. Abschnitt 5.1 geht auf 

das Gradientenverfahren ein und Abschnitt 5.2 auf das konjugierte Gradientenverfahren. 

Dabei werden Bemerkungen, Vor- und Nachteile und die Iterationsvorschrift 

der Verfahren angegeben. Im letzten Abschnitt dieses Kapitels werden die Minimierungsergebnisse, 

die mit beiden Verfahren erzielt werden, gezeigt und diskutiert. 

Bemerkung: Als Schrittweite wird beim Gradientenverfahren als auch beim konjugierten 

Gradientenverfahren die gedämpfte Physik-Schrittweite, also µBio, verwendet. 

D.h., es wird ein µPhys berechnet (siehe Abschnitt 8.9) und dieses wird mit einem 

Parameter fµ multipliziert. Genaueres zu dieser Schrittweitensteuerung findet sich 

in Unterabschnitt 4.2.1. Da als vorgeschriebene Dosis 3Gy (RBW) verwendet wird, 

so wird für den Dämpfungsfaktor fµ = 0.5 gewählt (siehe Abbildung 4.1). Eine Implementierung 

der Armijo-Schrittweite in das Gradientenverfahren und konjugierte 

Gradientenverfahren ist in naher Zukunft geplant. 

5.1 Das Gradientenverfahren 

Das Gradientenverfahren (GRV), auch Verfahren des steilsten Abstiegs genannt, ist 

ein klassisches Verfahren der nichtlinearen Optimierung. Das GRV macht in jedem 

Iterationsschritt einen Schritt in die Richtung des steilsten Abstiegs der Zielfunktion. 

Die Richtung des steilsten Abstiegs einer Funktion ist der negative Gradient der 

Funktion. 

Algorithmus: Gradientenverfahren (GRV) 

Da das GRV ein so einfacher und übersichtlicher Algorithmus ist, wird hier nicht die 

ganze Verfahrensvorschrift angegeben. Das GRV kann sehr einfach in das allgemeine 

Linesearch-Verfahren aus Abschnitt 4.1 eingebaut werden. Der einzige Punkt, 

der beachtet werden muss, ist, dass in jedem Iterationsschritt die Suchrichtung 

dk = −∇χ 2 ( Nk) verwendet wird. 

58

Bemerkungen: 

5.2 Das konjugierte Gradientenverfahren 

• Das GRV ist robust und einfach zu implementieren, weswegen es häufig in den 

Anwendungen benutzt wird. 

• Bei gewissen Voraussetzungen ist das GRV ein global konvergentes Verfahren 1 

[Ulb07]. 

• Oftmals konvergiert das GRV langsam, da es sich dem Minimum mit einem 

Zick-Zack-Kurs nähert. 

• Der Betrag/Norm des Gradienten an einer Stelle Nk ist ein Maß für die Steigung 

der Funktion an dieser Stelle. Ist das Minimum in einer flachen Region 

lokalisiert, so ist das GRV dort ineffizient, de es in der Regel nur noch kleine 

Schritte macht. Auf der anderen Seite arbeitet das GRV im Einzugsgebiet 

relativ schnell. 

• Da das GRV lediglich mit dem Gradienten der Zielfunktion und einer Schrittweite 

arbeitet, müssen keine großen Speicherressourcen zur Verfügung gestellt 

werden. 

5.2 Das konjugierte Gradientenverfahren 

Bei dem konjugierten Gradientenverfahren (KGV), auch Verfahren konjugierter Richtungen 

genannt, handelt es sich um eine Modifizierung des Gradientenverfahrens. 

Die Idee der Verwendung von konjugierten Richtungen [Ste04] ist, dass die Information, 

über die Abstiegsrichtung aus dem vorherigen Iterationsschritt, in den neuen 

Schritt mitgenommen wird. Dadurch kann ein ausgeprägter Zick-Zack-Verlauf des 

Verfahrens vermieden werden und das Verfahren besitzt in der Regel bessere Konvergenzeigenschaften 

als das GRV. Die Struktur der Iterationsvorschrift ist etwas 

aufwändiger, jedoch kostet ein Schritt nicht viel mehr Rechenzeit als beim GRV. 

Algorithmus: Konjugiertes Gradientenverfahren (KGV) 

1. Wähle einen Startpunkt N0. 

2. Berechne h0 = d0 = −∇χ 2 ( N0). 

3. Setze k := 0. 

4. Bestimme eine Schrittweite µk. 

5. Berechne einen neuen Teilchenzahlenvektor Nk+1 = Nk + µk hk. 

6. Falls eine Abbruchbedingung erfüllt ist, dann steige aus. 

1 Unter globaler Konvergenz versteht man, dass ein Verfahren unabhängig vom Startpunkt zu 

einer Lösung hin konvergiert. 

59

5 Gradientenverfahren und konjugiertes Gradientenverfahren 

7. Berechne dk+1 = −∇χ 2 ( Nk+1). 

8. Berechne βk = dT k+1 · dk+1 

d T k · , 

dk 

dT k · dk = 0, βk ∈ R≥0. 

9. Berechne hk+1 = dk+1 + βk hk. 


Bemerkungen: 

• Das KGV arbeitet lediglich mit Vektoren und Skalaren und ist daher nicht 

Speicheraufwändig. Daher eignet es sich, wie das GRV, für hochdimensionale 

Optimierungsprobleme. 

• Mit der gleichen Begründung wie beim GRV ist das KGV für Minima in flachen 

Regionen ineffizient. 

• Wird das βk wie in Schritt 8. berechnet, dann handelt es sich bei dem konjugierten 

Gradientenverfahren um die Variante nach "Fletcher-Reeves". Es existieren 

neben dieser Variante noch einige andere, wie z.B. die nach "Hestenes- 

Stiefel" oder "Polak-Ribiere". Bei den anderen Varianten wird das βk jeweils 

leicht abgeändert berechnet. Für nichtlineare Optimierungsprobleme erhält 

man jedoch meistens mit der "Fletcher-Reeves"-Variante die besten Konvergenzergebnisse 

[Alt02]. In [Bus09] wurde gezeigt, dass man bei der numerischen 

Lösung des Optimierungsproblems (2.8)-(2.9) mit der "Fletcher- 

Reeves"-Variante die besten Konvergenzergebnisse erhält. 

• Wie das GRV, so ist auch das KGV bei bestimmten Voraussetzungen ein global 

konvergentes Verfahren. 

5.3 Konvergenzergebnisse und Diskussion 

Abbildung 5.1 zeigt die Minimierung der χ 2 -Funktion mit dem GRV und KGV als 

Funktion der Iterationsschritte und Abbildung 5.2 als Funktion der Rechenzeit bei 

Verwendung des Patientenplanes #135 (genaueres zum Bestrahlungsplan befindet 

sich in Abschnitt 4.4.2). 

Bei der Minimierung der χ 2 -Funktion bzgl. der Iterationsschritte ist sowohl beim 

GRV als auch beim KGV ein typisches Verhalten dieser Verfahren zu beobachten. 

Die ersten 10-15 Iterationsschritte läuft die Minimierung mit größeren Schritten. 

Danach ist nur noch ein langsamer, streng monotoner, Abfall der χ 2 -Funktion zu 

beobachten. Diese Ergebnisse lassen vermuten, dass sich die Verfahren in den ersten 

10-15 Iterationsschritten im Einzugsgebiet befinden. Das Minimum scheint in 

einer eher flachen Region lokalisiert zu sein, in welche die Verfahren nach dem Einzugsgebiet 

eintreten. Von Anfang an arbeitet das KGV mit größeren Schritten zum 

60


Minimum hin als das GRV. Für ein χ 2 -Level von 2.8, für welches das GRV 100 Iterationsschritte 

benötigt, braucht das KGV nur 17 Iterationsschritte. Dies lässt sich 

damit erklären, dass das KGV eine Modifizierung des GRVs ist und eine angepasstere 

Iterationsvorschrift besitzt. Das Abbruchkriterium (4.6) (siehe Abschnitt 4.4.4), 

mit ɛ1 = 10 −8 , wird mit beiden Verfahren nicht erfüllt. 

Bei der Minimierung der χ 2 -Funktion bzgl. der Rechenzeit ist der Verlauf sehr 

ähnlich wie in Abbildung 5.1. Dies lässt sich damit begründen, dass das GRV und das 

KGV für einen Iterationsschritt ungefähr die selbe Rechenzeit benötigen. Trotz der 

komplexeren Iterationssvorschrift ist der Mehraufwand beim KGV in einer Iteration, 

gegenüber dem des GRVs, gering. Für ein χ 2 -Level von 2.8, für welches das GRV 

ca. 1420 Sekunden benötigt, braucht das KGV lediglich ca. 240 Sekunden. Beide 

Verfahren benötigen zu ihrem Endpunkt (100. Iterationsschritt) ca. 1420 Sekunden. 

D.h., dass mit diesen Verfahren der Optimierungsschritt, in diesem Bestrahlungsplan 

und den gegebenen Einstellungen, weniger als eine halbe Stunde dauert. 

Bei der Minimierung der χ 2 -Funktion arbeitet das KGV bzgl. der Iterationsschritte 

als auch der Rechenzeit wesentlich effizienter als das GRV. Die Minimierung konnte 

mit dem KGV in den Iterationen als auch in der Rechenzeit um einen Faktor von 

fast sechs verschnellert werden. In anderen Patientenplänen konnte ein ähnlicher Effekt 

beobachtet werden. Beide Verfahren besitzen einen ähnlichen Speicheraufwand 

und somit ist hier das KGV dem GRV gegenüber deutlich im Vorteil. 

61

5 Gradientenverfahren und konjugiertes Gradientenverfahren 

χ 2 

✡ ✡✡✣ 

KGV 

17 Schritte 

χ 2 -Level von ca. 2.8 

Iteration 

GRV 

100 Schritte 

❏ 

❏❏❏❫ 

Abbildung 5.1: Minimierung der χ 2 -Funktion mit dem GRV und KGV als Funktion der Iterationsschritte. 

Detaillierte Bildbeschreibung und Diskussion befindet sich im Text. 

χ 2 

✡ ✡✡✣ 

KGV 

ca. 240s 

χ 2 -Level von ca. 2.8 

Zeit [s] 

GRV 

ca. 1420s 

❏ 

❏ 

❏❏❫ 

Abbildung 5.2: Minimierung der χ 2 -Funktion mit dem GRV und KGV als Funktion der Rechenzeit. 

Detaillierte Bildbeschreibung und Diskussion befindet sich im Text. 

62

6 BFGS-Verfahren 

In diesem Kapitel wird das BFGS-Verfahren behandelt. Die Konvergenzergebnisse 

mit dem KGV sind zwar zufriedenstellend, es soll aber getestet werden, ob mit dem 

BFGS-Verfahren evtl. noch bessere Konvergenzergebnisse erreicht werden können. 

Der erste Abschnitt beschreibt das Newton-Verfahren. Das Newton-Verfahren ist 

wichtig für das Verständnis der Arbeitsweise des BFGS-Verfahrens. In Abschnitt 6.2 

wird das wichtigste zu den Quasi-Newton-Verfahren genannt, zu deren Klasse das 

BFGS-Verfahren gehört. In Abschnitt 6.3 geht es um das BFGS-Update, besonders 

um das inverse BFGS-Update, welches Kern des BFGS-Verfahrens ist. Die Iterationsvorschrift 

des BFGS-Verfahrens, mit der die besten Konvergenzergebnisse erzielt 

werden, wird detailliert in Abschnitt 6.4 geschildert. Anschließend werden die Konvergenzergebnisse 

des BFGS-Verfahrens diskutiert. Im letzten Abschnitt werden die 

weiteren Varianten des BFGS-Verfahrens genannt, die in TRiP implementiert und 

ausgewertet wurden. 

Bemerkung: In diesem Abschnitt spielt die zweite Ableitung der χ 2 -Funktion, also 

die Hesse-Matrix, eine bedeutende Rolle. Die Hesse-Matrix der Zielfunktion wird 

hier mit ∇ 2 χ 2 ( N) bezeichnet. Des Weiteren wird in diesem Abschnitt die Matrix H 

oft verwendet. Für beide Matrizen gilt die mathematische Forderung 

∇ 2 χ 2 ( N) ∧ H ∈ R p×p , (6.1) 

die im weiteren Verlauf nicht mehr explizit angegeben wird. 

6.1 Das Newton-Verfahren 

Das Newton-Verfahren (NV) spielt in der numerischen Mathematik als auch der 

nichtlinearen Optimierung eine bedeutende Rolle, da es lokal sehr gute Konvergenzeigenschaften 

besitzt. Das Bedeutende im NV ist die Newton-Richtung, die auch 

Grundlage für andere Suchrichtungen ist. Hier wird nur das vom NV behandelt, was 

später in dieser Arbeit benötigt wird. Details zum NV finden sich in nahezu allen 

Büchern zur numerischen Mathematik und nichtlinearen Optimierung. 

Die Arbeitsweise des NVs wird hier über einen anschaulicheren Ansatz motiviert. 

Eine Erklärung der Arbeitsweise über die Lösung eines nichtlinearen Gleichungssystemes 

findet sich z.B. in [Ulb07]. 

Für die Minimierung der χ 2 -Funktion kann diese um den Punkt N0 (dieser wird 

nach Abschnitt 4.3 berechnet) mit einem Taylor-Polynom zweiten Grades approxi- 

63


miert werden: 

χ 2 ( N) ≈ Q( N) = χ 2 ( N0) + ( N − N0) T · ∇χ 2 ( N0) 

+ 1 

2 · ( N − N0) T · ∇ 2 χ 2 ( N0) · ( N − N0) . 

(6.2) 

Ist die Hesse-Matrix ∇ 2 χ 2 ( N0) positiv definit, so ist die Funktion Q( N) streng konvex 

und ihr eindeutiges Minimum kann analytisch folgendermaßen berechnet werden: 

NMin, Q := ∇Q( N) = 0 , (6.3) 

=⇒ ∇χ 2 ( N0) + ∇ 2 χ 2 ( N0) · ( N − N0) = 0 , (6.4) 

=⇒ NMin, Q = 

N0 − ∇ 2 χ 2 ( −1 N0) · ∇χ 2 ( N0) . (6.5) 

Bei (6.3) handelt es sich um die notwendige Optimalitätsbedingung 1. Ordnung. 

D.h., man sucht einen stationären Punkt der Funktion Q. Für den Fall, dass die 

Approximation in (6.2) gut ist, so liegt das Minimum NMin, Q näher an dem Minimum 

der χ2-Funktion als der Punkt N0. Durch wiederholtes Anwenden dieser Prozedur, 

immer ausgehend von dem neu erhaltenen Punkt, kann in den meisten Fällen die 

Näherung an das gesuchte Minimum NOpt stets verbessert werden. Daraus ergibt 

sich im NV der sogenannte Newton-Schritt: 

Nk+1 = 

Nk − ∇ 2 χ 2 ( −1 Nk) · ∇χ 2 ( Nk) . (6.6) 

 

Hier ist dk die sog. Newton-Richtung. Diese und der Newton-Schritt können leicht 

in das allgemeine Linesearch-Verfahren aus Kapitel 4.1 eingebaut werden. 

Bemerkungen: 

64 

• Bei der Anwendung auf ein Minimierungsproblem wird das NV manchmal 

auch "Minimierung mit quadratischer Form" genannt [Bra99]. 

• Man ersetzt beim NV somit die Aufgabe der Minimierung der χ 2 -Funktion 

durch das einfachere quadratische Optimierungsproblem (6.3) und löst dieses 

analytisch. Ist die Hesse-Matrix ∇ 2 χ 2 ( Nk) positiv definit, dann liegt ein eindeutiges 

Minimum des quadratischen Problems vor und die Suchrichtung dk 

ist eine Abstiegsrichtung. Weiteres zu quadratischen Optimierungsproblemen 

findet sich z.B. in [Alt02, Ulb07]. 

• Das NV, welches in diesem Abschnitt beschrieben wird, wird als "Standard"oder 

"gewöhnliches"-NV bezeichnet [Hor79]. Bei diesem wird die Schrittweite 

µk = 1∀k verwendet. In diesem Fall kann bei einer schlechten Wahl des 

Startpunktes N0 das NV sogar divergieren. Durch eine geeignete Schrittweitensteuerung 

kann globale Konvergenz (sog. Globalisierung des Verfahrens) 

erreicht werden. 

dk

6.1 Das Newton-Verfahren 

• Liegt der Startwert N0 nahe am Minimum der χ 2 -Funktion, dann konvergiert 

das NV in der Regel schnell. Bei bestimmten Voraussetzungen liegt sogar quadratische 

Konvergenz 1 vor [Ulb07]. Die guten Konvergenzeigenschaften erhält 

man allerdings nur in einer lokalen Umgebung des Minimums. 

• Nachteil des NVs ist, dass in jedem Iterationsschritt die Hesse-Matrix ∇ 2 χ 2 ( Nk) 

aufgestellt und gespeichert werden muss. Das Aufstellen der Hesse-Matrix kann 

viel Rechenzeit beanspruchen. Der Speicheraufwand kann bei hochdimensionalen 

Problemen mehrere Gigabytes erfordern. 

• Neben dem hier beschriebenen "Standard"-NV gibt es noch die Newton-artigen-Verfahren, 

die inexakten NV und die Quasi-Newton-Verfahren. Bei den 

Newton-artigen-Verfahren wird die Hesse-Matrix ∇ 2 χ 2 ( Nk) in jedem Iterationsschritt 

k approximiert. Der Begriff der inexakten NV wird weiter unten 

in diesem Abschnitt erklärt. Mit den Quasi-Newton-Verfahren, zu denen das 

BFGS-Verfahren gehört, beschäftigt sich der nächste Abschnitt ausführlicher. 

Die Berechnung der Newton-Richtung 

 

dk = − ∇ 2 χ 2 ( −1 Nk) · ∇χ 2 ( Nk) (6.7) 

erfordert in jedem Iterationsschritt k das Invertieren der Hesse-Matrix ∇ 2 χ 2 ( Nk) 

und die anschließende Multiplikation mit dem Gradienten ∇χ 2 ( Nk). Dieses Vorgehen 

wäre numerisch nicht sinnvoll, da das Invertieren einer Matrix mit einem großen 

Rechenaufwand verbunden ist [EMR96]. Daher wird der Ausdruck (6.7) in den folgenden 

überführt 

∇ 2 χ 2 ( Nk) · dk = −∇χ 2 ( Nk) , (6.8) 

der als Newton-Gleichung bezeichnet wird. Die Newton-Gleichung ist ein lineares 

Gleichungssystem mit der gleichen Ordnung wie die Dimension des Optimierungsproblems 

(hier also der Ordnung p). Die Koeffizientenmatrix ist die Hesse-Matrix 

der Zielfunktion und die rechte Seite der negative Gradient der Zielfunktion. Das 

Gleichungssystem (6.8) ist symmetrisch, da die Hesse-Matrix nach dem Satz von 

Schwarz symmetrisch ist [Heu83]. Wird das Gleichungssystem nur näherungsweise 

gelöst, dann handelt es sich um ein inexaktes NV. Dabei wird in der Regel die 

Konvergenzgeschwindigkeit des NVs niedriger, auf der anderen Seite kann viel Rechenzeit 

gespart werden. Für die Konvergenzordnung von inexakten NV als auch 

Newton-artigen-Verfahren spielt die Dennis-Moré-Bedingung eine fundamentale Rolle 

[Ulb07]. 

Es gibt prinzipiell zwei Ansätze um ein lineares Gleichungssystem zu lösen, die 

direkten und iterativen Methoden/Verfahren [Sch93]. Die direkten Verfahren, z.B. 

1 Die Definition von quadratischer Konvergenz und anderen Konvergenzgeschwindigkeiten, wie 

z.B. die lineare oder superlinerae Konvergenz, findet sich in fast allen Lehrbüchern zur numerischen 

Mathematik. 

65


Cholesky-Zerlegung oder Gauß-Algorithmus, haben den Vorteil, dass sie eine exakte 

Lösung des Gleichungssystems liefern [F + 92]. Der Nachteil ist, dass die direkten 

Verfahren O(p 3 ) Punktoperationen benötigen und damit immer noch aufwendig 

sind. Bei den iterativen Verfahren eignen sich besonders die Krylov-Unterraum- 

Verfahren, wie z.B. das CG-Verfahren, für die Lösung der Gleichungssysteme [Hac93, 

Saa03]. Diese liefern zwar nur eine angenäherte Lösung, benötigen jedoch pro Iterationsschritt 

lediglich O(p) Punktoperationen. Werden bei den Krylov-Unterraum- 

Verfahren zusätzlich Vorkonditionierungstechniken angewendet, dann konvergieren 

die Verfahren meistens schnell. Es ist offensichtlich, dass je höher die Ordnung des 

Gleichungssystem ist, desto eher eignen sich die Krylov-Unterraum-Verfahren. Dabei 

muss jedoch eine Verringerung der Konvergenzgeschwindigkeit des NVs in kauf genommen 

werden. Diese haben zusätzlich den direkten Verfahren gegenüber den Vorteil, 

dass sie die Besetzungsstruktur der Koeffizientenmatrix, wie z.B. eine dünne Besetzungsstruktur, 

ausnutzen können. Zudem sind die Krylov-Unterraum-Verfahren 

robust und einfach zu implementieren. 

6.2 Quasi-Newton-Verfahren 

Wie bereits erwähnt wurde, die Berechnung der Newton-Richtung ist aufwendig. In 

jedem Iterationsschritt muss die Hesse-Matrix ∇ 2 χ 2 ( Nk) aufgestellt und invertiert 

werden oder statt der Invertierung kann das Gleichungssystem (6.8) gelöst werden. 

Bei den Newton-artigen-Verfahren werden geeignete Approximationen Hk der 

Hesse-Matrix verwendet, also: 

Hk ≈ ∇ 2 χ 2 ( Nk) . (6.9) 

Die Suchrichtung dk kann anschließend durch Lösung der Newton-artigen-Gleichung 

Hk · dk = −∇χ 2 ( Nk) (6.10) 

bestimmt werden. 

Die Idee bei den Quasi-Newton-Verfahren ist, dass ausgehend von einer symmetrischen 

und invertierbaren 2 Matrix H0 durch Updates die Matrizen Hk erzeugt 

werden. Das Update (auch als Aufdatierung bezeichnet) soll dabei durch eine Korrektur 

der aktuellen Matrix Hk berechnet werden, also: 

Hk+1 = Hk + Korrektur ∀k . (6.11) 

Damit können Informationen 3 aus der Matrix Hk an die neue Matrix Hk+1 weitergegeben 

werden. 

Eine fundamentale Rolle bei den Quasi-Newton-Verfahren spielt die Quasi-Newton-Gleichung: 

Hk+1 · ( Nk+1 − Nk) = ∇χ 2 ( Nk+1) − ∇χ 2 ( Nk) . (6.12) 

2 Invertierbare Matrizen werden auch reguläre Matrizen genannt. 

3 Die Matrizen Hk enthalten z.B. Informationen über die Krümmung der Zielfunktion. 

66

6.3 Das BFGS-Update 

Eine Herleitung und weiteres zu der Quasi-Newton-Gleichung findet man z.B. in 

[Ulb07]. Im weiteren Verlauf dieser Arbeit werden die folgenden Abkürzungen verwendet: 

sk = Nk+1 − Nk und yk = ∇χ 2 ( Nk+1) − ∇χ 2 ( Nk) , (6.13) 

mit sk ∈ R p und yk ∈ R p . Mit den oberen Abkürzungen kann die Quasi-Newton- 

Gleichung kompakter aufgeschrieben werden: 

Hk+1 · sk = yk . (6.14) 

Bei den Quasi-Newton-Verfahren beschränkt man sich bei den Aufdatierungsformeln 

auf folgende Abbildung: 

Hk+1 = Φ(Hk, sk, yk) , (6.15) 

mit Φ : R p×p × R p × R p → R p×p . 

Bemerkungen: 

• Als Startmatrix H0 wird oft die Einheitsmatrix I verwendet. Die Einheitsmatrix 

ist symmetrisch und positiv definit. 

• Bei einem guten Update sollte die Matrix Hk+1 symmetrisch, positiv definit 

und notwendigerweise die Quasi-Newton-Gleichung erfüllen. 

• Nach Möglichkeit sollte ein Update wenig Rechenaufwand erfordern. 

• Unter gewissen Voraussetzungen gilt 

lim 

k→∞ ||Hk+1 − Hk|| = 0 . (6.16) 

Ist (6.16) erfüllt, dann kann von dem entsprechenden Quasi-Newton-Verfahren, 

über die Dennis-Moré-Bedingung, superlineare Konvergenz gezeigt werden. 

Die Matrix Hk+1 in der Quasi-Newton-Gleichung ist nicht eindeutig bestimmt. Aus 

diesem Grund existieren mehrere Aufdatierungvarianten, wie z.B. das SR1-, DFPoder 

BFGS-Update. Das BFGS-Update ist das Bewährteste unter ihnen, da es sich 

in der Praxis als das numerisch effizienteste erwiesen hat. Daher wurde bis jetzt 

nur dieses in TRiP implementiert und ist Gegenstand im weiteren Verlauf dieses 

Kapitels. 

6.3 Das BFGS-Update 

Es wird nochmals an die Abkürzungen 

sk = Nk+1 − Nk und yk = ∇χ 2 ( Nk+1) − ∇χ 2 ( Nk) (6.17) 

67


erinnert. Das BFGS-Update wurde 1970 mit unterschiedlichen Ansätzen von Broyden, 

Fletcher, Goldfarb und Shanno unabhängig voneinander entwickelt [Bro70, 

Fle70, Gol70, Sha70]. Die BFGS-Aufdatierungsformel hat folgende Struktur: 

Hk+1 = Hk + yk · y T k 

y T k · sk 

Bemerkungen: 

− Hk · sk · (Hk · sk) T 

s T k · Hk · sk 

, y T k · sk = 0 , s T k · Hk · sk = 0 . (6.18) 

• Eine Herleitung der BFGS-Aufdatierungsformel findet man z.B. in [Alt02]. 

• Es kann leicht gezeigt werden, dass die BFGS-Aufdatierungsformel die Quasi- 

Newton-Gleichung erfüllt. 

• Ist die Matrix Hk symmetrisch, positiv definit und gilt y T k · sk > 0, dann ist 

die Matrix Hk+1, die über (6.18) berechnet wurde, ebenfalls symmetrisch und 

positiv definit. Die resultierende Suchrichtung dk+1 ist dann eine Abstiegsrichtung. 

Wie beim NV kann auch bei einem Quasi-Newton-Verfahren die Suchrichtung dk, 

anstelle der Lösung der Gleichung (6.10), über Matrixinversion berechnet werden: 

dk = −H −1 

k · ∇χ 2 ( Nk) . (6.19) 

Damit wird mit H −1 

k eine gute Approximation der inversen Hesse-Matrix angestrebt: 

H −1 

k ≈ 

 

∇ 2 χ 2 ( Nk) 

−1 

. (6.20) 

Der Vorteil beim BFGS-Update ist, dass neben den Updates der Matrix Hk auch 

Updates der inversen Matrix H −1 

k berechnet werden können. Über die "Sherman- 

Morrison-Woodbury-Formel" [GT97] kann aus (6.18) der folgende Ausdruck hergeleitet 

werden, der als inverser BFGS-Update bezeichnet wird: 

H −1 

k+1 = H−1 

k + (sk − H −1 

k · yk) · s T k + sk · (sk − H −1 

k · yk) T 

y T k · sk 

− (sk − H −1 

k · yk) T · yk 

(y T · (sk · s 

k · sk) 2 

T k ) , y T k · sk = 0 . 

(6.21) 

Hier kommt nun die Stärke des BFGS-Updates zur Geltung. Anstelle des Updates 

(6.18) kann der inverse Update (6.21) verwendet werden. Der Rechenaufwand dieser 

beiden Updates ist ungefähr der Gleiche. Nach dem inversen BFGS-Update kann 

über (6.19) (also lediglich eine Matrix-Vektor-Multiplikation) die Suchrichtung dk 

berechnet werden. Damit kann das Lösen eines linearen Gleichungssystemes oder 

eine Matrixinvertierung vollständig umgangen werden. 

Bemerkungen: 

68

6.4 Das inverse BFGS-Verfahren mit Armijo-Schrittweite und Winkeltest 

• Wird das inverse BFGS-Update verwendet, dann wird das Verfahren inverses 

BFGS-Verfahren genannt. 

• Beim inversen BFGS-Verfahren muss als Startmatrix anstelle von H0 eine inverse 

H −1 

0 vorgegeben werden. Es kann weiterhin als Startmatrix die Einheitsmatrix 

I verwendet werden, denn trivialerweise gilt: 

H0 = I =⇒ H −1 

0 = I . (6.22) 

• Die Auswertung der inversen BFGS-Aufdatierungsformel (6.21) benötigt O(p 2 ) 

Punktoperationen [Alt02]. 

6.4 Das inverse BFGS-Verfahren mit 

Armijo-Schrittweite und Winkeltest 

Unten wird die Iterationsvorschrift des BFGS-Verfahrens angegeben, die in TRiP 

implementiert ist. Dabei wird das inverse BFGS-Update verwendet und zur Schrittweitensteuerung 

wird das Armijo-Verfahren benutzt. Des Weiteren ist ein Winkeltest 

implementiert, der für das Konvergenzverhalten des Verfahrens eine große Rolle 

spielt und weiter unten näher betrachtet wird. Mit der angegeben Variante wurden 

die besten Ergebnisse beim BFGS-Verfahren erzielt. Die anderen Varianten, die 

ebenfalls in TRiP implementiert sind und ausgewertet wurden, werden in Abschnitt 

6.6 diskutiert. 

Algorithmus: BFGS-Verfahren (BFGS) 

1. Setze δ = 0.5, γ = 10 −2 und τ = 0.15. 

2. Wähle als Startmatrix H −1 

0 = I. 

3. Bestimme einen Startpunkt N0 und setze k := 0. 

4. Falls eine Abbruchbedingung erfüllt ist, dann steige mit der Lösung Nk aus. 

5. Berechne die BFGS-Suchrichtung d BFGS 

k 

6. Falls 

−∇χ2 ( Nk) T · dBFGS k 

||∇χ2 ( Nk)|| · || dBFGS k 

erfüllt ist, dann verwende als Suchrichtung 

= −H −1 

k · ∇χ 2 ( Nk). 

|| ≥ τ , ||∇χ2 ( Nk)|| ∧ || d BFGS 

k || = 0 , (6.23) 

dk = d BFGS 

k , (6.24) 

69


führe Schritt 7 aus und überspringe Schritt 8. 

Ist (6.23) nicht erfüllt, dann verwende als Suchrichtung 

und mache weiter mit Schritt 8. 

7. Berechne die Startschrittweite µmax,k über (4.12). 

dk = −∇χ 2 ( Nk) (6.25) 

8. Berechne die Startschrittweite µmax,k über µBio aus (4.10). 

9. Bestimme eine Schrittweite µk über das Armijo-Verfahren. 

10. Berechne einen neuen Teilchenzahlenvektor Nk+1 = Nk + µk dk. 

11. Berechne sk = Nk+1 − Nk und yk = ∇χ 2 ( Nk+1) − ∇χ 2 ( Nk). 

12. Berechne H −1 

k+1 nach dem inversen BFGS-Update (6.21). 


Bei (6.23) handelt es sich um den sogenannten Winkeltest. Dabei wird der Winkel 

zwischen dem negativen Gradienten der χ2-Funktion an der Stelle Nk und der 

BFGS-Suchrichtung dBFGS k berechnet. Der negative Gradient der Zielfunktion steht 

orthogonal auf den Höhenlinien. Ist der Winkel zwischen −∇χ2 ( Nk) und dBFGS k exakt 

90 ◦ , dann würde das den Fall repräsentieren, dass man mit der BFGS-Suchrichtung 

anfangs entlang der Höhenlinie läuft. In dem entsprechenden Iterationsschritt könnte 

dann die Zielfunktion nicht minimiert werden. Ist der Winkel nahe bei 90 ◦ (z.B. 

zwischen 80 ◦ und 90 ◦ ), würde man mit dem Schritt die Zielfunktion wahrscheinlich 

nur geringfügig minimieren können. Mit dem Winkeltest kann dies verhindert 

werden. Die Idee dabei ist, dass wenn die berechnete BFGS-Suchrichtung zu nahe 

an den Höhenlinien liegt, dass diese dann verworfen wird und in dem aktuellen Iterationsschritt 

der negative Gradient als Suchrichtung verwendet wird. Man ersetzt 

damit in einem Iterationsschritt den BFGS-Schritt mit einem Schritt des GRVs. 

In dem hier angegebenen BFGS-Algorithmus wird τ = 0.15 als kritischer Winkel- 

wert verwendet. Es gilt4 arccos(0.15) ≈ 81, 373. D.h., dass zwischen dem negativem 

Gradienten der Zielfunktion an der Stelle Nk und der BFGS-Suchrichtung dBFGS k ein 

Winkel von 81, 37◦ noch toleriert wird. Ist der Winkel größer (und damit ziemlich 

nahe an der entsprechenden Höhenlinie), dann wird die BFGS-Suchrichtung mit der 

Suchrichtung vom GRV überschrieben. 

Der Winkeltest ist bei Newton-artigen-Verfahren als auch bei Quasi-Newton- 

Verfahren sinnvoll, obwohl man ihn selten in der Literatur findet. Bei beiden Verfahren 

werden in jedem Iterationsschritt Approximationen für die Hesse-Matrix verwendet. 

Ist in einem Iterationsschritt die Approximation schlecht, dann kann die 

4 Für den Winkel φ zwischen den Vektoren v und w gilt: 

70 

〈v,w〉 

||v||·||w|| = cos φ.


schlechte Approximation mit dem Winkeltest abgesichert werden. Anstelle eines 

Schrittes, in dem die schlecht approximierte Matrix verwertet wird, kann der Schritt 

mit dem robusten Gradientenverfahren ersetzt werden. Dies trägt zur allgemeinen 

Robustheit des Verfahrens bei und verbessert in der Regel auch die Konvergenzgeschwindigkeit. 

Neben dem hier beschriebenen Winkeltest gibt es noch den "allgemeinen 

Winkeltest", der in [Ulb07] beschrieben ist. 

Weitere Bemerkungen zum BFGS-Algorithmus: 

• Die Konstanten δ und γ werden für das Armijo-Verfahren verwendet. 

• Bei dem obigen BFGS-Verfahren wird als Startmatrix die Einheitsmatrix I 

verwendet. Daher ist der erste Schritt des Verfahrens ein Schritt des GRVs. 

• Die Wahl der Startschrittweite für das Armijo-Verfahren hängt von der letztendlich 

verwendeten Suchrichtung dk ab. Wird die BFGS-Suchrichtung verwendet, 

dann wird die Startschrittweite über das Minimum der quadratischen 

Interpolation (4.12) berechnet (Schritt 7 im BFGS-Algorithmus). Wird als 

Suchrichtung der negative Gradient verwendet, dann wird als Startschrittweite 

µBio aus (4.10) verwendet (Schritt 8 im BFGS-Algorithmus), da sich diese 

bereits bei dem GRV und KGV bewährt hat. Dies wird nochmals in Abschnitt 

6.6 aufgegriffen und näher erklärt. 

• Für allgemeine nichtlineare Zielfunktionen ist der Beweis der globalen Konvergenz 

des inversen BFGS-Verfahrens mit Armijo-Schrittweite ein offenes Problem 

5 . Ist die Zielfunktion auf einer Niveau-Menge gleichmäßig konvex, dann 

kann die globale Konvergenz gezeigt werden [Ulb07]. Ist die Hesse-Matrix der 

Zielfunktion in einer lokalen Umgebung eines Minimums Lipschitz-Stetig, dann 

konvergiert das Verfahren in dieser Umgebung superlinear. 


Abbildung 6.1 zeigt die Minimierung der χ 2 -Funktion mit dem inversen BFGS- 

Verfahren, welches im vorherigen Abschnitt detailliert beschrieben wurde, als Funktion 

der Iterationsschritte. Diesmal wurden 150 Iterationsschritte zugelassen. Abbildung 

6.2 zeigt das entsprechende Ergebnis der Minimierung bzgl. der Rechenzeit. 

Für einen Vergleich werden die Ergebnisse mit denen des KGVs, da sich dieses gegenüber 

dem GRV sowohl in den Iterationsschritten als auch in der Rechenzeit als 

das bessere Verfahren gezeigt hatte, gegenübergestellt. 

Bei der Minimierung bzgl. der Iterationsschritte ist beim BFGS-Verfahren am 

Anfang ein relativ steiler Abfall der Funktionswerte der χ 2 -Funktion zu erkennen. 

5 Konvergenzuntersuchungen zu Quasi-Newton-Verfahren gestalten sich generell als sehr schwierig, 

da neben Approximationseigenschaften der Update-Matrizen Hk für die Aufdatierungen 

Störungsaussagen aus der linearen Algebra einbezogen werden müssen. 

71


Im weiteren Verlauf wird dieser Abfall stets flacher. Im Vergleich zum KGV arbeitet 

das BFGS-Verfahren im Einzugsgebiet schlechter. Nach dem Einzugsgebiet ist das 

BFGS-Verfahren effizienter als das KGV, da der Abfall der χ 2 -Funktionswerte steiler 

ist. Dies kann wahrscheinlich damit begründet werden, dass das BFGS-Verfahren 

Krümmungsinformationen der Zielfunktion verarbeitet und damit in der flachen Region 

besser arbeitet. Da jedoch das KGV im Einzugsgebiet deutlich effizienter ist, 

schafft es das BFGS-Verfahren auch nicht nach 150 Iterationsschritten das KGV zu 

überholen (besser zu minimieren). Beim 150 Iterationsschritt ist jedoch mit beiden 

Verfahren ein Level von ca. 0.9 der χ 2 -Funktion erreicht. Das Abbruchkriterium 

(4.6) (siehe Abschnitt 4.4.4), mit ɛ1 = 10 −8 , wird mit beiden Verfahren nicht erfüllt. 

Weitere Auswertungen haben ergeben, dass das inverse BFGS-Verfahren das KGV 

ca. im 180. Iterationsschritt überholt. Im weiteren Verlauf kann jedoch mit dem inversen 

BFGS-Verfahren nur noch eine wenig bessere Minimierung der χ 2 -Funktion 

errreicht werden. Dies liegt daran, dass sich beide Verfahren bereits in relativ niedrigen 

Bereichen befinden, in denen nicht mehr viel minimiert werden kann. 

Die Minimierung der χ 2 -Funktion bzgl. der Rechenzeit ist in Abbildung 6.2 zu 

sehen. Man sieht, dass das BFGS-Verfahren nicht wesentlich mehr Rechenzeit als 

das KGV benötigt, ein Unterschied ist jedoch sichtbar. Dies liegt daran, dass beim 

BFGS-Verfahren in jedem Iterationsschritt das Matrixupdate stattfindet. Das KGV 

benötigt bis zum Ende ca. 2100s. Das BFGS-Verfahren benötigt zu dem fast gleichen 

Endpunkt ca. 3250s. Dies ist ein Faktor von ca. 1.55 mehr Rechenzeit. 

Im Gesamturteil ist das KGV besser als das BFGS-Verfahren. Nach 150 Iterationsschritten 

ist zwar ein ähnliches Level der χ 2 -Funktion erreicht, das BFGS- 

Verfahren benötigt aber mehr Rechenzeit. Ein weiterer Nachteil des BFGS-Verfahrens 

gegenüber dem KGV ist, dass in jedem Iterationsschritt die Update-Matrix 

gespeichert werden muss. Schon bei dem "kleinen" Patientenplan #135 besitzt die 

Update-Matrix ca. 19600 2 Elemente. Werden die Matrixelemente in doppelter Genauigkeit 

abgespeichert (also in der Programmiersprache C im "double"-Format mit 

8 Byte pro Matrixelement), dann ergibt sich ein Speicheraufwand von ca. 2.9GB für 

die Update-Matrix. Z.B. bei einem Optimierungsproblem mit der Dimension von 

80000 beträgt der Speicheraufwand für die Update-Matrix ca. 47.7GB bei doppelter 

Genauigkeit, was eine hohe Anforderung ist. 

Auswertungen haben ergeben, dass die Hesse-Matrizen ∇ 2 χ 2 ( Nk), unabhängig 

von k, schwach besetzt sind. Ca. 80-90% der Werte sind 0 oder vernachlässigbar klein. 

Die restlichen Werte sind in Clustern durch die gesamte Matrix verteilt [Hor08]. 

Auch wenn die Hesse-Matrizen ∇ 2 χ 2 ( Nk) schwach besetzt sind, sind die Update- 

Matrizen Hk in der Regel voll besetzt [Spe99]. Es ist schwieriger, mit einer vollbesetzten 

Matrix Hk die dünnbesetzte Matrix ∇ 2 χ 2 ( Nk) gut zu approximieren, was die 

Voraussetzung für ein gutes Konvergenzverhalten eines Quasi-Newton-Verfahrens 

ist. Dies könnte ein Grund sein, warum das inverse BFGS-Verfahren bzgl. der Iterationsschritte 

nicht effizienter als das KGV arbeitet. 

72

χ 2 


Iteration 

Abbildung 6.1: Minimierung der χ 2 -Funktion mit dem BFGS-Verfahren und KGV als Funktion 

der Iterationsschritte. Detaillierte Bildbeschreibung und Diskussion befindet sich im Text. 

χ 2 

KGV 

ca. 2100s 

❏ 

❏❏❏❏❏❏❫ 

χ2-Level von ca. 0.9 

❏ 

❏❏❫ 

Zeit [s] 

BFGS 

ca. 3250s 

❏ 

❏❏❏❫ 

Abbildung 6.2: Minimierung der χ 2 -Funktion mit dem BFGS-Verfahren und KGV als Funktion 

der Rechenzeit. Detaillierte Bildbeschreibung und Diskussion befindet sich im Text. 

73


6.6 Weitere implementierte und ausgewertete 

Varianten des inversen BFGS-Verfahrens und 

zusätzliche Bemerkungen 

Der Vollständigkeit halber werden hier alle anderen Varianten des inversen BFGS- 

Verfahrens angegeben, die in TRiP implementiert und ausgewertet wurden. Die 

anderen Varianten haben schlechtere Ergebnisse geliefert als das inverse BFGS- 

Verfahren aus Abschnitt 6.4. Aus diesem Grund werden von den anderen Varianten 

an dieser Stelle keine Konvergenzergebnisse gezeigt. Des Weiteren werden in diesem 

Abschnitt zusätzliche Bemerkungen zum inversen BFGS-Verfahren aus Abschnitt 

6.4 gemacht. 

74 

• Bei allen Varianten des inversen BFGS-Verfahrens war der Winkeltest notwendig 

für ein gutes Konvergenzverhalten. D.h., dass im Verfahren öfters Suchrichtungen 

dBFGS k erzeugt wurden, die nahe an der Höhenlinie lagen. Ohne den 

Winkeltest war die Konvergenzgeschwindigkeit des entsprechenden inversen 

BFGS-Verfahrens sehr langsam (sogar wesentlich langsamer als beim GRV). 

[HDK10] 

• Beim Winkeltest wurden für den kritischen Winkelwert τ in allen inversen 

BFGS-Varianten Werte von 0.05, 0.1, 0.15, ...,0.5 getestet. In den meisten 

Fällen wurden mit τ = 0.15 die besten Konvergenzergebnisse erzielt. War der 

Wert kleiner, dann wurden BFGS-Suchrichtungen zugelassen, die zu nah an 

den Höhenlinien waren. Daraus folgte oft eine sehr geringe Minimierung der 

Zielfunktion. Bei größeren Werten für τ verhielt sich das Verfahren sehr ähnlich 

wie das GRV. 

• Wurde als Suchrichtung die BFGS-Suchrichtung verwendet, also 

dk = d BFGS 

k , (6.26) 

dann wurden die besten Konvergenzergebnisse erzielt, wenn die Startschrittweite 

µmax,k für das Armijo-Verfahren über das Minimum der quadratischen 

Interpolation (4.12) berechnet wurde. Näheres dazu im übernächsten Punkt. 

• Ergibt sich aus dem Winkeltest, dass die aktuelle Suchrichtung der negative 

Gradient ist, also: 

dk = −∇χ 2 ( Nk) , (6.27) 

dann werden die besten Konvergenzergebnisse erreicht, wenn die Startschrittweite 

µmax,k für das Armijo-Verfahren über µBio aus (4.10) berechnet wird. 

Näheres dazu im nächsten Punkt. 

• Auswertungen haben folgendes ergeben: Für die Norm der Suchrichtung über 

den negativen Gradienten gilt || − ∇χ2 ( Nk)|| < 1 ∀ k und für die Norm der 

BFGS-Suchrichtung gilt || dBFGS k || > 1 ∀ k. Es konnte beobachtet werden, dass

6.6 Weitere implementierte und ausgewertete Varianten des inversen 

BFGS-Verfahrens und zusätzliche Bemerkungen 

wenn die Norm der Suchrichtung klein ist, dass sich als Startschrittweite für 

das Armijo-Verfahren µBio besser eignet. Ist die Norm der Suchrichtung größer, 

dann eignet sich als Startschrittweite für das Armijo-Verfahren das Minimum 

aus der quadratischen Interpolation (4.12). Daher erhält man die besten Konvergenzergebnisse 

mit dem inversen BFGS-Verfahren, wenn die Startschrittweite 

für das Armijo-Verfahren vom Typen der Suchrichtung abhängt. 

Mit der Variante des inversen BFGS-Verfahrens aus Abschnitt 6.4 erhält man 

die besten Konvergenzergebnisse. Es konnte sogar beobachtet werden, dass 

mit dieser Variante dass Armijo-Verfahren in fast allen Iterationsschritten die 

Startschrittweite nicht verkleinern muss. Dies lässt folgendes vermuten: Falls in 

einem Iterationsschritt die Suchrichtung −∇χ2 ( Nk) verwendet wird, wird mit 

der Schrittweite µBio eine gute Approximation der exakten Schrittweite erzielt. 

Wird als Suchrichtung dBFGS k verwendet, dann erhält man über das Minimum 

der quadratischen Interpolation (4.12) eine gute Approximation der exakten 

Schrittweite. Dass die Startschrittweite des Armijo-Kriteriums (4.11) fast immer 

akzeptiert wird, spielt für die benötigte Gesamtrechenzeit des Verfahrens 

eine bedeutende Rolle. Es werden dann keine zusätzlichen Funktionsauswertungen 

benötigt. Diese sind hier relativ teuer, da bei einer Auswertung der 

χ2-Funktion die RBW-Werte berechnet werden müssen, was zeitaufwendig ist. 

• Wurden die Werte für die Startschrittweite für das Armijo-Verfahren manuell 

gewählt, z.B. µmax,k = 1, 2 oder 4, dann waren die Konvergenzergebnisse nicht 

schlecht aber auch nicht zufriedenstellend. 

• Bei der BFGS-Suchrichtung dBFGS k wurde für das Armijo-Verfahren als Startschrittweite 

die folgende implementiert: 

µmax,k = || Nk|| 

|| dk|| 

, || dk|| = 0 . (6.28) 

Auswertungen haben ergeben, dass diese Startschrittweite zu groß ist. Das 

Armijo-Verfahren musste die Startschrittweite oft (ca. 5-10) verkleinern. Durch 

die zusätzlichen Auswertungen der χ 2 -Funktion wird damit viel Rechenzeit 

beansprucht. Die Ergebnisse mit dieser Startschrittweite bzgl. der Iterationsschritte 

waren ähnlich wie in Abbildung 6.1. Durch die langen Rechenzeiten 

war das Ergebnis bzgl. der Rechenzeit relativ schlecht. 

Weitere Auswertungen haben ergeben, dass bei der Startschrittweite (6.28) 

die letztendlich akzeptierte Schrittweite ähnlich wie die Schrittweite aus dem 

Minimum der quadratischen Interpolation ist. Dies festigt die Vermutung, die 

schon weiter oben genannt wurde, dass mit der Schrittweite aus dem Minimum 

der quadratischen Interpolation (4.12) eine gute Approximation der exakten 

Schrittweite erzielt wird. 

• Für die Konstanten δ und γ im Armijo-Verfahren wurden in allen Varianten 

des inversen BFGS-Verfahrens verschiedene Werte überprüft. Es wur- 

75


76 

den jeweils, in Kombination miteinander, δ = 0.75, 0.66, 0.5, 0.33, 0.25 und 

γ = 10 −1 , 10 −2 , 10 −3 , . . . , 10 −5 ausprobiert. Die besten Konvergenzergebnisse 

wurden mit δ = 0.5 und γ = 10 −2 erzielt. Dies konnte in den meisten Varianten 

des inversen BFGS-Verfahrens beobachtet werden. 

• Restarts beim inversen BFGS-Verfahren (D.h., dass die Update-Matrix H −1 

k 

in einem gewissen Iterationsschritt k mit der Einheitsmatrix I "neu gestartet" 

wird [Alt02]) zeigten stets eine Verschlechterung der Konvergenzergebnisse.

7 Zusammenfassung und Ausblick 

7.1 Zusammenfassung 

Im Pilotprojket der GSI wurden von 1997 bis 2008 ca. 440 Tumorpatienten mit 

schweren Ionen unter Verwendung des Rasterscan-Verfahrens bestrahlt. Dabei wurden 

ausschließlich Kohlenstoffionen verwendet, da diese durch ihren scharfen Bragg- 

Peak und ihre hohe RBW besonders geeignete Eigenschaften besitzen. Die Erfolgsquoten 

von dieser neuartigen Strahlentherpaie waren so vielversprechend, dass seit 

2008 das dedizierte Heidelberger Ionenstrahl-Therapiezentrum HIT die Schwerionentherapie 

im klinischen Routinebetrieb weiterführt. Die Patiententherapie findet nur 

noch am HIT statt, dennoch ist die Schwerionentherapie weiterhin Gegenstand intensiver 

Forschung an der GSI. 

Für jeden Patienten muss vor der Bestrahlung ein individueller Bestrahlungsplan 

erstellt werden. Dafür wurde an der GSI die Bestrahlungsplanungssoftware 

TRiP entwickelt. Ein wesentlicher Bestandteil der Bestrahlungsplanung ist die Optimierung 

der Dosis. Das Ziel dabei ist eine homogene Dosisverteilung durch den 

Tumor zu erhalten, die nahe an der vorgeschriebenen Dosis liegt. Des Weiteren 

soll die resultierende Dosisverteilung im gesunden Gewebe so niedrig wie möglich 

sein und in kritischen Organen gewisse Dosis-Grenzwerte nicht überschreiten. Diese 

Kriterien können mathematisch in einem Optimierungsproblem formuliert werden. 

Werden biologische Effekte berücksichtigt, d.h. eine Einbeziehung der RBW, dann 

wird das Optimierungsproblem nichtlinear. Der Kerngedanke der Optimierung ist, 

dass die quadratischen Abweichungen zwischen vorgeschriebener Dosis und tatsächlich 

erzeugter Dosis in den Voxeln minimiert werden, was mit einem Zielfunktional 

modelliert wird. Dabei sind die Teilchenzahlen für die Rasterpunkte die freien und zu 

optimierenden Variablen. Eine mathematische Analyse des Optimierungsproblems 

ergibt, dass es sich um eine nichtlineare endlichdimensionale ungleichungsrestringierte 

Funktionalminimierung handelt. Die theoretische Betrachtung und numerische 

Lösung des Optimierungsproblemes waren Schwerpunkt dieser Master-Thesis. 

Nach der Beschreibung des Optimierungsproblemes wurde dieses theoretisch betrachtet. 

Eine Stetigkeitsuntersuchung der Zielfunktion ergab, dass diese wegen der 

vorkommenden Heaviside-Funktion nicht stetig ist. Für die Existenzuntersuchung 

konnte damit der Extremwertsatz von Weierstraß nicht angewendet werden, da dieser 

die Stetigkeit der Zielfunktion voraussetzt. Zudem ist die zulässige Menge des 

Optimierungsproblems nicht beschränkt, was eine weitere Voraussetzung des Extremwertsatzes 

von Weierstraß ist. Aus diesem Grund wurde für den Existenzbeweis 

eine Erweiterung des Extremwertsatzes von Weierstraß verwendet, die die Unter- 

77


halbstetigkeit und radiale Unbeschränktheit der Zielfunktion voraussetzt. Nach dem 

diese beiden Eigenschaften für das Zielfunktional bewiesen werden konnten, konnte 

die Existenz mindestens eines globalen Minimums des Optimierungsproblemes bewiesen 

werden. Die Eindeutigkeit eines globalen Minimums konnte nicht nachgewiesen 

werden, da die Zielfunktion nicht konvex ist. Damit können Standardtechniken, 

mit denen Eindeutigkeitsbeweise für Minima geführt werden, nicht angewendet werden. 

Des Weiteren wurde die Zielfunktion in dieser Arbeit mit einer angepassten 

Tangens Hyperbolicus-Funktion geglättet. Dies war notwendig, damit die Karush- 

Kuhn-Tucker-Bedingungen zu dem Optimierungsproblem angegeben werden konnten. 

Diese sind die notwendige Optimalitätsbedingung erster Ordnung und besitzen 

nur bei einer stetig-differenzierbaren Zielfunktion ihre Gültigkeit. 

Für die numerische Lösung des Optimierungsproblemes wurden Linesearch-Verfahren 

verwendet. Als erstes wurden diese allgemein eingeführt und deren Arbeitsweise 

geschildert. Als Schrittweitensteurung wurden in dieser Arbeit zwei Techniken 

verwendet. Bei der einen Technik wird eine skalierte Schrittweite von einem 

einfacheren linearen Optimierungsproblem verwendet, bei dem die biologischen 

Effekte vernachlässigt werden und die andere Technik ist die bekannte Armijo- 

Schrittweitensteuerung. Bei der Armijo-Schrittweite wurden unterschiedliche Startschrittweiten 

verwendet. Als Linesearch-Verfahren wurden in dieser Arbeit das Gradientenverfahren, 

das konjugierte Gradientenverfahren und das inverse BFGS-Verfahren 

in TRiP implementiert und ausgewertet. Deren Arbeitsweise, Vor- und Nachteile 

als auch diverse Varianten dieser Verfahren wurden diskutiert. Die besten Minimierungsergebnisse 

von den Varianten dieser Verfahren wurden bei Verwendung 

des Patientenplanes #135 bzgl. der Iterationsschritte als auch der Rechenzeit gegenübergestellt. 

Das Gradientenverfahren schneidet dabei am schlechtesten ab. Bzgl. der 

Iterationsschritte arbeiten das inverse BFGS-Verfahren und das konjugierte Gradientenverfahren 

ähnlich effizient. Wegen den benötigten Matrixupdates braucht jedoch 

das inverse BFGS-Verfahren ca. um einen Faktor von 1.5 mehr Rechenzeit als das 

konjugierte Gradientenverfahren. Obwohl beim inversen BFGS-Verfahren viele Varianten 

versucht wurden, konnten mit diesem keine besseren Konvergenzergebnisse 

als mit dem konjugierten Gradientenverfahren erzielt werden. 

In [Hor08] wurde die Levenberg-Marquardt-Minimierung [Lev44, Mar63] für die numerische 

Lösung des Optimierungsproblemes untersucht. Dabei konnte beobachtet 

werden, das dass Minimierungsergebnis bzgl. der Iterationsschritte sehr gut ist (sogar 

deutlich besser als beim konjugierten Gradientenverfahren). Da die auftretenden 

Gleichungssysteme in jedem Iterationsschritt mit dem Cholesky-Verfahren gelöst 

wurden, ist die Levenberg-Marquardt-Minimierung in dieser Variante extrem zeitaufwendig. 

Damit ist das konjugierte Gradientenverfahren im Gesamturteil immer 

noch geeigneter für die Optimierung in der Bestrahlungsplanung als diese Variante 

der Levenberg-Marquardt-Minimierung. 

In der Arbeit [Bus09] wurden die auftretenden linearen Gleichungssysteme in 

der Levenberg-Marquardt-Minimierung mit den Krylov-Unterraum-Verfahren gelöst. 

Dabei konnten die Rechenzeiten zwar signifikant verringert werden, die Ge- 

78

7.2 Ausblick 

samtrechenzeit der Levenberg-Marquardt-Minimierung war dennoch deutlich höher 

als beim konjugierten Gradientenverfahren. 

Ein weiterer Schwerpunkt der Arbeit [Bus09] war das konjugierte Gradientenverfahren. 

Dort wurden viele Varianten von diesem untersucht, wie z.B. die von Polak- 

Ribiere und Hestenes-Stiefel. Auch in der Arbeit [Bus09] hat sich gezeigt, dass die 

besten Konvergenzergebnisse bei der numerischen Lösung des Optimierungsproblemes 

mit der Fletcher-Reeves Variante des konjugierten Gradientenverfahrens erreicht 

werden. 

Der gegenwärtige Stand ist, dass bei der nichtlinearen Dosisoptimierung in der 

Schwerionentherapie die Fletcher-Reeves Variante des konjugierten Gradientenverfahrens 

das geeignetste Verfahren ist. Mit diesem Verfahren kann der Optimierungsschritt 

in der Bestrahlungsplanung in einer angemessen Zeit durchgeführt werden. 

Die gegenwärtigen Konvergenzergebnisse als auch die resultierenden Dosisverteilungen 

sind relativ zufriedenstellend. Des Weiteren eignet sich das konjugierte Gradientenverfahren, 

da es keine großen Speicherressourcen beansprucht und robust ist. 

7.2 Ausblick 

Folgende Ideen könnten in der Zukunft bei der nichtlinearen Dosisoptimierung eingebracht 

werden: 

• Es könnten Modifikationen an der Zielfunktion vorgenommen werden. Z.B. 

könnten Optimierungsergebnisse betrachtet werden, wenn als Zielfunktion die 

geglättete Zielfunktion aus (3.23) verwendet wird. 

• Für die numerische Lösung des Optimierungsproblemes könnten die sog. Innere- 

Punkte-Verfahren getestet werden. 

• Die auftretenden Gleichungssysteme bei der Levenberg-Marquardt-Minimierung 

könnten mit UMFPACK [Dav04] gelöst werden. Damit könnte das gute 

Konvergenzverhalten der Levenberg-Marquardt-Minimierung bzgl. der Iterationsschritte 

ausgenutzt werden. Mit UMFPACK können dünnbesetzte lineare 

Gleichungssysteme sehr schnell gelöst werden. Dabei werden Matrixpermutationen 

geschickt eingesetzt. 

• Beim KGV könnte eine Implementierung des Winkeltestes, ähnlich wie beim 

inversen BFGS-Verfahren, untersucht werden. 

• Beim KGV könnte die Armijo-Schrittweite und die Powell-Wolfe-Schrittweite 

eingebaut werden. Die Powell-Wolfe-Schrittweite ist eine Erweiterung der Armijo-Schrittweite. 

Diese kann die Startschrittweite auch vergrößern. 

• Beim BFGS-Verfahren könnte die Powell-Wolfe-Schrittweite implementiert werden. 

79


• Anstelle des BFGS-Updates könnte das Limited-Memory-BFGS-Update (L- 

BFGS) verwendet werden. Dabei werden nicht Updates der ganzen Matrix 

berechnet, sondern nur von den relevanten Matrixeinträgen. Mit dem L-BFGS- 

Verfahren kann viel Speicherplatz gespart werden. 

• Es könnten Auswertungen gemacht werden, wie bei der numerischen Lösung 

des Optimierungsproblemes die Linesearch-Verfahren geeignet miteinander 

kombiniert werden können. Beispielsweise könnte im Einzugsgebiet das KGV 

verwendet werden und in einem geeigneten Iterationsschritt könnte dann die 

Levenberg-Marquardt-Minimierung oder das inverse BFGS-Verfahren "eingeschaltet" 

werden. 

In Abschnitt 1.5 wurde erwähnt, dass die GSI an einer Weiterentwicklung der Schwerionentherapie 

arbeitet. Zwei Punkte bei der Erweiterung der Therapie, wo die Optimierung 

eine Rolle spielt, sind: 

80 

• Bei der Patientenbehandlung soll in Zukunft die adaptive Therapie angewendet 

werden. Hierbei soll z.B. der sogenannte Hypoxia-Effekt berücksichtigt 

werden. Dies erfordet eine neue Formulierung des Optimierungsproblemes. Des 

Weiteren wird dabei auch der LET optimiert. Näheres dazu findet sich z.B. in 

[SKD10]. 

• Mit dem Schwerionenstrahl sollen auch Tumore bestrahlt werden, die im Thorax 

des Patienten liegen und sich unter Einfluss der Atmung und des Herzschlages 

bewegen. Dabei wird auch eine Optimierung der Dosis benötigt. Durch die 

Tumorbewegung wird die gesamte Bestrahlungsplanung wesentlich aufwendiger 

und komplexer als im statischen Fall, was auch zu einer aufwendigeren 

Optimierung führt. Weitere Details dazu, als auch zur Dosisoptimierung unter 

Einfluss der Bewegung, befindet sich in [BD11].

8 Anhang 

8.1 Beschleunigeranlage der GSI 

Obere Abbildung zeigt den Grundriß der GSI-Beschleunigeranlage. Im linken Fenster 

sieht man die Vergrößerung des Therapieraumes, der sich im gelben Bereich befindet. 

Die wichtigsten Beschleunigerkomponenten für die Therapie an der GSI sind: 

1. Die Ionenquellen HLI: Hier werden die 12 C-Ionen erzeugt. 

2. Der Linearbeschleuniger UNILAC: Dient als Vorstufe der Beschleunigung. 

3. Der Schwerionensynchrotron SIS: In dem Kreisbeschleuniger werden die 12 C- 

Ionen auf die gewünschte Geschwindigkeit/Energie gebracht. 

81

8 Anhang 

8.2 Gradient und Hesse-Matrix der Dosis 

Hier wird der Gradient und die Hesse-Matrix für die physikalische, RBW-gewichtete 

und des analytischen Ausdrucks für die RBW-gewichtete Dosis angegeben. Gradient 

und Hesse-Matrix der entsprechenden Dosis werden besonders bei den Ableitungen 

der Zielfunktion benötigt (siehe nächsten Abschnitt). Die verschiedenen Dosistypen 

werden ausführlich in Abschnitt 2.2 behandelt. Dort sind auch die Bezeichnungen 

und mathematischen Forderungen für die vorkommenden Parameter angegeben. Diese 

werden hier in den Ableitungen nicht mehr angegeben. 

8.2.1 Gradient und Hesse-Matrix der physikalischen Dosis 

Hier werden die Ableitungen der physikalischen Dosis 

mit D i Phys 

Der Gradient ist 

mit ∇D i Phys 

: Rp 

≥0 → R≥0 ∀ i, angegeben. 

: Rp≥0 

→ Rp≥0 

∀ i. 

D i Phys( N) = c T i · N , (8.1) 

∇D i Phys( N) = ci , (8.2) 

Es ist offensichtlich, dass die Hesse-Matrix ∇ 2 D i Phys ( N) in jedem Voxel i die Nullmatrix 

ist. 

8.2.2 Gradient und Hesse-Matrix der RBW-gewichteten Dosis 

Hier werden die Ableitungen der RBW-gewichteten Dosis 

mit D i Bio 


mit ∇D i Bio 

: Rp 

≥0 → R≥0 ∀ i, angegeben. 

D i Bio( N) = D i Phys( N) · RBW i ( N) , (8.3) 

∇D i Bio( N) = ∇D i Phys( N) · RBW i ( N) + D i Phys( N) · ∇RBW i ( N) , (8.4) 

: Rp 

≥0 → Rp ∀ i. 

Die Hesse-Matrix ist 

∇ 2 D i Bio( N) = ∇D i Phys( N) · ∇RBW i ( N) T + ∇RBW i ( N) · ∇D i Phys( N) T 

mit ∇ 2 D i Bio ( N) ∈ R p×p ∀ i. 

82 

+ D i Phys( N) · ∇ 2 RBW i ( N) , 

(8.5)

8.3 Gradient und Hesse-Matrix der Zielfunktion 

8.2.3 Gradient und Hesse-Matrix des analytischen Ausdrucks 

für die RBW-gewichtete Dosis 

Hier werden die Ableitungen des analytischen Ausdrucks für die RBW-gewichtete 

Dosis 

 

D i Bio(ana)( N) = 

αi · (c T i · N) + βi · (c T i · N) 2 

mit Di Bio(ana) 

obere Ausdruck ist stetig differenzierbar. 


βx 

+ 

2 αx 

2βx 

− αx 

2βx 

, (8.6) 

: Rp 

≥0 → R≥0 ∀ i, angegeben. Wie bereits in 2.2.2 erwähnt wurde, der 

∇D i Bio(ana)( 

αi · (c 

N) = 0.5 · 

T i · N) + βi · (c T i · N) 2 

βx 

 

αi + βi · 2 · (c T i · 

N) 

· 

βx 

mit ∇Di Bio(ana) 

Gradient komponentenweise stetig. 

· ci , 

+ 

αx 

2βx 

2 −0.5 

(8.7) 

: Rp 

≥0 → Rp ∀ i. Da (8.6) stetig differenzierbar ist, so ist der obere 

Aus Platzgründen wird die Hesse-Matrix ∇ 2 D i Bio(ana) ( N) hier nicht angegeben. 

8.3 Gradient und Hesse-Matrix der Zielfunktion 

In diesem Abschnitt wird der Gradient und die Hesse-Matrix der Zielfunktion angegeben. 

Die Zielfunktion wurde in Abschnitt 2.3 eingeführt und dort physikalisch, 

technisch und mathematisch diskutiert. Gradient und Hesse-Matrix der Zielfunktion 

werden jeweils für den Fall, dass mit der physikalischen, der RBW-gewichteten 

und mit dem analytischen Ausdruck für die RBW-gewichtete Dosis optimiert wird, 

angegeben. Gradient und Hesse-Matrix spielen bei den Verfahren zur Minimierung 

als auch bei der theoretischen Diskussion der Zielfunktion eine tragende Rolle. Wie 

bereits in 2.3.2 erwähnt wurde, beim Ableiten der Zielfunktion wird die Heaviside- 

Funktion Θ als konstanter Faktor behandelt. 

8.3.1 Gradient und Hesse-Matrix bei Optimierung der 

physikalischen Dosis 

Optimierung der physikalischen Dosis erfordert das Einsetzen von Di Phys für Di act in 

die Zielfunktion. Die Zielfunktion wird in diesem Fall mit χ2 Phys bezeichnet und hat 

83

8 Anhang 

folgende Gestalt: 

mit χ 2 Phys 


mit ∇χ 2 Phys 

χ 2 Phys( N) = 

: Rp≥0 

→ R≥0. 

 

Di pre − c T i · 2 N 

∆D 

i∈Target 

2 pre 

 

Di max − c T i · 2 N 

+ 

i∈OAR 

∇χ 2 Phys( N) = −2 

: Rp 

≥0 → Rp . 


− 2 

∆D 2 max 

 

Di pre − c T i · 

N 

∆D 

i∈Target 

2 pre 

 

Di max − c T i · N 

i∈OAR 

∇ 2 χ 2 Phys( N) = 2 

mit ∇ 2 χ 2 Phys ( N) ∈ R p×p . 

1 

∆D 

i∈Target 

2 pre 

+ 2 

1 

∆D 

i∈OAR 

2 max 

∆D 2 max 

· ci · c T i 

· ci · c T i 

 

 

 

· Θ c T i · N − D i 

max 

· ci 

 

· ci · Θ c T i · N − D i 

max 

 

· Θ c T i · N − D i 

max 

8.3.2 Gradient und Hesse-Matrix bei Optimierung der 

RBW-gewichteten Dosis 

, 

, 

, 

(8.8) 

(8.9) 

(8.10) 

Optimierung der RBW-gewichteten Dosis erfordert das Einsetzen von Di Bio für Di act 

in die Zielfunktion. Die Zielfunktion wird in diesem Fall mit χ2 Bio bezeichnet und hat 

folgende Gestalt: 

84 

χ 2 Bio( N) = 

 

Di pre − Di Bio ( 2 N) 

∆D 

i∈Target 

2 pre 

 

Di max − Di Bio ( 2 N) 

+ 

i∈OAR 

∆D 2 max 

 

· Θ D i Bio( N) − D i 

max 

, 

(8.11)

mit χ 2 Bio 

: Rp≥0 

→ R≥0. 


∇χ 2 Bio( N) = −2 

mit ∇χ 2 Bio 

− 2 

 

Di pre − Di Bio ( 

N) 

∆D 

i∈Target 

2 pre 

 

Di max − Di Bio ( N) 

i∈OAR 

: Rp 

≥0 → Rp . 


∇ 2 χ 2 Bio( N) = 2 

⎡ 

∆D 2 max 

⎣ 

i∈Target 

∇Di Bio ( N) · ∇Di Bio ( N) T 

∆D2 pre 

+ 2 

· Θ 

⎡ 

mit ∇ 2 χ 2 Bio ( N) ∈ R p×p . 

⎣ 

i∈OAR 

∇Di Bio ( N) · ∇Di Bio ( N) T 

∆D2 max 

 

D i Bio( N) − D i 

max , 

 

8.4 Der Extremwertsatz von Weierstraß 

· ∇D i Bio( N) 

· ∇D i Bio( 

N) · Θ D i Bio( N) − D i 

max 

− 

− 

 

Di pre − Di Bio ( 

N) 

∆D2 pre 

 

Di max − Di Bio ( N) 

∆D 2 max 

 

, 

(8.12) 

· ∇ 2 D i Bio( N) 

· ∇ 2 D i Bio( N) 

8.3.3 Gradient und Hesse-Matrix bei Optimierung mit dem 

analytischen Ausdruck für die RBW-gewichtete Dosis 

⎤ 

⎦ 

⎤ 

⎦ 

(8.13) 

Bei Optimierung mit dem analytischen Ausdruck für die RBW-gewichtete Dosis 

muss Di Bio(ana) für Di act in die Zielfunktion eingesetzt werden. In diesem Fall wird 

die Zielfunktion mit χ2 Bio(ana) bezeichnet. Den Ausdruck χ2 Bio(ana) , den Gradienten 

∇χ2 Bio(ana) und die Hesse-Matrix ∇2χ2 Bio(ana) erhält man, wenn in χ2Bio , ∇χ2Bio und 

∇2χ2 Bio aus dem vorherigem Abschnitt 8.3.2 die Ausdrücke Di Bio , ∇Di Bio und ∇2Di Bio 

mit Di Bio(ana) , ∇Di Bio(ana) und ∇2Di Bio(ana) ersetzt werden. 

8.4 Der Extremwertsatz von Weierstraß 

Satz 8.1 

Es sei G ⊂ X, G nichtleer, eine kompakte Menge und f sei auf G eine stetige Funktion. 

Dann besitzt f auf G mindestens ein Optimum/Extremwert. 

Bemerkungen: 

85

8 Anhang 

• Der obige Satz ist in der Literatur in verschiedenen Versionen formuliert. Die 

obige Version richtet sich nach [GT97]. 

• Häufig wird der obige Satz auch nur "Satz von Weierstraß" oder "Satz vom 

Maximum und Minimum einer Funktion" genannt. 

• Im endlichdimensionalen Raum ist die Kompaktheit einer Menge äquivalent 

zu ihrer Beschränktheit und Abgeschlossenheit. Diese Äquivalenz gilt nicht in 

unendlichdimensionalen Räumen [Trö09]. 

• Der obige Satz liefert lediglich eine Aussage über die Existenz von mindestens 

einem Optimum. Über das Auffinden oder Eindeutigkeitsaussagen von 

optimalen Punkten müssen andere Techniken verwendet werden. 

Oftmals ist der Definitionsbereich G von f nicht kompakt. Der Satz von Weierstraß 

kann dennoch als Existenzkriterium für ein Minimum verwendet werden, wenn 

Niveau-Mengen betrachtet werden. Eine Niveau-Menge NM ist wie folgt definiert: 

Definition 8.2 

Sei G ⊂ R n , G nichtleer, f : G → R und x0 ∈ G. Die Menge 

heißt Niveau-Menge der Funktion f. 

NM(f, f(x0)) := {x ∈ G | f(x) ≤ f(x0)} (8.14) 

Jetzt kann der Satz von Weierstraß auf kompakte Niveau-Mengen angepasst werden. 

Satz 8.3 

Es sei G ⊂ R n , G nichtleer und f : G → R stetig auf G. Existiert ein x0 ∈ G, so 

dass die zugehörige Niveau-Menge 

NM(f, f(x0)) := {x ∈ G | f(x) ≤ f(x0)} (8.15) 

nichtleer und kompakt ist, dann besitzt f auf G mindestens ein globales Minimum. 

8.5 Unterhalbstetigkeit einer Funktion 

Die Halbstetigkeit einer Funktion ist eine Erweiterung des Begriffes der Stetigkeit 

einer Funktion. Funktionen, die unstetig sind, können unterhalb- oder oberhalbstetig 

sein. Bei der Minimierung einer reellwertigen Funktion spielt die Unterhalbstetigkeit 

der Funktion eine große Rolle. Da die Zielfunktion in dieser Arbeit minimiert werden 

soll, wird im folgenden nur die Unterhalbstetigkeit behandelt. Oft wird anstelle von 

Unterhalbstetigkeit der Begriff "nach unten halbstetig" oder "halbstetig von unten" 

verwendet. 

86

8.5 Unterhalbstetigkeit einer Funktion 

Es folgen zwei äquivalente Definitionen für unterhalbstetige Funktionen: 


Sei X ein topologischer Raum, x0 ∈ X und f : X → R eine reellwertige Funktion. 

f heißt im Punkt x0 unterhalbstetig, wenn für jedes ɛ > 0 eine Umgebung U von x0 

existiert, so dass f(y) > f(x0) − ɛ für alle y ∈ U gilt. 


Sei X ein topologischer Raum, x0 ∈ X und f : X → R eine reellwertige Funktion. 

Des Weiteren existiert in X eine beliebige Folge xn mit xn → x0. Die Funktion f ist 

unterhalbstetig in x0, falls 

lim inf f(xn) ≥ f(x0) (8.16) 

xn→x0 

gilt. 

Bei näherer Betrachtung der beiden obigen Definitionen erkennt man, dass bei einer 

unterhalbstetigen Funktion die Funktionswerte nicht nach unten springen können. 

Analog, wie bei der Stetigkeit einer Funktion, gilt: 


Die Funktion f heißt unterhalbstetig auf X, wenn sie in jedem Punkt x0 ∈ X unterhalbstetig 

ist. 

Eigenschaften unterhalbstetiger Funktionen: 

• Eine Funktion f ist in einem Punkt x0 stetig, wenn sie in x0 sowohl unterhalbals 

auch oberhalbstetig ist. 

• Sind f und g in x0 unterhalbstetig, dann ist auch deren Summe f + g in x0 

unterhalbstetig. 

• Sind f und g nichtnegativ und in x0 unterhalbstetig, dann ist auch deren 

Produkt f · g in x0 unterhalbstetig. 

Die zweite Eigenschaft zur Addition unterhalbstetiger Funktionen kann über Definition 

8.5 leicht gezeigt werden. Aus der Definition von "lim inf" folgt: 

lim inf 

xn→x0 

(f(xn) + g(xn)) ≥ lim inf 

xn→x0 

f(xn) + lim inf 

xn→x0 

g(xn) ≥ f(x0) + g(x0) . (8.17) 

Analog kann die dritte Eigenschaft zur Multiplikation unterhalbstetiger Funktionen 

gezeigt werden. 

Abbildung 8.1 zeigt ein Beispiel für eine unstetige Funktion, die unterhalbstetig 

ist. 

87

8 Anhang 

f 

Abbildung 8.1: Beispiel einer unstetigen Funktion, die unterhalbstetig ist. Man sieht, dass die 

Funktion f an keiner Stelle nach unten springt. Der Sprung nach oben an der Stelle x0 verletzt die 

Bedingung der Unterhalbstetigkeit nicht. 

8.6 Radiale Unbeschränktheit einer Funktion 

Bei der Minimierung einer Funktion spielt die radiale Unbeschränktheit der Funktion 

eine bedeutende Rolle. Eine radial unbeschränkte Funktion ist wie folgt definiert: 


Eine Funktion f : R n → R mit 

heißt radial unbeschränkt. 

Bemerkungen: 

lim f(x) = +∞ (8.18) 

||x||→∞ 

• Manchmal wird eine radial unbeschränkte Funktion auch "koerziv" genannt. 

• Anschaulich bedeutet die radiale Unbeschränktheit einer Funktion, dass die 

Funktionswerte gegen unendlich gehen, wenn die Eingabewerte gegen unendlich 

gehen. 

• Sind die Funktionen f und g radial unbeschränkt, so ist auch deren Summe 

f + g radial unbeschränkt. 

8.7 Erweiterungen des Extremwertsatzes von 

Weierstraß 

In Abschnitt 8.4 ist die "Standardversion" des Extremwertsatzes von Weierstraß 

angegeben. Diese benötigt Stetigkeit der Funktion und Kompaktheit der Menge, auf 

der die Funktion betrachtet wird. Der Extremwertsatz von Weierstraß gilt auch unter 

schwächeren Voraussetzungen. Z.B. besitzt Satz 8.1 seine Gültigkeit, wenn die 

88

8.8 Eindeutigkeit eines Minimums 

Forderung der Stetigkeit von f durch Unterhalbstetigkeit ersetzt wird [Ste04]. Wenn 

zusätzlich die radiale Unbeschränktheit von f einbezogen wird, so kann der folgende 

Satz angegeben werden: 

Satz 8.8 

Die zulässige Menge G sei nichtleer und abgeschlossen, die Funktion f : G → R sei 

auf G unterhalbstetig und radial unbeschränkt, also 

lim 

||x||→∞, x∈G 

f(x) = +∞ . (8.19) 

Dann besitzt f auf G mindestens ein globales Minimum. 

8.8 Eindeutigkeit eines Minimums 

In der Regel werden Eindeutigkeitsaussagen für Minima von Optimierungsproblemen 

über Konvexitätseigenschaften der zulässigen Menge und Zielfunktion getroffen. 

Satz 8.9 

Sei G ⊂ R n eine konvexe Menge und f : G → R eine konvexe Funktion. Dann gilt: 

i) Jedes lokale Minimum von f auf G ist auch globales Minimum. 

ii) Ist f streng konvex, dann hat f auf G höchstens ein lokales Minimum und dieses 

ist dann zugleich das einzige globale Minimum. 

Bemerkungen: 

• Haüfig wird der Begriff strikt konvex anstelle von streng konvex verwendet. 

• Definitionen von konvexen Mengen und Funktion, als auch weitere Bemerkungen, 

Sätze und Eigenschaften von solchen, befinden sich z.B. in [GK02, Alt02, 

Ulb07]. 

8.9 Exakte Schrittweitenbestimmung bei 

Optimierung der physikalischen Dosis 

Optimierung der linearen physikalischen Dosis bei Vernachlässigung des OAR-Terms 

in der Zielfunktion hat folgende Gestalt: 

χ 2 Phys( N) = 

i∈Target 

 

Di pre − c T i · 2 N 

∆D 2 pre 

, (8.20) 

89

8 Anhang 

mit χ 2 Phys : R p 

≥0 → R≥0. In diesem Fall kann die exakte Schrittweite µPhys (siehe 

Abschnitt 4.2) analytisch berechnet werden. Dafür ergibt sich ein streng konvexes 

quadratisches Optimierungsproblem. Das eindeutige µPhys muss dann die folgende 

notwendige Optimalitätsbedingung erster Ordnung erfüllen: 

dχ 2 Phys ( N + µPhys d) 

dµPhys 

= −2 

i∈Target 

 

D i pre − c T i · ( N + µPhys d) 

∆D 2 pre 

 

· 

 

c T i · 

d = 0 . 

(8.21) 

Nach einigen analytischen Operationen kann nach dem µPhys eindeutig umgestellt 

werden: 

µPhys = 

⎛ 

⎝ 

i∈Target 

 

Di pre − c T i · 

N · c T i · ⎞ 

⎛ 

d 

⎠ ⎜ 

/ ⎝ 

∆D 2 pre 

 

i∈Target 

 

c T i · d 

∆D 2 pre 

2 

⎞ 

⎟ 

⎠ . (8.22) 

Der Nenner in (8.22) darf nicht 0 werden. 

Diese Prozedur muss bei einem Linesearch-Verfahren in jedem Iterationsschritt 

k wiederholt werden. D.h., der Iterationsindex k wurde hier für µk, Nk und dk 

unterschlagen. Der genaue Rechenweg von (8.21) nach (8.22) findet sich in [Hor08]. 

90

Literaturverzeichnis 

[A + 99] Bruce Alberts et al. Lehrbuch der Molekularen Zellbiologie. Wiley-VCH 

Verlag, 1. Auflage, 1999. 

[Alt02] Walter Alt. Nichtlineare Optimierung. Vieweg Verlag, 1. Auflage, 2002. 

[B + 90] Thomas Bortfeld et al. Methods of Image Reconstruction from Projections 

Applied to Conformation Radiotherapy. Physics in Medicine and 

Biology, 35(10):1423–1434, 1990. 

[B + 06] Christoph Bert et al. Treatment of Moving Targets with Scanned Ion Beams: 

A Comparison of Different Strategies. Medical Physics, 33(6):2049, 

2006. 

[BD11] Christoph Bert und Marco Durante. Motion in Radiotherapy: Particle 

Therapy. Physics in Medicine and Biology, 56(16):R113–R144, 2011. 

[Ber06] Christoph Bert. Bestrahlungsplanung für bewegte Zielvolumina in der 

Tumortherapie mit gescanntem Kohlenstoffstrahl. Dissertation, Technische 

Universität Darmstadt, 2006. 

[Bet30] Hans Bethe. Zur Theorie des Durchgangs schneller Korpuskularstrahlung 

durch Materie. Annalen der Physik, 5(5):325–400, 1930. 

[Blo33] Felix Bloch. Zur Bremsung rasch bewegter Teilchen beim Durchgang 

durch Materie. Annalen der Physik, 5(16):285–321, 1933. 

[Bra99] Siegmund Brandt. Datenanalyse. Spektrum Akademischer Verlag, 

4. Auflage, 1999. 

[Bro70] Charles George Broyden. The Convergence of a Class of Double-Rank 

Minimization Algorithms. Journal of the Institute of Mathematics and 

Its Applications, 6:76–90, 1970. 

[Bus09] Alwin Buschbacher. Nichtlineare Optimierung der Teilchenfluenz für die 

biologisch effektive Dosis in der Schwerionentherapie: Effiziente numerische 

Lösung auftretender Gleichungssysteme. Diplomarbeit, Hochschule 

Darmstadt, 2009. 

[D + 06] Jürgen Debus et al. Strahlentherapie. Springer Verlag, 1. Auflage, 2006. 

92


[Dav04] Tim Davis. Algorithm 832: UMFPACK - an Unsymmetric-Pattern Multifrontal 

Method. ACM Transactions on Mathematical Software, 30:196– 

199, 2004. 

[DL10] Marco Durante und Jay S. Loeffler. Charged Particles in Radiation 

Oncology. Nature Reviews - Clinical Oncology, 7(1):37–43, 2010. 

[E + 99] Wolfgang Enghardt et al. Positron Emission Tomography for Quality 

Assurance of Cancer Therapy with Light Ion Beams. Nuclear Physics 

A, 654:1047c–1050c, 1999. 

[EKS08] Thilo Elsässer, Michael Krämer und Michael Scholz. Accuracy of the 

Local Effect Model for the Prediction of Biological Effects of Carbon 

Ion Beams In-Vitro and In-Vivo. International Journal of Radiation 

Oncology*Biology*Physics, 71(3):866–872, 2008. 

[EMR96] Gisela Engeln-Müllges und Fritz Reutter. Numerik-Algorithmen. VDI 


[F + 92] Brian P. Flannery et al. Numerical Recipes in C - The Art of Scientific 

Computing. Cambridge University Press, 2. Auflage, 1992. 

[Fle70] Roger Fletcher. A New Approach to Variable Metric Algorithms. Computer 

Journal, 13(3):317–322, 1970. 

[G + 08] Alexander Gemmel et al. Biological Dose Optimization with Multiple 

Ion Fields. Physics in Medicine and Biology, 53:6991–7012, 2008. 

[Gem09] Alexander Gemmel. Berechnung der RBW-gewichteten Dosis und biologische 

Dosimetrie für bewegte Zielvolumina in der Tumortherapie 

mit gescannten Kohlenstoffionen. Dissertation, Technische Universität 


[GK02] Carl Geiger und Christian Kanzow. Theorie und Numerik restringierter 

Optimierungsaufgaben. Springer Verlag, 1. Auflage, 2002. 

[GM06] Christian Gerthsen und Dieter Meschede. Gerthsen Physik. Springer 


[Gol70] Donald Goldfarb. A Family of Variable Metric Updates Derived by 

Variational Means. Mathematics of Computation, 24(109):23–26, 1970. 

[Grö04] Sven Oliver Grözinger. Volume Conformal Irradiation of Moving Target 

Volumes with Scanned Ion Beams. Dissertation, Technische Universität 


93


[Gro01] Intensity Modulated Radiation Therapy Collaborative Working Group. 

Intensity-Modulated Radiotherapy: Current Status and Issues of Interest. 

International Journal of Radiation Oncology*Biology*Physics, 

51(4):880–914, 2001. 

[GT97] Christian Großmann und Johannes Terno. Numerik der Optimierung. 

B.G. Teubner Stuttgart Verlag, 2. Auflage, 1997. 

[H + 93] Thomas Haberer et al. Magnetic Scanning System for Heavy Ion Therapy. 

Nuclear Instruments and Methods in Physics Research, A330:296– 

305, 1993. 

[H + 04] Thomas Haberer et al. The Heidelberg Ion Therapy Center. Radiotherapy 

Oncology, 73:186–190, 2004. 

[Hac93] Wolfgang Hackbusch. Iterative Lösung großer schwachbesetzter Gleichungssysteme. 

B.G. Teubner Stuttgart Verlag, 2. Auflage, 1993. 

[Hal94] Eric J. Hall. Radiobiology for the Radiologist. J.B. Lippincott Company, 

4. Auflage, 1994. 

[HB97] Thomas Herrmann und Michael Baumann. Klinische Strahlenbiologie - 

kurz und bündig. Gustav Fischer Verlag, 3. Auflage, 1997. 

[HDK10] Michael Horcicka, Marco Durante und Michael Krämer. Particle Number 

Optimization Using the BFGS Method in Heavy-Ion Therapy. Report, 

GSI Helmholtzzentrum für Schwerionenforschung GmbH, 2010. 

[Heu83] Harro Heuser. Lehrbuch der Analysis - Teil 2. B.G. Teubner Stuttgart 


[Heu84] Harro Heuser. Lehrbuch der Analysis - Teil 1. B.G. Teubner Stuttgart 


[Heu92] Harro Heuser. Funktionalanalysis. B.G. Teubner Stuttgart Verlag, 

3. Auflage, 1992. 

[Hor79] Reiner Horst. Nichtlineare Optimierung. Carl Hanser Verlag, 1. Auflage, 

1979. 

[Hor08] Michael Horcicka. Mehrfelderoptimierung für die biologisch effektive Dosis 

in der Schwerionentherapie: Nichtlineare Methoden und numerische 

Analyse. Diplomarbeit, Hochschule Darmstadt, 2008. 

[J + 01] Oliver Jäkel et al. Treatment Planning for Heavy-Ion Radiotherapy: Clinical 

Implementation and Application. Physics in Medicine and Biology, 

46(4):1101–1116, 2001. 

94


[K + 00] Michael Krämer et al. Treatment Planning for Heavy-Ion Radiotherapy: 

Physical Beam Model and Dose Optimization. Physics in Medicine and 

Biology, 45(11):3299–3317, 2000. 

[KD10] Michael Krämer und Marco Durante. Ion Beam Transport Calculations 

and Treatment Plans in Particle Therapy. The European Physical 

Journal D, 60:195–202, 2010. 

[KK94] Michael Krämer und Gerhard Kraft. Calculations of Heavy-Ion Track 

Structure. Radiation and Environmental Biophysics, 33(2):91–109, 1994. 

[KKWS03] Michael Krämer, Wilma Kraft-Weyrather und Michael Scholz. The Increased 

Biological Effectiveness of Heavy Charged Particles: From Radiobiology 

to Treatment Planning. Technology in Cancer Research and 

Treatment, 2(5):427–436, 2003. 

[KP88] Hanno Krieger und Wolfgang Petzold. Strahlenphysik, Dosimetrie und 

Strahlenschutz. B.G. Teubner Stuttgart Verlag, 1988. Band 1 und 2. 

[Krä01] Michael Krämer. Treatment Planning for Heavy-Ion Radiotherapy: Biological 

Optimization of Multiple Beam Ports. Journal of Radiation Research, 

42(1):39–46, 2001. 

[Krä09] Michael Krämer. Swift Ions in Radiotherapy - Treatment Planning 

with TRiP98. Nuclear Instruments and Methods in Physics Research 

B, 267:989–992, 2009. 

[Kra00] Gerhard Kraft. Tumor Therapy with Heavy Charged Particles. Progress 

in Particle and Nuclear Physics, 45:473–544, 2000. 

[Kra08] Gerhard Kraft. Tumortherapie mit schweren Ionen. GSI Helmholtzzentrum 

für Schwerionenforschung GmbH, 2. Auflage, 2008. 

[Kre07] Erwin Kreyszig. Introductory Functional Analysis with Applications. 

Wiley Verlag, 3. Auflage, 2007. 

[KS00] Michael Krämer und Michael Scholz. Treatment Planning for Heavy-Ion 

Radiotherapy: Calculation and Optimization of Biologically Effective 

Dose. Physics in Medicine and Biology, 45(11):3319–3330, 2000. 

[KS06] Michael Krämer und Michael Scholz. Rapid Calculation of Biological Effects 

in Ion Radiotherapy. Physics in Medicine and Biology, 51(8):1959– 

1970, 2006. 

[Lev44] Kenneth Levenberg. A Method for the Solution of Certain Non-Linear 

Problems in Least Squares. The Quarterly of Applied Mathematics, 

2:164–168, 1944. 

95


[Mar63] Donald W. Marquardt. An Algorithm for Least-Squares Estimation of 

Nonlinear Parameters. Journal of the Society for Industrial and Applied 

Mathematics, 11(2):431–441, 1963. 

[Pag03] Harald Paganetti. Significance and Implementation of RBE Variations in 

Proton Beam Therapy. Technology in Cancer Research and Treatment, 

2(5):413–426, 2003. 

[RB10] Eike Rietzel und Christoph Bert. Respiratory Motion Management in 

Particle Therapy. Medical Physics, 37(2):449–460, 2010. 

[Saa03] Yousef Saad. Iterative Methods for Sparse Linear Systems. Society for 

Industrial and Applied Mathematics, 2. Auflage, 2003. 

[Sch93] Hans Rudolf Schwarz. Numerische Mathematik. B.G. Teubner Stuttgart 


[Sch03] Michael Scholz. Effects of Ion Radiation on Cells and Tissues. Advances 

in Polymer Science, 162:95–155, 2003. 

[Sch06] Alexander Schmidt. Examinations on Multiple Field Optimization in 

Ion Therapy. Diplomarbeit, TU Darmstadt, 2006. 

[SE + 04] Daniela Schulz-Ertner et al. Results of Carbon Ion Radiotherapy in 152 

Patients. International Journal of Radiation Oncology*Biology*Physics, 

58(2):631–640, 2004. 

[SESE10] Dieter Schardt, Thilo Elsässer und Daniela Schulz-Ertner. Heavy-Ion 

Tumor Therapy: Physical and Radiobiological Benefits. Reviews of Modern 

Physics, 82(1):383–425, 2010. 

[Sha70] David Shanno. Conditioning of Quasi-Newton Methods for Function 

Minimization. Mathematics of Computation, 24:647–656, 1970. 

[SKD10] Emanuele Scifoni, Michael Krämer und Marco Durante. Oxygen Effect 

Implementation into TRiP98. Report, GSI Helmholtzzentrum für 

Schwerionenforschung GmbH, 2010. 

[Spe99] Peter Spellucci. Nichtlineare Optimierungsprobleme hoher Dimension - 

Stand der Forschung. Report, Technische Universität Darmstadt, 1999. 

[Ste04] Oliver Stein. Optimierung III (Nichtlineare Optimierung). Vorlesungsskript, 

Universität Duisburg-Essen, 2004. 

[Trö09] Fredi Tröltzsch. Optimale Steuerung partieller Differentialgleichungen. 

Vieweg+Teubner Verlag, 2. Auflage, 2009. 

[Ulb07] Stefan Ulbrich. Nichtlineare Optimierung. Vorlesungsskript, Technische 

Universität Darmstadt, 2007. 

96


[vN + 06] Cläre von Neubeck et al. A Multidimensional System for Biological 

Dosimetry. Report, Gesellschaft für Schwerionenforschung mbH, 2006. 

[W + 07] Andre Wambersie et al. The RBE Issues in Ion-Beam Therapy: Conclusions 

of a Joint IAEA/ICRU Working Group Regarding Quantities and 

Units. Radiation Prot. Dosimetry, 122:463–470, 2007. 

[Web96] Uli Weber. Volumenkonforme Bestrahlung mit Kohlenstoff-Ionen zur 

Vorbereitung einer Strahlentherapie. Dissertation, Universität Kassel, 

1996. 

[Wik11] Wikipedia. URL http://de.wikipedia.org/wiki/Krebs, 2011. 

[Wil46] R. R. Wilson. Radiological Use of Fast Protons. Radiology, 47:487–491, 

1946. 

[WK09] Uli Weber und Gerhard Kraft. Comparison of Carbon Ions Versus Protons. 

The Cancer Journal, 15(4):325–332, 2009. 

97

Danksagung 

Hier möchte ich mich bei den vielen Menschen bedanken, die zu dieser Master-Thesis 

beigetragen haben. 

Als erstes Danke ich Prof. Dr. Christian Meyer dafür, dass er mir die Möglichkeit 

gegeben hat, diese externe Master-Thesis anzufertigen. Des Weiteren danke ich 

ihm für die zahlreichen Ratschläge und Denkanstöße. Trotz der größeren Entfernung 

habe ich mich die ganze Zeit hervorragend betreut gefühlt. 

Bei Prof. Dr. Stefan Ulbrich bedanke ich mich herzlichst für die Übernahme der 

Korreferentschaft. 

Bei PD Dr. Michael Krämer bedanke ich mich für die Übergabe des interessanten 

Themas und für die Beantwortung meiner Fragen. 

Vielen Dank an Prof. Dr. Michael Gubitz, dass er mich im Jahre 2006 als Praktikanten 

an die GSI in die Abteilung Biophysik vermittelt hat. Ohne ihn wäre diese 

Arbeit nicht zustande gekommen. 

Dem ehemaligen Leiter und Gründer der Biophysik-Abteilung Prof. Dr. Gerhard 

Kraft danke ich, dass er mich im Jahre 2006 in seine Abteilung aufgenommen hat. 

Dem gegenwärtigem Leiter der Biophysik-Abteilung Prof. Dr. Marco Durante 

danke ich herzlichst, dass ich in seiner Abteilung als Werkstudent arbeiten durfte 

und diese Master-Thesis erstellen konnte. 

Bei den zahlreichen Zimmerkollegen über den längeren Zeitraum dieser Master- 

Thesis bedanke ich mich für die angenehme Büroatmosphäre. Besonders danke ich 

Alexander Helm, der während dieser Zeit treu mein Platznachbar war und für den 

Austausch mit ihm von Biologie- und Mathe-Themen. 

Der gesamten Biophysik-Gruppe danke ich für die angenehme Arbeitsatmosphäre 

in den letzten 5 1 Jahren. Diese tolle Zeit werde ich mein ganzes Leben lang nicht 

2 

vergessen! 

Abschließend ist es mir ein besonderes Anliegen mich bei meinen Eltern zu bedanken. 

An sie geht mein größter Dank, denn sie haben mir überhaupt das Studium 

der Mathematik ermöglicht. 

99

Erklärung 

Hiermit versichere ich, die vorliegende Master-Thesis ohne Hilfe Dritter, nur mit den 

angegebenen Quellen und Hilfsmitteln, angefertigt zu haben. Alle Stellen, die aus 

den Quellen entnommen wurden, sind als solche kenntlich gemacht worden. Diese 

Arbeit hat in gleicher Form noch keiner Prüfungsbehörde vorgelegen. 

Darmstadt, den 27. Oktober 2011. 

(Michael Horcicka)

Fachbereich Mathematik - GSI

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?