Mehrfelderoptimierung für die biologisch effektive Dosis in der - GSI

gsi.de

Mehrfelderoptimierung für die biologisch effektive Dosis in der - GSI

Hochschule Darmstadt

- Fachbereich Mathematik und Naturwissenschaften -

Gesellschaft für Schwerionenforschung

- Abteilung Biophysik -

Diplomarbeit

Mehrfelderoptimierung für die biologisch effektive

Dosis in der Schwerionentherapie: Nichtlineare

Methoden und numerische Analyse

Angefertigt von

Michael Horcicka

Referent: Prof. Dr. Jürgen Groß

Korreferent: Dr. Michael Krämer

Darmstadt 2008


Diese Arbeit wurde mit dem Textsatzsystem L ATEX erstellt.


Abstract

The software TRiP is successfully used for the patient treatment planning in the ion

therapy pilot project at Gesellschaft für Schwerionenforschung. A crucial part of the

treatment planning is the particle number optimization in order to achieve a target

dose distribution as close as possible to the prescribed dose distribution. Recently,

a new optimization technique called multiple field optimization was implemented in

TRiP. This technique allows a better target conformity and a sparing of organs-atrisk

by 20-50% in comparison with single field optimization.

To obtain the optimal particle numbers it is necessary to minimize an objective

function. If biologically effects are taken into account the objective function is

nonlinear in its free parameters. Hence, numerical methods are required to solve the

optimization problem.

First of all, the method of steepest descent, conjugated gradients and the Bortfeld

algorithm were examined. The results showed, that the method of steepest descent

has the best numerical properties. Therefore, modifications of the method of steepest

descent were tested to improve the convergence speed. The modifications showed no

improvements.

Finally, the Levenberg-Marquardt-Minimization was implemented. This method

shows a very good convergence behaviour concerning the iteration steps. However,

due to the handling of large matrices the computation times are very long. Suggestions

to avoid the long computation times are discussed.

3


Inhaltsverzeichnis

Abbildungsverzeichnis 6

Abkürzungsverzeichnis 8

1 Einleitung 10

1.1 Die Krankheit Krebs . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.1.1 Gehirntumore . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.2 Strahlentherapie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3 Physikalische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4 Strahlenbiologische Grundlagen . . . . . . . . . . . . . . . . . . . . . 15

1.5 Das Therapieprojekt der GSI . . . . . . . . . . . . . . . . . . . . . . 16

2 Material und Methoden 20

2.1 Bestrahlungsplanung mit TRiP . . . . . . . . . . . . . . . . . . . . . 20

2.2 Berechnung der Dosis . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2.1 Berechnung der physikalischen Dosis . . . . . . . . . . . . . . 23

2.2.2 Berechnung der biologisch effektiven Dosis . . . . . . . . . . . 24

2.3 Optimierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.4 Einzelfeldoptimierung vs. Mehrfelderoptimierung . . . . . . . . . . . . 28

3 Numerische Optimierungsverfahren 31

3.1 Numerische Minimierung . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2 Das Gradientenverfahren . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.3 Das konjugierte Gradientenverfahren . . . . . . . . . . . . . . . . . . 33

3.4 Das Bortfeld-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.5 Konvergenzergebnisse und Gegenüberstellung der Verfahren . . . . . . 35

3.5.1 Daten und Ressourcen für die Minimierung . . . . . . . . . . . 35

3.5.2 Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4 Weitere Betrachtung der numerischen Optimierung 38

4.1 Startwerte für die Optimierung - Voroptimierung . . . . . . . . . . . 38

4.2 Eindeutigkeit des Minimums . . . . . . . . . . . . . . . . . . . . . . . 39

4.3 Schrittweitensteuerung bei den gradientenbezogenen Verfahren . . . . 39

5 Konvergenzbeschleunigung des Gradientenverfahrens 42

5.1 Verlängerung des Gradienten in der Nähe des Minimums . . . . . . . 42

5.2 Dynamische Suche nach der optimalen Schrittweite . . . . . . . . . . 43

4


Inhaltsverzeichnis

5.2.1 Der Suchalgorithmus . . . . . . . . . . . . . . . . . . . . . . . 43

5.2.2 Konvergenzergebnisse . . . . . . . . . . . . . . . . . . . . . . . 44

5.2.3 Verifikation des Dämpfungsfaktors für andere Patientenpläne . 45

6 Die Levenberg-Marquardt-Minimierung 47

6.1 Minimierung mit quadratischer Form . . . . . . . . . . . . . . . . . . 47

6.2 Die Levenberg-Marquardt-Minimierung . . . . . . . . . . . . . . . . . 48

6.3 Approximation der Hesse-Matrix . . . . . . . . . . . . . . . . . . . . 50

6.4 Berechnung der Suchrichtung über die Lösung eines linearen Gleichungssystems

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

6.5 Konvergenzergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

6.6 Modifizierungen der Levenberg-Marquardt-Minimierung . . . . . . . . 52

6.6.1 Vereinfachte Levenberg-Marquardt-Minimierung . . . . . . . . 52

6.6.2 Levenberg-Marquardt-Minimierung mit Schrittweitenparameter 55

6.7 Diskussion der Konvergenzergebnisse . . . . . . . . . . . . . . . . . . 56

7 Zusammenfassung und Ausblick 58

8 Anhang 60

8.1 Bestrahlungsplandaten . . . . . . . . . . . . . . . . . . . . . . . . . . 60

8.2 Gradient und Hesse-Matrix bei Optimierung der physikalischen Dosis 60

8.3 Exakte Schrittweitenbestimmung bei Optimierung der physikalischen

Dosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

8.4 Anzahl erforderlicher Punktoperationen zur Lösung eines linearen

Gleichungssystems . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

8.5 Das Cholesky-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . 62

Literaturverzeichnis 65

5


Abbildungsverzeichnis

6

1.1 Überlagerung von Bestrahlungsfeldern bei der Photonentherapie . . . 11

1.2 Dosisverteilung, erzeugt durch IMRT und Kohlenstofftherapie im Schädelinneren

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3 Tiefendosisprofil für Photonen, Protonen und 12 C in Wasser . . . . . 13

1.4 Laterales Streuverhalten von Photonen-, Protonen- und 12 C-Strahlen

in Wasser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.5 Überlebenskurven von Zellen nach Röntgen- und Kohlenstoffbestrahlung

mit verschiedenen RBW-Werten . . . . . . . . . . . . . . . . . . 15

1.6 Vergleich der berechneten Bahnspuren von 12 C-Ionen und Röntgen

mit den Dimensionen einer DNA-Doppelhelix . . . . . . . . . . . . . 16

1.7 Schematische Darstellung des Rasterscan-Verfahrens . . . . . . . . . . 17

1.8 Darstellung einer ausgedehnten Bragg-Peak Zone . . . . . . . . . . . 18

1.9 Fixierter Patient im Therapieraum der GSI . . . . . . . . . . . . . . . 19

2.1 CT-Scheibe des Patientenplanes #135 mit eingezeichnetem Target

und Hirnstamm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2 Modellhafte Darstellung eines Zielvolumens mit Isoenergieschichten

und den dazugehörigen Rasterpunkten . . . . . . . . . . . . . . . . . 22

2.3 Beispiel eines DVH’s . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.4 Modellrechnung der physikalischen Dosis, BED und RBW mit TRiP . 25

2.5 Schematische Bestrahlung mit zwei gegenüberliegenden Feldern bei

der Bestrahlungsplanung mit EFO . . . . . . . . . . . . . . . . . . . . 28

2.6 Schematische Bestrahlung mit zwei gegenüberliegenden Feldern bei

der Bestrahlungsplanung mit MFO . . . . . . . . . . . . . . . . . . . 29

2.7 DVH’s der Patientenpläne #319, #305, #268 und #290: Einzelfeldoptimierung

vs. Mehrfelderoptimierung . . . . . . . . . . . . . . . . . 30

2.8 Dosisverteilung in einer CT-Scheibe: Einzelfeldoptimierung vs. Mehrfelderoptimierung

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.1 Konvergenzgeschwindigkeit der drei Minimierungsverfahren als Funktion

der Iterationsschritte . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2 Konvergenzgeschwindigkeit der drei Minimierungsverfahren als Funktion

der Zeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.1 Geeignete Werte für das Verhältnis zwischen biologischer und physikalischer

Schrittweite . . . . . . . . . . . . . . . . . . . . . . . . . . . 40


Abbildungsverzeichnis

5.1 Konvergenzverhalten des GRV’s mit dem Suchalgorithmus im Vergleich

zu dem konventionellen GRV . . . . . . . . . . . . . . . . . . . 44

5.2 Geeignete Werte für das Verhältnis zwischen biologischer und physikalischer

Schrittweite in zwei verschiedenen Patientenplänen . . . . . 45

6.1 Konvergenzgeschwindigkeit der LMM und des GRV’s als Funktion

der Iterationsschritte . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

6.2 Minimierungsergebnisse aus Abbildung 6.1 gegen die Zeit . . . . . . . 53

6.3 Konvergenzgeschwindigkeit der vereinfachten LMM und der LMM als

Funktion der Iterationsschritte . . . . . . . . . . . . . . . . . . . . . . 54

6.4 Minimierungsergebnisse aus Abbildung 6.3 gegen die Zeit . . . . . . . 54

6.5 Konvergenzgeschwindigkeit der LMM und der LMM mit Schrittweitenparameter

D = 2 als Funktion der Iterationsschritte . . . . . . . . 56

7


Abkürzungsverzeichnis

12C Atomkern des Kohlenstoffes mit 6 Protonen und 6 Neutronen

BED Biologisch effektive Dosis

BFV Bortfeld-Verfahren (modifiziertes Newton-Verfahren)

CT Computertomographie, Computertomogramm

DVH Dosis-Volumen-Histogramm

EFO Einzelfeldoptimierung

GRV Gradientenverfahren

GSI Gesellschaft für Schwerionenforschung

Gy SI-Einheit Gray[ J

GyE

] (Energiedosis verursacht durch Strahlung)

kg

Gray-Equivalent (Einheit der biologisch effektiven Dosis)

HIT Heidelberger Ionenstrahl-Therapiezentrum

IES Isoenergieschicht

IMRT Intensitätsmodulierte Photonentherapie

KGV Konjugiertes Gradientenverfahren

LEM Local-Effect-Model (Biophysikalisches Modell zur Bestimmung der

RBW)

LET Linearer Energietransfer

LMM Levenberg-Marquardt-Minimierung

MFO Mehrfelderoptimierung

MQF Minimierung mit quadratischer Form

NDF Anzahl der Freiheitsgrade

OAR Organ-At-Risk (Risikoorgan)

RBW Relative biologische Wirksamkeit

Target Zielvolumen bei der Bestrahlungsplanung

TRiP Treatment Planning for Particles (Software für die Bestrahlungsplanung)

VOI Volume of Interest

Voxel Volumenpixel in einer CT

8


1 Einleitung

1.1 Die Krankheit Krebs

In Deutschland erkranken jährlich ca. 450.000 Menschen neu an der Krankheit

Krebs, ca. 200.000 Menschen sterben jährlich an dieser Krankheit. Bis zum Jahr

2030, schätzen Experten, dass die Anzahl der Krebserkrankungen um 50% zunehmen

wird [Deu08b]. Damit ist Krebs, nach den Herz-Kreislauferkrankungen, die

zweithäufigste Todesursache in Deutschland.

Im allgemeinen Sprachgebrauch steht Krebs für eine Vielzahl verwandter Krankheitsbilder

mit unterschiedlichen Ursachen. Eine häufige Form von Krebs ist das

Auftreten von malignem Gewebe (bösartiger Tumor) im menschlichen Körper. Die

Zellen in diesem Gewebe wachsen und teilen sich unkontrolliert, was zu einer Verdrängung

oder sogar Zerstörung von umliegendem gesunden Gewebe führen kann.

1.1.1 Gehirntumore

Im Therapieprojekt der Gesellschaft für Schwerionenforschung (siehe Abschnitt 1.5)

werden derzeit hauptsächlich Gehirntumore behandelt. Unter einem Gehirntumor

versteht man eine Gewebswucherung im Schädelinneren. Der Anteil der Gehirntumore

ist im Vergleich zu anderen Krebsarten relativ gering. Die am meisten vorkommenden

Arten sind Glioblastome, Meningeome, Astrozytome und Ependymome, die

alle einen unterschiedlichen Grad der Malignität besitzen [Deu08a]. Nur in sehr wenigen

Fällen bilden Hirntumore Metastasen (Tochtergeschwülste). Wegen der Sensitivität

und des komplexen Aufbaus des menschlichen Gehirns ist ein Hirntumor sehr

schwierig zu behandeln. Bei einer unvollständigen Behandlung des Tumors kann es

zu einem Rezidiv (Rückfall) kommen.

Die Therapie richtet sich nach der Tumorart, Tumorgröße, Lokalisation des Tumors

und dem Allgemeinzustand des zu behandelnden Patienten. Als Therapieformen

stehen die Chemotherapie, Operation und Strahlentherapie zur Verfügung.

Letztere wird im nächsten Abschnitt genauer beschrieben. Oftmals werden die Therapieformen

auch miteinander kombiniert.

1.2 Strahlentherapie

Etwa die Hälfte aller Krebserkrankungen werden mit einer Strahlentherapie behandelt.

Ziel ist die Bestrahlung von Tumorgewebe mit einer ausreichend hohen Dosis,

die die Reparaturfähigkeit der Tumorzellen überschreitet [HB97]. Gleichzeitig

10


1.2 Strahlentherapie

Abbildung 1.1: Tumorbestrahlung mit Photonen. Um mit einem einzelnen Bestrahlungsfeld die

vorgeschriebene Dosis (Anteil in Prozent) im Tumor (roter Bereich) zu erhalten, müsste im Eingangskanal

eine höhere Dosis erzeugt werden (linke Seite). Schon bei der Hinzunahme eines zweiten

Feldes kann dieser Effekt deutlich reduziert werden (rechte Seite).

muss umliegendes gesundes Gewebe maximal geschont werden. Voraussetzung für

die Strahlentherapie ist ein Bestrahlungsplan, der individuell für jeden Patienten

erstellt werden muss. Auf Basis von mehreren Computertomographien (CT) werden

dabei die für die Bestrahlung notwendigen Parameter festgelegt. Diese müssen oft

auf komplexe Weise berechnet werden. Der genaue Ablauf der Bestrahlungsplanung

wird in Abschnitt 2.1 beschrieben. Die Gesamtdosis, die in dem Tumor deponiert

werden soll, wird auf Einzeldosen verteilt (Fraktionierung). Üblicherweise wird dem

Patienten täglich eine Fraktion verabreicht. Der gesamte Bestrahlungsprozess kann

3-6 Wochen dauern mit bis zu 30 Fraktionen.

Die konventionelle Form der Strahlentherapie ist die Photonentherapie. Photonenstrahlen

besitzen die Eigenschaft, dass wenige Millimeter nach dem Eintreten in

das Gewebe die Dosisdeposition ihr Maximum erreicht und anschließend exponentiell

abfällt [KP88]. Um das umliegende Gewebe zu schonen, werden in tiefer sitzenden

Tumoren mehrere Einstrahlrichtungen (Bestrahlungsfelder) überlagert. Abbildung

1.1 demonstriert dies anhand von zwei Strahlrichtungen. Bei einer Patientenbestrahlung

werden in den meisten Fällen 6-12 Bestrahlungsfelder benutzt. Die fortgeschrittenste

Methode der Photonentherapie ist die intensitätsmodulierte Photonentherapie

(IMRT) [Gro01]. Mit dieser Technik können kompliziert geformte Tumore (z.B.

konkave Form) präzise bestrahlt werden. Durch speziell geformte Kompensatoren im

Strahlweg wird die Dosis im Bestrahlungsfeld moduliert und damit der Tumorform

angepasst.

Bei der Teilchentherapie werden derzeit Protonen und Kohlenstoffteilchen verwendet.

Teilchenstrahlen zeigen ein vorteilhaftes Tiefendosisprofil gegenüber Photonenstrahlen

[Wil46]. Besonders 12 C-Ionen besitzen ideale Eigenschaften für die

Schwerionentherapie 1 [Kra00]. Der Kohlenstoffstrahl erzeugt am Ende seiner Reichweite

ein scharfes Dosis-Maximum während im Eingangskanal eine geringe Dosis

deponiert wird. Dies wird als das Inverse Dosisprofil bezeichnet. Das Gewebe hinter

dem zu bestrahlenden Tumor kann fast vollständig geschont werden. Zudem

1 In der Strahlentherapie werden alle Ionen mit einer größeren Ordnungszahl als Wasserstoff als

schwere Ionen bezeichnet.

11


1 Einleitung

Abbildung 1.2: Dosisverteilung erzeugt durch Kohlenstofftherapie mit 2 Bestrahlungsfeldern (links)

und IMRT mit 9 Feldern (rechts). Die Farbskalierung reicht von rot, entsprechend 100% der vorgeschriebenen

Zieldosis, bis zu blau mit 10%. Mit beiden Methoden kann eine gute Dosisapplikation

im Tumorbereich erzielt werden. Die Integraldosis im gesunden Gewebe ist bei der Therapie mit

Teilchen wesentlich niedriger als bei Photonen.

haben 12 C-Ionen eine höhere biologische Wirksamkeit (Abschnitt 1.4) als Photonen

und Protonen [KKWS03]. In der Regel reichen bei Kohlenstoff zwei Bestrahlungsfelder

aus um die vorgeschriebene Dosis im Tumorvolumen zu verteilen. Einen

Vergleich zur Dosisverteilung mit IMRT zeigt Abbildung 1.2. Damit die Teilchen

genug Energie besitzen, um tief in das Gewebe eindringen zu können, müssen sie

in Teilchenbeschleunigern auf sehr hohe Geschwindigkeiten gebracht werden. Solche

Beschleunigeranlagen stellen hohe finanzielle und technische Anforderungen.

1.3 Physikalische Grundlagen

Ionisierende Strahlung setzt beim Eintreten in Materie Elektronen aus den Atomhüllen

frei, so dass positiv geladene Ionen zurückbleiben. Ionisierende Strahlen werden

in Teilchenstrahlen und elektromagnetische Strahlen eingeteilt, wobei man letztere

auch als Photonenstrahlen bezeichnet. Messgröße für die applizierte Energiedosis D

ist die Einheit Gray (Gy), welche die absorbierte Energie E pro Masse m definiert:

D[Gy] = dE

dm

= 1

ρ

dE

dV

, 1Gy = 1 J

kg

. (1.1)

Hier ist ρ die Dichte und V das Volumen des bestrahlten Materials. Die Dosis, die

aus Gleichung 1.1 resultiert, wird als physikalische oder absorbierte Dosis bezeichnet.

Photonen, die auf Materie treffen, lösen unterschiedliche Prozesse aus. Die fundamentalsten

sind der Photoeffekt, der Compton-Effekt und die Paarbildung [GM06].

Die dabei entstehende Schwächung der Strahlungsintensität I ist durch das Beersche

Absorptionsgesetz gegeben:

I(x) = I0 · e −µx , (1.2)

12


1.3 Physikalische Grundlagen

Abbildung 1.3: Tiefendosisprofil für Photonen, Protonen und 12 C in Wasser. Bei Photonen ist

nach einem anfänglichen Anstieg ein exponentieller Abfall zu beobachten. Teilchenstrahlen deponieren

am Anfang wenig Dosis und am Ende ihrer Reichweite das Dosismaximum (Bragg-Peak),

welches bei 12 C noch ausgeprägter ist als bei Protonen. Die Lage des Maximums kann durch die

Anfangsenergie der Strahlen kontrolliert werden. Durch Projektilfragmente entsteht bei 12 C hinter

dem Bragg-Peak noch ein kleiner Dosisanteil.

mit der Anfangsintensität I0, der Eindringtiefe x und Materialabsorptionskonstante

µ. Die Tiefendosiskurve für Photonenstrahlung (Abb. 1.3) zeigt einen Anstieg

im Bereich der ersten Zentimeter und erst anschließend einen exponentiellen Abfall.

Der anfängliche Anstieg kann mit dem Aufbaueffekt erklärt werden, bei dem

Sekundärelektronen vorwiegend in Vorwärtsrichtung emittiert werden, bis sich ein

Gleichgewicht zwischen Energiedeposition und Produktion weiterer Sekundärelektronen

einstellt.

Teilchenstrahlen, wie z.B. Protonenstrahlen oder Ionenstrahlen, interagieren mit

dem Targetmaterial hauptsächlich durch inelastische Kollisionen mit den Hüllenelektronen.

Dabei erleiden die durchgehenden Teilchen pro Weglängeneinheit dx einen

Energieverlust, den die Bethe-Bloch-Formel [Bet30, Blo33] beschreibt:

− dE

dx = 4π e4z2

eff 2mev

nZ ln

mev2 2

+ relativistische Korrekturen , (1.3)

I

wobei e die Elementarladung des Elektrons und me seine Ruhemasse, v die Teilchen-

13


1 Einleitung

Strahlaufweitung [mm]

Photonen (21MV)

12 C (270MeV/u)

Protonen (148MeV/u)

Eindringtiefe in Wasser [mm]

Abbildung 1.4: Laterales Streuverhalten von Photonen-, Protonen- und 12 C-Strahlen in Wasser.

Photonenstrahlen besitzen anfangs die größte Aufweitung, welche sich aber bei weiterem Verlauf

wenig ändert. Protonen streuen bis zum dreifachen stärker als 12 C-Ionen. Abbildung aus [Web96].

geschwindigkeit, zeff die effektive Projektilladung, n die Dichte der Targetatome , Z

die Atomnummer und I das Targetionisationspotential darstellen. Der Energieverlust

ist bei hohen Geschwindigkeiten relativ gering und steigt mit Geschwindigkeitsabnahme

stetig an. Kurz bevor die Teilchen zum Ende ihrer Reichweite gelangen

kommt es zu einem starken Anstieg des Energieverlustes. Dabei erreicht die deponierte

Dosis ein scharfes Maximum (Bragg-Peak o. Bragg-Maximum) und fällt

unmittelbar danach sehr steil ab. Der aus diesem Prozess resultierende Verlauf der

Tiefendosisprofile ist in Abbildung 1.3 zu sehen.

Häufig wird in der Strahlenbiologie die Energieübertragung der Teilchen mit dem

linearen Energietransfer (LET) beschrieben. Dieser wird in Kiloelektronenvolt pro

Mikrometer gemessen und ist mit der Dosis verbunden über:

D[Gy] = 1.6 · 10 −9 · dE


keV


g

· ρ

dx µm cm


LET

3

−1 · F cm −2 , (1.4)

mit der Materialdichte ρ und Teilchenfluenz F .

Das grundsätzlich unterschiedliche Tiefendosisprofil von Teilchenstrahlung gegenüber

Photonenstrahlung ist für die Strahlentherapie von großer Bedeutung. Besonders

der scharfe Bragg-Peak bei 12 C erlaubt eine konzentrierte Dosisapplikation.

Ein weiterer physikalischer Effekt, in dem die Strahlarten sich unterscheiden, ist die

laterale Aufweitung des Strahlenbündels beim Eintreten in Materie (siehe Abb. 1.4).

14


1.4 Strahlenbiologische Grundlagen

250 kV

Abbildung 1.5: Überlebenskurven von Zellen nach der Bestrahlung mit Röntgenstrahlen bzw. Kohlenstoffionen.

RBW-Werte sind für verschiedene Überlebensanteile angegeben. Um ein Überleben

von 10% zu erreichen muss mit Röntgenstrahlen, im Vergleich zu Kohlenstoffstrahlen, eine 4.2fache

physikalische Dosis appliziert werden. Bei steigender Dosis sinkt die RBW. [Mit freundlicher

Genehmigung Dr. W. Kraft-Weyrather].

1.4 Strahlenbiologische Grundlagen

Tritt ionisierende Strahlung in biologisches Gewebe ein, dann kommt es im mikroskopischen

Bereich zu einer Schädigung der DNA. Die im Zellkern liegende DNA kann

dabei so stark geschädigt werden, dass die zahlreichen Reparaturprozesse der Zelle

nicht mehr greifen können. Besonders eine hohe Anzahl an Doppelstrangbrüchen

induziert die Apoptose (programmierter Zelltod).

Die Strahlenwirkung auf zelluläres Gewebe wird anhand von Überlebenskurven

gemessen. Diese beschreiben die Wahrscheinlichkeit des Zellenüberlebens S als Funktion

der absorbierten Dosis D mit einem linear-quadratischen Modell:

ln S(D) = − αD + βD 2 , (1.5)

wobei α und β von der bestrahlten Zelllinie abhängen.

Die gleiche absorbierte Dosis kann bei verschiedenen Strahlarten unterschiedliche

biologische Effekte auslösen. Ein Maß dafür ist die relative biologische Wirksamkeit

(RBW). Die RBW ist definiert als das Verhältnis der Dosis einer Bezugsstrahlung

zu der Dosis einer zu vergleichenden Strahlung, wobei mit beiden Dosen die gleiche

biologische Wirkung erreicht wird:


DBezugsstrahlung

RBW =

. (1.6)

Dzu vergleichende Strahlung

Isoeffekt

Verschiedene RBW-Werte von 12 C-Ionen, mit Röntgen als Bezugsstrahlung, können

aus den entsprechenden Überlebenskurven in Abbildung 1.5 entnommen werden.

15


1 Einleitung

z [nm]

12 C-Ionen Röntgen

x [nm]

z [nm]

x [nm]

Abbildung 1.6: Vergleich der berechneten Bahnspuren von 12 C-Ionen und Röntgen mit den Dimensionen

einer DNA-Doppelhelix. Die farbigen Linien repräsentieren die Spuren der emittierten Sekundärelektronen.

Die höhere Ionisationsdichte kann bei der Teilchenstrahlung deutlich beobachtet

werden. Der dabei entstehende Schaden ist sehr schwierig zu reparieren. Die geringe Ionisationsdichte

von der Röntgenstrahlung verursacht meist reparable Einzelstrangbrüche.

Dabei ist stets eine RBW von > 1 zu beobachten. Daraus resultiert, dass Kohlenstoff,

bei gleicher physikalischer Dosis, eine höhere biologische Wirkung besitzt. Dies kann

unter anderem dadurch erklärt werden, dass die Bahnstruktur von Teilchenstrahlen

eine höhere Ionisationsdichte aufweist (siehe Abb. 1.6) [KK94].

Wegen der höheren biologischen Wirksamkeit können Tumorzellen mit 12 C-Ionen

besser inaktiviert werden als mit Photonen oder Protonen. Da die RBW von vielen

Faktoren abhängig ist, wie z.B. Art der Strahlung, bestrahlter Gewebetyp, Dosislevel

und Energie, ist die Berechnung hoch komplex. Dafür wurde an der Gesellschaft für

Schwerionenforschung (GSI) das Local-Effect-Model (LEM) [Sch03] entwickelt, mit

dem die relevanten RBW-Werte für die Strahlentherapie mit Schwerionen bestimmt

werden können.

1.5 Das Therapieprojekt der GSI

Das Pilotprojekt der GSI startete im Jahr 1997 mit der weltweit ersten intensitätsmodulierten

Schwerionentherapie [Kra08]. Bis Mitte 2008 wurden über 440 Patienten

mit 12 C-Ionen bestrahlt. Dabei wurden meist strahlenresistente und tiefsitzende

Tumorarten gewählt, die im Kopf oder Nackenbereich lagen. Seit dem Jahr 2006

werden auch Prostatakarzinome behandelt. Die Erfolgsquoten waren so vielversprechend

[SE + 04], dass diese neue Art der Tumortherapie klinisch angewendet werden

soll. 2007 wurde das Heidelberger Ionenstrahl-Therapiezentrum HIT fertig gestellt.

Ab Herbst 2008 sollen am HIT über 1000 Patienten pro Jahr behandelt werden. Gegenwärtig

befinden sich in Kiel und Marburg Strahlentherapiezentren im Bau und

weltweit weitere in Planung.

Das Therapieprojekt der GSI ist derzeit für statische Tumore begrenzt. Tumorarten,

die im Thorax oder Bauchbereich liegen, bewegen sich unter Einfluss der

Atmung und des Herzschlages. Um auch diese bestrahlen zu können, arbeitet die

GSI an einer Weiterentwicklung der Schwerionentherapie mit der die Tumorbewe-

16


1.5 Das Therapieprojekt der GSI

Polschuhe

der Dipolmagnete Tumor

Erster Magnet

horizontale

Strahlablenkung

Zweiter Magnet

vertikale

Strahlablenkung

Letzte Schicht

niedrigste Energie

¢£¡£ ¥ ¨

¡ ¤ ¦§ ©



¡¡




¡



¡







¡







¡ ¡



¡


¡ ¡


¡




¡



¡


¡ Erste Schicht

höchste Energie

Abbildung 1.7: Schematische Darstellung des Rasterscan-Verfahrens. Der Tumor ist in Isoenergieschichten

(lila Scheiben) aufgeteilt auf denen die Rasterpunkte (schwarze Punkte) definiert sind.

Die blauen Platten repräsentieren die Scannermagnete, die den geladenen Teilchenstrahl (rote Linie)

horizontal und vertikal ablenken.

gung kompensiert werden soll. Näheres ist z. B. in [Grö04, Ber06] zu finden.

Technik und Ablauf der Therapie

Bei der GSI werden die Kohlenstoffionen in Ionenquellen erzeugt und anschließend

in die Beschleunigeranlage 2 (Linearbeschleuniger und Schwerionensynchrotron) injiziert.

Nachdem die Teilchen dort hohe Geschwindigkeiten erreicht haben werden sie

in den Therapieraum weitergeführt.

Um das Tumorvolumen komplett zu erfassen wird es in Schichten gleicher Strahlreichweite,

sog. Isoenergieschichten (IES), aufgeteilt. In jeder IES wird ein Punkteraster

definiert. Damit alle Rasterpunkte einer IES mit dem Strahl abgetastet

werden können, wurde an der GSI das Rasterscan-Verfahren [H + 93] entwickelt. Beim

Rasterscannen wird das geladene Teilchenbündel von zwei Dipolmagneten (Scannmagnete),

unter Einwirkung der Lorentz-Kraft [GM06], horizontal und vertikal abgelenkt.

Abbildung 1.7 illustriert das Rasterscan-Verfahren. Nachdem die Sollintensität

in einem Rasterpunkt erreicht ist, wird der Strahl weitergelenkt. Strahlreichweite,

und damit der Bragg-Peak, wird mit aktiver Energievariation gesteuert. Zuerst wird

die hinterste IES bestrahlt, anschließend erfolgt eine Verringerung der Energiestufe

um die vordere Scheibe zu bestrahlen. Eine homogene Dosis in der Tumorzone

entsteht durch Überlagerung einzelner Bragg-Peaks unterschiedlicher Anfangsenergie

(siehe Abb. 1.8). Die GSI-Beschleunigeranlage stellt 253 verschiedene Energien

(80MeV/u - 430MeV/u) des 12 C-Strahls, mit jeweils sieben Strahldurchmessern, zur

Verfügung. Mit dieser Technik kann ein dünner Strahl über das gesamte Zielvolumen

geführt werden.

Im Therapieraum der GSI wird der Patient, mit einer speziell für ihn angefertigten

Kopfmaske, vor dem Strahlaustrittsfenster fixiert. Dies geschieht an einer

2 Genauere Angaben zur Beschleunigeranlage der GSI sind auf http://www.gsi.de/beschleuniger

beschrieben.

17


1 Einleitung

Relative Dosis [%]

Ausgedehnter

Bragg-Peak

✛ Tumorzone ✲

✟✟✟✟✟✟

Eindringtiefe [cm]

Abbildung 1.8: Überlagerung einzelner Bragg-Peaks (rote Kurven) zu einer resultierenden Dosis

(blaue Kurve). In der Tumorzone kann mit dem ausgedehnten Bragg-Peak eine homogene Dosisverteilung

erzielt werden.

Liege, wie es Abbildung 1.9 zeigt. Die Gesamtzeit, die für eine Fraktion benötigt

wird, liegt bei ca. 30 Minuten. Die reine Bestrahlungszeit dauert etwa 5-10 Minuten.

Fixierung und präzise Positionierung nehmen die meiste Zeit in Anspruch.

Bei Schädeltumoren werden 20 Fraktionen in 20 aufeinanderfolgenden Tagen verabreicht.

Die Gesamtdosis einer Therapie liegt bei 60-70Gy. Die Bestrahlung wird

mit einem automatischen Kontrollsystem überwacht und bei Unregelmäßigkeiten sofort

abgebrochen. Die Möglichkeit der Rotation des Patiententisches erlaubt einen

Wechsel der Bestrahlungsfelder. In der Regel werden mit zwei gegenüberliegenden

Feldern gute Ergebnisse erzielt, selten wird noch ein drittes verwendet.

18


Austrittsfenster

des Strahls

Fixierte

Kopfmaske

Patient

1.5 Das Therapieprojekt der GSI

Verstellbare

Patientenliege

Positionierbarer

Tisch

Abbildung 1.9: Fixierter Patient im Therapieraum der GSI. Die Kopfmaske ist an die Tischauflage,

direkt vor dem Strahlaustrittsfenster, geschraubt. Der Tisch kann entlang der kreisförmigen

Schiene im Boden rotiert werden. Damit kann ein automatischer Wechsel des Bestrahlungsfeldes

stattfinden.

19


2 Material und Methoden

2.1 Bestrahlungsplanung mit TRiP

Das Rasterscan-Verfahren erfordert eine präzise Vorberechnung mehrerer zehntausend

Strahlpositionen, Strahlenergien und Teilchenzahlen um die vom Arzt festgelegte

Dosis zu erreichen. Hierzu dient die Bestrahlungsplanungssoftware Treatment

Planning for Particles (TRiP) [K + 00, J + 01]. Sie wurde an der GSI für die intensitätsmodulierte

Schwerionentherapie in der Programmiersprache C entwickelt.

Bei der Erstellung eines Bestrahlungsplanes führt TRiP im wesentlichen vier Schritte

aus:

1. Die CT-Daten des Patienten werden eingelesen.

2. Ein dreidimensionales Rastergitter im Target wird definiert.

3. Die Teilchenfluenzen für jeden einzelnen Rasterpunkt werden mit implementierten

Algorithmen berechnet. Hierbei handelt es sich um ein Optimierungsproblem.

4. Eine Kontrolldatei für den Rasterscanner wird erstellt.

Der genauere Ablauf der einzelnen Schritte wird im folgenden beschrieben.

Die Auflösung eines CT’s ist 3mm in z-Richtung (Tiefe) und 1mm in x- bzw. y-

Richtung. Eine solche Volumeneinheit wird Voxel (Volumenpixel) genannt. Bevor

TRiP die CT’s verarbeitet, werden von einem Medizin-Physiker die Volumes of Interest

(VOI) bestimmt und in jeder CT-Scheibe mit einer Kontur umlegt. Die VOI’s

umfassen Tumor (Target) und Organs at Risk (OAR). Bei einem OAR kann es sich

z.B. um Hirnstamm, Chiasma oder Sehnerv handeln, welche bei der Bestrahlungsplanung

besonders berücksichtigt werden müssen. Eine bearbeitete CT-Scheibe zeigt

Abbildung 2.1.

Die Anzahl der Bestrahlungsfelder und deren Richtungen werden bei der Bestrahlungsplanung

manuell eingestellt. TRiP generiert, relativ zum Strahleintritt,

in jedem Feld die Isoenergieschichten. In jeder IES wird ein Punkteraster gelegt

und die x- bzw. y-Koordinaten der einzelnen Rasterpunkte werden berechnet. Die z-

Koordinaten der Rasterpunkte werden über die Anfangsenergien des Strahls, welche

aus den verfügbaren Beschleunigerenergien gewählt werden, bestimmt. Die Abstände

der Rasterpunkte in x-,y- und z-Richtung können vom Benutzer definiert werden.

20


2.1 Bestrahlungsplanung mit TRiP

Abbildung 2.1: CT-Scheibe des Patientenplanes #135. Von einem Arzt wurden Tumor (rote Kontur)

und Hirnstamm (grüne Kontur) markiert.

Typische Abstände für die Therapie sind 2-3mm in alle drei Richtungen. Bei Überlagerung

der Rasterpunkte, aus allen Scheiben und Feldern, entsteht ein 3D-Gitter

im Target, welches bei der Bestrahlung abgefahren wird. In Abbilldung 2.2 ist das

Modell eines Zielvolumens, mit Isoenergieschichten und den dazugehörigen Rasterpunkten,

zu sehen.

Ein wesentlicher Bestandteil der Bestrahlungsplanung ist die Optimierung der

Teilchenfluenzen für mehrere zehntausend Rasterpunkte. Ziel der Optimierung ist

eine homogene Dosisverteilung durch den Tumor bei möglichst hoher Schonung des

umliegenden gesunden Gewebes. Details zur Dosisberechnung werden im folgenden

Abschnitt behandelt. Die mathematische Formulierung der Optimierung wird in Abschnitt

2.3 vorgestellt und in Abschnitt 2.4 wird eine spezielle Optimierungsmethode

geschildert. Ab Kapitel 3 folgen die verschiedenen Verfahren, die zur Lösung des Optimierungsproblems

verwendet werden. Als Ergebnis der Optimierung erzeugt TRiP

einen Dosis-Würfel, der die dreidimensionale Dosisverteilung zeigt. Dabei enthält

jedes Voxel einen Dosiswert. Für eine bessere Übersicht können Dosisverteilungen

21


2 Material und Methoden

Strahl

✏ ✏✏✏✶

y

x

Reichweite/Energie

Abbildung 2.2: Modellhafte Darstellung eines Zielvolumens (Ellipsoid) mit Isoenergieschichten

und den dazugehörigen Rasterpunkten. Die Größe der Rasterpunkte repräsentiert die benötigte

Teilchenfluenz um eine optimierte Dosis zu erhalten. Die hinterste IES (aus Sicht des Strahls)

bedarf der höchsten Teilchenfluenz. Wegen der Vorbestrahlung wird für die vorderste IES lediglich

eine kleine Fluenz benötigt. [Mit freundlicher Genehmigung Dr. C. Bert].

in den einzelnen CT-Scheiben betrachtet werden.

Bewertung eines Bestrahlungsplanes

Die wichtigsten Kriterien für einen guten Bestrahlungsplan sind [B + 90]:

z

• Die applizierte Dosis im Target sollte sehr nahe an der vorgeschriebenen Dosis

liegen.

• Die Dosis sollte im Target homogen verteilt sein.

• In jedem OAR sollte die festgelegte tolerierbare Dosisgrenze nicht überschritten

werden.

• In dem umliegenden Gewebe, welches an das Target angrenzt, sollte wenig

Dosis appliziert werden.

Um einen ersten Eindruck über die Qualität eines Bestrahlungsplanes zu erhalten

erstellt TRiP ein Dosis-Volumen-Histogramm (DVH). Für jedes VOI ist in einem

DVH der prozentuale Anteil des Volumens gegen den prozentualen Anteil der erhaltenen

Dosis geplottet. Ein DVH, welches die Dosisapplikation im Target und einem

einzelnen OAR beschreibt, zeigt Abbildung 2.3. Das gezeigte DVH beinhaltet folgende

Informationen: In keinem Teil

22


Volumen [%]

Target

OAR

Dosis [%]

2.2 Berechnung der Dosis

Abbildung 2.3: Dosis-Volumen-Histogramm für ein Targetvolumen und ein OAR-Volumen. Die

Erklärung zu dieser Abbildung befindet sich im Text.

- des Targets wird weniger als 90% der vorgeschriebenen Dosis

- des Targets wird mehr als 105% der vorgeschriebenen Dosis

- des OAR’s wird mehr als 90% der vorgeschriebenen Dosis

appliziert. Idealerweise sollte die schwarze Kurve den Verlauf der blauen einnehmen.

Je stärker dabei der Kurvenverlauf abweicht, desto mehr Über- bzw. Unterdosierung

besteht im Target. Die rote Kurve, welche die Dosis im OAR beschreibt, sollte so

niedrig wie möglich verlaufen. In diesem Beispiel könnte, wegen der zu hohen Belastung

des OAR’s, der Bestrahlungsplan aus medizinischer Sicht nicht akzeptiert

werden.

Da ein DVH keine Informationen über den Ort der Über- und Unterdosierung

liefert, ist es für eine Beurteilung über die Qualität des Bestrahlungsplanes nicht ausreichend.

Für einen guten Bestrahlungsplan ist ein gutes DVH notwendig aber nicht

hinreichend. Eine Betrachtung der Dosisverteilung in den einzelnen CT-Scheiben ist

stets zwingend.

2.2 Berechnung der Dosis

2.2.1 Berechnung der physikalischen Dosis

Das folgende Strahlmodell, mit dem TRiP die physikalische Dosis (absorbierte Dosis)

berechnet, wurde speziell für 12 C-Ionenstrahlen entwickelt. Die partielle Dosis, die

ein einzelnes Strahlenbündel der Energie ES an Position r0 in Position r appliziert,

23


2 Material und Methoden

ist gegeben durch [K + 00]:

D(ES, r)[Gy] = (1.6 · 10 −8

MeV

) · d(ES, z)

gcm−2

N

·

2πσ2 [mm2

· exp −

] r2

2σ2

, (2.1)

wobei N die gesamte Anzahl der Teilchen, σ die Strahlbreite, r 2 = |r− r0| 2 der euklidische

Abstand und d(ES, z) die eindimensionale Tiefendosisverteilung ist. Es wird

angenommen, dass der Strahl lateral ein gaußförmiges Profil besitzt. Die eindimensionale

Tiefendosisverteilung beschreibt, welche Dosis ein Strahl der Anfangsenergie

ES in Abhängigkeit der Tiefe z deponiert. Die Berechnung erfolgt nach dem YIELD-

Transportmodell, das detailiert in [K + 00] geschildert wird.

Die Gesamtdosis in einem CT-Voxel resultiert aus der Akkumulation von vielen

Dosisbeiträgen, die sich aus den jeweiligen Einzelstrahlen gemäß (2.1) ergeben. In

TRiP werden prinzipiell in jedem Voxel die Dosisbeiträge, der Strahlenbündel an

allen Rasterpunkten, summiert. Dafür wird zu jedem Voxel i, von jedem Rasterpunkt

j, ein Lateral- und ein Tiefenbeitrag berechnet. Der Wert, der die Stärke

dieser Dosis-Korrelation angibt, wird mit cij bezeichnet. Damit kann die gesamte

physikalische Dosis D i Phys in einem Voxel, als Funktion der Teilchenfluenzen N für

die Rasterpunkte, wie folgt berechnet werden:

D i Phys( N)[Gy] =

cijNj = c T i N . (2.2)

Da ein typischer Bestrahlungsplan mehrere zehntausend Rasterpunkte sowie Voxel

beinhaltet, würde die Implementation der vollständigen Dosis-Korrelationsmatrix

cij zu einem enormen Speicheraufwand führen. TRiP erlaubt die Einstellung eines

Parameters ɛc, der eine obere Schranke darstellt bis zu der die Dosis-Korrelationswerte

vernachlässigt werden. Dabei entsteht eine dünnbesetzte Matrix, die TRiP als

Elementliste speichert. Bei der Wahl von ɛc = 2 · 10 −3 erhält durchschnittlich jedes

Voxel von ca. 1000 Rasterpunkten Beiträge. Die Vernachlässigung der restlichen

Rasterpunkte induziert einen Dosisfehler von 0.5-1%, der in der Bestrahlungsplanung

akzeptabel ist [G + 07]. Das Speichern der Elementliste kann dennoch mehrere

Gigabytes erfordern.

2.2.2 Berechnung der biologisch effektiven Dosis

Bei der Teilchentherapie müssen neben den physikalischen auch die biologischen

Effekte berücksichtigt werden. D.h., die RBW muss in die Bestrahlungsplanung integriert

sein. Dies geschieht, indem die physikalische Dosis mit der RBW gewichtet

wird. Wie bereits erwähnt wurde, die RBW setzt sich in komplizierter Weise aus

vielen physikalischen und biologischen Parametern zusammen. Durch die Komplexität

des Bestrahlungsfeldes ändert sich die RBW von Punkt zu Punkt und kann

deshalb nicht mit einem globalen Wert belegt werden. Im Gegensatz dazu besitzen

Protonen nur eine schwach erhöhte biologische Wirksamkeit, die in der klinischen

Anwendung mit einer konstanten RBW von 1.1 festgesetzt wird [Pag03].

24

j


Dosis [GyE]

Überleben


RBW


Eindringtiefe [mm]

BED

Phys. Dosis

2.3 Optimierung

Abbildung 2.4: Oberes Bild: Modellrechnung von TRiP mit zwei gegenüberliegenden Feldern. Physikalische

Dosis und BED sind als Funktion der Eindringtiefe aufgetragen. Die Kohlenstoffstrahlen

variieren zwischen einer Anfangsenergie von 160 und 230MeV/u. Der starke Einfluss der RBW,

auf die BED, kann deutlich beobachtet werden. Unteres Bild: Experimentell gemessenes (Punkte)

und kalkuliertes Überleben der Zellen (Linie), korrespondierend zu dem oberen Tiefendosisprofil.

Abbildung aus [Krä01].

Für die Berechnung der biologischen Effekte von 12C-Ionen ist das LEM in TRiP

implementiert [KS00]. Mit Hilfe des LEM’s kann in jedem Voxel i, in Abhängigkeit

der Teilchenfluenzen N, die RBW bestimmt werden. Daraus ergibt sich die biologisch

effektive Dosis (BED) Di Bio , die in der Einheit GyE (Gray-Equivalent) gemessen

wird:

D i Bio( N)[GyE] = D i Phys( N) · RBW


Gleichung (2.2)

i ( N) . (2.3)

Gleichung (2.3) ist nichtlinear in N, hingegen ist Gleichung (2.2) linear in N. Abbildung

2.4 zeigt eine Modellrechnung mit physikalischer Dosis, BED und RBW.

Zudem ist ein Vergleich mit experimentellen Überlebensdaten von bestrahlten Zelllinien

zu sehen.

2.3 Optimierung

Aufgabe der Optimierung ist die Berechnung der Teilchenfluenzen für alle Rasterpunkte.

Die daraus resultierende Dosisverteilung soll die Qualitätskriterien eines

Bestrahlungsplanes (siehe Abschnitt 2.1, Bewertung eines Bestrahlungsplanes) möglichst

gut erfüllen. Die mathematische Formulierung des Optimierungsproblems entspricht

der Minimierung einer mehrdimensionalen Zielfunktion. Speziell handelt es

25


2 Material und Methoden

sich um die Methode der kleinsten Quadrate. Dabei sind die Teilchenfluenzen die

freien und zu optimierenden Parameter.

Der Aufbau der zu minimierenden χ 2 -Funktion, im Fall der Mehrfelderoptimierung

(wird im nächsten Abschnitt erklärt), ist wie folgt [Sch06]:

Bezeichnungen:

χ 2 ( N) =


Di pre − Di act( 2 N)

∆D

i∈Target

2 pre


Di max − Di act( 2 N)

+

i∈OAR

∆D 2 max


· Θ D i act( N) − D i

max

N : Vektor, dessen Komponenten die Teilchenzahlen

für die Rasterpunkte enthalten

i ∈ Target/OAR : Voxel aus dem Target/OAR-Volumen

D i pre : Vorgeschriebene Dosis im Target

D i max : Maximale Dosisgrenze im OAR

D i act : Aktuelle Dosis im Voxel i

∆Dpre/max : Gewichtungsfaktor

Θ : Heaviside-Funktion

.

(2.4)

Die Funktion setzt sich aus einem Target- und einem OAR-Term zusammen. Letzterer

wird für jedes OAR einmal hinzugefügt. Ein Bestrahlungsplan kann durchaus

mehr als fünf OAR’s enthalten. Dpre wird durch das gesamte Targetvolumen homogen

definiert. Bei Dmax handelt es sich um die tolerierbare maximale Dosisgrenze

für ein OAR und wird als Anteil von Dpre angegeben:

Dmax = dfrac · Dpre, dfrac ∈ [0.3 ; 0.7] . (2.5)

Im Target sind Über- und Unterdosierungen erlaubt, wenn auch nicht erwünscht, und

werden mit quadratischen Abweichungen quantifiziert. Unterdosierungen im OAR

spielen keine Rolle und müssen bei der Optimierung nicht berücksichtigt werden.

Dies wird von der Heaviside-Funktion kontrolliert:


Θ D i act(

N) − Dmax =


1 : D i act( N) > Dmax

0 : D i act( N) ≤ Dmax .

(2.6)

Die Gewichtungsfaktoren ∆Dpre und ∆Dmax kontrollieren den Einfluss der quadratischen

Abweichungen. Damit eine Abweichung stärker gewichtet wird, werden beide

Faktoren mit kleinen Werten von

26

∆Dpre = 0.025 · Dpre bzw. ∆Dmax = 0.025 · Dmax (2.7)


2.3 Optimierung

belegt. Durch Gleichung (2.5) besteht zwischen ihnen stets die Größenbeziehung:

∆Dmax < ∆Dpre . (2.8)

Somit wird eine Abweichung im OAR stärker "bestraft" als im Target.

Die optimalen Teilchenzahlen NOpt liegen im Minimum der χ 2 -Funktion. Um das

Minimum zu ermitteln muss folgendes Nullstellenproblem gelöst werden:

NOpt := ∇χ 2 ( N) = 0 . (2.9)

Optimierung der BED erfordert das Einsetzen von Gleichung (2.3) in die χ 2 -Funktion:

D i act( N) = D i Bio( N) = D i Phys( N) · RBW i ( N) . (2.10)

In diesem Fall besitzt das Nullstellenproblem (2.9) folgende Gestalt:

mit

∇χ 2 ( N) = −2

− 2

= 0 ,

i∈Target

i∈OAR



Dpre − D i Bio ( N)

∆D 2 pre

Dmax − D i Bio ( N)

∆D 2 max



· ∇D i Bio( N)

· ∇D i Bio(

N) · Θ D i Bio(

N) − Dmax

(2.11)

∇D i Bio( N) = ∇D i Phys( N) · RBW i ( N) + D i Phys( N) · ∇RBW i ( N) . (2.12)

Gleichung (2.11) ist nichtlinear in N und kann analytisch nicht gelöst werden.

Die Lösung mit iterativen Verfahren und deren numerische Bewertung sind weiterer

Gegenstand dieser Arbeit. Davor sind noch folgende Punkte zu beachteten:

• Die verwendeten iterativen Verfahren benötigen die erste und teilweise auch die

zweite Ableitung der χ 2 -Funktion. Durch die hohe Anzahl an Rasterpunkten

entsteht ein hoher Speicherbedarf für die Ableitungen, der zusätzlich zu den

Speicheranforderungen der Dosis-Korrelationsmatrizen hinzukommt.

• Momentan ist TRiP so konzipiert, dass ein einzelner Bestrahlungsplan maximal

4GB Gesamtspeicher anfordern darf.

• Da die Teilchenzahlen in jedem Iterationsschritt variieren, muss die RBW Voxelweise

immer wieder neu berechnet werden. Dabei handelt es sich um den

zeitaufwändigsten Teil in der Bio-Optimierung. Dafür wurde in TRiP die Lowdose-Approximation

[KS06] implementiert, mit der die RBW-Werte relativ

schnell berechnet werden können.

27


2 Material und Methoden

Feld 1

OAR

OAR

Feld 2

Abbildung 2.5: Schematische Bestrahlung mit zwei gegenüberliegenden Feldern bei der Bestrahlungsplanung

mit EFO. Die Pfeile repräsentieren die Strahlen, die schwarzen Punkte die Rasterpunkte.

Um aus einer Strahlrichtung den gegenüberliegenden senkrechten Bereich des Targets zu

bestrahlen, kann mit der EFO Strahlung durch das OAR nicht vermieden werden. Abbildung aus

[Sch06].

• Die Heaviside-Funktion Θ ist im klassischen Sinne nicht differenzierbar. Über

die mathematische Theorie der Distributionen kann eine Ableitung mit der Diracschen

Delta-Funktion definiert werden. Im Rahmen der Optimierung wird

dies nicht benötigt. Deshalb wird die Heaviside-Funktion beim Differenzieren

der χ 2 -Funktion als konstanter Faktor behandelt.

• Bei der Patientenbestrahlung werden die Teilchenfluenzen mit Ionisationskammern

kontrolliert. Ionisationskammern besitzen ein unteres Detektionslimit,

welches von der Teilchenfluenz Nj des Rasterpunktes j nicht unterschritten

werden darf. Daraus ergibt sich ein restringierter Lösungsraum für das Optimierungsproblem:

NOpt = Nj > Limit ∀ Rasterpunkte j . (2.13)

• Die Anzahl der Freiheitsgrade (NDF) ist die Differenz zwischen der Anzahl

der Voxel und der Anzahl der Rasterpunkte:

NDF = Anzahl der Voxel - Anzahl der Rasterpunkte . (2.14)

Damit NOpt eindeutig bestimmt werden kann, muss bei jeder Optimierung die

Bedingung

NDF ≥ 0 (2.15)

erfüllt sein.

2.4 Einzelfeldoptimierung vs.

Mehrfelderoptimierung

Das Standardverfahren im GSI Pilotprojekt ist die Einzelfeldoptimierung (EFO).

Mit dieser Methode werden die Felder einzeln und unabhängig voneinander optimiert.

In der klassischen Variante der EFO wird lediglich der Target-Term der χ 2 -

Funktion berücksichtigt. Bei einer neueren Variante der EFO wird der OAR-Term in

28


Feld 1

2.4 Einzelfeldoptimierung vs. Mehrfelderoptimierung

OAR

Feld 2

Abbildung 2.6: Schematische Bestrahlung mit zwei gegenüberliegenden Feldern bei der Bestrahlungsplanung

mit MFO. Die Pfeile repräsentieren die Strahlen, die Punkte die Rasterpunkte. Strahlung

durch das OAR kann mit der MFO vermieden werden. Der senkrechte Bereich im Target wird

lediglich aus der naheliegenden Strahlrichtung bestrahlt während der untere Bereich für beide

Felder zugänglich ist. Abbildung aus [Sch06].

den Optimierungsprozess mit einbezogen, wodurch eine Verbesserung der Ergebnisse

erreicht werden kann [Krä07]. Die gesamte Dosisverteilung ergibt sich aus der Superposition

der einzeln optimierten Felder. Nachteil der EFO ist, dass "verbotene"

Bereiche nicht immer ausgespart werden können (siehe Abb. 2.5).

Bei der Mehrfelderoptimierung (MFO) werden alle Felder gleichzeitig optimiert.

Allerdings kann jetzt das Durchqueren des Strahls durch ein OAR vermieden werden

(siehe Abb. 2.6). Die MFO ist in die aktuelle Version von TRiP (TRiP98BEAM)

implementiert und seit 2007 werden bei der GSI Patienten auch mit MFO-Plänen

behandelt [Krä07]. Sowohl die Speicheranforderungen der Dosis-Korrelationsmatrizen

als auch die Rechenzeiten fallen bei der Bestrahlungsplanung mit MFO höher

aus.

Mit der MFO kann in den meisten Fällen eine bessere Targetkonformität, bei

signifikant geringerer Belastung der kritischen Organe, erreicht werden. Besonders

schwierig zu bestrahlende Tumorformen zeigen deutlich diese besseren Eigenschaften.

Abbildung 2.7 zeigt DVH’s von vier verschiedenen Patienten, die mit MFO bzw.

klassischer EFO berechnet wurden. In Abbildung 2.8 ist der Vergleich beider Methoden,

anhand der Dosisverteilung in der CT-Scheibe aus Abbildung 2.1, zu sehen.

Die dazugehörigen Bestrahlungsplandaten sind im Anhang dieser Arbeit, unter Abschnitt

8.1, tabellarisch aufgelistet. Experimentelle Verifikationen der MFO befinden

sich in [G + 07, vN + 06, S + 05].

29


2 Material und Methoden

Volumen [%]

Volumen [%]

#319

#268

Dosis [%]

Target

Hirnst.

Chiasma

Target

Hirnst.

#305

#290

Dosis [%]

Target

Rückenm.

Hirnst.

Chiasma

Target

Hirnst.

Sehn. L

Chiasma

Abbildung 2.7: DVH’s der Patientenpläne #319, #305, #268 und #290. Durchgezogene Linien

repräsentieren die Ergebnisse mit MFO und gestrichelte Linien mit klassischer EFO. Die Dosis

entspricht dem prozentualen Anteil der vorgeschriebenen BED. In allen vier Beispielen kann mit

der MFO eine bessere Targetkonformität beobachtet werden und in jedem OAR wird eine geringere

Dosis appliziert. Abbildung aus [G + 07].

Abbildung 2.8: Dosisverteilung mit zwei gegenüberliegenden Feldern in einer CT-Scheibe des Patientenplanes

#135. Die Farbskalierung entspricht dem prozentualen Anteil der vorgeschriebenen

BED. Da hier der Tumor (starke Kontur) um den Hirnstamm (schwache kreisförmige Kontur)

herumwächst handelt es sich um eine schwierig zu bestrahlende Form. Linkes Bild zeigt Ergebnisse

mit klassischer EFO und rechtes Bild mit MFO. Mit beiden Optimierungsmethoden kann im

Target eine gute Dosisverteilung erreicht werden. Bei der MFO ist die geringere Dosisapplikation

im Hirnstamm, gegenüber der EFO, deutlich zu sehen. Abbildung aus [G + 07].

30


3 Numerische

Optimierungsverfahren

Dieses Kapitel beschreibt die iterativen Verfahren, die bei der Minimierung der χ 2 -

Funktion eingesetzt werden und deren Ergebnisse. In Abschnitt 3.1 wird die Arbeitsweise

von Abstiegsverfahren geschildert. Anschließend werden abschnittsweise

das Gradientenverfahren, das konjugierte Gradientenverfahren und das Bortfeld-

Verfahren vorgestellt, wobei letzteres eine Modifizierung des Newton-Verfahrens ist.

Dabei werden die Vor- und Nachteile der Verfahren genannt und die Iterationsvorschrift

wird angegeben. Abschnitt 3.5 zeigt die Minimierungsergebnisse und eine

Gegenüberstellung der drei Verfahren bzgl. ihrer Konvergenzeigenschaften. Die Ergebnisse

beziehen sich auf die Optimierung der BED bei Verwendung der MFO.

3.1 Numerische Minimierung

Das Nullstellenproblem (2.11) ist nichtlinear in den Parametern N und kann analytisch

nicht gelöst werden. Mittlerweile existiert in der Numerischen Mathematik

eine breite Palette an iterativen Verfahren zur Lösung nichtlinearer Optimierungsprobleme.

Ziel eines Iterationsverfahren ist die Konstruktion einer Folge, von der

der Grenzwert gegen die gesuchte Lösung konvergiert. Die Verfahren, die in dieser

Arbeit verwendet werden, besitzen alle folgende Form:

Nk+1 = F ( Nk) , (k = 0, 1, 2, 3, ....) . (3.1)

N ist der Vektor mit den gesuchten Teilchenfluenzen, k der Laufindex der Iteration

und F eine Abbildung der betreffenden Menge in sich selbst. Bei geeigneten Voraussetzungen

kann, ausgehend von einem Startwert N0, die Lösung, oder zumindest

eine gute Näherung der Lösung, in relativ wenigen Schritten erreicht werden.

Da die χ 2 -Funktion minimiert werden soll, ist es naheliegend, mit dem Iterationsverfahren

ein Abstiegsverfahren anzustreben. Bei einem Abstiegsverfahren ist stets

die folgende Bedingung erfüllt:

χ 2 ( Nk+1) < χ 2 ( Nk) , (k = 0, 1, 2, 3, ....) . (3.2)

Damit werden in jedem Iterationsschritt absteigende Funktionswerte erzwingt. Ein

Abstiegsverfahren verwendet bei der Berechnung des nächsten Schrittes eine Abstiegsrichtung

dk und eine Schrittweite µk, mit der Eigenschaft:

χ 2 ( Nk + µk dk) < χ 2 ( Nk) , (k = 0, 1, 2, 3, ....) ∧ µk > 0 ∀ k . (3.3)

31


3 Numerische Optimierungsverfahren

Die Abstiegsrichtung wird aufgrund von lokalen Informationen über die Zielfunktion

bestimmt und die Schrittweite sorgt für einen möglichst großen Abstieg. Die Berechnung

der Schrittweite wird als Schrittweitensteuerung bezeichnet, welche ebenfalls

ein Optimierungsproblem beinhaltet. Ohne die Berechnung der Abstiegsrichtung

und der Schrittweite zu spezifizieren, kann der Ablauf eines Abstiegsverfahrens folgendermaßen

verallgemeinert werden:

Iterationsvorschrift eines Abstiegsverfahrens:

1. Wähle einen Startpunkt N0

2. Setze k := 0

3. Bestimme eine Abstiegsrichtung dk

4. Berechne eine Schrittweite µk

5. Berechne die neuen Teilchenzahlen Nk+1 = Nk + µk dk

6. Setze k := k + 1 und gehe zu 3.

Damit unnötig lange Rechenzeiten vermieden werden, sind in TRiP die folgenden

Abbruchkriterien eingebaut:

• Die Bedingung (3.2) muss in jedem Iterationsschritt k erfüllt sein.

• Das Verfahren bricht ab, wenn die relative Änderung des Funktionswertes der

χ 2 -Funktion unter ein vom Benutzer definierbares Limit ɛ fällt:

χ 2 ( Nk−1) − χ 2 ( Nk)

χ 2 ( Nk−1)

< ɛ, (k = 1, 2, 3, ....) . (3.4)

Fällt die relative Änderung unter diesen Wert, der sehr klein gewählt wird,

ist das Verfahren wahrscheinlich in einer nahen Umgebung des Minimums

angelangt und die Berechnung weiterer Schritte zahlt sich nicht mehr aus.

• Tritt keines der beiden oberen Abbruchkriterien ein, dann steigt das Verfahren,

nachdem die vom Benutzer definierte maximale Anzahl der Iterationsschritte

erreicht wurde, aus.

Mit den iterativen Verfahren kann lediglich, in Abhänigkeit des Startwertes, ein

lokales Minimum ermittelt werden. Der Berechnung eines geeigneten Startwertes

N0 widmet sich Abschnitt 4.1 und ob es sich beim lokalen Minimum auch um ein

globales Minimum handelt wird in Abschnitt 4.2 diskutiert.

32


3.2 Das Gradientenverfahren

3.2 Das Gradientenverfahren

Das Gradientenverfahren (GRV), auch Verfahren des steilsten Abstiegs genannt, ist

ein klassisches Verfahren der Nichtlinearen Optimierung. Das GRV macht in jedem

Iterationsschritt einen Schritt in die Richtung des steilsten Abfalls. Die Richtung des

steilsten Abfalls ist definitionsgemäß der negative Gradient der Zielfunktion. Eine

optimale Skalierung des negativen Gradientens erfolgt mit der Schrittweitensteuerung.

Verfahrensvorschrift des GRV’s:

• Verwende als Suchrichtung dk = −∇χ 2 ( Nk)

• Löse folgende Gleichung für die Schrittweite µk:

dχ2

Nk + µ


dk

= 0



• Berechne Nk+1 = Nk + µk dk

µ=µk

(3.5)

Oftmals konvergiert das GRV langsam, da es sich dem Minimum mit einem Zick-

Zack-Kurs nähert. Zudem ist der Betrag des Gradientens in der Nähe des Minimums

sehr klein, wodurch die Länge der Schritte ebenfalls sehr klein wird. Besonders bei

einer Lokalisierung des Minimums in einer eher flachen Region arbeitet das GRV

ineffizient. Zu den Vorteilen zählt die einfache Implementation und die Robustheit

des Verfahrens. Da lediglich die erste Ableitung der χ 2 -Funktion benötigt wird,

müssen keine großen Rechnerressourcen zur Verfügung gestellt werden.

3.3 Das konjugierte Gradientenverfahren

Bei dem konjugierten Gradientenverfahren (KGV), auch Verfahren konjugierter Richtungen

genannt, handelt es sich um eine Modifizierung des Gradientenverfahrens.

Die Idee der Verwendung von konjugierten Richtungen ist, dass die Information,

über die Richtung aus dem vorherigen Schritt, in den neuen Schritt mitgenommen

wird. Dadurch kann ein Zick-Zack-Verlauf vermieden werden und das Verfahren nähert

sich meistens in weniger Schritten, als das GRV, dem Minimum. Im Gegenzug

muss für die aufwendigere Iterationsvorschrift eine längere Rechenzeit in Kauf genommen

werden. Das KGV besitzt für Optimierungsaufgaben großer Dimension den

Vorteil, dass lediglich zwei Richtungsvektoren, aber keine Matrizen, gespeichert werden

müssen. Ebenso wie das GRV, ist das KGV für das Auffinden von Minimas in

flachen Regionen weniger effizient.

33


3 Numerische Optimierungsverfahren

Verfahrensvorschrift des KGV’s (Modifikation des GRV’s):

• Berechne

gk−1 = ( dk − dk−1) T · dk−1

d T k−1 · dk−1

• Verwende als Suchrichtung hk = dk−1 + gk−1 hk−1

• Löse folgende Gleichung für die Schrittweite µk:

dχ2

Nk + µ


hk

= 0



• Berechne Nk+1 = Nk + µk hk

3.4 Das Bortfeld-Verfahren

µ=µk

(3.6)

(3.7)

Das Bortfeld-Verfahren (BFV) [B + 90, B + 92] ist eine Modifizierung des Newton-

Verfahrens, welches ein Standardverfahren zur Lösung von nichtlinearen Gleichungen

ist. Damit Gleichung (2.11) mit dem Newton-Verfahren gelöst werden kann, wird die

erste und die zweite Ableitung der χ 2 -Funktion benötigt. Die partiellen Ableitungen

zweiter Ordnung werden in der Mathematik mit der Hesse-Matrix zusammengefasst.

Als Schreibweise für die Hesse-Matrix der χ 2 -Funktion wird hier ∇ 2 χ 2 ( N) verwendet.

Das Newton-Verfahren iteriert, ausgehend von einem Startwert N0, nach folgen-

der Vorschrift:

Nk+1 = Nk −

∇ 2 χ 2 ( −1 Nk) · ∇χ 2 (

Nk) , (k = 0, 1, 2, 3, ....) . (3.8)

Ist ∇ 2 χ 2 ( Nk) positiv definit, dann ist die Richtung


dk = − ∇ 2 χ 2 ( −1 Nk) · ∇χ 2 ( Nk) (3.9)

eine Abstiegsrichtung und die Invertierbarkeit von ∇2χ2 ( Nk) ist ebenfalls gewährleistet.

Die Schrittweitensteuerung entfällt beim Newton-Verfahren. Im Gegensatz

zum GRV und KGV, arbeitet das Newton-Verfahren in flachen Regionen, in denen

das Minimum lokalisiert ist, aufgrund größerer Schritte effektiver.

Wegen der Größe von ∇2χ2 ( Nk) ist die Invertierung mit einem enormen Rechenaufwand

verbunden. Beim BFV wird in (3.8) die Hesse-Matrix mit ihren Hauptdiagonalelementen

approximiert:


∇ 2 χ 2 (

Nk) . (3.10)

jj

34


3.5 Konvergenzergebnisse und Gegenüberstellung der Verfahren

Diese Matrix wird Skalierungsmatrix genannt und mit den reziproken Hauptdiagonalelementen

kann sie einfach und schnell invertiert werden. Damit besitzt das BFV

folgende Verfahrensvorschrift:

Nk+1 = Nk − 1



C

2 χ 2 ( −1 Nk) · ∇χ

jj

2 ( Nk), (k = 0, 1, 2, 3, ....) . (3.11)

Durch das Auslassen der Elemente außerhalb der Hauptdiagonalen entsteht ein Rechenfehler.

In das BFV ist der Konvergenzfaktor C eingebaut, mit dem der Rechenfehler

kompensiert werden soll. Es hat sich gezeigt, dass die zweifache Anzahl der

durchschnittlich beitragenden Rasterpunkte zu einem Voxel, ein guter Wert für C

ist [G + 07].

3.5 Konvergenzergebnisse und Gegenüberstellung

der Verfahren

3.5.1 Daten und Ressourcen für die Minimierung

Als Referenz für die Minimierungsergebnisse wird der Patientenplan #135 (Bestrahlungsplandaten

im Anhang) verwendet. Berechnungen anderer Patientenpläne zeigen

ähnliche Ergebnisse. Die vorgeschriebene BED Dpre wird auf 3GyE festgesetzt

und die maximale Dosisgrenze Dmax auf 1.5GyE. Diese Werte sind typisch für einzelne

Fraktionen in der Therapie.

Die Berechnungen werden mit einem IBM p615 Rechner auf einem 1.4GHz Power4

Prozessor ausgeführt.

3.5.2 Ergebnisse

Um die drei Minimierungsverfahren bzgl. ihrer Konvergenzeigenschaften zu charakterisieren

werden die folgenden Kriterien betrachtet:

• Konvergenzgeschwindigkeit als Funktion der Iterationsschritte.

• Konvergenzgeschwindigkeit als Funktion der Zeit.

Die Konvergenzgeschwindigkeit der drei Minimierungsverfahren als Funktion der

Iterationsschritte zeigt Abbildung 3.1. Überraschenderweise nähert sich dabei das

GRV am schnellsten in Richtung des Minimums. Das unerwartet schlechtere abschneiden

des KGV’s kann gegenwärtig noch nicht vollständig verstanden werden.

Der Theorie nach müsste das KGV, hinsichtlich der Iterationsschritte, effektiver

als das GRV arbeiten. Da das KGV für hinreichend glatte Zielfunktionen geeignet

ist [GT97], jedoch die χ 2 -Funktion wegen der Heaviside-Funktion nicht glatt ist,

könnte eine mögliche Begründung der langsameren Konvergenz sein. Die kleinen

Schritte des BFV’s können damit erklärt werden, dass mit dem Auslassen der Elemente

außerhalb der Hauptdiagonalen der Hesse-Matrix ein zu großer Rechenfehler

35


3 Numerische Optimierungsverfahren

entsteht, der durch den Konvergenzfaktor C nicht ausreichend genug kompensiert

wird. In den ersten 10-15 Iterationsschritten kann beim GRV ein größerer Abfall

der χ 2 -Funktionswerte beobachtet werden. Anschließend arbeitet das Verfahren mit

kleineren Schritten zum Minimum hin. Dies lässt vermuten, dass das Minimum in

einer eher flachen Region lokalisiert ist.

Abbildung 3.2 zeigt die Konvergenzgeschwindigkeit der drei Verfahren als Funktion

der Zeit. Das BFV benötigt für einen Iterationsschritt die längste Rechenzeit,

da die erste und die zweite Ableitung ausgewertet werden muss. Das GRV braucht

für den Iterationsschritt die geringste CPU-Zeit der drei Verfahren.

Das BFV und das GRV zeigen bzgl. ihrer Robustheit sehr zufriedenstellende Ergebnisse.

In den ersten Iterationsschritten macht das KGV gelegentlich relativ kleine

oder große Schritte (siehe rote Pfeile in Abb. 3.1). Bei den kleinen Schritten besteht

die Gefahr, dass die relative Änderung des χ 2 -Funktionswertes unter das Limit ɛ

fällt (Gleichung (3.4)) und es kommt zu einem frühzeitigen Abbruch der Iteration.

Im "Härtefall" kann bei sehr kleinen Änderungen, ausgelöst von Rundungsfehlern,

sogar Bedingung (3.2) verletzt werden.

Diese Ergebnisse zeigen, dass das GRV die besten numerischen Eigenschaften, im

Vergleich zu den beiden anderen Verfahren, besitzt. Deshalb wird es gegenwärtig für

die Optimierung eingesetzt.

36


χ 2

3.5 Konvergenzergebnisse und Gegenüberstellung der Verfahren

Großer Schritt






✡✡✢

✘✘✘

Kleiner Schritt

✘✘✘

✘✘✘

✘✘✾

Iteration

Abbildung 3.1: Konvergenzgeschwindigkeit der drei Minimierungsverfahren als Funktion der Iterationsschritte.

Das BFV macht von Anfang bis Ende der Iteration kleine Schritte. Bei den gradientenbezogenen

Verfahren kann in den ersten Iterationsschritten ein größerer Abfall der χ 2 -Funktion

beobachtet werden. Ab dem 10-15 Iterationsschritt minimieren beide in ähnlich kleinen Schritten.

Die roten Pfeile repräsentieren die relativ kleinen und großen Schritte des KGV’s in den ersten

Iterationsschritten.

χ 2

Zeit [s]

Abbildung 3.2: Konvergenzgeschwindigkeit der drei Minimierungsverfahren als Funktion der Zeit.

Während das BFV langsam konvergiert, arbeiten die gradientenbezogenen Verfahren relativ schnell.

Das GRV minimiert die χ 2 -Funktion etwa doppelt so schnell wie das KGV.

37


4 Weitere Betrachtung der

numerischen Optimierung

In diesem Kapitel werden weitere wichtige Punkte, zur numerischen Minimierung der

χ 2 -Funktion, diskutiert. Die Berechnung des Startvektors N0, der Ausgangspunkt

der iterativen Verfahren aus Kapitel 3 ist, wird in 4.1 geschildert. Abschnitt 4.2

behandelt die Eindeutigkeit des Minimums der χ 2 -Funktion. Der letzte Abschnitt

beinhaltet einen Ansatz, mit dem die Schrittweite bei den gradientenbezogenen Verfahren

approximiert wird.

4.1 Startwerte für die Optimierung -

Voroptimierung

Die Iterationsverfahren aus Kapitel 3 arbeiten alle ausgehend von einem Startvektor

N0. Die Wahl des Startvektors hat einen großen Einfluss auf den weiteren Verlauf

der Iteration. Sind bei der Zielfunktion mehrere Minima vorhanden, dann läuft das

Verfahren meistens vom Startpunkt in das nächstgelegene Minimum. In der Regel

gilt, je näher der Startvektor am Minimum liegt, desto schneller konvergiert das

Verfahren.

Da der Startvektor für die Konvergenz und Konvergenzgeschwindigkeit von großer

Bedeutung ist, wird er nicht willkürlich gewählt. Bevor die eigentliche Optimierung

beginnt, gibt es in TRiP eine Voroptimierung, die einen geeigneten Startvektor N0

berechnet.

Ablauf der Voroptimierung

Bei der Voroptimierung [K + 00] geht TRiP, für jedes Feld einzeln, durch alle Isoenergieschichten

und deren Rasterpunkte. OAR’s werden nicht berücksichtigt. Für jeden

Rasterpunkt wird die Teilchenfluenz berechnet, die der Soll-Dosis genügt. TRiP arbeitet

sich dabei von der hintersten IES bis zur vordersten. Dosisbeiträge von Rasterpunkten

höherer Energie können somit berücksichtigt werden. Diese Prozedur

wird mehrmals wiederholt, um auch die Projektilfragmente hinter dem Bragg-Peak

(siehe Abb. 1.3) einzubeziehen.

38


4.2 Eindeutigkeit des Minimums

4.2 Eindeutigkeit des Minimums

Iterative Abstiegsverfahren können lediglich ein lokales Minimum ermitteln. Eine

häufig angewandte Methode zur Charakterisierung des Minimums, im Hinblick auf

dessen Eindeutigkeit, ist die Untersuchung der Zielfunktion auf Konvexität. Konvexe

Funktionen besitzen die Eigenschaft, dass jedes lokale Minimum auch globales

Minimum ist. Es gestaltet sich jedoch als äußerst schwierig, mathematisch zu überprüfen,

ob es sich bei der χ 2 -Funktion um eine konvexe Funktion handelt. Einige

Gründe dafür sind:

• Die komplexe Berechnung der RBW.

• Die Zielfunktionstopologie variiert mit jedem Patientenplan.

• Die Heaviside-Funktion.

Wird bei der Iteration der Nullvektor als Startvektor verwendet, also

N0 := 0 , (4.1)

dann nähern sich die Verfahren den Teilchenzahlen, denen sie sich auch ausgehend

von der Voroptimierung nähern [Sch06]. D.h., sogar wenn der Startpunkt weit entfernt

von den optimalen Teilchenzahlen liegt, konvergieren die Verfahren gegen den

selben Punkt, gegen den sie auch aus näherliegenden Startpunkten konvergieren.

Dies deutet darauf hin, dass das Minimum der χ 2 -Funktion wahrscheinlich eindeutig

ist.

4.3 Schrittweitensteuerung bei den

gradientenbezogenen Verfahren

Damit das GRV und KGV konvergiert, muss in jedem Iterationsschritt k eine effiziente

Schrittweite µk berechnet werden. Schrittweitenbestimmung, durch Lösung

des eindimensionalen Optimierungsproblems

dχ2

Nk + µ


dk

= 0


, (4.2)

µ=µk

welches in beiden Verfahren angewandt wird, nennt man Exakte Schrittweitenbestimmung

1 [Alt02].

Bei Optimierung der BED, die nichtlinear von den Teilchenzahlen N abhängt,

kann (4.2) analytisch nicht gelöst werden. Mit iterativen Verfahren wäre eine Lösung

1 In der Literatur wird die Exakte Schrittweitenbestimmung auch oftmals Prinzip der Strahlmini-

mierung genannt

39


4 Weitere Betrachtung der numerischen Optimierung


Dosis [GyE]

Abbildung 4.1: Geeignete Werte für das Verhältnis zwischen biologischer und physikalischer

Schrittweite fµ (siehe Gleichung (4.4)), aufgetragen gegen die vorgeschriebene BED. Daten wurden

mit dem Patientenplan #135 erstellt. Bei steigender Dosis muss fµ erhöht werden. Für die Optimierung

mit 3GyE wird fµ = 0.5 gesetzt. Ab ca. 8GyE nähert sich die biologische der physikalischen

Schrittweite. Abbildung aus [Sch06].

im Prinzip möglich, z.B. mit dem Newton-Verfahren oder Sekantenverfahren, würde

aber die Rechenzeit des gesamten Optimierungsprozesses deutlich erhöhen. Um diese

zusätzlich hohen Rechenzeiten zu vermeiden wird die Schrittweite mit folgendem

Ansatz approximiert:

Berechnung von µBio durch Dämpfung von µPhys

Vorab werden die folgenden Bezeichnungen eingeführt:

• Schrittweite bei Optimierung der BED := µBio

• Schrittweite bei Optimierung der physikalischen Dosis := µPhys

Optimierung der physikalischen Dosis erfordert das Einsetzen von Gleichung (2.2)

in die χ 2 -Funktion. In diesem Fall kann, bei Vernachlässigung des OAR-Termes, das

Optimierungsproblem (4.2) analytisch gelöst werden (Die genaue Berechnungsvorschrift

befindet sich in Abschnitt 8.3). Daher bietet es sich an, nach einem Verhältnis

zwischen µBio und µPhys zu suchen.

Auswertungen verschiedener Patientenpläne zeigten stets die folgende Größenbeziehung

[Sch06]:

µBio ≤ µPhys . (4.3)

Bei einer vorgeschriebenen BED von 3GyE stellte sich heraus, dass die besten Kon-

40


4.3 Schrittweitensteuerung bei den gradientenbezogenen Verfahren

vergenzergebnisse mit dem Verhältnis

fµ = µBio

µPhys

= 0.5 (4.4)

erzielt werden. Damit für höhere Dosen die guten Konvergenzergebnisse erhalten

bleiben, muss fµ vergrößert werden. Dies liegt daran, dass mit steigender Dosis die

RBW abnimmt [G + 07]. Ab einer vorgeschriebenen BED von ca. 8GyE gilt:

fµ ≈ 1 =⇒ µBio ≈ µPhys . (4.5)

Ein geeigneter Wert für fµ, in Abhängigkeit der vorgeschriebenen BED, kann aus

Abbildung 4.1 entnommen werden. Die Daten wurden mit dem Patientenplan #135

erstellt. Gute Konvergenzergebnisse mit diesen Werten in anderen Patientenplänen

deuten auf ihre allgemeine Gültigkeit.

41


5 Konvergenzbeschleunigung des

Gradientenverfahrens

Bei Betrachtung der Konvergenzgeschwindigkeit bzgl. der Zeit und der Iterationsschritte

zeigt das GRV die besten Eigenschaften. Optimierung von Patientenplänen

mit einer größeren Anzahl an Rasterpunkten, z.B. 50000-80000, beansprucht

dennoch mehrere Stunden Rechenzeit. In diesem Kapitel wird untersucht, ob die

Konvergenz des GRV’s mit einfachen Modifikationen beschleunigt werden kann.

In Abschnitt 5.1 wird eine Verlängerung des Gradienten, beim Eintreten des Verfahrens

in die vermutet flache Region in der das Minimum lokalisiert ist, untersucht.

Abschnitt 5.2 beschreibt einen Suchalgorithmus, der den Dämpfungsparameter fµ,

der in Abschnitt 4.3 behandelt wurde, dynamisch den lokalen Verhältnissen der χ 2 -

Funktion anpasst.

5.1 Verlängerung des Gradienten in der Nähe des

Minimums

Die Ergebnisse des GRV’s aus Abschnitt 3.5 lassen vermuten, dass das Minimum der

χ 2 -Funktion in einer eher flachen Region lokalisiert ist. Abbildung 3.1 zeigt, dass sich

das Verfahren in den ersten 10-15 Iterationsschritten im "Einzugsgebiet" befindet

und anschließend in die vermutet flache Region übergeht. In flachen Regionen ist der

Betrag des Gradienten sehr klein, wodurch die Länge der Iterationsschritte ebenfalls

sehr klein ist.

In diesem Abschnitt wird untersucht, ob mit einer Verlängerung des Gradienten

die Konvergenz des GRV’s beschleunigt werden kann. Dafür wird ab dem 15

Iterationsschritt der negative Gradient −∇χ 2 ( Nk) mit einem Skalar r multipliziert:

r · −∇χ 2 ( Nk) für k ≥ 15 . (5.1)

Es wird jeweils r = 1.1 und r = 1.2 gewählt. D.h., dass der negative Gradient um

10% und um 20% seiner Länge gestreckt wird.

Sowohl mit r = 1.1 als auch mit r = 1.2 konnte in verschiedenen Patientenplänen

keine Beschleunigung der Konvergenz erreicht werden. Bei der Minimierung der χ 2 -

Funktion sind die Unterschiede zwischen dem GRV mit den Verlängerungen und

dem konventionellen GRV kaum erkennbar.

42


5.2 Dynamische Suche nach der optimalen Schrittweite

5.2 Dynamische Suche nach der optimalen

Schrittweite

Bei Optimierung der BED wird beim GRV, nach Abschnitt 4.3, die Schrittweite

folgendermaßen berechnet:

mit

Nk+1 = Nk + µBio · dk , (5.2)

µBio := fµ · µPhys . (5.3)

µPhys wird in jedem Iterationsschritt k nach Gleichung (8.8) berechnet. Geeignete

Werte für den Dämpfungsfaktor fµ, in Abhängigkeit der vorgeschriebenen BED,

zeigt Abbildung 4.1. Allerdings unterliegen die Werte in dieser Abbildung einer

Abweichung von ca. ±0.1. Da fµ während des Iterationsprozesses konstant gehalten

wird, ist es möglich, dass nicht in jedem Iterationsschritt das beste fµ verwendet

wird.

In diesem Abschnitt wird ein Suchalgorithmus beschrieben, der in jedem zehnten

Iterationsschritt überprüft, ob mit

fµ := fµ ± 0.1 (5.4)

ein niedrigerer Funktionswert der χ 2 -Funktion erreicht werden kann. Der genaue

Ablauf des Suchalgorithmus wird im nächsten Unterabschnitt geschildert und die

Konvergenzergebnisse im darauffolgenden Unterabschnitt.

5.2.1 Der Suchalgorithmus

Am Anfang wird ein geeigneter Dämpfungsfaktor fµ gewählt. In den ersten neun

Iterationsschritten wird aus dem µPhys, mit dem fµ, ein µBio berechnet (siehe (5.3)).

Beim zehnten Iterationsschritt findet eine Abfrage statt. Aus dem µPhys werden

drei unterschiedliche µBio berechnet, die sich aus den folgenden Änderungen von fµ

ergeben:

µBio := fµ · µPhys ,

µ < Bio := f < µ · µPhys , mit f < µ := fµ − 0.1 , (5.5)

µ > Bio := f > µ · µPhys , mit f > µ := fµ + 0.1 .

Mit diesen werden jeweils über (5.2) neue Teilchenzahlen berechnet und damit auch

drei Funktionswerte der χ 2 -Funktion. Für den zehnten Iterationsschritt wird der

kleinste Funktionswert genommen. Der Algorithmus merkt sich, ob mit fµ, f < µ oder

f > µ der kleinste Funktionswert erreicht wurde und verwendet diesen als Dämpfungsfaktor

für die nächsten zehn Iterationsschritte. Beim 20., 30., 40., . . . usw. Iterationsschritt

findet diese Abfrage erneut statt. Dabei wird dann der aktuelle Dämpfungsfaktor

jeweils um ±0.1 verändert. Damit wird fµ den lokalen Verhältnissen

der χ 2 -Funktion dynamisch angepasst.

43


5 Konvergenzbeschleunigung des Gradientenverfahrens

χ 2

Iteration

Abbildung 5.1: Konvergenzverhalten des GRV’s mit dem Suchalgorithmus im Vergleich zu dem

konventionellen GRV ab dem zehnten Iterationsschritt. Bei der Minimierung ist zwischen beiden

Methoden kein Unterschied zu erkennen.

5.2.2 Konvergenzergebnisse

Für die Berechnungen wurde der Patientenplan #135 verwendet. Die vorgeschriebene

BED wurde bei der Optimierung auf 3GyE gesetzt. Somit wurde am Anfang

der Iteration fµ = 0.5 gewählt (siehe Abschnitt 4.3).

Abbildung 5.1 zeigt das Konvergenzverhalten des GRV’s mit dem eben beschriebenen

Suchalgorithmus im Vergleich zu dem konventionellen GRV ab dem zehnten

Iterationsschritt. Bei der Minimierung ist zwischen beiden Methoden kein Unterschied

zu erkennen. Dies liegt daran, dass der Suchalgorithmus den Dämpfungsfaktor

fµ lediglich im 30. Iterationsschritt auf 0.6 erhöhte und bei der Abfrage im 40.

Iterationsschritt auf 0.5 verminderte. Zudem hatte die Änderung des Dämpfungsfaktors

zwischen dem 30. und 40. Iterationsschritt kaum einen Einfluss auf den Abfall

der χ 2 -Funktion.

Mit dem Suchalgorithmus zeigen andere Patientenpläne ein ähnliches Konvergenzverhalten.

Dies deutet auf eine Stabilität der Daten aus Abbildung 4.1. Insgesamt

wird mit dem Suchalgorithmus ein schlechteres Ergebnis erzielt, da wegen den

Abfragen zusätzliche Rechenzeit in Anspruch genommen wird.

44



5.2 Dynamische Suche nach der optimalen Schrittweite

Dosis [GyE]

Abbildung 5.2: Geeignete Werte für das Verhältnis zwischen biologischer und physikalischer

Schrittweite fµ, aufgetragen gegen die vorgeschriebene BED. Die Werte aus Abbildung 4.1 (aus

Patientenplan #135) sind denen gegenübergestellt, die mit dem Suchalgorithmus aus Patientenplan

#240 ermittelt werden konnten. Dabei ist keine große Abweichung zu sehen. Bei den Dosen

4GyE, 5GyE, 7GyE, 8GyE und 10GyE ergibt sich für fµ ein zu erwartender Wert.

5.2.3 Verifikation des Dämpfungsfaktors für andere

Patientenpläne

Die Daten für den Dämpfungsfaktor fµ aus Abbildung 4.1 wurden mit mehreren

Auswertungen in jedem einzelnen Iterationsschritt erstellt [Sch06]. Für diese Auswertungen

wurde der Patientenplan #135 verwendet. Wie bereits erwähnt, auch in

anderen Patientenplänen werden mit diesen Werten für fµ zufriedenstellende Konvergenzergebnisse

erzielt.

Mit dem dynamischen Suchalgorithmus kann die Gültigkeit des in Abbildung 4.1

dargestellten empirischen Zusammenhangs ohne viel Aufwand für andere Patientenpläne

verifiziert werden. Dafür wird für eine vorgeschriebene BED von 1GyE,

2GyE, 3GyE,. . . ,10GyE das GRV mit dem Suchalgorithmus verwendet. Dabei wird

jeweils die Iteration mit dem Dämpfungsfaktor fµ = 0.5 gestartet, der eigentlich

für eine vorgeschriebene BED von 3GyE geeignet ist. Diesmal wird beobachtet, ob

und bei welchem Wert für fµ sich der Suchalgorithmus nach 100 Iterationsschritten

einpendelt.

Als Beispiel wurde der Patientenplan #240 (Bestrahlungsplandaten im Anhang)

45


5 Konvergenzbeschleunigung des Gradientenverfahrens

untersucht. Bei allen Dosen pendelte sich der Suchalgorithmus gegen einen Wert

für fµ ein. Diese werden in Abbildung 5.2 den Werten aus Abbildung 4.1 gegenübergestellt.

Dabei kann beobachtet werden, dass die Werte nicht stark voneinander

abweichen. Auch für die Dosen 4GyE, 5GyE, 7GyE, 8GyE und 10GyE, die in [Sch06]

nicht untersucht wurden, pendelte sich fµ gegen den zu erwartenden Wert ein.

46


6 Die Levenberg-Marquardt-

Minimierung

In diesem Kapitel wird ausführlich die Verwendung der Levenberg-Marquardt-Minimierung

(LMM) bei Optimierung der BED beschrieben. Zuerst wird die Minimierung

mit quadratischer Form, in die die LMM übergehen kann, hergeleitet. Diese

Herleitung ist wichtig für ein besseres Verständnis der Arbeitsweise der LMM, die

dann in Abschnitt 6.2 eingeführt wird. Abschnitt 6.3 beschreibt eine Approximation

der zur χ 2 -Funktion gehörenden Hesse-Matrix. Abschnitt 6.4 zeigt, wie zur Einsparung

von Rechenzeiten, die Invertierung der Hesse-Matrix durch die Lösung eines

linearen Gleichungssystems ersetzt wird. Die Konvergenzergebnisse der LMM werden

in Abschnitt 6.5 diskutiert und direkt mit dem GRV verglichen. Im darauffolgenden

Abschnitt werden zwei Modifizierungen der LMM betrachtet. Der letzte Abschnitt

beinhaltet eine weitere Diskussion der Ergebnisse mit Vorschlägen für verbesserte

Konvergenzeigenschaften.

6.1 Minimierung mit quadratischer Form

Bei der Minimierung mit quadratischer Form (MQF) wird die χ 2 -Funktion um den

Punkt N0 (dieser wird nach Abschnitt 4.1 berechnet) durch eine Taylor-Reihe zweiten

Grades approximiert:

χ 2 ( N) ≈ Q( N) = χ 2 ( N0) + ( N − N0) T · ∇χ 2 ( N0)

+ 1

2 · ( N − N0) T · ∇ 2 χ 2 ( N0) · ( N − N0) .

(6.1)

Anschließend kann von der Funktion Q( N) das Minimum analytisch berechnet werden:

NMin, Q := ∇Q( N) = 0 (6.2)

=⇒ ∇χ 2 ( N0) + ∇ 2 χ 2 ( N0) · ( N − N0) = 0 (6.3)

=⇒ NMin, Q =

N0 − ∇ 2 χ 2 ( −1 N0) · ∇χ 2 ( N0) . (6.4)

Für den Fall, dass die Approximation (6.1) gut ist, so liegt das Minimum NMin, Q nahe

an dem Minimum der χ 2 -Funktion, welches bekanntlich im Optimierungsprozess

47


6 Die Levenberg-Marquardt-Minimierung

ermittelt werden soll. Durch wiederholtes Anwenden dieser Prozedur, immer ausgehend

von dem neu erhaltenen Punkt, kann die Näherung an das gesuchte Minimum

verbessert werden. Daraus ergibt sich für die MQF folgende Verfahrensvorschrift:

Nk+1 = Nk −


∇ 2 χ 2 ( −1 Nk) · ∇χ 2 ( Nk), (k = 0, 1, 2, 3, ....) . (6.5)

Dabei ist k der Laufindex der Iteration.

Liegt der Startwert N0 nahe am Minimum der χ 2 -Funktion, dann konvergiert die

MQF sehr schnell. Anderenfalls kann bei einer schlechten Wahl von N0 das Verfahren

sogar divergieren [Bra99].

Der Speicheraufwand für die Hesse-Matrix ∇ 2 χ 2 ( Nk) kann mehrere Gigabytes

erfordern.

6.2 Die Levenberg-Marquardt-Minimierung

Die Levenberg-Marquardt-Minimierung (LMM) [Lev44, Mar63], auch Marquardt-

Minimierung genannt, arbeitet in der Praxis sehr effektiv und ist ein Standardverfahren

für nichtlineare Minimum-Quadrat-Probleme.

Die LMM variiert zwischen der MQF und der Methode des steilsten Abstiegs.

Die Idee dabei ist, die jeweiligen Vorteile der beiden Verfahren miteinander zu Verbinden,

die Schnelligkeit des ersten Verfahrens im Bereich nahe des Minimums und

die Robustheit des zweiteren, falls man sich noch im "Einzugsgebiet" befindet. Bei

der LMM wird in jedem Iterationsschritt mit einem Parameter λ eine Regularisierungstechnik

erzeugt, die einen größtmöglichen, aber dennoch sicheren, Schritt in

Richtung des Minimums macht. Um dies zu erreichen wird in (6.5) die Hesse-Matrix

∇ 2 χ 2 ( Nk) durch eine geänderte Hesse-Matrix ersetzt, die mit

∇ 2 χ 2 ( Nk) ′

(6.6)

bezeichnet wird. ∇2χ2 ( Nk) ′

ist vom Parameter λ abhängig und folgendermaßen definiert:

∇ 2 2 ′

χmn := λ · ∇ 2 χ 2 mn für m = n , λ ≥ 1 , (6.7)

∇ 2 2 ′

χmn := ∇ 2 χ 2 mn für m = n , (6.8)

wobei m der Zeilen- und n der Spaltenindex der Matrix ist. ∇2 2 ′

χmn und ∇2χ2 mn sind

dann die Matrixelemente zum entsprechenden Indexpaar. Somit iteriert die LMM

nach folgender Vorschrift:

Nk+1 = Nk −

mit k als Laufindex der Iteration.

48


∇ 2 χ 2 ( Nk) ′ −1

· ∇χ 2 ( Nk), (k = 0, 1, 2, 3, ....) , (6.9)


6.2 Die Levenberg-Marquardt-Minimierung

Ist λ sehr groß, dann verlieren die Werte aus (6.8) an Einfluss und können vernachlässigt

werden. In diesem Fall geht (6.9) in

Nk+1 =

Nk − ∇ 2 χ 2 ( Nk) ′−1 · ∇χ 2 ( Nk) (6.10)

über. Mit

∇ 2 χ 2 ( Nk) ′

mm

mm

(6.11)

ist die Diagonalmatrix der geänderten Hesse-Matrix gemeint. In (6.10) macht das

Verfahren einen Schritt in Richtung des Vektors


− ∇ 2 χ 2 ( Nk) ′−1 · ∇χ 2 ( Nk) . (6.12)

mm

Dieser Schritt wird um so kleiner, je größer der Parameter λ ist. Allerdings wird mit

diesem kleinen Schritt ein sicherer Schritt gemacht. Bei λ = 1 geht (6.9) in (6.5)

über.

Die lokale Anpassung von λ kann aus der folgenden Verfahrensvorschrift entnommen

werden:

Verfahrensvorschrift der LMM:

• (†) Setze λ = 10

• (‡) Verwende als Suchrichtung


dk = − ∇ 2 χ 2 ( Nk) ′−1 · ∇χ 2 ( Nk) (6.13)

• Berechne die neuen Teilchenzahlen Nk+1 = Nk + dk

• – Falls χ 2 ( Nk+1) ≥ χ 2 ( Nk), dann setze λ := λ · 10 und gehe zu (‡)

– Falls χ 2 ( Nk+1) < χ 2 ( Nk), dann setze k := k + 1 und gehe zu (†)

Für die LMM werden folgende Abbruchkriterien verwendet:

• Das Abbruchkriterium (3.4).

• Wurde die vom Benutzer definierte maximale Anzahl der Iterationsschritte

erreicht, dann steigt das Verfahren aus.

• Bei zu vielen Erhöhungen des Parameters λ wird die Iteration abgebrochen.

Hier soll erwähnt werden, dass mehrere Varianten der LMM existieren. Einige

davon werden z.B. in [F + 92, Sch93, Bra99] behandelt. Die obere Vorschrift ist ähnlich

zu der aus [F + 92].

Für den Parameter λ, der im Grunde genommen beliebig bestimmt werden kann,

wurden verschiedene Ansätze getestet. Mit der oberen Variante konnten bei Minimierung

der χ 2 -Funktion bis jetzt die besten Ergebnisse erzielt werden.

49


6 Die Levenberg-Marquardt-Minimierung

Notwendig, um die Suchrichtung (6.13) bestimmen zu können, ist unter anderem

die Invertierbarkeit von ∇2χ2 ( Nk) ′

. Der Aufwand zur Berechnung von


∇ 2 χ 2 ( Nk) ′−1 (6.14)

ist recht groß.

Bevor die Ergebnisse der LMM diskutiert werden, wird im nächsten Abschnitt

eine Approximation der Hesse-Matrix betrachtet. In Abschnitt 6.4 wird gezeigt, wie

der Rechenaufwand für (6.14) reduziert werden kann.

6.3 Approximation der Hesse-Matrix

Damit bei Optimierung der BED die Hesse-Matrix der χ2-Funktion bestimmt werden

kann, muss ∇χ2 ( N) aus Gleichung (2.11) abgeleitet werden:

∇ 2 χ 2 ( N) = 2


⎣ ∇Di Bio ( N) · ∇Di Bio ( N) T


Dpre − D


i Bio (

N)

· ∇ 2 D i Bio( ⎤

N) ⎦

mit

i∈Target

+ 2

· Θ


∆D 2 pre


i∈OAR

∇Di Bio ( N) · ∇Di Bio ( N) T

∆D2 max


D i Bio(

N) − Dmax ,



∆D 2 pre

Dmax − D i Bio ( N)

∆D 2 max


· ∇ 2 D i Bio( N)



(6.15)

∇D i Bio( N) = ∇D i Phys( N) · RBW i ( N) + D i Phys( N) · ∇RBW i ( N) . (6.16)

Auch hier wird beim Differenzieren die Heaviside-Funktion Θ als konstanter Faktor

behandelt (siehe Abschnitt 2.3). Die zweite Ableitung der BED ∇2Di Bio ( N), die sich

aus der Ableitung von (6.16) ergibt, wird hier nicht explizit angegeben.

∇2Di Bio ( N) wird in (6.15) im Target- und im OAR-Term jeweils mit


Dpre/max − D i Bio(

N)

(6.17)

multipliziert. Bei (6.17) handelt es sich um die Dosisabweichung im Voxel i, die in der

Regel klein ist. Daher kann in (6.15) sowohl im Target- als auch im OAR-Term der

zweite Term vernachlässigt werden. Somit kann die Hesse-Matrix der χ2-Funktion, bei Optimierung der BED, mit der folgenden approximiert werden:

∇ 2χ2 ( N) = 2


∇Di Bio ( N) · ∇Di Bio ( N) T


50

∆D

i∈Target

2 pre


∇Di Bio ( N) · ∇Di Bio ( N) T

+ 2

i∈OAR

∆D 2 max



· Θ D i Bio(

N) − Dmax

.

(6.18)


6.4 Berechnung der Suchrichtung über die Lösung eines linearen

Gleichungssystems

Die Approximation (6.18) ist im Hinblick der Rechenzeit von großem Vorteil, da

∇ 2 D i Bio ( N) jetzt fehlt. ∇ 2 D i Bio ( N) beinhaltet unter anderem die zweite Ableitung

der RBW, also

∇ 2 RBW i ( N) , (6.19)

deren Berechnung sehr aufwändig ist und damit umgangen werden kann.

Im weiteren Verlauf wird bei der LMM ausschließlich die approximierte Hesse-

Matrix ∇ 2 χ 2 ( N) verwendet.

6.4 Berechnung der Suchrichtung über die Lösung

eines linearen Gleichungssystems

Die LMM verwendet in jedem Iterationsschritt k als Suchrichtung


dk = − ∇ 2 χ 2 ( Nk) ′−1 · ∇χ 2 ( Nk) . (6.20)

Die Berechnung von dk, über die Invertierung der geänderten Hesse-Matrix ∇ 2 χ 2 ( Nk) ′

und anschließender Multiplikation mit dem Gradienten ∇χ 2 ( Nk), wie es in (6.20)

vorgeschrieben ist, erweist sich als numerisch ungünstig, da das Invertieren von Matrizen

mit einem hohen Rechenaufwand verbunden ist. Statt dessen kann (6.20) in

das folgende lineare Gleichungssystem überführt werden:

∇ 2 χ 2 ( Nk) ′

· dk = −∇χ 2 ( Nk) , (6.21)

wobei ∇2χ2 ( Nk) ′

die Koeffizientenmatrix und −∇χ2 ( Nk) die rechte Seite des Gleichungssystems

ist. Die neue Suchrichtung dk ergibt sich dann aus der Lösung von

(6.21).

Zum Lösen von (6.21) wird das Cholesky-Verfahren, auch Cholesky-Zerlegung

genannt, verwendet. Vorteile des Cholesky-Verfahrens ist die numerische Stabilität

des Verfahrens und im Vergleich zu anderen Verfahren die geringere Anzahl an erforderlichen

Punktoperationen (siehe Abschnitt 8.4). Notwendig, um das Cholesky-

Verfahren anwenden zu können, ist die Symmetrie und positive Definitheit der Matrix

∇2χ2 ( Nk) ′

. Nach dem Satz von Schwarz1 ist die Hesse-Matrix symmetrisch.

Wird beim Iterationsverfahren (6.9) der Startvektor N0 hinreichend nahe am Minimum

der χ2-Funktion gewählt, dann ist ∇2χ2 ( Nk) ′

positiv definit. Damit ist dann

auch sichergestellt, dass das Gleichungssystem (6.21) genau eine Lösung dk besitzt,

die eine Abstiegsrichtung darstellt [Alt02].

Eine detailliertere Beschreibung des Cholesky-Verfahrens befindet sich in Abschnitt

8.5.

1 Der Satz von Schwarz befindet sich in nahezu jedem Buch zur höheren Analysis.

51


6 Die Levenberg-Marquardt-Minimierung

6.5 Konvergenzergebnisse

Bei den Eingangsdaten und Rechnerressourcen für die Optimierung gelten in diesem

Abschnitt die gleichen Bedingungen, die bereits im Unterabschnitt 3.5.1 genannt

wurden.

Um die Konvergenzeigenschaften der LMM zu charakterisieren, wird die Konvergenzgeschwindigkeit

als Funktion der Iterationsschritte und als Funktion der Zeit

betrachtet. Bis jetzt zeigte das GRV bei beiden Kriterien die besten Eigenschaften.

Daher werden die Ergebnisse der LMM den entsprechenden Ergebnissen des GRV’s,

die in Abschnitt 3.5.2 gezeigt und diskutiert wurden, gegenübergestellt. Für einen

fairen Vergleich blieben alle anderen Parameter im Optimierungsprozess unverändert.

Die Konvergenzgeschwindigkeit als Funktion der Iterationsschritte zeigt Abbildung

6.1. Beim ersten Iterationsschritt macht die LMM, im Vergleich zum GRV,

einen großen Schritt in Richtung des Minimums der χ 2 -Funktion. Bereits nach fünf

Schritten erreicht die LMM den Funktionswert, für den das GRV 100 Schritte benötigt.

Das Problem der langsamen Konvergenz des GRV’s in der Nähe des Minimums

ist bei der LMM nicht vorhanden. In diesem Beispiel musste in keinem Iterationsschritt

der Parameter λ erhöht werden.

Abbildung 6.2 zeigt die Minimierungsergebnisse aus Abbildung 6.1 gegen die Zeit.

Dabei kann die lange Rechenzeit der LMM, die in diesem Beispiel ca. 32 Stunden

beträgt, deutlich beobachtet werden. Ein einzelner Iterationsschritt der LMM dauert

länger als die 100 Iterationsschritte beim GRV. Um das gleiche Ergebnis wie das

GRV zu erreichen, benötigt die LMM ca. das Achtfache an Rechenzeit. Die lange

Rechenzeit ergibt sich hauptsächlich aus der Berechnung der Hesse-Matrix und aus

der Lösung des Gleichungssystems (6.21), wobei letzteres stärker ins Gewicht fällt.

Eine weitere Diskussion zu den Ergebnissen der LMM, mit Schwerpunkt auf die

lange Rechenzeit, findet in Abschnitt 6.7 statt.

Im nächsten Abschnitt werden zwei Modifizierungen der LMM betrachtet. In der

ersten wird eine vereinfachte Variante der LMM vorgestellt, bei der die Hesse-Matrix

lediglich einmal berechnet wird. In der zweiten wird versucht, mit einem manuell

eingestellten Schrittweitenparameter größere Schritte in Richtung des Minimums zu

erzielen.

6.6 Modifizierungen der

Levenberg-Marquardt-Minimierung

6.6.1 Vereinfachte Levenberg-Marquardt-Minimierung

Oftmals ändern sich die Werte der Hesse-Matrix im Iterationsverlauf nicht mehr

stark. Zudem ist der Berechnungsaufwand der Hesse-Matrix recht hoch. Eine Möglichkeit,

um Rechenzeit zu sparen, ist in jedem Iterationsschritt k die Hesse-Matrix

52

∇ 2 χ 2 ( N0) ′

(6.22)


χ 2

6.6 Modifizierungen der Levenberg-Marquardt-Minimierung

Iteration

Abbildung 6.1: Konvergenzgeschwindigkeit der LMM und des GRV’s als Funktion der Iterationsschritte.

Die LMM konvergiert in wesentlich größeren Schritten. Bereits im fünften Schritt erreicht

die LMM den Funktionswert, für den das GRV 100 Schritte benötigt. Auch in der Nähe des Minimums

kann bei der LMM ein effizienter Abfall der χ 2 -Funktion beobachtet werden.

χ 2

Zeit [s]

×10 5

Abbildung 6.2: Minimierungsergebnisse aus Abbildung 6.1 gegen die CPU-Zeit. Die Minimierung

der χ 2 -Funktion dauert mit der LMM wesentlich länger als mit dem GRV. Der erste Schritt der

LMM benötigt eine längere Rechenzeit als die 100 Schritte des GRV’s.

53


6 Die Levenberg-Marquardt-Minimierung

χ 2

Iteration

Abbildung 6.3: Konvergenzgeschwindigkeit der vereinfachten LMM und der LMM als Funktion der

Iterationsschritte. Die Arbeitsweise der vereinfachten LMM ist zufriedenstellend. Die χ 2 -Funktion

wird kontinuierlich mit größeren Schritten minimiert, die nur etwas schlechter ausfallen als bei der

LMM.

χ 2

Zeit [s]

×10 5

Abbildung 6.4: Minimierungsergebnisse aus Abbildung 6.3 gegen die Zeit. Insgesamt kann mit der

vereinfachten LMM eine schnellere Minimierung der χ 2 -Funktion erreicht werden.

54


6.6 Modifizierungen der Levenberg-Marquardt-Minimierung

zu verwenden. Zwar verliert das Verfahren damit an Konvergenzordnung, jedoch

wird jetzt die aufwändige Berechnung der Hesse-Matrix in jedem weiteren Iterationsschritt

vermieden. Mit einem geeigneten Startwert N0 können durch beibehalten von

(6.22) gute Konvergenzeigenschaften erzielt werden.

Die eben angesprochene Variante wird hier vereinfachte Levenberg-Marquardt-

Minimierung genannt, die nach folgender Vorschrift iteriert:

Nk+1 = Nk + dk, (k = 0, 1, 2, 3, ....) . (6.23)

Nach Abschnitt 6.4 wird dann die Suchrichtung dk aus dem folgenden Gleichungssystem

ermittelt:

∇ 2 χ 2 ( N0) ′

· dk = −∇χ 2 ( Nk) . (6.24)

Des weiteren bringt die vereinfachte LMM aufwandsmäßig den Vorteil, dass die

Koeffizientenmatrix aus (6.24) nicht in jedem Iterationsschritt in die Cholesky-Faktoren

zerlegt werden muss. Lediglich einmal für den Startvektor N0 und bei einer

Erhöhung des Parameters λ wird die Zerlegung berechnet. Ansonsten genügt zur

Lösung von (6.24) die Vorwärts- und Rückwärtssubstitution (siehe Abschnitt 8.5)

für jede neue rechte Seite. Beim Cholesky-Verfahren benötigt die Zerlegung in die

Cholesky-Faktoren n 3 /6 Punktoperationen (Bei einer n × n Matrix) [F + 92] und ist

damit der rechenaufwändigste Teil im Verfahren (siehe Tabelle in Abschnitt 8.4).

Abbildung 6.3 zeigt die Konvergenzgeschwindigkeit der vereinfachten LMM als

Funktion der Iterationsschritte. Dabei werden die Ergebnisse mit den entsprechenden

Ergebnissen der LMM aus Abbildung 6.1 verglichen. Die Arbeitsweise der vereinfachten

LMM ist zufriedenstellend. Die χ 2 -Funktion wird kontinuierlich mit effizienten

Schritten minimiert, die nur etwas schlechter ausfallen als bei der LMM. In

diesem Beispiel musste bei der vereinfachten LMM der Parameter λ in vier Iterationsschritten

jeweils einmal erhöht werden.

Abbildung 6.4 zeigt die Minimierungsergebnisse aus Abbildung 6.3 gegen die Zeit.

Obwohl die vereinfachte LMM bzgl. der Iterationsschritte schlechter arbeitet wird

die χ 2 -Funktion schneller minimiert. Dies zeigt, dass mit der vereinfachten LMM

viel Rechenzeit gespart werden kann. Die Zeitersparnis ergibt sich hauptsächlich

aus der geringeren Anzahl der Zerlegungen der Koeffizientenmatrix in die Cholesky-

Faktoren.

6.6.2 Levenberg-Marquardt-Minimierung mit

Schrittweitenparameter

Durch die Verwendung der approximierten Hesse-Matrix ∇ 2 χ 2 ( N) entsteht in jedem

Iterationsschritt ein Rechenfehler. Mit einem manuell gewählten Schrittweitenparameter

D wurde getestet, ob der Rechenfehler kompensiert werden kann. Der

Schrittweitenparameter D ist folgendermaßen in die LMM eingebaut:

Nk+1 = Nk + D · dk, (k = 0, 1, 2, 3, ....) . (6.25)

55


6 Die Levenberg-Marquardt-Minimierung

χ 2

Iteration

Abbildung 6.5: Konvergenzgeschwindigkeit der LMM und der LMM mit Schrittweitenparameter

D = 2 (siehe (6.25)) als Funktion der Iterationsschritte. In den ersten und in den letzten Iterationsschritten

wird die χ 2 -Funktion durch den Schrittweitenparameter besser minimiert.

Die Suchrichtung dk berechnet sich dann aus der Lösung des Gleichungssystems

(6.21).

Verschiedene Werte wurden für D eingesetzt und mit den entsprechenden Ergebnissen

aus Abbildung 6.1 verglichen. Es hat sich gezeigt, dass mit D = 2 die

Konvergenz des Verfahrens etwas verbessert werden kann. Die Ergebnisse dazu zeigt

Abbildung 6.5. Da in diesem Beispiel der Parameter λ ebenfalls in keinem Iterationsschritt

erhöht werden musste, besteht kein Unterschied zwischen den Rechenzeiten

beider Varianten.

6.7 Diskussion der Konvergenzergebnisse

Die langen Rechenzeiten der LMM entstehen hauptsächlich beim Lösen des linearen

Gleichungssystems (6.21). Da die Tumorgröße im verwendeten Patientenplan #135

ca. 20000 Rasterpunkten entspricht, besitzt die Hesse-Matrix der χ 2 -Funktion eine

Dimension von ca. 20000×20000. Diese Dimension gilt somit auch für die Koeffizientenmatrix

aus (6.21). Damit werden für die Lösung mit dem Cholesky-Verfahren ca.

1.3 · 10 12 Punktoperationen in einem Schritt der LMM erfordert. Selbst ein schneller

Rechner benötigt für die Ausführung einer solch großen Anzahl an Rechenoperationen

lange Rechenzeiten.

56


6.7 Diskussion der Konvergenzergebnisse

Im Gesamtvergleich mit dem Gradientenverfahren schneidet die LMM wesentlich

schlechter ab. Wegen den langen Rechenzeiten kann die LMM in der Bestrahlungsplanung

momentan nicht eingesetzt werden. Mit der vereinfachten LMM konnten

die Rechenzeiten zwar deutlich reduziert werden, jedoch bleiben auch diese um ein

Vielfaches höher als bei dem GRV.

Auswertungen der Hesse-Matrix haben ergeben, dass ca. 75% der Einträge aus

Nullen bestehen. Des weiteren können zusätzlich ca. 5-10% der Einträge wegen fast

verschwindender Größe vernachlässigt werden. Die restlichen Einträge sind durch

die gesamte Matrix in Clustern verteilt. Matrizen mit dieser Besetzungsstruktur

werden in der Mathematik als dünn- oder als schwachbesetzte Matrizen bezeichnet.

Zu beachten ist, dass bei diesen Matrizen sowohl die Inverse als auch die Cholesky-

Faktoren vollbesetzt sind. Im Allgemeinen kann bei direkten Verfahren zur Lösung linearer

Gleichungssysteme die Besetzungsstruktur der Koeffizientenmatrix nicht ausgenutzt

werden.

Hingegen kann die Besetzungsstruktur der Koeffizientenmatrix bei den Krylow-

Unterraum-Verfahren [Hac93, Saa03] ausgenutzt werden. Bei diesen Verfahren handelt

es sich um iterative Verfahren zur näherungsweisen Lösung von großen linearen

Gleichungssystemen mit dünnbesetzter Koeffizientenmatrix, die ausschließlich

Matrix-Vektor-Multiplikationen und Skalarprodukte berechnen. Während direkte

Verfahren O(n 3 ) Punktoperationen benötigen, werden von den Krylow-Unterraum-

Verfahren lediglich O(n) Punktoperationen ausgeführt. Diese müssen allerdings in

jedem Iterationsschritt in Kauf genommen werden. Oftmals konvergieren die Krylow-

Unterraum-Verfahren schnell. Mit der Verwendung von Vorkonditionierern kann die

Effizienz signifikant gesteigert werden. Des weiteren sind die Krylow-Unterraum-

Verfahren robust und einfach zu implementieren.

57


7 Zusammenfassung und Ausblick

Im Pilotprojekt der Gesellschaft für Schwerionenforschung (GSI) werden Tumorpatienten

mit dem Rasterscan-Verfahren bestrahlt. Die Erfolgsquoten der Therapie

sind hoch. Als Teilchensorte werden 12 C-Ionen verwendet, da diese vorteilhafte Eigenschaften

besitzen (scharfer Bragg-Peak und hohe RBW). Notwendig für eine erfolgreiche

Bestrahlung ist ein Bestrahlungsplan, der individuell für jeden Patienten

erstellt werden muss. Dafür wurde an der GSI die Bestrahlungsplanungssoftware

TRiP entwickelt. TRiP definiert im Tumorvolumen ein dreidimensionales Rastergitter,

welches sich typischerweise aus mehreren zehntausend Rasterpunkten zusammensetzt.

Im Bestrahlungsprozess wird dieses dreidimensionale Rastergitter mit dem

Kohlenstoffstrahl abgefahren.

Ein wesentlicher Bestandteil der Bestrahlungsplanung ist die Optimierung der

Teilchenfluenzen für die mehreren zehntausend Rasterpunkte. Ziel der Optimierung

ist eine homogene Dosisverteilung durch den Tumor bei möglichst hoher Schonung

des umliegenden gesunden Gewebes. Diese beiden Kriterien werden von der Mehrfelderoptimierung,

bei der alle Bestrahlungsfelder gleichzeitig optimiert werden, besser

erfüllt als von der Einzelfeldoptimierung. Die optimalen Teilchenfluenzen genügen

der Minimierung einer mehrdimensionalen Zielfunktion. Aus mathematischer Sicht

handelt es sich dabei um ein Minimum-Quadrat-Problem. Bei Berücksichtigung der

RBW ist die Zielfunktion nichtlinear in ihren freien Parametern. Somit müssen numerische

Methoden verwendet werden, um das nichtlineare Optimierungsproblem

lösen zu können.

Für die Minimierung der Zielfunktion wurden das Gradientenverfahren, das konjugierte

Gradientenverfahren und das Bortfeld-Verfahren untersucht. Die drei Verfahren

wurden in realen Patientenplänen getestet und anschließend hinsichtlich ihrer

Konvergenzeigenschaften verglichen. Dabei zeigte das Gradientenverfahren sowohl in

den Iterationsschritten als auch in den Rechenzeiten die besten Ergebnisse. Auch die

Robustheit des Verfahrens ist zufriedenstellend.

Bei einer großen Anzahl an Rasterpunkten benötigt die Minimierung mit dem

Gradientenverfahren dennoch mehrere Stunden Rechenzeit. Daher wurde mit zwei

einfachen Modifikationen untersucht, ob die Konvergenz des Gradientenverfahrens

beschleunigt werden kann. Jedoch konnte mit beiden Modifikationen keine Verbesserung

erzielt werden.

Schließlich wurde die Levenberg-Marquardt-Minimierung (LMM) ausführlich untersucht.

Mit diesem Verfahren konnten sehr gute Konvergenzergebnisse bzgl. der

Iterationsschritte beobachtet werden. Da bei der LMM lineare Gleichungssysteme

mit sehr großen Koeffizientenmatrizen gelöst werden müssen, sind die Rechenzeiten

hoch. Sie übersteigen die des Gradientenverfahrens um ein Vielfaches. Damit schnei-

58


det die LMM im Gesamtvergleich wesentlich schlechter ab. Aus diesem Grund wird

gegenwärtig das Gradientenverfahren für die Optimierung bevorzugt.

Die LMM sollte wegen den sehr guten Konvergenzeigenschaften bzgl. der Iterationsschritte

nicht verworfen werden. Die langen Rechenzeiten könnten mit einer erfolgreichen

Implementierung der angesprochenen Krylow-Unterraum-Verfahren deutlich

reduziert werden. Auch andere Varianten der Behandlung des Parameters λ könnten

zur Verbesserung der Konvergenzeigenschaften führen.

59


8 Anhang

8.1 Bestrahlungsplandaten

Die folgende Tabelle beinhaltet die in dieser Arbeit verwendeten Bestrahlungsplandaten.

Der Speicher in der letzten Spalte bezieht sich auf den Speicheraufwand der

Dosis-Korrelationsmatrizen bei der Bestrahlungsplanung mit MFO.

Patientenpl. # Targetvoxel OAR-Voxel Rasterpunkte Felder Speicher [MB]

135 20000 4000 20000 2 440

240 37000 16000 32000 2 1600

268 44000 13000 47000 2 1300

290 47000 11000 48000 2 1200

305 57000 9000 58000 3 3000

319 44000 12000 45000 2 1300

8.2 Gradient und Hesse-Matrix bei Optimierung

der physikalischen Dosis

Optimierung der physikalischen Dosis erfordert das Einsetzen von Gleichung (2.2)

in die χ2-Funktion: χ 2 ( N) =


Dpre − c T i 2 N

∆D

i∈Target

2 pre


Dmax − c T i 2 N

+

i∈OAR

∆D 2 max

Der Gradient und die Hesse-Matrix sind dann:

∇χ 2 ( N) = −2


60

− 2

i∈Target

i∈OAR


Dpre − c T i N

∆D 2 pre

Dmax − c T i N

∆D 2 max



· Θ c T i

N − Dmax


· ci


· ci · Θ c T i

N − Dmax

(8.1)

(8.2)


8.3 Exakte Schrittweitenbestimmung bei Optimierung der physikalischen Dosis

∇ 2 χ 2 ( N) = 2

1

∆D

i∈Target

2 pre

+ 2

1

∆D

i∈OAR

2 max

· cic T i

· cic T i



· Θ c T i

N − Dmax

(8.3)

Die Heaviside-Funktion Θ wird bei den Ableitungen als konstanter Faktor angesehen

(siehe Abschnitt 2.3).

8.3 Exakte Schrittweitenbestimmung bei

Optimierung der physikalischen Dosis

Die Exakte Schrittweite [Alt02], die bei dem GRV und KGV (Abschnitt 3.2 und 3.3)

zur Schrittweitensteuerung verwendet wird, kann bei Optimierung der physikalischen

Dosis analytisch berechnet werden. Dafür muss, wegen der Heaviside-Funktion, der

OAR-Term in der χ2-Funktion vernachlässigt werden.

Mathematisch gesehen wird die χ2-Funktion in Abstiegsrichtung d mit dem Schrittweitenfaktor

µ parametrisiert:

χ 2 ( N + µ d) =


Dpre − c T i · ( N + µ 2 d)

. (8.4)

i∈Target

∆D 2 pre

Die Exakte Schrittweite löst dann das folgende eindimensionale Optimierungsproblem:

dχ2 ( N + µ d)

= −2




Dpre − c T i · ( N + µ

d)

· c T i d = 0 . (8.5)

i∈Target

Eine erste Ausmultiplikation im Zähler ergibt



i∈Target

Dpre − c T i N − c T i µ d

∆D 2 pre

∆D 2 pre


· c T i d = 0 . (8.6)

Nach einer weiteren Ausmultiplikation und anschließender Zerlegung der Summe

folgt



Dpre − c T i

N · c T i d

− µ


c T i 2 d

= 0 (8.7)

i∈Target

∆D 2 pre

i∈Target

∆D 2 pre

und schließlich kann nach dem µ eindeutig umgestellt werden:


µ = µPhys = ⎝


Dpre − c T i

N · c T i ⎞ ⎛

d

⎠ ⎜ c

/ ⎝

T i d

i∈Target

∆D 2 pre

i∈Target

2

∆D 2 pre



⎠ . (8.8)

Bei den Verfahren muss die Schrittweite µ in jedem Iterationsschritt neu berechnet

werden.

61


8 Anhang

8.4 Anzahl erforderlicher Punktoperationen zur

Lösung eines linearen Gleichungssystems

Die folgende Tabelle beinhaltet die Anzahl der Punktoperationen (Multiplikationen,

Divisionen), die erforderlich sind, um ein lineares Gleichungssystem mit n Gleichungen

und n Unbekannten nach dem entsprechenden Verfahren zu lösen. Daten aus

[Sch93, EMR96].

Verfahren Anzahl der Punktoperationen

Cholesky-Verfahren

1

6n3 + 3

2n2 + 1

3n Gauß Algorithmus

1

3n3 + n2 − 1

3n Gauß-Jordan-Verfahren

1

2n3 + n2 + 1

2n ∗ Lösung über Matrixinversion 4

3n3 − 1

3n ∗ Mit Lösung über Matrixinversion ist die Lösung des linearen Gleichungssystems

über

gemeint.

A · x = b , mit A ∈ R n×n , x ∈ R n und b ∈ R n

8.5 Das Cholesky-Verfahren

(8.9)

x = A −1 · b (8.10)

Gegeben ist das Gleichungssystem aus (8.9) mit einer symmetrischen und positiv

definiten 1 Matrix A. Beim Cholesky-Verfahren wird die Matrix A in eine untere

Dreiecksmatrix L zerlegt, die die folgende Eigenschaft besitzt:

L · L T = A . (8.11)

L und L T werden als Cholesky-Faktoren bezeichnet. Liegen diese vor, dann wird das

Gleichungssystem erst durch Vorwärtssubstitution

und anschließend durch Rückwärtssubstitution

1 Bei einer positiv definiten Matrix sind alle Eigenwerte > 0.

62

L · y = b (8.12)

L T · x = y (8.13)


8.5 Das Cholesky-Verfahren

gelöst. Die genaue Berechnung von L ist folgendermaßen:

Lii =



i−1

Aii −


, (8.14)

Lji = 1

Lii


k=1


L 2 ik

i−1

Aij − Lik · Ljk

k=1


, j = i + 1, i + 2, ..., n , (8.15)

mit i als Zeilen- und j als Spaltenindex der Matrix. Aij und Lij sind die Matrixelemente

zum entsprechenden Indexpaar. Die Berechnung von L erfolgt mit

i = 1, 2, . . . , n.

Ist die Matrix A nicht positiv definit, so können die Rechenoperationen in (8.14)

oder (8.15) nicht ausgeführt werden. Damit eignet sich das Cholesky-Verfahren auch

zur Überprüfung der Matrix A auf positive Definitheit. Das Cholesky-Verfahren ist

numerisch stabil und deshalb muss eine Pivotisierung nicht berücksichtigt werden.

Bei größerem n arbeitet das Cholesky-Verfahren ca. doppelt so schnell wie der Gauß-

Algorithmus (siehe Tabelle in Abschnitt 8.4).

63


Literaturverzeichnis

[Alt02] Walter Alt. Nichtlineare Optimierung. Vieweg Verlag, 1. Auflage, 2002.

[B + 90] Thomas Bortfeld et al. Methods of Image Reconstruction from Projections

Applied to Conformation Radiotherapy. Physics in Medicine and

Biology, 35(10):1423–1434, 1990.

[B + 92] Thomas Bortfeld et al. Three-Dimensional Solution of the Inverse

Problem in Conformation Radiotherapy. Advanced Radiation Therapy

Tumor Response Monitoring and Treatment Planning, Seiten 503–508,

1992.

[Ber06] Christoph Bert. Bestrahlungsplanung für bewegte Zielvolumina in der

Tumortherapie mit gescanntem Kohlenstoffstrahl. Dissertation, Technische

Universität Darmstadt, 2006.

[Bet30] Hans Bethe. Zur Theorie des Durchgangs schneller Korpuskularstrahlung

durch Materie. Annalen der Physik, 5(5):325–400, 1930.

[Blo33] Felix Bloch. Zur Bremsung rasch bewegter Teilchen beim Durchgang

durch Materie. Annalen der Physik, 5(16):285–321, 1933.

[Bra99] Siegmund Brandt. Datenanalyse. Spektrum Akademischer Verlag,

4. Auflage, 1999.

[Deu08a] Deutsche Hirntumorhilfe. URL http://www.hirntumorhilfe.de, 2008.

[Deu08b] Deutsche Krebshilfe. URL http://www.krebshilfe.de/krebszahlen, 2008.

[EMR96] Gisela Engeln-Müllges und Fritz Reutter. Numerik-Algorithmen. VDI

Verlag, 8. Auflage, 1996.

[F + 92] Brian P. Flannery et al. Numerical Recipes in C - The Art of Scientific

Computing. Cambridge University Press, 2. Auflage, 1992.

[G + 07] Alexander Gemmel et al. Biological Dose Optimization with Multiple

Ion Fields. Eingereicht bei Physics in Medicine and Biology, 2007.

[GM06] Christian Gerthsen und Dieter Meschede. Gerthsen Physik. Springer

Verlag, 23. Auflage, 2006.

65


Literaturverzeichnis

[Grö04] Sven Oliver Grözinger. Volume Conformal Irradiation of Moving Target

Volumes with Scanned Ion Beams. Dissertation, Technische Universität

Darmstadt, 2004.

[Gro01] Intensity Modulated Radiation Therapy Collaborative Working Group.

Intensity-Modulated Radiotherapy: Current Status and Issues of Interest.

International Journal of Radiation Oncology*Biology*Physics,

51(4):880–914, 2001.

[GT97] Christian Großmann und Johannes Terno. Numerik der Optimierung.

B.G. Teubner Stuttgart, 2. Auflage, 1997.

[H + 93] Thomas Haberer et al. Magnetic Scanning System for Heavy Ion Therapy.

Nuclear Instruments and Methods in Physics Research, A330:296–

305, 1993.

[Hac93] Wolfgang Hackbusch. Iterative Lösung großer schwachbesetzter Gleichungssysteme.

B.G. Teubner Stuttgart, 2. Auflage, 1993.

[HB97] Thomas Herrmann und Michael Baumann. Klinische Strahlenbiologie -

kurz und bündig. Gustav Fischer Verlag, 3. Auflage, 1997.

[J + 01] Oliver Jäkel et al. Treatment Planning for Heavy-Ion Radiotherapy: Clinical

Implementation and Application. Physics in Medicine and Biology,

46(4):1101–1116, 2001.

[K + 00] Michael Krämer et al. Treatment Planning for Heavy-Ion Radiotherapy:

Physical Beam Model and Dose Optimization. Physics in Medicine and

Biology, 45(11):3299–3317, 2000.

[KK94] Michael Krämer und Gerhard Kraft. Calculations of Heavy-Ion Track

Structure. Radiation and Environmental Biophysics, 33(2):91–109, 1994.

[KKWS03] Michael Krämer, Wilma Kraft-Weyrather und Michael Scholz. The Increased

Biological Effectiveness of Heavy Charged Particles: From Radiobiology

to Treatment Planning. Technology in Cancer Research and

Treatment, 2(5):427–436, 2003.

[KP88] Hanno Krieger und Wolfgang Petzold. Strahlenphysik, Dosimetrie und

Strahlenschutz. B.G. Teubner Stuttgart, 1988. Band 1 und 2.

[Krä01] Michael Krämer. Treatment Planning for Heavy-Ion Radiotherapy: Biological

Optimization of Multiple Beam Ports. Journal of Radiation Research,

42(1):39–46, 2001.

[Krä07] Michael Krämer. Treatment Planning for the Carbon Ion Radiotherapy.

Report, Gesellschaft für Schwerionenforschung mbH, 2007.

66


Literaturverzeichnis

[Kra00] Gerhard Kraft. Tumor Therapy with Heavy Charged Particles. Progress

in Particle and Nuclear Physics, 45:473–544, 2000.

[Kra08] Gerhard Kraft. Tumortherapie mit schweren Ionen. Gesellschaft für

Schwerionenforschung mbH, 2. Auflage, 2008.

[KS00] Michael Krämer und Michael Scholz. Treatment Planning for Heavy-Ion

Radiotherapy: Calculation and Optimization of Biologically Effective

Dose. Physics in Medicine and Biology, 45(11):3319–3330, 2000.

[KS06] Michael Krämer und Michael Scholz. Rapid Calculation of Biological Effects

in Ion Radiotherapy. Physics in Medicine and Biology, 51(8):1959–

1970, 2006.

[Lev44] Kenneth Levenberg. A Method for the Solution of Certain Non-Linear

Problems in Least Squares. The Quarterly of Applied Mathematics,

2:164–168, 1944.

[Mar63] Donald W. Marquardt. An Algorithm for Least-Squares Estimation of

Nonlinear Parameters. Journal of the Society for Industrial and Applied

Mathematics, 11(2):431–441, 1963.

[Pag03] Harald Paganetti. Significance and Implementation of RBE Variations in

Proton Beam Therapy. Technology in Cancer Research and Treatment,

2(5):413–426, 2003.

[S + 05] Alexander Schmidt et al. Multiple Field Optimization and Biological

Dosimetry of a 2D-Treatment Plan. Report, Gesellschaft für Schwerionenforschung

mbH, 2005.

[Saa03] Yousef Saad. Iterative Methods for Sparse Linear Systems. Society for

Industrial and Applied Mathematics, 2. Auflage, 2003.

[Sch93] Hans Rudolf Schwarz. Numerische Mathematik. B.G. Teubner Stuttgart,

3. Auflage, 1993.

[Sch03] Michael Scholz. Effects of Ion Radiation on Cells and Tissues. Advances

in Polymer Science, 162:95–155, 2003.

[Sch06] Alexander Schmidt. Examinations on Multiple Field Optimization in

Ion Therapy. Diplomarbeit, TU Darmstadt, 2006.

[SE + 04] Daniela Schulz-Ertner et al. Results of Carbon Ion Radiotherapy in 152

Patients. International Journal of Radiation Oncology*Biology*Physics,

58(2):631–640, 2004.

[vN + 06] Cläre von Neubeck et al. A Multidimensional System for Biological

Dosimetry. Report, Gesellschaft für Schwerionenforschung mbH, 2006.

67


Literaturverzeichnis

[Web96] Uli Weber. Volumenkonforme Bestrahlung mit Kohlenstoff-Ionen zur

Vorbereitung einer Strahlentherapie. Dissertation, Universität Kassel,

1996.

[Wil46] R. R. Wilson. Radiological Use of Fast Protons. Radiology, 47:487–491,

1946.

68


Danksagung

An dieser Stelle möchte ich mich bei allen bedanken, die mich beim Erstellen dieser

Diplomarbeit unterstützt haben.

Als erstes möchte ich mich bei Prof. Dr. Jürgen Gross für die hervorragende

Betreuung von Seiten der Hochschule Darmstadt bedanken. Die vielen telefonischen

Gespräche haben stets meine Arbeit vorangetrieben. Des weiteren bedanke ich mich

für die Möglichkeit der Durchführung einer externen Diplomarbeit.

Dr. Michael Krämer danke ich für die Vergabe des interessanten Themas und

für die Betreuung an der GSI. Seine Tür stand immer offen, um meine fachlichen

Fragen zu beantworten.

Besonders bedanken möchte ich mich bei Dipl. Phys. Alexander Gemmel für die

intensive Einarbeitung in das Thema. Mit allen Anliegen konnte ich mich immer an

ihn wenden und die zahlreichen Diskussionen haben entscheidend zu dieser Arbeit

beigetragen.

Vielen Dank an Prof. Dr. Michael Gubitz, der zur Abteilung Biophysik den Kontakt

aufnahm und mich noch als Praktikanten vermittelte. Ohne ihn wäre diese

Arbeit wahrscheinlich nicht zustande gekommen.

Prof. Dr. Gerhard Kraft danke ich für die Aufnahme in seine Abteilung.

Mein weiterer Dank geht an meine Zimmerkollegen Cläre, Jana, Frank und Peter

für die angenehme Zeit. Es war immer sehr unterhaltsam und abwechslungsreich mit

euch.

Der gesamten Biopysik-Gruppe danke ich für die großartige Arbeitsatmosphäre

und die vielen Kuchen bzw. Torten, die es regelmäßig gab.

Mein größter Dank gilt meinen Eltern, die mir überhaupt das Studium der Mathematik

ermöglicht haben.

69


Erklärung

Hiermit versichere ich, die vorliegende Diplomarbeit ohne Hilfe Dritter nur mit den

angegebenen Quellen und Hilfsmitteln angefertigt zu haben. Alle Stellen, die aus

den Quellen entnommen wurden, sind als solche kenntlich gemacht worden. Diese

Arbeit hat in gleicher Form noch keiner Prüfungsbehörde vorgelegen.

Darmstadt, den 1. Dezember 2008

(Michael Horcicka)

Weitere Magazine dieses Users
Ähnliche Magazine