Die Permanente im thermodynamischen Viel-Bosonen-Pfadintegral ...
Die Permanente im thermodynamischen Viel-Bosonen-Pfadintegral ...
Die Permanente im thermodynamischen Viel-Bosonen-Pfadintegral ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
CBADE<br />
<strong>Die</strong> <strong>Permanente</strong> <strong>im</strong> <strong>thermodynamischen</strong><br />
<strong>Viel</strong>-<strong>Bosonen</strong>-<strong>Pfadintegral</strong><br />
sowie<br />
die Best<strong>im</strong>mung von Phasenübergängen aus<br />
exper<strong>im</strong>entellen Streuspektren atomarer Cluster<br />
Diplomarbeit <strong>im</strong><br />
Studiengang Diplom-Physik<br />
vorgelegt von:<br />
Habbo Hait Heinze<br />
Betreuender Gutachter:<br />
Zweiter Gutachter:<br />
Prof. Dr. Dr. Eberhard R. Hilf<br />
Prof. Dr. Alexander Rauh<br />
Oldenburg, 16. Dezember 1998
Inhaltsverzeichnis<br />
Vorwort 1<br />
I <strong>Die</strong> <strong>Permanente</strong> <strong>im</strong> <strong>thermodynamischen</strong> <strong>Viel</strong>–<strong>Bosonen</strong>–<strong>Pfadintegral</strong><br />
2<br />
1 Einleitung 3<br />
2 Das thermodynamische <strong>Pfadintegral</strong> 5<br />
2.1 <strong>Die</strong> physikalische Ausgangssituation ................ 5<br />
2.2 Dasdiskretisierte<strong>Pfadintegral</strong>inderOrtsdarstellung ....... 8<br />
2.3 Berechnung thermodynamischer Observablen ........... 13<br />
2.4 Das<strong>Pfadintegral</strong>-Monte-CarloVerfahren(PIMC) ......... 14<br />
2.5 ImportanceSamplingofPermutations ............... 16<br />
2.6 Warum ist die Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> interessant?<br />
............................... 17<br />
3 Mögliche Berechnungsverfahren für die <strong>Permanente</strong> 18<br />
3.1 Mathematische Grundlagen der <strong>Permanente</strong> ............ 18<br />
3.2 Allgemeine Berechnungsverfahren ................. 21<br />
3.2.1 <strong>Die</strong> Definition und die Laplace–Entwicklung . ...... 21<br />
3.2.2 DasRyser–Verfahren.................... 22<br />
3.2.3 GraphentheoretischeVerfahren............... 24<br />
3.2.4 Das KKLLL-Näherungsverfahren . ............ 27<br />
3.3 Eigene Versuche zur Berechnung der <strong>Permanente</strong> . . . ...... 29<br />
3.3.1 Eigenschaftender<strong>Permanente</strong><strong>im</strong><strong>Pfadintegral</strong> ...... 29<br />
3.3.2 Mathematisch motivierter Näherungsversuch . ...... 31<br />
3.3.3 Physikalisch motivierter Näherungsversuch . . ...... 34<br />
3.3.4 AndereVersuche ...................... 36<br />
4 Vergleich der verschiedenen Berechnungsverfahren 37<br />
5 Zusammenfassung 41<br />
I
INHALTSVERZEICHNIS<br />
II<br />
II Best<strong>im</strong>mung von Phasenübergängen aus exper<strong>im</strong>entellen Streuspektren<br />
atomarer Cluster 42<br />
6 Einleitung 43<br />
7 <strong>Die</strong>Methode 45<br />
7.1 Der Zusammenhang von Paarverteilungsfunktion und Streuspektrum 45<br />
7.2 Hypervirialtheoreme ........................ 50<br />
7.2.1 DasklassischeHypervirialtheorem............. 51<br />
7.2.2 DasquantenmechanischeHypervirialtheorem....... 52<br />
7.3 DasquantenstatistischeModell................... 53<br />
7.3.1 Modellierung des Systems ................. 53<br />
7.3.2 Separation von Schwerpunkts– und Relativbewegung . . . 54<br />
7.3.3 Das richtige“ Hypervirialtheorem für dieses System . . . 55<br />
”<br />
7.3.4 Berechnung der Energieerwartungswerte über die Paarkorrelationsfunktion<br />
...................... 58<br />
7.4 DerklassischeGrenzfall ...................... 60<br />
7.5 Verteilungen verschiedener Clustergrößen ............. 61<br />
8 Numerische S<strong>im</strong>ulationen als ”<br />
ideale Exper<strong>im</strong>ente“ 62<br />
9 Ergebnisse 65<br />
9.1 Theoretische Streuspektren und Paarkorrelationsfunktionen . . . . 65<br />
9.2 Best<strong>im</strong>mung von Erwartungswerten ................ 70<br />
9.3 Kalorische Zustandsgleichungen . ................. 74<br />
9.4 Best<strong>im</strong>mung der spezifischen Wärme ............... 79<br />
10 Zusammenfassung und Ausblick 83<br />
A Grundlagen von Monte–Carlo–Verfahren 85<br />
A.1 Zufallsgrößen ............................ 85<br />
A.2 MarkoffscheKetten......................... 87<br />
A.2.1 DerMetropolisAlgorithmus................ 89<br />
A.2.2 Das heatbath“–Verfahren................. ”<br />
91<br />
B Preprint 92
Abbildungsverzeichnis<br />
4.1 Vergleich des Rechenaufwands für das Ryser–Verfahren und das<br />
KKLLL–Verfahren . . ....................... 38<br />
4.2 Energien be<strong>im</strong> eind<strong>im</strong>ensionalen bosonischen harmonischen Oszillator<br />
für n =4 .......................... 39<br />
9.1 Streuspektrum und Paarkorrelationsfunktion für Ar 13 – und Ar 14 –<br />
Cluster................................ 67<br />
9.2 Streuspektrum und Paarkorrelationsfunktion für Ar 55 – und Ar 56 –<br />
Cluster................................ 68<br />
9.3 Streuspektrum und Paarkorrelationsfunktion für Ne 13 –Cluster . . 69<br />
9.4 Beitrag der gemessenen StreuintensitätzurEnergie ........ 71<br />
9.5 Wechselwirkungspotentiale fürArgon ............... 73<br />
9.6 Kalorische Zustandsgleichungen für klassische Argon–Clustern . 75<br />
9.7 Absoluter Fehler bei der Temperaturbest<strong>im</strong>mung von Argon–Clustern 77<br />
9.8 Klassische und quantenmechanische Zustandsgleichungen von Ne 13 –<br />
Clustern............................... 78<br />
9.9 Klassische und quantenmechanische kinetische Energie von Ne 13 –<br />
Clustern............................... 80<br />
9.10 Klassisch und quantenmechanisch berechnete Wärmekapazität für<br />
Ne 13 –Cluster ............................ 81<br />
III
Tabellenverzeichnis<br />
3.1 Anzahl der Nullelemente oberhalb der Diagonalen in Abhängigkeit<br />
von der Matrixgröße füreineHessenberg-Matrix. ......... 35<br />
8.1 Lennard–Jones–Parameter und Atomgewichte der Edelgase Argon<br />
undNeon .............................. 63<br />
IV
Vorwort<br />
<strong>Die</strong> vorliegende Arbeit wurde in der Arbeitsgruppe ”<br />
Theorie III: Theoretische Cluster–<br />
und Schwerionenphysik“ der Carl von Ossietzky Universität Oldenburg ausgeführt.<br />
Sie enthält die Ergebnisse von zwei voneinander unabhängigen Fragestellungen,<br />
die ich <strong>im</strong> Laufe des vergangenen Jahres bearbeitet habe.<br />
Dem ersten Teil der Arbeit lag die Frage zu Grunde, wie sich der hohe numerische<br />
Aufwand bei der Berechnung thermodynamischer Eigenschaften von <strong>Viel</strong>–<br />
<strong>Bosonen</strong>–Systemen in der <strong>Pfadintegral</strong>methode reduzieren läßt. <strong>Die</strong>ser hohe Rechenaufwand<br />
läßt sich mathematisch auf einen algebraischen Ausdruck — die <strong>Permanente</strong><br />
einer best<strong>im</strong>mten Matrix — zurückführen. <strong>Die</strong> Grundidee zu diesem Teil<br />
der Arbeit bestand nun darin, die mathematische Spezialliteratur zu diesem relativ<br />
unbekannten algebraischen Objekt zu sichten, um so den Weg für eine effiziente<br />
numerische Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> zu weisen.<br />
Das <strong>im</strong> zweiten Teil dieser Arbeit behandelte Thema versucht, Erkenntnisse<br />
aus der theoretischen Clusterphysik mit exper<strong>im</strong>entellen Resultaten zu verknüpfen.<br />
Es wurde ein neuer Ansatz entwickelt, wie sich aus in Streuexper<strong>im</strong>enten an atomaren<br />
Clustern gemessenen Intensitätsverteilungen die Energie und Temperatur der<br />
Cluster best<strong>im</strong>men lassen. <strong>Die</strong> Kenntnis der Energie als Funktion der Temperatur<br />
ermöglicht es wiederum, Aufschluß über das Phasenverhalten der untersuchten<br />
Cluster zu gewinnen.<br />
Oldenburg, den 16. Dezember 1998<br />
Habbo Hait Heinze<br />
1
Teil I<br />
<strong>Die</strong> <strong>Permanente</strong> <strong>im</strong><br />
<strong>thermodynamischen</strong><br />
<strong>Viel</strong>–<strong>Bosonen</strong>–<strong>Pfadintegral</strong><br />
2
Kapitel 1<br />
Einleitung<br />
In den letzten zehn Jahre hat sich gezeigt, daß die zuerst von FEYNMAN eingeführten<br />
thermodynamische <strong>Pfadintegral</strong>e sehr gut dafür geeignet sind, die <strong>thermodynamischen</strong><br />
Eigenschaften von mesoskopischen (z.B. Cluster [?, ?]) bis hin zu makroskopischen<br />
<strong>Viel</strong>teilchensystemen (z.B. Gase/Flüssigkeiten [?]) zu behandeln.<br />
Einerseits verhalten sich zahlreiche solcher <strong>Viel</strong>teilchensysteme näherungsweise<br />
klassisch. Andererseits werden in einigen Systemen gerade durch Quanteneffekte<br />
interessante physikalische Erscheinungen hervorgerufen, von denen die<br />
Suprafluidität von flüssigem 4 He das prominenteste Beispiel sein dürfte.<br />
Hier bietet der thermodynamische <strong>Pfadintegral</strong>formalismus große Vorteile, denn<br />
er ermöglicht eine quantenstatistische Beschreibung von <strong>Viel</strong>teilchensystemen in<br />
einer Integralform, die sich auf natürliche und besonders einfache Weise auf die<br />
klassische kanonische Beschreibung reduzieren läßt. Quantenstatistische thermodynamische<br />
Größen lassen sich dann wie be<strong>im</strong> klassisch–kanonischen Ensemble<br />
direkt über Monte–Carlo–S<strong>im</strong>ulationen berechnen, ohne daß z.B. mit großem numerischen<br />
Aufwand Energieeigenfunktionen best<strong>im</strong>mt werden müssen. Ein weiterer<br />
Vorteil ist, daß es für die <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>e ein solides mathematisches<br />
Fundament gibt — ganz <strong>im</strong> Gegensatz zu den quantenmechanischen<br />
<strong>Pfadintegral</strong>en.<br />
Gerade die <strong>Pfadintegral</strong>behandlung der interessanten physikalischen Effekte,<br />
die durch die quantenmechanische Ununterscheidbarkeit von einzelnen Teilchen<br />
hervorgerufen werden, erscheint vielversprechend [?]. Das <strong>Pfadintegral</strong> eines solchen<br />
Systems aus <strong>Bosonen</strong> oder Fermionen läßt sich ohne weiteres angeben, das<br />
einzige Problem ist zur Zeit der große numerische Rechenaufwand.<br />
<strong>Die</strong>ser große numerische Aufwand läßt sich direkt auf die für <strong>Bosonen</strong> (bzw.<br />
Fermionen) notwendige Symmetrisierung (bzw. Antisymmetrisierung) zurückführen,<br />
die sich <strong>im</strong> <strong>Pfadintegral</strong> in Form von Permutationssummen über best<strong>im</strong>mte<br />
algebraische Ausdrücke äußert.<br />
Handelt es sich bei den N Teilchen um Fermionen, so läßt sich dieser algebraische<br />
Ausdruck als Determinante einer best<strong>im</strong>mten N N Matrix A schreiben.<br />
Bei der Determinante ist der Berechnungsaufwand i.a. von der Ordnung O(N 3 ),<br />
3
KAPITEL 1. EINLEITUNG 4<br />
es gibt sogar Hinweise darauf, daß er in diesem speziellen Fall von der Ordnung<br />
O(N 2 ) ist [?].<br />
Handelt es sich dagegen bei den Teilchen um ein System aus N <strong>Bosonen</strong>, so<br />
wird der algebraische Ausdruck zur <strong>Permanente</strong> der Matrix A. <strong>Die</strong> <strong>Permanente</strong> ist<br />
genauso wie die Determinante ein wohldefiniertes Objekt der multilinearen Algebra<br />
und die <strong>Permanente</strong> einer Matrix ergibt sich aus der Determinante derselben<br />
Matrix durch Umwandeln aller ”<br />
-“–Zeichen in ”<br />
+“–Zeichen.<br />
Das eigentliche Problem besteht nun darin, daß der Aufwand zur Berechnung<br />
einer <strong>Permanente</strong> <strong>im</strong> allgemeinen exponentiell mit der Matrixgröße N wächst und<br />
bisher kein Verfahren gefunden wurde, daß eine effiziente Berechnung der sehr<br />
speziellen, <strong>im</strong> bosonischen <strong>Pfadintegral</strong> auftauchenden <strong>Permanente</strong> ermöglicht.<br />
Aus diesem Grund wird in den bisher veröffentlichten Arbeiten zu <strong>Pfadintegral</strong>–<br />
Monte–Carlo–S<strong>im</strong>ulationen von bosonischen Systemen das Problem der <strong>Permanente</strong>nberechnung<br />
durch das sogenannte Importance Sampling of Permutations<br />
Verfahren umgangen. Bei dieser Methode werden die einzelnen Teilchenpermutationen<br />
als zusätzliche Freiheitsgrade des Systems aufgefaßt, deren Auswirkung<br />
durch ein erweitertes Monte–Carlo–Verfahren berücksichtigt werden kann.<br />
Mit einem solchen Verfahren wurden z.B. von CEPERLEY ET. AL. [?, ?, ?]<br />
erfolgreich die <strong>thermodynamischen</strong> und strukturellen Eigenschaften von 4 He <strong>im</strong><br />
Rahmen der exper<strong>im</strong>entellen Meßunsicherheiten berechnet. Allerdings gaben die<br />
Autoren an, daß der größte Zeitfaktor auch be<strong>im</strong> ”<br />
Importance Sampling of Permutations“<br />
<strong>im</strong>mer noch die Berechnung der Permutationen ist.<br />
Offensichtlich würde sich die Berechnung bosonischer Systeme stark vereinfachen,<br />
wenn ein Verfahren zur direkten Berechnung der <strong>Permanente</strong> gefunden<br />
würde, das einen geringeren Rechenaufwand als das ”<br />
Importance Sampling of Permutations“<br />
benötigt.<br />
<strong>Die</strong> Aufgabenstellung, die diesem Teil der Diplomarbeit zugrunde liegt, war,<br />
die mathematische Spezialliteratur zur Theorie der <strong>Permanente</strong>n zu sichten, die für<br />
die Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> interessanten Resultate allgemeinverständlich<br />
darzustellen und einen Weg aufzuzeigen, wie sich die <strong>Permanente</strong> mit<br />
diesen Resultaten effizienter berechnen läßt.<br />
Im weiteren Verlauf gliedert sich Teil I der Diplomarbeit wie folgt: In Kapitel<br />
2 wird der Formalismus der <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>e vorgestellt und<br />
die Fragestellung der Arbeit präzisiert. In Kapitel 3 wird die <strong>Permanente</strong> als mathematisches<br />
Objekt vorgestellt und es werden verschiedene allgemeine und spezielle<br />
Ansätze zur Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> diskutiert.<br />
Abschließend erfolgt einer Analyse des Laufzeitverhaltens der vielversprechensten<br />
Berechnungsverfahren und es werden aus der diskutierten Fragestellung Vorschläge<br />
für ein weiteres Vorgehen gemacht.
Kapitel 2<br />
Das thermodynamische<br />
<strong>Pfadintegral</strong><br />
In Kapitel 1 wurde die Fragestellung für den ersten Teil dieser Arbeit notwendigerweise<br />
nur angedeutet. Um zu einer präziseren Formulierung zu gelangen, müssen<br />
zuerst die dafür nötigen Grundlagen des <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>formalismus<br />
zur Verfügung gestellt werden.<br />
Zunächst wird erläutert, wie sich nach FEYNMAN die statistische Dichtematrix<br />
eines quantenmechanischen <strong>Viel</strong>teilchensystems durch ein thermodynamisches <strong>Pfadintegral</strong><br />
beschreiben läßt.<br />
Für dieses abstrakte <strong>Pfadintegral</strong> wird dann eine diskretisierte Darstellung hergeleitet<br />
und es wird gezeigt, wie diese Darstellung prinzipiell eine numerische Berechnung<br />
von <strong>thermodynamischen</strong> Observablen über Monte–Carlo–S<strong>im</strong>ulationen<br />
ermöglicht.<br />
Weiter wird aufgezeigt, daß in <strong>Viel</strong>–<strong>Bosonen</strong>–Systemen die vollständige Symmetrisierung<br />
der Dichtematrix Teilchenpermutationen erzwingt, die in den numerischen<br />
S<strong>im</strong>ulationen den größten Rechenaufwand erfordern und es werden die beiden<br />
prinzipiell möglichen Strategien zur Berechnung dieser Permutationen vorgestellt,<br />
nämlich (a) durch Berechnung der <strong>Permanente</strong> und (b) durch das sogenannte<br />
Importance Sampling of Permutations“.<br />
”<br />
Schließlich wird noch einmal auf die Fragestellung dieses Teils der Arbeit eingegangen.<br />
2.1 <strong>Die</strong> physikalische Ausgangssituation<br />
Betrachten wir ein System aus N spinpolarisierten Teilchen (<strong>Bosonen</strong> oder Fermionen),<br />
das durch einen Hamiltonoperator der Form<br />
^H(^p 1 ;::: ; ^p N ; ^r 1 ;::: ; ^r N )=<br />
NX<br />
i=1<br />
^p 2 i<br />
2m i<br />
+ V (^r 1 ;::: ;^r N ) (2.1)<br />
5
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 6<br />
charakterisiert sein soll. Befindet sich dieses System <strong>im</strong> thermischen Gleichgewicht<br />
mit einem Wärmebad der Temperatur T ,soläßt es sich quantenstatistisch<br />
durch die kanonische Gesamtheit beschreiben. Der statistische Erwartungswert einer<br />
beliebigen Observablen ^O ist dann vollständig durch den Dichteoperator ^ und<br />
die Zustandssumme Z best<strong>im</strong>mt,<br />
die <strong>im</strong> kanonischen Ensemble definiert sind als<br />
hOi = 1 Z Tr( ^O ^) ; (2.2)<br />
, ^H<br />
^ = e<br />
, ^H<br />
Z = Tr e<br />
; (2.3)<br />
: (2.4)<br />
<strong>Die</strong> Kenntnis dieser beiden Größen genügt also, um prinzipiell alle <strong>thermodynamischen</strong><br />
Eigenschaften des Systems berechnen zu können.<br />
In der Ortsdarstellung ergibt sich aus dem Dichteoperator ^ die vollständig<br />
symmetrisierte (antisymmetrisierte) Dichtematrix für Bose-Einstein (bzw. Fermi-<br />
Dirac) Statistik durch die Summation über alle Permutationen:<br />
(~r 1 00 ;::: ;~r N<br />
00 ; ~r1 0 ;::: ;~r N<br />
0 ) =<br />
X<br />
1<br />
(1) P hP~r 00 1 ;::: ;P~r 00 N j ^ j ~r 0 1 ;::: ;~r 0 N i ; (2.5)<br />
N !<br />
P 2S N<br />
wobei der Faktor (1) P für <strong>Bosonen</strong> den Wert +1 und für Fermionen den Wert<br />
+1 für gerade und ,1 für ungerade Permutationen annehmen soll.<br />
<strong>Die</strong> formale Ähnlichkeit der N–Teilchen–Dichtematrix mit dem Kern<br />
<br />
K(x 2 ;t 2 jx 1 ;t 1 )=hx 2 j exp , i ^H(t 2 , t 1 ) j x 1 i (2.6)<br />
~<br />
des quantenmechanischen Zeitentwicklungsoperators kann nach FEYNMAN [?, ?]<br />
genutzt werden, um in Analogie zur Darstellung des Zeitentwicklungsoperators<br />
durch ein quantenmechanischen <strong>Pfadintegral</strong> ebenso die N–Teilchen–Dichtematrix<br />
durch ein <strong>Pfadintegral</strong> auszudrücken.<br />
Mathematisch geschieht dies durch eine analytische Fortsetzung des quantenmechanischen<br />
Zeitentwicklungsoperators zu <strong>im</strong>aginären Zeiten t = ,i~, indem<br />
in den Vierervektoren (t; ~r) der Minkowski–Raumzeit die Zeitkoordinate t um<br />
einen Winkel =2 gedreht wird (WICK–Rotation), wodurch ein vierd<strong>im</strong>ensionaler<br />
Raum (~r; = ~) mit einer euklidischen Metrik entsteht.<br />
An Stelle des quantenmechanischen <strong>Pfadintegral</strong>s mit seinem <strong>im</strong>aginären, unendlich<br />
rasch oszillierenden Exponenten tritt für die N–Teilchen–Dichtematrix so
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 7<br />
das rein reelle, exponentiell gedämpfte thermodynamische <strong>Pfadintegral</strong>:<br />
(~r 00 00 1 ;::: ;~r N ; 0 0 ~r1 ;::: ;~r N ) =<br />
1 X Z Z<br />
(1) P D~r 1 :::<br />
N !<br />
P 2S N<br />
~r1 0 ;P~r1 00<br />
exp<br />
"<br />
, 1 ~<br />
Z ~<br />
0<br />
d<br />
1<br />
2<br />
NX<br />
i=1<br />
~r N<br />
0;P~r N<br />
00<br />
m i<br />
d<br />
d ~r i( )<br />
D~r N<br />
2<br />
+ V (~r 1 ( );::: ;~r N ( ))!#<br />
(2.7)<br />
Das Symbol D~r i steht dabei für ein Maß auf dem abstrakten Raum aller möglichen<br />
”<br />
Pfade“ ~r i<br />
0<br />
; ~r i 00 , die in dem vierd<strong>im</strong>ensionalen Raum (~x; = ~) mit<br />
euklidischer Metrik von ~r i 0 nach ~r i 00 führen.<br />
Mit der Interpretation der Größe in Gleichung (2.7) als <strong>im</strong>aginäre ”<br />
Zeit“ it<br />
beschreibt ~r i ( ) die ”<br />
Bahn“ bzw. den Pfad, auf dem sich das Teilchen i von der<br />
Ausgangsposition ~r i (0) := ~r i 0 zu der Endposition ~r i (~) = ~r i<br />
00<br />
”<br />
bewegt“, wobei<br />
die Gesamt ”<br />
zeit“ ~ für diese ”<br />
Bewegung“ durch die Temperatur des Systems<br />
festgelegt ist.<br />
<strong>Die</strong> Dichtematrix ergibt sich also, indem für jedes Teilchen über alle möglichen<br />
Pfade ~r i<br />
0 ; ~ri 00 summiert wird, wobei der Beitrag jedes Einzelpfades zum <strong>Pfadintegral</strong><br />
durch das <strong>im</strong> Exponenten stehende ”<br />
zeitliche“ Integral über die ”<br />
Energie“<br />
aller ”<br />
Teilchenbewegungen“ auf diesem Pfad geteilt durch ~ gewichtet wird.<br />
Das eigentliche Problem besteht nun darin, eine sinnvolle Darstellung für das<br />
<strong>Pfadintegral</strong>maß D~r zu finden. Formal–mathematisch gesehen ist Gleichung (2.7)<br />
eine abstrakte, nicht direkt berechenbare Integralgleichung für die N-Teilchen-<br />
Dichtematrix . Das auf der rechten Seite stehende Integral gehört zur Klasse der<br />
Wiener–Integrale 1 und ist <strong>im</strong> Sinne der Schwarzschen Distributionen als Grenzwert<br />
einer Folge von Testfunktionalen aufzufassen [?, ?]. Solche Folgen von Testfunktionalen,<br />
die <strong>im</strong> L<strong>im</strong>es in Gleichung (2.7) übergehen, werden als Darstellungen<br />
des <strong>Pfadintegral</strong>s bezeichnet und nur sie liefern berechenbare Formeln.<br />
In den letzten Jahren haben sich nun zwei Ansätze für Darstellungen des <strong>Pfadintegral</strong>s<br />
als besonders vielversprechend erwiesen [?].<br />
Der eine ist die sogenannte Fourierdarstellung von <strong>Pfadintegral</strong>en, beidem<br />
zuerst alle Pfade als Fourierreihen über einen Referenzpfad entwickelt werden und<br />
die Integration in Gleichung (2.7) somit über alle Fourierkoeffizienten erfolgt [?,<br />
?]. Ein berechenbarer Ausdruck ergibt sich dann durch das Vernachlässigen der<br />
höheren Fourierfrequenzen, d.h. es werden nur glatte, wenig oszillierende Pfade<br />
um den klassischen Pfad berücksichtigt.<br />
Für semiklassisch zu behandelnde Systeme ist eine solche Näherung gerechtfertigt,<br />
bei rein quantenmechanischen Systemen ist durch die Fourierentwicklung<br />
nichts gewonnen, da in diesem Fall prinzipiell alle Entwicklungsterme einen nicht<br />
zu vernachlässigenden Beitrag liefern. <strong>Die</strong> Fourierdarstellung von <strong>Pfadintegral</strong>en<br />
soll in dieser Arbeit nicht weiter betrachtet werden.<br />
1 <strong>Die</strong>se 1923 von N. WIENER eingeführten Funktionalintegrale sind auf Grund des reellen Integranden<br />
mathematisch wohldefinierte Maßintegrale auf Mengen von Trajektorien.
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 8<br />
Der andere Ansatz ist die Diskretisierte <strong>Pfadintegral</strong>darstellung oder kurz DPI,<br />
bei dem der zeitliche Verlauf der einzelnen Pfade bzw. ”<br />
Teilchenbahnen“ geeignet<br />
diskretisiert wird, so daß das Integral über alle Pfade durch eine endliche Anzahl<br />
von Riemann-Integralen angenähert werden kann.<br />
Unter den vielen diskretisierten Darstellungen hat sich das Pr<strong>im</strong>itive Diskretisierte<br />
<strong>Pfadintegral</strong> (PDPI) als besonders sinnvoll erwiesen, da auf ihm viele andere,<br />
schneller konvergente Formulierungen basieren [?, ?, ?, ?]. Da die PDPI-<br />
Darstellung der Dichtematrix die Grundlage der hier vorliegenden Arbeit bildet,<br />
wird für sie <strong>im</strong> nächsten Abschnitt eine detaillierte Herleitung präsentiert. Das Endergebnis<br />
— eine <strong>Pfadintegral</strong>formel für — findet sich in Gleichung (2.29).<br />
2.2 Das diskretisierte <strong>Pfadintegral</strong> in der Ortsdarstellung<br />
Der entscheidende Schritt in der Herleitung der diskretisierten Ortsdarstellung besteht<br />
in der Approx<strong>im</strong>ation des Dichteoperators. Bevor wir diese Approx<strong>im</strong>ation<br />
durchführen, definieren wir zunächst die Abkürzung ^T für den der kinetischen<br />
Energie entsprechenden Operatoranteil des Hamiltonoperators (2.1). Mit der Trotter–<br />
Produktformel [?]<br />
e ,( ^T + ^V ) =<br />
l<strong>im</strong><br />
e , ^T M e , ^V M<br />
M<br />
M!1<br />
können wir den Dichteoperator ^ durch den Operator<br />
^ ^ M := 1 e <br />
, ^T M e , ^V M <br />
3<br />
M + O<br />
Z<br />
M 3<br />
(2.8)<br />
(2.9)<br />
approx<strong>im</strong>ieren. 2<br />
Zur Berechnung von ^ M in der Ortsdarstellung müssen für <strong>Bosonen</strong> total symmetrische<br />
und für Fermionen total antisymmetrische N–Teilchen–Ortszustände<br />
verwendet werden. Wir beschränken uns hier zunächst auf den Fall eines Systems<br />
aus N <strong>Bosonen</strong>, für die die Ortsbasiszustände als<br />
definiert sind.<br />
X<br />
j ~r 1 ;::: ;~r N i S := 1 j ~r<br />
N P (1) ;~r P (2) ::: ;~r P (N) i (2.10)<br />
!<br />
P 2S N<br />
2 <strong>Die</strong> Trotter–Formel gilt, wenn die drei Operatoren ^T , ^V und ^ T + V selbstadjungiert und wohldefiniert<br />
sind. Eine hinreichende Bedingung hierfür ist, daß ihr Spektrum nach unten beschränkt ist<br />
[?]. Mit modifizierten Trotter–Formeln lassen sich Restterme höherer Ordnung erreichen [?]. Auf<br />
die diffizile Frage der Konvergenz von M gegen für M !1wird in dieser Arbeit nicht weiter<br />
eingegangen.
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 9<br />
<strong>Die</strong> Normierung der Ortsbasiszustände ergibt sich aus den Orthonormierungsbedingungen<br />
S h~r 1 ;::: ;~r N j ~r 1 0 ;::: ;~r N 0 i S<br />
=<br />
<br />
1<br />
N ! 2 X<br />
X<br />
P;P 0 2S N<br />
h~r P 0 (1);::: ;~r P 0 (N) j ~r P (1) ;::: ;~r P (N) i (2.11)<br />
= 1 h~r 1 ;::: ;~r N j ~r<br />
N P (1) ;::: ;~r P (N) i (2.12)<br />
!<br />
P 2S N<br />
= 1 N !<br />
X<br />
P 2S N<br />
N Y<br />
i=1<br />
(~r i , ~r P (i) ); (2.13)<br />
die eine logische Verallgemeinerung der Orthonormierungsbedingungen für die<br />
kontinuierlichen Ein–Teilchen–Ortszustände darstellen. Im zweiten Schritt der Gleichungskette<br />
wurde benutzt, daß in diesem Fall die zweifache Summe über alle<br />
Permutationen gleich N ! mal der einfachen Summe über alle Permutationen ist.<br />
Als abkürzende Schreibweise für das N-Tupel (~r 1 ;::: ;~r N ) soll <strong>im</strong> folgenden<br />
gelegentlich der 3N-komponentige Ortsvektor ~ R verwendet werden.<br />
Für die Matrixelemente von ^ M ergibt sich also<br />
M ( ~ R 00 ; ~ R 0 )= S h ~ R 00 j<br />
<br />
e (, M ^T ) e (, M ^V ) M<br />
j ~ R 0 i S : (2.14)<br />
Durch Einschieben von M , 1 vollständigen Sätzen von total symmetrischen<br />
Ortsbasiszuständen in das Operatorprodukt erhalten wir<br />
M =<br />
MY Z<br />
=2<br />
d ~ R()<br />
MY<br />
=1<br />
S h ~ R( +1)j e (, M ^T ) e (, M ^V ) j ~ R()i S ;<br />
(2.15)<br />
wobei ~ R(M +1)= ~ R 00 und ~ R(1) = ~ R 00 gelten soll.<br />
Führen wir für die noch zu berechnenden Matrixelemente<br />
S h ~ R( +1)j e (, M ^T ) e (, M ^V ) j ~ R()i S (2.16)<br />
die Abkürzung Q( +1;) ein und bezeichnen wir wieder mit ~ P das N-Tupel<br />
(~p 1 ;::: ;~p N ) von Impulsvektoren, so lassen sich die Q(+1;) durch Einschieben<br />
eines vollständigen Satzes von Impulsbasiszuständen berechnen:<br />
Q( +1;) =<br />
Z<br />
d ~ P<br />
(2~) 3N S h ~ R( +1)j e (, M ^T ) j ~ P i S<br />
h ~ P j S e (, M ^V ) j ~ R()i S (2.17)<br />
= e , M V ( ~ R())<br />
Z<br />
d P ~ exp<br />
(2~) 3N ,<br />
M<br />
NX<br />
i=1<br />
~p i<br />
2<br />
2m<br />
S h ~ R( +1)j ~ P i SS h ~ P j ~ R()i S : (2.18)<br />
!
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 10<br />
Dabei haben wir <strong>im</strong> ersten Schritt angenommen, daß der Operatoranteil für die<br />
potentielle Energie ^V lokal und rein ortsabhängig sein soll und demzufolge mit<br />
dem Permutationsoperator und allen ^p i kommutiert.<br />
<strong>Die</strong> Fourieramplitude S h ~ R( +1)j ~ P i S läßt sich unter Rückgriff auf die Definition<br />
der total symmetrischen Zustände auswerten:<br />
S h R( ~ +1)j P ~ i S = S h~r 1 ( +1);::: ;~r N ( +1)j ~p 1 ;::: ;~p N i S (2.19)<br />
X X<br />
= 1<br />
h~r<br />
(N !) 2 P (1) ( +1);::: ;~r P (N) ( +1)j<br />
P 0 2S N<br />
P 2S N<br />
j~p P 0 (1);::: ;~p P 0 (N)i (2.20)<br />
X<br />
= 1 h~r<br />
N P (1) ( +1);::: ;~r P (N) ( +1)j ~p 1 ;::: ;~p N i (2.21)<br />
!<br />
P 2S N<br />
!<br />
X<br />
NX<br />
= 1 exp , i ~r<br />
N P (i) ( +1) ~p i (2.22)<br />
!<br />
~<br />
P 2S N i=1<br />
wobei wir <strong>im</strong> zweiten Schritt wieder die Doppelsumme über alle Permutationen in<br />
N ! mal der Einfachsumme reduziert haben.<br />
Für die inverse Fourieramplitude S h P ~ j R()i ~ S ergibt sich nach analoger<br />
Rechnung<br />
!<br />
X<br />
NX<br />
S h P ~ j R()i ~ S = 1 i exp + ~r<br />
N P (i) () ~p i (2.23)<br />
! ~<br />
P 2S N i=1<br />
und somit für das Produkt beider Amplituden<br />
S h R( ~ +1)j P ~ i SS h P ~ j R()i ~ S =<br />
1 X X<br />
(N !) 2<br />
P 2S N<br />
P 0 2S N<br />
exp , i ~<br />
NX , ! ~p i ~r P 0 (i)( +1), ~r P (i) () (2.24)<br />
i=1<br />
Setzen wir dieses Zwischenergebnis in Gleichung (2.18) für das Matrixelement<br />
Q( +1;) ein, so erhalten wir<br />
<br />
<br />
1<br />
Q( +1;) =<br />
(N !) 2 exp , M V (~r 1();::: ;~r N ())<br />
<br />
X Z<br />
P;P 0 2S N<br />
exp<br />
NX<br />
i=1<br />
d~p 1<br />
(2~) 3<br />
, M<br />
Z<br />
d~p N<br />
(2~) 3<br />
p 2 i<br />
2m , i ~ ~p i , ~r P 0 (i) ( +1), ~r P (i) ()! (2.25)<br />
<strong>Die</strong> in dieser Gleichung auftretenden Impulsintegrale sind nach quadratischer<br />
Ergänzung vom Gaußschen Typ und somit leicht zu berechnen. Nach Auswertung
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 11<br />
der Integrale ergibt sich für die Matrixelemente<br />
<br />
1<br />
Q( +1;) =<br />
(N !) 2 exp , M V (~r 1();::: ;~r N ())<br />
X Y<br />
N m M 3=2<br />
<br />
2~ 2 <br />
P;P 0 2S N i=1<br />
<br />
exp , m M , <br />
2<br />
~rP<br />
2~ <br />
0 (i)( +1), ~r P (i) ()<br />
= 1 N ! exp , M V (~r 1();::: ;~r N ())<br />
X<br />
P;2S N<br />
N Y<br />
i=1<br />
<br />
<br />
(2.26)<br />
(A( +1;)) i;P i ; (2.27)<br />
wobei die Matrizen A( +1;) definiert sind als<br />
3 m M 2<br />
<br />
(A( +1;)) i;j =<br />
exp<br />
, m M<br />
2~ 2 <br />
2~ (~r i( +1), ~r j ()) 2 :<br />
(2.28)<br />
Auch hier haben wir <strong>im</strong> letzen Schritt wieder verwendet, daß die zweifache Summe<br />
über alle Permutationen gleich N ! mal der einfachen Summe über alle Permutationen<br />
ist.<br />
Für die Matrixelemente des diskretisierten Dichteoperator ^ M aus Gleichung<br />
(2.15) erhalten wir mit dem Ausdruck (2.27) also die pr<strong>im</strong>itive diskretisierte <strong>Pfadintegral</strong>darstellung<br />
M der Dichtematrix <br />
<br />
M ( R ~ 00 ; R ~ 0 1<br />
NY Z <br />
) =<br />
d~r j ()<br />
N !<br />
<br />
MY<br />
M MY<br />
=2<br />
X<br />
j=1<br />
Y<br />
N<br />
=1 P 2S N i=1<br />
exp<br />
0<br />
@ ,<br />
<br />
M<br />
(A( +1;)) i;P i<br />
MX<br />
=1<br />
1<br />
V (~r 1 ();::: ;~r N ()) A (2.29)<br />
für ein N-<strong>Bosonen</strong>-System.<br />
<strong>Die</strong> lateinischen Indizes dienen hierbei zur Numerierung der Teilchen. <strong>Die</strong><br />
griechischen Indizes entsprechen M diskreten Punkten <strong>im</strong> Temperaturintervall<br />
[0;]^=[1;T], also in der schon in Abschnitt 2.1 angesprochenen <strong>im</strong>aginären ”<br />
Zeit“,<br />
sie werden in der Literatur auch als Zeitscheiben bezeichnet. Für einen festen Teilchenindex<br />
i bezeichnen also die (~r 1 (); =1;::: ;M) genau die M Punkte auf<br />
dem Pfad dieses Teilchens von ~r i 0 nach ~r i 00 .
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 12<br />
Der in Gleichung (2.29) auftauchende algebraische Ausdruck<br />
X<br />
P 2S N<br />
N Y<br />
i=1<br />
(A( +1;)) i;P i<br />
(2.30)<br />
ist ein in der multilinearen Algebra wohlbekanntes Objekt und wird als <strong>Permanente</strong><br />
der Matrix A( +1;) (abgekürzt: perA( +1;)) bezeichnet.<br />
<strong>Die</strong> entsprechende PDPI-Darstellung von für ein N–Fermionen–System ergibt<br />
sich nach analoger Rechnung. Dabei zeigt sich, daß in Gleichung (2.29) unter<br />
der Summe über alle Permutationen noch ein zusätzlicher Faktor (1) P auftaucht,<br />
so daß <strong>im</strong> diskretisierten fermionischen <strong>Pfadintegral</strong> an Stelle der <strong>Permanente</strong> von<br />
A( +1;) die Determinante von A( +1;) steht.<br />
Bei der Dichtematrix (2.5) und dem abstrakten Feynmanschen <strong>Pfadintegral</strong><br />
(2.7) genügt eine einzige Permutation der Teilchenendpositionen ~r 1 00 ;::: ;~r N ,um<br />
eine vollständige Symmetrisierung zu erreichen. Auch be<strong>im</strong> diskretisierten <strong>Pfadintegral</strong>s<br />
M (2.29) sollte es ausreichend sein, wenn nur einmal zwischen zwei<br />
aufeinanderfolgenden Zeitscheiben eine Permutation von Teilchenindizes erfolgt.<br />
Wie gleich gezeigt wird, läßt sich dies mathematisch durch Substitution der Integrationsvariablen<br />
begründen.<br />
Der Integrand des <strong>Pfadintegral</strong>s (2.29) enthält die Permutationen in Form eines<br />
Produktes über die <strong>Permanente</strong>n der Matrizen A( +1;). <strong>Die</strong>ses Produkt ergibt<br />
ausmultipliziert<br />
MY<br />
=1<br />
per A( +1;)=<br />
X<br />
X<br />
X<br />
:::<br />
P12S N P22S N P M 2S N<br />
<br />
NY<br />
MY<br />
i=1 =1<br />
Mit M , 2 Koordinatentransformationen vom Typ<br />
(A( +1;)) i;P(i)<br />
(2.31)<br />
(x 1 ();::: ;x N ()) ,! (x P,1(1)();::: ;x P,1(N)())<br />
(2.32)<br />
für = 2;::: ;M, deren Jacobideterminanten den Betrag 1 haben, können die<br />
Doppelsummen über die N–Teilchenpermutationen P ,1 ;P durch N ! mal den<br />
Einfachsummen über alle Permutationen ersetzt werden:<br />
X<br />
X<br />
,!<br />
P ,12S N P 2S N<br />
X<br />
mit P 0 = P ,1 P ,1 : (2.33)<br />
P2S 0 N
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 13<br />
Das <strong>Pfadintegral</strong> (2.29) kann so in die mathematisch äquivalente Form<br />
M ( ~ R 00 ; ~ R 0 ) = 1 N !<br />
MY<br />
NY Z<br />
=2 j=1<br />
d~r j ()<br />
perA(M;M , 1)<br />
exp<br />
0<br />
@ ,<br />
<br />
M<br />
MX<br />
=1<br />
<br />
NY<br />
M,2<br />
Y<br />
i=1 =1<br />
(A( +1;)) i;i<br />
1<br />
V (~r 1 ();::: ;~r N ()) A (2.34)<br />
umgeschrieben werden, in der die Permutation der Teilchenindizes zwischen den<br />
beiden Zeitscheiben = M und +1=1erfolgt.<br />
2.3 Berechnung thermodynamischer Observablen<br />
Wie bekannt, wird in der Quantenstatistik der Erwartungswert einer Observablen<br />
^O bezüglich eines gemischten Zustandes über den Dichteoperator ^ berechnet:<br />
h ^Oi =Tr(^O ^): (2.35)<br />
Für Observablen ^O = ^O( ~ R), die nicht explizit von den N Impulsoperatoren ^p i<br />
abhängen, gilt<br />
S h ~ R j ^O( ~ R) j ~ R 0 i S = 1 N ! O( ~ R)<br />
X<br />
P 2S N<br />
( ~ R , P ~ R 0 ): (2.36)<br />
Damit läßt sich für den Erwartungswert (2.35) analog zum vorherigen Abschnitt<br />
eine diskretisierte <strong>Pfadintegral</strong>darstellung finden 3 :<br />
h ^Oi 1 1<br />
d R(1)<br />
Z M N ~ <br />
!<br />
wobei Z M die genäherte Zustandssumme<br />
ist und W die Wahrscheinlichkeitsdichtefunktion<br />
W = 1 N ! per A(1;M) N Y<br />
i=1<br />
exp<br />
Z<br />
0<br />
Z<br />
d ~ R(M ) O( ~ R)W ( ~ R) (2.37)<br />
Z M =Tr^ M (2.38)<br />
@ ,<br />
<br />
M<br />
MX<br />
=1<br />
Y<br />
M,1<br />
=1<br />
(A( +1;)) i;i<br />
1<br />
V (~r 1 ();::: ;~r N ()) A (2.39)<br />
3 Für Observablen, die explizit von den Impulsoperatoren abhängen gibt es andere Möglichkeiten<br />
der Diskretisierung, siehe z.B. [?].
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 14<br />
bezeichnet.<br />
Es ist zu beachten, daß in Gleichung (2.37) durch die Spurbildung eine zusätzliche<br />
Integration über den Anfangs- und Endpunkt ~ R(M +1) = ~ R(1) (periodische<br />
Randbedingung) auftaucht und die Permutation der Teilchenindizes zwischen die<br />
beiden Zeitscheiben = M und +1=1gelegt wurde.<br />
<strong>Die</strong> Wahrscheinlichkeitsdichte W kann rein formal interpretiert werden (der<br />
sog. klassische Isomorphismus, [?, ?]) als die klassische Boltzmann–Verteilung<br />
eines Systemes aus N M Teilchen, die wie ”<br />
Perlen“ auf einer geschlossenen<br />
Kette aufgereiht sind und sich in einem Potential ~ V bewegen, das aus zwei Teilen<br />
besteht.<br />
Der eine Teil ist nichts anderes als das Potential V des ursprünglichen Systems,<br />
das zu einer Wechselwirkung zwischen ”<br />
Perlen“ derselben Zeitscheibe führt. Der<br />
andere Anteil — repräsentiert durch die Exponenten in den Komponenten der Matrix<br />
A( +1;) — stellt eine harmonische, federartige Wechselwirkung zwischen<br />
den ”<br />
Perlen“ direkt aufeinander folgender Zeitscheiben und +1dar.<br />
Für den Fall M =1entfällt in der Wahrscheinlichkeitsdichte W das Produkt<br />
über die Komponenten der Matrix A und es ergibt sich der klassische Grenzfall der<br />
Boltzmann-Statistik für ein System aus N Teilchen.<br />
<strong>Die</strong> formale Ähnlichkeit des diskretisierten <strong>Pfadintegral</strong>es mit dem klassischen<br />
Phasenraumintegral eines größeren Systems erlaubt es, für numerische Berechnung<br />
auf die bei klassischen Systemen erprobten Verfahren zurückzugreifen.<br />
2.4 Das <strong>Pfadintegral</strong>-Monte-Carlo Verfahren (PIMC)<br />
Eines der robustesten und am besten untersuchten Verfahren (siehe z.B. [?, ?, ?])<br />
zur numerischen Berechnung von Erwartungstungswerten <strong>im</strong> klassischen kanonischen<br />
Ensemble ist das auf METROPOLIS ET. AL. [?] zurückgehende Monte–<br />
Carlo–Verfahren, das in Anhang A in einem allgemeineren Zusammenhang erläutert<br />
wird.<br />
Neben dem Metropolis-Algorithmus werden zur S<strong>im</strong>ulation eines kanonischen<br />
Ensembles auch noch andere Monte–Carlo–Verfahren ( ”<br />
heat bath“–Algorithmus;<br />
kraftgesteuerte MC-Verfahren) mit einem besseren Konvergenzverhalten verwendet.<br />
<strong>Die</strong>se Verfahren sind jedoch entweder rechenaufwendiger oder sie greifen auf<br />
zusätzliche, physikalische Eigenschaften (z.B. Kräfte) der Systeme zurück [?, ?].<br />
Da der oben angesprochene klassische Isomorphismus auf einer mathematisch–<br />
strukturellen Ähnlichkeit zwischen <strong>Pfadintegral</strong> und klassischem Phasenraumintegral<br />
beruht, ist nicht so ohne weiteres klar, ob sich solche physikalischen Eigenschaften<br />
ebenfalls übertragen lassen [?]. Deshalb wird bei der numerische Berechnung<br />
des thermischen <strong>Pfadintegral</strong>es in der Regel vom Metropolis–Verfahren ausgegangen.<br />
Im Metropolis–Algorithmus wird ein random walk durch den Konfigurationsraum<br />
so erzeugt, daß die Wahrscheinlichkeitsverteilung (2.39) unter dem zugehörige<br />
Markoff–Prozeß stationär ist (eine detaillierte Beschreibung findet sich in An-
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 15<br />
hang A.2.1).<br />
Ausgehend von einer beliebigen Startkonfiguration wird <strong>im</strong> Metropolis–Algorithmus<br />
der i-te Schritt des ”<br />
random walk“ wie folgt realisiert:<br />
1. Zufällige Erzeugung einer neuen Teilchenkonfiguration C 0 <strong>im</strong> 3NM-d<strong>im</strong>ensionalen<br />
Konfigurationsraum.<br />
2. <strong>Die</strong>se Konfiguration wird die neue Konfiguration C i , falls für eine Zufallszahl<br />
2 [0; 1] die Bedingung<br />
W (C 0 )<br />
> (2.40)<br />
W (C i )<br />
erfüllt ist, d.h. der Quotient in Gleichung (2.40) muß größer als eine Zufallszahl<br />
zwischen 0 und 1 werden.<br />
Der Erwartungswert einer beliebigen Observablen ^O ergibt sich dann durch<br />
Summation über alle n Metropolis–Schritte:<br />
h ^Oi =<br />
nX<br />
i=1<br />
W (C i ): (2.41)<br />
Bei der konkreten Umsetzung dieses Algorithmus sind allerdings viele technische<br />
Details zu beachten. 4 Bewährt hat sich folgendes Vorgehen: Ein Schritt der<br />
Monte–Carlo–S<strong>im</strong>ulation wird in mehrere sogenannte mikroskopische und makroskopische<br />
Schritte zerlegt.<br />
Bei einem mikroskopischen Schritt wird nur eine Teilchenkoordinate i zu einer<br />
best<strong>im</strong>mten Zeitscheibe um einen zufälligen Betrag ~r 1 verschoben:<br />
~r i () ,! ~r i () +~r 1 : (2.42)<br />
Bei einem makroskopischen Schritt werden dagegen alle zu einem Teilchenindex<br />
i gehörenden Koordinaten verschoben:<br />
~r i () ,! ~r i () +~r 2 f. a. =1;::: ;M: (2.43)<br />
In einem S<strong>im</strong>ulationsschritt wird nun für jede der NM Koordinaten ~r i () ein<br />
mikroskopischer Schritt und für jeden der N Pfade (~r i (); = 1;::: ;M) ein<br />
makroskopischer Schritt ausgeführt. In jedem dieser Teilschritte muß dabei die<br />
Akzeptanzbedingung (2.40) erfüllt werden.<br />
<strong>Die</strong> Zufallsvektoren ~r 1 und ~r 2 werden aus zwei Schrittweitenparametern<br />
w 1 und w 2 erzeugt, die wiederum so best<strong>im</strong>mt werden, daß das Verhältnis von<br />
abgelehnten zu angenommenen Schritten in einem vorgegebenem Bereich bleibt.<br />
Zu beachten ist außerdem [?], daß in der Gewichtsfunktion (2.39) der Anteil<br />
der potentiellen Energie proportional zu =M eingeht, während der durch die<br />
4 siehe z.B. FRANKE [?], Kapitel 4.2: ”<br />
<strong>Die</strong> Kunst der Konfigurationserzeugung“.
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 16<br />
Komponenten (2.28) der Matrix A( +1;) best<strong>im</strong>mte kinetische Energieterm<br />
proportional zu M= ist. Um nun zu erreichen, daß der potentielle und der kinetische<br />
Term gleichermaßen die Dynamik der S<strong>im</strong>ulationsrechnung best<strong>im</strong>men, wird<br />
an den Quotienten =M die Bedingung<br />
<br />
= const. (2.44)<br />
M<br />
gestellt, je kleiner also die Temperatur gewählt wird, umso größer soll die Anzahl<br />
der Zeitscheiben gewählt werden.<br />
2.5 Importance Sampling of Permutations<br />
In der Formulierung des <strong>Pfadintegral</strong>–Monte–Carlo–Verfahrens nach Metropolis<br />
ist deutlich zu erkennen, daß die Überprüfung der Akzeptanzbedingung (2.40) den<br />
größten numerischen Aufwand erfordert. Davon geht wieder ein Hauptteil zu Lasten<br />
der Berechnung der <strong>Permanente</strong>, die in jedem S<strong>im</strong>ulationsschritt 3N mal ausgewertet<br />
werden muß.<br />
<strong>Die</strong> Anwendbarkeit der <strong>Pfadintegral</strong>–Monte–Carlo–Methode für <strong>Viel</strong>–<strong>Bosonen</strong>–<br />
Systeme in der bis hier dargestellten Form hängt also wesentlich davon ab, ob eine<br />
effiziente Möglichkeit zur Berechnung der <strong>Permanente</strong> der Matrix A( +1;) gefunden<br />
wird. Bisher ist jedoch noch keine solche Berechnungsmethode bekannt<br />
(siehe z.B. den Übersichtsartikel von CEPERLEY [?]).<br />
Deshalb hat sich für die numerische Auswertung des <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>s<br />
von N–<strong>Bosonen</strong>–Systemen ein modifiziertes Monte–Carlo–Verfahren nach<br />
Metropolis durchgesetzt, daß in der Literatur [?] unter dem Stichwort ”<br />
<strong>im</strong>portance<br />
sampling of permutations“ bekannt ist.<br />
Bei dieser Methode werden die zu untersuchenden physikalischen Observablen<br />
^O als Funktionen von Permutationen P und Koordinaten ~ R(i) aufgefaßt, der Konfigurationsraum<br />
wird sozusagend um den abstrakten Permutationsraum erweitert.<br />
Damit kann ein Mittelwert analog zu Gleichung (2.37) definiert werden<br />
h ^Oi <br />
P<br />
P 2S N<br />
R<br />
d ~ R(1) <br />
R<br />
d ~ R(M ) O(P; ~ R) ~ W (P; ~ R)<br />
P<br />
P 2S N<br />
R<br />
d ~ R(1) <br />
R<br />
d ~ R(M ) ~ W (P; ~ R);<br />
wobei die modifizierte Gewichtsfunktion ~ W gegeben ist durch<br />
~W = 1 N !<br />
2<br />
NY<br />
i=1<br />
exp<br />
Y<br />
4 (A(1;M))i;P i<br />
M,1<br />
0<br />
@ ,<br />
<br />
M<br />
MX<br />
=1<br />
=1<br />
(A( +1;)) i;i<br />
3<br />
5<br />
1<br />
(2.45)<br />
V (~r 1 ();::: ;~r N ()) A : (2.46)
KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 17<br />
<strong>Die</strong>ser Mittelwert läßt sich wieder mit einem MC–Verfahren vom Metropolis–<br />
Typ berechnen. Allerdings müssen nun zusätzlich zu den in Abschnitt 2.4 erwähnten<br />
mikroskopischen und makroskopischen MC–Schritten auch noch Schritte <strong>im</strong><br />
Permutationsraum durchgeführt werden. Dabei wird ausgenutzt, daß sich jede Permutation<br />
in eine Hintereinanderausführung von sogenannten Elementarpermutationen,<br />
d.h. das Vertauschen von nur zwei Indizes zerlegen läßt.<br />
Werden zwei Teilchenindizes i und j vertauscht, so ändert sich die Gewichtsfunktion<br />
~ W um den Faktor<br />
= (A(1;M)) i;P j (A(1;M)) j;P i<br />
(A(1;M)) i;P i (A(1;M)) j;P j<br />
: (2.47)<br />
Ein Schritt <strong>im</strong> Permutationsraum besteht nun darin, daß für alle N (N , 1)=2<br />
möglichen Indexpaare 1 i
Kapitel 3<br />
Mögliche Berechnungsverfahren<br />
für die <strong>Permanente</strong><br />
In diesem Kapitel sollen Alternativen zu dem etablierten, bisher in der <strong>Pfadintegral</strong>–<br />
Monte–Carlo–Methode benutzten ”<br />
Importance Sampling of Permutations“ aufgezeigt<br />
werden.<br />
Der Ausgangspunkt für solche alternativen Ansätze sollen dabei die in der Mathematik<br />
erzielten Ergebnisse auf dem Gebiet der <strong>Permanente</strong>n sein.<br />
Um diese Ergebisse darstellen zu können, werden zuerst einige elementare<br />
Grundlagen aus der Theorie der <strong>Permanente</strong>n angegeben.<br />
Danach werden die wichtigsten allgemeinen Berechnungsverfahren für <strong>Permanente</strong>n<br />
vorgestellt, bevor schließlich die <strong>im</strong> Rahmen dieser Diplomarbeit angestellten<br />
Berechnungsversuche erläutert werden.<br />
3.1 Mathematische Grundlagen der <strong>Permanente</strong><br />
<strong>Die</strong> <strong>Permanente</strong> als algebraisches Objekt ist jünger als ihre bekanntere Verwandte,<br />
die Determinante. Im Jahr 1812 entdeckten zeitgleich CAUCHY und BINET bei<br />
Untersuchungen von ”<br />
fonctions symétriques permanentes“ diese spezielle Abbildung<br />
der multilinearen Algebra [?] und erkannten ihren Zusammenhang mit der<br />
Determinante. Der Begriff <strong>Permanente</strong> wurde allerdings erst <strong>im</strong> letzten Viertel des<br />
vorigen Jahrhunderts, <strong>im</strong> Jahr 1881, von MUIR geprägt [?].<br />
Obwohl die <strong>Permanente</strong> schon seit über 150 Jahren als mathematisches Objekt<br />
bekannt ist, hat sie nie auch nur annähernd dieselbe Bedeutung wie die Determinante<br />
erlangt. So sind in den Jahren von 1812 bis 1977 lediglich 301 mathematische<br />
Veröffentlichungen bekannt, in denen die <strong>Permanente</strong> erwähnt ist — wobei mehr<br />
als dreiviertel der Arbeiten <strong>im</strong> Zeitraum von 1960–1977 erschienen sind.<br />
Eine Ursache hierfür ist sicherlich, daß die <strong>Permanente</strong> nur selten in Problemen<br />
der angewandten Mathematik anzutreffen ist. Eine wichtige Rolle spielt sie<br />
lediglich in der Kombinatorik, der Wahrscheinlichkeitstheorie sowie in einigen Bereichen<br />
der Quantenfeldtheorie und der Statistischen Physik.<br />
18
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 19<br />
<strong>Die</strong> andere Ursache ist sicherlich die Tatsache, daß die Berechnung der <strong>Permanente</strong><br />
so ungleich viel schwieriger ist als bei der Determinante 1 .<br />
Zunächst betrachten wir die grundlegende Definition der <strong>Permanente</strong>. Sei A =<br />
(a ij ) eine m n Matrix über dem Körper R oder C mit m n. <strong>Die</strong><strong>Permanente</strong><br />
von A ist definiert als<br />
per (A) =<br />
X<br />
<br />
a 1(1) a 2(2) a m(m) ; (3.1)<br />
wobei eine eins-zu-eins Abbildung von f1;::: ;mg auf f1;::: ;ng ist.<br />
Im Falle einer quadratischen Matrix — d.h. m = n — bedeutet dies nichts<br />
anderes, als daß die Abbildung eine Permutation der ersten n natürlichen Zahlen<br />
f1;::: ;ng ist. <strong>Die</strong> <strong>Permanente</strong> einer quadratischen n n Matrix A kann damit<br />
aufgefaßt werden als die Summe über alle Produkte von n Komponenten aus A,<br />
wobei jeweils zwei dieser Komponenten nicht in derselben Zeile oder Spalte stehen<br />
dürfen:<br />
per (A) =<br />
X<br />
2S n<br />
a 1(1) a 2(2) a n(n) : (3.2)<br />
Hierbei steht S n als Abkürzung für die symmetrische Gruppe der Permutationen<br />
der ersten n natürlichen Zahlen.<br />
<strong>Die</strong>se Interpretation ermöglicht den Vergleich von der <strong>Permanente</strong> einer quadratischen<br />
Matrix A mit der Determinante derselben Matrix:<br />
det A =<br />
X<br />
2S n<br />
(,1) j() a 1(1) a 2(2) a n(n) : (3.3)<br />
Der Ausdruck (,1) j() soll dabei +1 für eine gerade Permutation und ,1 für eine<br />
ungerade Permutation ergeben.<br />
Aus der o.g. Definition der <strong>Permanente</strong> lassen sich sofort einige fundamentale<br />
Eigenschaften herleiten:<br />
1. Für eine m n Matrix A (m n) istper (A) eine multilineare Abbildung<br />
in den Zeilen von A. Im Falle einer quadratischen nn Matrix A ist per (A)<br />
sogar eine multilineare Abbildung der Spalten von A.<br />
2. Für eine m n Matrix A (m n) und zwei Permutationsmatrizen P und Q<br />
der Ordnungen m bzw. n gilt<br />
per (A) =per(PAQ) (3.4)<br />
<strong>Die</strong>s bedeutet nichts anderes, als daß die <strong>Permanente</strong> sich unter beliebigen<br />
Vertauschungen von Zeilen oder Spalten nicht ändert.<br />
1 Anmerkung aus dem Alltag der Wissenschaft: Nach einem Kolloquiumsvortrag in Oldenburg<br />
bemerkte der numerische Algebraiker B.N. DATTA, daß das effizienteste Verfahren zur Berechnung<br />
der <strong>Permanente</strong> <strong>im</strong>mer noch darin bestünde, nicht die <strong>Permanente</strong> zu berechnen, sondern das Problem<br />
so umzuformulieren, daß die <strong>Permanente</strong> nicht mehr auftaucht !
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 20<br />
3. Ist A eine n n Matrix, so gilt insbesondere<br />
per (A) =per(A T ) (3.5)<br />
<strong>Die</strong> <strong>Permanente</strong> einer quadratischen Matrix ist also invariant unter Transpositionen.<br />
4. Ist A eine m n Matrix (m n) mit mindestens einer Nullzeile, so ist<br />
per (A) =0.<br />
Im Falle einer quadratischen Matrix sind die erste und die dritte dieser elementaren<br />
Eigenschaften auch für die Determinante der Matrix erfüllt. Bemerkenswert<br />
ist jedoch, daß die <strong>Permanente</strong> gegenüber der Determinante die “schöne” Eigenschaft<br />
besitzt, invariant unter beliebigen Permutationen von Komponenten der Ausgangsmatrix<br />
zu sein.<br />
Nun besitzt die <strong>Permanente</strong> als multilineare Abbildung aber auch einige “unangenehme”<br />
Eigenarten in dem Sinne, als daß einige der von Determinanten bekannten<br />
Rechenregeln für <strong>Permanente</strong>n nicht gelten:<br />
1. Sind A und B zwei n n Matrizen, so gilt <strong>im</strong> allgemeinen<br />
per (A B) 6= per (A) per (B) (3.6)<br />
2. Elementare Zeilenumformungen — d.h. Addition eines <strong>Viel</strong>fachens einer<br />
Zeile der Matrix zu einer anderen Zeile der Matrix — ändern den Wert der<br />
<strong>Permanente</strong> !<br />
3. <strong>Die</strong> vorherige Eigenschaft <strong>im</strong>pliziert insbesondere<br />
Rang A
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 21<br />
aufweisen (Toeplitz–Matrizen, Zirkulanten) oder nur Komponenten aus einem sehr<br />
eingeschränkten Wertebereich haben (0–1–Matrizen).<br />
Als Beispiel sei die <strong>Permanente</strong> einer Hessenberg–Matrix angegeben, auf die<br />
noch in Abschnitt 3.3 zurückgegriffen wird.<br />
Eine Hessenberg–Matrix H ist eine n n Matrix, die die Bedingung<br />
(H) ij =0 falls j , i 2 (3.8)<br />
erfüllt, d.h. alle Matrixelemente über der oberen Nebendiagonale müssen Null sein.<br />
Wird nun aus H die Matrix ~ H erzeugt mittels<br />
<br />
( H) ~ ,(H)ij falls j , i 2<br />
ij =<br />
(H) ij sonst<br />
; (3.9)<br />
so folgt [?]<br />
perH = det ~ H: (3.10)<br />
3.2 Allgemeine Berechnungsverfahren<br />
Das Problem, die Determinante einer beliebigen n n Matrix zu berechnen, ist<br />
äquivalent zu dem Problem, diese Matrix auf Dreiecksgestalt zu bringen. Für letzteres<br />
gibt es eine Reihe von effizienten Verfahren (Gauss-Verfahren, LU-Zerlegung<br />
usw.), deren Berechnungsaufwand in der Größenordnung von O(n 3 ) liegt. Mit dem<br />
Begriff Berechnungsaufwand (oder Rechenaufwand) eines Berechnungsverfahrens<br />
wird in der numerischen Mathematik üblicherweise die Anzahl der in dem Verfahren<br />
vorkommenden Multiplikationen bezeichnet, da diese sehr viel rechenintensiver<br />
als die Additionsoperationen sind.<br />
Für die <strong>Permanente</strong> ist es dagegen bis jetzt noch nicht gelungen, ein allgemeines<br />
Berechnungsverfahren anzugeben, dessen Rechenaufwand polynomial und<br />
nicht exponentiell in der Matrixgrösse n ist. Erstaunlicherweise ist es noch nicht<br />
einmal gelungen [?, ?] ein allgemeines Näherungsverfahren zu finden, daß polynomial<br />
in n ist !<br />
Im folgenden werde ich einen kurzen Überblick über die wichtigsten bis jetzt<br />
bekannten allgemeinen Berechnungsverfahren geben.<br />
3.2.1 <strong>Die</strong> Definition und die Laplace–Entwicklung<br />
Der naivste Versuch, die <strong>Permanente</strong> einer Matrix A zu berechnen, besteht sicherlich<br />
darin, auf die Definitionsgleichung (3.2) zurückzugreifen. Bei einer näheren<br />
Betrachtung der definierenden Gleichung läßt sich sofort feststellen, daß der Rechenaufwand<br />
in der Größenordnung von O((n,1)n!) ist: <strong>Die</strong> symmetrische Permutationsgruppe<br />
S n hat n! Elemente, es gibt also ebensoviele Summanden, und in<br />
jedem Summanden tauchen n , 1 Multiplikationen auf.
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 22<br />
Eine Variante der Definitonsgleichung ergibt sich, wenn in Analogie zur Laplace–Entwicklung<br />
der Determinante die <strong>Permanente</strong> in eine Summe über Unterpermanenten<br />
der Matrix A entwickelt wird:<br />
per (A) =<br />
nX<br />
t=1<br />
a tj per (A(tjj)) : (3.11)<br />
Dabei soll das Symbol A(tjj) für die (n , 1) (n , 1) Matrix sein, die aus A<br />
durch Streichen der Spalte t und der Zeile j entsteht (Entwicklung nach der j–ten<br />
Zeile).<br />
<strong>Die</strong>se Entwicklung bringt offensichtlich nur dann einen Vorteil gegenüber der<br />
Definitonsgleichung, wenn die Werte für die Unterpermanenten bekannt sind. Eine<br />
rekursive Berechnug der Unterpermanenten über Laplace–Entwicklung oder die<br />
direkte Berechnung über Gleichung (3.2) führt schließlich ebenfalls auf einen Rechenaufwand<br />
von<br />
Multiplikationen.<br />
3.2.2 Das Ryser–Verfahren<br />
O((n , 1) n!) (3.12)<br />
Das von RYSER entwickelte Verfahren [?] zur Berechnung der <strong>Permanente</strong> basiert<br />
auf dem kombinatorischen Inklusions– und Exklusions–Prinzip und ist das zur Zeit<br />
effizienteste bekannte allgemeine Verfahren zur Berechnung der <strong>Permanente</strong>. <strong>Die</strong><br />
Grundidee ist dabei ganz einfach zu formulieren:<br />
Summiere für jede Zeile der Matrix über alle Spalten und bilde das Produkt aller<br />
dieser Zeilensummen. Der so entstehende Ausdruck enthält u.a. auch diejenigen<br />
Terme, die bei der Berechnung der <strong>Permanente</strong> gemäß Gleichung (3.2) auftauchen.<br />
Also müssen “nur noch” die überflüssigen Terme wieder abgezogen werden. <strong>Die</strong><br />
Berechnung der <strong>Permanente</strong> ist damit auf das Best<strong>im</strong>men dieser überflüssigen Terme<br />
und damit auf ein rein kombinatorisches Problem zurückgeführt.<br />
Mathematisch konkretisiert ergibt diese Idee die Rysersche Formel:<br />
per (A) =(,1) n<br />
X<br />
X<br />
Y<br />
n<br />
Sf1;:::ng(,1) jSj i=1 j2S<br />
a ij ; (3.13)<br />
wobei in der ersten Summe über alle Untermengen S von f1;:::ng summiert wird<br />
und das Symbol jSj für die Anzahl der Elemente der Menge S steht. Es werden also<br />
für jede Untermenge S alle Spalten in A mit Nullen aufgefüllt, deren Spaltenindex<br />
j in S enthalten ist und anschliessend wird das Produkt von den Zeilensummen<br />
der so entstandenen Matrix gebildet. <strong>Die</strong> Summe der so entstandenen Ausdrücke<br />
ergibt dann die <strong>Permanente</strong> der Matrix.<br />
Der Beweis der Ryserschen Formel erfolgt rein kombinatorisch mit dem schon<br />
oben erwähnten Inklusions– und Exklusionsprinzip (siehe z.B. [?, ?] oder [?]).
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 23<br />
Da für jeden Summanden der ersten Summe in (3.13) (n , 1) Multiplikationen<br />
ausgeführt werden, ergibt sich der Berechnungsaufwand offensichtlich aus der Anzahl<br />
der Summanden in dieser Summe. Es gibt genau 2 n , 1 nichtleere verschiedene<br />
Teilmengen von f1;::: ;ng und damit beträgt die Anzahl der Multiplikationen<br />
(n , 1) (2 n , 1): (3.14)<br />
NIJENHUIS und WILF ([?]) haben eine Variante der Ryserschen Formel hergeleitet,<br />
die besonders geeignet für eine algorithmische Umsetzung ist:<br />
x i = a in , 1 2<br />
nX<br />
j=1<br />
per (A) = (,1) n,1 2 <br />
a ij i =1;::: ;n (3.15)<br />
X<br />
Sf1;:::n,1g(,1) jSj n Y<br />
i=1<br />
0<br />
@ xi +<br />
X<br />
j2S<br />
a ij<br />
1<br />
A<br />
Bei dieser Version der Ryserschen Formel werden die in (3.13) doppelt auftauchenden<br />
Terme nur einmal berechnet und gehen dafür mit einem Faktor 2 in die Summe<br />
ein. Da also nur Untermengen S von f1;:::n, 1g gebildet werden müssen, reduziert<br />
sich die Anzahl der Multiplikationen auf<br />
(n , 1) 2 n,1 =1=2 (n , 1) 2 n : (3.16)<br />
Werden nun bei der algorithmischen Umsetzung von Gleichung (3.16) die Untermengen<br />
S so durchlaufen, daß sich die neue Untermenge S 0 von der vorhergehenden<br />
nur in einem Element unterscheidet, 2 so läßt sich die Gesamtzahl der<br />
notwendigen Additionen wie folgt min<strong>im</strong>ieren:<br />
Für jedes S f1;:::n, 1g muß folgendes Produkt neu berechnet werden:<br />
0<br />
nY<br />
i=1<br />
@ xi +<br />
X<br />
j2S<br />
a ij<br />
1<br />
A =:<br />
n Y<br />
i=1<br />
i (S) (3.17)<br />
Wird nun die nächste Untermenge S 0 so gewählt, daß sie sich von der vorhergehenden<br />
nur in einem Element unterscheidet,<br />
9j 2f1;:::n, 1g : j 62 S 0 ^ j 2 S falls jSj = jS 0 j +1 (3.18)<br />
9j 2f1;:::n, 1g : j 62 S ^ j 2 S 0 falls jS 0 j = jSj +1 (3.19)<br />
so berechnet sich das neue i (S 0 ) aus dem alten i (S) einfach als<br />
i (S 0 ) = i (S) , a ij falls jSj = jS 0 j +1 (3.20)<br />
i (S 0 ) = i (S) +a ij falls jS 0 j = jSj +1 (3.21)<br />
<strong>Die</strong> Anzahl der Additionen wird also gegenüber einer beliebigen Durchlauffolge<br />
für die Untermengen S um die Hälfte reduziert.<br />
2 <strong>Die</strong>s läßt sich z.B. durch einen sog. Hamilton Walk über die Ecken eines Einheitswürfels <strong>im</strong><br />
R (n,1) realisieren.
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 24<br />
3.2.3 Graphentheoretische Verfahren<br />
In diesem Abschnitt soll eine graphentheoretisches Verfahren nach der Methode<br />
von ITAI, RODEH und TANIMOTO [?] vorgestellt werden. Bevor näher erläutert<br />
werden kann, wie sich die Berechnung der <strong>Permanente</strong> einer beliebigen Matrix A<br />
mit Mitteln der Graphentheorie formulieren läßt und welche Vorteile eine solche<br />
Formulierung mit sich bringt, müssen zunächst einige elementare Definitionen der<br />
Graphentheorie getroffen werden.<br />
Gegeben sei eine endliche Menge V = fv 1 ;v 2 ;::: ;v n g und eine Menge E<br />
geordneter Paare (v i ;v j ) mit v i ;v j 2 V ,alsoE V V . Dann heißt G =(V;E)<br />
ein endlicher Graph. <strong>Die</strong> Elemente von V heißen Knoten, dievonE Kanten.<br />
Ist ein Knoten v i 2 V Bestandteil einer Kante, d.h.<br />
9 v i 2 V : (v i ;v j ) 2 E; (3.22)<br />
dann ist dieser Knoten inzident mit dieser Kante. Der Grad eines Knotens ist die<br />
Anzahl der Kanten des Graphens, mit der dieser Knoten inzident ist.<br />
Ein Graph G =(V = v 1 ;::: ;v n ;E) heißt dicht, wenn der Grad jedes Knotens<br />
größer gleich n=2 ist, d.h. es muß mindestens n=2 Kanten in dem Graphen geben<br />
und jeder Knoten muß inzident mit mindestens n=2 dieser Kanten sein.<br />
Für eine Knotenfolge v 1 ;v 2 ;::: ;v k gelte (v i ;v i +1)2 E für i =1;::: ;k,<br />
1. Dann heißt die zugehörige Kantenfolge ein Weg. Ein Weg bei dem Anfangsund<br />
Endknoten zusammenfallen, und der mindestens eine Kante enthält, heißt ein<br />
Kreis.<br />
Ein Graph B = (V;E) heißt bipartit, falls die Knotenmenge V sich so als<br />
Vereinigung zweier Mengen X und Y darstellen läßt, daß alle Kanten einen Knoten<br />
in X und den anderen in Y haben.<br />
Eine Teilmenge M E der Kantenmenge eines bipartiten Graphen B =<br />
(V;E) heißt Matching, falls kein Knoten aus V mit mehr als einer Kante von M inzident<br />
ist. <strong>Die</strong> Größe eines Matchings ist durch die Anzahl seiner Kanten gegeben<br />
und die Größe einer Knotenmenge V ist wie üblich durch die Anzahl der Elemente<br />
jV j in V definiert.<br />
Gilt für einen bipartiten Graph B =(V = X [ Y;E), daßjXj jY j und ist<br />
jeder Knoten x 2 X inzident mit einer Kante von M, dann heißt das Matching<br />
perfekt. Ein Matching max<strong>im</strong>aler Größe wird als max<strong>im</strong>ales Matching bezeichnet.<br />
Wie läßt sich nun die Berechnung der <strong>Permanente</strong> graphentheoretisch formulieren<br />
? Der Ausgangspunkt bildet wieder die Definition der <strong>Permanente</strong> nach Gleichung<br />
(3.2):<br />
per (A) =<br />
X<br />
2S n<br />
n Y<br />
i=1<br />
a i(i) : (3.23)<br />
Der entscheidende Teil dieser Formel, der die Berechnung der <strong>Permanente</strong> so schwierig<br />
macht, ist offensichtlich die Summe über alle Permutationen.
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 25<br />
Jede Permutation 2 S n ist nichts anderes als eine 1-zu-1-Abbildung der<br />
ersten n natürlichen Zahlen auf sich selbst:<br />
1 ,! (1)<br />
2 ,! (2)<br />
.<br />
. (3.24)<br />
n ,! (n) :<br />
Wird jeder Permutation 2 S n eine ”<br />
grafische Abbildung“ wie in (3.24) zugeordnet,<br />
so läßt sich die Überlagerung aller dieser Abbildungen als bipartiter Graph<br />
interpretieren. Jede Permutation ist dann nichts anderes als perfektes Matching<br />
dieses bipartiten Graphen. Mit geeigneten graphentheoretischen Algorithmen, die<br />
weiter unten vorgestellt werden, lassen sich alle perfekten Matchings eines Graphen<br />
und damit in diesem Spezialfall alle Permutationen 2 S n berechnen.<br />
Im allgemeinen Fall bietet diese graphentheoretische Formulierung keinen Vorteil,<br />
da diese nur eine andere Möglichkeit bietet, alle n! Permutationen der Zahlen<br />
1;::: ;nzu berechnen.<br />
Falls nun aber einige der Matrixelemente a ij gleich null sind, so fallen in Gleichung<br />
(3.23) viele der Produkte unter der Permutationssumme weg, d.h. es muß<br />
nur über die Permutationen summiert werden, bei denen keine Zeilen- oder Spaltenindizes<br />
auftauchen, die Nullelemente der Matrix indizieren.<br />
Alle diese zulässigen Permutationen lassen sich wie folgt graphentheoretisch<br />
best<strong>im</strong>men: Sei B =(V = X[Y;E) ein bipartiter Graph, mit X = fx 1 ;::: ;x n g,<br />
Y = fy 1 ;::: ;y n g und (x i ;y i ) 2 E genau dann, wenn a ij 6=0.Dannistfür jede<br />
Permutation 2 S n die Aussage<br />
äquivalent zu der Aussage, daß<br />
nY<br />
i=1<br />
a i(i) 6=0 (3.25)<br />
M = f(x i ;y (i) ji =1;::: ;ng\E (3.26)<br />
ein perfektes Matching ist. Der Wert der <strong>Permanente</strong> ergibt sich schließlich durch<br />
Summation über alle Permutationen 2 S n , die einem perfekten Matching entsprechen.<br />
<strong>Die</strong>se abstrakt formulierte Idee läßt sich an einem Beispiel verdeutlichen: Sei<br />
A die 3 3 Matrix<br />
0 1<br />
@ a 11 a 12 0<br />
0 a 22 a 23<br />
0 a 32 a 33<br />
Dann n<strong>im</strong>mt der Graph G =(X [ Y;E) die Gestalt<br />
A : (3.27)
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 26<br />
x 1<br />
x 2<br />
s<br />
s y<br />
H 1<br />
HHHHH<br />
<br />
s<br />
s y<br />
H 2<br />
HHHHH<br />
x 3<br />
s <br />
s<br />
y 3<br />
an und es lassen sich 3 perfekte Matchings M 1 ;M 2 ;M 3 finden 3 :<br />
x 1<br />
x 2<br />
x 3<br />
s<br />
s<br />
s<br />
s y 1<br />
s<br />
s y 2<br />
M 1<br />
y 3<br />
x 1<br />
x 2<br />
x 3 H s<br />
s<br />
s<br />
s y 1<br />
s y 2<br />
s<br />
H<br />
HHHH<br />
<br />
M 1<br />
y 3<br />
x 1<br />
x 2<br />
x 3 H<br />
HHHH<br />
s s<br />
s<br />
s<br />
s y 1<br />
s y 2<br />
M 1<br />
y 3<br />
In dem Artikel von ITAI ET AL. [?] wird nun ein (<strong>im</strong> Detail sehr komplizierter) Algorithmus<br />
vorgestellt, der für einen vorgegebenen bipartiten Graph alle perfekten<br />
Matchings mit einem Berechnungsaufwand von<br />
O(e( p n + m)) (3.28)<br />
findet, wobei e die Anzahl der Kanten m die Anzahl der perfekten Matchings und<br />
n die Anzahl der zu permutierenden Elemente angibt.<br />
Welche Werte e und m annehmen, hängt davon ab, wie viele der Permutationenzuberücksichtigen<br />
sind d.h. wie viele der n 2 Komponenten der Matrix verschwinden.<br />
Falls keine Komponente verschwindet, entspricht jede Permutation einem<br />
möglichen perfekten Matching und jedes Matching hat n Kanten. Damit ist<br />
m = n! und e = n n!, der Rechenaufwand steigt also wie bei der Definition<br />
wieder mit der Fakultät von n an.<br />
Für eine Matrix, bei der einige Komponenten verschwinden, sieht dies etwas<br />
anders aus: Wird für einen festen Index i die Anzahl der möglichen Partnerindizes<br />
j,für die a ij 6=0gilt, mit f i bezeichnet, so ergibt sich für die Anzahl der möglichen<br />
Kanten<br />
e =<br />
nY<br />
i=1<br />
(n , f i ): (3.29)<br />
Für die Anzahl m der perfekten Matchings d.h. die Anzahl der zulässigen Permutationen<br />
kann keine geschlossene Formel angegeben werden. Es wurde aber <strong>im</strong><br />
3 Wie sich solche Graphen finden lassen, daß ist gerade ein ein aktuelles Forschungsgebiet in der<br />
Graphentheorie. Bei kleinen Graphen bleibt nur der Weg des Ausprobierens ...
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 27<br />
Rahmen der Graphentheorie gezeigt, daß für sogenannte dichte Graphen (engl.:dense<br />
graphs) prinzipiell eine Berechnung der perfekten Matchings mit einem polynomialen<br />
Aufwand in n möglich ist und es gibt Hinweise darauf, daß Algorithmen<br />
von der hier vorgestellten Art dieses Kriterium erfüllen [?].<br />
3.2.4 Das KKLLL-Näherungsverfahren<br />
Bei dem KKLLL–Verfahren, das nach seinen Erfindern KARMARKAR, KARP,<br />
LIPTON, LOVÁSZ und LUBY benannt ist, handelt es sich um einen Monte–Carlo–<br />
Algorithmus zur näherungsweisen Berechnung der <strong>Permanente</strong> einer nichtnegativen<br />
Matrix [?]. <strong>Die</strong>ses Verfahren ist auch für die Berechnung der <strong>Permanente</strong> <strong>im</strong><br />
<strong>Pfadintegral</strong> interessant, da diese — wie später noch näher erläutert wird — ebenfalls<br />
nichtnegativ ist.<br />
Das Besondere an diesem Algorithmus ist es, daß er für eine n n Matrix A<br />
mit nichtnegativen Komponenten und zwei vorgegebenen positiven Parametern <br />
und einen Schätzwert Y für perA ermittelt, der die Bedingung<br />
Pr [(1 , )perA Y (1 + )perA] 1 , (3.30)<br />
erfüllt 4 und eine Laufzeit von der Ordnung<br />
<br />
<br />
<br />
O 2 n=2 1 1<br />
2 log poly(n)<br />
<br />
(3.31)<br />
hat. Damit ist die Laufzeit dieses Algorithmus für nichtnegative Matrizen <strong>im</strong> wesentlichen<br />
die Wurzel aus der Laufzeit für das Ryser–Verfahren (Abschnitt 3.2.2).<br />
Das KKLLL-Verfahren läßt sich am besten verstehen, wenn zunächst ein einfacheres<br />
Verfahren nach GODSIL/GUTMAN betrachtet wird, das von der Ähnlichkeit<br />
zwischen Determinanten und <strong>Permanente</strong>n Gebrauch macht.<br />
Sei A eine n n Matrix mit nichtnegativen Komponenten a ij und sei S <br />
S n die Menge aller Permutationen von f1;::: ;ng so daß a i(i) 6= 0 für alle<br />
i = 1;::: ;n. Es gibt also eine 1–1–Abbildung von Termen, die zur <strong>Permanente</strong><br />
beitragen und Permutationen in S.<br />
Weiter sei für alle 2 S die Größe<br />
sgn () =(,1) t (3.32)<br />
definiert, wobei t die Anzahl der Elementarpermutationen bezeichne aus denen <br />
besteht. Damit folgt<br />
det A =<br />
perA =<br />
X<br />
2S<br />
X<br />
sgn()<br />
nY<br />
2S i=1<br />
nY<br />
i=1<br />
a i(i) (3.33)<br />
a i(i) ; (3.34)<br />
4 Mit Pr[] ist hier die Wahrscheinlichkeit für das Eintreten des Ereignisses gemeint.
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 28<br />
mit nur noch nichtverschwindenden Summanden — <strong>im</strong> Gegensatz zur Definition.<br />
<strong>Die</strong> Grundidee des Godsil/Gutman–Verfahrens:<br />
Sei für alle nichtverschwindenden Matrixelemente a i(i) 6=0zufällig eine Zahl b ij<br />
aus den zwei Wurzeln f p a ij ; , p a ij g gewählt. Mit Hilfe dieser Zufallszahlen läßt<br />
Q n<br />
sich eine Familie von paarweise unabhängigen Zufallsvariablen x :=<br />
i=1 b i(i)<br />
erzeugen.<br />
,P<br />
Für den Erwartungswert von<br />
2S sgn() x 2<br />
findet sich nun aber<br />
2<br />
E 4 X ! 2<br />
3<br />
X<br />
sgn() x <br />
5 <br />
= E sgn 2 () x 2 <br />
2S<br />
2S<br />
X<br />
+<br />
1 ; 2 2S<br />
1 6= 2<br />
sgn( 1 )sgn( 2 ) E [x 1 x 2 ] (3.35)<br />
Der erste Term in Gleichung (3.35) ergibt mit der Definition der x und unter<br />
Berücksichtigung von sgn 2 () =1gerade die <strong>Permanente</strong> der Matrix A:<br />
X<br />
2S<br />
E sgn 2 () x 2 <br />
<br />
=<br />
X<br />
nY<br />
2S i=1<br />
(b i(i) ) 2 =<br />
X<br />
nY<br />
2S i=1<br />
a i(i) =perA:<br />
(3.36)<br />
Der zweite Term in Gleichung (3.35) verschwindet, da die Zufallsvariablen<br />
fx ; 2 Sg paarweise unabhängig sind und somit E[x 1 x 2 ]=0für 1 6= 2 .<br />
Identifizieren wir nun noch<br />
det B =<br />
X<br />
2S<br />
so folgt aus Gleichung (3.35) die Formel<br />
E<br />
sgn() x ; (3.37)<br />
h<br />
(det B) 2i =perA: (3.38)<br />
Der Godsil/Gutman–Est<strong>im</strong>ator Y für die <strong>Permanente</strong> einer nichtnegativen Matrix<br />
A läßt sich also algorithmisch wie folgt best<strong>im</strong>men:<br />
1. Aus der Matrix A wird nach folgender Vorschrift eine n n Matrix B konstruiert:<br />
(a) Wenn a ij =0,dannb ij := 0.<br />
(b) Sonst wähle zufällig und unabhängig für b ij eine der beiden Wurzeln<br />
f p a ij ; , p a ij g.<br />
2. Y := (det B) 2 .<br />
Der KKLLL–Algorithmus basiert auf einem besseren Est<strong>im</strong>ator für die <strong>Permanente</strong>,<br />
der aber nach demselben Prinzip wie der Godsil/Gutman–Est<strong>im</strong>ator gebildet<br />
wird.
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 29<br />
Seien<br />
p p<br />
w 0 =1; w 1 = , 1 3<br />
2 + i; w 2 = , 1 3<br />
, i (3.39)<br />
4 2 4<br />
die drei komplexen kubischen Wurzeln der Eins. Der KKLLL–Est<strong>im</strong>ator Z berechnet<br />
sich wie folgt:<br />
1. Aus der Matrix A wird nach folgender Vorschrift eine n n Matrix B konstruiert:<br />
(a) Wenn a ij =0,dannb ij := 0.<br />
(b) Sonst wähle zufällig und unabhängig b ij 2f p a ij w 0 ; p a ij w 1 ; p a ij w 2 g<br />
mit der Wahrscheinlichkeit 1=3 für jede Wahl.<br />
2. Z := det B (det B) <br />
Daß der KKLLL–Est<strong>im</strong>ator Z ebenfalls einen Schätzwert für die <strong>Permanente</strong><br />
von A liefert, läßt sich wie be<strong>im</strong> Godsil/Gutman–Est<strong>im</strong>ator zeigen.<br />
Der Beweis, daß der KKLLL–Est<strong>im</strong>ator Z tatsächlich eine (; )–Approx<strong>im</strong>ation<br />
für die <strong>Permanente</strong> gemäß Gl. (3.30) und (3.31) liefert, ist <strong>im</strong> Detail sehr technisch<br />
und deshalb wird an dieser Stelle nur die Grundidee skizziert.<br />
Der KKLLL–Algorithmus liefert nach N unabhängigen Versuchen einen Schätzwert<br />
1<br />
N<br />
NX<br />
i=1<br />
Z i (3.40)<br />
für die <strong>Permanente</strong>, wobei Z i das Ergebnis des i–ten Versuchs sei. Mit der Tschebyscheffschen<br />
Ungleichung folgt, daß<br />
N = E[Z2 ]<br />
1<br />
(3.41)<br />
(E[Z]) 2 2 <br />
genügt, damit Z eine (; )–Approx<strong>im</strong>ation für die <strong>Permanente</strong> ist. Nun ist es<br />
möglich, für diesen Algorithmus zu zeigen, daß der Quotient der Erwartungswerte<br />
nach oben beschränkt ist:<br />
E[Z 2 ]<br />
(E[Z]) 2 2n=2 ; (3.42)<br />
und damit wäre der Beweis beendet.<br />
3.3 Eigene Versuche zur Berechnung der <strong>Permanente</strong><br />
3.3.1 Eigenschaften der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong><br />
In diesem Abschnitt sollen die spezifischen mathematischen Eigenschaften der <strong>Permanente</strong><br />
von der <strong>im</strong> <strong>Pfadintegral</strong> auftauchenden Matrix A( +1;) näher untersucht<br />
werden.
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 30<br />
Laut Gleichung (2.28) hat die Matrix A( +1;) die Gestalt<br />
(A) ij = exp , , (~x i , ~y j ) 2 i; j =1;::: ;N (3.43)<br />
wobei <strong>im</strong> folgenden die Abkürzungen<br />
m<br />
= M 3=2<br />
; (3.44)<br />
2~ 2 <br />
m = M 2~ 2 = 2=3 ; (3.45)<br />
~x i = ~r i ( +1); (3.46)<br />
~y j = ~r j (); (3.47)<br />
benutzt werden sollen.<br />
Zunächst läßt sich feststellen, daß die Matrix A nicht symmetrisch ist, da ~x i<br />
und ~y j auf zwei benachbarten Zeitscheiben liegen und daß<br />
Rang A = N (3.48)<br />
gilt. Es gibt aber eine Art verborgene Symmetrie, denn die N 2 Komponenten von<br />
A werden durch nur 2N Koordinatenvektoren ~x i ;~y j 2 R 3 erzeugt.<br />
Betrachten wir nun die Komponenten der Matrix <strong>im</strong> einzelnen. Aus (3.44) und<br />
(3.45) folgt, daß und für Temperaturen über dem absoluten Nullpunkt <strong>im</strong>mer<br />
positiv sind. Mit der Nichtnegativität des Skalarproduktes (~x i , ~y j ) 2 ergibt sich,<br />
daß die möglichen Matrixkomponenten (A) ij aus dem Wertebereich der Funktion<br />
stammen, d.h.<br />
u ,! e ,u2 ; u 2 R0 (3.49)<br />
(A) ij 2 ]0; 1] i; j =1;::: ;N: (3.50)<br />
<strong>Die</strong> Matrix A ist mathematisch formuliert also nichtnegativ und finit d.h. für<br />
N ! 1 gilt perA N !. Im Gegensatz zur Determinante übeträgt sich diese<br />
Eigenschaft der Matrix auch auf die <strong>Permanente</strong> von A.<br />
Wenden wir uns nun der <strong>Permanente</strong> von A zu. In einem ersten Schritt läßt sich<br />
die Multilinearität der <strong>Permanente</strong> als algebraische Abbildung ausnutzen. Für jede<br />
Komponente von A gilt<br />
(A) ij = exp , , (~x i , ~y j ) 2 (3.51)<br />
= exp , , (~x 2 i + ~y2 j ) exp (+2 ~x i ~y j ) : (3.52)<br />
Da die <strong>Permanente</strong> linear in jeder Zeile und Spalte ist, kann in jeder Zeile<br />
von A ein Faktor exp(,~x 2 i ) und in jeder Spalte ein Faktor exp(,~y2 j ) vor die<br />
<strong>Permanente</strong> geholt werden. Damit folgt für perA sofort<br />
per A =() N N Y<br />
i=1<br />
exp , , (~x 2 i + ~y2 i )! perB; (3.53)
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 31<br />
wobei die Matrix B definiert ist durch<br />
(B) ij = exp (+2 ~x i ~y j ) i; j =1;::: ;N: (3.54)<br />
Es ist also ”<br />
nur noch“ die <strong>Permanente</strong> der Matrix B zu best<strong>im</strong>men. Formal–<br />
mathematisch gesehen ist dies sehr einfach:<br />
perB =<br />
=<br />
X<br />
Y<br />
N<br />
exp (2 ~x i ~y Pi ) (3.55)<br />
P 2S N i=1<br />
!<br />
X NX<br />
exp 2 ~x i ~y Pi : (3.56)<br />
P 2S N i=1<br />
Für praktische Anwendungen ist der Ausdruck (3.56) jedoch unbrauchbar, da<br />
zur Berechnung der Permutationssumme die Exponentialfunktion N ! mal numerisch<br />
ausgewertet werden müßte, was schon für kleine N zu illusorischen Berechnungszeiten<br />
führen würde.<br />
Andererseits zeigt Gleichung (3.56) auch, daß es nicht möglich sein wird, einen<br />
exakten Ausdruck für perB — und damit für perA — zu best<strong>im</strong>men, der nicht die<br />
Summe über alle Permutationen enthält.<br />
<strong>Die</strong>s liegt ganz einfach daran, daß es für jede der N ! verschiedenen Permutationen<br />
einen eindeutigen Exponenten<br />
NX<br />
i=1<br />
2 ~x i ~y Pi (3.57)<br />
gibt, der sich von allen anderen (N !,1) möglichen Exponenten unterscheidet. Das<br />
N !–fache Auswerten der Exponentialfunktion pro Berechnung der <strong>Permanente</strong> ist<br />
also nicht zu vermeiden !<br />
3.3.2 Mathematisch motivierter Näherungsversuch<br />
Da es nicht möglich ist, einen exakten Ausdruck für die <strong>Permanente</strong> der Matrix A<br />
(bzw. der Matrix B) herzuleiten, der eine effiziente Berechnung ermöglicht, ist es<br />
wünschenswert, zumindestens einen Näherungsausdruck für perA (bzw. per B)<br />
zu erhalten.<br />
Eine solche Näherung per ~ A soll zum einen natürlich die Struktur des exakten<br />
mathematischen Ausdrucks perA soweit vereinfachen, daß eine effiziente Berechnung<br />
der Näherung per ~ A möglich ist. Des weiteren ist zu beachten, daß durch die<br />
physikalische oder mathematisch motivierte Näherung nicht zu viel von der physikalischen<br />
Information verlorengeht, die in dem ursprünglichen, exakten Ausdruck<br />
enthalten war.<br />
Ein erster, mathematisch motivierter Näherungsansatz besteht darin, die Exponentialfunktion<br />
in den einzelnen Komponenten der Matrix B in Potenzreihen zu
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 32<br />
entwickeln. Beschränken wir uns <strong>im</strong> folgenden auf ein eind<strong>im</strong>ensionales System,<br />
so liefert eine solche Näherung bis zur Ordnung l<br />
(B) ij =<br />
lX<br />
k=0<br />
1<br />
k! (x i) k (y j ) k : (3.58)<br />
Im Falle des fermionischen <strong>Pfadintegral</strong>es wurde von BORRMANN gezeigt, daß<br />
sich mit dieser Näherung die Determinante der Matrix B mit O(N 2 ) Multiplikationen<br />
berechnen läßt [?].<br />
<strong>Die</strong> Näherungsmatrix B ~ läßt sich nämlich in ein Produkt RST aus zwei Vandermonde–Matrizen<br />
R; T und einer Diagonalmatrix S zerlegen:<br />
~B =<br />
0<br />
B<br />
@<br />
1 x 1 x 2 1<br />
<br />
1 x 1 x 2 1<br />
<br />
. . . .<br />
1 x 1 x 2 1<br />
<br />
10<br />
C<br />
A<br />
B<br />
@<br />
1<br />
0!<br />
1<br />
0 0 <br />
1<br />
0 0 <br />
1!<br />
1<br />
0 0 C<br />
2! A<br />
.<br />
. . . ..<br />
0<br />
B<br />
@<br />
1 1 1<br />
y 1 y 2 y N<br />
y1 2 y2 2 yN<br />
2<br />
.<br />
.<br />
.<br />
.<br />
1<br />
C<br />
A (3.59)<br />
Durch die für die Determinante erlaubte Produktzerlegung ergibt sich für det ~ B<br />
der Ausdruck<br />
det ~ B = det R det S det T (3.60)<br />
=<br />
Y<br />
1j
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 33<br />
Es gibt nun ein abstraktes Reduktionskriterium für Irreduzibilität, daß sich<br />
glücklicherweise sehr gut für eine algorithmische Umsetzung eignet. <strong>Die</strong>s ermöglicht<br />
es, mit den schon oben erwähnten Computeralgebra–Systemen eine eindeutige<br />
Aussage darüber zu machen, ob ein konkretes multivariates Polynom irreduzibel<br />
ist, oder nicht [?].<br />
Werden nun für n = 3; 4; 5 die entsprechenden Polynome für die <strong>Permanente</strong><br />
und für die Determinante berechnet, so lautet die eindeutige Antwort der<br />
Computeralgebra–Systeme, daß die von der Determinante stammenden Polynome<br />
reduzibel und die von der <strong>Permanente</strong> stammenden irreduzibel sind.<br />
<strong>Die</strong> Ursache für das unterschiedliche Verhalten von det ~ B und per ~ B kann nur<br />
darin begründet liegen, daß es bei der Determinante durch die auftretenden negativen<br />
Vorzeichen zur Auslöschung von Termen innerhalb des Polynoms kommt.<br />
<strong>Die</strong>ses Ergebnis ist nun kein mathematischer Beweis dafür, daß sich per ~ B<br />
auch für n > 5 nicht faktorisieren läßt, aber dieses Resultat macht eine solche<br />
Vermutung unwahrscheinlich.<br />
Ein weiteres Argument dafür, warum sich det ~ B und per ~ B so unterschiedlich<br />
verhalten müssen, ergibt sich, indem die Multilinearität von Determinante und<br />
<strong>Permanente</strong> ausgenutzt wird, um die Summanden in jeder Komponente von (3.58)<br />
auseinanderzuziehen.<br />
Durch die Linearität in der 1–ten Zeile wird per ~ B so in eine Summe von l +1<br />
<strong>Permanente</strong>n zerlegt. Wird bei jeder dieser Matrizen die Linearität in der 2–ten<br />
Zeile ausgenutzt, so ergibt sich für per ~ B eine Summe von (l +1) 2 <strong>Permanente</strong>n.<br />
Insgesamt erhalten wir durch dieses Vorgehen die Formel<br />
per ~ B =<br />
(l+1)<br />
X<br />
N<br />
q=1<br />
per C q ; (3.62)<br />
wobei die Komponenten der l N Matrizen C q durch die Summanden der Exponentialreihe<br />
gebildet werden.<br />
<strong>Die</strong> Anzahl der in der Summe (3.62) zu berechnenden <strong>Permanente</strong>n steigt exponentiell<br />
in der Matrixgröße N an, falls nicht von vornherein viele der <strong>Permanente</strong>n<br />
nur einen Nullbeitrag liefern.<br />
<strong>Die</strong>s ist jedoch unwahrscheinlich, da die Komponenten der exakten Matrix B<br />
größer Null sind und durch die Näherung nur wenige Komponenten der Matrix B ~<br />
verschwinden werden. Damit die <strong>Permanente</strong> einer nichtnegativen N N–Matrix<br />
null wird, darf die Matrix selbst aber nicht mehr als N , 1 Komponenten verschieden<br />
von der Null haben, damit in Gleichung (3.2) alle Summanden einzeln zu Null<br />
werden.<br />
Für Determinanten stellt sich dieser Sachverhalt vorteilhafter dar, denn für alle<br />
C q mit Rang C q
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 34<br />
verschieden von allen anderen Potenzen in den anderen N , 1 Zeilen sind, z.B.<br />
0<br />
B<br />
@<br />
x 1 y 1 x 1 y 2 x 1 y 3 <br />
x 7 2 y7 1<br />
x 7 2 y7 2<br />
x 7 2 y7 3<br />
<br />
1 1 1 <br />
.<br />
.<br />
.<br />
.<br />
1<br />
C<br />
A : (3.63)<br />
Ist die Entwicklungsordnung l =0; 1; 2;::: kleiner als N ,1, so sind nicht genug<br />
verschiedene Potenzen in k =0;::: ;lvorhanden, um die lineare Unabhängigkeit<br />
der Matrixzeilen bzw. Spalten zu gewährleisten und damit<br />
det C q =0 für alle q =1;::: ;(l +1) N : (3.64)<br />
<strong>Die</strong>se Beobachtung liefert einen Hinweis darauf, warum in der Vandermonde–<br />
Zerlegung von det ~ B die Entwicklungsordnung an die Teilchenzahl gekoppelt sein<br />
muß.<br />
3.3.3 Physikalisch motivierter Näherungsversuch<br />
Um zu einer physikalisch motivierten Näherung zu gelangen, betrachten wir wieder<br />
die <strong>Permanente</strong> der Matrix A, in der direkt die Differenzen von Teilchenkoordinaten<br />
eingehen.<br />
Bei einem System von N <strong>Bosonen</strong> in einem Wärmebad der Temperatur T ist<br />
physikalisch zu erwarten, daß sich das System bei hohen Temperaturen T 0<br />
klassisch verhält, also in der <strong>Permanente</strong> die identischen Permutationen den einzigen<br />
wesentlichen Beitrag liefern sollen.<br />
Bei sinkenden Temperaturen werden die Anteile der Permutationen nahe der<br />
Identität an Bedeutung gewinnen und be<strong>im</strong> (nicht erreichbaren) absoluten Temperaturnullpunkt<br />
sollten alle Permutationen eine gleichberechtigte Rolle spielen.<br />
Findet <strong>im</strong> <strong>Pfadintegral</strong> die Permutation der Teilchenindizes zwischen den Zeitscheiben<br />
und +1statt, so bedeutet dies, daß bei hohen Temperaturen nur für<br />
den gleichen Teilchenindex i die Koordinatenabstände<br />
j~r i ( +1), ~r i ()j (3.65)<br />
zwischen den Zeitscheiben klein werden, also nur die Diagonalelemente in der<br />
Matrix A( +1;) wesentlich von Null verschieden sind.<br />
Mit sinkenden Temperaturen tauchen nun vermehrt auch für verschiedene Teilchen<br />
i und j geringere Abstände<br />
j~r i ( +1), ~r j ()j (3.66)<br />
auf, die Nebendiagonalelemente von A( +1;) nehmen also an Bedeutung zu.<br />
Als Näherung bietet es sich offensichtlich an, die unbedeutenden Permutationen<br />
zu vernachlässigen. <strong>Die</strong>se sind ja gerade dadurch charakterisiert, daß für sie
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 35<br />
das Produkt<br />
NY , exp , (~x i , ~y 2 j ) (3.67)<br />
i=1<br />
nur einen sehr unwesentlichen Beitrag zur Summe über alle Permutationen P 2<br />
S N liefert.<br />
Praktisch läßt sich diese Näherung dadurch umsetzen, daß aus der Matrix A eine<br />
Näherungsmatrix ~ A erzeugt wird, indem die zahlenmäßig kleinsten Matrixelemente<br />
dynamisch — d.h. <strong>im</strong> Verlauf der Monte–Carlo–S<strong>im</strong>ulation — gleich Null<br />
gesetzt werden. Damit stellt sich dann auch die Frage, wie sich die <strong>Permanente</strong> der<br />
so erzeugten Matrix ~ A berechnen läßt.<br />
Rückführung auf eine Hessenberg–Matrix<br />
Ein Ansatz könnte daraus bestehen, so viele Elemente der Matrix A auf Null zu setzen,<br />
daß per ~ A durch Vertauschen von Zeilen und Spalten in die <strong>Permanente</strong> einer<br />
Hessenberg–Matrix (3.8) überführt werden kann. Nach Gleichung (3.10) ließe sich<br />
dann die <strong>Permanente</strong> auf die Determinante einer ähnlichen Matrix zurückführen<br />
und mit einem Aufwand O(N 3 ) berechnen.<br />
Nun enthält eine n n Hessenberg–Matrix 1=2 (n , 1)(n , 2) Nullkomponenten<br />
oberhalb der Diagonale, es müssen also mindestens genauso viele Komponenten<br />
in der Matrix A auf Null gesetzt werden. Wie aus Tabelle 3.1 zu entnehmen<br />
ist, muß für größere Matrizen annähernd die Hälfte aller Matrixkomponenten auf<br />
Null gesetzt werden.<br />
n n 2 1=2 (n , 1)(n , 2)<br />
10 100 36<br />
20 400 171<br />
30 900 406<br />
40 1600 741<br />
50 2500 1176<br />
100 10000 4851<br />
500 250000 124251<br />
1000 1000000 498501<br />
Tabelle 3.1: Anzahl der Nullelemente oberhalb der Diagonalen in Abhängigkeit<br />
von der Matrixgröße für eine Hessenberg-Matrix.<br />
<strong>Die</strong> Tatsache, daß die genäherte Matrix ~ A erst durch Zeilen– und Spaltenvertauschungen<br />
in eine Hessenberg–Matrix überführt werden soll, erzwingt, daß nicht<br />
einfach die 1=2 (n , 1)(n , 2) kleinsten Komponenten auf Null gesetzt werden<br />
können ! Denn Zeilenvertauschungen können niemals die Anzahl der Nullen in einer<br />
Spalte ändern und umgekehrt können Spaltenvertauschungen nicht die Zahl der<br />
Nullen in einer Zeile ändern.
KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 36<br />
Der einzig praktikable Weg wäre also der, daß in einem algorithmischen Verfahren<br />
angefangen mit der kleinsten Komponente von A nach und nach die Matrixkomponenten<br />
auf Null gesetzt werden und in jedem Schritt die nötigen Zeilen– und<br />
Spaltenumformungen vorgenommen werden, um die Matrix in die Hessenberg–<br />
Form zu bringen.<br />
Ähnliche Algorithmen sind in der Kombinatorik bekannt [?]. Bei diesen Verfahren<br />
werden die aus dem numerischen Lösen linearer Gleichungssysteme bekannten<br />
Pivotisierungsalgorithmen, bei denen die Zeilen der Koeffizientenmatrix<br />
in eine numerisch günstige Reihenfolge gebracht werden, mit der Backtracking–<br />
Methode kombiniert, die es erlaubt, best<strong>im</strong>mte Zeilenvertauschungen auszuprobieren.<br />
Das Laufzeitverhalten solcher Algorithmen ist ebenfalls polynomial in der<br />
Matrixgröße.<br />
Anwendung graphentheoretischer Algorithmen<br />
Wie <strong>im</strong> vorherigen Abschnitt aufgezeigt wurde, läßt sich selbst durch eine sehr<br />
drastische Näherung, bei der nahezu die Hälfte aller Matrixkomponenten zu Null<br />
gesetzt werden, keine analytische Formel für die <strong>Permanente</strong> angeben.<br />
Deshalb erscheint es naheliegend, von vornherein die Berechnung der <strong>Permanente</strong><br />
der Näherungsmatrix durch ein algorithmisches Verfahren vorzunehmen.<br />
Von den in Abschnitt 3.2 vorgestellten allgemeinen Rechenverfahren hat ja gerade<br />
der graphentheoretische Algorithmus 3.2.3 von ITAI ET. AL. die Eigenschaft,<br />
daß sein Berechnungsaufwand mit steigender Anzahl von Nullkomponenten in der<br />
Matrix abfällt.<br />
3.3.4 Andere Versuche<br />
Ein anderer Versuch, die Berechnung der <strong>Permanente</strong> auf die Berechnung der Determinante<br />
zurückzuführen, macht von der einfach zu beweisenden Formel<br />
(per C) (det C) = det C (2) + f (C) (3.68)<br />
mit<br />
f (C) =<br />
X<br />
; 0 2Gn<br />
6= 0 n Y<br />
i=1<br />
(C) i;(i) (C) i;(i) 0 +<br />
X<br />
; 0 2Un<br />
6= 0 n Y<br />
i=1<br />
(C) i; (i) (C) i; 0 (i)<br />
(3.69)<br />
Gebrauch [?]. In dieser Formel bezeichnet C (2) diejenige Matrix, die aus C entsteht,<br />
indem alle Komponenten quadriert werden und G n (bzw. U n ) die Menge<br />
aller geraden (bzw. ungeraden) Permutationen.<br />
<strong>Die</strong> Berechnung von perC läßt sich nun auf die Berechnung von det C und<br />
det C (2) zurückführen, wenn der Restterm f (C) sich einfach berechnen läßt.<br />
Wird für die Matrix C der Näherungsausdruck ~ B aus Abschnitt 3.3.2 für die<br />
<strong>im</strong> <strong>Pfadintegral</strong> vorkommende Matrix eingesetzt, so ergibt sich ein Restterm f (A),<br />
der für N =3; 4 wieder auf ein irreduzibles Polynom führt.
Kapitel 4<br />
Vergleich der verschiedenen<br />
Berechnungsverfahren<br />
Da es <strong>im</strong> Rahmen dieser Arbeit nicht gelungen ist, eine einfache ”<br />
Formel“ zu finden,<br />
die eine effiziente Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>thermodynamischen</strong> <strong>Pfadintegral</strong><br />
gestattet, bleibt uns an dieser Stelle nur die Betrachtung der algorithmischen<br />
Lösungsansätze.<br />
Von den vorgestellten Verfahren zur Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>thermodynamischen</strong><br />
<strong>Pfadintegral</strong> ist bis heute das von NIJENHUIS und WILF verbesserte<br />
Verfahren nach RYSER mit einem Aufwand von der Ordnung O((n , 1)2 n,1 )<br />
<strong>im</strong>mer noch die schnellste Methode, um die <strong>Permanente</strong> exakt zu berechnen.<br />
Mit dem KKLLL–Verfahren ist es dagegen möglich, die <strong>Permanente</strong> näherungsweise<br />
durch den Mittelwert vieler Determinanten anzunähern. <strong>Die</strong> Güte dieser<br />
Näherung wird dabei durch die Anzahl l der berechneten Determinanten best<strong>im</strong>mt,<br />
womit der Aufwand des KKLLL–Verfahrens in der Größenordnung von<br />
l n 3 liegt.<br />
In Abbildung 4.1 ist der Rechenaufwand für das Ryser–Verfahren und verschieden<br />
genaue KKLLL–Näherungen in Abhängigkeit von der Matrixgröße n aufgetragen.<br />
Von Interesse ist nun, ab welcher Matrixgröße N das Ryser–Verfahren einen<br />
größeren Berechnungsaufwand als die anderen Verfahren hat. Der Wert für n,<br />
bei dem zwei Verfahren denselben Rechenaufwand haben, wird auch als ”<br />
Break–<br />
Even–Point“ der Verfahren bezeichnet.<br />
In der Abbildung ist zu erkennen, daß das Ryser–Verfahren bis zu n =6einen<br />
geringeren Aufwand als die KKLLL–Näherung mit l = 1 hat. Der Wert l = 1<br />
<strong>im</strong>pliziert die Berechnung einer einzigen Determinante und entspricht damit auch<br />
dem Berechnungsaufwand für den fermionischen Fall.<br />
Für größere n führt der exponentiell ansteigende Rechenaufwand zu einem<br />
unakzeptablen Laufzeitverhalten. Bei einem Wert von n = 13, der physikalisch<br />
z.B. bei der ersten vollständigen Ikosaederkonfiguration eines Edelgasclusters von<br />
Interesse ist, hat das Ryser–Verfahren bereits einen um einen Faktor 23 höheren<br />
37
KAPITEL 4. VERGLEICH DER BERECHNUNGSVERFAHREN... 38<br />
Rechenaufwand<br />
10 10<br />
10 8<br />
10 6<br />
10 4<br />
10 2<br />
10 0<br />
Ryser<br />
KKLLL (l=1)<br />
KKLLL (l=10)<br />
KKLLL (l=100)<br />
KKLLL (l=1000)<br />
0 5 10 15 20<br />
n<br />
Abbildung 4.1: Vergleich des Rechenaufwands für das Ryser–Verfahren und das<br />
KKLLL–Verfahren. Für das KKLLL–Verfahren sind verschiedene Werte des Parameters<br />
l eingezeichnet.<br />
Berechnungsaufwand als bei der Determinante.<br />
Im Gegensatz dazu ist die Laufzeit der KKLLL–Näherung ”<br />
nur“ um den konstanten<br />
Faktor l länger als be<strong>im</strong> fermionischen Fall. Wählen wir den Faktor sehr<br />
groß, z.B. l = 1000, so hat diese Näherung schon ab n =20einen geringeren Aufwand<br />
als das Ryser–Verfahren. Für einen absolut unrealistischen Wert von l =10 7<br />
ist der Break–Even–Point mit dem Ryser–Verfahren <strong>im</strong>mer noch erstaunlich niedrig,<br />
er liegt bei n =35.<br />
Entscheidend ist be<strong>im</strong> KKLLL–Verfahren, wie bei der Berechnung der <strong>Permanente</strong><br />
in der <strong>Pfadintegral</strong>–Monte–Carlo–Methode die Laufzeit und die Genauigkeit<br />
der berechneten Erwartungswerte von der Größe des Faktors l beeinflußt werden.<br />
Dazu haben wir numerische Tests an einem System aus 4 eind<strong>im</strong>ensionalen bosonischen<br />
harmonischen Oszillatoren durchgeführt, das durch den Hamilton–Operator<br />
^H =<br />
n=4<br />
X<br />
i=1<br />
d 2<br />
, 1 2 dx 2 i<br />
+ 1 2 x2 i (4.1)<br />
beschrieben wird, wobei ~ und die Teilchenmassen auf 1 gesetzt wurden.<br />
In einer FORTRAN90–Implementation des in Abschnitt 2.4 beschriebenen<br />
PIMC–Verfahrens haben wir zunächst das exakte Ryser–Verfahren verwendet, um<br />
für mehrere Temperaturen die Erwartungswerte der potentiellen und kinetischen<br />
Energien des Systems zu berechnen. Für jede der hier angesprochenen Berechnungen<br />
eines Erwartungswertes wurde M T = 4 gewählt und 200 000 Iterationen<br />
durchgeführt.<br />
Wie Abbildung 4.2 zeigt, st<strong>im</strong>mt das Ergebnis dieser Berechnungen gut mit
KAPITEL 4. VERGLEICH DER BERECHNUNGSVERFAHREN... 39<br />
Energie<br />
1.6<br />
1.4<br />
1.2<br />
1.0<br />
exakt<br />
E kin<br />
Ryser<br />
E pot<br />
Ryser<br />
E kin<br />
KKLLL (l=10)<br />
E pot<br />
KKLLL (l=10)<br />
0.0 0.5 1.0<br />
T / k B<br />
Abbildung 4.2: Energien be<strong>im</strong> eind<strong>im</strong>ensionalen bosonischen harmonischen Oszillator<br />
für n = 4 mit verschiedenen Verfahren zur Berechnung der <strong>Permanente</strong>.<br />
Es wurde ~ = m i = 1 gesetzt und M= = 4 gewählt. Für jeden Punkt wurden<br />
200 000 Iterationen durchgeführt.<br />
den analytisch berechneten Erwartungswerten [?]<br />
E kin = E pot =<br />
n=4<br />
X<br />
i=1<br />
<br />
i i<br />
4 coth 2T<br />
<br />
, 3 2<br />
(4.2)<br />
überein.<br />
Für eine Temperatur T=k B = 1 haben wir Berechnungsversuche mit dem<br />
KKLLL–Verfahren für verschiedene l unternommen. Bei der sehr niedrigen Wahl<br />
von l =10ist der relative Fehler in den Energien erwartungsgemäß groß, er liegt<br />
bei 6% für E kin und bei 11% für E pot .<br />
<strong>Die</strong> Rechenzeit, die für die Berechnung dieser beiden Erwartungswerte benötigt<br />
wurde, lag auf einer IBM–AIX P70 Workstation mit 64 MB Hauptspeicher schon<br />
bei 26:5 CPU–Stunden ! Weitere Berechnungsversuche mit l = 20 und l = 30<br />
wurden wegen der schon bei so geringen Teilchenzahlen unvertretbar hohen Laufzeiten<br />
abgebrochen.<br />
<strong>Die</strong> theoretische Betrachtung des Rechenaufwands und die praktischen Versuche<br />
zum Laufzeitverhalten legen nahe, daß auch das KKLLL–Verfahren keine<br />
Alternative zur effizienten Berechnung <strong>im</strong> <strong>Pfadintegral</strong> bietet.<br />
Als weitere Möglichkeit zur Berechnung der <strong>Permanente</strong> bleibt noch der physikalisch<br />
motivierte Ansatz, nicht die <strong>Permanente</strong> der Matrix A( +1;) zu nähern,<br />
sondern zuerst eine geeignete Näherung für die Matrix selbst durchzuführen, von<br />
der die <strong>Permanente</strong> dann exakt berechnet werden kann.<br />
Von den beiden in Kapitel 3.3.3 dazu entwickelten Ideen erscheint uns die Verwendung<br />
des graphentheoretischen Ansatzes, bei dem genügend viele der kleinsten
KAPITEL 4. VERGLEICH DER BERECHNUNGSVERFAHREN... 40<br />
Matrix–Elemente zu Null gesetzt werden, als besonders vielversprechend, denn<br />
laut CEPERLEY [?] sind gerade Permutationen mit einem Austausch von 2; 3 und<br />
4 Teilchen besonders wichtig.<br />
Definitive Aussagen über das Laufzeitverhalten des KKLLL–Verfahrens und<br />
des graphentheoretischen Näherungsverfahrens lassen sich aber nur durch eine systematische<br />
Untersuchung mit physikalisch relevanten Systemen gewinnen. Insbesondere<br />
ist dazu auch der Vergleich mit dem als Standardmethode verwendeten<br />
Importance Sampling of Permutations“ durchzuführen.<br />
”<br />
Es empfiehlt sich also folgendes weitere Vorgehen:<br />
Eine weitere Suche nach einer einfachen ”<br />
Formel“ für die <strong>Permanente</strong> erscheint<br />
nicht sinnvoll.<br />
Wegen des enormen Rechenzeitbedarfs bei PIMC sollten alle Programme in<br />
einer parallelisierten, für Großrechner geeigneten Form erstellt werden.<br />
Es ist eine PIMC–Version mit einem ”<br />
Importance Sampling of Permutations“<br />
zu erstellen. Damit stünde eine Version dieses Standardverfahrens für<br />
Vergleichsrechnungen zur Verfügung.<br />
Es ist eine PIMC–Version mit einem austauschbaren Modul zur Berechnung<br />
der <strong>Permanente</strong> zu erstellen.<br />
Für kleinere Systeme (n 10)könnte für dieses Modul das Ryser–Verfahren<br />
benutzt werden.<br />
Der graphentheoretische Algorithmus sollte <strong>im</strong>plementiert werden. Als Vorlage<br />
kann ein ähnliches Programm [?] zum Matchen von Graphen verwendet<br />
werden. Zu untersuchen wäre das Laufzeitverhalten in Abhängigkeit von der<br />
Genauigkeit und ob dieses Verfahren ergodisch ist.
Kapitel 5<br />
Zusammenfassung<br />
In Teil I dieser Arbeit wurde nach einer Möglichkeit gesucht, wie sich die Berechnung<br />
von <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>en von <strong>Viel</strong>–<strong>Bosonen</strong>–Systemen verbessern<br />
läßt.<br />
Es wurde der Formalismus der <strong>Pfadintegral</strong>e dargestellt und es wurde erläutert,<br />
daß die numerische Berechnung von Erwartungswerten bei bosonischen <strong>Pfadintegral</strong>en<br />
einen sehr viel höheren Aufwand erfordert als bei fermionischen <strong>Pfadintegral</strong>en.<br />
Als Ursache dafür wurde die bei bosonischen <strong>Pfadintegral</strong>en zu berechnende<br />
<strong>Permanente</strong> einer Matrix A( +1;) erkannt und es wurde erklärt, wie sich<br />
die Berechnung der <strong>Permanente</strong> durch ein ”<br />
Importance Sampling of Permutations“<br />
umgehen läßt.<br />
Nachdem die wichtigsten der in der Mathematik bekannten allgemeinen Berechnungsverfahren<br />
für <strong>Permanente</strong>n vorgestellt wurden, wurden eigene Versuche<br />
zur Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> unternommen.<br />
Es wurde aufgezeigt, warum es keine effiziente Formel für die Berechnung dieser<br />
speziellen <strong>Permanente</strong> gibt und es wurden Argumente angeführt, warum auch<br />
keine Näherungsformel wie für die Determinante <strong>im</strong> fermionischen <strong>Pfadintegral</strong><br />
möglich ist.<br />
Ausgehend von den in der Literatur gewonnen Erkenntnissen über die Bedeutung<br />
der Permutationen be<strong>im</strong> ”<br />
Importance Sampling“ wurde schließlich eine physikalisch<br />
motivierte Näherung der Matrix A( +1;) vorgeschlagen, die zusammen<br />
mit einem graphentheoretischen Algorithmus eventuell eine effiziente näherungsweise<br />
Berechnung der <strong>Permanente</strong> <strong>im</strong> bosonischen <strong>Pfadintegral</strong> gestatten würde.<br />
<strong>Die</strong> Anwendbarkeit dieses Vorschlags bleibt noch zu untersuchen.<br />
41
Teil II<br />
Best<strong>im</strong>mung von<br />
Phasenübergängen aus<br />
exper<strong>im</strong>entellen Streuspektren<br />
atomarer Cluster<br />
42
Kapitel 6<br />
Einleitung<br />
Mit dem Konzept der Phasenübergänge wird in der Thermodynamik die strukturelle<br />
Umwandlung makroskopischer Systeme — d.h. Systeme mit unendlich vielen<br />
Freiheitsgraden — beschrieben. Solche strukturellen Umwandlungen sind in der<br />
Regel mit abrupten Änderungen von <strong>thermodynamischen</strong> Zustandsgrößen oder anderen<br />
geeigneten Ordnungsparametern verbunden.<br />
Mesoskopische Systeme besitzen dagegen nur eine endliche Anzahl von Freiheitsgraden,<br />
was dazu führt, daß die Ordnungsparameter von Strukturumwandlungen<br />
ein weicheres Änderungsverhalten zeigen und sich der Begriff der ”<br />
Phase“ des<br />
Systems nicht mehr präzise definieren läßt.<br />
Anfang der 80er Jahre wurde durch numerische S<strong>im</strong>ulationsrechnungen gezeigt,<br />
daß es bei atomaren und molekülaren Clustern Übergänge zwischen den bei<br />
tiefen Temperaturen vorherrschenden starren Strukturen und den strker fluktuierenden<br />
Strukturen bei höheren Temperaturen gibt, die sich als Übergänge zwischen<br />
verschiedenen Cluster–Isomeren deuten lassen [?].<br />
<strong>Die</strong>se Strukturverwandlungen von atomaren Clustern äußern sich ähnlich wie<br />
bei makroskopischen Phasenübergängen durch deutlich erkennbare Änderungen in<br />
dem Verhalten geeigneter Observablen: eine Stufe in der kalorischen Zustandsgleichung,<br />
ein plötzliches Ansteigen der spezifischen Wärme, makroskopische Änderungen<br />
in den relativen Abständen zu den nächsten Nachbarn mit steigender Temperatur<br />
usw.<br />
In Analogie zu den fest–flüssig–Phasenübergängen in kondensierter Materie<br />
wurde durch BERRY ET AL. einphänomenologisches Modell zur Erklärung dieser<br />
S<strong>im</strong>ulationsrechnungen eingeführt [?, ?]. Darin werden unterschiedliche Temperaturen<br />
für den Schmelz– und Gefrierpunkt definiert, wodurch ein Übergangsbereich<br />
zwischen fester und flüssiger Phase definiert wird — der sogenannte Koexistenzbereich.<br />
Als besonders geeignete Verfahren für die Untersuchung von Clusterstrukturen<br />
haben sich Beugungsexper<strong>im</strong>ente mit Elektronen–, Röntgen– oder Neutronenstrahlen<br />
herausgestellt [?]. Sie haben den großen Vorteil, daß sich die Beugungsintensität<br />
aus den gemessenen Streuspektren als räumliche Fourier–Transformierte<br />
43
KAPITEL 6. EINLEITUNG 44<br />
einer Observablen der statistischen Physik — der Paarkorrelationsfunktion — interpretieren<br />
läßt.<br />
Das Standardverfahren zur Analyse der so gemessenen Streuspektren besteht<br />
darin, für vorgegebene Clustergeometrien über numerische Molekulardynamik–<br />
oder Monte–Carlo–Rechnungen theoretische Streuspektren zu berechnen und diese<br />
anschliessend visuell mit den exper<strong>im</strong>entellen Spektren zu vergleichen. <strong>Die</strong>se<br />
Kombination aus exper<strong>im</strong>enteller Messung und theoretischer Modellbildung wurde<br />
in der Vergangenheit z.B. erfolgreich genutzt, um die stabilen Konfigurationen<br />
kleiner und mittlerer Argon–Cluster aufzufinden [?, ?, ?].<br />
Da bei den numerischen S<strong>im</strong>ulationen die potentielle und kinetische Energie<br />
der Cluster als Nebenprodukt ermittelt wird, kann dasselbe Verfahren aber auch<br />
indirekt dazu verwendet werden, diese Energien selbst für die untersuchten Cluster<br />
zu best<strong>im</strong>men, was <strong>im</strong> Hinblick auf Phasenübergänge besonders interessant ist.<br />
Für semiklassische Clustersysteme läßt sich damit auch die ”<br />
innere Temperatur“<br />
T ermitteln, die über die mittlere kinetische Energie pro Freiheitsgrad definiert<br />
werden kann [?, ?].<br />
<strong>Die</strong>ses Verfahren zur Best<strong>im</strong>mung der Energie bzw. der Temperatur atomarer<br />
Cluster hat zwei große Nachteile: Es müssen zum einen viele zeitaufwendige<br />
Computers<strong>im</strong>ulationen durchgeführt werden, um eine genügend große Anzahl von<br />
theoretischen Vergleichsspektren zu erzeugen. Zum anderen müssen dann die gesuchten<br />
Energie– bzw. Temperaturwerte durch einen visuellen Vergleich der theoretischen<br />
mit den exper<strong>im</strong>entellen Spektren gefunden werden.<br />
In diesem zweiten Teil der Diplomarbeit entwickeln wir nun eine alternative<br />
Methode zur Berechnung der Energien bzw. der Temperatur aus den gemessenen<br />
Streuspektren. Wir zeigen, daß für monoatomare Cluster, die sich durch eine<br />
paarweise additive Wechselwirkung beschreiben lassen, die potentielle und die<br />
kinetische Energie sowie die klassische Temperatur als einfache Funktionale der<br />
Streuspektren und eines angenommenen Wechselwirkungspotentials ausgedrückt<br />
werden können, wobei in den Funktionalen nur eind<strong>im</strong>ensionale Integrationen ausgeführt<br />
werden müssen.<br />
In Kapitel 7 wird zunächst der Zusammenhang zwischen gemessenem Streuspektrum<br />
und der Paarkorrelationsfunktion erläutert, bevor in einem quantenstatischen<br />
und einem klassischen Modell ausgehend von verallgemeinerten Virialtheoremen<br />
die gerade angesprochenen einfachen Formeln für die Berechnung der Energien<br />
und der Temperatur hergeleitet werden.<br />
Um die praktische Anwendbarkeit unserer Methode überprüfen zu können,<br />
haben wir klassische MC und <strong>Pfadintegral</strong>–MC–S<strong>im</strong>ulationen von Systemen aus<br />
Argon– und Neon–Clustern als ”<br />
ideale Exper<strong>im</strong>ente“ durchgeführt (Kapitel 8).<br />
Aus den in diesen numerischen S<strong>im</strong>ulationen generierten Streuspektren berechnen<br />
wir über unsere neue Methode Erwartungswerte für die Energien und die<br />
Temperatur, die mit den exakten Werten aus den S<strong>im</strong>ulationen verglichen werden<br />
(Kapitel 9) und wir erläutern, wie sich damit Phasenübergänge in den untersuchten<br />
Clustern feststellen lassen.
Kapitel 7<br />
<strong>Die</strong> Methode<br />
In diesem Kapitel wird eine neue Methode vorgestellt, wie sich direkt aus exper<strong>im</strong>entell<br />
gemessenen Streuspektren atomarer Cluster ihre potentielle und kinetische<br />
Energie sowie <strong>im</strong> klassischen Grenzfall die Temperatur berechnen lassen.<br />
<strong>Die</strong> Grundidee unserer Methode ist dabei, die statistischen Erwartungswerte<br />
für die potentielle Energie E pot und die kinetische Energie E kin als Funktionale<br />
der Paarkorrelationsfunktion ,(r) auszudrücken, wozu wir verallgemeinerte Virialtheoreme<br />
— sogenannte Hypervirialtheoreme — verwenden.<br />
Am Anfang dieses Kapitels wird zunächst der Zusammenhang zwischen der<br />
in Beugungsexper<strong>im</strong>enten gemessenen Intensitätsverteilung I(S) und der Paarkorrelationsfunktion<br />
,(r) erläutert, bevor die klassischen und quantenmechanischen<br />
Hypervirialtheoreme nach HIRSCHFELDER [?] betrachtet werden.<br />
Im Rahmen eines quantenstatistischen kanonischen Modells zur Beschreibung<br />
atomarer Cluster mit paarweiser Wechselwirkung wird mit Hilfe des quantenmechanischen<br />
Hypervirialtheorems gezeigt, wie sich die potentielle und kinetische<br />
Energie über eine einfache Integration aus der Paarkorrelationsfunktion ergeben.<br />
Für sich beinahe klassisch verhaltende Systeme wird gezeigt, wie sich aus dem<br />
klassischen Hypervirialtheorem eine entsprechende Formel für die innere Temperatur<br />
der Cluster herleiten läßt.<br />
Schließlich wird erläutert, wie die so hergeleiteten Formeln modifiziert werden<br />
müssen, damit sie auch bei exper<strong>im</strong>entell vorliegenden diskreten Verteilungen<br />
(N ) von Clustern verschiedener Teilchenzahlen N angewendet werden können.<br />
7.1 Der Zusammenhang von Paarverteilungsfunktion und<br />
Streuspektrum<br />
Eines der etabliertesten exper<strong>im</strong>entellen Verfahren zur Analyse von Clusterstrukturen<br />
ist die Elektronenbeugung an Clusterstrahlen, die durch Überschallexpansion<br />
von heißen Gasen in ein Vakuum erzeugt werden [?].<br />
Bei diesem Meßverfahren wird ein heißes Gas mit Überschallgeschwindigkeit<br />
in ein Vakuum expandiert, wobei es unter geeigneten äußeren Bedingungen zur<br />
45
KAPITEL 7. DIE METHODE 46<br />
Bildung von Clustern in dem expandieren Gasstrahl kommt. Werden die so erzeugten<br />
Cluster mit hochenergetischen Elektronen durchstrahlt, so kommt es zu<br />
einer Auffächerung des Elektronenstrahls und es entsteht ein Beugungsbild, dessen<br />
Intensitätsverteilung charakteristisch für die innere Struktur der Cluster ist.<br />
Wichtig für das Zustandekommen dieses Effektes ist dabei nur, daß die einfallende<br />
Strahlung Wellencharakter hat, wobei die Wellenlänge in der Größenordnung<br />
der Streuzentren–Abstände liegen muß [?]. Daher werden neben Elektronenstrahlen<br />
auch Neutronen– und Röntgenstrahlen für Beugungsexper<strong>im</strong>ente dieser Art<br />
verwendet.<br />
Gegenüber den beiden anderen Strahlungsquellen bietet die Elektronenbeugung<br />
zur Zeit noch einige Vorteile:<br />
1. Elektronenstrahlen lassen sich wesentlich besser fokussieren als Neutronen–<br />
und Röntgenstrahlen.<br />
2. Für die momentan exper<strong>im</strong>entell gut realisierbaren Strahlintensitäten und<br />
Teilchenenergien liefert die Elektronenbeugung bei schwach streuenden Teilchen<br />
atomarer D<strong>im</strong>ensionen die qualitativ intensivsten und schärfsten Beugungsbilder.<br />
Vom theoretischen Standpunkt aus läßt sich das Problem der Streuung von<br />
Elektronen an Atomen und das Entstehen der Beugungsbilder mit unterschiedlicher<br />
Genauigkeit und entsprechend mit unterschiedlichem theoretischen Aufwand<br />
behandeln.<br />
Für die bei Strukturuntersuchungen an Clustern vorgenommenen Beugungsexper<strong>im</strong>ente<br />
genügt es, die sog. kinematische Streutheorie zu betrachten, in der nicht<br />
nur die Lage der Beugungsringe, sondern auch ihre Form und Intensität wiedergegeben<br />
wird.<br />
Betrachten wir zunächst die elastische Streuung eines Strahls schneller Elektronen<br />
an dem als zentralsymmetrisch angenommenen Potential V (r) eines einzelnen<br />
unbewegten Atoms.<br />
Da in Beugungsexper<strong>im</strong>enten der Elektronenstrahl typischerweise sehr viel<br />
länger eingeschaltet ist, als ein einzelnes Elektron zum Durchqueren der Streuregion<br />
benötigt und da das Streupotential zeitunabhängig ist, genügt es die zeitunabhängige<br />
Schrödingergleichung für dieses System zu betrachten [?]:<br />
<br />
, ~2<br />
2m r2 + V (r) (~r) =E (~r): (7.1)<br />
<strong>Die</strong> Energie E des einfallenden Elektrons ist dabei mit seinem Impuls ~ k und<br />
seiner Wellenlänge über die Gleichung<br />
verknüpft.<br />
E = p2<br />
2m = ~2<br />
2m k2 = ~2 2<br />
2m <br />
(7.2)
KAPITEL 7. DIE METHODE 47<br />
Unter der Annahme, daß das atomare Potential V (r) für große r genügend<br />
schnell abfällt, kann für Gleichung (7.1) eine asymptotische Lösung in der Form<br />
1 (~r) =A [ ein (~r) + str (~r)] (7.3)<br />
angeben werden, wobei ein die Wellenfunktion des einfallenden Elektrons und<br />
str die des gestreuten Elektrons bezeichnen soll.<br />
Da der einfallende stationäre Teilchenstrom verglichen mit den atomaren D<strong>im</strong>ensionen<br />
des Streuzentrums einen großen Durchmesser hat, kann für die Wellenfunktion<br />
ein eine ebene Welle angenommen werden:<br />
ein(~r) =e i~ k~r : (7.4)<br />
<strong>Die</strong> Gestalt der gestreuten Wellenfunktion str ist dadurch best<strong>im</strong>mt, daß der<br />
Fluß der gestreuten Teilchen radialsymmetrisch sein muß:<br />
str(~r) =f (; ) ei~ k~r<br />
r ; (7.5)<br />
wobei (r;;) die Polardarstellung des Koordinatenvektors ~r ist und die Amplitude<br />
f (; ) der Streuwellenfunktion als Streuamplitude bezeichnet wird.<br />
<strong>Die</strong> weit entfernt vom Streupunkt gemessene Streuintensität<br />
I = I 0<br />
r jf (; 2 )j2 (7.6)<br />
ist damit best<strong>im</strong>mt durch den Streuwinkel , die Intensität der einfallenden Elektronen<br />
I 0 und die Streuamplitude f (; ).<br />
Bei einem radialsymmetrischen Zentralpotential V (r) hängt die Streuamplitude<br />
nur von ab. In diesem Fall kann f () durch eine Partialwellenzerlegung<br />
best<strong>im</strong>mt werden, bei der f () durch eine Reihe über Legendre–Polynome P l dargestellt<br />
wird. Für f () ergibt sich so schließlich der Ausdruck [?]:<br />
1X (2l<br />
h i<br />
+1)<br />
f () =<br />
P l (cos ) e 2i l<br />
, 1 ; (7.7)<br />
2ik<br />
l=0<br />
in dem f () vollständig durch die Phasenverschiebungen l best<strong>im</strong>mt ist.<br />
Für kleine Phasenverschiebungen l gilt die Näherung (Bornsche Näherung für<br />
die Partialwelle l)[?]:<br />
l = , 2mk<br />
~ 2 Z 1<br />
0<br />
V (r) r 2 [j l (kr)] 2 dr; (7.8)<br />
mit der Bezeichnung j l für die sphärische Besselfunktion der Ordnung l.<br />
Entwickeln wir in (7.7)<br />
e 2i l<br />
=1+2i l , 2 2 l + ::: (7.9)
KAPITEL 7. DIE METHODE 49<br />
<strong>Die</strong> Hintergrundintensität I b setzt sich dabei zusammen aus einem Anteil für<br />
die elastische Streuung an einzelnen Atomen — proportional zu der Summe über<br />
die Quadrate der atomaren elastischen Streufaktoren f i (s) — und aus einem Anteil<br />
für die inelastische Streuung proportional zur Summe über die inelastischen<br />
Streufaktoren S i (s):<br />
I b (s) = I 0<br />
R 2 M X<br />
i=1<br />
<br />
<br />
jf i (s)j 2 + 4<br />
a S 2 i(s) : (7.17)<br />
0 s4<br />
Der Interferenzterm I int enthält letztlich die von der Struktur d.h. von der Verteilung<br />
der Atome herrührende Information:<br />
I int (s) = I 0<br />
R 2 M X<br />
i=1<br />
MX<br />
j=1<br />
j6=i<br />
f i (s)f j(s)<br />
Z 1<br />
0<br />
P ij (r) sin(sr)<br />
sr<br />
dr (7.18)<br />
Um die Bewegungen der Atome gegeneinander zu berücksichtigen, muß hierbei<br />
über die gewichteten, von einzelnen Atom–Atom–Paaren stammenden Intensitätsanteile<br />
[sin(sr)=(sr)] integriert werden. <strong>Die</strong> Gewichtsfunktion P ij (r) ist dabei die<br />
radiale Wahrscheinlichkeitsdichte dafür, daß die Atome i und j gerade den Abstand<br />
r haben.<br />
Für ein System, daß aus unterschiedlichen Atomen bzw. aus Molekülen verschiedener<br />
Atome besteht, setzt sich die Interferenzintensität (7.18) additiv aus<br />
einem intramolekularen Interferenzanteil I mol und einem von der Clusterstruktur<br />
abhängigen intermolekularen Interferenzanteil I Cl zusammen:<br />
I int = I mol + I Cl : (7.19)<br />
In der Literatur ist es allgemein üblich [?], an Stelle des strukturhängigen Interferenzterms<br />
I Cl die Strukturfunktion<br />
M Cl =<br />
I Cl<br />
Ib<br />
elast<br />
(7.20)<br />
zu betrachten, d.h. aus I Cl wird der elastische Anteil Ib<br />
elast der atomaren Hintergrundintensität<br />
(7.17) herausdividiert.<br />
Für ein System aus rein atomaren Clustern verschwindet in Gleichung (7.19)<br />
der intramolekulare Interferenzterm I mol .Sindzusätzlich alle Atome in dem betrachteten<br />
Cluster identisch, so ist in den Gleichungen (7.17) und (7.18) nur ein<br />
elastischer Streufaktor f (s) und eine Gewichtsfunktion (,(r) = p ij (r) f.a. i 6=<br />
j 2 [1;::: ;N]) zuberücksichtigen. Somit können die Summen über alle Bindungen<br />
bzw. über alle Teilchen explizit ausgeführt werden und wir erhalten für die<br />
Interferenzintensität I int und für die zugehörige Strukturfunktion M:<br />
I int (s) = Njf (s)j 2 M (s) (7.21)<br />
Z 1<br />
= Njf (s)j 2 4r 2 ,(r) sin(sr) dr: (7.22)<br />
sr<br />
0
KAPITEL 7. DIE METHODE 50<br />
Unter Vernachlässigung des inkohärenten Streuanteils in der Hintergrundintensität<br />
(7.17) ergibt sich für die gemessene Gesamtintensität I tot also<br />
I tot (s) =Njf (s)j 2 1+<br />
Z 1<br />
0<br />
4r 2 ,(r) sin(sr)<br />
sr<br />
dr<br />
<br />
: (7.23)<br />
<strong>Die</strong> Gewichtsfunktion ,(r) läßt sich in diesem Fall als statistischer Erwartungswert<br />
formulieren [?]:<br />
2<br />
,(r) =<br />
N (N , 1)<br />
* X<br />
1i
KAPITEL 7. DIE METHODE 51<br />
7.2.1 Das klassische Hypervirialtheorem<br />
Wir betrachten ein mechanisches System aus N Teilchen, die sich durch eine<br />
Hamilton–Funktion H in den 3N generalisierten Ortskoordinaten q 1 ;q 2 ;::: ;q 3N<br />
und den dazu konjugierten Impulsen p 1 ;p 2 ;::: ;p 3N beschreiben lassen sollen.<br />
Sei W nun eine Funktion der generalisierten Koordinaten und Impulse mit den<br />
beiden folgenden Eigenschaften:<br />
1. W ist eindeutig durch jede Konfiguration des Systems best<strong>im</strong>mt.<br />
2. W n<strong>im</strong>mt für alle mit den vorgeschriebenen Randbedingungen und Erhaltungssätzen<br />
des Systems verträglichen Konfigurationen einen endlichen Wert<br />
an.<br />
Dann läßt sich die zeitliche Entwicklung von W mit Hilfe der kanonischen<br />
Bewegungsgleichungen<br />
_q i = @H und , _p i = @H<br />
(7.27)<br />
@p i @q i<br />
durch die Poisson–Klammer von W und der Hamilton–Funktion H ausdrücken<br />
[?]:<br />
dW<br />
dt<br />
= fH; Wg p;q =<br />
3NX<br />
j=1<br />
@H @W<br />
, @H @W<br />
: (7.28)<br />
@p j @q j @q j @p j<br />
Auf beiden Seiten von Gleichung (7.28) wird nun das Zeitmittel<br />
Z t=<br />
hi := 1 dt 0 (7.29)<br />
t=0<br />
gebildet. Dabei soll für eine periodische Bewegung des Systems als die Zeit<br />
genommen werden, die das System benötigt, um wieder in den Ausgangszustand<br />
zurückzukehren, und für alle anderen Systeme soll der L<strong>im</strong>es ! 1 betrachtet<br />
werden.<br />
Wegen der zweiten der an W gestellten Voraussetzungen folgt offensichtlich<br />
dW<br />
=0 (7.30)<br />
dt<br />
und damit ergibt sich aus (7.28) die Gleichung<br />
E 3NX<br />
0=<br />
DfH; Wg p;q =<br />
j=1<br />
@H<br />
@p j<br />
@W<br />
@q j<br />
, @H<br />
@q j<br />
@W<br />
@p j<br />
<br />
: (7.31)<br />
Von besonderem Interesse sind nun Relationen, die sich aus Gleichung (7.31)<br />
ergeben, wenn W eine homogene Funktion vom Grad 1 in den generalisierten Impulsen<br />
ist. <strong>Die</strong>se Relationen werden nach HIRSCHFELDER [?] alsklassische Hypervirialtheoreme<br />
bezeichnet, da sie als Verallgemeinerungen des Virialsatzes von<br />
CLAUSIUS aufgefaßt werden können.
KAPITEL 7. DIE METHODE 52<br />
Wird z.B.<br />
W = p k f (q 1 ;q 2 ;::: ;q 3N ) (7.32)<br />
gewählt, so lautet das entsprechende Hypervirialtheorem:<br />
3NX<br />
j=1<br />
<br />
_q j<br />
@f<br />
@q j<br />
p k<br />
<br />
=<br />
<br />
f @H ; (7.33)<br />
@q k<br />
aus dem sich mit f = q k wieder der Virialsatz von CLAUSIUS ergibt:<br />
h _q j p k i =<br />
<br />
@H<br />
q k : (7.34)<br />
@q k<br />
Betrachten wir nun ein System <strong>im</strong> thermischen Gleichgewicht bei einer Temperatur<br />
T , so ergeben sich in den Hypervirialtheoremen deutliche Vereinfachungen.<br />
Zum einen gibt es in der klassischen Statistischen Mechanik keine Korrelationen<br />
zwischen den Ortskoordinaten und den Impulsen. Zum anderen gilt [?]<br />
und damit n<strong>im</strong>mt Gleichung (7.33) die Gestalt 2<br />
k B T<br />
<br />
p k<br />
@H<br />
@p k<br />
<br />
= k B T; (7.35)<br />
3NX<br />
j=1<br />
@f<br />
@q j<br />
<br />
=<br />
<br />
f @H<br />
@q k<br />
<br />
(7.36)<br />
an.<br />
Gleichung (7.36) läßt sich allerdings auch direkt mit Mitteln der Statistischen<br />
Mechanik herleiten, indem z.B. <strong>im</strong> kanonischen Ensemble die Zustandssumme<br />
partiell integriert wird [?] oder <strong>im</strong> mikrokanonischen Ensemble über geeignete<br />
Energiehyperflächen integriert wird [?, ?].<br />
7.2.2 Das quantenmechanische Hypervirialtheorem<br />
Wird in der klassischen Mechanik die zeitliche Entwicklung einer Funktion W mit<br />
Hilfe von Poisson–Klammern formuliert, so entspricht dies in der Quantenmechanik<br />
der Beschreibung einer Observablen ^W H <strong>im</strong> Heisenberg–Bild.<br />
Wir betrachten <strong>im</strong> folgenden ein System, das durch einen zeitunabhängigen<br />
Hamilton–Operator ^H beschrieben wird. Im Heisenberg–Bild wird die Dynamik<br />
eines nicht explizit zeitabhängigen Schrödingeroperators ^W S durch die Heisenbergsche<br />
Bewegungsgleichung<br />
d<br />
dt ^W i h i<br />
H = ^H; ^W H (7.37)<br />
~<br />
2 Zu beachten ist hierbei, daß für alle Koordinaten, die nicht in H auftauchen, (z.B. zyklische<br />
Koordinaten) diese Gleichungen identisch verschwinden.
KAPITEL 7. DIE METHODE 53<br />
beschrieben, wobei<br />
^W H = e i ~ ^Ht ^W S e , i ~ ^Ht<br />
(7.38)<br />
die Darstellung von ^W S <strong>im</strong> Heisenberg–Bild ist.<br />
Wird nun auf beiden Seiten von Gleichung (7.37) der Erwartungswert bezüglich<br />
stationärer Energieeigenzustände j m i und j n i gebildet, so ergibt sich<br />
h i<br />
h m j ^H; ^W H j n i = i h m j ^H ^W H , ^W ^H H j n i (7.39)<br />
~<br />
= i ~ (E m , E n )h m j ^W H j n i (7.40)<br />
= i (E m , E n ) e ~ i (Em,En)t h m j ^W S j n i: (7.41)<br />
~<br />
Wenn der Erwartungswert von ^W S bezüglich eines stationären Energieeigenzustands<br />
j n i endlich ist, dann folgt aus Gleichung (7.41), daß<br />
h i<br />
h n j ^H; ^W H j n i =0 (7.42)<br />
gilt.<br />
In Analogie zum klassischen Fall werden laut HIRSCHFELDER diejenigen Relationen<br />
als quantenmechanisches Hypervirialtheorem bezeichnet, die sich aus der<br />
allgemeinen Formel (7.42) für Operatoren W ergeben, die vom Grad 1 in den Impulsoperatoren<br />
sind.<br />
7.3 Das quantenstatistische Modell<br />
7.3.1 Modellierung des Systems<br />
Als Ausgangspunkt für unsere theoretischen Überlegungen wählen wir ein kanonisches<br />
Ensemble von atomaren Clustern aus N–Teilchen. <strong>Die</strong>se Form der Beschreibung<br />
ist z.B. dann geeignet, wenn die Cluster <strong>im</strong> thermischen Gleichgewicht mit<br />
einem Wärmebad aus sie umgebenden Atomen sind, wie dies bei vielen Gasstrahlexpansionsexper<strong>im</strong>enten<br />
der Fall ist [?].<br />
Außerdem schränken wir unsere Betrachtungen auf Cluster aus N identischen<br />
Atomen der Masse m ein, deren Wechselwirkung sich durch ein paarweise additives<br />
2–Teilchen Potential der Form<br />
V WW =<br />
N,1<br />
X<br />
i=1<br />
NX<br />
j=2<br />
i
KAPITEL 7. DIE METHODE 54<br />
Der Hamilton–Operator eines solchen Systems lautet<br />
^H tot = , ~2<br />
2m<br />
NX<br />
i=1<br />
X<br />
r 2 i + V (j~x i , ~x j j): (7.44)<br />
7.3.2 Separation von Schwerpunkts– und Relativbewegung<br />
Da durch die Wahl des Wechselwirkungspotentials der Hamilton–Operator ^H tot<br />
invariant unter Translationen wird, liefern die Kontinuumszustände mit nichtverschwindendem<br />
Gesamt<strong>im</strong>puls ( ” äußere Freiheitsgrade“) nur einen festen Beitrag<br />
3<br />
2 k BT zur kinetischen Energie.<br />
Für die Änderungen in der Clusterstruktur sind dagegen die verbleibenden ”<br />
inneren“<br />
Freiheitsgrade ausschlaggebend [?] und nur diese lassen sich auch durch<br />
die Spektren aus Elektronenbeugungsexper<strong>im</strong>enten nachweisen. 3 Deshalb ist es<br />
sinnvoll, die Schwerpunkts– von der Relativbewegung zu separieren.<br />
<strong>Die</strong>s geschieht am zweckmäßigsten durch eine Koordinatentransformation<br />
i
KAPITEL 7. DIE METHODE 55<br />
^H<br />
kin rel den Anteil für die Relativbewegung bezeichnet:<br />
^H rel<br />
kin = , ~2<br />
m<br />
2<br />
6X<br />
4 N<br />
i=1<br />
r 2 r i<br />
+<br />
N,2<br />
X<br />
und das Wechselwirkungspotential die Gestalt<br />
V WW =<br />
N,1<br />
X<br />
i=1<br />
V (j~r i j)+<br />
i=1<br />
N,2<br />
X<br />
i=1<br />
N,1<br />
X<br />
j=2<br />
i
KAPITEL 7. DIE METHODE 56<br />
gegeben, wobei<br />
<br />
Z =Tr<br />
e , ^H rel<br />
(7.58)<br />
die kanonische Zustandssumme der inneren Freiheitsgrade ist.<br />
Für die mittlere potentielle Energie des Systems, d.h. den Erwartungswert hV WW i,<br />
erhalten wir so den formalen Ausdruck<br />
E pot = 1 Z<br />
X<br />
wobei die Summe über alle Energieeigenzustände j ni mit<br />
n<br />
e ,En hn j V WW j ni; (7.59)<br />
^H rel j ni = E n j ni (7.60)<br />
läuft.<br />
Andererseits ist es physikalisch intuitiv klar, daß sich die mittlere potentielle<br />
Energie auch über die Paarkorrelationsfunktion ,(r) berechnen läßt:<br />
Z<br />
N (N , 1) 1<br />
E pot = dr ,(r) V (r); (7.61)<br />
2 0<br />
denn ,(r) dr gibt ja die mittlere Wahrscheinlichkeit an, daß zwei beliebige Teilchen<br />
des betrachteten Systems einen Abstand r 0 zwischen r und r +dr haben. Also<br />
ergibt das Integral in Gleichung (7.61) den Erwartungswert für das 2–Teilchen–<br />
Wechselwirkungspotential pro Bindung, es muß also noch mit der Anzahl der Bindungen<br />
multipliziert werden.<br />
Für die mittlere interne kinetische Energie ist die Sachlage komplizierter, denn<br />
sie berechnet sich <strong>im</strong> kanonischen Ensemble zu<br />
E kin = 1 Z<br />
X<br />
n<br />
e ,En hn j<br />
rel ^H kin j ni: (7.62)<br />
Hier ist nicht offensichtlich, wie sich der Erwartungswert hn j ^H<br />
rel<br />
kin<br />
j ni durch die<br />
Paarkorrelationsfunktion ,(r) ausdrücken läßt.<br />
In diesem Abschnitt wird nun gezeigt, wie mit Hilfe eines geeigneten Hypervirialtheorems<br />
die Gleichung (7.62) in eine Form gebracht werden kann, die dieselbe<br />
Struktur wie (7.59) hat. <strong>Die</strong>s genügt, wie in Abschnitt 7.3.4 noch ausführlicher<br />
erläutert wird, um E kin über ,(r) berechnen zu können.<br />
Um zu dem richtigen“ Hypervirialtheorem zu gelangen, gehen wir von dem<br />
”<br />
allgemeinen quantenmechanischen Hypervirialtheorem (7.42) aus und wählen [?]<br />
^W =<br />
N,1<br />
X<br />
k=1<br />
~r k r k : (7.63)<br />
Wie schon in Abschnitt 7.2.2 erläutert wurde, muß zunächst der Kommutator<br />
[ ^H rel ; ^W ] berechnet werden. Dazu werten wir die Operatorprodukte ^H rel ^W und<br />
^W ^H rel getrennt aus.
KAPITEL 7. DIE METHODE 57<br />
Für das erste Produkt ^H rel ^W ergibt sich:<br />
^H rel ^W = , ~2<br />
m<br />
" N,1<br />
X<br />
r 2 i (~r k r k ) +<br />
i;k=1<br />
| {z }<br />
%1<br />
X<br />
N,1<br />
X<br />
(r i r j )(~r k r k )<br />
i
KAPITEL 7. DIE METHODE 58<br />
Das zweite Operatorprodukt ^W ^H rel läßt sich direkt berechnen:<br />
^W ^H rel = , ~2<br />
m<br />
N,1<br />
X<br />
k=1<br />
" N,1<br />
X<br />
i=1<br />
X<br />
(~r k r k )r 2 i + (~r k r k )(r i r j )<br />
i
KAPITEL 7. DIE METHODE 59<br />
der Erwartungswert durch die folgende Formel gegeben ist:<br />
N (N , 1)<br />
hF i =<br />
2<br />
Z 1<br />
drf(r),(r): (7.79)<br />
0<br />
Zum Beweis von (7.79) erinnern wir uns an die Definition der Paarkorrelationsfunktion<br />
,(r) in Gleichung (7.24), die sich <strong>im</strong> Relativkoordinatensystem wie<br />
folgt schreibt:<br />
2<br />
,(r) =<br />
N (N , 1)<br />
2<br />
4<br />
* N,1<br />
X<br />
i=1<br />
(j~r i j,r)<br />
+<br />
+<br />
* X<br />
i
KAPITEL 7. DIE METHODE 60<br />
aus den in Beugungsexper<strong>im</strong>enten gemessenen Intensitätsspektren best<strong>im</strong>men lassen:<br />
Z<br />
N (N , 1) 1<br />
E pot = drV(r),(r); (7.87)<br />
2 0<br />
Z<br />
N (N , 1) 1<br />
E kin = drrV 0 (r),(r): (7.88)<br />
4<br />
7.4 Der klassische Grenzfall<br />
<strong>Die</strong> quantenstatistische kanonische Zustandssumme Z aus Gleichung (7.58) läßt<br />
sich in guter Näherung durch die klassisch kanonische Zustandssumme Z kl der<br />
korrigierten Maxwell–Boltzmann Statistik ersetzen, falls der mittlere interatomare<br />
Abstand d sehr viel größer als die thermische de Broglie–Wellenlänge<br />
0<br />
th =<br />
h<br />
p 2mkB T<br />
(7.89)<br />
ist. th ist dabei ein Maß für die Ortsunschärfe zur mittleren kinetischen Energie<br />
und damit zum mittleren Impuls [?, ?].<br />
In der klassischen kanonischen Formulierung ist die Zustandsumme Z kl des<br />
von uns betrachteten Systems gegeben als<br />
Z<br />
1<br />
Z kl =<br />
h 3N e ,H rel(~p;~r) d~p d~r (7.90)<br />
N !<br />
wobei ~p und ~r für die 3(N , 1)–d<strong>im</strong>ensionalen Koordinatenvektoren bzw. Impulsvektoren<br />
des Relativsystems stehen und H rel die dem Hamilton–Operator (7.56)<br />
des Relativsystems entsprechende klassische Hamiltonfunktion<br />
H rel (~p 1 ;::: ;~p N,1 ;~r 1 ;::: ;~r N,1 )=<br />
N,1<br />
X<br />
i=1<br />
(~p i ) 2<br />
2m + V WW (7.91)<br />
bezeichnet.<br />
Für die mittlere potentielle Energie kann die Gleichung (7.87) ohne weiteres<br />
übernommen werden, da bei der Herleitung der allgemeinen Formel (7.79) in Abschnitt<br />
7.3.4 kein Gebrauch von der expliziten Gestalt des quantenmechanischen<br />
Erwartungswertes gemacht wurde.<br />
Für die mittlere innere kinetische Energie <strong>im</strong> klassisch–kanonischen Ensemble<br />
muß dagegen wieder der Erwartungswert der kinetischen Energie in eine geeignete<br />
Form gebracht werden, um die Formel (7.79) anwenden zu können. Dazu wird<br />
auf das klassische Hypervirialtheorem in Form von Gleichung (7.36) mit der Wahl<br />
f = q k zurückgegriffen, daß in kartesichen Koordinaten die Gestalt<br />
* N,1<br />
X<br />
i=1<br />
~r i r i V WW<br />
+<br />
=3(N , 1)k B T (7.92)
KAPITEL 7. DIE METHODE 61<br />
ann<strong>im</strong>mt.<br />
Da die Ableitung auf der rechten Seite von Gleichung (7.92) schon in Abschnitt<br />
7.3.4 berechnet wurde (s. Gl. (7.86)), gelangen wir auch für die klassische mittlere<br />
kinetische Energie wieder zu der Formel (7.88):<br />
Z<br />
N (N , 1) 1<br />
E kin =3(N , 1)k B T = drrV 0 (r),(r);<br />
2 0<br />
(7.93)<br />
wodurch sich <strong>im</strong> klassischen L<strong>im</strong>es jetzt auch eine Formel für die Berechnung<br />
der inneren Temperatur der so modellierten Cluster aus exper<strong>im</strong>entell gemessenen<br />
Streuspektren ergibt:<br />
Z<br />
T N 1<br />
=<br />
dr rV 0 (r),(r): (7.94)<br />
6k B<br />
7.5 Verteilungen verschiedener Clustergrößen<br />
0<br />
Bei der Erzeugung von Clustern durch Überschallexpansion eines Gasstrahls liegt<br />
typischerweise eine durch die exper<strong>im</strong>entellen Parameter best<strong>im</strong>mte diskrete Verteilung<br />
(N ) von Clusterteilchenzahlen N vor. Nachdem der Clusterstrahl die<br />
Analyseexper<strong>im</strong>ente wie z.B. Elektronenbeugung durchlaufen hat, kann diese Grössenverteilung<br />
(N ) durch massenspektrometrische Methoden best<strong>im</strong>mt werden<br />
[?].<br />
<strong>Die</strong> exper<strong>im</strong>entell gemessene Intensität I ~ ergibt sich dann durch eine lineare<br />
Superposition der von den einzelnen Clustern fester Größe N stammenden Streuintensitäten<br />
I N :<br />
~I =<br />
X<br />
N<br />
(N ) I N ; (7.95)<br />
wobei die Einzelintensitäten I N in der kinematischen Streutheorie durch Gleichung<br />
(7.23) gegeben sind.<br />
Da die entsprechenden Paarkorrelationsfunktion , N nach (7.25) mit den Einzelintensitäten<br />
I N über lineare Fourier–Transformationen zusammenhängen, läßt<br />
sich die Fourier–Transformierte , ~ der gemessenen Intensität I ~ ebenfalls als eine<br />
durch (N ) best<strong>im</strong>mte Superposition von Paarkorrelationsfunktionen fester Clustergrößen<br />
N best<strong>im</strong>men:<br />
~, =<br />
X<br />
N<br />
(N ), N : (7.96)<br />
Befinden sich auch die Cluster verschiedener Größe miteinander <strong>im</strong> thermischen<br />
Gleichgewicht, so läßt sich mit (7.94) wieder eine Formel angeben, durch<br />
die die innere Temperatur der Cluster aus der Fourier–Transformierten der gemessenen<br />
Streuintensität berechnen werden kann:<br />
R 1<br />
T = 1 0<br />
6k B<br />
drrV 0 (r) ,(r) ~ : (7.97)<br />
P<br />
(N)<br />
N N
Kapitel 8<br />
Numerische S<strong>im</strong>ulationen als<br />
ideale Exper<strong>im</strong>ente“<br />
”<br />
Um die Anwendbarkeit der in Kapitel 7 hergeleiteten Formeln zur Berechnung der<br />
potentiellen Energie (7.87) und der kinetischen Energie (7.88) bzw. Temperatur<br />
(7.94) zu überprüfen, haben wir klassische und <strong>Pfadintegral</strong>–Monte–Carlo S<strong>im</strong>ulationen<br />
von kanonischen Ensembles aus Argon– und Neon–Clustern als idealisierte<br />
numerische Exper<strong>im</strong>ente“ durchgeführt.<br />
”<br />
In diesen S<strong>im</strong>ulationen, bei denen die Temperatur als externer Parameter vorgegeben<br />
wird, wurden zum einen direkt die Erwartungswerte der Observablen E kin<br />
und E pot best<strong>im</strong>mt. Zum anderen wurde die Paarkorrelationsfunktion ,(r) ermittelt,<br />
aus der wir in einer nachfolgenden Datenanalyse ebenfalls Erwartungswerte<br />
für E kin und E pot gemäß der hergeleiteten Formeln berechnet haben.<br />
Um einen Vergleich mit früher durchgeführten numerischen S<strong>im</strong>ulationen für<br />
Argon–Cluster zu ermöglichen [?, ?, ?], haben wir für das Wechselwirkungspotential<br />
V WW der Argon– und Neon–Cluster eine analytische Potentialfunktion vom<br />
Lennard–Jones–(12,6)–Typ<br />
<br />
12 <br />
6<br />
<br />
V LJ (r) =4 , (8.1)<br />
r r<br />
angenommen, wobei die für Argon und Neon verwendeten Parameter zusammen<br />
mit den Massen der verwendeten Isotope in Tabelle 8.1 aufgeführt sind.<br />
Wie in Abschnitt 7.4 erklärt wurde, ist der klassisch–kanonische Formalismus<br />
eine gute Näherung, falls der interatomare Abstand d sehr viel größer als die thermische<br />
Wellenlänge th ist. Ab welcher Temperatur diese Bedingung für die von<br />
uns betrachteten Edelgascluster erfüllt ist, kann durch folgende grobe Abschätzung<br />
festgestellt werden:<br />
Für den interatomaren Abstand d wählen wir näherungsweise den Abstand<br />
r m = 6p 2, für den V LJ min<strong>im</strong>al wird. Mit den in Tabelle 8.1 aufgeführten Werten<br />
ergibt sich, daß bei Argon–Atomen für T 0:5 K und bei Neon–Atomen für<br />
T 5 K die klassische Beschreibung eine gute Näherung darstellt.<br />
62
KAPITEL 8. NUMERISCHE SIMULATIONEN... 63<br />
Argon Neon<br />
in meV 10.3 3.068<br />
in Å 3.405 2.745<br />
m in AMU 39.96238 19.99244<br />
Tabelle 8.1: Lennard–Jones–Parameter und Atomgewichte der in den numerischen<br />
S<strong>im</strong>ulationen verwendeten Edelgase Argon und Neon. Für die Atomgewichte wurden<br />
die Massen der am häufigsten vorkommenden Isotope gewählt.<br />
<strong>Die</strong> Größe der zu untersuchenden Cluster wurde so gewählt, daß einerseits<br />
die Stabilität der Cluster über einen genügend großen Zeitraum gewährleistet ist<br />
und andererseits die mit der Temperaturerhöhung verbundenen Strukturveränderungen<br />
zu einem deutlichen Effekt in der Paarkorrelationsfunktion bzw. dem Intensitätsspektrum<br />
führen. Bei Edelgasclustern bieten sich hierfür die niedrigsten<br />
abgeschlossenen Ikosaederkonfigurationen aus N = 13 und N = 55 Atomen<br />
bzw. die entsprechende Sequenz der einfach dekorierten Ikosaederkonfiguration<br />
aus N =14und N =56Atomen an.<br />
Im Fall von Argon ist bekannt, daß der fest–flüssig–Phasenübergang bei einer<br />
Temperatur von 20 K einsetzt [?]. Der zu untersuchende Temperaturbereich von 10<br />
bis 40 Kelvin liegt deutlich über der oben abgeschätzen kritischen Temperatur von<br />
0:5 K, eine rein klassische Behandlung sollte also eine gute Näherung darstellen.<br />
Aus diesem Grund haben wir für Argon klassisch–kanonische MC–S<strong>im</strong>ulationen<br />
von Clustern der Größen N = 12; 13; 14 und N = 54; 55; 56 durchgeführt.<br />
Dazu wurde ein von P. BORRMANN entwickeltes Programm zur klassischen MC–<br />
S<strong>im</strong>ulation mit einer von H. STAMERJOHANNS <strong>im</strong>plementierten Routine zur opt<strong>im</strong>ierten<br />
Datenanalyse nach FERRENBERG ET. AL. [?] kombiniert.<br />
In der opt<strong>im</strong>ierten Datenanalyse werden in einem selbstkonsistenten Verfahren<br />
die für feste Temperaturen in einzelnen MC–Läufen ermittelten Histogramm–<br />
DatenzueinerNäherung für die Zustandsdichte kombiniert. Aus dieser lassen<br />
sich dann die Erwartungswerte thermodynamischer Observablen über einen ganzen<br />
Temperaturbereich ermitteln.<br />
Für Neon ist auf Grund des gegenüber Argon halbierten Atomgewichtes dagegen<br />
zu erwarten, daß der fest–flüssig–Phasenübergang bei einer deutlich niedrigeren<br />
Temperatur eintritt und so Quanteneffekte eine wichtige Rolle spielen. <strong>Die</strong>s<br />
wird auch durch die o.g. Abschätzung für den Gültigkeitsbereich der klassischen<br />
Näherung gestützt, die nur für Temperaturen von deutlich mehr als 5 K eine klassische<br />
Beschreibung rechtfertigt.<br />
Andererseits kann die quantenmechanische Ununterscheidbarkeit der Neon-<br />
Atome für den hier relevanten Temperaturbereich von 2 bis 12 K vernachlässigt<br />
werden. Untersuchungen von CEPERLEY ET. AL. haben gezeigt [?], daß selbst für<br />
das noch leichtere Helium bei einer Temperatur von 2 K die durch die quantenmechanische<br />
Ununterscheidbarkeit hervorgerufenen Änderungen in der Paarkorrelationsfunktion<br />
gegenüber der korrigierten Mawell–Boltzmann–Statistik unter 2%
KAPITEL 8. NUMERISCHE SIMULATIONEN... 64<br />
liegen.<br />
Somit bietet es sich an, für ein System von Neon–Cluster die Ergebnisse von<br />
quantenmechanischer und klassischer Behandlung zu vergleichen. Konkret haben<br />
wir für ein System von Ne 13 –Clustern klassische Monte–Carlo und <strong>Pfadintegral</strong>–<br />
Monte–Carlo–S<strong>im</strong>ulationen (PIMC) durchgeführt.<br />
Das Prinzip der PIMC–S<strong>im</strong>ulationen wurde schon ausführlich in Kapitel 2<br />
erläutert, wobei hier allerdings nicht die Ununterscheidbarkeit der Teilchen berücksichtigt<br />
wurde, d.h. an Stelle der <strong>Permanente</strong> bzw. Determinante taucht in der Gewichtsfunktion<br />
(2.39) nur das Produkt der Diagonalelemente von A( +1;) auf.
Kapitel 9<br />
Ergebnisse<br />
Mit den in Kapitel 8 in numerischen S<strong>im</strong>ulationen berechneten Streuspektren kann<br />
nun überprüft werden, ob unsere formal exakte Methode zur Berechnung der potentiellen<br />
und kinetischen Energie bzw. der Temperatur auch für praktische Anwendungen<br />
geeignet ist.<br />
Zuerst werden die qualitativen Eigenschaften der mit den in Kapitel 8 beschriebenen<br />
S<strong>im</strong>ulationsverfahren berechneten Streuspektren I(s) und die dazugehörigen<br />
Paarkorrelationsfunktionen ,(r) diskutiert.<br />
Danach wird untersucht, ob unsere Formeln zur Berechnung von Energieerwartungswerten<br />
bzw. Temperaturen aus diesen Spektren sich numerisch stabil verhalten.<br />
Insbesondere werden die durch die Form der Potentialfunktion hervorgerufenen<br />
numerischen Probleme bei der Berechnung der kinetischen Energie betrachtet.<br />
Anschließend werden für die untersuchten Systeme aus Argon– und Neon–<br />
Clustern mit unserer Methode die potentiellen und kinetischen Energien als Funktionen<br />
der Temperatur best<strong>im</strong>mt und mit den exakten Werten aus den S<strong>im</strong>ulationen<br />
verglichen. Außerdem wird beschrieben, wie sich aus diesen Kurven Rückschlüsse<br />
auf Phasenübergänge innerhalb der betrachteten Cluster ziehen lassen.<br />
Zum Abschluß wird die spezifische Wärme als weitere entscheidende Größe<br />
zur Best<strong>im</strong>mung von Phasenübergängen betrachtet und es wird darauf eingegangen,<br />
wie diese sich aus den bisher gewonnenen Energiekurven E(T ) berechnen<br />
läßt.<br />
9.1 Theoretische Streuspektren und Paarkorrelationsfunktionen<br />
Zunächst betrachten wir die Paarkorrelationsfunktionen ,(r) und die daraus errechneten<br />
Intensitätsverteilungen I(s) aus den klassischen und quantenstatistischen<br />
S<strong>im</strong>ulationsrechnungen.<br />
Wie schon mehrfach erwähnt wurde, bilden die aus Streuexper<strong>im</strong>enten gewonnen<br />
Intensitätsverteilungen I(s) den Ausgangspunkt für die von uns entwickelte<br />
65
KAPITEL 9. ERGEBNISSE 66<br />
Methode zur Best<strong>im</strong>mung der inneren Energien E pot und E kin bzw. der inneren<br />
Temperatur T .<br />
In Abbildung 9.1 sind die Paarkorrelationsfunktionen und die dazugehörigen<br />
Spektren für ein klassisches System aus Argon–Clustern der Größen N =13und<br />
N = 14 gezeigt. Zur Berechnung dieser wie auch der anderen in diesem Kapitel<br />
gezeigten klassischen Paarkorrelationsfunktionen wurden 2 10 7 Monte–Carlo–<br />
Schritte durchgeführt. Exemplarisch sei hier die Rechenzeit für ein Ar 13 –System<br />
angegeben, die auf einer IBM AIX P70 Workstation mit 64 MB Hauptspeicher<br />
6.4 CPU–Minuten betrug.<br />
<strong>Die</strong> Paarkorrelationsfunktionen zeigen das typische Bild eines ausgeprägten<br />
ersten Max<strong>im</strong>ums mit weiteren Nebenmax<strong>im</strong>a geringere Höhe. Das erste Max<strong>im</strong>um<br />
gibt dabei den mittleren Abstand zum nächsten Nachbarn an, der <strong>im</strong> wesentlichen<br />
durch den Gleichgewichtsabstand des interatomaren Wechselwirkungspotentials<br />
best<strong>im</strong>mt wird.<br />
Betrachten wir zunächst die Kurven für das Ar 13 –System. <strong>Die</strong> Zentralpositionen<br />
der beiden bei T =20K deutlich erkennbaren Nebenmax<strong>im</strong>a entsprechen der<br />
idealen Ikosaederkonfiguration, die Aufweitung der Peaks wird durch die thermischen<br />
Fluktuationen hervorgerufen.<br />
Der fest–flüssig Phasenübergang findet für Ar 13 zwischen 25 und 30 Kelvin<br />
statt (s. z.B. [?]) was sich für T = 30 K in dem Verschmelzen der beiden Nebenmax<strong>im</strong>a<br />
äußert. Physikalisch bedeutet dies, daß das System genug thermische<br />
Energie besitzt, um neben der dem Grundzustand entsprechenden Ikosaederstruktur<br />
auch höherenergetische Isomerkonfigurationen besetzen zu können.<br />
Der Ar 14 Cluster hat als ideale Grundkonfiguration dagegen die einfach dekorierte<br />
Ikosaederstruktur. <strong>Die</strong>s führt in der Paarkorrelationsfunktion zu einem dritten<br />
Nebenmax<strong>im</strong>um sehr geringer Höhe, daß in Abb. 9.1 schwach <strong>im</strong> Bereich von 9 bis<br />
10 Å zu erkennen ist. Auch bei diesem System wird der fest–flüssig Phasenübergang<br />
bei der höheren Temperatur deutlich .<br />
Da die Paarkorrelationsfunktion durch eine räumliche Fouriertransformation<br />
mit der Intensitätsverteilung I(s) des Streuspektrums verknüpft ist, enthält diese<br />
ebenfalls die volle Strukturinformation. Das Intensitätsspektrum wird bei kleinen<br />
Streuparametern s prinzipiell durch die gröberen Strukturen (die ”<br />
Einhüllende“) in<br />
der Paarkorrelationsfunktion best<strong>im</strong>mt, während der Verlauf von I(s) bei größeren<br />
Werten des Streuparamters den feineren Details von ,(r) entspricht.<br />
<strong>Die</strong>se Interpretation wird gestützt durch das klassisch errechnete Streuspektrum<br />
der beiden Argon–Cluster mit der nächsten abgeschlossenen Ikosaederschale<br />
(N =55) bzw. der einfach dekorierten Ikosaederstruktur (N =56) in Abbildung<br />
9.2. <strong>Die</strong> deutlich feiner strukturierte Paarkorrelationsfunktion ,(r) hat ihr Äquivalent<br />
in der größeren Zahl von Beugungsmax<strong>im</strong>a und –min<strong>im</strong>a <strong>im</strong> Intensitätsspektrum<br />
I(s).<br />
Für Neon–13–Cluster haben wir sowohl klassische als auch <strong>Pfadintegral</strong>–Monte–Carlo–S<strong>im</strong>ulationen<br />
mit jeweils 2 10 7 Iterationen durchgeführt (s. Abb. 9.3).<br />
Bei den PIMC–Rechnungen wurde eine gute Konvergenzrate für das Verhältnis<br />
M= = 120 k B von Zeitscheiben zu inverser Temperatur erzielt.
KAPITEL 9. ERGEBNISSE 67<br />
a)<br />
I(s)<br />
b)<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
−5<br />
−10<br />
T=20 K, N=13<br />
T=20 K, N=14<br />
T=35 K, N=13<br />
T=35 K, N=14<br />
−15<br />
1.0 3.0 5.0 7.0 9.0<br />
s [Å −1 ]<br />
1.0<br />
0.8<br />
T=20 K, N=13<br />
T=20 K, N=14<br />
T=35 K, N=13<br />
T=35 K, N=14<br />
Γ(r)<br />
0.6<br />
0.4<br />
0.2<br />
0.0<br />
3.0 5.0 7.0 9.0 11.0<br />
r [Å]<br />
Abbildung 9.1: (a) Streuspektrum I(s) und (b) Paarkorrelationsfunktion ,(r) (beide<br />
in willk. Einheiten) für ein klassisches Ensemble von Ar 13 und Ar 14 Clustern.
KAPITEL 9. ERGEBNISSE 68<br />
a)<br />
I(s)<br />
20<br />
15<br />
10<br />
5<br />
0<br />
−5<br />
T=25 K, N=55<br />
T=25 K, N=56<br />
T=35 K, N=55<br />
T=35 K, N=56<br />
b)<br />
Γ(r)<br />
−10<br />
1.0 3.0 5.0 7.0 9.0<br />
s [Å −1 ]<br />
0.30<br />
0.25<br />
0.20<br />
0.15<br />
0.10<br />
0.05<br />
T=25 K, N=55<br />
T=25 K, N=56<br />
T=35 K, N=55<br />
T=35 K, N=56<br />
0.00<br />
3.0 6.0 9.0 12.0 15.0 18.0<br />
r [Å]<br />
Abbildung 9.2: (a) Streuspektrum I(s) und (b) Paarkorrelationsfunktion ,(r) für<br />
ein klassisches Ensemble von Ar 55 und Ar 56 Clustern.
KAPITEL 9. ERGEBNISSE 69<br />
a)<br />
I(s)<br />
15<br />
10<br />
5<br />
0<br />
−5<br />
−10<br />
T=4.5 K (cl.)<br />
T=4.5 K (q.m.)<br />
T=9.0 K (cl.)<br />
T=9.0 K (q.m.)<br />
b)<br />
Γ(r)<br />
−15<br />
1.0 3.0 5.0 7.0 9.0<br />
s [Å −1 ]<br />
1.4<br />
1.2<br />
1.0<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
T=4.5 K (cl.)<br />
T=4.5 K (q.m.)<br />
T=9.0 K (c.l.)<br />
T=9.0 K (q.m.)<br />
0.0<br />
2.5 3.5 4.5 5.5 6.5 7.5<br />
r [Å]<br />
Abbildung 9.3: (a) Streuspektrum I(s) und (b) Paarkorrelationsfunktion ,(r) aus<br />
klassischen und <strong>Pfadintegral</strong>-MC–S<strong>im</strong>ulationen von Ne 13 Clustern.
KAPITEL 9. ERGEBNISSE 70<br />
<strong>Die</strong> Rechenzeit pro Zeitscheibe betrug für eine PIMC–S<strong>im</strong>ulation 34.45 CPU–<br />
Minuten auf dem CONVEX SPPUX Parallelrechner (1 GByte Hauptspeicher, 8<br />
Prozessoren) des Hochschulrechenzentrums der Universität Oldenburg.<br />
Auch für Ne 13 zeigen sich in der Paarkorrelationsfunktion wieder die drei<br />
für die Ikosaederkonfiguration charakteristischen Max<strong>im</strong>a. Es fällt auf, daß bei<br />
den quantenmechanisch errechneten Paarkorrelationsfunktionen die Peaks deutlich<br />
niedriger und breiter sind, als bei den entsprechenden klassisch errechneten Kurven,<br />
was auf die <strong>im</strong> quantenmechanischen Fall vorhandenen Nullpunktsschwingungen<br />
zurückzuführen ist. Wie auch zu erwarten ist, n<strong>im</strong>mt dieser quantenmechanische<br />
Effekt mit steigender Temperatur ab.<br />
Schließlich läßt sich aus den quantenmechanischen Kurven auch abschätzen,<br />
daß der fest–flüssig–Phasenübergang in einem Temperaturbereich 4 K T 9 K<br />
stattfindet.<br />
9.2 Best<strong>im</strong>mung von Erwartungswerten<br />
An dieser Stelle soll untersucht werden, inwieweit sich mit den in Abschnitt 7.3.4<br />
und 7.4 vorgestellten Formeln — die rein formal exakt sind — die Erwartungswerte<br />
für E pot und E kin bzw. die Temperatur T aus numerisch vorliegenden Spektren<br />
berechnen lassen.<br />
Da die eben angesprochenen Formeln in Kapitel 7 mit Hilfe verallgemeinerter<br />
Virialtheoreme hergeleitet werden, bezeichnen wir <strong>im</strong> weiteren Erwartungswerte,<br />
die über diese Formeln aus den Streuspektren berechnet werden, als viriale Erwartungswerte.<br />
Als erstes untersuchen wir die Berechnung der mittleren potentiellen Energie<br />
E pot aus einem vorgegebenem Streuspektrum I(s). Nach Gleichung (7.87) kann<br />
E pot aus einer Integration über das Produkt der Paarkorrelationsfunktion ,(r) und<br />
einem angenommenen Wechselwirkungspotential V (r) best<strong>im</strong>mt werden.<br />
Da die Paarkorrelationsfunktion sich aber nach (7.25) als Fourier–Transformierte<br />
des Streuspektrums I(s) darstellen läßt, finden wir die Formel<br />
Z<br />
N (N , 1) 1<br />
E pot = dsG pot (s) (9.1)<br />
2<br />
wobei G pot (s) als<br />
G pot (s) =4s 2 <br />
Itot (s)<br />
Njf (s)j 2 , 1 Z 1<br />
0<br />
0<br />
dr sin(sr)<br />
sr<br />
V (r) (9.2)<br />
definiert ist.<br />
Für jeden Streuparameter s gibt die Größe G pot (s) also an, wieviel die zu diesem<br />
Streuparameter gehörende Intensität zur potentiellen Energie beiträgt. <strong>Die</strong>ser<br />
Sachverhalt wird exemplarisch in Abbildung 9.4 (a) verdeutlicht. Dort wird für ein<br />
bei T =20K theoretisch errechnetes Intensitätsspektrum klassischer Ar 13 –Cluster<br />
sowohl G pot (s) als auch die unnormierte Größe R s<br />
0 G pot(s 0 )ds 0 gezeigt.
KAPITEL 9. ERGEBNISSE 71<br />
a)<br />
G pot<br />
(s) [meVÅ]<br />
2<br />
0<br />
−2<br />
−4<br />
−6<br />
G pot<br />
(s)<br />
Integral G pot<br />
(s) ds<br />
b)<br />
G kin<br />
(s) [meVÅ]<br />
−8<br />
60<br />
40<br />
20<br />
0<br />
−20<br />
−40<br />
−60<br />
−80<br />
0 5 10 15<br />
s [Å −1 ]<br />
G kin<br />
(s)<br />
Integral G kin<br />
(s)<br />
0 5 10 15<br />
s [Å −1 ]<br />
Abbildung 9.4: Beiträge der gemessenen Streuintensität I(s) zur potentiellen<br />
Rund kinetischen R Energie in Abhängigkeit vom Streuparameter s. <strong>Die</strong> Integrale<br />
1<br />
1<br />
G<br />
0 pot ds und G<br />
0 kin ds ergeben bei geeigneter Normierung die virialen Erwartungswerte<br />
für die potentielle und kinetische Energie.
KAPITEL 9. ERGEBNISSE 72<br />
Es ist gut zu erkennen, daß die Integralfunktion <strong>im</strong> wesentlichen einen monoton<br />
fallenden Verlauf hat und sich recht schnell auf einen stabilen Sättigungswert<br />
einpendelt. <strong>Die</strong>s bedeutet, daß Streuparameter größer als 15 Å ,1 nur noch geringe<br />
Beiträge zum Integral liefern.<br />
<strong>Die</strong> kinetische Energie läßt sich mittels (7.88) und (7.25) in analoger Weise als<br />
Funktional des Streuspektrums schreiben:<br />
E pot =<br />
N (N , 1)<br />
2<br />
Z 1<br />
G kin (s) = 4s 2 <br />
Itot (s)<br />
0<br />
dsG kin (s) (9.3)<br />
Njf (s)j 2 , 1 Z 1<br />
0<br />
dr sin(sr)<br />
sr<br />
rV 0 (r): (9.4)<br />
Auch für die kinetische Energie gibt G kin (s) an, wie die <strong>im</strong> Streuspektrum<br />
gemessene Intensität I(s) in den Erwartungswert für E kin eingeht. Für das schon<br />
oben erwähnte Beispielsystem R aus Ar 13 –Clustern bei 20 Kelvin sind in Abbildung<br />
s<br />
9.4 (b) G kin (s) und G 0 kin(s 0 )ds 0 aufgetragen.<br />
Hier fällt auf, daß die Integralfunktion sich nicht in eindeutiger Weise einem<br />
stabilen Wert nähert. Zunächst wird das Integral über G kin (s) sogar negativ, bevor<br />
es <strong>im</strong> hinteren Teil des Spektrums auf einen physikalisch sinnvollen, positiven Wert<br />
zustrebt.<br />
Im nächsten Schritt werden die aus den numerischen Streuspektren berechneten<br />
virialen Erwartungswerte für E pot und E kin mit den als exakt angenommenen<br />
Erwartungswerten aus den Monte–Carlo–S<strong>im</strong>ulationen verglichen. Dabei<br />
zeigt sich, daß die relative Abweichung E pot vernachlässigbar klein ist (E pot <br />
0:01%). <strong>Die</strong> Abweichung in der kinetischen Energie hängt dagegen stark von der<br />
Anzahl der Datenpunkte ab, mit der die Streuspektren numerisch dargestellt werden,<br />
und schwankt zwischen 1% und 30%.<br />
Es läst sich also festhalten, daß obwohl die beiden Formeln (7.87) und (7.88)<br />
mathematisch exakt sind, die Formel (7.88) zur Berechnung der kinetischen Energie<br />
numerisch weniger stabil ist als die Formel zur Berechnung der potentiellen<br />
Energie !<br />
<strong>Die</strong> Ursache für dieses völlig unterschiedliche Verhalten in der numerischen<br />
Anwendung kann nur darin zu suchen sein, daß bei der Berechnung der kinetischen<br />
Energie die Ableitung der Potentialfunktion V (r) eingeht.<br />
Betrachten wir dazu die Abbildung 9.5, in der der Verlauf der Potentialfunktion<br />
V (r) und ihrer Ableitung für zwei gängige Argon–Wechselwirkungspotentiale<br />
dargestellt ist. Zum einen ist dies das analytisch einfach darstellbare und deshalb<br />
häufig in S<strong>im</strong>ulationen verwendete Lennard–Jones–Potential. Zum anderen wird<br />
das laut [?] für gasförmige Argon–D<strong>im</strong>ere realistischere HFD–C–Potential von<br />
AZIZ ET. AL. gezeigt.
KAPITEL 9. ERGEBNISSE 73<br />
0<br />
V(r) [meV]<br />
−2<br />
−4<br />
−6<br />
−8<br />
−10<br />
V’(r) [meV]<br />
10<br />
8<br />
6<br />
4<br />
2<br />
0<br />
−2<br />
−4<br />
L.−J.<br />
HFD−C<br />
3 4 5 6 7 8 9 1011<br />
r [Å]<br />
Lennard−Jones−(6,12)−Potential<br />
Aziz/Chen HFD−C Potential<br />
3 4 5 6 7 8 9<br />
r [Å]<br />
Abbildung 9.5: Wechselwirkungspotentiale für Argon: Lennard–Jones–(6,12)–<br />
Potential (durchgezogene Linie) und Aziz–HFD–C–Potential (gestrichelte Linie).<br />
Der Einschub zeigt die Ableitung beider Potentialfunktionen.<br />
Da für die nun folgende Diskussion nur der qualitative Verlauf des Wechselwirkungspotentials<br />
eine Rolle spielt, der sich für Argon wie für alle Edelgase bei den<br />
meisten empirisch best<strong>im</strong>mten Potentialfunktionen nur geringfügig unterscheidet,<br />
ist <strong>im</strong> weiteren nur von der Potentialfunktion die Rede.<br />
Zuerst betrachten wir, wie sich das Produkt aus der Paarkorrelationsfunktion<br />
,(r) und dem Potential bzw. der Ableitung des Potentials verhält. Sowohl V (r) als<br />
auch V 0 (r) sind numerisch gesehen für radiale Abstände r größer als 15 Å gleich<br />
Null. Andererseits führt der steile Hardcore-Anteil des Potentials dazu, daß in ,(r)<br />
der Nearest-Neighbour-Peak erst ab circa 3 Å beginnt, wie z.B. in Abbildung 9.1<br />
(b) zu erkennen ist. Nur in diesem Bereich liefern die radialen Integrationen in den<br />
Formeln für die potentielle und die kinetische Energie also einen nennenswerten<br />
Beitrag.<br />
Betrachten wir nun die Ableitung der Potentialfunktion etwas genauer: Ihr Verlauf<br />
wird in dem relevanten Bereich von 3 Å r 9 Å durch die große Steigung<br />
der Potentialfunktion in der Nähe des Min<strong>im</strong>ums und durch den Wendepunkt <strong>im</strong><br />
attraktiven Teil der Potentialfunktion geprägt. <strong>Die</strong> Ableitung V 0 (r) steigt bis zu<br />
ihrem Max<strong>im</strong>um an der Stelle des Wendepunktes von V (r) sehr viel steiler als die<br />
Potentialfunktion selbst an und sie hat zudem noch negative und positive Anteile.
KAPITEL 9. ERGEBNISSE 74<br />
Damit ist auch eine Erklärung für die numerischen Probleme bei der Berechnung<br />
der kinetischen Energie gefunden: Nur wenn in dem Bereich, wo die Ableitung<br />
V 0 (r) sich stark ändert, genügend viele Werte von ,(r) vorliegen, kann eine<br />
numerische Integration über das Produkt rV 0 (r),(r) ein vernünftiges Resultat<br />
liefern.<br />
9.3 Kalorische Zustandsgleichungen<br />
Ein umfassenderer Überblick über die Strukturumwandlungen innerhalb eines Systems<br />
von Clustern läßt sich dadurch gewinnen, daß die potentielle Energie der<br />
Cluster in Abhängigkeit von der kinetischen Energie, oder — <strong>im</strong> klassischen Grenzfall<br />
— in Abhängigkeit von der Temperatur aufgetragen wird. <strong>Die</strong> so entstehenden<br />
Kurven werden in der Literatur als kalorische Kurven oder kalorische Zustandsgleichungen<br />
bezeichnet.<br />
Nachdem wir <strong>im</strong> vorherigen Abschnitt die numerische Stabilität unserer Methode<br />
untersucht haben, wollen wir sie nun dazu benutzen, aus numerisch vorliegenden<br />
Spektren solche kalorischen Kurven E pot (E kin ) bzw. E pot (T ) zu berechnen.<br />
Als Testdaten verwenden wir die in Abschnitt 9.1 vorgestellten Streuspektren aus<br />
den Monte–Carlo–S<strong>im</strong>ulationen bzw. die dazugehörigen Paarkorrelationsfunktionen.<br />
Abbildung 9.6 zeigt die kalorischen Kurven für klassisch modellierte Systeme<br />
von (a) Ar 13 ,Ar 14 und (b) Ar 55 Clustern. <strong>Die</strong> mit ”<br />
quasi exakt“ bezeichneten<br />
Linien geben den Verlauf der kalorischen Zustandsgleichungen E pot (T ) wieder,<br />
wie er direkt in den klassischen MC–S<strong>im</strong>ulationen berechnet wurde. <strong>Die</strong> virialen<br />
Erwartungswerte sind durch Symbole markiert.<br />
Betrachten wir zunächst in beiden Teilbildern die exakten Ergebnisse. Für alle<br />
drei Clustergrößen N = 13; 14; 55 n<strong>im</strong>mt die Steigung der kalorischen Kurven<br />
— also die spezifische Wärme — plötzlich zu. <strong>Die</strong>ser Effekt kann nach BERRY<br />
als Indikator für das ”<br />
Schmelzen“ der Cluster aufgefaßt werden, bei dem in einer<br />
Koexistenzphase mehrere Clusterstrukturen gleichzeitig vorliegen können [?].<br />
Es fällt auf, daß die Temperatur, bei der dieser Effekt eintritt, für den 55er Cluster<br />
höher liegt als für die kleineren 13=14er Cluster und daß der Schmelzeffekt bei<br />
den kleineren Clustern weniger deutlich ausgerprägt ist. Außerdem ist in dem dargestellten<br />
Temperaturbereich nicht das nach dem Modell von Berry vorhergesagte<br />
Abflachen der kalorischen Kurve für größere Temperaturen zu beobachten, welches<br />
auf eine Beendigung der Koexistenzphase schliessen ließe. Der Grund dafür<br />
ist, daß die betrachteten Argon–Cluster in diesem Temperaturbereich nicht mehr<br />
stabil sind [?].<br />
<strong>Die</strong>se als exakt angenommenen kalorischen Kurven können nun mit Werten<br />
für E pot (T ) verglichen werden, die sich mit den Formeln (7.87) und (7.94) aus den<br />
in Abbildung 9.1 dargestellten Streuspektren und einem angenommenen Wechselwirkungspotential<br />
V (r) berechnen lassen.
KAPITEL 9. ERGEBNISSE 75<br />
a)<br />
E pot<br />
[meV]<br />
−320<br />
−360<br />
−400<br />
−440<br />
quasi exact (N=13)<br />
quasi exact (N=14)<br />
virial est. LJ−pot (N=13)<br />
virial est. LJ−pot (N=14)<br />
virial est. HFD−C−pot (N=14)<br />
b)<br />
−480<br />
10 15 20 25 30 35 40<br />
T kin<br />
[K]<br />
−2200<br />
quasi exact (N=55)<br />
virial est. (15 Punkte/Å)<br />
virial est. (18 Punkte/Å)<br />
E pot<br />
[mev]<br />
−2400<br />
−2600<br />
−2800<br />
10 15 20 25 30 35 40<br />
T [K]<br />
Abbildung 9.6: Kalorische Zustandsgleichungen für klassische Ensembles von<br />
Argon–Clustern: (a) quasi exakte Kurven aus den MC–S<strong>im</strong>ulationen und viriale<br />
Näherungskurve für Ar 13 und Ar 14 Cluster, (b) quasi exakte Kurve und viriale<br />
Näherungskurven für zwei verschieden genau abgetastete Paarkorrelationsfunktionen<br />
von Ar 55 Clustern.
KAPITEL 9. ERGEBNISSE 76<br />
Wird für die interatomare 2–Teilchen–Wechselwirkung V (r) dasselbe Lennard–Jones–Potential<br />
(8.1) gewählt, das auch in den numerischen S<strong>im</strong>ulationen<br />
verwendet wurde, so ergeben sich in Abbildung 9.6 (a) und (b) die mit dem Diamant–<br />
Symbol und die mit kleinen Kreisen versehenen virialen Erwartungswerte für<br />
die potentielle Energie.<br />
<strong>Die</strong> virialen kalorischen Kurven st<strong>im</strong>men offensichtlich für die beiden kleinen<br />
Cluster gut mit den exakten Kurvenverläufen überein. Insgesamt betrachtet scheinen<br />
die virialen Kurven gegenüber den exakten Kurven zu etwas niedrigeren Temperaturen<br />
verschoben zu sein. Lediglich <strong>im</strong> Bereich des Phasenübergangs ergeben<br />
sich etwas größere Abweichungen als <strong>im</strong> Tieftemperaturbereich.<br />
<strong>Die</strong> Abweichung der virialen von der exakten kalorischen Kurve wird also<br />
durch den Fehler in der Temperatur best<strong>im</strong>mt, für die ausschließlich zu kleine<br />
Werte gefunden wurden. <strong>Die</strong>se Beobachtung steht in Einklang mit der Feststellung<br />
aus Abschnitt 9.2, daß die Berechnung der kinetischen Energie — und damit<br />
der Temperatur — sich numerisch viel ungünstiger verhält, als die Berechnung der<br />
potentiellen Energie.<br />
Anhand der kalorischen Kurve der Ar 55 Cluster läßt sich dieser Befund noch<br />
deutlicher ablesen. In Abbildung 9.6 (b) sind zwei viriale kalorische Kurven aufgetragen,<br />
die aus numerisch verschieden genau bekannten Spektren berechnet wurden.<br />
Wird der Kurvenverlauf von , durch 15 Funktionswerte pro Angstrøm beschrieben,<br />
so wird die Temperatur um einen konstanten Wert von (3 0:2) Kelvin<br />
zu niedrig berechnet. Bei einer Abtastrate von 18 Funktionswerten pro Angstrøm<br />
reduziert sich der konstante Fehler schon auf (2:2 0:2) Kelvin.<br />
In Abbildung 9.7 wird für die bis jetzt diskutierten Ar 13;14 und Ar 55;56 –Cluster<br />
eine Übersicht über den absoluten Fehler in der Temperatur gegeben, wie er bei<br />
der Berechnung aus den Streuspektren nach Gleichung (7.94) auftaucht.<br />
Wie in Abschnitt 9.2 vorhergesagt wurde, zeigt sich also, daß das Ergebnis<br />
der Temperaturberechnung nach Formel (7.94) sehr sensibel davon abhängt, wie<br />
genau der Verlauf des Intensitätsspektrums I(S) bzw. der Paarkorrelationsfunktion<br />
, bekannt ist.<br />
Abschließend untersuchen wir noch für das System aus Ar 14 –Clustern, welche<br />
Auswirkung die Wahl des Wechselwirkungspotentials auf die kalorische Kurve hat.<br />
Wählen wir an Stelle des Lennard–Jones–Potentials das realistischere HFD–C–<br />
Potential von AZIZ ET AL., so ergibt sich die in Abbildung 9.6 (a) mit Kreuzen<br />
markierte kalorische Kurve. <strong>Die</strong>se viriale kalorische Kurve ist nicht nur zu deutlich<br />
höheren potentiellen Energien und niedrigeren Temperaturen verschoben, sondern<br />
sie zeigt auch <strong>im</strong> Bereich des Phasenübergangs einen wesentlich steileren Anstieg.<br />
<strong>Die</strong> Ursache für diese drastischen Unterschiede zwischen der virialen und der<br />
exakten kalorischen Kurve hängen damit zusammen, daß wir in den (als exakt angenommenen)<br />
MC–S<strong>im</strong>ulationen das Lennard–Jones–Potential verwendet haben.<br />
In Abbildung 9.5 ist jedoch zu erkennen, daß sich das HFD–C vom Lennard–<br />
Jones–Potential gerade für solche Abstände r signifikant unterscheidet, die entscheidend<br />
in die Berechnung der potentiellen Energie und der Temperatur einge-
KAPITEL 9. ERGEBNISSE 77<br />
hen.<br />
T − T est<br />
[K]<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
N = 13<br />
N = 14<br />
N = 55<br />
N = 56<br />
−1<br />
10 15 20 25 30 35 40<br />
T [K]<br />
Abbildung 9.7: Absolute Abweichung der über Gleichung (7.94) best<strong>im</strong>mten Temperatur<br />
T est von der exakten Temperatur T für Ar 13;14 und Ar 55;56 –Cluster. Für die<br />
kleineren Cluster wurden Spektren mit 15 Datenpunkten pro Å und für die größeren<br />
Cluster Spektren mit 18 Datenpunkten pro Å verwendet.<br />
Wenden wir uns nun dem System aus Ne 13 –Clustern zu, daß wir klassisch und<br />
quantenmechanisch behandelt haben. Im quantenmechanischen Fall sind wir mit<br />
der in Kapitel 7 vorgestellten Methode nicht in der Lage, die innere Temperatur<br />
der Cluster zu best<strong>im</strong>men, es kann lediglich der Erwartungswert für die kinetische<br />
Energie best<strong>im</strong>mt werden.<br />
In der sich so ergebenden Kurve E pot (E kin ), die in Abbildung 9.8 (a) gezeigt<br />
wird, ist sehr schön der Phasenübergang von der ”<br />
festen“ zur ”<br />
flüssigen“ Clusterstruktur<br />
zu erkennen. Der Vergleich mit den als exakt interpretierten Werten aus<br />
den PIMC–S<strong>im</strong>ulationen zeigt, daß sich beide Kurven nur <strong>im</strong> Koexistenzbereich<br />
des Phasenübergangs deutlich unterscheiden lassen, die virialen Erwartungswerte<br />
liefern für E kin wieder zu kleine Werte. Mit dem Abflachen der Kurve ab einem<br />
Wert von 24 meV für die kinetische Energie st<strong>im</strong>men die virialen Werte wieder<br />
besser mit den S<strong>im</strong>ulationswerten überein.
KAPITEL 9. ERGEBNISSE 78<br />
a)<br />
E pot<br />
[meV]<br />
−80<br />
−90<br />
−100<br />
quasi exact<br />
virial est.<br />
b)<br />
E pot<br />
[meV]<br />
−110<br />
−100<br />
−110<br />
−120<br />
−130<br />
22 23 24 25<br />
E kin<br />
[meV]<br />
quasi exact<br />
virial est.<br />
−140<br />
2 4 6 8 10<br />
T [K]<br />
Abbildung 9.8: Klassische und quantenmechanische Zustandsgleichungen von<br />
Ne 13 Clustern: (a) quasi exakte Kurve aus <strong>Pfadintegral</strong>-MC–S<strong>im</strong>ulationen und viriale<br />
Näherungskurve, (b) quasi exakte Kurve aus klassischen MC–S<strong>im</strong>ulationen<br />
und und viriale Näherungskurve.
KAPITEL 9. ERGEBNISSE 79<br />
Wird dasselbe System aus Ne 13 –Clustern klassisch untersucht, so ergibt sich<br />
die in Abbildung 9.8 (b) gezeigte Kurve für die potentielle Energie. Wieder st<strong>im</strong>men<br />
die virialen Erwartungswerte mit den S<strong>im</strong>ulationswerten gut überein.<br />
In ihrem Verlauf ähnelt die kalorische Kurve stark der entsprechenden Kurve<br />
für die klassischen Ar 13 –Cluster aus Abbildung 9.6 (a). Auf Grund der geringeren<br />
Atommasse sind die Ne 13 –Cluster nur über einen wesentlich kleineren Temperaturbereich<br />
stabil als die Ar 13 –Cluster, der Phasenübergang beginnt schon bei<br />
Temperaturen um 8 Kelvin.<br />
Auch für die kinetische Energie können wir die virialen Erwartungswerte mit<br />
den exakten Werten aus den numerischen S<strong>im</strong>ulationen vergleichen. In Abbildung<br />
9.9 (a) sind beide Werte sowohl für den klassischen als auch für den quantenmechanischen<br />
Fall aufgetragen. In beiden Fällen st<strong>im</strong>men die viriale und die exakte<br />
Kurve wieder gut überein.<br />
Das Teilbild (b) zeigt für beide Energiekurven die absolute Abweichung<br />
E kin = E exakt<br />
kin<br />
, E virial<br />
kin (9.5)<br />
der virialen Werte von den exakten Werten. Es fällt auf, daß <strong>im</strong> klassischen Fall der<br />
Fehler über einen großen Temperaturbereich fast konstant ist und über dem Fehler<br />
der quantenmechanischen Rechnungen liegt. Der größere Fehler wird dadurch<br />
erklärt, daß zur Berechnung der quantenmechanischen Werte wieder Paarkorrelationsfunktionen<br />
mit einer höheren Punktdichte verwendet wurden.<br />
<strong>Die</strong> ”<br />
Glattheit“ der klassischen Kurven resultiert daraus, daß bei der opt<strong>im</strong>ierten<br />
Datenanalyse die Information von wenigen bei fester Temperatur durchgeführten<br />
MC–S<strong>im</strong>ulationen auf einen ganzen Temperaturbereich extrapoliert wird. Im<br />
quantenmechanischen Fall wurde dagegen für jeden gezeigten Datenpunkt eine<br />
unabhängige PIMC–S<strong>im</strong>ulation gestartet.<br />
9.4 Best<strong>im</strong>mung der spezifischen Wärme<br />
Ähnlich wie bei makroskopischen Systemen ist die spezifische Wärme eine weitere<br />
wichtige Größe für die Best<strong>im</strong>mung von Phasenübergängen in mesoskopischen<br />
Systemen wie z.B. Mikroclustern.<br />
Als Beispiel für die Best<strong>im</strong>mung der spezifischen Wärme wollen wir das kanonische<br />
Ensemble von Ne 13 –Clustern betrachten, für das wir klassische und quantenmechanische<br />
S<strong>im</strong>ulationsrechnungen durchgeführt haben. Da die translatorischen<br />
Freiheitsgrade für die Strukturveränderungen innerhalb eines Clusters nicht<br />
relevant sind, beschränken wir uns auch hier auf die inneren Freiheitsgrade.<br />
Für dieses System können wir die Wärmekapazität bei konstantem Volumen<br />
C V (T ) als Steigung der kalorischen Kurve E(T ) berechnen:<br />
<br />
C V (T )= @E<br />
@T ; (9.6)<br />
V
KAPITEL 9. ERGEBNISSE 80<br />
a)<br />
30<br />
25<br />
b)<br />
E kin<br />
[meV]<br />
20<br />
15<br />
10<br />
5<br />
0<br />
0.50<br />
qm: quasi exact<br />
qm: virial est.<br />
cl: quasi exact<br />
cl: virial est.<br />
2 4 6 8 10 12<br />
T [K]<br />
0.40<br />
∆E kin<br />
[meV]<br />
0.30<br />
0.20<br />
0.10<br />
0.00<br />
2 4 6 8 10 12<br />
T [K]<br />
Abbildung 9.9: (a)Vergleich von klassischer und quantenmechanischer kinetische<br />
Energie für ein Ensemble aus Ne 13 Clustern. (b) Absolute Abweichung der klassischen<br />
und quantenmechanischen virialen kinetischen Energie von der exakten<br />
kinetischen Energie für Ne 13 Cluster.
KAPITEL 9. ERGEBNISSE 81<br />
aus der sich die entsprechende spezifische Wärme durch Bezug auf die Teilchenzahl<br />
ergibt.<br />
Mit der in dieser Arbeit entwickelten Methode ist es nur <strong>im</strong> klassischen Fall<br />
möglich, die innere Energie in Abhängigkeit von der Temperatur aus den Streuspektren<br />
zu berechnen. Im quantenmechanischen Fall kann nur die potentielle Energie<br />
als Funktion der kinetischen Energie best<strong>im</strong>mt werden. Strenggenommen kann<br />
damit auch die Wärmekapazität bei konstantem Volumen als Ableitung der kalorischen<br />
Kurve E(T ) nur <strong>im</strong> klassischen Fall errechnet werden.<br />
Um trotzdem einen Vergleich von klassischen und quantenmechanischen Ergebnissen<br />
zu ermöglichen, benutzen wir die aus den S<strong>im</strong>ulationsrechnungen bekannte<br />
Zuordnung von kinetischer Energie zu Temperatur, um auch für den quantenmechanischen<br />
Fall eine Kurve E(T ) zur Verfügung zu haben.<br />
Nach Interpolation der klassischen und quantenmechanischen kalorischen Kurven<br />
durch geeignete least-squares-Fits können die Wärmekapazitäten für beide<br />
Fälle durch numerische Differentiationen best<strong>im</strong>mt werden. Als Fit-Funktionen<br />
wurden <strong>im</strong> klassischen Fall kubische B–Splines 3. Ordnung und <strong>im</strong> quantenmechanischen<br />
Fall ein Polynom 3. Ordnung benutzt.<br />
10.0<br />
C V<br />
[meV/K]<br />
8.0<br />
6.0<br />
4.0<br />
2.0<br />
0.0<br />
cl: quasi exact<br />
cl: virial est.<br />
qm: quasi exact<br />
qm: virial est.<br />
2.0 4.0 6.0 8.0 10.0<br />
T [K]<br />
Abbildung 9.10: Klassisch und quantenmechanisch berechnete Wärmekapazität<br />
bei konstanten Volumen C V (T ) für Ne 13 –Cluster.<br />
<strong>Die</strong> so errechneten Wärmekapazitäten C V (T ) sind in Abbildung 9.10 darge-
KAPITEL 9. ERGEBNISSE 82<br />
stellt. <strong>Die</strong> Übereinst<strong>im</strong>mung zwischen den aus den virialen Kurven errechneten<br />
Wärmekapazitäten, für die der Übersichtlichkeit halber nur einzelne Punkte eingezeichnet<br />
sind, und den aus den S<strong>im</strong>ulationsdaten errechneten Wärmekapazitäten<br />
ist nahezu perfekt.<br />
Bei der klassischen Wärmekapazität ist gut zu erkennen, daß sie für kleine<br />
Temperaturen dem konstanten Wert 3(N , 1)k B ann<strong>im</strong>mt und <strong>im</strong> Bereich des Phasenübergangs<br />
ab ungefähr 8 Kelvin mit der quantenmechanischen Kurve zusammenfällt.<br />
<strong>Die</strong>se nähert sich wiederum dem Nullpunkt proportional zu T 3 ,wiees<br />
auch durch das quantenmechanische Normalmodenmodell von FRANKE vorhergesagt<br />
wird [?].
Kapitel 10<br />
Zusammenfassung und Ausblick<br />
In diesem zweiten Teil der Diplomarbeit wurde untersucht, wie sich aus exper<strong>im</strong>entell<br />
gemessenen Streuspektren atomarer Cluster Rückschlüsse auf Phasenübergänge<br />
in diesen Clustern ziehen lassen.<br />
Phasenübergänge in Clustern lassen sich u.a. durch plötzliche Änderungen<br />
in den kalorischen Kurven E(T ) und ihrer Ableitungen, den Wärmekapazitäten<br />
C V (T ) feststellen. Bei dem bisherigen Standardverfahren zur Analyse von Streuspektren<br />
lassen sich die Energie und die Temperatur nur auf indirekte Weise ermitteln,<br />
indem mit Molekulardynamik– oder Monte–Carlo–S<strong>im</strong>ulationen theoretische<br />
Streuspektren errechnet und visuell mit den exper<strong>im</strong>entell gemessenen Spektren<br />
verglichen werden.<br />
<strong>Die</strong> bisherige Vorgehensweise hat den Nachteil, daß zum einen zeitaufwendige<br />
numerische S<strong>im</strong>ulationen durchgeführt werden müssen und zum anderen ein<br />
subjektives Element durch den visuellen Vergleich von Spektren eingeführt wird.<br />
In dieser Arbeit haben wir nun eine Methode entwickelt, mit der für atomare<br />
Cluster direkt aus den gemessenen Streuspektren die potentielle und kinetische<br />
Energie sowie <strong>im</strong> klassischen L<strong>im</strong>es die Temperatur berechnet werden können.<br />
Dazu wurde benutzt, daß die gemessenen Streuspektren sich als dreid<strong>im</strong>ensionale<br />
Fourier–Transformierte der räumlichen Paarkorrelationsfunktion interpretieren<br />
läßt.<br />
Ausgehend von den von HIRSCHFELDER eingeführten verallgemeinerten Virialtheoremen<br />
(Hypervirialtheoremen) wurde gezeigt, daß sich für ein kanonisches<br />
Ensemble von atomaren Clustern die Energien und die Temperatur über eine einfache<br />
Integration aus der Paarkorrelationsfunktion und einem angenommenen paarweisen<br />
Wechselwirkungspotential berechnen lassen.<br />
Es wurde erläutert, wie die so hergeleiteten Formeln zur Berechnung der Energien<br />
und der Temperatur modifiziert werden müssen, damit sie auch bei exper<strong>im</strong>entell<br />
vorliegenden diskreten Verteilungen (N ) von Clustern verschiedener<br />
Teilchenzahlen N angwendet werden können.<br />
Weiterhin wurde untersucht, ob unsere neue Methode auch für praktische Anwendungen<br />
geeignet ist. Dazu wurden mit klassischen Monte–Carlo und Pfadinte-<br />
83
KAPITEL 10. ZUSAMMENFASSUNG UND AUSBLICK 84<br />
gral–Monte–Carlo S<strong>im</strong>ulationen theoretische Streuspektren von kanonischen Ensembles<br />
aus Argon– und Neon–Clustern berechnet.<br />
Obwohl sowohl die potentielle Energie als auch die kinetische Energie bzw.<br />
die Temperatur mit unserer Methode formal exakt berechenbar sein müßten, zeigte<br />
es sich, daß die Berechnung der kinetischen Energie bzw. der Temperatur numerisch<br />
weniger stabil ist, während der Fehler bei der Berechnung der potentiellen<br />
Energie zu vernachlässigen ist. Als Ursache für dieses unterschiedliche numerische<br />
Verhalten der kinetischen Energie wurde die Ableitung der Potentialfunktion<br />
identifiziert und es wurde erklärt, wie sich der daraus resultierende Fehler in der<br />
Energieberechnung min<strong>im</strong>ieren läßt.<br />
Außerdem wurde diskutiert, inwieweit die Wahl der Potentialfunktion das Ergebnis<br />
der Berechnung beeinflußt. Es wurde festgestellt, daß für sich nur wenig unterscheidende<br />
Potentialfunktionen ähnliche Resultate bei der Energieberechnung<br />
zu erwarten sind.<br />
Schließlich wurde beschrieben, wie sich aus den so errechneten Energiekurven<br />
die spezifische Wärme berechnen läßt und wie aus beiden Größen Rückschlüsse<br />
auf Phasenübergänge innerhalb der betrachteten Cluster gezogen werden können.<br />
Als Fazit läßt sich festhalten, daß diese neue Methode prinzipiell eine schnellere<br />
und genauere Berechnung der Energien und Temperaturen atomarer Cluster aus<br />
gemessenen Streuspektren erlauben sollte als die bisherigen Verfahren. Eine definitive<br />
Aussage darüber läßt sich sicherlich nur dann treffen, wenn dieses Verfahren<br />
auf ”<br />
echte“ exper<strong>im</strong>entelle Streuspektren angewendet wird.<br />
<strong>Die</strong> in diesem Teil der Diplomarbeit erzielten Ergebnisse wurden als Artikel<br />
für die Veröffentlichung in ZEITSCHRIFT FÜR PHYSIK D eingereicht. Der Preprint<br />
des Artikels ist in Anhang B angefügt.
Anhang A<br />
Grundlagen von<br />
Monte–Carlo–Verfahren<br />
In diesem Anhang sind die für das Verständnis der Arbeit benötigten theoretischen<br />
Grundlagen zur Technik der Monte–Carlo–S<strong>im</strong>ulation in knapper Form zusammengestellt.<br />
<strong>Die</strong> Darstellung der wahrscheinlichkeitstheoretischen Grundlagen und der Markoffschen<br />
Ketten orientiert sich <strong>im</strong> wesentlich an den Lehrbüchern von KRENGEL<br />
[?] und RÖMER und FILK [?] und an dem Taschenbuch der Mathematik [?, ?].<br />
<strong>Die</strong> Beschreibung des Metropolis Algorithmus basiert zu großen Teilen auf dem<br />
Übersichtsartikel von BHANOT [?].<br />
Monte–Carlo–Verfahren werden <strong>im</strong> allgemeinen dazu benutzt, abstrakte mathematische<br />
Zufallsexper<strong>im</strong>ente numerisch zu s<strong>im</strong>ulieren. Mit solchen Zufallsexper<strong>im</strong>enten<br />
werden in der Regel unbekannte Größen berechnet, die mit Hilfe<br />
mathematischer Modelle als Erwartungswerte best<strong>im</strong>mter Zufallsvariablen X, also<br />
=E(X), interpretiert werden.<br />
<strong>Die</strong>se einfache Grundidee wird in den folgenden Abschnitten mathematisch<br />
präzisiert, wobei der Einfachheit halber nur der eind<strong>im</strong>ensionale Fall betrachtet<br />
wird.<br />
A.1 Zufallsgrößen<br />
Ein Vorgang, dessen Ausgang nur vom Zufall abhängt, heißt ein Zufallsexper<strong>im</strong>ent<br />
und die möglichen Ergebnisse eines Zufallsexper<strong>im</strong>entes heißen Ereignisse. <strong>Die</strong><br />
fundamentale Annahme in dem mathematischen Formalismus der Wahrscheinlichkeitstheorie<br />
ist nun, daß sich die Ergebnisse eines Zufallsexper<strong>im</strong>entes mit Hilfe<br />
einer abstrakten Menge beschreiben lassen. <strong>Die</strong>se Menge wird Menge der<br />
Elementarereignisse, Stichprobenraum oder auch Ereignisraum genannt und die<br />
Elemente von heißen Elementarereignisse.<br />
Nun kann der Stichprobenraum eine überabzählbare Menge sein, so daß es<br />
nicht möglich ist, jeden Ausgang des Zufallsexper<strong>im</strong>entes (ein Ereignis) mit genau<br />
85
ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 86<br />
einem Elementarereignis zu identifizieren und damit jedem Elementarereignis eine<br />
best<strong>im</strong>mte Wahrscheinlichkeit zuzuordnen. <strong>Viel</strong>mehr wird jedes Ereignis einer<br />
Menge von Elementarereignissen, also einer Teilmenge von entsprechen.<br />
Vom mathematischen Standpunkt ist es praktisch, nur Teilmengen von zuzulassen,<br />
die sich untereinander über best<strong>im</strong>mte algebraische Relationen verknüpfen<br />
lassen - sogenannte –Algebren. Damit lassen sich nämlich jetzt den Teilmengen<br />
einer solchen –Algebra Wahrscheinlichkeiten so zuordnen, daß die üblichen Rechenregeln<br />
(Kolmogorowsche Axiome) für Wahrscheinlichkeiten erfüllt sind. <strong>Die</strong><br />
Abbildung, die dies bewerkstelligt, heißt Wahrscheinlichkeitsmaß.<br />
<strong>Die</strong> Grundlage der Wahrscheinlichkeitstheorie bildet also ein Tripel (; ;)<br />
genannt Wahrscheinlichkeitsraum, daß aus der Menge der Elementarereignisse ,<br />
der –Algebra und dem Wahrscheinlichkeitsmaß :,! R besteht.<br />
Für die Anwendung in der Physik sind folgende Wahrscheinlichkeitsräume von<br />
besonderer Bedeutung:<br />
Der diskrete Fall =N:<br />
<strong>Die</strong> –Algebra ist die Menge aller Teilmengen von N. Das Wahrscheinlichkeitsmaß<br />
ist : N ,! [0; 1] mit (i) = i .<br />
Der kontinuierliche Fall =R N :<br />
<strong>Die</strong> –Algebra ist die Menge aller Teilmengen von R N , die sich durch<br />
die in definierten algebraischen Operationen aus Hyperquadern V =<br />
[a 1 ;b 1 ][a N ;b N ] erzeugen lassen. Das Wahrscheinlichkeitsmaß wird<br />
z.B. über eine Wahrscheinlichkeitsdichtefunktion (x) und das Lebesgue-<br />
Maß definiert, so daß einer Teilmenge E 2 die Wahrscheinlichkeit<br />
(E) =<br />
Z<br />
E<br />
(x)dx<br />
(A.1)<br />
zugeordnet wird.<br />
Eine Funktion f : ,! R heißt meßbar (genauer: -meßbar), wenn das<br />
Urbild jeder meßbaren Menge in R eine meßbare Menge in ist. Jede meßbare<br />
Funktion f : ,! R wird auch Zufallsvariable genannt und für sie läßt sich<br />
mittels<br />
f (M )=(f ,1 [M ]); M R (A.2)<br />
ein Wahrscheinlichkeitsmaß f auf ] ,1; 1[ definieren, das die Wahrscheinlichkeitsverteilung<br />
von f genannt wird.<br />
Mit Hilfe dieses Maßes läßt sich nun der Erwartungswert einer Zufallsvariablen<br />
f berechnen:<br />
E(f )=<br />
Z<br />
<br />
f d =<br />
Z<br />
R<br />
x d f (x) =<br />
Z<br />
R<br />
xw f (x)dx:<br />
(A.3)<br />
Im letzten Schritt der Gleichungskette wurde dabei die Wahrscheinlichkeitsdichte<br />
w f (x) = d f<br />
dx<br />
(A.4)
ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 87<br />
definiert.<br />
Insbesondere lassen sich so auch die Erwartungswerte von meßbaren, reellwertigen<br />
Funktionen F der Zufallsvariablen f erklären:<br />
E(F )=<br />
Z<br />
R<br />
F (f (x))w f (x)dx:<br />
(A.5)<br />
Nach dem starken Gesetz der großen Zahl läßt sich der Erwartungswert in Gleichung<br />
(A.5) zumindestens näherungsweise best<strong>im</strong>men: Seien ff (! 1 );::: ;f(! n )j! i 2<br />
g Werte der Zufallsvariablen f (eine Stichprobe, engl. sample). Dann liefert<br />
F = 1 n<br />
nX<br />
i=1<br />
F (f (! i ))<br />
(A.6)<br />
eine erwartungstreue und konsistente Schätzfunktion für E(F ).D.h.esistE( F )=<br />
E(F ) und es gilt<br />
8 >0 8 >0 9 n 0 (; ) 2 N = f1; 2;:::g<br />
8 n n 0 : P (j F , E(F )j 1 , : (A.7)<br />
Hat die Zufallsvariable f eine endliche Varianz, so folgt aus der Tschebyscheffschen<br />
Ungleichung, daß der Fehler, der in Gleichung (A.6) gemacht wird, proportional<br />
zu n ,1=2 ist, also gleich Cn ,1=2 .<br />
Das starke Gesetz der großen Zahl besagt also, daß sich für eine genügend<br />
große Anzahl von Werten einer Zufallsgröße jeder Erwartungswert beliebig genau<br />
annähern läßt und bildet damit die Grundlage für die in der Einleitung allgemein<br />
formulierte Idee des Monte–Carlo–Verfahrens.<br />
In Gleichung (A.6) wird allerdings keine Aussage darüber gemacht, wie groß<br />
der Stichprobenumfang n gewählt werden muß, damit der Fehler klein genug wird.<br />
<strong>Die</strong>s hängt einzig und allein von der Proportionalitätskonstante C ab. Es läßt sich<br />
aber festhalten, daß die Abweichung umso geringer sein wird, je näher die Verteilung<br />
der Stichprobenwerte f i an der Wahrscheinlichkeitsverteilungsdichte w f der<br />
Zufallsvariablen f liegt.<br />
Eine solche Stichprobe läßt sich am effektivsten als eine sogenannten Markoffsche<br />
Kette konstruieren.<br />
A.2 Markoffsche Ketten<br />
Um den mathematischen Formalismus nicht ausufern zu lassen, werden <strong>im</strong> folgenden<br />
nur Wahrscheinlichkeitsräume mit diskretem Ereignisraum und Zufallsvariablen<br />
f mit diskretem Wertebereich betrachtet.<br />
Für den Formalismus der klassischen statistischen Physik stellt dies keine große<br />
Einschränkung dar, da der kontinuierliche Phasenraum durch eine geeignete Einteilung<br />
in Zellen gut approx<strong>im</strong>iert werden kann und durch die Diskretisierung des<br />
Phasenraumes auch das Energiespektrum diskret wird.
ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 88<br />
Sei nun ff n ;n =0; 1; 2; 3;:::g eine Familie von Zustandsvariablen mit einem<br />
diskreten Ereignisraum . Wir interpretieren f i (!) = x i als den Zustand eines<br />
abstrakten Systemes zur Markoff–Zeit n und bezeichnen den abzählbarem Wertebereich<br />
X = fx n ;n =0; 1; 2; 3;:::g als Zustandsraum.<br />
Eine solche Familie von Zustandsvariablen bildet eine Markoffsche Kette,wenn<br />
sie die Eigenschaft besitzt, daß die Wahrscheinlichkeit, <strong>im</strong> n+1–ten Schritt in einen<br />
beliebigen Zustand zu gelangen, nur vom Zustand <strong>im</strong> Schritt n abhängt, aber nicht<br />
davon, in welchen Zuständen das System früher war.<br />
Hängt weiter für zwei beliebige Zustände x und x 0 die Übergangswahrscheinlichkeit<br />
P xx 0 := P (f n = x ! f n+1 = x 0 ) nicht davon ab, in welchem Schritt<br />
der Markoffschen Kette der Übergang stattfindet, so heißt die Kette homogen und<br />
sie läßt sich vollständig beschreiben durch die Angabe einer stochastischen Matrix<br />
P =(P xx 0) mit den Eigenschaften<br />
1. 8 x; x 0 2X : P xx 0 0<br />
P<br />
2.<br />
x 0 2X P x 0 x =1(Erhaltung der Gesamtwahrscheinlichkeit)<br />
und durch eine initiale Wahrscheinlichkeitsverteilung<br />
0 =( 0 [x];x 2X) mit 0 [x] =P (f 0 = x) (A.8)<br />
Im weiteren beschränken wir uns auf die Betrachtung von Markoffschen-Ketten,<br />
die das Kriterium der strengen Ergodizität erfüllen, d.h. es soll möglich sein, von<br />
jedem Zustand x zu jedem anderen Zustand x 0 zu gelangen. <strong>Die</strong>s ist jedenfalls dann<br />
der Fall, wenn es für je zwei Zustände x und x 0 eine natürliche Zahl n gibt, so daß<br />
P n x 0 x :=<br />
X<br />
x1;::: ;x n,1<br />
P x0 x n,1 P x n,1x n,2 :::P x1x > 0<br />
(A.9)<br />
Nach einem Satz von Frobenius und Peron besitzt unter diesen Voraussetzungen<br />
die stochastische Matrix P den nichtentarteten und betragsmäßig größten Eigenwert<br />
1, wobei der dazugehörige Eigenvektor =([x];x2X) positive Komponenten<br />
[x] > 0 besitzt und P die Summe aller Komponenten (ev. nach geeigneter<br />
Normierung) gerade 1 ergibt:<br />
x [x] =1.<br />
Hieraus läßt sich folgern [?], daß die Übergangswahrscheinlichkeiten P x0 x gegen<br />
die von x unabhängige Zahlen [x 0 ] konvergieren:<br />
l<strong>im</strong> P n = P 1 und P 1 n!1<br />
x 0 x = [x0 ] (A.10)<br />
Für jede beliebige initiale Wahrscheinlichkeitsverteilung 0 folgt somit:<br />
X<br />
x2X<br />
P 1 x 0 x 0[x] =[x]<br />
(A.11)<br />
d.h. nach unendlich“ vielen Schritten generiert die Markoffsche Kette eine Wahrscheinlichkeitsverteilung<br />
unabhängig von der Ausgangsverteilung 0 . Insbeson-<br />
”<br />
dere ergibt sich diese Ausgangsverteilung ausgehend von der initialen Wahrscheinlichkeitsverteilung<br />
0 [x] = x;x 0 , es ist also möglich, von einer genau definierten<br />
Systemkonfiguration aus zu starten.
ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 89<br />
Es bleibt also nur noch sicherzustellen, daß die in unserem Fall gewünschte<br />
Wahrscheinlichkeitsdichte w f gerade ein Eigenvektor einer Markoffschen stochastischen<br />
Matrix P x 0 x zum Eigenwert 1 ist.<br />
Eine hinreichende Bedingung dafür ist, daß bei der Auswahl einer neuen Konfiguration<br />
x 0 für den nächsten Schritt in der Markoffschen Kette die Bedingung des<br />
detaillierten Gleichgewichtes (detailed balance) erfüllt ist:<br />
P x0 x w f [x] =P xx 0 w f [x 0 ]<br />
(A.12)<br />
Mit Gleichung (A.12) und der Erhaltung der Gesamtwahrscheinlichkeit für die stochastische<br />
Matrix (P xx 0) folgt dann sofort:<br />
X<br />
[x] = P x0 x w f [x] = P xx 0 w f [x 0 ]; (A.13)<br />
x 0 x`<br />
d.h. w f ist Eigenvektor von (P xx 0) zum Eigenwert 1.<br />
Anschaulich interpretiert sagt Gleichung (A.12) aus, daß das System genauso<br />
häufig vom Zustand x in den Zustand x 0 wechseln können muß wie in umgekehrte<br />
Richtung. <strong>Die</strong> Häufigkeit für einen Prozeß x ! x 0 ist dabei das Produkt aus der<br />
Wahrscheinlichkeit w f [x] für das Vorliegen des Zustandes x mit der bedingten<br />
Wahrscheinlichkeit für den Übergang von x nach x 0 .<br />
A.2.1<br />
Der Metropolis Algorithmus<br />
Ein sehr effizientes Verfahren zur Erzeugung einer Markoffschen Kette von der<br />
gewünschten Art wurde schon 1953 von METROPOLIS ET AL. gefunden [?] und<br />
wird als Metropolis–Algorithmus bezeichnet. Der Metropolis–Algorithmus erzeugt<br />
eine Kette von Zahlen ~ P x0 x so, daß eine vorgegebene Wahrscheinlichkeitsverteilung<br />
w f gerade ein Eigenvektor ~w der Matrix ~ P =( ~ P x0 x) ist.<br />
Werden nämlich die Zahlen ~ P x0 x definiert als<br />
X<br />
~P x0 x := 1 falls w f (x 0 )
ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 90<br />
also<br />
und damit<br />
~P x 0 xw f (x) =w f (x) (A.19)<br />
~P xx 0w f (x 0 w f (x)<br />
)=<br />
w f (x 0 w f (x 0 )=w f (x):<br />
(A.20)<br />
)<br />
Der umgekehrte Fall w f (x 0 ) w f (x) folgt analog und damit ist Wahrscheinlichkeitsverteilung<br />
w f Eigenvektor der so definierten Markoff–Matrix.<br />
Konkret besteht eine Monte–Carlo–S<strong>im</strong>ulation nach dem Metropolis–Algorithmus<br />
also aus den folgenden Schritten:<br />
1. Wähle einen Startzustand x 0 für die Markoffsche Kette.<br />
2. Erzeuge ausgehend von dem aktuellen Zustand x i einen neuen Zustand x 0<br />
mit einer Wahrscheinlichkeit p 1 .<br />
3. Überprüfe, ob der neue Zustand x 0 der nächste Zustand x i+1 der Markoffschen<br />
Kette werden soll:<br />
(a) Falls w f (x 0 ) p 2 ,sowirdx i+1 := x 0 gesetzt, andernfalls bleibt das System in<br />
der alten Konfiguration: x i+1 := x i . <strong>Die</strong>s entspricht dem Fall (A.15)<br />
4. Wiederhole die Schritte 2 bis 3 so lange, bis eine genügende Genauigkeit<br />
erreicht ist.<br />
<strong>Die</strong> mit dem Metropolis–Algorithmus erzeugte Markoffsche Kette von Systemzuständen<br />
erlaubt es nun theoretisch, die Erwartungswerte von Funktionen<br />
F (f ) mittels Gleichung (A.6) exakt zu berechnen. Da in einer realen Monte–<br />
Carlo–S<strong>im</strong>ulation aber <strong>im</strong>mer nur endlich viele Glieder der Kette berechnet werden<br />
können (n
ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 91<br />
A.2.2<br />
Das ”<br />
heat bath“–Verfahren<br />
Eine andere Lösung der Bedingung des detaillierten Gleichgewichtes (A.12) ist<br />
offensichtlich dann gegeben, wenn die Übergangswahrscheinlichkeit<br />
~P x 0 x = w f [x 0 ] (A.22)<br />
gewählt wird. <strong>Die</strong>s bedeutet nichts anderes, als daß der neue Zustand x 0 unabhängig<br />
vom vorherigen Zustand x direkt nach der vorgegebenen Wahrscheinlichkeitsverteilung<br />
w f best<strong>im</strong>mt wird.<br />
Der Name ”<br />
heat bath“ für dieses Verfahren rührt daher, daß dieses Verfahren<br />
zuerst bei der Monte–Carlo–S<strong>im</strong>ulation von Boltzmann–Verteilungen benutzt wurde.<br />
<strong>Die</strong>ses Verfahren wurde in dieser Arbeit nicht verwendet und wird hier nur der<br />
Vollständigkeit halber erwähnt. Weitere Details finden sich in [?].
Literaturverzeichnis<br />
[1] Gert Franke. Struktur und Thermodynamik kleiner Edelgascluster. PhDthesis,<br />
Universität Oldenburg, Februar 1990.<br />
[2] P. Sindzingre, L.M. Klein, and D.M. Ceperley. Path-Integral Monte Carlo<br />
Study of Low-Temperature 4 He Clusters. Phys. Rev. Lett., 63(15):1601–1604,<br />
October 1989.<br />
[3] D.M. Ceperley. Path integrals in the theory of condensed helium. Rev. Mod.<br />
Phys., 67(2), April 1995.<br />
[4] P. Borrmann and E.R. Hilf. New enhancements to Feynmans Path Integral<br />
for fermions. cond-mat/9412113, December 1994.<br />
[5] D.M. Ceperley and E.L. Pollock. Path Integral Computation of the Low-<br />
Temperature Properties of Liquid 4 He. Phys. Rev. Lett., 56(4):351–354, January<br />
1986.<br />
[6] D.M. Ceperley and E.L. Pollock. The momentum distribution of normal and<br />
superfluid liquid 4 He. Can. J. Phys., 65:1416–1420, 1987.<br />
[7] D.M. Ceperley and E.L. Pollock. Path integral computation of superfluid<br />
densities. Phys.Rev.B, 36(16):8343–8352, December 1987.<br />
[8] R.P. Feynman and A.R. Hibbs. Quantum Mechanics and Path Integrals. Mc-<br />
Graw Hill, New York, 1965.<br />
[9] R.P. Feynman. Statistical Mechanics: A Set of Lectures. Addison–Wesley<br />
Publishing Company, Inc., New York, 13 edition, 1990.<br />
[10] J. Gl<strong>im</strong>m and A. Jaffe. Quantum Physics — A functional Integral Point of<br />
View. Springer Verlag, New York, 2nd edition, 1987.<br />
[11] L.S. Schulman. Techniques and Applications of Path Integration. John Wiley<br />
& Sons, 1981.<br />
[12] H. Kono, A. Tkasaka, and S.H. Lin. Monte Carlo calculation of the quantum<br />
partition function via path integral formulations. J. Chem. Phys.,<br />
88(10):6390–6398, May 1988.<br />
96
LITERATURVERZEICHNIS 97<br />
[13] D.L. Freeman and J.D. Doll. A Monte Carlo method for quantum Boltzmann<br />
statistical mechanics. J. Chem. Phys., 80(5):2239–2240, March 1984.<br />
[14] D.L. Freeman and J.D. Doll. A Monte Carlo method for quantum Boltzmann<br />
statistical mechanics using fourier representations of path integrals. J. Chem.<br />
Phys., 80(11):5709–5718, June 1984.<br />
[15] M. Takahashi and M. Imada. Monte Carlo Calculations of Quantum systems.<br />
J. Phys. Soc. Jpn., 53(3):936–974, 1984.<br />
[16] M. Takahashi and M. Imada. Monte Carlo Calculations of Quantum Systems.<br />
II. Higher Order Correction. J. Phys. Soc. Jpn., 53(11):3765–3769, 1984.<br />
[17] M. Suzuki. Quantum Monte Carlo methods – recent developments. Physica<br />
A, pages 432–449, 1993.<br />
[18] Hagen Kleinert. <strong>Pfadintegral</strong>e in Quantenmechanik, Statistik und Polymerphysik.<br />
B.I. Wissenschaftsverlag, Mannhe<strong>im</strong>, 1993.<br />
[19] H.F. Trotter. On The Product of Semi–Groups of operators. Proc. Am. Math.<br />
Soc., 10:545–551, 1959.<br />
[20] B. S<strong>im</strong>on. Functional Integration and Quantum Physics. Academic Press,<br />
New York, 1979.<br />
[21] Andreas Dullweber. <strong>Pfadintegral</strong>methoden. Master’s thesis, Carl von Ossietzky<br />
Universität Oldenburg, Januar 1995.<br />
[22] K.E. Schmidt and D.M. Ceperley. Monte carlo techniques for quantum fluids,<br />
solids and droplets. In K. Binder, editor, The Monte Carlo Method in Condensed<br />
Matter Physics, pages 75–91, New York – Berlin, 1991. Springer.<br />
[23] M.H. Kalos and P.A. Whitlock. Monte Carlo Methods, volume I: Basics.<br />
Wiley, 1986.<br />
[24] G. Bhanot. The Metropolis algorithm. Rep. Prog. Phys., 51:429–457, 1988.<br />
[25] K. Binder, editor. The Monte Carlo Method in Condensed Matter Physics.<br />
Springer, New York – Berlin, 1991.<br />
[26] N. Metropolis, A.W. Rosenbluth, M.N. Rosenbluth, A. Teller, and E. Teller.<br />
Equation of state calculations by fast computing machines. J. Chem. Phys.,<br />
21(6):1087–1092, 1953.<br />
[27] D.W. Heermann. Computer S<strong>im</strong>ulation Methods in Theoretical Physics.<br />
Springer, Berlin-Heidelberg, 1986.<br />
[28] Jürgen Schnakenberg. Algorithmen in der Quantentheorie und Statistischen<br />
Physik. Verlag Z<strong>im</strong>mermann-Neufang, Ulmen, 1. edition, 1995.
LITERATURVERZEICHNIS 98<br />
[29] H. Minc. Permanents, volume 6 of Encyclopedia of Mathematics and its<br />
Applications. Addison Wesley Publishing Company, Inc., Reading, Massachusetts,<br />
1978.<br />
[30] P.M. Gibson. An identity between permanents and determinants. Amer. Math.<br />
Monthly, 76:270–271, 1969.<br />
[31] M. Luby. A survey of approx<strong>im</strong>ation algorithms for the permanent. In Sequences,<br />
pages 75–91, New York – Berlin, 1990. Springer.<br />
[32] N. Karmarkar, R. Karp, R. Lipton, L. Lovasz, and M. Luby. A Monte Carlo<br />
Algorithm for Est<strong>im</strong>ating the Permanent. SIAM J. Comput., 22(2):284–293,<br />
April 1993.<br />
[33] H.J. Ryser. Combinatorial Mathematics. Carus Math. Monographs, 1963.<br />
[34] A. Nijenhuis and H.S. Wilf. Combinatorial Algorithms for Computers and<br />
Calculators. Academic Press, New York, 2nd edition, 1978.<br />
[35] A. Itai, M. Rodeh, and S.L. Tan<strong>im</strong>oto. Some Matching Problems for Bipartite<br />
Graphs. J. ACM., 25(4):517–525, 1978.<br />
[36] M. Jerrum and A. Sinclair. Conductance and the rapid mixing property<br />
for Markov Chains: the approx<strong>im</strong>ation of the permanent resolved. In Proceed.<br />
20th Annual ACM Symposium on Theory of Computing, pages 235–244.<br />
ACM, May 1988.<br />
[37] S. Lang. Algebra. Addison–Wesley, 1974.<br />
[38] A.G. Akritas. Elements of Computer Algebra: With Applications. Wiley, New<br />
York, 1989.<br />
[39] U. Pape and D. Conradt. Max<strong>im</strong>ales matching in graphen. In H. Späth, editor,<br />
Ausgewählte Operations–research–Software in FORTRAN, pages 103–114,<br />
München, 1979. Oldenbourg.<br />
[40] R.S. Berry. Melting and freezing of clusters: How they happen and what they<br />
mean. In H. Haberland, editor, Atomic and Molecular Clusters I, Berlin–<br />
Heidelberg, 1995. Springer.<br />
[41] R.S. Berry, J. Jellinek, and G. Natanson. Melting of clusters and melting.<br />
Phys. Rev. A, 30(2):919–931, August 1984.<br />
[42] R.S. Berry, T.L. Beck, H.L. Davis, and J. Jellinek. Solid–liquid phase behavior<br />
in microclusters. Adv. Chem. Phys., 70:75, 1988.<br />
[43] L.S. Bartell. Diffraction Studies of Clusters Generated in Supersonic Flow.<br />
Chem. Rev., 86(3):486, 1986.
LITERATURVERZEICHNIS 99<br />
[44] J. Farges, M.F. de Feraudy, B. Raoult, and G. Torchet. Noncrystalline structure<br />
of argon clusters. i. Polyicosahedral structure of ar n clusters, 20< n
LITERATURVERZEICHNIS 100<br />
[59] B.H. Bransden and C.J. Joachain. Physics of atoms and molecules. Longman<br />
Scientifc & Technical, London, 1983.<br />
[60] J.J. Sakurai. Modern Quantum Mechanics. Addison–Wesley, Redwood City,<br />
Calif., 1991.<br />
[61] J. Kestin and J.R. Dorfman. A Course in Statistical Thermodynamics. Academic<br />
Press, New York, 1971.<br />
[62] H. Haberland. Exper<strong>im</strong>ental methods. In H. Haberland, editor, Atomic and<br />
Molecular Clusters I, Berlin–Heidelberg, 1995. Springer.<br />
[63] G. Franke and J. Schulte. Quantum mechanics and the structure of noble–gas<br />
clusters. Z. Phys. D, 12(1–4):65–68, 1989.<br />
[64] C. Chakravarty. Structure of binary quantum clusters. Phys. Rev. Lett.,<br />
75(9):1727–1730, 1995.<br />
[65] A.M. Ferrenberg and R.H. Swendsen. Opt<strong>im</strong>ized Monte Carlo Data Analysis.<br />
Phys. Rev. Lett., 63(12):1195–1198, 1989.<br />
[66] G.C. Maitland, M. Rigby, E.B. Smith, and W.A. Wakeham. Intermolecular<br />
Forces — Their Origin and Determination. Oxford University Press, Oxford,<br />
1987.<br />
[67] Ulrich Krengel. Einführung in die Wahrscheinlichkeitstheorie und Statistik.<br />
Vieweg Verlag, Braunschweig, 3. edition, 1991.<br />
[68] Bronstein and Semendjajew. Teubner–Taschenbuch der Mathematik, volume<br />
I. Teubner, Leipzig, 1996.<br />
[69] Bronstein and Semendjajew. Teubner–Taschenbuch der Mathematik, volume<br />
II. Teubner, Leipzig, 1995.
Danksagung<br />
Ich danke Herrn Prof. Dr. Eberhard Hilf, daß er mir das Thema für den ersten<br />
Teil dieser Arbeit zur selbstständigen Bearbeitung überlassen hat, für seine Unterstützung<br />
und seine stets ermutigenden Kommentierungen, die er mir dabei zukommen<br />
ließ.<br />
Auf Herrn Dr. Peter Borrmann, der stets für zahlreiche Diskussionen zur Verfügung<br />
stand, geht die Idee zum zweiten Teil dieser Arbeit zurück. <strong>Die</strong> von ihm und<br />
Herrn Heinrich Stamerjohanns erstellten S<strong>im</strong>ulationsprogramme waren mir eine<br />
große Hilfe. Ihnen möchte ich an dieser Stelle meinen herzlichen Dank aussprechen.<br />
Nicht zuletzt gilt mein Dank meinen Eltern, die mir dieses Studium ermöglicht<br />
haben, und meiner Kommilitonin Katrin Reblinsky, die mit mir in dieser Zeit alle<br />
Höhen und Tiefen durchlebt hat.
Hiermit versichere ich, daß ich diese Arbeit selbstständig verfaßt und keine anderen<br />
als die angegebenen Quellen und Hilfsmittel benutzt habe.<br />
Oldenburg, 16. Dezember 1998