06.11.2013 Aufrufe

Die Permanente im thermodynamischen Viel-Bosonen-Pfadintegral ...

Die Permanente im thermodynamischen Viel-Bosonen-Pfadintegral ...

Die Permanente im thermodynamischen Viel-Bosonen-Pfadintegral ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

CBADE<br />

<strong>Die</strong> <strong>Permanente</strong> <strong>im</strong> <strong>thermodynamischen</strong><br />

<strong>Viel</strong>-<strong>Bosonen</strong>-<strong>Pfadintegral</strong><br />

sowie<br />

die Best<strong>im</strong>mung von Phasenübergängen aus<br />

exper<strong>im</strong>entellen Streuspektren atomarer Cluster<br />

Diplomarbeit <strong>im</strong><br />

Studiengang Diplom-Physik<br />

vorgelegt von:<br />

Habbo Hait Heinze<br />

Betreuender Gutachter:<br />

Zweiter Gutachter:<br />

Prof. Dr. Dr. Eberhard R. Hilf<br />

Prof. Dr. Alexander Rauh<br />

Oldenburg, 16. Dezember 1998


Inhaltsverzeichnis<br />

Vorwort 1<br />

I <strong>Die</strong> <strong>Permanente</strong> <strong>im</strong> <strong>thermodynamischen</strong> <strong>Viel</strong>–<strong>Bosonen</strong>–<strong>Pfadintegral</strong><br />

2<br />

1 Einleitung 3<br />

2 Das thermodynamische <strong>Pfadintegral</strong> 5<br />

2.1 <strong>Die</strong> physikalische Ausgangssituation ................ 5<br />

2.2 Dasdiskretisierte<strong>Pfadintegral</strong>inderOrtsdarstellung ....... 8<br />

2.3 Berechnung thermodynamischer Observablen ........... 13<br />

2.4 Das<strong>Pfadintegral</strong>-Monte-CarloVerfahren(PIMC) ......... 14<br />

2.5 ImportanceSamplingofPermutations ............... 16<br />

2.6 Warum ist die Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> interessant?<br />

............................... 17<br />

3 Mögliche Berechnungsverfahren für die <strong>Permanente</strong> 18<br />

3.1 Mathematische Grundlagen der <strong>Permanente</strong> ............ 18<br />

3.2 Allgemeine Berechnungsverfahren ................. 21<br />

3.2.1 <strong>Die</strong> Definition und die Laplace–Entwicklung . ...... 21<br />

3.2.2 DasRyser–Verfahren.................... 22<br />

3.2.3 GraphentheoretischeVerfahren............... 24<br />

3.2.4 Das KKLLL-Näherungsverfahren . ............ 27<br />

3.3 Eigene Versuche zur Berechnung der <strong>Permanente</strong> . . . ...... 29<br />

3.3.1 Eigenschaftender<strong>Permanente</strong><strong>im</strong><strong>Pfadintegral</strong> ...... 29<br />

3.3.2 Mathematisch motivierter Näherungsversuch . ...... 31<br />

3.3.3 Physikalisch motivierter Näherungsversuch . . ...... 34<br />

3.3.4 AndereVersuche ...................... 36<br />

4 Vergleich der verschiedenen Berechnungsverfahren 37<br />

5 Zusammenfassung 41<br />

I


INHALTSVERZEICHNIS<br />

II<br />

II Best<strong>im</strong>mung von Phasenübergängen aus exper<strong>im</strong>entellen Streuspektren<br />

atomarer Cluster 42<br />

6 Einleitung 43<br />

7 <strong>Die</strong>Methode 45<br />

7.1 Der Zusammenhang von Paarverteilungsfunktion und Streuspektrum 45<br />

7.2 Hypervirialtheoreme ........................ 50<br />

7.2.1 DasklassischeHypervirialtheorem............. 51<br />

7.2.2 DasquantenmechanischeHypervirialtheorem....... 52<br />

7.3 DasquantenstatistischeModell................... 53<br />

7.3.1 Modellierung des Systems ................. 53<br />

7.3.2 Separation von Schwerpunkts– und Relativbewegung . . . 54<br />

7.3.3 Das richtige“ Hypervirialtheorem für dieses System . . . 55<br />

”<br />

7.3.4 Berechnung der Energieerwartungswerte über die Paarkorrelationsfunktion<br />

...................... 58<br />

7.4 DerklassischeGrenzfall ...................... 60<br />

7.5 Verteilungen verschiedener Clustergrößen ............. 61<br />

8 Numerische S<strong>im</strong>ulationen als ”<br />

ideale Exper<strong>im</strong>ente“ 62<br />

9 Ergebnisse 65<br />

9.1 Theoretische Streuspektren und Paarkorrelationsfunktionen . . . . 65<br />

9.2 Best<strong>im</strong>mung von Erwartungswerten ................ 70<br />

9.3 Kalorische Zustandsgleichungen . ................. 74<br />

9.4 Best<strong>im</strong>mung der spezifischen Wärme ............... 79<br />

10 Zusammenfassung und Ausblick 83<br />

A Grundlagen von Monte–Carlo–Verfahren 85<br />

A.1 Zufallsgrößen ............................ 85<br />

A.2 MarkoffscheKetten......................... 87<br />

A.2.1 DerMetropolisAlgorithmus................ 89<br />

A.2.2 Das heatbath“–Verfahren................. ”<br />

91<br />

B Preprint 92


Abbildungsverzeichnis<br />

4.1 Vergleich des Rechenaufwands für das Ryser–Verfahren und das<br />

KKLLL–Verfahren . . ....................... 38<br />

4.2 Energien be<strong>im</strong> eind<strong>im</strong>ensionalen bosonischen harmonischen Oszillator<br />

für n =4 .......................... 39<br />

9.1 Streuspektrum und Paarkorrelationsfunktion für Ar 13 – und Ar 14 –<br />

Cluster................................ 67<br />

9.2 Streuspektrum und Paarkorrelationsfunktion für Ar 55 – und Ar 56 –<br />

Cluster................................ 68<br />

9.3 Streuspektrum und Paarkorrelationsfunktion für Ne 13 –Cluster . . 69<br />

9.4 Beitrag der gemessenen StreuintensitätzurEnergie ........ 71<br />

9.5 Wechselwirkungspotentiale fürArgon ............... 73<br />

9.6 Kalorische Zustandsgleichungen für klassische Argon–Clustern . 75<br />

9.7 Absoluter Fehler bei der Temperaturbest<strong>im</strong>mung von Argon–Clustern 77<br />

9.8 Klassische und quantenmechanische Zustandsgleichungen von Ne 13 –<br />

Clustern............................... 78<br />

9.9 Klassische und quantenmechanische kinetische Energie von Ne 13 –<br />

Clustern............................... 80<br />

9.10 Klassisch und quantenmechanisch berechnete Wärmekapazität für<br />

Ne 13 –Cluster ............................ 81<br />

III


Tabellenverzeichnis<br />

3.1 Anzahl der Nullelemente oberhalb der Diagonalen in Abhängigkeit<br />

von der Matrixgröße füreineHessenberg-Matrix. ......... 35<br />

8.1 Lennard–Jones–Parameter und Atomgewichte der Edelgase Argon<br />

undNeon .............................. 63<br />

IV


Vorwort<br />

<strong>Die</strong> vorliegende Arbeit wurde in der Arbeitsgruppe ”<br />

Theorie III: Theoretische Cluster–<br />

und Schwerionenphysik“ der Carl von Ossietzky Universität Oldenburg ausgeführt.<br />

Sie enthält die Ergebnisse von zwei voneinander unabhängigen Fragestellungen,<br />

die ich <strong>im</strong> Laufe des vergangenen Jahres bearbeitet habe.<br />

Dem ersten Teil der Arbeit lag die Frage zu Grunde, wie sich der hohe numerische<br />

Aufwand bei der Berechnung thermodynamischer Eigenschaften von <strong>Viel</strong>–<br />

<strong>Bosonen</strong>–Systemen in der <strong>Pfadintegral</strong>methode reduzieren läßt. <strong>Die</strong>ser hohe Rechenaufwand<br />

läßt sich mathematisch auf einen algebraischen Ausdruck — die <strong>Permanente</strong><br />

einer best<strong>im</strong>mten Matrix — zurückführen. <strong>Die</strong> Grundidee zu diesem Teil<br />

der Arbeit bestand nun darin, die mathematische Spezialliteratur zu diesem relativ<br />

unbekannten algebraischen Objekt zu sichten, um so den Weg für eine effiziente<br />

numerische Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> zu weisen.<br />

Das <strong>im</strong> zweiten Teil dieser Arbeit behandelte Thema versucht, Erkenntnisse<br />

aus der theoretischen Clusterphysik mit exper<strong>im</strong>entellen Resultaten zu verknüpfen.<br />

Es wurde ein neuer Ansatz entwickelt, wie sich aus in Streuexper<strong>im</strong>enten an atomaren<br />

Clustern gemessenen Intensitätsverteilungen die Energie und Temperatur der<br />

Cluster best<strong>im</strong>men lassen. <strong>Die</strong> Kenntnis der Energie als Funktion der Temperatur<br />

ermöglicht es wiederum, Aufschluß über das Phasenverhalten der untersuchten<br />

Cluster zu gewinnen.<br />

Oldenburg, den 16. Dezember 1998<br />

Habbo Hait Heinze<br />

1


Teil I<br />

<strong>Die</strong> <strong>Permanente</strong> <strong>im</strong><br />

<strong>thermodynamischen</strong><br />

<strong>Viel</strong>–<strong>Bosonen</strong>–<strong>Pfadintegral</strong><br />

2


Kapitel 1<br />

Einleitung<br />

In den letzten zehn Jahre hat sich gezeigt, daß die zuerst von FEYNMAN eingeführten<br />

thermodynamische <strong>Pfadintegral</strong>e sehr gut dafür geeignet sind, die <strong>thermodynamischen</strong><br />

Eigenschaften von mesoskopischen (z.B. Cluster [?, ?]) bis hin zu makroskopischen<br />

<strong>Viel</strong>teilchensystemen (z.B. Gase/Flüssigkeiten [?]) zu behandeln.<br />

Einerseits verhalten sich zahlreiche solcher <strong>Viel</strong>teilchensysteme näherungsweise<br />

klassisch. Andererseits werden in einigen Systemen gerade durch Quanteneffekte<br />

interessante physikalische Erscheinungen hervorgerufen, von denen die<br />

Suprafluidität von flüssigem 4 He das prominenteste Beispiel sein dürfte.<br />

Hier bietet der thermodynamische <strong>Pfadintegral</strong>formalismus große Vorteile, denn<br />

er ermöglicht eine quantenstatistische Beschreibung von <strong>Viel</strong>teilchensystemen in<br />

einer Integralform, die sich auf natürliche und besonders einfache Weise auf die<br />

klassische kanonische Beschreibung reduzieren läßt. Quantenstatistische thermodynamische<br />

Größen lassen sich dann wie be<strong>im</strong> klassisch–kanonischen Ensemble<br />

direkt über Monte–Carlo–S<strong>im</strong>ulationen berechnen, ohne daß z.B. mit großem numerischen<br />

Aufwand Energieeigenfunktionen best<strong>im</strong>mt werden müssen. Ein weiterer<br />

Vorteil ist, daß es für die <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>e ein solides mathematisches<br />

Fundament gibt — ganz <strong>im</strong> Gegensatz zu den quantenmechanischen<br />

<strong>Pfadintegral</strong>en.<br />

Gerade die <strong>Pfadintegral</strong>behandlung der interessanten physikalischen Effekte,<br />

die durch die quantenmechanische Ununterscheidbarkeit von einzelnen Teilchen<br />

hervorgerufen werden, erscheint vielversprechend [?]. Das <strong>Pfadintegral</strong> eines solchen<br />

Systems aus <strong>Bosonen</strong> oder Fermionen läßt sich ohne weiteres angeben, das<br />

einzige Problem ist zur Zeit der große numerische Rechenaufwand.<br />

<strong>Die</strong>ser große numerische Aufwand läßt sich direkt auf die für <strong>Bosonen</strong> (bzw.<br />

Fermionen) notwendige Symmetrisierung (bzw. Antisymmetrisierung) zurückführen,<br />

die sich <strong>im</strong> <strong>Pfadintegral</strong> in Form von Permutationssummen über best<strong>im</strong>mte<br />

algebraische Ausdrücke äußert.<br />

Handelt es sich bei den N Teilchen um Fermionen, so läßt sich dieser algebraische<br />

Ausdruck als Determinante einer best<strong>im</strong>mten N N Matrix A schreiben.<br />

Bei der Determinante ist der Berechnungsaufwand i.a. von der Ordnung O(N 3 ),<br />

3


KAPITEL 1. EINLEITUNG 4<br />

es gibt sogar Hinweise darauf, daß er in diesem speziellen Fall von der Ordnung<br />

O(N 2 ) ist [?].<br />

Handelt es sich dagegen bei den Teilchen um ein System aus N <strong>Bosonen</strong>, so<br />

wird der algebraische Ausdruck zur <strong>Permanente</strong> der Matrix A. <strong>Die</strong> <strong>Permanente</strong> ist<br />

genauso wie die Determinante ein wohldefiniertes Objekt der multilinearen Algebra<br />

und die <strong>Permanente</strong> einer Matrix ergibt sich aus der Determinante derselben<br />

Matrix durch Umwandeln aller ”<br />

-“–Zeichen in ”<br />

+“–Zeichen.<br />

Das eigentliche Problem besteht nun darin, daß der Aufwand zur Berechnung<br />

einer <strong>Permanente</strong> <strong>im</strong> allgemeinen exponentiell mit der Matrixgröße N wächst und<br />

bisher kein Verfahren gefunden wurde, daß eine effiziente Berechnung der sehr<br />

speziellen, <strong>im</strong> bosonischen <strong>Pfadintegral</strong> auftauchenden <strong>Permanente</strong> ermöglicht.<br />

Aus diesem Grund wird in den bisher veröffentlichten Arbeiten zu <strong>Pfadintegral</strong>–<br />

Monte–Carlo–S<strong>im</strong>ulationen von bosonischen Systemen das Problem der <strong>Permanente</strong>nberechnung<br />

durch das sogenannte Importance Sampling of Permutations<br />

Verfahren umgangen. Bei dieser Methode werden die einzelnen Teilchenpermutationen<br />

als zusätzliche Freiheitsgrade des Systems aufgefaßt, deren Auswirkung<br />

durch ein erweitertes Monte–Carlo–Verfahren berücksichtigt werden kann.<br />

Mit einem solchen Verfahren wurden z.B. von CEPERLEY ET. AL. [?, ?, ?]<br />

erfolgreich die <strong>thermodynamischen</strong> und strukturellen Eigenschaften von 4 He <strong>im</strong><br />

Rahmen der exper<strong>im</strong>entellen Meßunsicherheiten berechnet. Allerdings gaben die<br />

Autoren an, daß der größte Zeitfaktor auch be<strong>im</strong> ”<br />

Importance Sampling of Permutations“<br />

<strong>im</strong>mer noch die Berechnung der Permutationen ist.<br />

Offensichtlich würde sich die Berechnung bosonischer Systeme stark vereinfachen,<br />

wenn ein Verfahren zur direkten Berechnung der <strong>Permanente</strong> gefunden<br />

würde, das einen geringeren Rechenaufwand als das ”<br />

Importance Sampling of Permutations“<br />

benötigt.<br />

<strong>Die</strong> Aufgabenstellung, die diesem Teil der Diplomarbeit zugrunde liegt, war,<br />

die mathematische Spezialliteratur zur Theorie der <strong>Permanente</strong>n zu sichten, die für<br />

die Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> interessanten Resultate allgemeinverständlich<br />

darzustellen und einen Weg aufzuzeigen, wie sich die <strong>Permanente</strong> mit<br />

diesen Resultaten effizienter berechnen läßt.<br />

Im weiteren Verlauf gliedert sich Teil I der Diplomarbeit wie folgt: In Kapitel<br />

2 wird der Formalismus der <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>e vorgestellt und<br />

die Fragestellung der Arbeit präzisiert. In Kapitel 3 wird die <strong>Permanente</strong> als mathematisches<br />

Objekt vorgestellt und es werden verschiedene allgemeine und spezielle<br />

Ansätze zur Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> diskutiert.<br />

Abschließend erfolgt einer Analyse des Laufzeitverhaltens der vielversprechensten<br />

Berechnungsverfahren und es werden aus der diskutierten Fragestellung Vorschläge<br />

für ein weiteres Vorgehen gemacht.


Kapitel 2<br />

Das thermodynamische<br />

<strong>Pfadintegral</strong><br />

In Kapitel 1 wurde die Fragestellung für den ersten Teil dieser Arbeit notwendigerweise<br />

nur angedeutet. Um zu einer präziseren Formulierung zu gelangen, müssen<br />

zuerst die dafür nötigen Grundlagen des <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>formalismus<br />

zur Verfügung gestellt werden.<br />

Zunächst wird erläutert, wie sich nach FEYNMAN die statistische Dichtematrix<br />

eines quantenmechanischen <strong>Viel</strong>teilchensystems durch ein thermodynamisches <strong>Pfadintegral</strong><br />

beschreiben läßt.<br />

Für dieses abstrakte <strong>Pfadintegral</strong> wird dann eine diskretisierte Darstellung hergeleitet<br />

und es wird gezeigt, wie diese Darstellung prinzipiell eine numerische Berechnung<br />

von <strong>thermodynamischen</strong> Observablen über Monte–Carlo–S<strong>im</strong>ulationen<br />

ermöglicht.<br />

Weiter wird aufgezeigt, daß in <strong>Viel</strong>–<strong>Bosonen</strong>–Systemen die vollständige Symmetrisierung<br />

der Dichtematrix Teilchenpermutationen erzwingt, die in den numerischen<br />

S<strong>im</strong>ulationen den größten Rechenaufwand erfordern und es werden die beiden<br />

prinzipiell möglichen Strategien zur Berechnung dieser Permutationen vorgestellt,<br />

nämlich (a) durch Berechnung der <strong>Permanente</strong> und (b) durch das sogenannte<br />

Importance Sampling of Permutations“.<br />

”<br />

Schließlich wird noch einmal auf die Fragestellung dieses Teils der Arbeit eingegangen.<br />

2.1 <strong>Die</strong> physikalische Ausgangssituation<br />

Betrachten wir ein System aus N spinpolarisierten Teilchen (<strong>Bosonen</strong> oder Fermionen),<br />

das durch einen Hamiltonoperator der Form<br />

^H(^p 1 ;::: ; ^p N ; ^r 1 ;::: ; ^r N )=<br />

NX<br />

i=1<br />

^p 2 i<br />

2m i<br />

+ V (^r 1 ;::: ;^r N ) (2.1)<br />

5


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 6<br />

charakterisiert sein soll. Befindet sich dieses System <strong>im</strong> thermischen Gleichgewicht<br />

mit einem Wärmebad der Temperatur T ,soläßt es sich quantenstatistisch<br />

durch die kanonische Gesamtheit beschreiben. Der statistische Erwartungswert einer<br />

beliebigen Observablen ^O ist dann vollständig durch den Dichteoperator ^ und<br />

die Zustandssumme Z best<strong>im</strong>mt,<br />

die <strong>im</strong> kanonischen Ensemble definiert sind als<br />

hOi = 1 Z Tr( ^O ^) ; (2.2)<br />

, ^H<br />

^ = e<br />

, ^H<br />

Z = Tr e<br />

; (2.3)<br />

: (2.4)<br />

<strong>Die</strong> Kenntnis dieser beiden Größen genügt also, um prinzipiell alle <strong>thermodynamischen</strong><br />

Eigenschaften des Systems berechnen zu können.<br />

In der Ortsdarstellung ergibt sich aus dem Dichteoperator ^ die vollständig<br />

symmetrisierte (antisymmetrisierte) Dichtematrix für Bose-Einstein (bzw. Fermi-<br />

Dirac) Statistik durch die Summation über alle Permutationen:<br />

(~r 1 00 ;::: ;~r N<br />

00 ; ~r1 0 ;::: ;~r N<br />

0 ) =<br />

X<br />

1<br />

(1) P hP~r 00 1 ;::: ;P~r 00 N j ^ j ~r 0 1 ;::: ;~r 0 N i ; (2.5)<br />

N !<br />

P 2S N<br />

wobei der Faktor (1) P für <strong>Bosonen</strong> den Wert +1 und für Fermionen den Wert<br />

+1 für gerade und ,1 für ungerade Permutationen annehmen soll.<br />

<strong>Die</strong> formale Ähnlichkeit der N–Teilchen–Dichtematrix mit dem Kern<br />

<br />

K(x 2 ;t 2 jx 1 ;t 1 )=hx 2 j exp , i ^H(t 2 , t 1 ) j x 1 i (2.6)<br />

~<br />

des quantenmechanischen Zeitentwicklungsoperators kann nach FEYNMAN [?, ?]<br />

genutzt werden, um in Analogie zur Darstellung des Zeitentwicklungsoperators<br />

durch ein quantenmechanischen <strong>Pfadintegral</strong> ebenso die N–Teilchen–Dichtematrix<br />

durch ein <strong>Pfadintegral</strong> auszudrücken.<br />

Mathematisch geschieht dies durch eine analytische Fortsetzung des quantenmechanischen<br />

Zeitentwicklungsoperators zu <strong>im</strong>aginären Zeiten t = ,i~, indem<br />

in den Vierervektoren (t; ~r) der Minkowski–Raumzeit die Zeitkoordinate t um<br />

einen Winkel =2 gedreht wird (WICK–Rotation), wodurch ein vierd<strong>im</strong>ensionaler<br />

Raum (~r; = ~) mit einer euklidischen Metrik entsteht.<br />

An Stelle des quantenmechanischen <strong>Pfadintegral</strong>s mit seinem <strong>im</strong>aginären, unendlich<br />

rasch oszillierenden Exponenten tritt für die N–Teilchen–Dichtematrix so


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 7<br />

das rein reelle, exponentiell gedämpfte thermodynamische <strong>Pfadintegral</strong>:<br />

(~r 00 00 1 ;::: ;~r N ; 0 0 ~r1 ;::: ;~r N ) =<br />

1 X Z Z<br />

(1) P D~r 1 :::<br />

N !<br />

P 2S N<br />

~r1 0 ;P~r1 00<br />

exp<br />

"<br />

, 1 ~<br />

Z ~<br />

0<br />

d<br />

1<br />

2<br />

NX<br />

i=1<br />

~r N<br />

0;P~r N<br />

00<br />

m i<br />

d<br />

d ~r i( )<br />

D~r N<br />

2<br />

+ V (~r 1 ( );::: ;~r N ( ))!#<br />

(2.7)<br />

Das Symbol D~r i steht dabei für ein Maß auf dem abstrakten Raum aller möglichen<br />

”<br />

Pfade“ ~r i<br />

0<br />

; ~r i 00 , die in dem vierd<strong>im</strong>ensionalen Raum (~x; = ~) mit<br />

euklidischer Metrik von ~r i 0 nach ~r i 00 führen.<br />

Mit der Interpretation der Größe in Gleichung (2.7) als <strong>im</strong>aginäre ”<br />

Zeit“ it<br />

beschreibt ~r i ( ) die ”<br />

Bahn“ bzw. den Pfad, auf dem sich das Teilchen i von der<br />

Ausgangsposition ~r i (0) := ~r i 0 zu der Endposition ~r i (~) = ~r i<br />

00<br />

”<br />

bewegt“, wobei<br />

die Gesamt ”<br />

zeit“ ~ für diese ”<br />

Bewegung“ durch die Temperatur des Systems<br />

festgelegt ist.<br />

<strong>Die</strong> Dichtematrix ergibt sich also, indem für jedes Teilchen über alle möglichen<br />

Pfade ~r i<br />

0 ; ~ri 00 summiert wird, wobei der Beitrag jedes Einzelpfades zum <strong>Pfadintegral</strong><br />

durch das <strong>im</strong> Exponenten stehende ”<br />

zeitliche“ Integral über die ”<br />

Energie“<br />

aller ”<br />

Teilchenbewegungen“ auf diesem Pfad geteilt durch ~ gewichtet wird.<br />

Das eigentliche Problem besteht nun darin, eine sinnvolle Darstellung für das<br />

<strong>Pfadintegral</strong>maß D~r zu finden. Formal–mathematisch gesehen ist Gleichung (2.7)<br />

eine abstrakte, nicht direkt berechenbare Integralgleichung für die N-Teilchen-<br />

Dichtematrix . Das auf der rechten Seite stehende Integral gehört zur Klasse der<br />

Wiener–Integrale 1 und ist <strong>im</strong> Sinne der Schwarzschen Distributionen als Grenzwert<br />

einer Folge von Testfunktionalen aufzufassen [?, ?]. Solche Folgen von Testfunktionalen,<br />

die <strong>im</strong> L<strong>im</strong>es in Gleichung (2.7) übergehen, werden als Darstellungen<br />

des <strong>Pfadintegral</strong>s bezeichnet und nur sie liefern berechenbare Formeln.<br />

In den letzten Jahren haben sich nun zwei Ansätze für Darstellungen des <strong>Pfadintegral</strong>s<br />

als besonders vielversprechend erwiesen [?].<br />

Der eine ist die sogenannte Fourierdarstellung von <strong>Pfadintegral</strong>en, beidem<br />

zuerst alle Pfade als Fourierreihen über einen Referenzpfad entwickelt werden und<br />

die Integration in Gleichung (2.7) somit über alle Fourierkoeffizienten erfolgt [?,<br />

?]. Ein berechenbarer Ausdruck ergibt sich dann durch das Vernachlässigen der<br />

höheren Fourierfrequenzen, d.h. es werden nur glatte, wenig oszillierende Pfade<br />

um den klassischen Pfad berücksichtigt.<br />

Für semiklassisch zu behandelnde Systeme ist eine solche Näherung gerechtfertigt,<br />

bei rein quantenmechanischen Systemen ist durch die Fourierentwicklung<br />

nichts gewonnen, da in diesem Fall prinzipiell alle Entwicklungsterme einen nicht<br />

zu vernachlässigenden Beitrag liefern. <strong>Die</strong> Fourierdarstellung von <strong>Pfadintegral</strong>en<br />

soll in dieser Arbeit nicht weiter betrachtet werden.<br />

1 <strong>Die</strong>se 1923 von N. WIENER eingeführten Funktionalintegrale sind auf Grund des reellen Integranden<br />

mathematisch wohldefinierte Maßintegrale auf Mengen von Trajektorien.


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 8<br />

Der andere Ansatz ist die Diskretisierte <strong>Pfadintegral</strong>darstellung oder kurz DPI,<br />

bei dem der zeitliche Verlauf der einzelnen Pfade bzw. ”<br />

Teilchenbahnen“ geeignet<br />

diskretisiert wird, so daß das Integral über alle Pfade durch eine endliche Anzahl<br />

von Riemann-Integralen angenähert werden kann.<br />

Unter den vielen diskretisierten Darstellungen hat sich das Pr<strong>im</strong>itive Diskretisierte<br />

<strong>Pfadintegral</strong> (PDPI) als besonders sinnvoll erwiesen, da auf ihm viele andere,<br />

schneller konvergente Formulierungen basieren [?, ?, ?, ?]. Da die PDPI-<br />

Darstellung der Dichtematrix die Grundlage der hier vorliegenden Arbeit bildet,<br />

wird für sie <strong>im</strong> nächsten Abschnitt eine detaillierte Herleitung präsentiert. Das Endergebnis<br />

— eine <strong>Pfadintegral</strong>formel für — findet sich in Gleichung (2.29).<br />

2.2 Das diskretisierte <strong>Pfadintegral</strong> in der Ortsdarstellung<br />

Der entscheidende Schritt in der Herleitung der diskretisierten Ortsdarstellung besteht<br />

in der Approx<strong>im</strong>ation des Dichteoperators. Bevor wir diese Approx<strong>im</strong>ation<br />

durchführen, definieren wir zunächst die Abkürzung ^T für den der kinetischen<br />

Energie entsprechenden Operatoranteil des Hamiltonoperators (2.1). Mit der Trotter–<br />

Produktformel [?]<br />

e ,( ^T + ^V ) =<br />

l<strong>im</strong><br />

e , ^T M e , ^V M<br />

M<br />

M!1<br />

können wir den Dichteoperator ^ durch den Operator<br />

^ ^ M := 1 e <br />

, ^T M e , ^V M <br />

3<br />

M + O<br />

Z<br />

M 3<br />

(2.8)<br />

(2.9)<br />

approx<strong>im</strong>ieren. 2<br />

Zur Berechnung von ^ M in der Ortsdarstellung müssen für <strong>Bosonen</strong> total symmetrische<br />

und für Fermionen total antisymmetrische N–Teilchen–Ortszustände<br />

verwendet werden. Wir beschränken uns hier zunächst auf den Fall eines Systems<br />

aus N <strong>Bosonen</strong>, für die die Ortsbasiszustände als<br />

definiert sind.<br />

X<br />

j ~r 1 ;::: ;~r N i S := 1 j ~r<br />

N P (1) ;~r P (2) ::: ;~r P (N) i (2.10)<br />

!<br />

P 2S N<br />

2 <strong>Die</strong> Trotter–Formel gilt, wenn die drei Operatoren ^T , ^V und ^ T + V selbstadjungiert und wohldefiniert<br />

sind. Eine hinreichende Bedingung hierfür ist, daß ihr Spektrum nach unten beschränkt ist<br />

[?]. Mit modifizierten Trotter–Formeln lassen sich Restterme höherer Ordnung erreichen [?]. Auf<br />

die diffizile Frage der Konvergenz von M gegen für M !1wird in dieser Arbeit nicht weiter<br />

eingegangen.


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 9<br />

<strong>Die</strong> Normierung der Ortsbasiszustände ergibt sich aus den Orthonormierungsbedingungen<br />

S h~r 1 ;::: ;~r N j ~r 1 0 ;::: ;~r N 0 i S<br />

=<br />

<br />

1<br />

N ! 2 X<br />

X<br />

P;P 0 2S N<br />

h~r P 0 (1);::: ;~r P 0 (N) j ~r P (1) ;::: ;~r P (N) i (2.11)<br />

= 1 h~r 1 ;::: ;~r N j ~r<br />

N P (1) ;::: ;~r P (N) i (2.12)<br />

!<br />

P 2S N<br />

= 1 N !<br />

X<br />

P 2S N<br />

N Y<br />

i=1<br />

(~r i , ~r P (i) ); (2.13)<br />

die eine logische Verallgemeinerung der Orthonormierungsbedingungen für die<br />

kontinuierlichen Ein–Teilchen–Ortszustände darstellen. Im zweiten Schritt der Gleichungskette<br />

wurde benutzt, daß in diesem Fall die zweifache Summe über alle<br />

Permutationen gleich N ! mal der einfachen Summe über alle Permutationen ist.<br />

Als abkürzende Schreibweise für das N-Tupel (~r 1 ;::: ;~r N ) soll <strong>im</strong> folgenden<br />

gelegentlich der 3N-komponentige Ortsvektor ~ R verwendet werden.<br />

Für die Matrixelemente von ^ M ergibt sich also<br />

M ( ~ R 00 ; ~ R 0 )= S h ~ R 00 j<br />

<br />

e (, M ^T ) e (, M ^V ) M<br />

j ~ R 0 i S : (2.14)<br />

Durch Einschieben von M , 1 vollständigen Sätzen von total symmetrischen<br />

Ortsbasiszuständen in das Operatorprodukt erhalten wir<br />

M =<br />

MY Z<br />

=2<br />

d ~ R()<br />

MY<br />

=1<br />

S h ~ R( +1)j e (, M ^T ) e (, M ^V ) j ~ R()i S ;<br />

(2.15)<br />

wobei ~ R(M +1)= ~ R 00 und ~ R(1) = ~ R 00 gelten soll.<br />

Führen wir für die noch zu berechnenden Matrixelemente<br />

S h ~ R( +1)j e (, M ^T ) e (, M ^V ) j ~ R()i S (2.16)<br />

die Abkürzung Q( +1;) ein und bezeichnen wir wieder mit ~ P das N-Tupel<br />

(~p 1 ;::: ;~p N ) von Impulsvektoren, so lassen sich die Q(+1;) durch Einschieben<br />

eines vollständigen Satzes von Impulsbasiszuständen berechnen:<br />

Q( +1;) =<br />

Z<br />

d ~ P<br />

(2~) 3N S h ~ R( +1)j e (, M ^T ) j ~ P i S<br />

h ~ P j S e (, M ^V ) j ~ R()i S (2.17)<br />

= e , M V ( ~ R())<br />

Z<br />

d P ~ exp<br />

(2~) 3N ,<br />

M<br />

NX<br />

i=1<br />

~p i<br />

2<br />

2m<br />

S h ~ R( +1)j ~ P i SS h ~ P j ~ R()i S : (2.18)<br />

!


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 10<br />

Dabei haben wir <strong>im</strong> ersten Schritt angenommen, daß der Operatoranteil für die<br />

potentielle Energie ^V lokal und rein ortsabhängig sein soll und demzufolge mit<br />

dem Permutationsoperator und allen ^p i kommutiert.<br />

<strong>Die</strong> Fourieramplitude S h ~ R( +1)j ~ P i S läßt sich unter Rückgriff auf die Definition<br />

der total symmetrischen Zustände auswerten:<br />

S h R( ~ +1)j P ~ i S = S h~r 1 ( +1);::: ;~r N ( +1)j ~p 1 ;::: ;~p N i S (2.19)<br />

X X<br />

= 1<br />

h~r<br />

(N !) 2 P (1) ( +1);::: ;~r P (N) ( +1)j<br />

P 0 2S N<br />

P 2S N<br />

j~p P 0 (1);::: ;~p P 0 (N)i (2.20)<br />

X<br />

= 1 h~r<br />

N P (1) ( +1);::: ;~r P (N) ( +1)j ~p 1 ;::: ;~p N i (2.21)<br />

!<br />

P 2S N<br />

!<br />

X<br />

NX<br />

= 1 exp , i ~r<br />

N P (i) ( +1) ~p i (2.22)<br />

!<br />

~<br />

P 2S N i=1<br />

wobei wir <strong>im</strong> zweiten Schritt wieder die Doppelsumme über alle Permutationen in<br />

N ! mal der Einfachsumme reduziert haben.<br />

Für die inverse Fourieramplitude S h P ~ j R()i ~ S ergibt sich nach analoger<br />

Rechnung<br />

!<br />

X<br />

NX<br />

S h P ~ j R()i ~ S = 1 i exp + ~r<br />

N P (i) () ~p i (2.23)<br />

! ~<br />

P 2S N i=1<br />

und somit für das Produkt beider Amplituden<br />

S h R( ~ +1)j P ~ i SS h P ~ j R()i ~ S =<br />

1 X X<br />

(N !) 2<br />

P 2S N<br />

P 0 2S N<br />

exp , i ~<br />

NX , ! ~p i ~r P 0 (i)( +1), ~r P (i) () (2.24)<br />

i=1<br />

Setzen wir dieses Zwischenergebnis in Gleichung (2.18) für das Matrixelement<br />

Q( +1;) ein, so erhalten wir<br />

<br />

<br />

1<br />

Q( +1;) =<br />

(N !) 2 exp , M V (~r 1();::: ;~r N ())<br />

<br />

X Z<br />

P;P 0 2S N<br />

exp<br />

NX<br />

i=1<br />

d~p 1<br />

(2~) 3<br />

, M<br />

Z<br />

d~p N<br />

(2~) 3<br />

p 2 i<br />

2m , i ~ ~p i , ~r P 0 (i) ( +1), ~r P (i) ()! (2.25)<br />

<strong>Die</strong> in dieser Gleichung auftretenden Impulsintegrale sind nach quadratischer<br />

Ergänzung vom Gaußschen Typ und somit leicht zu berechnen. Nach Auswertung


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 11<br />

der Integrale ergibt sich für die Matrixelemente<br />

<br />

1<br />

Q( +1;) =<br />

(N !) 2 exp , M V (~r 1();::: ;~r N ())<br />

X Y<br />

N m M 3=2<br />

<br />

2~ 2 <br />

P;P 0 2S N i=1<br />

<br />

exp , m M , <br />

2<br />

~rP<br />

2~ <br />

0 (i)( +1), ~r P (i) ()<br />

= 1 N ! exp , M V (~r 1();::: ;~r N ())<br />

X<br />

P;2S N<br />

N Y<br />

i=1<br />

<br />

<br />

(2.26)<br />

(A( +1;)) i;P i ; (2.27)<br />

wobei die Matrizen A( +1;) definiert sind als<br />

3 m M 2<br />

<br />

(A( +1;)) i;j =<br />

exp<br />

, m M<br />

2~ 2 <br />

2~ (~r i( +1), ~r j ()) 2 :<br />

(2.28)<br />

Auch hier haben wir <strong>im</strong> letzen Schritt wieder verwendet, daß die zweifache Summe<br />

über alle Permutationen gleich N ! mal der einfachen Summe über alle Permutationen<br />

ist.<br />

Für die Matrixelemente des diskretisierten Dichteoperator ^ M aus Gleichung<br />

(2.15) erhalten wir mit dem Ausdruck (2.27) also die pr<strong>im</strong>itive diskretisierte <strong>Pfadintegral</strong>darstellung<br />

M der Dichtematrix <br />

<br />

M ( R ~ 00 ; R ~ 0 1<br />

NY Z <br />

) =<br />

d~r j ()<br />

N !<br />

<br />

MY<br />

M MY<br />

=2<br />

X<br />

j=1<br />

Y<br />

N<br />

=1 P 2S N i=1<br />

exp<br />

0<br />

@ ,<br />

<br />

M<br />

(A( +1;)) i;P i<br />

MX<br />

=1<br />

1<br />

V (~r 1 ();::: ;~r N ()) A (2.29)<br />

für ein N-<strong>Bosonen</strong>-System.<br />

<strong>Die</strong> lateinischen Indizes dienen hierbei zur Numerierung der Teilchen. <strong>Die</strong><br />

griechischen Indizes entsprechen M diskreten Punkten <strong>im</strong> Temperaturintervall<br />

[0;]^=[1;T], also in der schon in Abschnitt 2.1 angesprochenen <strong>im</strong>aginären ”<br />

Zeit“,<br />

sie werden in der Literatur auch als Zeitscheiben bezeichnet. Für einen festen Teilchenindex<br />

i bezeichnen also die (~r 1 (); =1;::: ;M) genau die M Punkte auf<br />

dem Pfad dieses Teilchens von ~r i 0 nach ~r i 00 .


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 12<br />

Der in Gleichung (2.29) auftauchende algebraische Ausdruck<br />

X<br />

P 2S N<br />

N Y<br />

i=1<br />

(A( +1;)) i;P i<br />

(2.30)<br />

ist ein in der multilinearen Algebra wohlbekanntes Objekt und wird als <strong>Permanente</strong><br />

der Matrix A( +1;) (abgekürzt: perA( +1;)) bezeichnet.<br />

<strong>Die</strong> entsprechende PDPI-Darstellung von für ein N–Fermionen–System ergibt<br />

sich nach analoger Rechnung. Dabei zeigt sich, daß in Gleichung (2.29) unter<br />

der Summe über alle Permutationen noch ein zusätzlicher Faktor (1) P auftaucht,<br />

so daß <strong>im</strong> diskretisierten fermionischen <strong>Pfadintegral</strong> an Stelle der <strong>Permanente</strong> von<br />

A( +1;) die Determinante von A( +1;) steht.<br />

Bei der Dichtematrix (2.5) und dem abstrakten Feynmanschen <strong>Pfadintegral</strong><br />

(2.7) genügt eine einzige Permutation der Teilchenendpositionen ~r 1 00 ;::: ;~r N ,um<br />

eine vollständige Symmetrisierung zu erreichen. Auch be<strong>im</strong> diskretisierten <strong>Pfadintegral</strong>s<br />

M (2.29) sollte es ausreichend sein, wenn nur einmal zwischen zwei<br />

aufeinanderfolgenden Zeitscheiben eine Permutation von Teilchenindizes erfolgt.<br />

Wie gleich gezeigt wird, läßt sich dies mathematisch durch Substitution der Integrationsvariablen<br />

begründen.<br />

Der Integrand des <strong>Pfadintegral</strong>s (2.29) enthält die Permutationen in Form eines<br />

Produktes über die <strong>Permanente</strong>n der Matrizen A( +1;). <strong>Die</strong>ses Produkt ergibt<br />

ausmultipliziert<br />

MY<br />

=1<br />

per A( +1;)=<br />

X<br />

X<br />

X<br />

:::<br />

P12S N P22S N P M 2S N<br />

<br />

NY<br />

MY<br />

i=1 =1<br />

Mit M , 2 Koordinatentransformationen vom Typ<br />

(A( +1;)) i;P(i)<br />

(2.31)<br />

(x 1 ();::: ;x N ()) ,! (x P,1(1)();::: ;x P,1(N)())<br />

(2.32)<br />

für = 2;::: ;M, deren Jacobideterminanten den Betrag 1 haben, können die<br />

Doppelsummen über die N–Teilchenpermutationen P ,1 ;P durch N ! mal den<br />

Einfachsummen über alle Permutationen ersetzt werden:<br />

X<br />

X<br />

,!<br />

P ,12S N P 2S N<br />

X<br />

mit P 0 = P ,1 P ,1 : (2.33)<br />

P2S 0 N


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 13<br />

Das <strong>Pfadintegral</strong> (2.29) kann so in die mathematisch äquivalente Form<br />

M ( ~ R 00 ; ~ R 0 ) = 1 N !<br />

MY<br />

NY Z<br />

=2 j=1<br />

d~r j ()<br />

perA(M;M , 1)<br />

exp<br />

0<br />

@ ,<br />

<br />

M<br />

MX<br />

=1<br />

<br />

NY<br />

M,2<br />

Y<br />

i=1 =1<br />

(A( +1;)) i;i<br />

1<br />

V (~r 1 ();::: ;~r N ()) A (2.34)<br />

umgeschrieben werden, in der die Permutation der Teilchenindizes zwischen den<br />

beiden Zeitscheiben = M und +1=1erfolgt.<br />

2.3 Berechnung thermodynamischer Observablen<br />

Wie bekannt, wird in der Quantenstatistik der Erwartungswert einer Observablen<br />

^O bezüglich eines gemischten Zustandes über den Dichteoperator ^ berechnet:<br />

h ^Oi =Tr(^O ^): (2.35)<br />

Für Observablen ^O = ^O( ~ R), die nicht explizit von den N Impulsoperatoren ^p i<br />

abhängen, gilt<br />

S h ~ R j ^O( ~ R) j ~ R 0 i S = 1 N ! O( ~ R)<br />

X<br />

P 2S N<br />

( ~ R , P ~ R 0 ): (2.36)<br />

Damit läßt sich für den Erwartungswert (2.35) analog zum vorherigen Abschnitt<br />

eine diskretisierte <strong>Pfadintegral</strong>darstellung finden 3 :<br />

h ^Oi 1 1<br />

d R(1)<br />

Z M N ~ <br />

!<br />

wobei Z M die genäherte Zustandssumme<br />

ist und W die Wahrscheinlichkeitsdichtefunktion<br />

W = 1 N ! per A(1;M) N Y<br />

i=1<br />

exp<br />

Z<br />

0<br />

Z<br />

d ~ R(M ) O( ~ R)W ( ~ R) (2.37)<br />

Z M =Tr^ M (2.38)<br />

@ ,<br />

<br />

M<br />

MX<br />

=1<br />

Y<br />

M,1<br />

=1<br />

(A( +1;)) i;i<br />

1<br />

V (~r 1 ();::: ;~r N ()) A (2.39)<br />

3 Für Observablen, die explizit von den Impulsoperatoren abhängen gibt es andere Möglichkeiten<br />

der Diskretisierung, siehe z.B. [?].


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 14<br />

bezeichnet.<br />

Es ist zu beachten, daß in Gleichung (2.37) durch die Spurbildung eine zusätzliche<br />

Integration über den Anfangs- und Endpunkt ~ R(M +1) = ~ R(1) (periodische<br />

Randbedingung) auftaucht und die Permutation der Teilchenindizes zwischen die<br />

beiden Zeitscheiben = M und +1=1gelegt wurde.<br />

<strong>Die</strong> Wahrscheinlichkeitsdichte W kann rein formal interpretiert werden (der<br />

sog. klassische Isomorphismus, [?, ?]) als die klassische Boltzmann–Verteilung<br />

eines Systemes aus N M Teilchen, die wie ”<br />

Perlen“ auf einer geschlossenen<br />

Kette aufgereiht sind und sich in einem Potential ~ V bewegen, das aus zwei Teilen<br />

besteht.<br />

Der eine Teil ist nichts anderes als das Potential V des ursprünglichen Systems,<br />

das zu einer Wechselwirkung zwischen ”<br />

Perlen“ derselben Zeitscheibe führt. Der<br />

andere Anteil — repräsentiert durch die Exponenten in den Komponenten der Matrix<br />

A( +1;) — stellt eine harmonische, federartige Wechselwirkung zwischen<br />

den ”<br />

Perlen“ direkt aufeinander folgender Zeitscheiben und +1dar.<br />

Für den Fall M =1entfällt in der Wahrscheinlichkeitsdichte W das Produkt<br />

über die Komponenten der Matrix A und es ergibt sich der klassische Grenzfall der<br />

Boltzmann-Statistik für ein System aus N Teilchen.<br />

<strong>Die</strong> formale Ähnlichkeit des diskretisierten <strong>Pfadintegral</strong>es mit dem klassischen<br />

Phasenraumintegral eines größeren Systems erlaubt es, für numerische Berechnung<br />

auf die bei klassischen Systemen erprobten Verfahren zurückzugreifen.<br />

2.4 Das <strong>Pfadintegral</strong>-Monte-Carlo Verfahren (PIMC)<br />

Eines der robustesten und am besten untersuchten Verfahren (siehe z.B. [?, ?, ?])<br />

zur numerischen Berechnung von Erwartungstungswerten <strong>im</strong> klassischen kanonischen<br />

Ensemble ist das auf METROPOLIS ET. AL. [?] zurückgehende Monte–<br />

Carlo–Verfahren, das in Anhang A in einem allgemeineren Zusammenhang erläutert<br />

wird.<br />

Neben dem Metropolis-Algorithmus werden zur S<strong>im</strong>ulation eines kanonischen<br />

Ensembles auch noch andere Monte–Carlo–Verfahren ( ”<br />

heat bath“–Algorithmus;<br />

kraftgesteuerte MC-Verfahren) mit einem besseren Konvergenzverhalten verwendet.<br />

<strong>Die</strong>se Verfahren sind jedoch entweder rechenaufwendiger oder sie greifen auf<br />

zusätzliche, physikalische Eigenschaften (z.B. Kräfte) der Systeme zurück [?, ?].<br />

Da der oben angesprochene klassische Isomorphismus auf einer mathematisch–<br />

strukturellen Ähnlichkeit zwischen <strong>Pfadintegral</strong> und klassischem Phasenraumintegral<br />

beruht, ist nicht so ohne weiteres klar, ob sich solche physikalischen Eigenschaften<br />

ebenfalls übertragen lassen [?]. Deshalb wird bei der numerische Berechnung<br />

des thermischen <strong>Pfadintegral</strong>es in der Regel vom Metropolis–Verfahren ausgegangen.<br />

Im Metropolis–Algorithmus wird ein random walk durch den Konfigurationsraum<br />

so erzeugt, daß die Wahrscheinlichkeitsverteilung (2.39) unter dem zugehörige<br />

Markoff–Prozeß stationär ist (eine detaillierte Beschreibung findet sich in An-


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 15<br />

hang A.2.1).<br />

Ausgehend von einer beliebigen Startkonfiguration wird <strong>im</strong> Metropolis–Algorithmus<br />

der i-te Schritt des ”<br />

random walk“ wie folgt realisiert:<br />

1. Zufällige Erzeugung einer neuen Teilchenkonfiguration C 0 <strong>im</strong> 3NM-d<strong>im</strong>ensionalen<br />

Konfigurationsraum.<br />

2. <strong>Die</strong>se Konfiguration wird die neue Konfiguration C i , falls für eine Zufallszahl<br />

2 [0; 1] die Bedingung<br />

W (C 0 )<br />

> (2.40)<br />

W (C i )<br />

erfüllt ist, d.h. der Quotient in Gleichung (2.40) muß größer als eine Zufallszahl<br />

zwischen 0 und 1 werden.<br />

Der Erwartungswert einer beliebigen Observablen ^O ergibt sich dann durch<br />

Summation über alle n Metropolis–Schritte:<br />

h ^Oi =<br />

nX<br />

i=1<br />

W (C i ): (2.41)<br />

Bei der konkreten Umsetzung dieses Algorithmus sind allerdings viele technische<br />

Details zu beachten. 4 Bewährt hat sich folgendes Vorgehen: Ein Schritt der<br />

Monte–Carlo–S<strong>im</strong>ulation wird in mehrere sogenannte mikroskopische und makroskopische<br />

Schritte zerlegt.<br />

Bei einem mikroskopischen Schritt wird nur eine Teilchenkoordinate i zu einer<br />

best<strong>im</strong>mten Zeitscheibe um einen zufälligen Betrag ~r 1 verschoben:<br />

~r i () ,! ~r i () +~r 1 : (2.42)<br />

Bei einem makroskopischen Schritt werden dagegen alle zu einem Teilchenindex<br />

i gehörenden Koordinaten verschoben:<br />

~r i () ,! ~r i () +~r 2 f. a. =1;::: ;M: (2.43)<br />

In einem S<strong>im</strong>ulationsschritt wird nun für jede der NM Koordinaten ~r i () ein<br />

mikroskopischer Schritt und für jeden der N Pfade (~r i (); = 1;::: ;M) ein<br />

makroskopischer Schritt ausgeführt. In jedem dieser Teilschritte muß dabei die<br />

Akzeptanzbedingung (2.40) erfüllt werden.<br />

<strong>Die</strong> Zufallsvektoren ~r 1 und ~r 2 werden aus zwei Schrittweitenparametern<br />

w 1 und w 2 erzeugt, die wiederum so best<strong>im</strong>mt werden, daß das Verhältnis von<br />

abgelehnten zu angenommenen Schritten in einem vorgegebenem Bereich bleibt.<br />

Zu beachten ist außerdem [?], daß in der Gewichtsfunktion (2.39) der Anteil<br />

der potentiellen Energie proportional zu =M eingeht, während der durch die<br />

4 siehe z.B. FRANKE [?], Kapitel 4.2: ”<br />

<strong>Die</strong> Kunst der Konfigurationserzeugung“.


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 16<br />

Komponenten (2.28) der Matrix A( +1;) best<strong>im</strong>mte kinetische Energieterm<br />

proportional zu M= ist. Um nun zu erreichen, daß der potentielle und der kinetische<br />

Term gleichermaßen die Dynamik der S<strong>im</strong>ulationsrechnung best<strong>im</strong>men, wird<br />

an den Quotienten =M die Bedingung<br />

<br />

= const. (2.44)<br />

M<br />

gestellt, je kleiner also die Temperatur gewählt wird, umso größer soll die Anzahl<br />

der Zeitscheiben gewählt werden.<br />

2.5 Importance Sampling of Permutations<br />

In der Formulierung des <strong>Pfadintegral</strong>–Monte–Carlo–Verfahrens nach Metropolis<br />

ist deutlich zu erkennen, daß die Überprüfung der Akzeptanzbedingung (2.40) den<br />

größten numerischen Aufwand erfordert. Davon geht wieder ein Hauptteil zu Lasten<br />

der Berechnung der <strong>Permanente</strong>, die in jedem S<strong>im</strong>ulationsschritt 3N mal ausgewertet<br />

werden muß.<br />

<strong>Die</strong> Anwendbarkeit der <strong>Pfadintegral</strong>–Monte–Carlo–Methode für <strong>Viel</strong>–<strong>Bosonen</strong>–<br />

Systeme in der bis hier dargestellten Form hängt also wesentlich davon ab, ob eine<br />

effiziente Möglichkeit zur Berechnung der <strong>Permanente</strong> der Matrix A( +1;) gefunden<br />

wird. Bisher ist jedoch noch keine solche Berechnungsmethode bekannt<br />

(siehe z.B. den Übersichtsartikel von CEPERLEY [?]).<br />

Deshalb hat sich für die numerische Auswertung des <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>s<br />

von N–<strong>Bosonen</strong>–Systemen ein modifiziertes Monte–Carlo–Verfahren nach<br />

Metropolis durchgesetzt, daß in der Literatur [?] unter dem Stichwort ”<br />

<strong>im</strong>portance<br />

sampling of permutations“ bekannt ist.<br />

Bei dieser Methode werden die zu untersuchenden physikalischen Observablen<br />

^O als Funktionen von Permutationen P und Koordinaten ~ R(i) aufgefaßt, der Konfigurationsraum<br />

wird sozusagend um den abstrakten Permutationsraum erweitert.<br />

Damit kann ein Mittelwert analog zu Gleichung (2.37) definiert werden<br />

h ^Oi <br />

P<br />

P 2S N<br />

R<br />

d ~ R(1) <br />

R<br />

d ~ R(M ) O(P; ~ R) ~ W (P; ~ R)<br />

P<br />

P 2S N<br />

R<br />

d ~ R(1) <br />

R<br />

d ~ R(M ) ~ W (P; ~ R);<br />

wobei die modifizierte Gewichtsfunktion ~ W gegeben ist durch<br />

~W = 1 N !<br />

2<br />

NY<br />

i=1<br />

exp<br />

Y<br />

4 (A(1;M))i;P i<br />

M,1<br />

0<br />

@ ,<br />

<br />

M<br />

MX<br />

=1<br />

=1<br />

(A( +1;)) i;i<br />

3<br />

5<br />

1<br />

(2.45)<br />

V (~r 1 ();::: ;~r N ()) A : (2.46)


KAPITEL 2. DAS THERMODYNAMISCHE PFADINTEGRAL 17<br />

<strong>Die</strong>ser Mittelwert läßt sich wieder mit einem MC–Verfahren vom Metropolis–<br />

Typ berechnen. Allerdings müssen nun zusätzlich zu den in Abschnitt 2.4 erwähnten<br />

mikroskopischen und makroskopischen MC–Schritten auch noch Schritte <strong>im</strong><br />

Permutationsraum durchgeführt werden. Dabei wird ausgenutzt, daß sich jede Permutation<br />

in eine Hintereinanderausführung von sogenannten Elementarpermutationen,<br />

d.h. das Vertauschen von nur zwei Indizes zerlegen läßt.<br />

Werden zwei Teilchenindizes i und j vertauscht, so ändert sich die Gewichtsfunktion<br />

~ W um den Faktor<br />

= (A(1;M)) i;P j (A(1;M)) j;P i<br />

(A(1;M)) i;P i (A(1;M)) j;P j<br />

: (2.47)<br />

Ein Schritt <strong>im</strong> Permutationsraum besteht nun darin, daß für alle N (N , 1)=2<br />

möglichen Indexpaare 1 i


Kapitel 3<br />

Mögliche Berechnungsverfahren<br />

für die <strong>Permanente</strong><br />

In diesem Kapitel sollen Alternativen zu dem etablierten, bisher in der <strong>Pfadintegral</strong>–<br />

Monte–Carlo–Methode benutzten ”<br />

Importance Sampling of Permutations“ aufgezeigt<br />

werden.<br />

Der Ausgangspunkt für solche alternativen Ansätze sollen dabei die in der Mathematik<br />

erzielten Ergebnisse auf dem Gebiet der <strong>Permanente</strong>n sein.<br />

Um diese Ergebisse darstellen zu können, werden zuerst einige elementare<br />

Grundlagen aus der Theorie der <strong>Permanente</strong>n angegeben.<br />

Danach werden die wichtigsten allgemeinen Berechnungsverfahren für <strong>Permanente</strong>n<br />

vorgestellt, bevor schließlich die <strong>im</strong> Rahmen dieser Diplomarbeit angestellten<br />

Berechnungsversuche erläutert werden.<br />

3.1 Mathematische Grundlagen der <strong>Permanente</strong><br />

<strong>Die</strong> <strong>Permanente</strong> als algebraisches Objekt ist jünger als ihre bekanntere Verwandte,<br />

die Determinante. Im Jahr 1812 entdeckten zeitgleich CAUCHY und BINET bei<br />

Untersuchungen von ”<br />

fonctions symétriques permanentes“ diese spezielle Abbildung<br />

der multilinearen Algebra [?] und erkannten ihren Zusammenhang mit der<br />

Determinante. Der Begriff <strong>Permanente</strong> wurde allerdings erst <strong>im</strong> letzten Viertel des<br />

vorigen Jahrhunderts, <strong>im</strong> Jahr 1881, von MUIR geprägt [?].<br />

Obwohl die <strong>Permanente</strong> schon seit über 150 Jahren als mathematisches Objekt<br />

bekannt ist, hat sie nie auch nur annähernd dieselbe Bedeutung wie die Determinante<br />

erlangt. So sind in den Jahren von 1812 bis 1977 lediglich 301 mathematische<br />

Veröffentlichungen bekannt, in denen die <strong>Permanente</strong> erwähnt ist — wobei mehr<br />

als dreiviertel der Arbeiten <strong>im</strong> Zeitraum von 1960–1977 erschienen sind.<br />

Eine Ursache hierfür ist sicherlich, daß die <strong>Permanente</strong> nur selten in Problemen<br />

der angewandten Mathematik anzutreffen ist. Eine wichtige Rolle spielt sie<br />

lediglich in der Kombinatorik, der Wahrscheinlichkeitstheorie sowie in einigen Bereichen<br />

der Quantenfeldtheorie und der Statistischen Physik.<br />

18


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 19<br />

<strong>Die</strong> andere Ursache ist sicherlich die Tatsache, daß die Berechnung der <strong>Permanente</strong><br />

so ungleich viel schwieriger ist als bei der Determinante 1 .<br />

Zunächst betrachten wir die grundlegende Definition der <strong>Permanente</strong>. Sei A =<br />

(a ij ) eine m n Matrix über dem Körper R oder C mit m n. <strong>Die</strong><strong>Permanente</strong><br />

von A ist definiert als<br />

per (A) =<br />

X<br />

<br />

a 1(1) a 2(2) a m(m) ; (3.1)<br />

wobei eine eins-zu-eins Abbildung von f1;::: ;mg auf f1;::: ;ng ist.<br />

Im Falle einer quadratischen Matrix — d.h. m = n — bedeutet dies nichts<br />

anderes, als daß die Abbildung eine Permutation der ersten n natürlichen Zahlen<br />

f1;::: ;ng ist. <strong>Die</strong> <strong>Permanente</strong> einer quadratischen n n Matrix A kann damit<br />

aufgefaßt werden als die Summe über alle Produkte von n Komponenten aus A,<br />

wobei jeweils zwei dieser Komponenten nicht in derselben Zeile oder Spalte stehen<br />

dürfen:<br />

per (A) =<br />

X<br />

2S n<br />

a 1(1) a 2(2) a n(n) : (3.2)<br />

Hierbei steht S n als Abkürzung für die symmetrische Gruppe der Permutationen<br />

der ersten n natürlichen Zahlen.<br />

<strong>Die</strong>se Interpretation ermöglicht den Vergleich von der <strong>Permanente</strong> einer quadratischen<br />

Matrix A mit der Determinante derselben Matrix:<br />

det A =<br />

X<br />

2S n<br />

(,1) j() a 1(1) a 2(2) a n(n) : (3.3)<br />

Der Ausdruck (,1) j() soll dabei +1 für eine gerade Permutation und ,1 für eine<br />

ungerade Permutation ergeben.<br />

Aus der o.g. Definition der <strong>Permanente</strong> lassen sich sofort einige fundamentale<br />

Eigenschaften herleiten:<br />

1. Für eine m n Matrix A (m n) istper (A) eine multilineare Abbildung<br />

in den Zeilen von A. Im Falle einer quadratischen nn Matrix A ist per (A)<br />

sogar eine multilineare Abbildung der Spalten von A.<br />

2. Für eine m n Matrix A (m n) und zwei Permutationsmatrizen P und Q<br />

der Ordnungen m bzw. n gilt<br />

per (A) =per(PAQ) (3.4)<br />

<strong>Die</strong>s bedeutet nichts anderes, als daß die <strong>Permanente</strong> sich unter beliebigen<br />

Vertauschungen von Zeilen oder Spalten nicht ändert.<br />

1 Anmerkung aus dem Alltag der Wissenschaft: Nach einem Kolloquiumsvortrag in Oldenburg<br />

bemerkte der numerische Algebraiker B.N. DATTA, daß das effizienteste Verfahren zur Berechnung<br />

der <strong>Permanente</strong> <strong>im</strong>mer noch darin bestünde, nicht die <strong>Permanente</strong> zu berechnen, sondern das Problem<br />

so umzuformulieren, daß die <strong>Permanente</strong> nicht mehr auftaucht !


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 20<br />

3. Ist A eine n n Matrix, so gilt insbesondere<br />

per (A) =per(A T ) (3.5)<br />

<strong>Die</strong> <strong>Permanente</strong> einer quadratischen Matrix ist also invariant unter Transpositionen.<br />

4. Ist A eine m n Matrix (m n) mit mindestens einer Nullzeile, so ist<br />

per (A) =0.<br />

Im Falle einer quadratischen Matrix sind die erste und die dritte dieser elementaren<br />

Eigenschaften auch für die Determinante der Matrix erfüllt. Bemerkenswert<br />

ist jedoch, daß die <strong>Permanente</strong> gegenüber der Determinante die “schöne” Eigenschaft<br />

besitzt, invariant unter beliebigen Permutationen von Komponenten der Ausgangsmatrix<br />

zu sein.<br />

Nun besitzt die <strong>Permanente</strong> als multilineare Abbildung aber auch einige “unangenehme”<br />

Eigenarten in dem Sinne, als daß einige der von Determinanten bekannten<br />

Rechenregeln für <strong>Permanente</strong>n nicht gelten:<br />

1. Sind A und B zwei n n Matrizen, so gilt <strong>im</strong> allgemeinen<br />

per (A B) 6= per (A) per (B) (3.6)<br />

2. Elementare Zeilenumformungen — d.h. Addition eines <strong>Viel</strong>fachens einer<br />

Zeile der Matrix zu einer anderen Zeile der Matrix — ändern den Wert der<br />

<strong>Permanente</strong> !<br />

3. <strong>Die</strong> vorherige Eigenschaft <strong>im</strong>pliziert insbesondere<br />

Rang A


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 21<br />

aufweisen (Toeplitz–Matrizen, Zirkulanten) oder nur Komponenten aus einem sehr<br />

eingeschränkten Wertebereich haben (0–1–Matrizen).<br />

Als Beispiel sei die <strong>Permanente</strong> einer Hessenberg–Matrix angegeben, auf die<br />

noch in Abschnitt 3.3 zurückgegriffen wird.<br />

Eine Hessenberg–Matrix H ist eine n n Matrix, die die Bedingung<br />

(H) ij =0 falls j , i 2 (3.8)<br />

erfüllt, d.h. alle Matrixelemente über der oberen Nebendiagonale müssen Null sein.<br />

Wird nun aus H die Matrix ~ H erzeugt mittels<br />

<br />

( H) ~ ,(H)ij falls j , i 2<br />

ij =<br />

(H) ij sonst<br />

; (3.9)<br />

so folgt [?]<br />

perH = det ~ H: (3.10)<br />

3.2 Allgemeine Berechnungsverfahren<br />

Das Problem, die Determinante einer beliebigen n n Matrix zu berechnen, ist<br />

äquivalent zu dem Problem, diese Matrix auf Dreiecksgestalt zu bringen. Für letzteres<br />

gibt es eine Reihe von effizienten Verfahren (Gauss-Verfahren, LU-Zerlegung<br />

usw.), deren Berechnungsaufwand in der Größenordnung von O(n 3 ) liegt. Mit dem<br />

Begriff Berechnungsaufwand (oder Rechenaufwand) eines Berechnungsverfahrens<br />

wird in der numerischen Mathematik üblicherweise die Anzahl der in dem Verfahren<br />

vorkommenden Multiplikationen bezeichnet, da diese sehr viel rechenintensiver<br />

als die Additionsoperationen sind.<br />

Für die <strong>Permanente</strong> ist es dagegen bis jetzt noch nicht gelungen, ein allgemeines<br />

Berechnungsverfahren anzugeben, dessen Rechenaufwand polynomial und<br />

nicht exponentiell in der Matrixgrösse n ist. Erstaunlicherweise ist es noch nicht<br />

einmal gelungen [?, ?] ein allgemeines Näherungsverfahren zu finden, daß polynomial<br />

in n ist !<br />

Im folgenden werde ich einen kurzen Überblick über die wichtigsten bis jetzt<br />

bekannten allgemeinen Berechnungsverfahren geben.<br />

3.2.1 <strong>Die</strong> Definition und die Laplace–Entwicklung<br />

Der naivste Versuch, die <strong>Permanente</strong> einer Matrix A zu berechnen, besteht sicherlich<br />

darin, auf die Definitionsgleichung (3.2) zurückzugreifen. Bei einer näheren<br />

Betrachtung der definierenden Gleichung läßt sich sofort feststellen, daß der Rechenaufwand<br />

in der Größenordnung von O((n,1)n!) ist: <strong>Die</strong> symmetrische Permutationsgruppe<br />

S n hat n! Elemente, es gibt also ebensoviele Summanden, und in<br />

jedem Summanden tauchen n , 1 Multiplikationen auf.


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 22<br />

Eine Variante der Definitonsgleichung ergibt sich, wenn in Analogie zur Laplace–Entwicklung<br />

der Determinante die <strong>Permanente</strong> in eine Summe über Unterpermanenten<br />

der Matrix A entwickelt wird:<br />

per (A) =<br />

nX<br />

t=1<br />

a tj per (A(tjj)) : (3.11)<br />

Dabei soll das Symbol A(tjj) für die (n , 1) (n , 1) Matrix sein, die aus A<br />

durch Streichen der Spalte t und der Zeile j entsteht (Entwicklung nach der j–ten<br />

Zeile).<br />

<strong>Die</strong>se Entwicklung bringt offensichtlich nur dann einen Vorteil gegenüber der<br />

Definitonsgleichung, wenn die Werte für die Unterpermanenten bekannt sind. Eine<br />

rekursive Berechnug der Unterpermanenten über Laplace–Entwicklung oder die<br />

direkte Berechnung über Gleichung (3.2) führt schließlich ebenfalls auf einen Rechenaufwand<br />

von<br />

Multiplikationen.<br />

3.2.2 Das Ryser–Verfahren<br />

O((n , 1) n!) (3.12)<br />

Das von RYSER entwickelte Verfahren [?] zur Berechnung der <strong>Permanente</strong> basiert<br />

auf dem kombinatorischen Inklusions– und Exklusions–Prinzip und ist das zur Zeit<br />

effizienteste bekannte allgemeine Verfahren zur Berechnung der <strong>Permanente</strong>. <strong>Die</strong><br />

Grundidee ist dabei ganz einfach zu formulieren:<br />

Summiere für jede Zeile der Matrix über alle Spalten und bilde das Produkt aller<br />

dieser Zeilensummen. Der so entstehende Ausdruck enthält u.a. auch diejenigen<br />

Terme, die bei der Berechnung der <strong>Permanente</strong> gemäß Gleichung (3.2) auftauchen.<br />

Also müssen “nur noch” die überflüssigen Terme wieder abgezogen werden. <strong>Die</strong><br />

Berechnung der <strong>Permanente</strong> ist damit auf das Best<strong>im</strong>men dieser überflüssigen Terme<br />

und damit auf ein rein kombinatorisches Problem zurückgeführt.<br />

Mathematisch konkretisiert ergibt diese Idee die Rysersche Formel:<br />

per (A) =(,1) n<br />

X<br />

X<br />

Y<br />

n<br />

Sf1;:::ng(,1) jSj i=1 j2S<br />

a ij ; (3.13)<br />

wobei in der ersten Summe über alle Untermengen S von f1;:::ng summiert wird<br />

und das Symbol jSj für die Anzahl der Elemente der Menge S steht. Es werden also<br />

für jede Untermenge S alle Spalten in A mit Nullen aufgefüllt, deren Spaltenindex<br />

j in S enthalten ist und anschliessend wird das Produkt von den Zeilensummen<br />

der so entstandenen Matrix gebildet. <strong>Die</strong> Summe der so entstandenen Ausdrücke<br />

ergibt dann die <strong>Permanente</strong> der Matrix.<br />

Der Beweis der Ryserschen Formel erfolgt rein kombinatorisch mit dem schon<br />

oben erwähnten Inklusions– und Exklusionsprinzip (siehe z.B. [?, ?] oder [?]).


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 23<br />

Da für jeden Summanden der ersten Summe in (3.13) (n , 1) Multiplikationen<br />

ausgeführt werden, ergibt sich der Berechnungsaufwand offensichtlich aus der Anzahl<br />

der Summanden in dieser Summe. Es gibt genau 2 n , 1 nichtleere verschiedene<br />

Teilmengen von f1;::: ;ng und damit beträgt die Anzahl der Multiplikationen<br />

(n , 1) (2 n , 1): (3.14)<br />

NIJENHUIS und WILF ([?]) haben eine Variante der Ryserschen Formel hergeleitet,<br />

die besonders geeignet für eine algorithmische Umsetzung ist:<br />

x i = a in , 1 2<br />

nX<br />

j=1<br />

per (A) = (,1) n,1 2 <br />

a ij i =1;::: ;n (3.15)<br />

X<br />

Sf1;:::n,1g(,1) jSj n Y<br />

i=1<br />

0<br />

@ xi +<br />

X<br />

j2S<br />

a ij<br />

1<br />

A<br />

Bei dieser Version der Ryserschen Formel werden die in (3.13) doppelt auftauchenden<br />

Terme nur einmal berechnet und gehen dafür mit einem Faktor 2 in die Summe<br />

ein. Da also nur Untermengen S von f1;:::n, 1g gebildet werden müssen, reduziert<br />

sich die Anzahl der Multiplikationen auf<br />

(n , 1) 2 n,1 =1=2 (n , 1) 2 n : (3.16)<br />

Werden nun bei der algorithmischen Umsetzung von Gleichung (3.16) die Untermengen<br />

S so durchlaufen, daß sich die neue Untermenge S 0 von der vorhergehenden<br />

nur in einem Element unterscheidet, 2 so läßt sich die Gesamtzahl der<br />

notwendigen Additionen wie folgt min<strong>im</strong>ieren:<br />

Für jedes S f1;:::n, 1g muß folgendes Produkt neu berechnet werden:<br />

0<br />

nY<br />

i=1<br />

@ xi +<br />

X<br />

j2S<br />

a ij<br />

1<br />

A =:<br />

n Y<br />

i=1<br />

i (S) (3.17)<br />

Wird nun die nächste Untermenge S 0 so gewählt, daß sie sich von der vorhergehenden<br />

nur in einem Element unterscheidet,<br />

9j 2f1;:::n, 1g : j 62 S 0 ^ j 2 S falls jSj = jS 0 j +1 (3.18)<br />

9j 2f1;:::n, 1g : j 62 S ^ j 2 S 0 falls jS 0 j = jSj +1 (3.19)<br />

so berechnet sich das neue i (S 0 ) aus dem alten i (S) einfach als<br />

i (S 0 ) = i (S) , a ij falls jSj = jS 0 j +1 (3.20)<br />

i (S 0 ) = i (S) +a ij falls jS 0 j = jSj +1 (3.21)<br />

<strong>Die</strong> Anzahl der Additionen wird also gegenüber einer beliebigen Durchlauffolge<br />

für die Untermengen S um die Hälfte reduziert.<br />

2 <strong>Die</strong>s läßt sich z.B. durch einen sog. Hamilton Walk über die Ecken eines Einheitswürfels <strong>im</strong><br />

R (n,1) realisieren.


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 24<br />

3.2.3 Graphentheoretische Verfahren<br />

In diesem Abschnitt soll eine graphentheoretisches Verfahren nach der Methode<br />

von ITAI, RODEH und TANIMOTO [?] vorgestellt werden. Bevor näher erläutert<br />

werden kann, wie sich die Berechnung der <strong>Permanente</strong> einer beliebigen Matrix A<br />

mit Mitteln der Graphentheorie formulieren läßt und welche Vorteile eine solche<br />

Formulierung mit sich bringt, müssen zunächst einige elementare Definitionen der<br />

Graphentheorie getroffen werden.<br />

Gegeben sei eine endliche Menge V = fv 1 ;v 2 ;::: ;v n g und eine Menge E<br />

geordneter Paare (v i ;v j ) mit v i ;v j 2 V ,alsoE V V . Dann heißt G =(V;E)<br />

ein endlicher Graph. <strong>Die</strong> Elemente von V heißen Knoten, dievonE Kanten.<br />

Ist ein Knoten v i 2 V Bestandteil einer Kante, d.h.<br />

9 v i 2 V : (v i ;v j ) 2 E; (3.22)<br />

dann ist dieser Knoten inzident mit dieser Kante. Der Grad eines Knotens ist die<br />

Anzahl der Kanten des Graphens, mit der dieser Knoten inzident ist.<br />

Ein Graph G =(V = v 1 ;::: ;v n ;E) heißt dicht, wenn der Grad jedes Knotens<br />

größer gleich n=2 ist, d.h. es muß mindestens n=2 Kanten in dem Graphen geben<br />

und jeder Knoten muß inzident mit mindestens n=2 dieser Kanten sein.<br />

Für eine Knotenfolge v 1 ;v 2 ;::: ;v k gelte (v i ;v i +1)2 E für i =1;::: ;k,<br />

1. Dann heißt die zugehörige Kantenfolge ein Weg. Ein Weg bei dem Anfangsund<br />

Endknoten zusammenfallen, und der mindestens eine Kante enthält, heißt ein<br />

Kreis.<br />

Ein Graph B = (V;E) heißt bipartit, falls die Knotenmenge V sich so als<br />

Vereinigung zweier Mengen X und Y darstellen läßt, daß alle Kanten einen Knoten<br />

in X und den anderen in Y haben.<br />

Eine Teilmenge M E der Kantenmenge eines bipartiten Graphen B =<br />

(V;E) heißt Matching, falls kein Knoten aus V mit mehr als einer Kante von M inzident<br />

ist. <strong>Die</strong> Größe eines Matchings ist durch die Anzahl seiner Kanten gegeben<br />

und die Größe einer Knotenmenge V ist wie üblich durch die Anzahl der Elemente<br />

jV j in V definiert.<br />

Gilt für einen bipartiten Graph B =(V = X [ Y;E), daßjXj jY j und ist<br />

jeder Knoten x 2 X inzident mit einer Kante von M, dann heißt das Matching<br />

perfekt. Ein Matching max<strong>im</strong>aler Größe wird als max<strong>im</strong>ales Matching bezeichnet.<br />

Wie läßt sich nun die Berechnung der <strong>Permanente</strong> graphentheoretisch formulieren<br />

? Der Ausgangspunkt bildet wieder die Definition der <strong>Permanente</strong> nach Gleichung<br />

(3.2):<br />

per (A) =<br />

X<br />

2S n<br />

n Y<br />

i=1<br />

a i(i) : (3.23)<br />

Der entscheidende Teil dieser Formel, der die Berechnung der <strong>Permanente</strong> so schwierig<br />

macht, ist offensichtlich die Summe über alle Permutationen.


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 25<br />

Jede Permutation 2 S n ist nichts anderes als eine 1-zu-1-Abbildung der<br />

ersten n natürlichen Zahlen auf sich selbst:<br />

1 ,! (1)<br />

2 ,! (2)<br />

.<br />

. (3.24)<br />

n ,! (n) :<br />

Wird jeder Permutation 2 S n eine ”<br />

grafische Abbildung“ wie in (3.24) zugeordnet,<br />

so läßt sich die Überlagerung aller dieser Abbildungen als bipartiter Graph<br />

interpretieren. Jede Permutation ist dann nichts anderes als perfektes Matching<br />

dieses bipartiten Graphen. Mit geeigneten graphentheoretischen Algorithmen, die<br />

weiter unten vorgestellt werden, lassen sich alle perfekten Matchings eines Graphen<br />

und damit in diesem Spezialfall alle Permutationen 2 S n berechnen.<br />

Im allgemeinen Fall bietet diese graphentheoretische Formulierung keinen Vorteil,<br />

da diese nur eine andere Möglichkeit bietet, alle n! Permutationen der Zahlen<br />

1;::: ;nzu berechnen.<br />

Falls nun aber einige der Matrixelemente a ij gleich null sind, so fallen in Gleichung<br />

(3.23) viele der Produkte unter der Permutationssumme weg, d.h. es muß<br />

nur über die Permutationen summiert werden, bei denen keine Zeilen- oder Spaltenindizes<br />

auftauchen, die Nullelemente der Matrix indizieren.<br />

Alle diese zulässigen Permutationen lassen sich wie folgt graphentheoretisch<br />

best<strong>im</strong>men: Sei B =(V = X[Y;E) ein bipartiter Graph, mit X = fx 1 ;::: ;x n g,<br />

Y = fy 1 ;::: ;y n g und (x i ;y i ) 2 E genau dann, wenn a ij 6=0.Dannistfür jede<br />

Permutation 2 S n die Aussage<br />

äquivalent zu der Aussage, daß<br />

nY<br />

i=1<br />

a i(i) 6=0 (3.25)<br />

M = f(x i ;y (i) ji =1;::: ;ng\E (3.26)<br />

ein perfektes Matching ist. Der Wert der <strong>Permanente</strong> ergibt sich schließlich durch<br />

Summation über alle Permutationen 2 S n , die einem perfekten Matching entsprechen.<br />

<strong>Die</strong>se abstrakt formulierte Idee läßt sich an einem Beispiel verdeutlichen: Sei<br />

A die 3 3 Matrix<br />

0 1<br />

@ a 11 a 12 0<br />

0 a 22 a 23<br />

0 a 32 a 33<br />

Dann n<strong>im</strong>mt der Graph G =(X [ Y;E) die Gestalt<br />

A : (3.27)


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 26<br />

x 1<br />

x 2<br />

s<br />

s y<br />

H 1<br />

HHHHH<br />

<br />

s<br />

s y<br />

H 2<br />

HHHHH<br />

x 3<br />

s <br />

s<br />

y 3<br />

an und es lassen sich 3 perfekte Matchings M 1 ;M 2 ;M 3 finden 3 :<br />

x 1<br />

x 2<br />

x 3<br />

s<br />

s<br />

s<br />

s y 1<br />

s<br />

s y 2<br />

M 1<br />

y 3<br />

x 1<br />

x 2<br />

x 3 H s<br />

s<br />

s<br />

s y 1<br />

s y 2<br />

s<br />

H<br />

HHHH<br />

<br />

M 1<br />

y 3<br />

x 1<br />

x 2<br />

x 3 H<br />

HHHH<br />

s s<br />

s<br />

s<br />

s y 1<br />

s y 2<br />

M 1<br />

y 3<br />

In dem Artikel von ITAI ET AL. [?] wird nun ein (<strong>im</strong> Detail sehr komplizierter) Algorithmus<br />

vorgestellt, der für einen vorgegebenen bipartiten Graph alle perfekten<br />

Matchings mit einem Berechnungsaufwand von<br />

O(e( p n + m)) (3.28)<br />

findet, wobei e die Anzahl der Kanten m die Anzahl der perfekten Matchings und<br />

n die Anzahl der zu permutierenden Elemente angibt.<br />

Welche Werte e und m annehmen, hängt davon ab, wie viele der Permutationenzuberücksichtigen<br />

sind d.h. wie viele der n 2 Komponenten der Matrix verschwinden.<br />

Falls keine Komponente verschwindet, entspricht jede Permutation einem<br />

möglichen perfekten Matching und jedes Matching hat n Kanten. Damit ist<br />

m = n! und e = n n!, der Rechenaufwand steigt also wie bei der Definition<br />

wieder mit der Fakultät von n an.<br />

Für eine Matrix, bei der einige Komponenten verschwinden, sieht dies etwas<br />

anders aus: Wird für einen festen Index i die Anzahl der möglichen Partnerindizes<br />

j,für die a ij 6=0gilt, mit f i bezeichnet, so ergibt sich für die Anzahl der möglichen<br />

Kanten<br />

e =<br />

nY<br />

i=1<br />

(n , f i ): (3.29)<br />

Für die Anzahl m der perfekten Matchings d.h. die Anzahl der zulässigen Permutationen<br />

kann keine geschlossene Formel angegeben werden. Es wurde aber <strong>im</strong><br />

3 Wie sich solche Graphen finden lassen, daß ist gerade ein ein aktuelles Forschungsgebiet in der<br />

Graphentheorie. Bei kleinen Graphen bleibt nur der Weg des Ausprobierens ...


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 27<br />

Rahmen der Graphentheorie gezeigt, daß für sogenannte dichte Graphen (engl.:dense<br />

graphs) prinzipiell eine Berechnung der perfekten Matchings mit einem polynomialen<br />

Aufwand in n möglich ist und es gibt Hinweise darauf, daß Algorithmen<br />

von der hier vorgestellten Art dieses Kriterium erfüllen [?].<br />

3.2.4 Das KKLLL-Näherungsverfahren<br />

Bei dem KKLLL–Verfahren, das nach seinen Erfindern KARMARKAR, KARP,<br />

LIPTON, LOVÁSZ und LUBY benannt ist, handelt es sich um einen Monte–Carlo–<br />

Algorithmus zur näherungsweisen Berechnung der <strong>Permanente</strong> einer nichtnegativen<br />

Matrix [?]. <strong>Die</strong>ses Verfahren ist auch für die Berechnung der <strong>Permanente</strong> <strong>im</strong><br />

<strong>Pfadintegral</strong> interessant, da diese — wie später noch näher erläutert wird — ebenfalls<br />

nichtnegativ ist.<br />

Das Besondere an diesem Algorithmus ist es, daß er für eine n n Matrix A<br />

mit nichtnegativen Komponenten und zwei vorgegebenen positiven Parametern <br />

und einen Schätzwert Y für perA ermittelt, der die Bedingung<br />

Pr [(1 , )perA Y (1 + )perA] 1 , (3.30)<br />

erfüllt 4 und eine Laufzeit von der Ordnung<br />

<br />

<br />

<br />

O 2 n=2 1 1<br />

2 log poly(n)<br />

<br />

(3.31)<br />

hat. Damit ist die Laufzeit dieses Algorithmus für nichtnegative Matrizen <strong>im</strong> wesentlichen<br />

die Wurzel aus der Laufzeit für das Ryser–Verfahren (Abschnitt 3.2.2).<br />

Das KKLLL-Verfahren läßt sich am besten verstehen, wenn zunächst ein einfacheres<br />

Verfahren nach GODSIL/GUTMAN betrachtet wird, das von der Ähnlichkeit<br />

zwischen Determinanten und <strong>Permanente</strong>n Gebrauch macht.<br />

Sei A eine n n Matrix mit nichtnegativen Komponenten a ij und sei S <br />

S n die Menge aller Permutationen von f1;::: ;ng so daß a i(i) 6= 0 für alle<br />

i = 1;::: ;n. Es gibt also eine 1–1–Abbildung von Termen, die zur <strong>Permanente</strong><br />

beitragen und Permutationen in S.<br />

Weiter sei für alle 2 S die Größe<br />

sgn () =(,1) t (3.32)<br />

definiert, wobei t die Anzahl der Elementarpermutationen bezeichne aus denen <br />

besteht. Damit folgt<br />

det A =<br />

perA =<br />

X<br />

2S<br />

X<br />

sgn()<br />

nY<br />

2S i=1<br />

nY<br />

i=1<br />

a i(i) (3.33)<br />

a i(i) ; (3.34)<br />

4 Mit Pr[] ist hier die Wahrscheinlichkeit für das Eintreten des Ereignisses gemeint.


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 28<br />

mit nur noch nichtverschwindenden Summanden — <strong>im</strong> Gegensatz zur Definition.<br />

<strong>Die</strong> Grundidee des Godsil/Gutman–Verfahrens:<br />

Sei für alle nichtverschwindenden Matrixelemente a i(i) 6=0zufällig eine Zahl b ij<br />

aus den zwei Wurzeln f p a ij ; , p a ij g gewählt. Mit Hilfe dieser Zufallszahlen läßt<br />

Q n<br />

sich eine Familie von paarweise unabhängigen Zufallsvariablen x :=<br />

i=1 b i(i)<br />

erzeugen.<br />

,P<br />

Für den Erwartungswert von<br />

2S sgn() x 2<br />

findet sich nun aber<br />

2<br />

E 4 X ! 2<br />

3<br />

X<br />

sgn() x <br />

5 <br />

= E sgn 2 () x 2 <br />

2S<br />

2S<br />

X<br />

+<br />

1 ; 2 2S<br />

1 6= 2<br />

sgn( 1 )sgn( 2 ) E [x 1 x 2 ] (3.35)<br />

Der erste Term in Gleichung (3.35) ergibt mit der Definition der x und unter<br />

Berücksichtigung von sgn 2 () =1gerade die <strong>Permanente</strong> der Matrix A:<br />

X<br />

2S<br />

E sgn 2 () x 2 <br />

<br />

=<br />

X<br />

nY<br />

2S i=1<br />

(b i(i) ) 2 =<br />

X<br />

nY<br />

2S i=1<br />

a i(i) =perA:<br />

(3.36)<br />

Der zweite Term in Gleichung (3.35) verschwindet, da die Zufallsvariablen<br />

fx ; 2 Sg paarweise unabhängig sind und somit E[x 1 x 2 ]=0für 1 6= 2 .<br />

Identifizieren wir nun noch<br />

det B =<br />

X<br />

2S<br />

so folgt aus Gleichung (3.35) die Formel<br />

E<br />

sgn() x ; (3.37)<br />

h<br />

(det B) 2i =perA: (3.38)<br />

Der Godsil/Gutman–Est<strong>im</strong>ator Y für die <strong>Permanente</strong> einer nichtnegativen Matrix<br />

A läßt sich also algorithmisch wie folgt best<strong>im</strong>men:<br />

1. Aus der Matrix A wird nach folgender Vorschrift eine n n Matrix B konstruiert:<br />

(a) Wenn a ij =0,dannb ij := 0.<br />

(b) Sonst wähle zufällig und unabhängig für b ij eine der beiden Wurzeln<br />

f p a ij ; , p a ij g.<br />

2. Y := (det B) 2 .<br />

Der KKLLL–Algorithmus basiert auf einem besseren Est<strong>im</strong>ator für die <strong>Permanente</strong>,<br />

der aber nach demselben Prinzip wie der Godsil/Gutman–Est<strong>im</strong>ator gebildet<br />

wird.


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 29<br />

Seien<br />

p p<br />

w 0 =1; w 1 = , 1 3<br />

2 + i; w 2 = , 1 3<br />

, i (3.39)<br />

4 2 4<br />

die drei komplexen kubischen Wurzeln der Eins. Der KKLLL–Est<strong>im</strong>ator Z berechnet<br />

sich wie folgt:<br />

1. Aus der Matrix A wird nach folgender Vorschrift eine n n Matrix B konstruiert:<br />

(a) Wenn a ij =0,dannb ij := 0.<br />

(b) Sonst wähle zufällig und unabhängig b ij 2f p a ij w 0 ; p a ij w 1 ; p a ij w 2 g<br />

mit der Wahrscheinlichkeit 1=3 für jede Wahl.<br />

2. Z := det B (det B) <br />

Daß der KKLLL–Est<strong>im</strong>ator Z ebenfalls einen Schätzwert für die <strong>Permanente</strong><br />

von A liefert, läßt sich wie be<strong>im</strong> Godsil/Gutman–Est<strong>im</strong>ator zeigen.<br />

Der Beweis, daß der KKLLL–Est<strong>im</strong>ator Z tatsächlich eine (; )–Approx<strong>im</strong>ation<br />

für die <strong>Permanente</strong> gemäß Gl. (3.30) und (3.31) liefert, ist <strong>im</strong> Detail sehr technisch<br />

und deshalb wird an dieser Stelle nur die Grundidee skizziert.<br />

Der KKLLL–Algorithmus liefert nach N unabhängigen Versuchen einen Schätzwert<br />

1<br />

N<br />

NX<br />

i=1<br />

Z i (3.40)<br />

für die <strong>Permanente</strong>, wobei Z i das Ergebnis des i–ten Versuchs sei. Mit der Tschebyscheffschen<br />

Ungleichung folgt, daß<br />

N = E[Z2 ]<br />

1<br />

(3.41)<br />

(E[Z]) 2 2 <br />

genügt, damit Z eine (; )–Approx<strong>im</strong>ation für die <strong>Permanente</strong> ist. Nun ist es<br />

möglich, für diesen Algorithmus zu zeigen, daß der Quotient der Erwartungswerte<br />

nach oben beschränkt ist:<br />

E[Z 2 ]<br />

(E[Z]) 2 2n=2 ; (3.42)<br />

und damit wäre der Beweis beendet.<br />

3.3 Eigene Versuche zur Berechnung der <strong>Permanente</strong><br />

3.3.1 Eigenschaften der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong><br />

In diesem Abschnitt sollen die spezifischen mathematischen Eigenschaften der <strong>Permanente</strong><br />

von der <strong>im</strong> <strong>Pfadintegral</strong> auftauchenden Matrix A( +1;) näher untersucht<br />

werden.


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 30<br />

Laut Gleichung (2.28) hat die Matrix A( +1;) die Gestalt<br />

(A) ij = exp , , (~x i , ~y j ) 2 i; j =1;::: ;N (3.43)<br />

wobei <strong>im</strong> folgenden die Abkürzungen<br />

m<br />

= M 3=2<br />

; (3.44)<br />

2~ 2 <br />

m = M 2~ 2 = 2=3 ; (3.45)<br />

~x i = ~r i ( +1); (3.46)<br />

~y j = ~r j (); (3.47)<br />

benutzt werden sollen.<br />

Zunächst läßt sich feststellen, daß die Matrix A nicht symmetrisch ist, da ~x i<br />

und ~y j auf zwei benachbarten Zeitscheiben liegen und daß<br />

Rang A = N (3.48)<br />

gilt. Es gibt aber eine Art verborgene Symmetrie, denn die N 2 Komponenten von<br />

A werden durch nur 2N Koordinatenvektoren ~x i ;~y j 2 R 3 erzeugt.<br />

Betrachten wir nun die Komponenten der Matrix <strong>im</strong> einzelnen. Aus (3.44) und<br />

(3.45) folgt, daß und für Temperaturen über dem absoluten Nullpunkt <strong>im</strong>mer<br />

positiv sind. Mit der Nichtnegativität des Skalarproduktes (~x i , ~y j ) 2 ergibt sich,<br />

daß die möglichen Matrixkomponenten (A) ij aus dem Wertebereich der Funktion<br />

stammen, d.h.<br />

u ,! e ,u2 ; u 2 R0 (3.49)<br />

(A) ij 2 ]0; 1] i; j =1;::: ;N: (3.50)<br />

<strong>Die</strong> Matrix A ist mathematisch formuliert also nichtnegativ und finit d.h. für<br />

N ! 1 gilt perA N !. Im Gegensatz zur Determinante übeträgt sich diese<br />

Eigenschaft der Matrix auch auf die <strong>Permanente</strong> von A.<br />

Wenden wir uns nun der <strong>Permanente</strong> von A zu. In einem ersten Schritt läßt sich<br />

die Multilinearität der <strong>Permanente</strong> als algebraische Abbildung ausnutzen. Für jede<br />

Komponente von A gilt<br />

(A) ij = exp , , (~x i , ~y j ) 2 (3.51)<br />

= exp , , (~x 2 i + ~y2 j ) exp (+2 ~x i ~y j ) : (3.52)<br />

Da die <strong>Permanente</strong> linear in jeder Zeile und Spalte ist, kann in jeder Zeile<br />

von A ein Faktor exp(,~x 2 i ) und in jeder Spalte ein Faktor exp(,~y2 j ) vor die<br />

<strong>Permanente</strong> geholt werden. Damit folgt für perA sofort<br />

per A =() N N Y<br />

i=1<br />

exp , , (~x 2 i + ~y2 i )! perB; (3.53)


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 31<br />

wobei die Matrix B definiert ist durch<br />

(B) ij = exp (+2 ~x i ~y j ) i; j =1;::: ;N: (3.54)<br />

Es ist also ”<br />

nur noch“ die <strong>Permanente</strong> der Matrix B zu best<strong>im</strong>men. Formal–<br />

mathematisch gesehen ist dies sehr einfach:<br />

perB =<br />

=<br />

X<br />

Y<br />

N<br />

exp (2 ~x i ~y Pi ) (3.55)<br />

P 2S N i=1<br />

!<br />

X NX<br />

exp 2 ~x i ~y Pi : (3.56)<br />

P 2S N i=1<br />

Für praktische Anwendungen ist der Ausdruck (3.56) jedoch unbrauchbar, da<br />

zur Berechnung der Permutationssumme die Exponentialfunktion N ! mal numerisch<br />

ausgewertet werden müßte, was schon für kleine N zu illusorischen Berechnungszeiten<br />

führen würde.<br />

Andererseits zeigt Gleichung (3.56) auch, daß es nicht möglich sein wird, einen<br />

exakten Ausdruck für perB — und damit für perA — zu best<strong>im</strong>men, der nicht die<br />

Summe über alle Permutationen enthält.<br />

<strong>Die</strong>s liegt ganz einfach daran, daß es für jede der N ! verschiedenen Permutationen<br />

einen eindeutigen Exponenten<br />

NX<br />

i=1<br />

2 ~x i ~y Pi (3.57)<br />

gibt, der sich von allen anderen (N !,1) möglichen Exponenten unterscheidet. Das<br />

N !–fache Auswerten der Exponentialfunktion pro Berechnung der <strong>Permanente</strong> ist<br />

also nicht zu vermeiden !<br />

3.3.2 Mathematisch motivierter Näherungsversuch<br />

Da es nicht möglich ist, einen exakten Ausdruck für die <strong>Permanente</strong> der Matrix A<br />

(bzw. der Matrix B) herzuleiten, der eine effiziente Berechnung ermöglicht, ist es<br />

wünschenswert, zumindestens einen Näherungsausdruck für perA (bzw. per B)<br />

zu erhalten.<br />

Eine solche Näherung per ~ A soll zum einen natürlich die Struktur des exakten<br />

mathematischen Ausdrucks perA soweit vereinfachen, daß eine effiziente Berechnung<br />

der Näherung per ~ A möglich ist. Des weiteren ist zu beachten, daß durch die<br />

physikalische oder mathematisch motivierte Näherung nicht zu viel von der physikalischen<br />

Information verlorengeht, die in dem ursprünglichen, exakten Ausdruck<br />

enthalten war.<br />

Ein erster, mathematisch motivierter Näherungsansatz besteht darin, die Exponentialfunktion<br />

in den einzelnen Komponenten der Matrix B in Potenzreihen zu


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 32<br />

entwickeln. Beschränken wir uns <strong>im</strong> folgenden auf ein eind<strong>im</strong>ensionales System,<br />

so liefert eine solche Näherung bis zur Ordnung l<br />

(B) ij =<br />

lX<br />

k=0<br />

1<br />

k! (x i) k (y j ) k : (3.58)<br />

Im Falle des fermionischen <strong>Pfadintegral</strong>es wurde von BORRMANN gezeigt, daß<br />

sich mit dieser Näherung die Determinante der Matrix B mit O(N 2 ) Multiplikationen<br />

berechnen läßt [?].<br />

<strong>Die</strong> Näherungsmatrix B ~ läßt sich nämlich in ein Produkt RST aus zwei Vandermonde–Matrizen<br />

R; T und einer Diagonalmatrix S zerlegen:<br />

~B =<br />

0<br />

B<br />

@<br />

1 x 1 x 2 1<br />

<br />

1 x 1 x 2 1<br />

<br />

. . . .<br />

1 x 1 x 2 1<br />

<br />

10<br />

C<br />

A<br />

B<br />

@<br />

1<br />

0!<br />

1<br />

0 0 <br />

1<br />

0 0 <br />

1!<br />

1<br />

0 0 C<br />

2! A<br />

.<br />

. . . ..<br />

0<br />

B<br />

@<br />

1 1 1<br />

y 1 y 2 y N<br />

y1 2 y2 2 yN<br />

2<br />

.<br />

.<br />

.<br />

.<br />

1<br />

C<br />

A (3.59)<br />

Durch die für die Determinante erlaubte Produktzerlegung ergibt sich für det ~ B<br />

der Ausdruck<br />

det ~ B = det R det S det T (3.60)<br />

=<br />

Y<br />

1j


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 33<br />

Es gibt nun ein abstraktes Reduktionskriterium für Irreduzibilität, daß sich<br />

glücklicherweise sehr gut für eine algorithmische Umsetzung eignet. <strong>Die</strong>s ermöglicht<br />

es, mit den schon oben erwähnten Computeralgebra–Systemen eine eindeutige<br />

Aussage darüber zu machen, ob ein konkretes multivariates Polynom irreduzibel<br />

ist, oder nicht [?].<br />

Werden nun für n = 3; 4; 5 die entsprechenden Polynome für die <strong>Permanente</strong><br />

und für die Determinante berechnet, so lautet die eindeutige Antwort der<br />

Computeralgebra–Systeme, daß die von der Determinante stammenden Polynome<br />

reduzibel und die von der <strong>Permanente</strong> stammenden irreduzibel sind.<br />

<strong>Die</strong> Ursache für das unterschiedliche Verhalten von det ~ B und per ~ B kann nur<br />

darin begründet liegen, daß es bei der Determinante durch die auftretenden negativen<br />

Vorzeichen zur Auslöschung von Termen innerhalb des Polynoms kommt.<br />

<strong>Die</strong>ses Ergebnis ist nun kein mathematischer Beweis dafür, daß sich per ~ B<br />

auch für n > 5 nicht faktorisieren läßt, aber dieses Resultat macht eine solche<br />

Vermutung unwahrscheinlich.<br />

Ein weiteres Argument dafür, warum sich det ~ B und per ~ B so unterschiedlich<br />

verhalten müssen, ergibt sich, indem die Multilinearität von Determinante und<br />

<strong>Permanente</strong> ausgenutzt wird, um die Summanden in jeder Komponente von (3.58)<br />

auseinanderzuziehen.<br />

Durch die Linearität in der 1–ten Zeile wird per ~ B so in eine Summe von l +1<br />

<strong>Permanente</strong>n zerlegt. Wird bei jeder dieser Matrizen die Linearität in der 2–ten<br />

Zeile ausgenutzt, so ergibt sich für per ~ B eine Summe von (l +1) 2 <strong>Permanente</strong>n.<br />

Insgesamt erhalten wir durch dieses Vorgehen die Formel<br />

per ~ B =<br />

(l+1)<br />

X<br />

N<br />

q=1<br />

per C q ; (3.62)<br />

wobei die Komponenten der l N Matrizen C q durch die Summanden der Exponentialreihe<br />

gebildet werden.<br />

<strong>Die</strong> Anzahl der in der Summe (3.62) zu berechnenden <strong>Permanente</strong>n steigt exponentiell<br />

in der Matrixgröße N an, falls nicht von vornherein viele der <strong>Permanente</strong>n<br />

nur einen Nullbeitrag liefern.<br />

<strong>Die</strong>s ist jedoch unwahrscheinlich, da die Komponenten der exakten Matrix B<br />

größer Null sind und durch die Näherung nur wenige Komponenten der Matrix B ~<br />

verschwinden werden. Damit die <strong>Permanente</strong> einer nichtnegativen N N–Matrix<br />

null wird, darf die Matrix selbst aber nicht mehr als N , 1 Komponenten verschieden<br />

von der Null haben, damit in Gleichung (3.2) alle Summanden einzeln zu Null<br />

werden.<br />

Für Determinanten stellt sich dieser Sachverhalt vorteilhafter dar, denn für alle<br />

C q mit Rang C q


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 34<br />

verschieden von allen anderen Potenzen in den anderen N , 1 Zeilen sind, z.B.<br />

0<br />

B<br />

@<br />

x 1 y 1 x 1 y 2 x 1 y 3 <br />

x 7 2 y7 1<br />

x 7 2 y7 2<br />

x 7 2 y7 3<br />

<br />

1 1 1 <br />

.<br />

.<br />

.<br />

.<br />

1<br />

C<br />

A : (3.63)<br />

Ist die Entwicklungsordnung l =0; 1; 2;::: kleiner als N ,1, so sind nicht genug<br />

verschiedene Potenzen in k =0;::: ;lvorhanden, um die lineare Unabhängigkeit<br />

der Matrixzeilen bzw. Spalten zu gewährleisten und damit<br />

det C q =0 für alle q =1;::: ;(l +1) N : (3.64)<br />

<strong>Die</strong>se Beobachtung liefert einen Hinweis darauf, warum in der Vandermonde–<br />

Zerlegung von det ~ B die Entwicklungsordnung an die Teilchenzahl gekoppelt sein<br />

muß.<br />

3.3.3 Physikalisch motivierter Näherungsversuch<br />

Um zu einer physikalisch motivierten Näherung zu gelangen, betrachten wir wieder<br />

die <strong>Permanente</strong> der Matrix A, in der direkt die Differenzen von Teilchenkoordinaten<br />

eingehen.<br />

Bei einem System von N <strong>Bosonen</strong> in einem Wärmebad der Temperatur T ist<br />

physikalisch zu erwarten, daß sich das System bei hohen Temperaturen T 0<br />

klassisch verhält, also in der <strong>Permanente</strong> die identischen Permutationen den einzigen<br />

wesentlichen Beitrag liefern sollen.<br />

Bei sinkenden Temperaturen werden die Anteile der Permutationen nahe der<br />

Identität an Bedeutung gewinnen und be<strong>im</strong> (nicht erreichbaren) absoluten Temperaturnullpunkt<br />

sollten alle Permutationen eine gleichberechtigte Rolle spielen.<br />

Findet <strong>im</strong> <strong>Pfadintegral</strong> die Permutation der Teilchenindizes zwischen den Zeitscheiben<br />

und +1statt, so bedeutet dies, daß bei hohen Temperaturen nur für<br />

den gleichen Teilchenindex i die Koordinatenabstände<br />

j~r i ( +1), ~r i ()j (3.65)<br />

zwischen den Zeitscheiben klein werden, also nur die Diagonalelemente in der<br />

Matrix A( +1;) wesentlich von Null verschieden sind.<br />

Mit sinkenden Temperaturen tauchen nun vermehrt auch für verschiedene Teilchen<br />

i und j geringere Abstände<br />

j~r i ( +1), ~r j ()j (3.66)<br />

auf, die Nebendiagonalelemente von A( +1;) nehmen also an Bedeutung zu.<br />

Als Näherung bietet es sich offensichtlich an, die unbedeutenden Permutationen<br />

zu vernachlässigen. <strong>Die</strong>se sind ja gerade dadurch charakterisiert, daß für sie


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 35<br />

das Produkt<br />

NY , exp , (~x i , ~y 2 j ) (3.67)<br />

i=1<br />

nur einen sehr unwesentlichen Beitrag zur Summe über alle Permutationen P 2<br />

S N liefert.<br />

Praktisch läßt sich diese Näherung dadurch umsetzen, daß aus der Matrix A eine<br />

Näherungsmatrix ~ A erzeugt wird, indem die zahlenmäßig kleinsten Matrixelemente<br />

dynamisch — d.h. <strong>im</strong> Verlauf der Monte–Carlo–S<strong>im</strong>ulation — gleich Null<br />

gesetzt werden. Damit stellt sich dann auch die Frage, wie sich die <strong>Permanente</strong> der<br />

so erzeugten Matrix ~ A berechnen läßt.<br />

Rückführung auf eine Hessenberg–Matrix<br />

Ein Ansatz könnte daraus bestehen, so viele Elemente der Matrix A auf Null zu setzen,<br />

daß per ~ A durch Vertauschen von Zeilen und Spalten in die <strong>Permanente</strong> einer<br />

Hessenberg–Matrix (3.8) überführt werden kann. Nach Gleichung (3.10) ließe sich<br />

dann die <strong>Permanente</strong> auf die Determinante einer ähnlichen Matrix zurückführen<br />

und mit einem Aufwand O(N 3 ) berechnen.<br />

Nun enthält eine n n Hessenberg–Matrix 1=2 (n , 1)(n , 2) Nullkomponenten<br />

oberhalb der Diagonale, es müssen also mindestens genauso viele Komponenten<br />

in der Matrix A auf Null gesetzt werden. Wie aus Tabelle 3.1 zu entnehmen<br />

ist, muß für größere Matrizen annähernd die Hälfte aller Matrixkomponenten auf<br />

Null gesetzt werden.<br />

n n 2 1=2 (n , 1)(n , 2)<br />

10 100 36<br />

20 400 171<br />

30 900 406<br />

40 1600 741<br />

50 2500 1176<br />

100 10000 4851<br />

500 250000 124251<br />

1000 1000000 498501<br />

Tabelle 3.1: Anzahl der Nullelemente oberhalb der Diagonalen in Abhängigkeit<br />

von der Matrixgröße für eine Hessenberg-Matrix.<br />

<strong>Die</strong> Tatsache, daß die genäherte Matrix ~ A erst durch Zeilen– und Spaltenvertauschungen<br />

in eine Hessenberg–Matrix überführt werden soll, erzwingt, daß nicht<br />

einfach die 1=2 (n , 1)(n , 2) kleinsten Komponenten auf Null gesetzt werden<br />

können ! Denn Zeilenvertauschungen können niemals die Anzahl der Nullen in einer<br />

Spalte ändern und umgekehrt können Spaltenvertauschungen nicht die Zahl der<br />

Nullen in einer Zeile ändern.


KAPITEL 3. MÖGLICHE BERECHNUNGSVERFAHREN ... 36<br />

Der einzig praktikable Weg wäre also der, daß in einem algorithmischen Verfahren<br />

angefangen mit der kleinsten Komponente von A nach und nach die Matrixkomponenten<br />

auf Null gesetzt werden und in jedem Schritt die nötigen Zeilen– und<br />

Spaltenumformungen vorgenommen werden, um die Matrix in die Hessenberg–<br />

Form zu bringen.<br />

Ähnliche Algorithmen sind in der Kombinatorik bekannt [?]. Bei diesen Verfahren<br />

werden die aus dem numerischen Lösen linearer Gleichungssysteme bekannten<br />

Pivotisierungsalgorithmen, bei denen die Zeilen der Koeffizientenmatrix<br />

in eine numerisch günstige Reihenfolge gebracht werden, mit der Backtracking–<br />

Methode kombiniert, die es erlaubt, best<strong>im</strong>mte Zeilenvertauschungen auszuprobieren.<br />

Das Laufzeitverhalten solcher Algorithmen ist ebenfalls polynomial in der<br />

Matrixgröße.<br />

Anwendung graphentheoretischer Algorithmen<br />

Wie <strong>im</strong> vorherigen Abschnitt aufgezeigt wurde, läßt sich selbst durch eine sehr<br />

drastische Näherung, bei der nahezu die Hälfte aller Matrixkomponenten zu Null<br />

gesetzt werden, keine analytische Formel für die <strong>Permanente</strong> angeben.<br />

Deshalb erscheint es naheliegend, von vornherein die Berechnung der <strong>Permanente</strong><br />

der Näherungsmatrix durch ein algorithmisches Verfahren vorzunehmen.<br />

Von den in Abschnitt 3.2 vorgestellten allgemeinen Rechenverfahren hat ja gerade<br />

der graphentheoretische Algorithmus 3.2.3 von ITAI ET. AL. die Eigenschaft,<br />

daß sein Berechnungsaufwand mit steigender Anzahl von Nullkomponenten in der<br />

Matrix abfällt.<br />

3.3.4 Andere Versuche<br />

Ein anderer Versuch, die Berechnung der <strong>Permanente</strong> auf die Berechnung der Determinante<br />

zurückzuführen, macht von der einfach zu beweisenden Formel<br />

(per C) (det C) = det C (2) + f (C) (3.68)<br />

mit<br />

f (C) =<br />

X<br />

; 0 2Gn<br />

6= 0 n Y<br />

i=1<br />

(C) i;(i) (C) i;(i) 0 +<br />

X<br />

; 0 2Un<br />

6= 0 n Y<br />

i=1<br />

(C) i; (i) (C) i; 0 (i)<br />

(3.69)<br />

Gebrauch [?]. In dieser Formel bezeichnet C (2) diejenige Matrix, die aus C entsteht,<br />

indem alle Komponenten quadriert werden und G n (bzw. U n ) die Menge<br />

aller geraden (bzw. ungeraden) Permutationen.<br />

<strong>Die</strong> Berechnung von perC läßt sich nun auf die Berechnung von det C und<br />

det C (2) zurückführen, wenn der Restterm f (C) sich einfach berechnen läßt.<br />

Wird für die Matrix C der Näherungsausdruck ~ B aus Abschnitt 3.3.2 für die<br />

<strong>im</strong> <strong>Pfadintegral</strong> vorkommende Matrix eingesetzt, so ergibt sich ein Restterm f (A),<br />

der für N =3; 4 wieder auf ein irreduzibles Polynom führt.


Kapitel 4<br />

Vergleich der verschiedenen<br />

Berechnungsverfahren<br />

Da es <strong>im</strong> Rahmen dieser Arbeit nicht gelungen ist, eine einfache ”<br />

Formel“ zu finden,<br />

die eine effiziente Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>thermodynamischen</strong> <strong>Pfadintegral</strong><br />

gestattet, bleibt uns an dieser Stelle nur die Betrachtung der algorithmischen<br />

Lösungsansätze.<br />

Von den vorgestellten Verfahren zur Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>thermodynamischen</strong><br />

<strong>Pfadintegral</strong> ist bis heute das von NIJENHUIS und WILF verbesserte<br />

Verfahren nach RYSER mit einem Aufwand von der Ordnung O((n , 1)2 n,1 )<br />

<strong>im</strong>mer noch die schnellste Methode, um die <strong>Permanente</strong> exakt zu berechnen.<br />

Mit dem KKLLL–Verfahren ist es dagegen möglich, die <strong>Permanente</strong> näherungsweise<br />

durch den Mittelwert vieler Determinanten anzunähern. <strong>Die</strong> Güte dieser<br />

Näherung wird dabei durch die Anzahl l der berechneten Determinanten best<strong>im</strong>mt,<br />

womit der Aufwand des KKLLL–Verfahrens in der Größenordnung von<br />

l n 3 liegt.<br />

In Abbildung 4.1 ist der Rechenaufwand für das Ryser–Verfahren und verschieden<br />

genaue KKLLL–Näherungen in Abhängigkeit von der Matrixgröße n aufgetragen.<br />

Von Interesse ist nun, ab welcher Matrixgröße N das Ryser–Verfahren einen<br />

größeren Berechnungsaufwand als die anderen Verfahren hat. Der Wert für n,<br />

bei dem zwei Verfahren denselben Rechenaufwand haben, wird auch als ”<br />

Break–<br />

Even–Point“ der Verfahren bezeichnet.<br />

In der Abbildung ist zu erkennen, daß das Ryser–Verfahren bis zu n =6einen<br />

geringeren Aufwand als die KKLLL–Näherung mit l = 1 hat. Der Wert l = 1<br />

<strong>im</strong>pliziert die Berechnung einer einzigen Determinante und entspricht damit auch<br />

dem Berechnungsaufwand für den fermionischen Fall.<br />

Für größere n führt der exponentiell ansteigende Rechenaufwand zu einem<br />

unakzeptablen Laufzeitverhalten. Bei einem Wert von n = 13, der physikalisch<br />

z.B. bei der ersten vollständigen Ikosaederkonfiguration eines Edelgasclusters von<br />

Interesse ist, hat das Ryser–Verfahren bereits einen um einen Faktor 23 höheren<br />

37


KAPITEL 4. VERGLEICH DER BERECHNUNGSVERFAHREN... 38<br />

Rechenaufwand<br />

10 10<br />

10 8<br />

10 6<br />

10 4<br />

10 2<br />

10 0<br />

Ryser<br />

KKLLL (l=1)<br />

KKLLL (l=10)<br />

KKLLL (l=100)<br />

KKLLL (l=1000)<br />

0 5 10 15 20<br />

n<br />

Abbildung 4.1: Vergleich des Rechenaufwands für das Ryser–Verfahren und das<br />

KKLLL–Verfahren. Für das KKLLL–Verfahren sind verschiedene Werte des Parameters<br />

l eingezeichnet.<br />

Berechnungsaufwand als bei der Determinante.<br />

Im Gegensatz dazu ist die Laufzeit der KKLLL–Näherung ”<br />

nur“ um den konstanten<br />

Faktor l länger als be<strong>im</strong> fermionischen Fall. Wählen wir den Faktor sehr<br />

groß, z.B. l = 1000, so hat diese Näherung schon ab n =20einen geringeren Aufwand<br />

als das Ryser–Verfahren. Für einen absolut unrealistischen Wert von l =10 7<br />

ist der Break–Even–Point mit dem Ryser–Verfahren <strong>im</strong>mer noch erstaunlich niedrig,<br />

er liegt bei n =35.<br />

Entscheidend ist be<strong>im</strong> KKLLL–Verfahren, wie bei der Berechnung der <strong>Permanente</strong><br />

in der <strong>Pfadintegral</strong>–Monte–Carlo–Methode die Laufzeit und die Genauigkeit<br />

der berechneten Erwartungswerte von der Größe des Faktors l beeinflußt werden.<br />

Dazu haben wir numerische Tests an einem System aus 4 eind<strong>im</strong>ensionalen bosonischen<br />

harmonischen Oszillatoren durchgeführt, das durch den Hamilton–Operator<br />

^H =<br />

n=4<br />

X<br />

i=1<br />

d 2<br />

, 1 2 dx 2 i<br />

+ 1 2 x2 i (4.1)<br />

beschrieben wird, wobei ~ und die Teilchenmassen auf 1 gesetzt wurden.<br />

In einer FORTRAN90–Implementation des in Abschnitt 2.4 beschriebenen<br />

PIMC–Verfahrens haben wir zunächst das exakte Ryser–Verfahren verwendet, um<br />

für mehrere Temperaturen die Erwartungswerte der potentiellen und kinetischen<br />

Energien des Systems zu berechnen. Für jede der hier angesprochenen Berechnungen<br />

eines Erwartungswertes wurde M T = 4 gewählt und 200 000 Iterationen<br />

durchgeführt.<br />

Wie Abbildung 4.2 zeigt, st<strong>im</strong>mt das Ergebnis dieser Berechnungen gut mit


KAPITEL 4. VERGLEICH DER BERECHNUNGSVERFAHREN... 39<br />

Energie<br />

1.6<br />

1.4<br />

1.2<br />

1.0<br />

exakt<br />

E kin<br />

Ryser<br />

E pot<br />

Ryser<br />

E kin<br />

KKLLL (l=10)<br />

E pot<br />

KKLLL (l=10)<br />

0.0 0.5 1.0<br />

T / k B<br />

Abbildung 4.2: Energien be<strong>im</strong> eind<strong>im</strong>ensionalen bosonischen harmonischen Oszillator<br />

für n = 4 mit verschiedenen Verfahren zur Berechnung der <strong>Permanente</strong>.<br />

Es wurde ~ = m i = 1 gesetzt und M= = 4 gewählt. Für jeden Punkt wurden<br />

200 000 Iterationen durchgeführt.<br />

den analytisch berechneten Erwartungswerten [?]<br />

E kin = E pot =<br />

n=4<br />

X<br />

i=1<br />

<br />

i i<br />

4 coth 2T<br />

<br />

, 3 2<br />

(4.2)<br />

überein.<br />

Für eine Temperatur T=k B = 1 haben wir Berechnungsversuche mit dem<br />

KKLLL–Verfahren für verschiedene l unternommen. Bei der sehr niedrigen Wahl<br />

von l =10ist der relative Fehler in den Energien erwartungsgemäß groß, er liegt<br />

bei 6% für E kin und bei 11% für E pot .<br />

<strong>Die</strong> Rechenzeit, die für die Berechnung dieser beiden Erwartungswerte benötigt<br />

wurde, lag auf einer IBM–AIX P70 Workstation mit 64 MB Hauptspeicher schon<br />

bei 26:5 CPU–Stunden ! Weitere Berechnungsversuche mit l = 20 und l = 30<br />

wurden wegen der schon bei so geringen Teilchenzahlen unvertretbar hohen Laufzeiten<br />

abgebrochen.<br />

<strong>Die</strong> theoretische Betrachtung des Rechenaufwands und die praktischen Versuche<br />

zum Laufzeitverhalten legen nahe, daß auch das KKLLL–Verfahren keine<br />

Alternative zur effizienten Berechnung <strong>im</strong> <strong>Pfadintegral</strong> bietet.<br />

Als weitere Möglichkeit zur Berechnung der <strong>Permanente</strong> bleibt noch der physikalisch<br />

motivierte Ansatz, nicht die <strong>Permanente</strong> der Matrix A( +1;) zu nähern,<br />

sondern zuerst eine geeignete Näherung für die Matrix selbst durchzuführen, von<br />

der die <strong>Permanente</strong> dann exakt berechnet werden kann.<br />

Von den beiden in Kapitel 3.3.3 dazu entwickelten Ideen erscheint uns die Verwendung<br />

des graphentheoretischen Ansatzes, bei dem genügend viele der kleinsten


KAPITEL 4. VERGLEICH DER BERECHNUNGSVERFAHREN... 40<br />

Matrix–Elemente zu Null gesetzt werden, als besonders vielversprechend, denn<br />

laut CEPERLEY [?] sind gerade Permutationen mit einem Austausch von 2; 3 und<br />

4 Teilchen besonders wichtig.<br />

Definitive Aussagen über das Laufzeitverhalten des KKLLL–Verfahrens und<br />

des graphentheoretischen Näherungsverfahrens lassen sich aber nur durch eine systematische<br />

Untersuchung mit physikalisch relevanten Systemen gewinnen. Insbesondere<br />

ist dazu auch der Vergleich mit dem als Standardmethode verwendeten<br />

Importance Sampling of Permutations“ durchzuführen.<br />

”<br />

Es empfiehlt sich also folgendes weitere Vorgehen:<br />

Eine weitere Suche nach einer einfachen ”<br />

Formel“ für die <strong>Permanente</strong> erscheint<br />

nicht sinnvoll.<br />

Wegen des enormen Rechenzeitbedarfs bei PIMC sollten alle Programme in<br />

einer parallelisierten, für Großrechner geeigneten Form erstellt werden.<br />

Es ist eine PIMC–Version mit einem ”<br />

Importance Sampling of Permutations“<br />

zu erstellen. Damit stünde eine Version dieses Standardverfahrens für<br />

Vergleichsrechnungen zur Verfügung.<br />

Es ist eine PIMC–Version mit einem austauschbaren Modul zur Berechnung<br />

der <strong>Permanente</strong> zu erstellen.<br />

Für kleinere Systeme (n 10)könnte für dieses Modul das Ryser–Verfahren<br />

benutzt werden.<br />

Der graphentheoretische Algorithmus sollte <strong>im</strong>plementiert werden. Als Vorlage<br />

kann ein ähnliches Programm [?] zum Matchen von Graphen verwendet<br />

werden. Zu untersuchen wäre das Laufzeitverhalten in Abhängigkeit von der<br />

Genauigkeit und ob dieses Verfahren ergodisch ist.


Kapitel 5<br />

Zusammenfassung<br />

In Teil I dieser Arbeit wurde nach einer Möglichkeit gesucht, wie sich die Berechnung<br />

von <strong>thermodynamischen</strong> <strong>Pfadintegral</strong>en von <strong>Viel</strong>–<strong>Bosonen</strong>–Systemen verbessern<br />

läßt.<br />

Es wurde der Formalismus der <strong>Pfadintegral</strong>e dargestellt und es wurde erläutert,<br />

daß die numerische Berechnung von Erwartungswerten bei bosonischen <strong>Pfadintegral</strong>en<br />

einen sehr viel höheren Aufwand erfordert als bei fermionischen <strong>Pfadintegral</strong>en.<br />

Als Ursache dafür wurde die bei bosonischen <strong>Pfadintegral</strong>en zu berechnende<br />

<strong>Permanente</strong> einer Matrix A( +1;) erkannt und es wurde erklärt, wie sich<br />

die Berechnung der <strong>Permanente</strong> durch ein ”<br />

Importance Sampling of Permutations“<br />

umgehen läßt.<br />

Nachdem die wichtigsten der in der Mathematik bekannten allgemeinen Berechnungsverfahren<br />

für <strong>Permanente</strong>n vorgestellt wurden, wurden eigene Versuche<br />

zur Berechnung der <strong>Permanente</strong> <strong>im</strong> <strong>Pfadintegral</strong> unternommen.<br />

Es wurde aufgezeigt, warum es keine effiziente Formel für die Berechnung dieser<br />

speziellen <strong>Permanente</strong> gibt und es wurden Argumente angeführt, warum auch<br />

keine Näherungsformel wie für die Determinante <strong>im</strong> fermionischen <strong>Pfadintegral</strong><br />

möglich ist.<br />

Ausgehend von den in der Literatur gewonnen Erkenntnissen über die Bedeutung<br />

der Permutationen be<strong>im</strong> ”<br />

Importance Sampling“ wurde schließlich eine physikalisch<br />

motivierte Näherung der Matrix A( +1;) vorgeschlagen, die zusammen<br />

mit einem graphentheoretischen Algorithmus eventuell eine effiziente näherungsweise<br />

Berechnung der <strong>Permanente</strong> <strong>im</strong> bosonischen <strong>Pfadintegral</strong> gestatten würde.<br />

<strong>Die</strong> Anwendbarkeit dieses Vorschlags bleibt noch zu untersuchen.<br />

41


Teil II<br />

Best<strong>im</strong>mung von<br />

Phasenübergängen aus<br />

exper<strong>im</strong>entellen Streuspektren<br />

atomarer Cluster<br />

42


Kapitel 6<br />

Einleitung<br />

Mit dem Konzept der Phasenübergänge wird in der Thermodynamik die strukturelle<br />

Umwandlung makroskopischer Systeme — d.h. Systeme mit unendlich vielen<br />

Freiheitsgraden — beschrieben. Solche strukturellen Umwandlungen sind in der<br />

Regel mit abrupten Änderungen von <strong>thermodynamischen</strong> Zustandsgrößen oder anderen<br />

geeigneten Ordnungsparametern verbunden.<br />

Mesoskopische Systeme besitzen dagegen nur eine endliche Anzahl von Freiheitsgraden,<br />

was dazu führt, daß die Ordnungsparameter von Strukturumwandlungen<br />

ein weicheres Änderungsverhalten zeigen und sich der Begriff der ”<br />

Phase“ des<br />

Systems nicht mehr präzise definieren läßt.<br />

Anfang der 80er Jahre wurde durch numerische S<strong>im</strong>ulationsrechnungen gezeigt,<br />

daß es bei atomaren und molekülaren Clustern Übergänge zwischen den bei<br />

tiefen Temperaturen vorherrschenden starren Strukturen und den strker fluktuierenden<br />

Strukturen bei höheren Temperaturen gibt, die sich als Übergänge zwischen<br />

verschiedenen Cluster–Isomeren deuten lassen [?].<br />

<strong>Die</strong>se Strukturverwandlungen von atomaren Clustern äußern sich ähnlich wie<br />

bei makroskopischen Phasenübergängen durch deutlich erkennbare Änderungen in<br />

dem Verhalten geeigneter Observablen: eine Stufe in der kalorischen Zustandsgleichung,<br />

ein plötzliches Ansteigen der spezifischen Wärme, makroskopische Änderungen<br />

in den relativen Abständen zu den nächsten Nachbarn mit steigender Temperatur<br />

usw.<br />

In Analogie zu den fest–flüssig–Phasenübergängen in kondensierter Materie<br />

wurde durch BERRY ET AL. einphänomenologisches Modell zur Erklärung dieser<br />

S<strong>im</strong>ulationsrechnungen eingeführt [?, ?]. Darin werden unterschiedliche Temperaturen<br />

für den Schmelz– und Gefrierpunkt definiert, wodurch ein Übergangsbereich<br />

zwischen fester und flüssiger Phase definiert wird — der sogenannte Koexistenzbereich.<br />

Als besonders geeignete Verfahren für die Untersuchung von Clusterstrukturen<br />

haben sich Beugungsexper<strong>im</strong>ente mit Elektronen–, Röntgen– oder Neutronenstrahlen<br />

herausgestellt [?]. Sie haben den großen Vorteil, daß sich die Beugungsintensität<br />

aus den gemessenen Streuspektren als räumliche Fourier–Transformierte<br />

43


KAPITEL 6. EINLEITUNG 44<br />

einer Observablen der statistischen Physik — der Paarkorrelationsfunktion — interpretieren<br />

läßt.<br />

Das Standardverfahren zur Analyse der so gemessenen Streuspektren besteht<br />

darin, für vorgegebene Clustergeometrien über numerische Molekulardynamik–<br />

oder Monte–Carlo–Rechnungen theoretische Streuspektren zu berechnen und diese<br />

anschliessend visuell mit den exper<strong>im</strong>entellen Spektren zu vergleichen. <strong>Die</strong>se<br />

Kombination aus exper<strong>im</strong>enteller Messung und theoretischer Modellbildung wurde<br />

in der Vergangenheit z.B. erfolgreich genutzt, um die stabilen Konfigurationen<br />

kleiner und mittlerer Argon–Cluster aufzufinden [?, ?, ?].<br />

Da bei den numerischen S<strong>im</strong>ulationen die potentielle und kinetische Energie<br />

der Cluster als Nebenprodukt ermittelt wird, kann dasselbe Verfahren aber auch<br />

indirekt dazu verwendet werden, diese Energien selbst für die untersuchten Cluster<br />

zu best<strong>im</strong>men, was <strong>im</strong> Hinblick auf Phasenübergänge besonders interessant ist.<br />

Für semiklassische Clustersysteme läßt sich damit auch die ”<br />

innere Temperatur“<br />

T ermitteln, die über die mittlere kinetische Energie pro Freiheitsgrad definiert<br />

werden kann [?, ?].<br />

<strong>Die</strong>ses Verfahren zur Best<strong>im</strong>mung der Energie bzw. der Temperatur atomarer<br />

Cluster hat zwei große Nachteile: Es müssen zum einen viele zeitaufwendige<br />

Computers<strong>im</strong>ulationen durchgeführt werden, um eine genügend große Anzahl von<br />

theoretischen Vergleichsspektren zu erzeugen. Zum anderen müssen dann die gesuchten<br />

Energie– bzw. Temperaturwerte durch einen visuellen Vergleich der theoretischen<br />

mit den exper<strong>im</strong>entellen Spektren gefunden werden.<br />

In diesem zweiten Teil der Diplomarbeit entwickeln wir nun eine alternative<br />

Methode zur Berechnung der Energien bzw. der Temperatur aus den gemessenen<br />

Streuspektren. Wir zeigen, daß für monoatomare Cluster, die sich durch eine<br />

paarweise additive Wechselwirkung beschreiben lassen, die potentielle und die<br />

kinetische Energie sowie die klassische Temperatur als einfache Funktionale der<br />

Streuspektren und eines angenommenen Wechselwirkungspotentials ausgedrückt<br />

werden können, wobei in den Funktionalen nur eind<strong>im</strong>ensionale Integrationen ausgeführt<br />

werden müssen.<br />

In Kapitel 7 wird zunächst der Zusammenhang zwischen gemessenem Streuspektrum<br />

und der Paarkorrelationsfunktion erläutert, bevor in einem quantenstatischen<br />

und einem klassischen Modell ausgehend von verallgemeinerten Virialtheoremen<br />

die gerade angesprochenen einfachen Formeln für die Berechnung der Energien<br />

und der Temperatur hergeleitet werden.<br />

Um die praktische Anwendbarkeit unserer Methode überprüfen zu können,<br />

haben wir klassische MC und <strong>Pfadintegral</strong>–MC–S<strong>im</strong>ulationen von Systemen aus<br />

Argon– und Neon–Clustern als ”<br />

ideale Exper<strong>im</strong>ente“ durchgeführt (Kapitel 8).<br />

Aus den in diesen numerischen S<strong>im</strong>ulationen generierten Streuspektren berechnen<br />

wir über unsere neue Methode Erwartungswerte für die Energien und die<br />

Temperatur, die mit den exakten Werten aus den S<strong>im</strong>ulationen verglichen werden<br />

(Kapitel 9) und wir erläutern, wie sich damit Phasenübergänge in den untersuchten<br />

Clustern feststellen lassen.


Kapitel 7<br />

<strong>Die</strong> Methode<br />

In diesem Kapitel wird eine neue Methode vorgestellt, wie sich direkt aus exper<strong>im</strong>entell<br />

gemessenen Streuspektren atomarer Cluster ihre potentielle und kinetische<br />

Energie sowie <strong>im</strong> klassischen Grenzfall die Temperatur berechnen lassen.<br />

<strong>Die</strong> Grundidee unserer Methode ist dabei, die statistischen Erwartungswerte<br />

für die potentielle Energie E pot und die kinetische Energie E kin als Funktionale<br />

der Paarkorrelationsfunktion ,(r) auszudrücken, wozu wir verallgemeinerte Virialtheoreme<br />

— sogenannte Hypervirialtheoreme — verwenden.<br />

Am Anfang dieses Kapitels wird zunächst der Zusammenhang zwischen der<br />

in Beugungsexper<strong>im</strong>enten gemessenen Intensitätsverteilung I(S) und der Paarkorrelationsfunktion<br />

,(r) erläutert, bevor die klassischen und quantenmechanischen<br />

Hypervirialtheoreme nach HIRSCHFELDER [?] betrachtet werden.<br />

Im Rahmen eines quantenstatistischen kanonischen Modells zur Beschreibung<br />

atomarer Cluster mit paarweiser Wechselwirkung wird mit Hilfe des quantenmechanischen<br />

Hypervirialtheorems gezeigt, wie sich die potentielle und kinetische<br />

Energie über eine einfache Integration aus der Paarkorrelationsfunktion ergeben.<br />

Für sich beinahe klassisch verhaltende Systeme wird gezeigt, wie sich aus dem<br />

klassischen Hypervirialtheorem eine entsprechende Formel für die innere Temperatur<br />

der Cluster herleiten läßt.<br />

Schließlich wird erläutert, wie die so hergeleiteten Formeln modifiziert werden<br />

müssen, damit sie auch bei exper<strong>im</strong>entell vorliegenden diskreten Verteilungen<br />

(N ) von Clustern verschiedener Teilchenzahlen N angewendet werden können.<br />

7.1 Der Zusammenhang von Paarverteilungsfunktion und<br />

Streuspektrum<br />

Eines der etabliertesten exper<strong>im</strong>entellen Verfahren zur Analyse von Clusterstrukturen<br />

ist die Elektronenbeugung an Clusterstrahlen, die durch Überschallexpansion<br />

von heißen Gasen in ein Vakuum erzeugt werden [?].<br />

Bei diesem Meßverfahren wird ein heißes Gas mit Überschallgeschwindigkeit<br />

in ein Vakuum expandiert, wobei es unter geeigneten äußeren Bedingungen zur<br />

45


KAPITEL 7. DIE METHODE 46<br />

Bildung von Clustern in dem expandieren Gasstrahl kommt. Werden die so erzeugten<br />

Cluster mit hochenergetischen Elektronen durchstrahlt, so kommt es zu<br />

einer Auffächerung des Elektronenstrahls und es entsteht ein Beugungsbild, dessen<br />

Intensitätsverteilung charakteristisch für die innere Struktur der Cluster ist.<br />

Wichtig für das Zustandekommen dieses Effektes ist dabei nur, daß die einfallende<br />

Strahlung Wellencharakter hat, wobei die Wellenlänge in der Größenordnung<br />

der Streuzentren–Abstände liegen muß [?]. Daher werden neben Elektronenstrahlen<br />

auch Neutronen– und Röntgenstrahlen für Beugungsexper<strong>im</strong>ente dieser Art<br />

verwendet.<br />

Gegenüber den beiden anderen Strahlungsquellen bietet die Elektronenbeugung<br />

zur Zeit noch einige Vorteile:<br />

1. Elektronenstrahlen lassen sich wesentlich besser fokussieren als Neutronen–<br />

und Röntgenstrahlen.<br />

2. Für die momentan exper<strong>im</strong>entell gut realisierbaren Strahlintensitäten und<br />

Teilchenenergien liefert die Elektronenbeugung bei schwach streuenden Teilchen<br />

atomarer D<strong>im</strong>ensionen die qualitativ intensivsten und schärfsten Beugungsbilder.<br />

Vom theoretischen Standpunkt aus läßt sich das Problem der Streuung von<br />

Elektronen an Atomen und das Entstehen der Beugungsbilder mit unterschiedlicher<br />

Genauigkeit und entsprechend mit unterschiedlichem theoretischen Aufwand<br />

behandeln.<br />

Für die bei Strukturuntersuchungen an Clustern vorgenommenen Beugungsexper<strong>im</strong>ente<br />

genügt es, die sog. kinematische Streutheorie zu betrachten, in der nicht<br />

nur die Lage der Beugungsringe, sondern auch ihre Form und Intensität wiedergegeben<br />

wird.<br />

Betrachten wir zunächst die elastische Streuung eines Strahls schneller Elektronen<br />

an dem als zentralsymmetrisch angenommenen Potential V (r) eines einzelnen<br />

unbewegten Atoms.<br />

Da in Beugungsexper<strong>im</strong>enten der Elektronenstrahl typischerweise sehr viel<br />

länger eingeschaltet ist, als ein einzelnes Elektron zum Durchqueren der Streuregion<br />

benötigt und da das Streupotential zeitunabhängig ist, genügt es die zeitunabhängige<br />

Schrödingergleichung für dieses System zu betrachten [?]:<br />

<br />

, ~2<br />

2m r2 + V (r) (~r) =E (~r): (7.1)<br />

<strong>Die</strong> Energie E des einfallenden Elektrons ist dabei mit seinem Impuls ~ k und<br />

seiner Wellenlänge über die Gleichung<br />

verknüpft.<br />

E = p2<br />

2m = ~2<br />

2m k2 = ~2 2<br />

2m <br />

(7.2)


KAPITEL 7. DIE METHODE 47<br />

Unter der Annahme, daß das atomare Potential V (r) für große r genügend<br />

schnell abfällt, kann für Gleichung (7.1) eine asymptotische Lösung in der Form<br />

1 (~r) =A [ ein (~r) + str (~r)] (7.3)<br />

angeben werden, wobei ein die Wellenfunktion des einfallenden Elektrons und<br />

str die des gestreuten Elektrons bezeichnen soll.<br />

Da der einfallende stationäre Teilchenstrom verglichen mit den atomaren D<strong>im</strong>ensionen<br />

des Streuzentrums einen großen Durchmesser hat, kann für die Wellenfunktion<br />

ein eine ebene Welle angenommen werden:<br />

ein(~r) =e i~ k~r : (7.4)<br />

<strong>Die</strong> Gestalt der gestreuten Wellenfunktion str ist dadurch best<strong>im</strong>mt, daß der<br />

Fluß der gestreuten Teilchen radialsymmetrisch sein muß:<br />

str(~r) =f (; ) ei~ k~r<br />

r ; (7.5)<br />

wobei (r;;) die Polardarstellung des Koordinatenvektors ~r ist und die Amplitude<br />

f (; ) der Streuwellenfunktion als Streuamplitude bezeichnet wird.<br />

<strong>Die</strong> weit entfernt vom Streupunkt gemessene Streuintensität<br />

I = I 0<br />

r jf (; 2 )j2 (7.6)<br />

ist damit best<strong>im</strong>mt durch den Streuwinkel , die Intensität der einfallenden Elektronen<br />

I 0 und die Streuamplitude f (; ).<br />

Bei einem radialsymmetrischen Zentralpotential V (r) hängt die Streuamplitude<br />

nur von ab. In diesem Fall kann f () durch eine Partialwellenzerlegung<br />

best<strong>im</strong>mt werden, bei der f () durch eine Reihe über Legendre–Polynome P l dargestellt<br />

wird. Für f () ergibt sich so schließlich der Ausdruck [?]:<br />

1X (2l<br />

h i<br />

+1)<br />

f () =<br />

P l (cos ) e 2i l<br />

, 1 ; (7.7)<br />

2ik<br />

l=0<br />

in dem f () vollständig durch die Phasenverschiebungen l best<strong>im</strong>mt ist.<br />

Für kleine Phasenverschiebungen l gilt die Näherung (Bornsche Näherung für<br />

die Partialwelle l)[?]:<br />

l = , 2mk<br />

~ 2 Z 1<br />

0<br />

V (r) r 2 [j l (kr)] 2 dr; (7.8)<br />

mit der Bezeichnung j l für die sphärische Besselfunktion der Ordnung l.<br />

Entwickeln wir in (7.7)<br />

e 2i l<br />

=1+2i l , 2 2 l + ::: (7.9)


KAPITEL 7. DIE METHODE 49<br />

<strong>Die</strong> Hintergrundintensität I b setzt sich dabei zusammen aus einem Anteil für<br />

die elastische Streuung an einzelnen Atomen — proportional zu der Summe über<br />

die Quadrate der atomaren elastischen Streufaktoren f i (s) — und aus einem Anteil<br />

für die inelastische Streuung proportional zur Summe über die inelastischen<br />

Streufaktoren S i (s):<br />

I b (s) = I 0<br />

R 2 M X<br />

i=1<br />

<br />

<br />

jf i (s)j 2 + 4<br />

a S 2 i(s) : (7.17)<br />

0 s4<br />

Der Interferenzterm I int enthält letztlich die von der Struktur d.h. von der Verteilung<br />

der Atome herrührende Information:<br />

I int (s) = I 0<br />

R 2 M X<br />

i=1<br />

MX<br />

j=1<br />

j6=i<br />

f i (s)f j(s)<br />

Z 1<br />

0<br />

P ij (r) sin(sr)<br />

sr<br />

dr (7.18)<br />

Um die Bewegungen der Atome gegeneinander zu berücksichtigen, muß hierbei<br />

über die gewichteten, von einzelnen Atom–Atom–Paaren stammenden Intensitätsanteile<br />

[sin(sr)=(sr)] integriert werden. <strong>Die</strong> Gewichtsfunktion P ij (r) ist dabei die<br />

radiale Wahrscheinlichkeitsdichte dafür, daß die Atome i und j gerade den Abstand<br />

r haben.<br />

Für ein System, daß aus unterschiedlichen Atomen bzw. aus Molekülen verschiedener<br />

Atome besteht, setzt sich die Interferenzintensität (7.18) additiv aus<br />

einem intramolekularen Interferenzanteil I mol und einem von der Clusterstruktur<br />

abhängigen intermolekularen Interferenzanteil I Cl zusammen:<br />

I int = I mol + I Cl : (7.19)<br />

In der Literatur ist es allgemein üblich [?], an Stelle des strukturhängigen Interferenzterms<br />

I Cl die Strukturfunktion<br />

M Cl =<br />

I Cl<br />

Ib<br />

elast<br />

(7.20)<br />

zu betrachten, d.h. aus I Cl wird der elastische Anteil Ib<br />

elast der atomaren Hintergrundintensität<br />

(7.17) herausdividiert.<br />

Für ein System aus rein atomaren Clustern verschwindet in Gleichung (7.19)<br />

der intramolekulare Interferenzterm I mol .Sindzusätzlich alle Atome in dem betrachteten<br />

Cluster identisch, so ist in den Gleichungen (7.17) und (7.18) nur ein<br />

elastischer Streufaktor f (s) und eine Gewichtsfunktion (,(r) = p ij (r) f.a. i 6=<br />

j 2 [1;::: ;N]) zuberücksichtigen. Somit können die Summen über alle Bindungen<br />

bzw. über alle Teilchen explizit ausgeführt werden und wir erhalten für die<br />

Interferenzintensität I int und für die zugehörige Strukturfunktion M:<br />

I int (s) = Njf (s)j 2 M (s) (7.21)<br />

Z 1<br />

= Njf (s)j 2 4r 2 ,(r) sin(sr) dr: (7.22)<br />

sr<br />

0


KAPITEL 7. DIE METHODE 50<br />

Unter Vernachlässigung des inkohärenten Streuanteils in der Hintergrundintensität<br />

(7.17) ergibt sich für die gemessene Gesamtintensität I tot also<br />

I tot (s) =Njf (s)j 2 1+<br />

Z 1<br />

0<br />

4r 2 ,(r) sin(sr)<br />

sr<br />

dr<br />

<br />

: (7.23)<br />

<strong>Die</strong> Gewichtsfunktion ,(r) läßt sich in diesem Fall als statistischer Erwartungswert<br />

formulieren [?]:<br />

2<br />

,(r) =<br />

N (N , 1)<br />

* X<br />

1i


KAPITEL 7. DIE METHODE 51<br />

7.2.1 Das klassische Hypervirialtheorem<br />

Wir betrachten ein mechanisches System aus N Teilchen, die sich durch eine<br />

Hamilton–Funktion H in den 3N generalisierten Ortskoordinaten q 1 ;q 2 ;::: ;q 3N<br />

und den dazu konjugierten Impulsen p 1 ;p 2 ;::: ;p 3N beschreiben lassen sollen.<br />

Sei W nun eine Funktion der generalisierten Koordinaten und Impulse mit den<br />

beiden folgenden Eigenschaften:<br />

1. W ist eindeutig durch jede Konfiguration des Systems best<strong>im</strong>mt.<br />

2. W n<strong>im</strong>mt für alle mit den vorgeschriebenen Randbedingungen und Erhaltungssätzen<br />

des Systems verträglichen Konfigurationen einen endlichen Wert<br />

an.<br />

Dann läßt sich die zeitliche Entwicklung von W mit Hilfe der kanonischen<br />

Bewegungsgleichungen<br />

_q i = @H und , _p i = @H<br />

(7.27)<br />

@p i @q i<br />

durch die Poisson–Klammer von W und der Hamilton–Funktion H ausdrücken<br />

[?]:<br />

dW<br />

dt<br />

= fH; Wg p;q =<br />

3NX<br />

j=1<br />

@H @W<br />

, @H @W<br />

: (7.28)<br />

@p j @q j @q j @p j<br />

Auf beiden Seiten von Gleichung (7.28) wird nun das Zeitmittel<br />

Z t=<br />

hi := 1 dt 0 (7.29)<br />

t=0<br />

gebildet. Dabei soll für eine periodische Bewegung des Systems als die Zeit<br />

genommen werden, die das System benötigt, um wieder in den Ausgangszustand<br />

zurückzukehren, und für alle anderen Systeme soll der L<strong>im</strong>es ! 1 betrachtet<br />

werden.<br />

Wegen der zweiten der an W gestellten Voraussetzungen folgt offensichtlich<br />

dW<br />

=0 (7.30)<br />

dt<br />

und damit ergibt sich aus (7.28) die Gleichung<br />

E 3NX<br />

0=<br />

DfH; Wg p;q =<br />

j=1<br />

@H<br />

@p j<br />

@W<br />

@q j<br />

, @H<br />

@q j<br />

@W<br />

@p j<br />

<br />

: (7.31)<br />

Von besonderem Interesse sind nun Relationen, die sich aus Gleichung (7.31)<br />

ergeben, wenn W eine homogene Funktion vom Grad 1 in den generalisierten Impulsen<br />

ist. <strong>Die</strong>se Relationen werden nach HIRSCHFELDER [?] alsklassische Hypervirialtheoreme<br />

bezeichnet, da sie als Verallgemeinerungen des Virialsatzes von<br />

CLAUSIUS aufgefaßt werden können.


KAPITEL 7. DIE METHODE 52<br />

Wird z.B.<br />

W = p k f (q 1 ;q 2 ;::: ;q 3N ) (7.32)<br />

gewählt, so lautet das entsprechende Hypervirialtheorem:<br />

3NX<br />

j=1<br />

<br />

_q j<br />

@f<br />

@q j<br />

p k<br />

<br />

=<br />

<br />

f @H ; (7.33)<br />

@q k<br />

aus dem sich mit f = q k wieder der Virialsatz von CLAUSIUS ergibt:<br />

h _q j p k i =<br />

<br />

@H<br />

q k : (7.34)<br />

@q k<br />

Betrachten wir nun ein System <strong>im</strong> thermischen Gleichgewicht bei einer Temperatur<br />

T , so ergeben sich in den Hypervirialtheoremen deutliche Vereinfachungen.<br />

Zum einen gibt es in der klassischen Statistischen Mechanik keine Korrelationen<br />

zwischen den Ortskoordinaten und den Impulsen. Zum anderen gilt [?]<br />

und damit n<strong>im</strong>mt Gleichung (7.33) die Gestalt 2<br />

k B T<br />

<br />

p k<br />

@H<br />

@p k<br />

<br />

= k B T; (7.35)<br />

3NX<br />

j=1<br />

@f<br />

@q j<br />

<br />

=<br />

<br />

f @H<br />

@q k<br />

<br />

(7.36)<br />

an.<br />

Gleichung (7.36) läßt sich allerdings auch direkt mit Mitteln der Statistischen<br />

Mechanik herleiten, indem z.B. <strong>im</strong> kanonischen Ensemble die Zustandssumme<br />

partiell integriert wird [?] oder <strong>im</strong> mikrokanonischen Ensemble über geeignete<br />

Energiehyperflächen integriert wird [?, ?].<br />

7.2.2 Das quantenmechanische Hypervirialtheorem<br />

Wird in der klassischen Mechanik die zeitliche Entwicklung einer Funktion W mit<br />

Hilfe von Poisson–Klammern formuliert, so entspricht dies in der Quantenmechanik<br />

der Beschreibung einer Observablen ^W H <strong>im</strong> Heisenberg–Bild.<br />

Wir betrachten <strong>im</strong> folgenden ein System, das durch einen zeitunabhängigen<br />

Hamilton–Operator ^H beschrieben wird. Im Heisenberg–Bild wird die Dynamik<br />

eines nicht explizit zeitabhängigen Schrödingeroperators ^W S durch die Heisenbergsche<br />

Bewegungsgleichung<br />

d<br />

dt ^W i h i<br />

H = ^H; ^W H (7.37)<br />

~<br />

2 Zu beachten ist hierbei, daß für alle Koordinaten, die nicht in H auftauchen, (z.B. zyklische<br />

Koordinaten) diese Gleichungen identisch verschwinden.


KAPITEL 7. DIE METHODE 53<br />

beschrieben, wobei<br />

^W H = e i ~ ^Ht ^W S e , i ~ ^Ht<br />

(7.38)<br />

die Darstellung von ^W S <strong>im</strong> Heisenberg–Bild ist.<br />

Wird nun auf beiden Seiten von Gleichung (7.37) der Erwartungswert bezüglich<br />

stationärer Energieeigenzustände j m i und j n i gebildet, so ergibt sich<br />

h i<br />

h m j ^H; ^W H j n i = i h m j ^H ^W H , ^W ^H H j n i (7.39)<br />

~<br />

= i ~ (E m , E n )h m j ^W H j n i (7.40)<br />

= i (E m , E n ) e ~ i (Em,En)t h m j ^W S j n i: (7.41)<br />

~<br />

Wenn der Erwartungswert von ^W S bezüglich eines stationären Energieeigenzustands<br />

j n i endlich ist, dann folgt aus Gleichung (7.41), daß<br />

h i<br />

h n j ^H; ^W H j n i =0 (7.42)<br />

gilt.<br />

In Analogie zum klassischen Fall werden laut HIRSCHFELDER diejenigen Relationen<br />

als quantenmechanisches Hypervirialtheorem bezeichnet, die sich aus der<br />

allgemeinen Formel (7.42) für Operatoren W ergeben, die vom Grad 1 in den Impulsoperatoren<br />

sind.<br />

7.3 Das quantenstatistische Modell<br />

7.3.1 Modellierung des Systems<br />

Als Ausgangspunkt für unsere theoretischen Überlegungen wählen wir ein kanonisches<br />

Ensemble von atomaren Clustern aus N–Teilchen. <strong>Die</strong>se Form der Beschreibung<br />

ist z.B. dann geeignet, wenn die Cluster <strong>im</strong> thermischen Gleichgewicht mit<br />

einem Wärmebad aus sie umgebenden Atomen sind, wie dies bei vielen Gasstrahlexpansionsexper<strong>im</strong>enten<br />

der Fall ist [?].<br />

Außerdem schränken wir unsere Betrachtungen auf Cluster aus N identischen<br />

Atomen der Masse m ein, deren Wechselwirkung sich durch ein paarweise additives<br />

2–Teilchen Potential der Form<br />

V WW =<br />

N,1<br />

X<br />

i=1<br />

NX<br />

j=2<br />

i


KAPITEL 7. DIE METHODE 54<br />

Der Hamilton–Operator eines solchen Systems lautet<br />

^H tot = , ~2<br />

2m<br />

NX<br />

i=1<br />

X<br />

r 2 i + V (j~x i , ~x j j): (7.44)<br />

7.3.2 Separation von Schwerpunkts– und Relativbewegung<br />

Da durch die Wahl des Wechselwirkungspotentials der Hamilton–Operator ^H tot<br />

invariant unter Translationen wird, liefern die Kontinuumszustände mit nichtverschwindendem<br />

Gesamt<strong>im</strong>puls ( ” äußere Freiheitsgrade“) nur einen festen Beitrag<br />

3<br />

2 k BT zur kinetischen Energie.<br />

Für die Änderungen in der Clusterstruktur sind dagegen die verbleibenden ”<br />

inneren“<br />

Freiheitsgrade ausschlaggebend [?] und nur diese lassen sich auch durch<br />

die Spektren aus Elektronenbeugungsexper<strong>im</strong>enten nachweisen. 3 Deshalb ist es<br />

sinnvoll, die Schwerpunkts– von der Relativbewegung zu separieren.<br />

<strong>Die</strong>s geschieht am zweckmäßigsten durch eine Koordinatentransformation<br />

i


KAPITEL 7. DIE METHODE 55<br />

^H<br />

kin rel den Anteil für die Relativbewegung bezeichnet:<br />

^H rel<br />

kin = , ~2<br />

m<br />

2<br />

6X<br />

4 N<br />

i=1<br />

r 2 r i<br />

+<br />

N,2<br />

X<br />

und das Wechselwirkungspotential die Gestalt<br />

V WW =<br />

N,1<br />

X<br />

i=1<br />

V (j~r i j)+<br />

i=1<br />

N,2<br />

X<br />

i=1<br />

N,1<br />

X<br />

j=2<br />

i


KAPITEL 7. DIE METHODE 56<br />

gegeben, wobei<br />

<br />

Z =Tr<br />

e , ^H rel<br />

(7.58)<br />

die kanonische Zustandssumme der inneren Freiheitsgrade ist.<br />

Für die mittlere potentielle Energie des Systems, d.h. den Erwartungswert hV WW i,<br />

erhalten wir so den formalen Ausdruck<br />

E pot = 1 Z<br />

X<br />

wobei die Summe über alle Energieeigenzustände j ni mit<br />

n<br />

e ,En hn j V WW j ni; (7.59)<br />

^H rel j ni = E n j ni (7.60)<br />

läuft.<br />

Andererseits ist es physikalisch intuitiv klar, daß sich die mittlere potentielle<br />

Energie auch über die Paarkorrelationsfunktion ,(r) berechnen läßt:<br />

Z<br />

N (N , 1) 1<br />

E pot = dr ,(r) V (r); (7.61)<br />

2 0<br />

denn ,(r) dr gibt ja die mittlere Wahrscheinlichkeit an, daß zwei beliebige Teilchen<br />

des betrachteten Systems einen Abstand r 0 zwischen r und r +dr haben. Also<br />

ergibt das Integral in Gleichung (7.61) den Erwartungswert für das 2–Teilchen–<br />

Wechselwirkungspotential pro Bindung, es muß also noch mit der Anzahl der Bindungen<br />

multipliziert werden.<br />

Für die mittlere interne kinetische Energie ist die Sachlage komplizierter, denn<br />

sie berechnet sich <strong>im</strong> kanonischen Ensemble zu<br />

E kin = 1 Z<br />

X<br />

n<br />

e ,En hn j<br />

rel ^H kin j ni: (7.62)<br />

Hier ist nicht offensichtlich, wie sich der Erwartungswert hn j ^H<br />

rel<br />

kin<br />

j ni durch die<br />

Paarkorrelationsfunktion ,(r) ausdrücken läßt.<br />

In diesem Abschnitt wird nun gezeigt, wie mit Hilfe eines geeigneten Hypervirialtheorems<br />

die Gleichung (7.62) in eine Form gebracht werden kann, die dieselbe<br />

Struktur wie (7.59) hat. <strong>Die</strong>s genügt, wie in Abschnitt 7.3.4 noch ausführlicher<br />

erläutert wird, um E kin über ,(r) berechnen zu können.<br />

Um zu dem richtigen“ Hypervirialtheorem zu gelangen, gehen wir von dem<br />

”<br />

allgemeinen quantenmechanischen Hypervirialtheorem (7.42) aus und wählen [?]<br />

^W =<br />

N,1<br />

X<br />

k=1<br />

~r k r k : (7.63)<br />

Wie schon in Abschnitt 7.2.2 erläutert wurde, muß zunächst der Kommutator<br />

[ ^H rel ; ^W ] berechnet werden. Dazu werten wir die Operatorprodukte ^H rel ^W und<br />

^W ^H rel getrennt aus.


KAPITEL 7. DIE METHODE 57<br />

Für das erste Produkt ^H rel ^W ergibt sich:<br />

^H rel ^W = , ~2<br />

m<br />

" N,1<br />

X<br />

r 2 i (~r k r k ) +<br />

i;k=1<br />

| {z }<br />

%1<br />

X<br />

N,1<br />

X<br />

(r i r j )(~r k r k )<br />

i


KAPITEL 7. DIE METHODE 58<br />

Das zweite Operatorprodukt ^W ^H rel läßt sich direkt berechnen:<br />

^W ^H rel = , ~2<br />

m<br />

N,1<br />

X<br />

k=1<br />

" N,1<br />

X<br />

i=1<br />

X<br />

(~r k r k )r 2 i + (~r k r k )(r i r j )<br />

i


KAPITEL 7. DIE METHODE 59<br />

der Erwartungswert durch die folgende Formel gegeben ist:<br />

N (N , 1)<br />

hF i =<br />

2<br />

Z 1<br />

drf(r),(r): (7.79)<br />

0<br />

Zum Beweis von (7.79) erinnern wir uns an die Definition der Paarkorrelationsfunktion<br />

,(r) in Gleichung (7.24), die sich <strong>im</strong> Relativkoordinatensystem wie<br />

folgt schreibt:<br />

2<br />

,(r) =<br />

N (N , 1)<br />

2<br />

4<br />

* N,1<br />

X<br />

i=1<br />

(j~r i j,r)<br />

+<br />

+<br />

* X<br />

i


KAPITEL 7. DIE METHODE 60<br />

aus den in Beugungsexper<strong>im</strong>enten gemessenen Intensitätsspektren best<strong>im</strong>men lassen:<br />

Z<br />

N (N , 1) 1<br />

E pot = drV(r),(r); (7.87)<br />

2 0<br />

Z<br />

N (N , 1) 1<br />

E kin = drrV 0 (r),(r): (7.88)<br />

4<br />

7.4 Der klassische Grenzfall<br />

<strong>Die</strong> quantenstatistische kanonische Zustandssumme Z aus Gleichung (7.58) läßt<br />

sich in guter Näherung durch die klassisch kanonische Zustandssumme Z kl der<br />

korrigierten Maxwell–Boltzmann Statistik ersetzen, falls der mittlere interatomare<br />

Abstand d sehr viel größer als die thermische de Broglie–Wellenlänge<br />

0<br />

th =<br />

h<br />

p 2mkB T<br />

(7.89)<br />

ist. th ist dabei ein Maß für die Ortsunschärfe zur mittleren kinetischen Energie<br />

und damit zum mittleren Impuls [?, ?].<br />

In der klassischen kanonischen Formulierung ist die Zustandsumme Z kl des<br />

von uns betrachteten Systems gegeben als<br />

Z<br />

1<br />

Z kl =<br />

h 3N e ,H rel(~p;~r) d~p d~r (7.90)<br />

N !<br />

wobei ~p und ~r für die 3(N , 1)–d<strong>im</strong>ensionalen Koordinatenvektoren bzw. Impulsvektoren<br />

des Relativsystems stehen und H rel die dem Hamilton–Operator (7.56)<br />

des Relativsystems entsprechende klassische Hamiltonfunktion<br />

H rel (~p 1 ;::: ;~p N,1 ;~r 1 ;::: ;~r N,1 )=<br />

N,1<br />

X<br />

i=1<br />

(~p i ) 2<br />

2m + V WW (7.91)<br />

bezeichnet.<br />

Für die mittlere potentielle Energie kann die Gleichung (7.87) ohne weiteres<br />

übernommen werden, da bei der Herleitung der allgemeinen Formel (7.79) in Abschnitt<br />

7.3.4 kein Gebrauch von der expliziten Gestalt des quantenmechanischen<br />

Erwartungswertes gemacht wurde.<br />

Für die mittlere innere kinetische Energie <strong>im</strong> klassisch–kanonischen Ensemble<br />

muß dagegen wieder der Erwartungswert der kinetischen Energie in eine geeignete<br />

Form gebracht werden, um die Formel (7.79) anwenden zu können. Dazu wird<br />

auf das klassische Hypervirialtheorem in Form von Gleichung (7.36) mit der Wahl<br />

f = q k zurückgegriffen, daß in kartesichen Koordinaten die Gestalt<br />

* N,1<br />

X<br />

i=1<br />

~r i r i V WW<br />

+<br />

=3(N , 1)k B T (7.92)


KAPITEL 7. DIE METHODE 61<br />

ann<strong>im</strong>mt.<br />

Da die Ableitung auf der rechten Seite von Gleichung (7.92) schon in Abschnitt<br />

7.3.4 berechnet wurde (s. Gl. (7.86)), gelangen wir auch für die klassische mittlere<br />

kinetische Energie wieder zu der Formel (7.88):<br />

Z<br />

N (N , 1) 1<br />

E kin =3(N , 1)k B T = drrV 0 (r),(r);<br />

2 0<br />

(7.93)<br />

wodurch sich <strong>im</strong> klassischen L<strong>im</strong>es jetzt auch eine Formel für die Berechnung<br />

der inneren Temperatur der so modellierten Cluster aus exper<strong>im</strong>entell gemessenen<br />

Streuspektren ergibt:<br />

Z<br />

T N 1<br />

=<br />

dr rV 0 (r),(r): (7.94)<br />

6k B<br />

7.5 Verteilungen verschiedener Clustergrößen<br />

0<br />

Bei der Erzeugung von Clustern durch Überschallexpansion eines Gasstrahls liegt<br />

typischerweise eine durch die exper<strong>im</strong>entellen Parameter best<strong>im</strong>mte diskrete Verteilung<br />

(N ) von Clusterteilchenzahlen N vor. Nachdem der Clusterstrahl die<br />

Analyseexper<strong>im</strong>ente wie z.B. Elektronenbeugung durchlaufen hat, kann diese Grössenverteilung<br />

(N ) durch massenspektrometrische Methoden best<strong>im</strong>mt werden<br />

[?].<br />

<strong>Die</strong> exper<strong>im</strong>entell gemessene Intensität I ~ ergibt sich dann durch eine lineare<br />

Superposition der von den einzelnen Clustern fester Größe N stammenden Streuintensitäten<br />

I N :<br />

~I =<br />

X<br />

N<br />

(N ) I N ; (7.95)<br />

wobei die Einzelintensitäten I N in der kinematischen Streutheorie durch Gleichung<br />

(7.23) gegeben sind.<br />

Da die entsprechenden Paarkorrelationsfunktion , N nach (7.25) mit den Einzelintensitäten<br />

I N über lineare Fourier–Transformationen zusammenhängen, läßt<br />

sich die Fourier–Transformierte , ~ der gemessenen Intensität I ~ ebenfalls als eine<br />

durch (N ) best<strong>im</strong>mte Superposition von Paarkorrelationsfunktionen fester Clustergrößen<br />

N best<strong>im</strong>men:<br />

~, =<br />

X<br />

N<br />

(N ), N : (7.96)<br />

Befinden sich auch die Cluster verschiedener Größe miteinander <strong>im</strong> thermischen<br />

Gleichgewicht, so läßt sich mit (7.94) wieder eine Formel angeben, durch<br />

die die innere Temperatur der Cluster aus der Fourier–Transformierten der gemessenen<br />

Streuintensität berechnen werden kann:<br />

R 1<br />

T = 1 0<br />

6k B<br />

drrV 0 (r) ,(r) ~ : (7.97)<br />

P<br />

(N)<br />

N N


Kapitel 8<br />

Numerische S<strong>im</strong>ulationen als<br />

ideale Exper<strong>im</strong>ente“<br />

”<br />

Um die Anwendbarkeit der in Kapitel 7 hergeleiteten Formeln zur Berechnung der<br />

potentiellen Energie (7.87) und der kinetischen Energie (7.88) bzw. Temperatur<br />

(7.94) zu überprüfen, haben wir klassische und <strong>Pfadintegral</strong>–Monte–Carlo S<strong>im</strong>ulationen<br />

von kanonischen Ensembles aus Argon– und Neon–Clustern als idealisierte<br />

numerische Exper<strong>im</strong>ente“ durchgeführt.<br />

”<br />

In diesen S<strong>im</strong>ulationen, bei denen die Temperatur als externer Parameter vorgegeben<br />

wird, wurden zum einen direkt die Erwartungswerte der Observablen E kin<br />

und E pot best<strong>im</strong>mt. Zum anderen wurde die Paarkorrelationsfunktion ,(r) ermittelt,<br />

aus der wir in einer nachfolgenden Datenanalyse ebenfalls Erwartungswerte<br />

für E kin und E pot gemäß der hergeleiteten Formeln berechnet haben.<br />

Um einen Vergleich mit früher durchgeführten numerischen S<strong>im</strong>ulationen für<br />

Argon–Cluster zu ermöglichen [?, ?, ?], haben wir für das Wechselwirkungspotential<br />

V WW der Argon– und Neon–Cluster eine analytische Potentialfunktion vom<br />

Lennard–Jones–(12,6)–Typ<br />

<br />

12 <br />

6<br />

<br />

V LJ (r) =4 , (8.1)<br />

r r<br />

angenommen, wobei die für Argon und Neon verwendeten Parameter zusammen<br />

mit den Massen der verwendeten Isotope in Tabelle 8.1 aufgeführt sind.<br />

Wie in Abschnitt 7.4 erklärt wurde, ist der klassisch–kanonische Formalismus<br />

eine gute Näherung, falls der interatomare Abstand d sehr viel größer als die thermische<br />

Wellenlänge th ist. Ab welcher Temperatur diese Bedingung für die von<br />

uns betrachteten Edelgascluster erfüllt ist, kann durch folgende grobe Abschätzung<br />

festgestellt werden:<br />

Für den interatomaren Abstand d wählen wir näherungsweise den Abstand<br />

r m = 6p 2, für den V LJ min<strong>im</strong>al wird. Mit den in Tabelle 8.1 aufgeführten Werten<br />

ergibt sich, daß bei Argon–Atomen für T 0:5 K und bei Neon–Atomen für<br />

T 5 K die klassische Beschreibung eine gute Näherung darstellt.<br />

62


KAPITEL 8. NUMERISCHE SIMULATIONEN... 63<br />

Argon Neon<br />

in meV 10.3 3.068<br />

in Å 3.405 2.745<br />

m in AMU 39.96238 19.99244<br />

Tabelle 8.1: Lennard–Jones–Parameter und Atomgewichte der in den numerischen<br />

S<strong>im</strong>ulationen verwendeten Edelgase Argon und Neon. Für die Atomgewichte wurden<br />

die Massen der am häufigsten vorkommenden Isotope gewählt.<br />

<strong>Die</strong> Größe der zu untersuchenden Cluster wurde so gewählt, daß einerseits<br />

die Stabilität der Cluster über einen genügend großen Zeitraum gewährleistet ist<br />

und andererseits die mit der Temperaturerhöhung verbundenen Strukturveränderungen<br />

zu einem deutlichen Effekt in der Paarkorrelationsfunktion bzw. dem Intensitätsspektrum<br />

führen. Bei Edelgasclustern bieten sich hierfür die niedrigsten<br />

abgeschlossenen Ikosaederkonfigurationen aus N = 13 und N = 55 Atomen<br />

bzw. die entsprechende Sequenz der einfach dekorierten Ikosaederkonfiguration<br />

aus N =14und N =56Atomen an.<br />

Im Fall von Argon ist bekannt, daß der fest–flüssig–Phasenübergang bei einer<br />

Temperatur von 20 K einsetzt [?]. Der zu untersuchende Temperaturbereich von 10<br />

bis 40 Kelvin liegt deutlich über der oben abgeschätzen kritischen Temperatur von<br />

0:5 K, eine rein klassische Behandlung sollte also eine gute Näherung darstellen.<br />

Aus diesem Grund haben wir für Argon klassisch–kanonische MC–S<strong>im</strong>ulationen<br />

von Clustern der Größen N = 12; 13; 14 und N = 54; 55; 56 durchgeführt.<br />

Dazu wurde ein von P. BORRMANN entwickeltes Programm zur klassischen MC–<br />

S<strong>im</strong>ulation mit einer von H. STAMERJOHANNS <strong>im</strong>plementierten Routine zur opt<strong>im</strong>ierten<br />

Datenanalyse nach FERRENBERG ET. AL. [?] kombiniert.<br />

In der opt<strong>im</strong>ierten Datenanalyse werden in einem selbstkonsistenten Verfahren<br />

die für feste Temperaturen in einzelnen MC–Läufen ermittelten Histogramm–<br />

DatenzueinerNäherung für die Zustandsdichte kombiniert. Aus dieser lassen<br />

sich dann die Erwartungswerte thermodynamischer Observablen über einen ganzen<br />

Temperaturbereich ermitteln.<br />

Für Neon ist auf Grund des gegenüber Argon halbierten Atomgewichtes dagegen<br />

zu erwarten, daß der fest–flüssig–Phasenübergang bei einer deutlich niedrigeren<br />

Temperatur eintritt und so Quanteneffekte eine wichtige Rolle spielen. <strong>Die</strong>s<br />

wird auch durch die o.g. Abschätzung für den Gültigkeitsbereich der klassischen<br />

Näherung gestützt, die nur für Temperaturen von deutlich mehr als 5 K eine klassische<br />

Beschreibung rechtfertigt.<br />

Andererseits kann die quantenmechanische Ununterscheidbarkeit der Neon-<br />

Atome für den hier relevanten Temperaturbereich von 2 bis 12 K vernachlässigt<br />

werden. Untersuchungen von CEPERLEY ET. AL. haben gezeigt [?], daß selbst für<br />

das noch leichtere Helium bei einer Temperatur von 2 K die durch die quantenmechanische<br />

Ununterscheidbarkeit hervorgerufenen Änderungen in der Paarkorrelationsfunktion<br />

gegenüber der korrigierten Mawell–Boltzmann–Statistik unter 2%


KAPITEL 8. NUMERISCHE SIMULATIONEN... 64<br />

liegen.<br />

Somit bietet es sich an, für ein System von Neon–Cluster die Ergebnisse von<br />

quantenmechanischer und klassischer Behandlung zu vergleichen. Konkret haben<br />

wir für ein System von Ne 13 –Clustern klassische Monte–Carlo und <strong>Pfadintegral</strong>–<br />

Monte–Carlo–S<strong>im</strong>ulationen (PIMC) durchgeführt.<br />

Das Prinzip der PIMC–S<strong>im</strong>ulationen wurde schon ausführlich in Kapitel 2<br />

erläutert, wobei hier allerdings nicht die Ununterscheidbarkeit der Teilchen berücksichtigt<br />

wurde, d.h. an Stelle der <strong>Permanente</strong> bzw. Determinante taucht in der Gewichtsfunktion<br />

(2.39) nur das Produkt der Diagonalelemente von A( +1;) auf.


Kapitel 9<br />

Ergebnisse<br />

Mit den in Kapitel 8 in numerischen S<strong>im</strong>ulationen berechneten Streuspektren kann<br />

nun überprüft werden, ob unsere formal exakte Methode zur Berechnung der potentiellen<br />

und kinetischen Energie bzw. der Temperatur auch für praktische Anwendungen<br />

geeignet ist.<br />

Zuerst werden die qualitativen Eigenschaften der mit den in Kapitel 8 beschriebenen<br />

S<strong>im</strong>ulationsverfahren berechneten Streuspektren I(s) und die dazugehörigen<br />

Paarkorrelationsfunktionen ,(r) diskutiert.<br />

Danach wird untersucht, ob unsere Formeln zur Berechnung von Energieerwartungswerten<br />

bzw. Temperaturen aus diesen Spektren sich numerisch stabil verhalten.<br />

Insbesondere werden die durch die Form der Potentialfunktion hervorgerufenen<br />

numerischen Probleme bei der Berechnung der kinetischen Energie betrachtet.<br />

Anschließend werden für die untersuchten Systeme aus Argon– und Neon–<br />

Clustern mit unserer Methode die potentiellen und kinetischen Energien als Funktionen<br />

der Temperatur best<strong>im</strong>mt und mit den exakten Werten aus den S<strong>im</strong>ulationen<br />

verglichen. Außerdem wird beschrieben, wie sich aus diesen Kurven Rückschlüsse<br />

auf Phasenübergänge innerhalb der betrachteten Cluster ziehen lassen.<br />

Zum Abschluß wird die spezifische Wärme als weitere entscheidende Größe<br />

zur Best<strong>im</strong>mung von Phasenübergängen betrachtet und es wird darauf eingegangen,<br />

wie diese sich aus den bisher gewonnenen Energiekurven E(T ) berechnen<br />

läßt.<br />

9.1 Theoretische Streuspektren und Paarkorrelationsfunktionen<br />

Zunächst betrachten wir die Paarkorrelationsfunktionen ,(r) und die daraus errechneten<br />

Intensitätsverteilungen I(s) aus den klassischen und quantenstatistischen<br />

S<strong>im</strong>ulationsrechnungen.<br />

Wie schon mehrfach erwähnt wurde, bilden die aus Streuexper<strong>im</strong>enten gewonnen<br />

Intensitätsverteilungen I(s) den Ausgangspunkt für die von uns entwickelte<br />

65


KAPITEL 9. ERGEBNISSE 66<br />

Methode zur Best<strong>im</strong>mung der inneren Energien E pot und E kin bzw. der inneren<br />

Temperatur T .<br />

In Abbildung 9.1 sind die Paarkorrelationsfunktionen und die dazugehörigen<br />

Spektren für ein klassisches System aus Argon–Clustern der Größen N =13und<br />

N = 14 gezeigt. Zur Berechnung dieser wie auch der anderen in diesem Kapitel<br />

gezeigten klassischen Paarkorrelationsfunktionen wurden 2 10 7 Monte–Carlo–<br />

Schritte durchgeführt. Exemplarisch sei hier die Rechenzeit für ein Ar 13 –System<br />

angegeben, die auf einer IBM AIX P70 Workstation mit 64 MB Hauptspeicher<br />

6.4 CPU–Minuten betrug.<br />

<strong>Die</strong> Paarkorrelationsfunktionen zeigen das typische Bild eines ausgeprägten<br />

ersten Max<strong>im</strong>ums mit weiteren Nebenmax<strong>im</strong>a geringere Höhe. Das erste Max<strong>im</strong>um<br />

gibt dabei den mittleren Abstand zum nächsten Nachbarn an, der <strong>im</strong> wesentlichen<br />

durch den Gleichgewichtsabstand des interatomaren Wechselwirkungspotentials<br />

best<strong>im</strong>mt wird.<br />

Betrachten wir zunächst die Kurven für das Ar 13 –System. <strong>Die</strong> Zentralpositionen<br />

der beiden bei T =20K deutlich erkennbaren Nebenmax<strong>im</strong>a entsprechen der<br />

idealen Ikosaederkonfiguration, die Aufweitung der Peaks wird durch die thermischen<br />

Fluktuationen hervorgerufen.<br />

Der fest–flüssig Phasenübergang findet für Ar 13 zwischen 25 und 30 Kelvin<br />

statt (s. z.B. [?]) was sich für T = 30 K in dem Verschmelzen der beiden Nebenmax<strong>im</strong>a<br />

äußert. Physikalisch bedeutet dies, daß das System genug thermische<br />

Energie besitzt, um neben der dem Grundzustand entsprechenden Ikosaederstruktur<br />

auch höherenergetische Isomerkonfigurationen besetzen zu können.<br />

Der Ar 14 Cluster hat als ideale Grundkonfiguration dagegen die einfach dekorierte<br />

Ikosaederstruktur. <strong>Die</strong>s führt in der Paarkorrelationsfunktion zu einem dritten<br />

Nebenmax<strong>im</strong>um sehr geringer Höhe, daß in Abb. 9.1 schwach <strong>im</strong> Bereich von 9 bis<br />

10 Å zu erkennen ist. Auch bei diesem System wird der fest–flüssig Phasenübergang<br />

bei der höheren Temperatur deutlich .<br />

Da die Paarkorrelationsfunktion durch eine räumliche Fouriertransformation<br />

mit der Intensitätsverteilung I(s) des Streuspektrums verknüpft ist, enthält diese<br />

ebenfalls die volle Strukturinformation. Das Intensitätsspektrum wird bei kleinen<br />

Streuparametern s prinzipiell durch die gröberen Strukturen (die ”<br />

Einhüllende“) in<br />

der Paarkorrelationsfunktion best<strong>im</strong>mt, während der Verlauf von I(s) bei größeren<br />

Werten des Streuparamters den feineren Details von ,(r) entspricht.<br />

<strong>Die</strong>se Interpretation wird gestützt durch das klassisch errechnete Streuspektrum<br />

der beiden Argon–Cluster mit der nächsten abgeschlossenen Ikosaederschale<br />

(N =55) bzw. der einfach dekorierten Ikosaederstruktur (N =56) in Abbildung<br />

9.2. <strong>Die</strong> deutlich feiner strukturierte Paarkorrelationsfunktion ,(r) hat ihr Äquivalent<br />

in der größeren Zahl von Beugungsmax<strong>im</strong>a und –min<strong>im</strong>a <strong>im</strong> Intensitätsspektrum<br />

I(s).<br />

Für Neon–13–Cluster haben wir sowohl klassische als auch <strong>Pfadintegral</strong>–Monte–Carlo–S<strong>im</strong>ulationen<br />

mit jeweils 2 10 7 Iterationen durchgeführt (s. Abb. 9.3).<br />

Bei den PIMC–Rechnungen wurde eine gute Konvergenzrate für das Verhältnis<br />

M= = 120 k B von Zeitscheiben zu inverser Temperatur erzielt.


KAPITEL 9. ERGEBNISSE 67<br />

a)<br />

I(s)<br />

b)<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

−5<br />

−10<br />

T=20 K, N=13<br />

T=20 K, N=14<br />

T=35 K, N=13<br />

T=35 K, N=14<br />

−15<br />

1.0 3.0 5.0 7.0 9.0<br />

s [Å −1 ]<br />

1.0<br />

0.8<br />

T=20 K, N=13<br />

T=20 K, N=14<br />

T=35 K, N=13<br />

T=35 K, N=14<br />

Γ(r)<br />

0.6<br />

0.4<br />

0.2<br />

0.0<br />

3.0 5.0 7.0 9.0 11.0<br />

r [Å]<br />

Abbildung 9.1: (a) Streuspektrum I(s) und (b) Paarkorrelationsfunktion ,(r) (beide<br />

in willk. Einheiten) für ein klassisches Ensemble von Ar 13 und Ar 14 Clustern.


KAPITEL 9. ERGEBNISSE 68<br />

a)<br />

I(s)<br />

20<br />

15<br />

10<br />

5<br />

0<br />

−5<br />

T=25 K, N=55<br />

T=25 K, N=56<br />

T=35 K, N=55<br />

T=35 K, N=56<br />

b)<br />

Γ(r)<br />

−10<br />

1.0 3.0 5.0 7.0 9.0<br />

s [Å −1 ]<br />

0.30<br />

0.25<br />

0.20<br />

0.15<br />

0.10<br />

0.05<br />

T=25 K, N=55<br />

T=25 K, N=56<br />

T=35 K, N=55<br />

T=35 K, N=56<br />

0.00<br />

3.0 6.0 9.0 12.0 15.0 18.0<br />

r [Å]<br />

Abbildung 9.2: (a) Streuspektrum I(s) und (b) Paarkorrelationsfunktion ,(r) für<br />

ein klassisches Ensemble von Ar 55 und Ar 56 Clustern.


KAPITEL 9. ERGEBNISSE 69<br />

a)<br />

I(s)<br />

15<br />

10<br />

5<br />

0<br />

−5<br />

−10<br />

T=4.5 K (cl.)<br />

T=4.5 K (q.m.)<br />

T=9.0 K (cl.)<br />

T=9.0 K (q.m.)<br />

b)<br />

Γ(r)<br />

−15<br />

1.0 3.0 5.0 7.0 9.0<br />

s [Å −1 ]<br />

1.4<br />

1.2<br />

1.0<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

T=4.5 K (cl.)<br />

T=4.5 K (q.m.)<br />

T=9.0 K (c.l.)<br />

T=9.0 K (q.m.)<br />

0.0<br />

2.5 3.5 4.5 5.5 6.5 7.5<br />

r [Å]<br />

Abbildung 9.3: (a) Streuspektrum I(s) und (b) Paarkorrelationsfunktion ,(r) aus<br />

klassischen und <strong>Pfadintegral</strong>-MC–S<strong>im</strong>ulationen von Ne 13 Clustern.


KAPITEL 9. ERGEBNISSE 70<br />

<strong>Die</strong> Rechenzeit pro Zeitscheibe betrug für eine PIMC–S<strong>im</strong>ulation 34.45 CPU–<br />

Minuten auf dem CONVEX SPPUX Parallelrechner (1 GByte Hauptspeicher, 8<br />

Prozessoren) des Hochschulrechenzentrums der Universität Oldenburg.<br />

Auch für Ne 13 zeigen sich in der Paarkorrelationsfunktion wieder die drei<br />

für die Ikosaederkonfiguration charakteristischen Max<strong>im</strong>a. Es fällt auf, daß bei<br />

den quantenmechanisch errechneten Paarkorrelationsfunktionen die Peaks deutlich<br />

niedriger und breiter sind, als bei den entsprechenden klassisch errechneten Kurven,<br />

was auf die <strong>im</strong> quantenmechanischen Fall vorhandenen Nullpunktsschwingungen<br />

zurückzuführen ist. Wie auch zu erwarten ist, n<strong>im</strong>mt dieser quantenmechanische<br />

Effekt mit steigender Temperatur ab.<br />

Schließlich läßt sich aus den quantenmechanischen Kurven auch abschätzen,<br />

daß der fest–flüssig–Phasenübergang in einem Temperaturbereich 4 K T 9 K<br />

stattfindet.<br />

9.2 Best<strong>im</strong>mung von Erwartungswerten<br />

An dieser Stelle soll untersucht werden, inwieweit sich mit den in Abschnitt 7.3.4<br />

und 7.4 vorgestellten Formeln — die rein formal exakt sind — die Erwartungswerte<br />

für E pot und E kin bzw. die Temperatur T aus numerisch vorliegenden Spektren<br />

berechnen lassen.<br />

Da die eben angesprochenen Formeln in Kapitel 7 mit Hilfe verallgemeinerter<br />

Virialtheoreme hergeleitet werden, bezeichnen wir <strong>im</strong> weiteren Erwartungswerte,<br />

die über diese Formeln aus den Streuspektren berechnet werden, als viriale Erwartungswerte.<br />

Als erstes untersuchen wir die Berechnung der mittleren potentiellen Energie<br />

E pot aus einem vorgegebenem Streuspektrum I(s). Nach Gleichung (7.87) kann<br />

E pot aus einer Integration über das Produkt der Paarkorrelationsfunktion ,(r) und<br />

einem angenommenen Wechselwirkungspotential V (r) best<strong>im</strong>mt werden.<br />

Da die Paarkorrelationsfunktion sich aber nach (7.25) als Fourier–Transformierte<br />

des Streuspektrums I(s) darstellen läßt, finden wir die Formel<br />

Z<br />

N (N , 1) 1<br />

E pot = dsG pot (s) (9.1)<br />

2<br />

wobei G pot (s) als<br />

G pot (s) =4s 2 <br />

Itot (s)<br />

Njf (s)j 2 , 1 Z 1<br />

0<br />

0<br />

dr sin(sr)<br />

sr<br />

V (r) (9.2)<br />

definiert ist.<br />

Für jeden Streuparameter s gibt die Größe G pot (s) also an, wieviel die zu diesem<br />

Streuparameter gehörende Intensität zur potentiellen Energie beiträgt. <strong>Die</strong>ser<br />

Sachverhalt wird exemplarisch in Abbildung 9.4 (a) verdeutlicht. Dort wird für ein<br />

bei T =20K theoretisch errechnetes Intensitätsspektrum klassischer Ar 13 –Cluster<br />

sowohl G pot (s) als auch die unnormierte Größe R s<br />

0 G pot(s 0 )ds 0 gezeigt.


KAPITEL 9. ERGEBNISSE 71<br />

a)<br />

G pot<br />

(s) [meVÅ]<br />

2<br />

0<br />

−2<br />

−4<br />

−6<br />

G pot<br />

(s)<br />

Integral G pot<br />

(s) ds<br />

b)<br />

G kin<br />

(s) [meVÅ]<br />

−8<br />

60<br />

40<br />

20<br />

0<br />

−20<br />

−40<br />

−60<br />

−80<br />

0 5 10 15<br />

s [Å −1 ]<br />

G kin<br />

(s)<br />

Integral G kin<br />

(s)<br />

0 5 10 15<br />

s [Å −1 ]<br />

Abbildung 9.4: Beiträge der gemessenen Streuintensität I(s) zur potentiellen<br />

Rund kinetischen R Energie in Abhängigkeit vom Streuparameter s. <strong>Die</strong> Integrale<br />

1<br />

1<br />

G<br />

0 pot ds und G<br />

0 kin ds ergeben bei geeigneter Normierung die virialen Erwartungswerte<br />

für die potentielle und kinetische Energie.


KAPITEL 9. ERGEBNISSE 72<br />

Es ist gut zu erkennen, daß die Integralfunktion <strong>im</strong> wesentlichen einen monoton<br />

fallenden Verlauf hat und sich recht schnell auf einen stabilen Sättigungswert<br />

einpendelt. <strong>Die</strong>s bedeutet, daß Streuparameter größer als 15 Å ,1 nur noch geringe<br />

Beiträge zum Integral liefern.<br />

<strong>Die</strong> kinetische Energie läßt sich mittels (7.88) und (7.25) in analoger Weise als<br />

Funktional des Streuspektrums schreiben:<br />

E pot =<br />

N (N , 1)<br />

2<br />

Z 1<br />

G kin (s) = 4s 2 <br />

Itot (s)<br />

0<br />

dsG kin (s) (9.3)<br />

Njf (s)j 2 , 1 Z 1<br />

0<br />

dr sin(sr)<br />

sr<br />

rV 0 (r): (9.4)<br />

Auch für die kinetische Energie gibt G kin (s) an, wie die <strong>im</strong> Streuspektrum<br />

gemessene Intensität I(s) in den Erwartungswert für E kin eingeht. Für das schon<br />

oben erwähnte Beispielsystem R aus Ar 13 –Clustern bei 20 Kelvin sind in Abbildung<br />

s<br />

9.4 (b) G kin (s) und G 0 kin(s 0 )ds 0 aufgetragen.<br />

Hier fällt auf, daß die Integralfunktion sich nicht in eindeutiger Weise einem<br />

stabilen Wert nähert. Zunächst wird das Integral über G kin (s) sogar negativ, bevor<br />

es <strong>im</strong> hinteren Teil des Spektrums auf einen physikalisch sinnvollen, positiven Wert<br />

zustrebt.<br />

Im nächsten Schritt werden die aus den numerischen Streuspektren berechneten<br />

virialen Erwartungswerte für E pot und E kin mit den als exakt angenommenen<br />

Erwartungswerten aus den Monte–Carlo–S<strong>im</strong>ulationen verglichen. Dabei<br />

zeigt sich, daß die relative Abweichung E pot vernachlässigbar klein ist (E pot <br />

0:01%). <strong>Die</strong> Abweichung in der kinetischen Energie hängt dagegen stark von der<br />

Anzahl der Datenpunkte ab, mit der die Streuspektren numerisch dargestellt werden,<br />

und schwankt zwischen 1% und 30%.<br />

Es läst sich also festhalten, daß obwohl die beiden Formeln (7.87) und (7.88)<br />

mathematisch exakt sind, die Formel (7.88) zur Berechnung der kinetischen Energie<br />

numerisch weniger stabil ist als die Formel zur Berechnung der potentiellen<br />

Energie !<br />

<strong>Die</strong> Ursache für dieses völlig unterschiedliche Verhalten in der numerischen<br />

Anwendung kann nur darin zu suchen sein, daß bei der Berechnung der kinetischen<br />

Energie die Ableitung der Potentialfunktion V (r) eingeht.<br />

Betrachten wir dazu die Abbildung 9.5, in der der Verlauf der Potentialfunktion<br />

V (r) und ihrer Ableitung für zwei gängige Argon–Wechselwirkungspotentiale<br />

dargestellt ist. Zum einen ist dies das analytisch einfach darstellbare und deshalb<br />

häufig in S<strong>im</strong>ulationen verwendete Lennard–Jones–Potential. Zum anderen wird<br />

das laut [?] für gasförmige Argon–D<strong>im</strong>ere realistischere HFD–C–Potential von<br />

AZIZ ET. AL. gezeigt.


KAPITEL 9. ERGEBNISSE 73<br />

0<br />

V(r) [meV]<br />

−2<br />

−4<br />

−6<br />

−8<br />

−10<br />

V’(r) [meV]<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

−2<br />

−4<br />

L.−J.<br />

HFD−C<br />

3 4 5 6 7 8 9 1011<br />

r [Å]<br />

Lennard−Jones−(6,12)−Potential<br />

Aziz/Chen HFD−C Potential<br />

3 4 5 6 7 8 9<br />

r [Å]<br />

Abbildung 9.5: Wechselwirkungspotentiale für Argon: Lennard–Jones–(6,12)–<br />

Potential (durchgezogene Linie) und Aziz–HFD–C–Potential (gestrichelte Linie).<br />

Der Einschub zeigt die Ableitung beider Potentialfunktionen.<br />

Da für die nun folgende Diskussion nur der qualitative Verlauf des Wechselwirkungspotentials<br />

eine Rolle spielt, der sich für Argon wie für alle Edelgase bei den<br />

meisten empirisch best<strong>im</strong>mten Potentialfunktionen nur geringfügig unterscheidet,<br />

ist <strong>im</strong> weiteren nur von der Potentialfunktion die Rede.<br />

Zuerst betrachten wir, wie sich das Produkt aus der Paarkorrelationsfunktion<br />

,(r) und dem Potential bzw. der Ableitung des Potentials verhält. Sowohl V (r) als<br />

auch V 0 (r) sind numerisch gesehen für radiale Abstände r größer als 15 Å gleich<br />

Null. Andererseits führt der steile Hardcore-Anteil des Potentials dazu, daß in ,(r)<br />

der Nearest-Neighbour-Peak erst ab circa 3 Å beginnt, wie z.B. in Abbildung 9.1<br />

(b) zu erkennen ist. Nur in diesem Bereich liefern die radialen Integrationen in den<br />

Formeln für die potentielle und die kinetische Energie also einen nennenswerten<br />

Beitrag.<br />

Betrachten wir nun die Ableitung der Potentialfunktion etwas genauer: Ihr Verlauf<br />

wird in dem relevanten Bereich von 3 Å r 9 Å durch die große Steigung<br />

der Potentialfunktion in der Nähe des Min<strong>im</strong>ums und durch den Wendepunkt <strong>im</strong><br />

attraktiven Teil der Potentialfunktion geprägt. <strong>Die</strong> Ableitung V 0 (r) steigt bis zu<br />

ihrem Max<strong>im</strong>um an der Stelle des Wendepunktes von V (r) sehr viel steiler als die<br />

Potentialfunktion selbst an und sie hat zudem noch negative und positive Anteile.


KAPITEL 9. ERGEBNISSE 74<br />

Damit ist auch eine Erklärung für die numerischen Probleme bei der Berechnung<br />

der kinetischen Energie gefunden: Nur wenn in dem Bereich, wo die Ableitung<br />

V 0 (r) sich stark ändert, genügend viele Werte von ,(r) vorliegen, kann eine<br />

numerische Integration über das Produkt rV 0 (r),(r) ein vernünftiges Resultat<br />

liefern.<br />

9.3 Kalorische Zustandsgleichungen<br />

Ein umfassenderer Überblick über die Strukturumwandlungen innerhalb eines Systems<br />

von Clustern läßt sich dadurch gewinnen, daß die potentielle Energie der<br />

Cluster in Abhängigkeit von der kinetischen Energie, oder — <strong>im</strong> klassischen Grenzfall<br />

— in Abhängigkeit von der Temperatur aufgetragen wird. <strong>Die</strong> so entstehenden<br />

Kurven werden in der Literatur als kalorische Kurven oder kalorische Zustandsgleichungen<br />

bezeichnet.<br />

Nachdem wir <strong>im</strong> vorherigen Abschnitt die numerische Stabilität unserer Methode<br />

untersucht haben, wollen wir sie nun dazu benutzen, aus numerisch vorliegenden<br />

Spektren solche kalorischen Kurven E pot (E kin ) bzw. E pot (T ) zu berechnen.<br />

Als Testdaten verwenden wir die in Abschnitt 9.1 vorgestellten Streuspektren aus<br />

den Monte–Carlo–S<strong>im</strong>ulationen bzw. die dazugehörigen Paarkorrelationsfunktionen.<br />

Abbildung 9.6 zeigt die kalorischen Kurven für klassisch modellierte Systeme<br />

von (a) Ar 13 ,Ar 14 und (b) Ar 55 Clustern. <strong>Die</strong> mit ”<br />

quasi exakt“ bezeichneten<br />

Linien geben den Verlauf der kalorischen Zustandsgleichungen E pot (T ) wieder,<br />

wie er direkt in den klassischen MC–S<strong>im</strong>ulationen berechnet wurde. <strong>Die</strong> virialen<br />

Erwartungswerte sind durch Symbole markiert.<br />

Betrachten wir zunächst in beiden Teilbildern die exakten Ergebnisse. Für alle<br />

drei Clustergrößen N = 13; 14; 55 n<strong>im</strong>mt die Steigung der kalorischen Kurven<br />

— also die spezifische Wärme — plötzlich zu. <strong>Die</strong>ser Effekt kann nach BERRY<br />

als Indikator für das ”<br />

Schmelzen“ der Cluster aufgefaßt werden, bei dem in einer<br />

Koexistenzphase mehrere Clusterstrukturen gleichzeitig vorliegen können [?].<br />

Es fällt auf, daß die Temperatur, bei der dieser Effekt eintritt, für den 55er Cluster<br />

höher liegt als für die kleineren 13=14er Cluster und daß der Schmelzeffekt bei<br />

den kleineren Clustern weniger deutlich ausgerprägt ist. Außerdem ist in dem dargestellten<br />

Temperaturbereich nicht das nach dem Modell von Berry vorhergesagte<br />

Abflachen der kalorischen Kurve für größere Temperaturen zu beobachten, welches<br />

auf eine Beendigung der Koexistenzphase schliessen ließe. Der Grund dafür<br />

ist, daß die betrachteten Argon–Cluster in diesem Temperaturbereich nicht mehr<br />

stabil sind [?].<br />

<strong>Die</strong>se als exakt angenommenen kalorischen Kurven können nun mit Werten<br />

für E pot (T ) verglichen werden, die sich mit den Formeln (7.87) und (7.94) aus den<br />

in Abbildung 9.1 dargestellten Streuspektren und einem angenommenen Wechselwirkungspotential<br />

V (r) berechnen lassen.


KAPITEL 9. ERGEBNISSE 75<br />

a)<br />

E pot<br />

[meV]<br />

−320<br />

−360<br />

−400<br />

−440<br />

quasi exact (N=13)<br />

quasi exact (N=14)<br />

virial est. LJ−pot (N=13)<br />

virial est. LJ−pot (N=14)<br />

virial est. HFD−C−pot (N=14)<br />

b)<br />

−480<br />

10 15 20 25 30 35 40<br />

T kin<br />

[K]<br />

−2200<br />

quasi exact (N=55)<br />

virial est. (15 Punkte/Å)<br />

virial est. (18 Punkte/Å)<br />

E pot<br />

[mev]<br />

−2400<br />

−2600<br />

−2800<br />

10 15 20 25 30 35 40<br />

T [K]<br />

Abbildung 9.6: Kalorische Zustandsgleichungen für klassische Ensembles von<br />

Argon–Clustern: (a) quasi exakte Kurven aus den MC–S<strong>im</strong>ulationen und viriale<br />

Näherungskurve für Ar 13 und Ar 14 Cluster, (b) quasi exakte Kurve und viriale<br />

Näherungskurven für zwei verschieden genau abgetastete Paarkorrelationsfunktionen<br />

von Ar 55 Clustern.


KAPITEL 9. ERGEBNISSE 76<br />

Wird für die interatomare 2–Teilchen–Wechselwirkung V (r) dasselbe Lennard–Jones–Potential<br />

(8.1) gewählt, das auch in den numerischen S<strong>im</strong>ulationen<br />

verwendet wurde, so ergeben sich in Abbildung 9.6 (a) und (b) die mit dem Diamant–<br />

Symbol und die mit kleinen Kreisen versehenen virialen Erwartungswerte für<br />

die potentielle Energie.<br />

<strong>Die</strong> virialen kalorischen Kurven st<strong>im</strong>men offensichtlich für die beiden kleinen<br />

Cluster gut mit den exakten Kurvenverläufen überein. Insgesamt betrachtet scheinen<br />

die virialen Kurven gegenüber den exakten Kurven zu etwas niedrigeren Temperaturen<br />

verschoben zu sein. Lediglich <strong>im</strong> Bereich des Phasenübergangs ergeben<br />

sich etwas größere Abweichungen als <strong>im</strong> Tieftemperaturbereich.<br />

<strong>Die</strong> Abweichung der virialen von der exakten kalorischen Kurve wird also<br />

durch den Fehler in der Temperatur best<strong>im</strong>mt, für die ausschließlich zu kleine<br />

Werte gefunden wurden. <strong>Die</strong>se Beobachtung steht in Einklang mit der Feststellung<br />

aus Abschnitt 9.2, daß die Berechnung der kinetischen Energie — und damit<br />

der Temperatur — sich numerisch viel ungünstiger verhält, als die Berechnung der<br />

potentiellen Energie.<br />

Anhand der kalorischen Kurve der Ar 55 Cluster läßt sich dieser Befund noch<br />

deutlicher ablesen. In Abbildung 9.6 (b) sind zwei viriale kalorische Kurven aufgetragen,<br />

die aus numerisch verschieden genau bekannten Spektren berechnet wurden.<br />

Wird der Kurvenverlauf von , durch 15 Funktionswerte pro Angstrøm beschrieben,<br />

so wird die Temperatur um einen konstanten Wert von (3 0:2) Kelvin<br />

zu niedrig berechnet. Bei einer Abtastrate von 18 Funktionswerten pro Angstrøm<br />

reduziert sich der konstante Fehler schon auf (2:2 0:2) Kelvin.<br />

In Abbildung 9.7 wird für die bis jetzt diskutierten Ar 13;14 und Ar 55;56 –Cluster<br />

eine Übersicht über den absoluten Fehler in der Temperatur gegeben, wie er bei<br />

der Berechnung aus den Streuspektren nach Gleichung (7.94) auftaucht.<br />

Wie in Abschnitt 9.2 vorhergesagt wurde, zeigt sich also, daß das Ergebnis<br />

der Temperaturberechnung nach Formel (7.94) sehr sensibel davon abhängt, wie<br />

genau der Verlauf des Intensitätsspektrums I(S) bzw. der Paarkorrelationsfunktion<br />

, bekannt ist.<br />

Abschließend untersuchen wir noch für das System aus Ar 14 –Clustern, welche<br />

Auswirkung die Wahl des Wechselwirkungspotentials auf die kalorische Kurve hat.<br />

Wählen wir an Stelle des Lennard–Jones–Potentials das realistischere HFD–C–<br />

Potential von AZIZ ET AL., so ergibt sich die in Abbildung 9.6 (a) mit Kreuzen<br />

markierte kalorische Kurve. <strong>Die</strong>se viriale kalorische Kurve ist nicht nur zu deutlich<br />

höheren potentiellen Energien und niedrigeren Temperaturen verschoben, sondern<br />

sie zeigt auch <strong>im</strong> Bereich des Phasenübergangs einen wesentlich steileren Anstieg.<br />

<strong>Die</strong> Ursache für diese drastischen Unterschiede zwischen der virialen und der<br />

exakten kalorischen Kurve hängen damit zusammen, daß wir in den (als exakt angenommenen)<br />

MC–S<strong>im</strong>ulationen das Lennard–Jones–Potential verwendet haben.<br />

In Abbildung 9.5 ist jedoch zu erkennen, daß sich das HFD–C vom Lennard–<br />

Jones–Potential gerade für solche Abstände r signifikant unterscheidet, die entscheidend<br />

in die Berechnung der potentiellen Energie und der Temperatur einge-


KAPITEL 9. ERGEBNISSE 77<br />

hen.<br />

T − T est<br />

[K]<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

N = 13<br />

N = 14<br />

N = 55<br />

N = 56<br />

−1<br />

10 15 20 25 30 35 40<br />

T [K]<br />

Abbildung 9.7: Absolute Abweichung der über Gleichung (7.94) best<strong>im</strong>mten Temperatur<br />

T est von der exakten Temperatur T für Ar 13;14 und Ar 55;56 –Cluster. Für die<br />

kleineren Cluster wurden Spektren mit 15 Datenpunkten pro Å und für die größeren<br />

Cluster Spektren mit 18 Datenpunkten pro Å verwendet.<br />

Wenden wir uns nun dem System aus Ne 13 –Clustern zu, daß wir klassisch und<br />

quantenmechanisch behandelt haben. Im quantenmechanischen Fall sind wir mit<br />

der in Kapitel 7 vorgestellten Methode nicht in der Lage, die innere Temperatur<br />

der Cluster zu best<strong>im</strong>men, es kann lediglich der Erwartungswert für die kinetische<br />

Energie best<strong>im</strong>mt werden.<br />

In der sich so ergebenden Kurve E pot (E kin ), die in Abbildung 9.8 (a) gezeigt<br />

wird, ist sehr schön der Phasenübergang von der ”<br />

festen“ zur ”<br />

flüssigen“ Clusterstruktur<br />

zu erkennen. Der Vergleich mit den als exakt interpretierten Werten aus<br />

den PIMC–S<strong>im</strong>ulationen zeigt, daß sich beide Kurven nur <strong>im</strong> Koexistenzbereich<br />

des Phasenübergangs deutlich unterscheiden lassen, die virialen Erwartungswerte<br />

liefern für E kin wieder zu kleine Werte. Mit dem Abflachen der Kurve ab einem<br />

Wert von 24 meV für die kinetische Energie st<strong>im</strong>men die virialen Werte wieder<br />

besser mit den S<strong>im</strong>ulationswerten überein.


KAPITEL 9. ERGEBNISSE 78<br />

a)<br />

E pot<br />

[meV]<br />

−80<br />

−90<br />

−100<br />

quasi exact<br />

virial est.<br />

b)<br />

E pot<br />

[meV]<br />

−110<br />

−100<br />

−110<br />

−120<br />

−130<br />

22 23 24 25<br />

E kin<br />

[meV]<br />

quasi exact<br />

virial est.<br />

−140<br />

2 4 6 8 10<br />

T [K]<br />

Abbildung 9.8: Klassische und quantenmechanische Zustandsgleichungen von<br />

Ne 13 Clustern: (a) quasi exakte Kurve aus <strong>Pfadintegral</strong>-MC–S<strong>im</strong>ulationen und viriale<br />

Näherungskurve, (b) quasi exakte Kurve aus klassischen MC–S<strong>im</strong>ulationen<br />

und und viriale Näherungskurve.


KAPITEL 9. ERGEBNISSE 79<br />

Wird dasselbe System aus Ne 13 –Clustern klassisch untersucht, so ergibt sich<br />

die in Abbildung 9.8 (b) gezeigte Kurve für die potentielle Energie. Wieder st<strong>im</strong>men<br />

die virialen Erwartungswerte mit den S<strong>im</strong>ulationswerten gut überein.<br />

In ihrem Verlauf ähnelt die kalorische Kurve stark der entsprechenden Kurve<br />

für die klassischen Ar 13 –Cluster aus Abbildung 9.6 (a). Auf Grund der geringeren<br />

Atommasse sind die Ne 13 –Cluster nur über einen wesentlich kleineren Temperaturbereich<br />

stabil als die Ar 13 –Cluster, der Phasenübergang beginnt schon bei<br />

Temperaturen um 8 Kelvin.<br />

Auch für die kinetische Energie können wir die virialen Erwartungswerte mit<br />

den exakten Werten aus den numerischen S<strong>im</strong>ulationen vergleichen. In Abbildung<br />

9.9 (a) sind beide Werte sowohl für den klassischen als auch für den quantenmechanischen<br />

Fall aufgetragen. In beiden Fällen st<strong>im</strong>men die viriale und die exakte<br />

Kurve wieder gut überein.<br />

Das Teilbild (b) zeigt für beide Energiekurven die absolute Abweichung<br />

E kin = E exakt<br />

kin<br />

, E virial<br />

kin (9.5)<br />

der virialen Werte von den exakten Werten. Es fällt auf, daß <strong>im</strong> klassischen Fall der<br />

Fehler über einen großen Temperaturbereich fast konstant ist und über dem Fehler<br />

der quantenmechanischen Rechnungen liegt. Der größere Fehler wird dadurch<br />

erklärt, daß zur Berechnung der quantenmechanischen Werte wieder Paarkorrelationsfunktionen<br />

mit einer höheren Punktdichte verwendet wurden.<br />

<strong>Die</strong> ”<br />

Glattheit“ der klassischen Kurven resultiert daraus, daß bei der opt<strong>im</strong>ierten<br />

Datenanalyse die Information von wenigen bei fester Temperatur durchgeführten<br />

MC–S<strong>im</strong>ulationen auf einen ganzen Temperaturbereich extrapoliert wird. Im<br />

quantenmechanischen Fall wurde dagegen für jeden gezeigten Datenpunkt eine<br />

unabhängige PIMC–S<strong>im</strong>ulation gestartet.<br />

9.4 Best<strong>im</strong>mung der spezifischen Wärme<br />

Ähnlich wie bei makroskopischen Systemen ist die spezifische Wärme eine weitere<br />

wichtige Größe für die Best<strong>im</strong>mung von Phasenübergängen in mesoskopischen<br />

Systemen wie z.B. Mikroclustern.<br />

Als Beispiel für die Best<strong>im</strong>mung der spezifischen Wärme wollen wir das kanonische<br />

Ensemble von Ne 13 –Clustern betrachten, für das wir klassische und quantenmechanische<br />

S<strong>im</strong>ulationsrechnungen durchgeführt haben. Da die translatorischen<br />

Freiheitsgrade für die Strukturveränderungen innerhalb eines Clusters nicht<br />

relevant sind, beschränken wir uns auch hier auf die inneren Freiheitsgrade.<br />

Für dieses System können wir die Wärmekapazität bei konstantem Volumen<br />

C V (T ) als Steigung der kalorischen Kurve E(T ) berechnen:<br />

<br />

C V (T )= @E<br />

@T ; (9.6)<br />

V


KAPITEL 9. ERGEBNISSE 80<br />

a)<br />

30<br />

25<br />

b)<br />

E kin<br />

[meV]<br />

20<br />

15<br />

10<br />

5<br />

0<br />

0.50<br />

qm: quasi exact<br />

qm: virial est.<br />

cl: quasi exact<br />

cl: virial est.<br />

2 4 6 8 10 12<br />

T [K]<br />

0.40<br />

∆E kin<br />

[meV]<br />

0.30<br />

0.20<br />

0.10<br />

0.00<br />

2 4 6 8 10 12<br />

T [K]<br />

Abbildung 9.9: (a)Vergleich von klassischer und quantenmechanischer kinetische<br />

Energie für ein Ensemble aus Ne 13 Clustern. (b) Absolute Abweichung der klassischen<br />

und quantenmechanischen virialen kinetischen Energie von der exakten<br />

kinetischen Energie für Ne 13 Cluster.


KAPITEL 9. ERGEBNISSE 81<br />

aus der sich die entsprechende spezifische Wärme durch Bezug auf die Teilchenzahl<br />

ergibt.<br />

Mit der in dieser Arbeit entwickelten Methode ist es nur <strong>im</strong> klassischen Fall<br />

möglich, die innere Energie in Abhängigkeit von der Temperatur aus den Streuspektren<br />

zu berechnen. Im quantenmechanischen Fall kann nur die potentielle Energie<br />

als Funktion der kinetischen Energie best<strong>im</strong>mt werden. Strenggenommen kann<br />

damit auch die Wärmekapazität bei konstantem Volumen als Ableitung der kalorischen<br />

Kurve E(T ) nur <strong>im</strong> klassischen Fall errechnet werden.<br />

Um trotzdem einen Vergleich von klassischen und quantenmechanischen Ergebnissen<br />

zu ermöglichen, benutzen wir die aus den S<strong>im</strong>ulationsrechnungen bekannte<br />

Zuordnung von kinetischer Energie zu Temperatur, um auch für den quantenmechanischen<br />

Fall eine Kurve E(T ) zur Verfügung zu haben.<br />

Nach Interpolation der klassischen und quantenmechanischen kalorischen Kurven<br />

durch geeignete least-squares-Fits können die Wärmekapazitäten für beide<br />

Fälle durch numerische Differentiationen best<strong>im</strong>mt werden. Als Fit-Funktionen<br />

wurden <strong>im</strong> klassischen Fall kubische B–Splines 3. Ordnung und <strong>im</strong> quantenmechanischen<br />

Fall ein Polynom 3. Ordnung benutzt.<br />

10.0<br />

C V<br />

[meV/K]<br />

8.0<br />

6.0<br />

4.0<br />

2.0<br />

0.0<br />

cl: quasi exact<br />

cl: virial est.<br />

qm: quasi exact<br />

qm: virial est.<br />

2.0 4.0 6.0 8.0 10.0<br />

T [K]<br />

Abbildung 9.10: Klassisch und quantenmechanisch berechnete Wärmekapazität<br />

bei konstanten Volumen C V (T ) für Ne 13 –Cluster.<br />

<strong>Die</strong> so errechneten Wärmekapazitäten C V (T ) sind in Abbildung 9.10 darge-


KAPITEL 9. ERGEBNISSE 82<br />

stellt. <strong>Die</strong> Übereinst<strong>im</strong>mung zwischen den aus den virialen Kurven errechneten<br />

Wärmekapazitäten, für die der Übersichtlichkeit halber nur einzelne Punkte eingezeichnet<br />

sind, und den aus den S<strong>im</strong>ulationsdaten errechneten Wärmekapazitäten<br />

ist nahezu perfekt.<br />

Bei der klassischen Wärmekapazität ist gut zu erkennen, daß sie für kleine<br />

Temperaturen dem konstanten Wert 3(N , 1)k B ann<strong>im</strong>mt und <strong>im</strong> Bereich des Phasenübergangs<br />

ab ungefähr 8 Kelvin mit der quantenmechanischen Kurve zusammenfällt.<br />

<strong>Die</strong>se nähert sich wiederum dem Nullpunkt proportional zu T 3 ,wiees<br />

auch durch das quantenmechanische Normalmodenmodell von FRANKE vorhergesagt<br />

wird [?].


Kapitel 10<br />

Zusammenfassung und Ausblick<br />

In diesem zweiten Teil der Diplomarbeit wurde untersucht, wie sich aus exper<strong>im</strong>entell<br />

gemessenen Streuspektren atomarer Cluster Rückschlüsse auf Phasenübergänge<br />

in diesen Clustern ziehen lassen.<br />

Phasenübergänge in Clustern lassen sich u.a. durch plötzliche Änderungen<br />

in den kalorischen Kurven E(T ) und ihrer Ableitungen, den Wärmekapazitäten<br />

C V (T ) feststellen. Bei dem bisherigen Standardverfahren zur Analyse von Streuspektren<br />

lassen sich die Energie und die Temperatur nur auf indirekte Weise ermitteln,<br />

indem mit Molekulardynamik– oder Monte–Carlo–S<strong>im</strong>ulationen theoretische<br />

Streuspektren errechnet und visuell mit den exper<strong>im</strong>entell gemessenen Spektren<br />

verglichen werden.<br />

<strong>Die</strong> bisherige Vorgehensweise hat den Nachteil, daß zum einen zeitaufwendige<br />

numerische S<strong>im</strong>ulationen durchgeführt werden müssen und zum anderen ein<br />

subjektives Element durch den visuellen Vergleich von Spektren eingeführt wird.<br />

In dieser Arbeit haben wir nun eine Methode entwickelt, mit der für atomare<br />

Cluster direkt aus den gemessenen Streuspektren die potentielle und kinetische<br />

Energie sowie <strong>im</strong> klassischen L<strong>im</strong>es die Temperatur berechnet werden können.<br />

Dazu wurde benutzt, daß die gemessenen Streuspektren sich als dreid<strong>im</strong>ensionale<br />

Fourier–Transformierte der räumlichen Paarkorrelationsfunktion interpretieren<br />

läßt.<br />

Ausgehend von den von HIRSCHFELDER eingeführten verallgemeinerten Virialtheoremen<br />

(Hypervirialtheoremen) wurde gezeigt, daß sich für ein kanonisches<br />

Ensemble von atomaren Clustern die Energien und die Temperatur über eine einfache<br />

Integration aus der Paarkorrelationsfunktion und einem angenommenen paarweisen<br />

Wechselwirkungspotential berechnen lassen.<br />

Es wurde erläutert, wie die so hergeleiteten Formeln zur Berechnung der Energien<br />

und der Temperatur modifiziert werden müssen, damit sie auch bei exper<strong>im</strong>entell<br />

vorliegenden diskreten Verteilungen (N ) von Clustern verschiedener<br />

Teilchenzahlen N angwendet werden können.<br />

Weiterhin wurde untersucht, ob unsere neue Methode auch für praktische Anwendungen<br />

geeignet ist. Dazu wurden mit klassischen Monte–Carlo und Pfadinte-<br />

83


KAPITEL 10. ZUSAMMENFASSUNG UND AUSBLICK 84<br />

gral–Monte–Carlo S<strong>im</strong>ulationen theoretische Streuspektren von kanonischen Ensembles<br />

aus Argon– und Neon–Clustern berechnet.<br />

Obwohl sowohl die potentielle Energie als auch die kinetische Energie bzw.<br />

die Temperatur mit unserer Methode formal exakt berechenbar sein müßten, zeigte<br />

es sich, daß die Berechnung der kinetischen Energie bzw. der Temperatur numerisch<br />

weniger stabil ist, während der Fehler bei der Berechnung der potentiellen<br />

Energie zu vernachlässigen ist. Als Ursache für dieses unterschiedliche numerische<br />

Verhalten der kinetischen Energie wurde die Ableitung der Potentialfunktion<br />

identifiziert und es wurde erklärt, wie sich der daraus resultierende Fehler in der<br />

Energieberechnung min<strong>im</strong>ieren läßt.<br />

Außerdem wurde diskutiert, inwieweit die Wahl der Potentialfunktion das Ergebnis<br />

der Berechnung beeinflußt. Es wurde festgestellt, daß für sich nur wenig unterscheidende<br />

Potentialfunktionen ähnliche Resultate bei der Energieberechnung<br />

zu erwarten sind.<br />

Schließlich wurde beschrieben, wie sich aus den so errechneten Energiekurven<br />

die spezifische Wärme berechnen läßt und wie aus beiden Größen Rückschlüsse<br />

auf Phasenübergänge innerhalb der betrachteten Cluster gezogen werden können.<br />

Als Fazit läßt sich festhalten, daß diese neue Methode prinzipiell eine schnellere<br />

und genauere Berechnung der Energien und Temperaturen atomarer Cluster aus<br />

gemessenen Streuspektren erlauben sollte als die bisherigen Verfahren. Eine definitive<br />

Aussage darüber läßt sich sicherlich nur dann treffen, wenn dieses Verfahren<br />

auf ”<br />

echte“ exper<strong>im</strong>entelle Streuspektren angewendet wird.<br />

<strong>Die</strong> in diesem Teil der Diplomarbeit erzielten Ergebnisse wurden als Artikel<br />

für die Veröffentlichung in ZEITSCHRIFT FÜR PHYSIK D eingereicht. Der Preprint<br />

des Artikels ist in Anhang B angefügt.


Anhang A<br />

Grundlagen von<br />

Monte–Carlo–Verfahren<br />

In diesem Anhang sind die für das Verständnis der Arbeit benötigten theoretischen<br />

Grundlagen zur Technik der Monte–Carlo–S<strong>im</strong>ulation in knapper Form zusammengestellt.<br />

<strong>Die</strong> Darstellung der wahrscheinlichkeitstheoretischen Grundlagen und der Markoffschen<br />

Ketten orientiert sich <strong>im</strong> wesentlich an den Lehrbüchern von KRENGEL<br />

[?] und RÖMER und FILK [?] und an dem Taschenbuch der Mathematik [?, ?].<br />

<strong>Die</strong> Beschreibung des Metropolis Algorithmus basiert zu großen Teilen auf dem<br />

Übersichtsartikel von BHANOT [?].<br />

Monte–Carlo–Verfahren werden <strong>im</strong> allgemeinen dazu benutzt, abstrakte mathematische<br />

Zufallsexper<strong>im</strong>ente numerisch zu s<strong>im</strong>ulieren. Mit solchen Zufallsexper<strong>im</strong>enten<br />

werden in der Regel unbekannte Größen berechnet, die mit Hilfe<br />

mathematischer Modelle als Erwartungswerte best<strong>im</strong>mter Zufallsvariablen X, also<br />

=E(X), interpretiert werden.<br />

<strong>Die</strong>se einfache Grundidee wird in den folgenden Abschnitten mathematisch<br />

präzisiert, wobei der Einfachheit halber nur der eind<strong>im</strong>ensionale Fall betrachtet<br />

wird.<br />

A.1 Zufallsgrößen<br />

Ein Vorgang, dessen Ausgang nur vom Zufall abhängt, heißt ein Zufallsexper<strong>im</strong>ent<br />

und die möglichen Ergebnisse eines Zufallsexper<strong>im</strong>entes heißen Ereignisse. <strong>Die</strong><br />

fundamentale Annahme in dem mathematischen Formalismus der Wahrscheinlichkeitstheorie<br />

ist nun, daß sich die Ergebnisse eines Zufallsexper<strong>im</strong>entes mit Hilfe<br />

einer abstrakten Menge beschreiben lassen. <strong>Die</strong>se Menge wird Menge der<br />

Elementarereignisse, Stichprobenraum oder auch Ereignisraum genannt und die<br />

Elemente von heißen Elementarereignisse.<br />

Nun kann der Stichprobenraum eine überabzählbare Menge sein, so daß es<br />

nicht möglich ist, jeden Ausgang des Zufallsexper<strong>im</strong>entes (ein Ereignis) mit genau<br />

85


ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 86<br />

einem Elementarereignis zu identifizieren und damit jedem Elementarereignis eine<br />

best<strong>im</strong>mte Wahrscheinlichkeit zuzuordnen. <strong>Viel</strong>mehr wird jedes Ereignis einer<br />

Menge von Elementarereignissen, also einer Teilmenge von entsprechen.<br />

Vom mathematischen Standpunkt ist es praktisch, nur Teilmengen von zuzulassen,<br />

die sich untereinander über best<strong>im</strong>mte algebraische Relationen verknüpfen<br />

lassen - sogenannte –Algebren. Damit lassen sich nämlich jetzt den Teilmengen<br />

einer solchen –Algebra Wahrscheinlichkeiten so zuordnen, daß die üblichen Rechenregeln<br />

(Kolmogorowsche Axiome) für Wahrscheinlichkeiten erfüllt sind. <strong>Die</strong><br />

Abbildung, die dies bewerkstelligt, heißt Wahrscheinlichkeitsmaß.<br />

<strong>Die</strong> Grundlage der Wahrscheinlichkeitstheorie bildet also ein Tripel (; ;)<br />

genannt Wahrscheinlichkeitsraum, daß aus der Menge der Elementarereignisse ,<br />

der –Algebra und dem Wahrscheinlichkeitsmaß :,! R besteht.<br />

Für die Anwendung in der Physik sind folgende Wahrscheinlichkeitsräume von<br />

besonderer Bedeutung:<br />

Der diskrete Fall =N:<br />

<strong>Die</strong> –Algebra ist die Menge aller Teilmengen von N. Das Wahrscheinlichkeitsmaß<br />

ist : N ,! [0; 1] mit (i) = i .<br />

Der kontinuierliche Fall =R N :<br />

<strong>Die</strong> –Algebra ist die Menge aller Teilmengen von R N , die sich durch<br />

die in definierten algebraischen Operationen aus Hyperquadern V =<br />

[a 1 ;b 1 ][a N ;b N ] erzeugen lassen. Das Wahrscheinlichkeitsmaß wird<br />

z.B. über eine Wahrscheinlichkeitsdichtefunktion (x) und das Lebesgue-<br />

Maß definiert, so daß einer Teilmenge E 2 die Wahrscheinlichkeit<br />

(E) =<br />

Z<br />

E<br />

(x)dx<br />

(A.1)<br />

zugeordnet wird.<br />

Eine Funktion f : ,! R heißt meßbar (genauer: -meßbar), wenn das<br />

Urbild jeder meßbaren Menge in R eine meßbare Menge in ist. Jede meßbare<br />

Funktion f : ,! R wird auch Zufallsvariable genannt und für sie läßt sich<br />

mittels<br />

f (M )=(f ,1 [M ]); M R (A.2)<br />

ein Wahrscheinlichkeitsmaß f auf ] ,1; 1[ definieren, das die Wahrscheinlichkeitsverteilung<br />

von f genannt wird.<br />

Mit Hilfe dieses Maßes läßt sich nun der Erwartungswert einer Zufallsvariablen<br />

f berechnen:<br />

E(f )=<br />

Z<br />

<br />

f d =<br />

Z<br />

R<br />

x d f (x) =<br />

Z<br />

R<br />

xw f (x)dx:<br />

(A.3)<br />

Im letzten Schritt der Gleichungskette wurde dabei die Wahrscheinlichkeitsdichte<br />

w f (x) = d f<br />

dx<br />

(A.4)


ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 87<br />

definiert.<br />

Insbesondere lassen sich so auch die Erwartungswerte von meßbaren, reellwertigen<br />

Funktionen F der Zufallsvariablen f erklären:<br />

E(F )=<br />

Z<br />

R<br />

F (f (x))w f (x)dx:<br />

(A.5)<br />

Nach dem starken Gesetz der großen Zahl läßt sich der Erwartungswert in Gleichung<br />

(A.5) zumindestens näherungsweise best<strong>im</strong>men: Seien ff (! 1 );::: ;f(! n )j! i 2<br />

g Werte der Zufallsvariablen f (eine Stichprobe, engl. sample). Dann liefert<br />

F = 1 n<br />

nX<br />

i=1<br />

F (f (! i ))<br />

(A.6)<br />

eine erwartungstreue und konsistente Schätzfunktion für E(F ).D.h.esistE( F )=<br />

E(F ) und es gilt<br />

8 >0 8 >0 9 n 0 (; ) 2 N = f1; 2;:::g<br />

8 n n 0 : P (j F , E(F )j 1 , : (A.7)<br />

Hat die Zufallsvariable f eine endliche Varianz, so folgt aus der Tschebyscheffschen<br />

Ungleichung, daß der Fehler, der in Gleichung (A.6) gemacht wird, proportional<br />

zu n ,1=2 ist, also gleich Cn ,1=2 .<br />

Das starke Gesetz der großen Zahl besagt also, daß sich für eine genügend<br />

große Anzahl von Werten einer Zufallsgröße jeder Erwartungswert beliebig genau<br />

annähern läßt und bildet damit die Grundlage für die in der Einleitung allgemein<br />

formulierte Idee des Monte–Carlo–Verfahrens.<br />

In Gleichung (A.6) wird allerdings keine Aussage darüber gemacht, wie groß<br />

der Stichprobenumfang n gewählt werden muß, damit der Fehler klein genug wird.<br />

<strong>Die</strong>s hängt einzig und allein von der Proportionalitätskonstante C ab. Es läßt sich<br />

aber festhalten, daß die Abweichung umso geringer sein wird, je näher die Verteilung<br />

der Stichprobenwerte f i an der Wahrscheinlichkeitsverteilungsdichte w f der<br />

Zufallsvariablen f liegt.<br />

Eine solche Stichprobe läßt sich am effektivsten als eine sogenannten Markoffsche<br />

Kette konstruieren.<br />

A.2 Markoffsche Ketten<br />

Um den mathematischen Formalismus nicht ausufern zu lassen, werden <strong>im</strong> folgenden<br />

nur Wahrscheinlichkeitsräume mit diskretem Ereignisraum und Zufallsvariablen<br />

f mit diskretem Wertebereich betrachtet.<br />

Für den Formalismus der klassischen statistischen Physik stellt dies keine große<br />

Einschränkung dar, da der kontinuierliche Phasenraum durch eine geeignete Einteilung<br />

in Zellen gut approx<strong>im</strong>iert werden kann und durch die Diskretisierung des<br />

Phasenraumes auch das Energiespektrum diskret wird.


ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 88<br />

Sei nun ff n ;n =0; 1; 2; 3;:::g eine Familie von Zustandsvariablen mit einem<br />

diskreten Ereignisraum . Wir interpretieren f i (!) = x i als den Zustand eines<br />

abstrakten Systemes zur Markoff–Zeit n und bezeichnen den abzählbarem Wertebereich<br />

X = fx n ;n =0; 1; 2; 3;:::g als Zustandsraum.<br />

Eine solche Familie von Zustandsvariablen bildet eine Markoffsche Kette,wenn<br />

sie die Eigenschaft besitzt, daß die Wahrscheinlichkeit, <strong>im</strong> n+1–ten Schritt in einen<br />

beliebigen Zustand zu gelangen, nur vom Zustand <strong>im</strong> Schritt n abhängt, aber nicht<br />

davon, in welchen Zuständen das System früher war.<br />

Hängt weiter für zwei beliebige Zustände x und x 0 die Übergangswahrscheinlichkeit<br />

P xx 0 := P (f n = x ! f n+1 = x 0 ) nicht davon ab, in welchem Schritt<br />

der Markoffschen Kette der Übergang stattfindet, so heißt die Kette homogen und<br />

sie läßt sich vollständig beschreiben durch die Angabe einer stochastischen Matrix<br />

P =(P xx 0) mit den Eigenschaften<br />

1. 8 x; x 0 2X : P xx 0 0<br />

P<br />

2.<br />

x 0 2X P x 0 x =1(Erhaltung der Gesamtwahrscheinlichkeit)<br />

und durch eine initiale Wahrscheinlichkeitsverteilung<br />

0 =( 0 [x];x 2X) mit 0 [x] =P (f 0 = x) (A.8)<br />

Im weiteren beschränken wir uns auf die Betrachtung von Markoffschen-Ketten,<br />

die das Kriterium der strengen Ergodizität erfüllen, d.h. es soll möglich sein, von<br />

jedem Zustand x zu jedem anderen Zustand x 0 zu gelangen. <strong>Die</strong>s ist jedenfalls dann<br />

der Fall, wenn es für je zwei Zustände x und x 0 eine natürliche Zahl n gibt, so daß<br />

P n x 0 x :=<br />

X<br />

x1;::: ;x n,1<br />

P x0 x n,1 P x n,1x n,2 :::P x1x > 0<br />

(A.9)<br />

Nach einem Satz von Frobenius und Peron besitzt unter diesen Voraussetzungen<br />

die stochastische Matrix P den nichtentarteten und betragsmäßig größten Eigenwert<br />

1, wobei der dazugehörige Eigenvektor =([x];x2X) positive Komponenten<br />

[x] > 0 besitzt und P die Summe aller Komponenten (ev. nach geeigneter<br />

Normierung) gerade 1 ergibt:<br />

x [x] =1.<br />

Hieraus läßt sich folgern [?], daß die Übergangswahrscheinlichkeiten P x0 x gegen<br />

die von x unabhängige Zahlen [x 0 ] konvergieren:<br />

l<strong>im</strong> P n = P 1 und P 1 n!1<br />

x 0 x = [x0 ] (A.10)<br />

Für jede beliebige initiale Wahrscheinlichkeitsverteilung 0 folgt somit:<br />

X<br />

x2X<br />

P 1 x 0 x 0[x] =[x]<br />

(A.11)<br />

d.h. nach unendlich“ vielen Schritten generiert die Markoffsche Kette eine Wahrscheinlichkeitsverteilung<br />

unabhängig von der Ausgangsverteilung 0 . Insbeson-<br />

”<br />

dere ergibt sich diese Ausgangsverteilung ausgehend von der initialen Wahrscheinlichkeitsverteilung<br />

0 [x] = x;x 0 , es ist also möglich, von einer genau definierten<br />

Systemkonfiguration aus zu starten.


ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 89<br />

Es bleibt also nur noch sicherzustellen, daß die in unserem Fall gewünschte<br />

Wahrscheinlichkeitsdichte w f gerade ein Eigenvektor einer Markoffschen stochastischen<br />

Matrix P x 0 x zum Eigenwert 1 ist.<br />

Eine hinreichende Bedingung dafür ist, daß bei der Auswahl einer neuen Konfiguration<br />

x 0 für den nächsten Schritt in der Markoffschen Kette die Bedingung des<br />

detaillierten Gleichgewichtes (detailed balance) erfüllt ist:<br />

P x0 x w f [x] =P xx 0 w f [x 0 ]<br />

(A.12)<br />

Mit Gleichung (A.12) und der Erhaltung der Gesamtwahrscheinlichkeit für die stochastische<br />

Matrix (P xx 0) folgt dann sofort:<br />

X<br />

[x] = P x0 x w f [x] = P xx 0 w f [x 0 ]; (A.13)<br />

x 0 x`<br />

d.h. w f ist Eigenvektor von (P xx 0) zum Eigenwert 1.<br />

Anschaulich interpretiert sagt Gleichung (A.12) aus, daß das System genauso<br />

häufig vom Zustand x in den Zustand x 0 wechseln können muß wie in umgekehrte<br />

Richtung. <strong>Die</strong> Häufigkeit für einen Prozeß x ! x 0 ist dabei das Produkt aus der<br />

Wahrscheinlichkeit w f [x] für das Vorliegen des Zustandes x mit der bedingten<br />

Wahrscheinlichkeit für den Übergang von x nach x 0 .<br />

A.2.1<br />

Der Metropolis Algorithmus<br />

Ein sehr effizientes Verfahren zur Erzeugung einer Markoffschen Kette von der<br />

gewünschten Art wurde schon 1953 von METROPOLIS ET AL. gefunden [?] und<br />

wird als Metropolis–Algorithmus bezeichnet. Der Metropolis–Algorithmus erzeugt<br />

eine Kette von Zahlen ~ P x0 x so, daß eine vorgegebene Wahrscheinlichkeitsverteilung<br />

w f gerade ein Eigenvektor ~w der Matrix ~ P =( ~ P x0 x) ist.<br />

Werden nämlich die Zahlen ~ P x0 x definiert als<br />

X<br />

~P x0 x := 1 falls w f (x 0 )


ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 90<br />

also<br />

und damit<br />

~P x 0 xw f (x) =w f (x) (A.19)<br />

~P xx 0w f (x 0 w f (x)<br />

)=<br />

w f (x 0 w f (x 0 )=w f (x):<br />

(A.20)<br />

)<br />

Der umgekehrte Fall w f (x 0 ) w f (x) folgt analog und damit ist Wahrscheinlichkeitsverteilung<br />

w f Eigenvektor der so definierten Markoff–Matrix.<br />

Konkret besteht eine Monte–Carlo–S<strong>im</strong>ulation nach dem Metropolis–Algorithmus<br />

also aus den folgenden Schritten:<br />

1. Wähle einen Startzustand x 0 für die Markoffsche Kette.<br />

2. Erzeuge ausgehend von dem aktuellen Zustand x i einen neuen Zustand x 0<br />

mit einer Wahrscheinlichkeit p 1 .<br />

3. Überprüfe, ob der neue Zustand x 0 der nächste Zustand x i+1 der Markoffschen<br />

Kette werden soll:<br />

(a) Falls w f (x 0 ) p 2 ,sowirdx i+1 := x 0 gesetzt, andernfalls bleibt das System in<br />

der alten Konfiguration: x i+1 := x i . <strong>Die</strong>s entspricht dem Fall (A.15)<br />

4. Wiederhole die Schritte 2 bis 3 so lange, bis eine genügende Genauigkeit<br />

erreicht ist.<br />

<strong>Die</strong> mit dem Metropolis–Algorithmus erzeugte Markoffsche Kette von Systemzuständen<br />

erlaubt es nun theoretisch, die Erwartungswerte von Funktionen<br />

F (f ) mittels Gleichung (A.6) exakt zu berechnen. Da in einer realen Monte–<br />

Carlo–S<strong>im</strong>ulation aber <strong>im</strong>mer nur endlich viele Glieder der Kette berechnet werden<br />

können (n


ANHANG A. GRUNDLAGEN VON MONTE–CARLO–VERFAHREN 91<br />

A.2.2<br />

Das ”<br />

heat bath“–Verfahren<br />

Eine andere Lösung der Bedingung des detaillierten Gleichgewichtes (A.12) ist<br />

offensichtlich dann gegeben, wenn die Übergangswahrscheinlichkeit<br />

~P x 0 x = w f [x 0 ] (A.22)<br />

gewählt wird. <strong>Die</strong>s bedeutet nichts anderes, als daß der neue Zustand x 0 unabhängig<br />

vom vorherigen Zustand x direkt nach der vorgegebenen Wahrscheinlichkeitsverteilung<br />

w f best<strong>im</strong>mt wird.<br />

Der Name ”<br />

heat bath“ für dieses Verfahren rührt daher, daß dieses Verfahren<br />

zuerst bei der Monte–Carlo–S<strong>im</strong>ulation von Boltzmann–Verteilungen benutzt wurde.<br />

<strong>Die</strong>ses Verfahren wurde in dieser Arbeit nicht verwendet und wird hier nur der<br />

Vollständigkeit halber erwähnt. Weitere Details finden sich in [?].


Literaturverzeichnis<br />

[1] Gert Franke. Struktur und Thermodynamik kleiner Edelgascluster. PhDthesis,<br />

Universität Oldenburg, Februar 1990.<br />

[2] P. Sindzingre, L.M. Klein, and D.M. Ceperley. Path-Integral Monte Carlo<br />

Study of Low-Temperature 4 He Clusters. Phys. Rev. Lett., 63(15):1601–1604,<br />

October 1989.<br />

[3] D.M. Ceperley. Path integrals in the theory of condensed helium. Rev. Mod.<br />

Phys., 67(2), April 1995.<br />

[4] P. Borrmann and E.R. Hilf. New enhancements to Feynmans Path Integral<br />

for fermions. cond-mat/9412113, December 1994.<br />

[5] D.M. Ceperley and E.L. Pollock. Path Integral Computation of the Low-<br />

Temperature Properties of Liquid 4 He. Phys. Rev. Lett., 56(4):351–354, January<br />

1986.<br />

[6] D.M. Ceperley and E.L. Pollock. The momentum distribution of normal and<br />

superfluid liquid 4 He. Can. J. Phys., 65:1416–1420, 1987.<br />

[7] D.M. Ceperley and E.L. Pollock. Path integral computation of superfluid<br />

densities. Phys.Rev.B, 36(16):8343–8352, December 1987.<br />

[8] R.P. Feynman and A.R. Hibbs. Quantum Mechanics and Path Integrals. Mc-<br />

Graw Hill, New York, 1965.<br />

[9] R.P. Feynman. Statistical Mechanics: A Set of Lectures. Addison–Wesley<br />

Publishing Company, Inc., New York, 13 edition, 1990.<br />

[10] J. Gl<strong>im</strong>m and A. Jaffe. Quantum Physics — A functional Integral Point of<br />

View. Springer Verlag, New York, 2nd edition, 1987.<br />

[11] L.S. Schulman. Techniques and Applications of Path Integration. John Wiley<br />

& Sons, 1981.<br />

[12] H. Kono, A. Tkasaka, and S.H. Lin. Monte Carlo calculation of the quantum<br />

partition function via path integral formulations. J. Chem. Phys.,<br />

88(10):6390–6398, May 1988.<br />

96


LITERATURVERZEICHNIS 97<br />

[13] D.L. Freeman and J.D. Doll. A Monte Carlo method for quantum Boltzmann<br />

statistical mechanics. J. Chem. Phys., 80(5):2239–2240, March 1984.<br />

[14] D.L. Freeman and J.D. Doll. A Monte Carlo method for quantum Boltzmann<br />

statistical mechanics using fourier representations of path integrals. J. Chem.<br />

Phys., 80(11):5709–5718, June 1984.<br />

[15] M. Takahashi and M. Imada. Monte Carlo Calculations of Quantum systems.<br />

J. Phys. Soc. Jpn., 53(3):936–974, 1984.<br />

[16] M. Takahashi and M. Imada. Monte Carlo Calculations of Quantum Systems.<br />

II. Higher Order Correction. J. Phys. Soc. Jpn., 53(11):3765–3769, 1984.<br />

[17] M. Suzuki. Quantum Monte Carlo methods – recent developments. Physica<br />

A, pages 432–449, 1993.<br />

[18] Hagen Kleinert. <strong>Pfadintegral</strong>e in Quantenmechanik, Statistik und Polymerphysik.<br />

B.I. Wissenschaftsverlag, Mannhe<strong>im</strong>, 1993.<br />

[19] H.F. Trotter. On The Product of Semi–Groups of operators. Proc. Am. Math.<br />

Soc., 10:545–551, 1959.<br />

[20] B. S<strong>im</strong>on. Functional Integration and Quantum Physics. Academic Press,<br />

New York, 1979.<br />

[21] Andreas Dullweber. <strong>Pfadintegral</strong>methoden. Master’s thesis, Carl von Ossietzky<br />

Universität Oldenburg, Januar 1995.<br />

[22] K.E. Schmidt and D.M. Ceperley. Monte carlo techniques for quantum fluids,<br />

solids and droplets. In K. Binder, editor, The Monte Carlo Method in Condensed<br />

Matter Physics, pages 75–91, New York – Berlin, 1991. Springer.<br />

[23] M.H. Kalos and P.A. Whitlock. Monte Carlo Methods, volume I: Basics.<br />

Wiley, 1986.<br />

[24] G. Bhanot. The Metropolis algorithm. Rep. Prog. Phys., 51:429–457, 1988.<br />

[25] K. Binder, editor. The Monte Carlo Method in Condensed Matter Physics.<br />

Springer, New York – Berlin, 1991.<br />

[26] N. Metropolis, A.W. Rosenbluth, M.N. Rosenbluth, A. Teller, and E. Teller.<br />

Equation of state calculations by fast computing machines. J. Chem. Phys.,<br />

21(6):1087–1092, 1953.<br />

[27] D.W. Heermann. Computer S<strong>im</strong>ulation Methods in Theoretical Physics.<br />

Springer, Berlin-Heidelberg, 1986.<br />

[28] Jürgen Schnakenberg. Algorithmen in der Quantentheorie und Statistischen<br />

Physik. Verlag Z<strong>im</strong>mermann-Neufang, Ulmen, 1. edition, 1995.


LITERATURVERZEICHNIS 98<br />

[29] H. Minc. Permanents, volume 6 of Encyclopedia of Mathematics and its<br />

Applications. Addison Wesley Publishing Company, Inc., Reading, Massachusetts,<br />

1978.<br />

[30] P.M. Gibson. An identity between permanents and determinants. Amer. Math.<br />

Monthly, 76:270–271, 1969.<br />

[31] M. Luby. A survey of approx<strong>im</strong>ation algorithms for the permanent. In Sequences,<br />

pages 75–91, New York – Berlin, 1990. Springer.<br />

[32] N. Karmarkar, R. Karp, R. Lipton, L. Lovasz, and M. Luby. A Monte Carlo<br />

Algorithm for Est<strong>im</strong>ating the Permanent. SIAM J. Comput., 22(2):284–293,<br />

April 1993.<br />

[33] H.J. Ryser. Combinatorial Mathematics. Carus Math. Monographs, 1963.<br />

[34] A. Nijenhuis and H.S. Wilf. Combinatorial Algorithms for Computers and<br />

Calculators. Academic Press, New York, 2nd edition, 1978.<br />

[35] A. Itai, M. Rodeh, and S.L. Tan<strong>im</strong>oto. Some Matching Problems for Bipartite<br />

Graphs. J. ACM., 25(4):517–525, 1978.<br />

[36] M. Jerrum and A. Sinclair. Conductance and the rapid mixing property<br />

for Markov Chains: the approx<strong>im</strong>ation of the permanent resolved. In Proceed.<br />

20th Annual ACM Symposium on Theory of Computing, pages 235–244.<br />

ACM, May 1988.<br />

[37] S. Lang. Algebra. Addison–Wesley, 1974.<br />

[38] A.G. Akritas. Elements of Computer Algebra: With Applications. Wiley, New<br />

York, 1989.<br />

[39] U. Pape and D. Conradt. Max<strong>im</strong>ales matching in graphen. In H. Späth, editor,<br />

Ausgewählte Operations–research–Software in FORTRAN, pages 103–114,<br />

München, 1979. Oldenbourg.<br />

[40] R.S. Berry. Melting and freezing of clusters: How they happen and what they<br />

mean. In H. Haberland, editor, Atomic and Molecular Clusters I, Berlin–<br />

Heidelberg, 1995. Springer.<br />

[41] R.S. Berry, J. Jellinek, and G. Natanson. Melting of clusters and melting.<br />

Phys. Rev. A, 30(2):919–931, August 1984.<br />

[42] R.S. Berry, T.L. Beck, H.L. Davis, and J. Jellinek. Solid–liquid phase behavior<br />

in microclusters. Adv. Chem. Phys., 70:75, 1988.<br />

[43] L.S. Bartell. Diffraction Studies of Clusters Generated in Supersonic Flow.<br />

Chem. Rev., 86(3):486, 1986.


LITERATURVERZEICHNIS 99<br />

[44] J. Farges, M.F. de Feraudy, B. Raoult, and G. Torchet. Noncrystalline structure<br />

of argon clusters. i. Polyicosahedral structure of ar n clusters, 20< n


LITERATURVERZEICHNIS 100<br />

[59] B.H. Bransden and C.J. Joachain. Physics of atoms and molecules. Longman<br />

Scientifc & Technical, London, 1983.<br />

[60] J.J. Sakurai. Modern Quantum Mechanics. Addison–Wesley, Redwood City,<br />

Calif., 1991.<br />

[61] J. Kestin and J.R. Dorfman. A Course in Statistical Thermodynamics. Academic<br />

Press, New York, 1971.<br />

[62] H. Haberland. Exper<strong>im</strong>ental methods. In H. Haberland, editor, Atomic and<br />

Molecular Clusters I, Berlin–Heidelberg, 1995. Springer.<br />

[63] G. Franke and J. Schulte. Quantum mechanics and the structure of noble–gas<br />

clusters. Z. Phys. D, 12(1–4):65–68, 1989.<br />

[64] C. Chakravarty. Structure of binary quantum clusters. Phys. Rev. Lett.,<br />

75(9):1727–1730, 1995.<br />

[65] A.M. Ferrenberg and R.H. Swendsen. Opt<strong>im</strong>ized Monte Carlo Data Analysis.<br />

Phys. Rev. Lett., 63(12):1195–1198, 1989.<br />

[66] G.C. Maitland, M. Rigby, E.B. Smith, and W.A. Wakeham. Intermolecular<br />

Forces — Their Origin and Determination. Oxford University Press, Oxford,<br />

1987.<br />

[67] Ulrich Krengel. Einführung in die Wahrscheinlichkeitstheorie und Statistik.<br />

Vieweg Verlag, Braunschweig, 3. edition, 1991.<br />

[68] Bronstein and Semendjajew. Teubner–Taschenbuch der Mathematik, volume<br />

I. Teubner, Leipzig, 1996.<br />

[69] Bronstein and Semendjajew. Teubner–Taschenbuch der Mathematik, volume<br />

II. Teubner, Leipzig, 1995.


Danksagung<br />

Ich danke Herrn Prof. Dr. Eberhard Hilf, daß er mir das Thema für den ersten<br />

Teil dieser Arbeit zur selbstständigen Bearbeitung überlassen hat, für seine Unterstützung<br />

und seine stets ermutigenden Kommentierungen, die er mir dabei zukommen<br />

ließ.<br />

Auf Herrn Dr. Peter Borrmann, der stets für zahlreiche Diskussionen zur Verfügung<br />

stand, geht die Idee zum zweiten Teil dieser Arbeit zurück. <strong>Die</strong> von ihm und<br />

Herrn Heinrich Stamerjohanns erstellten S<strong>im</strong>ulationsprogramme waren mir eine<br />

große Hilfe. Ihnen möchte ich an dieser Stelle meinen herzlichen Dank aussprechen.<br />

Nicht zuletzt gilt mein Dank meinen Eltern, die mir dieses Studium ermöglicht<br />

haben, und meiner Kommilitonin Katrin Reblinsky, die mit mir in dieser Zeit alle<br />

Höhen und Tiefen durchlebt hat.


Hiermit versichere ich, daß ich diese Arbeit selbstständig verfaßt und keine anderen<br />

als die angegebenen Quellen und Hilfsmittel benutzt habe.<br />

Oldenburg, 16. Dezember 1998

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!