14.11.2013 Aufrufe

Hausarbeit - Friedrich-Schiller-Universität Jena

Hausarbeit - Friedrich-Schiller-Universität Jena

Hausarbeit - Friedrich-Schiller-Universität Jena

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Friedrich</strong>-<strong>Schiller</strong>-<strong>Universität</strong> <strong>Jena</strong><br />

Institut für Geographie<br />

HptS: Analyse und Modellierung räumlicher Daten<br />

WS 2004/05<br />

Leitung: Dr. Martin Herold<br />

Die „Weights of Evidence“ Methode<br />

Theorie und konzeptionelle Grunglagen in GIS<br />

Stephan Sonntag<br />

Matr.Nr.: 58127<br />

Studiengang: Geographie (Diplom)<br />

Semester: 6


Inhalt<br />

1 Einleitung<br />

2 Vorhersage von Mineralvorkommen<br />

3 Umgang mit der Weights of Evidence Methode<br />

3.1 Binary evidential themes<br />

3.2 Berechnung der weights<br />

3.3 Binäre Reklassifizierung<br />

3.4 Bayes Theorem<br />

4 Abschließende Betrachtung<br />

Literatur


1 Einleitung<br />

Die „Weights of Evidence“ Methode ermöglicht Wahrscheinlichkeiten im Licht<br />

verschiedener Themen (evidences), die durch Analyse oder Beobachtung gewonnen<br />

werden, zu bemessen (weight). Die Methode wurde laut Arc-WofE User-Guide<br />

(1998:1) ursprünglich für eine nicht-räumliche Anwendung entwickelt. So wurden in<br />

der medizinischen Diagnose die Symptome einer bestimmten Krankheit als<br />

Informationen (evidences) verstanden und die zugehörige Hypothese lautete: „Dieser<br />

Patient hat die Krankheit X“. Für jedes Symptom wurde ein Paar von so genannten<br />

Gewichtungen (weights) festgelegt, ein für das Vorhandensein und eine für das Nicht-<br />

Vorhandensein des Symptoms. Somit konnte in einer großen Gruppe von Patienten eine<br />

Verbindung zwischen der Häufigkeit von Symptomen und einem bestimmte<br />

Erkrankungsmuster festgestellt werden. Die errechneten weights konnten dann dafür<br />

verwendet werden, um einzuschätzen ob ein neuer Patient diese Krankheit hat, basiert<br />

auf dem Vorhandensein oder Nicht-Vorhandensein von Symptomen.<br />

1980 wurde die „Weights of Evidence“ Methode für die Darstellung möglicher<br />

Mineralvorkommen mit Hilfe von GIS angepasst. Dabei bestehen die Themen<br />

„Evidences“ aus einer Reihe von untersuchten Datensätzen (Karten) und die Hypothese<br />

lautet: „Ist in diesem Gebiet das Vorkommen von Ablagerung X möglich“. Die weights<br />

werden durch die Zusammenhänge zwischen Bekannten Mineralvorkommen und den<br />

Werten in den Karten, die dabei als Vorhersagewerte dienen, abgeschätzt. Die<br />

Hypothese ist dann für alle möglichen Orte auf der Karte bewiesen, auf der die weights<br />

of evidence der verschiedenen Kartenlayer übereinstimmen.<br />

2 Vorhersage von Mineralvorkommen<br />

Die physikalischen und chemischen Grundlagen, die die Bildung von<br />

Mineralvorkommen bestimmen sind zu komplex um damit Vorhersagen in<br />

mathematischer Form zu treffen. Die Vorhersage von Mineralvorkommen muss daher<br />

laut BONHAM-CARTER (1994:252) in empirischer Form geschehen mit Hilfe von<br />

deskriptiven Ablagerungsmodellen. Die Beschreibung eines Ablagerungsmodells<br />

beinhaltet eine Bewertung der chemischen und physikalischen Prozesse die die<br />

Ablagerung bestimmen. Bei der Benutzung von GIS zur Berechnung von potentiellen<br />

Mineralvorkommen, spielen so genannte Ablagerungsmodelle (deposit models) eine<br />

Rolle. Diese werden dazu benötigt, um Karten zu selektieren und abzuleiten, die gute<br />

Vorhersagen über bestimmte Ablagerungstypen treffen können und die Gewichtungen<br />

(weights) in den Vorhersagekarten (predictor map) festlegen. Die Zuweisung von<br />

Gewichtungen kann entweder in Form von statistischen Kriterien geschehen oder durch<br />

die Einschätzung aufgrund der Meinung von Experten. Bei der statistischen Methode<br />

wird versucht ein räumlicher Zusammenhang zwischen der Vorhersagekarte und der<br />

Ergebniskarte (response map) aufgrund bekannter Mineralvorkommen zu bestimmen.


Diese beiden Typen werden in datenbasierte (data-driven) und wissensbasierte<br />

(knowledge-driven) Modelle unterschieden. In Abbildung 1 sind diese beiden Typen<br />

dargestellt. In datenbasierter Modellierung werden die verschiedenen Inputkarten mit<br />

Hilfe von Modellen, wie „logistic regression“, „weights of evidence“ oder „neural<br />

network analysis“ verbunden. Bei der wissensbasierten Modellierung wird mit „fuzzy<br />

logic“, Bayesian probability“ und „Dempster-Shafer belief theory“ gearbeitet.<br />

Abb. 1: Modelle zur Bestimmung möglicher Mineralvorkommen (Quelle: BONHAM-<br />

CARTER 1994:254)<br />

3 Umgang mit der Weights of Evidence Methode<br />

BONHAM-CARTER 1994:317) nennt folgende Schritte die beim Umgang mit der Weights<br />

of Evidence Methode durzuführen sind:<br />

1. Eine Anzahl von Karten muss ausgewählt werden, die brauchbare Themen<br />

(evidences) für die gegebene Fragestellung liefert (in diesem Fall die Suche<br />

nach mineralischen Ablagerungen)<br />

2. Jede Karte, deren Thema durch eine größere Zahl von Klassen gegeben ist<br />

muss eine optimale Reklassifizierung gewählt werden um sie in binäre Form<br />

umzuwandeln. Dabei muss ein starker räumlicher Zusammenhang zwischen der<br />

Karte und den Ablagerungen gegeben sein. Die binäre Reklassifizierung soll im<br />

weiteren Verlauf der Arbeit noch diskutiert werden.<br />

3. Untersuchung nach paarweiser Korrelation zwischen den binären Karten. Dabei<br />

müssen „problematische“ Karten gelöscht werden, die zu anderen Karten keine<br />

Korrelation aufweisen. Oder es werden verschiedene binäre Karten kombiniert<br />

um die Korrelation zu erhöhen.<br />

4. Die unter Punkt zwei entstandenen binären Karten müssen mit einer Gleichung,<br />

deren Herleitung in dieser Arbeit beschrieben wird, verrechnet werden.<br />

5. Eine Karte muss erstellt, die das Ergebnis der Berechnung darstellt.<br />

Die einzelnen hier angeführten Schritte erfordern sehr viel mehr computerisierte<br />

Berechnungen als die subjektive Festlegung der weights mit anderen Methoden. Der<br />

Vorteil der Methode besteht aber darin, dass objektive Einschätzungen der weights


gegeben werden, die räumliche Zusammenhänge zwischen Kartenmustern und<br />

bekannten Vorkommen berücksichtigen.<br />

3.1 Binary evidential themes<br />

Ein evidential theme ist laut Arc-WofE User-Guide (1998:1) ein Kartenlayer, der für die<br />

Vorhersage eines bestimmten punktuellen Objektes, zum Beispiel mineralogischen<br />

Vorkommen, dient. Die evidential themes bestehen jeweils aus zwei oder mehr Klassen.<br />

Die Weights of Evidence Methode ist nur für binarär Klassifikation geeignet, wodurch<br />

es erforderlich wird multi-class evidential themes in zwei Klassen zu generalisieren.<br />

In Abbildung 2 ist ein rechteckiger View mit einem evidential theme in zwei Klassen<br />

dargestellt. Dabei ist in der Attributtabelle der Wert 2 für Anwesenheit des Themas und<br />

für Nicht-Anwesenheit 1. Zusätzlich ist eine Anzahl von Trainingspunkten gegeben.<br />

Der Arc-WofE User-Guide (1998:1) beschreibt Trainingspunkte als Punkt-Layer, der<br />

aus Orten besteht, an deren Stelle die Objekte bekannt sind die dort vorkommen. Im<br />

Fall von geologischen Explorationsarbeiten sind die Trainingsunkte die Vorkommen<br />

bestimmter Stoffe, die bereits von Minengesellschaften und Prospektoren entdeckt<br />

worden sind. In anderen geologischen Fachgebieten könnten die Trainingspunkte Orte<br />

mit seismischer Aktivität, Störungen oder Klüfte darstellen. Die Serie von Punkten dient<br />

dazu, die Gewichtungen für jedes einzelne Thema zu berechnen. Dabei ist in der<br />

Attributtabelle der Punkte nur vermerkt, ob dort das Thema vorkommt oder nicht. Es<br />

wird nicht nach der Größe oder Ergiebigkeit der Vorkommen unterschieden. In Figur<br />

2A sind die Grenzen der Basiskarte (Boundary of base map) dargestellt und in Figur 2B<br />

ist nur noch die Basiskarte, in der ein Teil des Themas und einige Trainingspunkte<br />

fehlen, abgebildet.


Abb. 2: A: binary evidential theme mit Trainingspunkten. B: Ausschnitt aus A (Quelle:<br />

Arc-WofE User-Guide 1998:3)<br />

Das Gebiet eines unit cell´s ist mit u km 2 gegeben. Ein unit cell ist laut Arc-WofE User-<br />

Guide (1998:1) ein kleines Gebiet, dass einen zugehörigen Trainingspunkt umgibt. Die<br />

Größe dieses Gebiet muss festgelegt werden. Denn das Ergebnis der Weights of<br />

Evidence Methode ist eine Karte, in der die Wahrscheinlichkeit berechnet ist, dass ein<br />

Gebiet (unit area) einen bestimmten Trainingspunkt beinhaltet oder nicht. Folglich<br />

verändert sich die Wahrscheinlichkeit mit der gewählten unit cell Größe. Die Größe<br />

wird am Anfang des Computerprogramms gesetzt und ist für alle evidential themes und<br />

alle Trainingspunkte gleich groß.<br />

3.2 Berechnung der weights<br />

Die folgende Berechnung der weights geschieht auf Grundlage des Arc-WofE User-<br />

Guide (1998:3-5). Die Größe der base map aus Abbildung 2 ist A(T)/u = N(T) in unit<br />

cells, wobei T die base map ist, A() das Gebiet (area) und N() die Anzahl der unit cells.<br />

Die Anzahl der Trainingspunkte innerhalb der base map ist N(D). Angenommen das<br />

evidential theme ist B, dann ist A(B)/u = N(B) in unit cells das Gebiet in dem B (zum<br />

Beispiel ein bestimmtes Mineral) vorhanden ist. Der Wert für B kann zum Beispiel 2<br />

sein. Dementsprechend ist A( )/u = N( ) das Gebiet in dem B nicht vorhanden ist. Bei<br />

ist dann zum Beispiel der Wert 1 anzunehmen. Wenn keine unbekannten Bereiche<br />

vorhanden sind gilt folgendes:<br />

N(B) + N(<br />

) = N(T).


Sind Regionen in T, wo B wegen nicht-kompletter Erkundung unbekannt ist, entsteht<br />

eine dritte Klasse mit dem Wert 0. Die Gleichung lautet dann:<br />

N(B) + N(<br />

) + N(missing) = N(T).<br />

Wenn GIS verwendet wird, kann N(T), N(B) und N( ) leicht ermittelt werden. Auch<br />

die Anzahl der Trainingspunkte von B und , geschrieben als N(Bn B) und N( nD),<br />

kann leicht ermittelt werden.<br />

Die weights liefern ein Maß für den räumlichen Zusammenhang zwischen den<br />

Trainingspunkten und dem evidential theme. Ein weight muss für jede Klasse des<br />

evidential theme bestimmt werden. Ein positiver Wert bedeutet, dass mehr Punkte<br />

innerhalb der Klasse liegen als normal Wahrscheinlich sind. Umgekehrt bedeutet ein<br />

negativer Wert, dass weniger Punkte als erwartet in der Klasse vorkommen. Ein Wert<br />

von Null oder nahe Null bedeutet, dass die Trainingspunkte in der Klasse zufällig<br />

verteilt sind. Bei binären Karten, die ja aus zwei Klassen bestehen, wird W + für ein<br />

weight benutzt, bei dem das evidential theme anwesend ist (Wert 2). W - wird dann<br />

demenstsprechend für Abwesenheit des evidential themes verwendet.<br />

Die Differenz zwischen den weights ist der Kontrast C. Also gilt: C = W + - W - . Der<br />

Kontrast ist ein gesamtes Maß für den räumlichen Zusammenhang zwischen den<br />

Trainingspunkten und dem evidential theme, indem er die Effekte der beiden weights<br />

kombiniert.<br />

Werte für die weights zwischen 0 und 0,5 sind wenig vorhersagend, Werte zwischen 0,5<br />

und 1 sind mäßig vorhersagend, zwischen 1 und 2 stark vorhersagend und über 2 extrem<br />

stark.<br />

Die weights für binäre Themen sind durch den Zusammenhang folgenden bedingte<br />

Wahrscheinlichkeiten gegeben:<br />

P(B¦ D)<br />

W + = ln P(B¦ ) und<br />

P( ¦D)<br />

W - = ln P( ¦ )<br />

P() ist dabei das Zeichen für Wahrscheinlichkeit. Vorausgesetzt, es besteht eein<br />

einfaches Verhältnis zwischen den Gebieten, dann ist:<br />

N(Bn D)<br />

P(B¦ D) = N(D) ,<br />

N(Bn )<br />

P(B¦ ) = N( ) ,


N( n D)<br />

P( ¦ D) = N(D) und<br />

N( n )<br />

P( ¦ ) = N( ) .<br />

N(Bn D) ist dabei die Anzahl der Trainingspunkte in Thema B. Somit ergibt sich für o.<br />

g. Gleichung:<br />

N(Bn D) / N(D)<br />

W + = ln [N(B) - N(Bn D)] / [N(T) – N(D)]<br />

Für W - wird genauso verfahren. Die weights für die einzelnen evidential themes sind<br />

somit berechnet.<br />

3.3 Binäre Reklassifizierung<br />

Die Konvertierung von Karten mit mehreren Klassen zu einer binären Form kann nach<br />

BONHAM-CARTER (1994:319-320) auf zwei Arten geschehen. Zum einen subjektiv, in<br />

dem man geologische beurteilt oder aber statistisch. Bei letzterem wird die Schwelle des<br />

maximalen räumlichen Zusammenhangs zwischen der resultierenden binären Karte und<br />

dem Muster der Trainingspunkte bestimmte.<br />

Abb. 3: Karte mit Antiklinalen und Orten bekannten Goldvorkommens (Quelle:<br />

BONHAM-CARTER 1994:319)<br />

In Abbildung 3 ist eine Karte der Antiklinalen mit mehreren Klassen dargestellt, in der<br />

auch die Punkte mit bekannten Mineralvorkommen eingetragen sind. Auch ohne


statistisches Wissen ist zu erkennen, dass die Punkte dazu tendieren in der Nähe der<br />

Antiklinalen zu liegen. Wenn aus diesem Thema (evidence) eine binäre Karte entstehen<br />

soll, besteht die Frage darin, in welcher Entfernung von den Antklinalen die beste<br />

Distanz ist um einen Schnitt zu machen. Innerhalb dieser Grenze wird das Vorkommen<br />

als Wahrscheinlich angesehen, außerhalb nicht. Wenn die Distanz zu kurz gerät wird<br />

das Gebiet kleiner und die Gefahr besteht, dass einige der Punkte mit bekannten<br />

Vorkommen nicht darin liegen. Wird die Distanz jedoch zu lang gewählt geht der<br />

Effekt, die Suche in dem Gebiet einzuengen, fast vollständig verloren. Anders als in der<br />

Abbildung dargestellt, hat die Karte 24 Buffer die in einem Intervall von 250 Metern<br />

unterteilt sind.<br />

Abb. 4: Tabelle für die Karte der Antiklinalen (Quelle: BONHAM-CARTER 1994:322)<br />

In Abbildung 4 sind alle Klassen mit Entfernung, Größe und den dazugehörigen<br />

Trainingspunkten dargestellt. Der Kontrast in der letzten Spalte ist ein Maß für den<br />

räumlichen Zusammenhang zwischen den Punkten mit bekannten Goldvorkommen und<br />

den antiklinalen Faltenachsen. Aus der Distanz und dem Kontrast lässt sich ein<br />

Diagramm formieren, dass in Abbildung 5 dargestellt ist. In diesem Beispiel ist ein<br />

eindeutiger Zusammenhang zwischen der Karte mit den Antiklinalen und bekannten


Goldvorkommen festzustellen. Bei einer Entfernung von 1.25 km sind 51 der insgesamt<br />

68 Vorkommen vertreten. Die Grenze auf der Karte liegt also bei 1,25 km. An dieser<br />

Stelle ergibt sich das beste Ergebnis für die Vorhersage weiterer Vorkommen. Es<br />

besteht aber auch die Möglichkeit, dass kein so klares Ergebnis aus dem Diagramm<br />

hervorgeht, weil die Trainingspunkt vielleicht nicht so eindeutig verteilt sind. In solchen<br />

Fällen muss zusätzlich eine subjektive Beurteilung unter zu Hilfenahme von<br />

fachspezifischen Kenntnissen erfolgen.<br />

Abb. 5: Graph mit den Schwankungen<br />

des Kontrasts mit der Entfernung<br />

(Quelle: BONHAM-CARTER 1994:320)<br />

3.4 Bayes Theorem<br />

Diese Weights of Evidence Methode basiert auf der Wahrscheinlichkeitstheorie nach<br />

Bayes. Das Bayes Theorem erlaubt in gewissem Sinne das Umkehren von<br />

Schlussfolgerungen. Vereinfacht ausgedrückt können bei bekannten Ursachen mit Hilfe<br />

des Theorems die Wahrscheinlichkeit des Auftretens eines Ereignisses berechnet<br />

werden. Das Bayes Theorem gibt an, wie man mit bedingten Wahrscheinlichkeiten<br />

rechnet. Für zwei Ergebnisse B und D lautet es:<br />

P(D¦ B) =<br />

P(B¦ D) * P(D)<br />

P(B)<br />

Hierbei ist P(D) die A-Priori-Wahrscheinlichkeit für ein Ereignis A und<br />

P(B¦ D) die Wahrscheinlichkeit für ein Ereignis B unter der Bedingung, dass D auftritt.<br />

Die A-Priori-Wahrscheinlichkeit ist in den Naturwissenschaften ein<br />

Wahrscheinlichkeitswert, der aufgrund von Vorwissen (zum Beispiel symmetrische<br />

Eigenschaften eines Würfels) gewonnen wird.


BONHAM-CARTER ET AL (1998:173) transformiert dabei den Ausdruck der<br />

Wahrscheinlichkeit in die logarhitmische Form log e . Wenn nun L() für den Logarithmus<br />

geschrieben wird, ergibt sich für den A-Posteriori-Logarhitmus (das Ergebnis der<br />

Methode) für nur ein evidential theme folgende Gleichung:<br />

L(D¦ B) = L(D) + W +<br />

bei Vorhandensein des Themas oder:<br />

L(D¦ ) = L(D) + W -<br />

bei Nicht-Vorhandensein des Themas. Es wird nun davon gesprochen, dass der A-<br />

Priori-Logarhitmus durch die evidences zum A-Posteriori-Logarhitmus „aktualisiert“<br />

(„updated“) wird. Dies ist nun die logarithmische Form des Bayes Theorem. Wenn zwei<br />

binäre evidential themes (B 1 und B 2 ) gegeben sind, führt das zu vier möglichen<br />

Situationen, in die sie kombiniert sein können:<br />

L(D¦ B 1 n B 2 ) = L(D) + W + +<br />

1 + W 2<br />

L(D¦ 1 n B 2 ) = L(D) + W - +<br />

1 + W 2<br />

L(D¦ B 1 n 2) = L(D) + W + -<br />

1 + W 2<br />

L(D¦ 1 n 2) = L(D) + W - -<br />

1 + W 2<br />

,<br />

,<br />

und<br />

.<br />

Drei oder mehreren evedential themes werden ähnlich kombiniert, indem die<br />

angemessenen weights der Themen zusätzlich addiert werden. Die abschließende<br />

Gleichung, die das Ergebnis der weights of evidence Methode liefert lautet dann:<br />

L(D¦ B 1 n B 2 n B 3 …B n } = L(D) + S W + i .<br />

Wie bereits weiter oben beschrieben ist diese Gleichung in die Computertools integriert,<br />

die sich mit Weights of Evidence befassen.<br />

4 Abschließende Betrachtung<br />

An dieser Stelle werden einige Vor- und Nachteile der Weights of Evidence Methode<br />

angesprochen. Die prinzipiellen Vorteile sind:


1. Die Methode ist objektiv und vermeidet eine subjektive Auswahl der<br />

Gewichtungsfaktoren (weighting factors), wie es zum Beispiel in der „Index<br />

Overlay“ Methode der Fall ist.<br />

2. Verschiedene Kartenmuster können mit einem Modell kombiniert werden, dass<br />

relativ einfach als Computertool bedient werden kann.<br />

3. Inputkarten mit fehlenden Daten (lückenhafte Oberfläche) können in das Modell<br />

eingefügt werden.<br />

Zwei Nachteile der „Weights of Evidence“ Methode sind:<br />

1. Die Kombination der Inputkarten setzt voraus, dass die Karten in Bezug auf ihre<br />

einzelnen Themen unabhängig sind.<br />

2. „Weights of Evidence“ gemeinsam mit anderen datenbasierten Methoden ist nur<br />

in solchen Regionen zu gebrauchen, wo die Ausgangsvariable (in diesem Fall<br />

das Vorhandensein von bekannten Lagerstätten) einigermaßen gut bekannt ist.


Literatur<br />

Arc-WofE User-Guide (1998) http://ntserv.gis.nrcan.gc.ca/wofe/project.htm. Zugriff<br />

22.11.2004.<br />

BONHAM-CARTER, G.F. (1994): Geographic Information Systems for Geoscientists:<br />

Modeling with GIS. New York.<br />

BONHAM-CARTER, G.F., F.P. AGTERBERG & D.F. WRIGHT (1989): Weights of evidence<br />

modeling: a new approach to mapping mineral potential. In: Statistical<br />

Applications in the Earth Sciences. Geological Survey of Canada. Nr. 89-9,<br />

171-183.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!