01.12.2012 Aufrufe

Mathematische Bildverarbeitung mit Ideen aus der ... - Mathematik.de

Mathematische Bildverarbeitung mit Ideen aus der ... - Mathematik.de

Mathematische Bildverarbeitung mit Ideen aus der ... - Mathematik.de

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Mathematische</strong> <strong>Bildverarbeitung</strong> <strong>mit</strong> <strong>I<strong>de</strong>en</strong> <strong>aus</strong> <strong><strong>de</strong>r</strong> Natur<br />

Joachim Weickert<br />

Die Faszination <strong><strong>de</strong>r</strong> angewandten <strong>Mathematik</strong> beruht<br />

nicht zuletzt auf <strong><strong>de</strong>r</strong> Tatsache, dass sie sich als ein äußerst<br />

erfolgreiches Mo<strong>de</strong>llierungswerkzeug etabliert hat. Viele<br />

Vorgänge in Natur und Technik lassen sich durch mathematische<br />

Gleichungen sehr kompakt und oft auch <strong>mit</strong><br />

hoher Genauigkeit darstellen. Differentialgleichungen, die<br />

Zusammenhänge zwischen einer unbekannten Funktion<br />

und ihren Ableitungen beschreiben, haben sich dabei als<br />

beson<strong><strong>de</strong>r</strong>s wichtige Mo<strong>de</strong>lle erwiesen. Da es häufig angebracht<br />

ist, Funktionen <strong>mit</strong> mehreren Variablen zu verwen<strong>de</strong>n,<br />

können partielle Ableitungen auftreten. Entsprechen<strong>de</strong><br />

Gleichungen nennt man partielle Differentialgleichungen<br />

(englisch: partial differential equations,kurzPDEs).<br />

Seit vielen Jahren weiß man, dass zahlreiche physikalische<br />

Vorgänge, wie z. B. Wärmeleitung, Diffusion, strömungsmechanische<br />

Prozesse und elektrodynamische Phänomene,<br />

partiellen Differentialgleichungen genügen. Auf mathematischer<br />

Seite hat man solche Gleichungen intensiv<br />

untersucht und hocheffiziente numerische Techniken entwickelt,<br />

um sie schnell und <strong>mit</strong> hoher Genauigkeit auf<br />

Computern zu approximieren. Da<strong>mit</strong> hat sich die numerische<br />

Simulation zu einem dritten Standbein neben <strong><strong>de</strong>r</strong><br />

Theorie und <strong>de</strong>m Experiment etabliert und das Gebiet<br />

<strong>de</strong>s wissenschaftlichen Rechnens begrün<strong>de</strong>t, das zahlreichen<br />

<strong>Mathematik</strong>ern ein spannen<strong>de</strong>s Betätigungsfeld bietet.<br />

Weniger bekannt ist jedoch die Tatsache, dass sich auch<br />

wichtige Teilgebiete in <strong><strong>de</strong>r</strong> digitalen <strong>Bildverarbeitung</strong> und<br />

<strong><strong>de</strong>r</strong> Computergrafik <strong>mit</strong> großem Erfolg mathematischer<br />

Mo<strong>de</strong>lle bedienen, die auf partiellen Differentialgleichungen<br />

beruhen. Dabei wur<strong>de</strong>n zahlreiche Anstrengungen<br />

unternommen, praktisch das gesamte Spektrum dieser<br />

Prozesse nutzbar zu machen, angefangen von elliptischen<br />

über parabolische bis hin zu hyperbolischen Gleichungen.<br />

Ziel dieses Beitrags ist es zu illustrieren, wie einige dieser<br />

grundlegen<strong>de</strong>n Mo<strong>de</strong>lle <strong>aus</strong> Natur und Technik Eingang<br />

in die mo<strong><strong>de</strong>r</strong>ne <strong>Bildverarbeitung</strong> und Computergrafik<br />

gefun<strong>de</strong>n haben. Nicht zuletzt diesen Erfolgen ist es<br />

zu verdanken, dass sich die sogenannte mathematische<br />

<strong>Bildverarbeitung</strong> als eigenständiges Forschungsgebiet etabliert<br />

hat, bei <strong>de</strong>m Deutschland international sehr gut positioniert<br />

ist. Wir wer<strong>de</strong>n Prozesse betrachten, die Inspirationen<br />

<strong>aus</strong> fünf Bereichen schöpfen: Elektrostatik, Diffusion,<br />

Wellen<strong>aus</strong>breitung, Wärmeleitung und Osmose.<br />

1 Bil<strong><strong>de</strong>r</strong> als Funktionen<br />

Um überhaupt mathematische <strong>Bildverarbeitung</strong> betreiben<br />

zu können, müssen wir zunächst <strong>de</strong>finieren, was man<br />

sich als <strong>Mathematik</strong>er unter einem Bild vorstellen sollte.<br />

Hierzu betrachten wir einen rechteckigen Bildbereich<br />

Ω ⊂ R 2 .<br />

Unter einem kontinuierlichen Grauwertbild verstehen<br />

wir eine Abbildung f : Ω ↦→ R. Es han<strong>de</strong>lt sich also<br />

um eine skalarwertige Funktion mehrerer Verän<strong><strong>de</strong>r</strong>licher,<br />

die je<strong><strong>de</strong>r</strong> Ortskoordinate (x, y) einen Grauwert f (x, y)<br />

zuordnet. Typischerweise interpretiert man große Grauwerte<br />

als helle Bildstrukturen und ordnet dunklen Bildstrukturen<br />

niedrige Grauwerte zu. Mit diesem Funktionsbegriff<br />

kann man Bil<strong><strong>de</strong>r</strong> <strong>mit</strong> Werkzeugen <strong><strong>de</strong>r</strong> mehrdimensionalen<br />

Analysis untersuchen. Beispielsweise i<strong>de</strong>ntifiziert<br />

man Bildkanten <strong>mit</strong> Orten, an <strong>de</strong>nen <strong><strong>de</strong>r</strong> Grauwertgradient<br />

∇f =(∂xf ,∂y f ) ⊤ einen beson<strong><strong>de</strong>r</strong>s großen Betrag<br />

aufweist (Abbildung 1).<br />

Abbildung 1. Links: Originalbild, 256 × 256 Pixel. Rechts: In<strong>de</strong>m<br />

man <strong>de</strong>n Betrag <strong>de</strong>s Bildgradienten berechnet, kann man Kanten<br />

i<strong>de</strong>ntifizieren.<br />

Im Fall von Farbbil<strong><strong>de</strong>r</strong>n repräsentiert man eine Farbe<br />

durch ihren Rot-, Grün- und Blauanteil (RGB-Mo<strong>de</strong>ll) und<br />

betrachtet Abbildungen f : Ω ↦→ R 3 . Farbbil<strong><strong>de</strong>r</strong> sind<br />

für uns also vektorwertige Funktionen. In unserem Artikel<br />

wer<strong>de</strong>n wir mathematische Mo<strong>de</strong>lle insbeson<strong><strong>de</strong>r</strong>e für<br />

Grauwertbil<strong><strong>de</strong>r</strong> studieren, jedoch diverse Beispiele zeigen,<br />

bei <strong>de</strong>nen Farbbil<strong><strong>de</strong>r</strong> zum Einsatz kommen. Im einfachsten<br />

Fall verwen<strong>de</strong>t man dabei ein Konzept für Grauwertbil<strong><strong>de</strong>r</strong><br />

für je<strong>de</strong>n <strong><strong>de</strong>r</strong> drei Farbkanäle getrennt, aber<br />

auch kompliziertere, gekoppelte Mo<strong>de</strong>lle können sinnvoll<br />

sein. Eine genauere Diskussion wür<strong>de</strong> jedoch <strong>de</strong>n Rahmen<br />

dieses einführen<strong>de</strong>n Artikels sprengen.<br />

Um Bil<strong><strong>de</strong>r</strong> einer Verarbeitung auf <strong>de</strong>m Rechner zugänglich<br />

zu machen, diskretisiert man <strong>de</strong>n Definitionsbereich<br />

Ω, in<strong>de</strong>m man das Bild auf einem äquidistanten Gitter<br />

82 FOKUS DOI 10.1515/dmvm-2012-0040


abtastet. Man gelangt so von einem kontinuierlichen zu<br />

einem diskreten Bild. Die einzelnen Bildpunkte wer<strong>de</strong>n<br />

als Pixel – eine Abkürzung für <strong>de</strong>n englischen Begriff picture<br />

elements – bezeichnet. Ableitungen kann man nun<br />

durch ihre finiten Differenzenapproximationen ersetzen.<br />

Möchte man partielle Differentialgleichungen auf Bil<strong><strong>de</strong>r</strong>n<br />

betrachten, so kann man sich auf natürliche Weise <strong><strong>de</strong>r</strong><br />

Numerik <strong><strong>de</strong>r</strong> finiten Differenzenverfahren bedienen [7].<br />

Häufig gelangt man durch solche Differenzenapproximationen<br />

zu großen linearen o<strong><strong>de</strong>r</strong> nichtlinearen Gleichungssystemen.<br />

Je<strong>de</strong> Unbekannte repräsentiert <strong>de</strong>n Grauwert<br />

<strong>de</strong>s gefilterten Bil<strong>de</strong>s an einem einzigen Pixel. Man kann<br />

sich leicht vorstellen, welche numerischen Her<strong>aus</strong>for<strong><strong>de</strong>r</strong>ungen<br />

sich <strong>aus</strong> <strong><strong>de</strong>r</strong> hohen Auflösung mo<strong><strong>de</strong>r</strong>ner Digitalbil<strong><strong>de</strong>r</strong><br />

ergeben. Da wir uns jedoch auf Mo<strong>de</strong>llierungsaspekte<br />

konzentrieren möchten, soll dies hier nicht weiter<br />

vertieft wer<strong>de</strong>n.<br />

2 Elektrostatik<br />

Wir beginnen unsere Exkursion in die mathematische<br />

Mo<strong>de</strong>llierung von <strong>Bildverarbeitung</strong>sprozessen <strong>mit</strong> einem<br />

Ansatz, <strong><strong>de</strong>r</strong> auch ohne Kenntnisse über Differentialgleichungen<br />

intuitiv erfasst wer<strong>de</strong>n kann: Er verwen<strong>de</strong>t <strong>I<strong>de</strong>en</strong><br />

<strong>aus</strong> <strong><strong>de</strong>r</strong> Elektrostatik, die wir seit unserer Schulzeit<br />

kennen.<br />

Das <strong>Bildverarbeitung</strong>sproblem, das wir betrachten möchten,<br />

wird als Halftoningproblem bezeichnet: Wir möchten<br />

ein Grauwertbild drucken, haben aber lediglich<br />

schwarzen Toner o<strong><strong>de</strong>r</strong> schwarze Tinte zur Verfügung.<br />

In <strong><strong>de</strong>r</strong> Druckerbranche wer<strong>de</strong>n hierzu Verfahren eingesetzt,<br />

die Grauwerte durch geeignet verteilte schwarze<br />

Kreisscheiben approximieren. Das Problem <strong><strong>de</strong>r</strong> optimalen<br />

zweidimensionalen Approximation ist mathematisch<br />

sehr anspruchsvoll, und es gibt eine ganze Reihe von Algorithmen,<br />

die in Publikationen und Patenten beschrieben<br />

wur<strong>de</strong>n und die diese Aufgabe mehr o<strong><strong>de</strong>r</strong> weniger<br />

gut lösen. Viele dieser Metho<strong>de</strong>n sind recht heuristisch<br />

und auch teilweise relativ kompliziert.<br />

Ein neuartiges Verfahren, das auf einfachen elektrostatischen<br />

Prinzipien beruht und Ergebnisse liefert, die qualitativ<br />

zum Stand <strong><strong>de</strong>r</strong> Kunst gehören, wird in [10] beschrieben.<br />

Nehmen wir zunächst an, dass wir lediglich schwarze<br />

Kreisscheiben von einer einheitlichen, vorgegebenen<br />

Größe zur Verfügung haben. Je<strong><strong>de</strong>r</strong> dieser “Partikel” soll<br />

die gleiche negative Ladung tragen und frei beweglich<br />

sein. Aufgrund ihrer Abstoßungskräfte wer<strong>de</strong>n diese Teilchen<br />

nun versuchen, sich möglichst gleichmäßig im Bildbereich<br />

zu verteilen, um ihren Abstand zu maximieren.<br />

Wenn wir nun eine zusätzliche positive Ladungsverteilung<br />

einführen, die ortsfest ist und proportional zu <strong>de</strong>n<br />

dunklen Grauwerten im Bild wirkt, stellt sich ein neues<br />

Kräftegleichgewicht ein, bei <strong>de</strong>m sich die schwarzen<br />

Kreisscheiben in dunklen Bildbereichen stärker konzentrieren.<br />

Dabei mo<strong>de</strong>llieren wir die Kräfte zwischen zwei<br />

Abbildung 2. (a) Oben links: Originalzeichnung von Leonardo da<br />

Vinci. (b) Oben rechts: Elektrostatisches Halftoning <strong>mit</strong> zahlreichen<br />

kleinen Punkten [10]. (c) Unten links: Mit wenigen großen Punkten<br />

[10]. (d) Unten rechts: Elektrostatische Repräsentation <strong>mit</strong> Linien<br />

[11].<br />

gela<strong>de</strong>nen Teilchen als invers proportional zu ihrem Abstand<br />

und als proportional zum Produkt ihrer Ladungen.<br />

Ein entsprechen<strong>de</strong>s Halftoningresultat sehen wir in Abbildung<br />

2b und 2c für zwei verschie<strong>de</strong>ne Teilchengrößen.<br />

Interessanterweise genügen schon wenige Kreisscheiben,<br />

um die Strukturen <strong>de</strong>s Grauwertbil<strong>de</strong>s gut zu approximieren.<br />

Selbstverständlich kann man diese Mo<strong>de</strong>lle auf die<br />

verschie<strong>de</strong>nsten Arten weiterentwickeln, beispielsweise<br />

durch unterschiedliche Teilchengrößen und Ladungen.<br />

Darüber hin<strong>aus</strong> ist es möglich, mehrere Teilchen durch<br />

eine starre Achse <strong>mit</strong>einan<strong><strong>de</strong>r</strong> zu koppeln, um da<strong>mit</strong> anisotrope<br />

Strukturen durch Gera<strong>de</strong>nstücke zu approximieren<br />

[11]. Dadurch erhält man künstlerische Repräsentationen,<br />

die <strong>de</strong>m Charakter einer Bleistiftzeichnung beson<strong><strong>de</strong>r</strong>s<br />

nahe kommen (Abbildung 2d).<br />

Zusätzliche Möglichkeiten ergeben sich bei Farbbil<strong><strong>de</strong>r</strong>n,<br />

wo wir drei verschie<strong>de</strong>nen Teilchenarten einführen können<br />

(rot, grün und blau) [11]. Einerseits sollten wir in<br />

einem solchen Fall ein Kräftegleichgewicht innerhalb <strong><strong>de</strong>r</strong><br />

selben Teilchenart anstreben. An<strong><strong>de</strong>r</strong>erseits ist es sinn-<br />

MDMV 20 / 2012 | 82–90 FOKUS 83


Abbildung 3. Links: Originaldaten. Rechts: Elektrostatische Repräsentation<br />

<strong><strong>de</strong>r</strong> RGB-Kanäle <strong>mit</strong> Hilfe von Schinken, Champignons<br />

und Salamischeiben in drei verschie<strong>de</strong>nen Größen [11]. Quelle<br />

<strong><strong>de</strong>r</strong> Zutaten: (User:fugutabetai_shyashin, flickr.com, CC-BY-NC-SA),<br />

(User:cyclonebill, flickr.com, CC-BY-SA), (User:vagabondvince310,<br />

flickr.com, CC-BY).<br />

voll, auch Interaktionen zwischen unterschiedlichen Teilchenarten<br />

zu mo<strong>de</strong>llieren, um insgesamt zu einer <strong>aus</strong>gewogenen<br />

Verteilung zu gelangen. Eine unerwartete Anwendung<br />

in <strong><strong>de</strong>r</strong> Computergrafik sehen wir in Abbildung<br />

3. Hier verwen<strong>de</strong>n wir anstelle von roten, grünen<br />

und blauen Kreisscheiben Pizzazutaten in Form von<br />

Schinkenstücken, Champignons und Salamisscheiben unterschiedlicher<br />

Größe. Geben wir nun verschie<strong>de</strong>ne kontinierliche<br />

Verteilungen vor, so erzeugt unser elektrostatisches<br />

Pizzahalftoning einen Belag nach Wunsch. Während<br />

ein anonymer Gutachter diese Resultate als “yummy”<br />

beschrieben hat, hat uns ein italienischer Stu<strong>de</strong>nt<br />

darauf aufmerksam gemacht, dass diese Pizzen noch zu<br />

“<strong>de</strong>utsch” wirken, da <strong><strong>de</strong>r</strong> Belag insgesamt zu wohlgeordnet<br />

erscheint. Wir sind zuversichtlich, dass sich <strong>mit</strong> einer<br />

stärkeren Randomisierung <strong><strong>de</strong>r</strong> Algorithmen <strong><strong>de</strong>r</strong> italienische<br />

Charakter unserer Pizzen <strong>de</strong>utlicher her<strong>aus</strong>arbeiten<br />

lässt. Hat man das Grundprinzip <strong>de</strong>s elektrostatischen<br />

Halftonings verstan<strong>de</strong>n und kann es numerisch simulieren,<br />

liegt es auf <strong><strong>de</strong>r</strong> Hand, es auch auf an<strong><strong>de</strong>r</strong>e Anwendungen<br />

in <strong><strong>de</strong>r</strong> Computergrafik zu übertragen, beispielsweise<br />

für die Computersimulation von Wäl<strong><strong>de</strong>r</strong>n und Streuobstwiesen.<br />

Aus mathematischer Sicht führt <strong><strong>de</strong>r</strong> Ansatz <strong>de</strong>s elektrostatischen<br />

Halftonings auf interessante Optimierungsprobleme<br />

im Bereich <strong><strong>de</strong>r</strong> konvexen Analysis. Darüber hin<strong>aus</strong><br />

ist zu beachten, dass naive numerische Implementationen<br />

<strong><strong>de</strong>r</strong> Interaktion von N Teilchen auf iterative<br />

Verfahren führen, die eine Komplexität von O(N 2 ) pro<br />

Iterationsschritt besitzen. Da N recht groß sein kann,<br />

ist dies schon relativ ungünstig. Mit mathematisch anspruchsvolleren<br />

Metho<strong>de</strong>n, beispielsweise <strong>mit</strong> schnellen<br />

Summationstechniken <strong>aus</strong> <strong>de</strong>m Bereich <strong><strong>de</strong>r</strong> nichtäquidistanten<br />

Fouriertransformation, lässt sich die Komplexität<br />

auf O(N log N) reduzieren. Für weitere Details sei <strong><strong>de</strong>r</strong><br />

Leser auf [13] verwiesen.<br />

3 Diffusion<br />

Als nächstes wen<strong>de</strong>n wir uns einem grundlegen<strong>de</strong>n <strong>Bildverarbeitung</strong>sproblem<br />

zu, das bereits seit langem intensiv<br />

erforscht wird: <strong>de</strong>m Glätten und Entr<strong>aus</strong>chen von Bil<strong><strong>de</strong>r</strong>n.<br />

Es ist un<strong>mit</strong>telbar einsichtig, dass sich R<strong>aus</strong>chen typischerweise<br />

in Grauwertschwankungen zwischen Nachbarpixeln<br />

nie<strong><strong>de</strong>r</strong>schlägt. Um solche Fluktuationen zu entfernen,<br />

betrachten wir einen wohlbekannten Glättungsprozess<br />

<strong>aus</strong> <strong><strong>de</strong>r</strong> Physik: Diffusion ist ein massenerhalten<strong><strong>de</strong>r</strong><br />

Mechanismus, <strong><strong>de</strong>r</strong> Konzentrationsunterschie<strong>de</strong> <strong>aus</strong>gleicht.<br />

In einer zweidimensionalen Welt <strong>mit</strong> Konzentrationen<br />

u(x, y, t) im Ort (x, y) zur Zeit t genügt er im<br />

einfachsten Fall <strong><strong>de</strong>r</strong> Differentialgleichung<br />

∂tu = Δu (1)<br />

wobei Δu = ∂xx u + ∂yy u <strong>de</strong>n örtlichen Laplaceoperator<br />

darstellt. Diese Gleichung bezeichnet man als homogene<br />

(lineare) Diffusionsgleichung. Typischerweise kennt man<br />

die Konzentrationsverteilung zur Zeit t =0(Anfangsbedingung),<br />

u(x, y, 0) = f (x, y), (2)<br />

und ist an <strong><strong>de</strong>r</strong> zeitlichen Evolution für t > 0 interessiert.<br />

Um diesen Ausgleichsvorgang auf Grauwertbil<strong><strong>de</strong>r</strong> zu<br />

übertragen, müssen wir lediglich die Anfangskonzentrationsverteilung<br />

<strong>mit</strong> unserem Grauwertbild f (x, y) i<strong>de</strong>ntifizieren.<br />

Üblicherweise nimmt man darüber hin<strong>aus</strong> an,<br />

dass <strong><strong>de</strong>r</strong> Fluss über <strong>de</strong>n Rand unseres Bildbereichs verschwin<strong>de</strong>t<br />

(homogene Neumann-Randbedingungen). Die<br />

Lösung u(x, y, t) stellt dann ein geglättetes Bild dar, wobei<br />

die Zeit t als Glättungsparameter fungiert: Größere<br />

Werte liefern glattere Lösungen.<br />

Homogene Diffusion wird in <strong><strong>de</strong>r</strong> <strong>Bildverarbeitung</strong> schon<br />

seit über 50 Jahren verwen<strong>de</strong>t: Bereits in Jahr 1959 hat<br />

Taizo Iijima diesen Prozess axiomatisch fundiert, in<strong>de</strong>m er<br />

bewiesen hat, dass dies <strong><strong>de</strong>r</strong> einzige Glättungsvorgang ist,<br />

<strong><strong>de</strong>r</strong> fünf Axiomen genügt: Linearität, Translationsinvarianz,<br />

Skaleninvarianz, <strong><strong>de</strong>r</strong> Halbgruppeneigenschaft und <strong><strong>de</strong>r</strong><br />

Erhaltung <strong><strong>de</strong>r</strong> Nichtnegativität [5]. Diese auf Japanisch publizierten<br />

Ergebnisse blieben in <strong><strong>de</strong>r</strong> westlichen Welt lange<br />

Zeit unbekannt. In Japan selbst wur<strong>de</strong>n homogene Diffusionsfilter<br />

im Bereich <strong><strong>de</strong>r</strong> optischen Zeichenerkennung<br />

(OCR) <strong>mit</strong> großem Erfolg eingesetzt.<br />

84 FOKUS MDMV 20 / 2012 | 82–90


Abbildung 4. Homogene Diffusionfilterung zur Visualisierung <strong><strong>de</strong>r</strong><br />

Wolkigkeit in Spinnvlies auf verschie<strong>de</strong>nen Skalen. Von links oben<br />

nach rechts unten: Wachsen<strong>de</strong> Diffusionszeit.<br />

Abbildung 4 zeigt die Wirkung <strong><strong>de</strong>r</strong> homogenen Diffusionsfilterung<br />

anhand eines Beispiels <strong>aus</strong> <strong><strong>de</strong>r</strong> computergestützten<br />

Qualitätskontrolle von Spinnvlies. Hierbei möchte<br />

man die Wolkigkeit auf verschie<strong>de</strong>nen Skalen darstellen<br />

und analysieren. Die Resultate zu unterschiedlichen<br />

Diffusionszeiten liefern diese gewünschte Skalenraumrepräsentation.<br />

In<strong>de</strong>m man für die jeweiligen Bil<strong><strong>de</strong>r</strong> die Varianz<br />

berechnet, hat man ein Maß für die Wolkigkeit auf<br />

verschie<strong>de</strong>nen Skalen.<br />

Während homogene Diffusion für die obige Anwendung<br />

i<strong>de</strong>al erscheint, ist sie bei an<strong><strong>de</strong>r</strong>en Problemen zu unflexibel:<br />

Deutliche Grauwertunterschie<strong>de</strong> zwischen Nachbarpixeln<br />

müssen nicht notwendigerweise auf R<strong>aus</strong>chen<br />

zurückgehen, son<strong><strong>de</strong>r</strong>n können beispielsweise auch durch<br />

Bildkanten verursacht wer<strong>de</strong>n. Solche Kanten möchte<br />

man häufig nicht wegglätten, da sie essentielle Bildinformation<br />

beinhalten. Es wäre daher schön, wenn man unterschiedliche<br />

Bildstrukturen unterschiedlich behan<strong>de</strong>ln<br />

könnte. Dies ist im Rahmen <strong><strong>de</strong>r</strong> homogenen Diffusionsfilterung<br />

lei<strong><strong>de</strong>r</strong> nicht möglich und erfor<strong><strong>de</strong>r</strong>t ortsvariante<br />

Prozesse. Im Jahr 1990 haben Perona und Malik hierzu<br />

folgen<strong>de</strong> nichtlineare Diffusionsgleichung vorgeschla-<br />

gen [9]:<br />

∂tu = div<br />

“<br />

g(|∇u| 2 ”<br />

) ∇u , (3)<br />

wobei div <strong>de</strong>n örtlichen Divergenzoperator beschreibt.<br />

Hierbei wird die Diffusion durch eine nichtlineare Diffusivität<br />

g(|∇u| 2 1<br />

)=<br />

1+|∇u| 2 /λ2 (4)<br />

gesteuert, die eine monoton fallen<strong>de</strong> Funktion im Betrag<br />

<strong>de</strong>s Bildgradienten ist. Wichtige Kanten, bei <strong>de</strong>nen<br />

|∇u| ≫λ gilt, möchte man dabei möglichst wenig glät-<br />

Abbildung 5. Nichtlineare Diffusion in <strong><strong>de</strong>r</strong> Mammographie. Links:<br />

Ausschnitt <strong>aus</strong> einem Mammogramm, 128 × 128 Pixel. Die hellen<br />

Strukturen sind Mikrokalzifikationen, die bei <strong><strong>de</strong>r</strong> Krebsfrüherkennung<br />

eine Rolle spielen. Rechts: Nach einer nichtlinearen Diffusionsfilterung<br />

wer<strong>de</strong>n Mikrokalzifikationen besser sichtbar.<br />

ten, während R<strong>aus</strong>chen, das sich in geringeren Fluktuationen<br />

nie<strong><strong>de</strong>r</strong>schlägt (|∇u| ≪λ), wirksam entfernt wer<strong>de</strong>n<br />

soll.<br />

Während das ursprüngliche Perona–Malik-Mo<strong>de</strong>ll in <strong><strong>de</strong>r</strong><br />

kontinuierlichen Formulierung <strong>mit</strong> einigen Gutgestelltheitsproblemen<br />

zu kämpfen hat, gibt es eine Reihe von<br />

Modifikationen, die sich als sehr stabil und äußerst nützlich<br />

in <strong><strong>de</strong>r</strong> Praxis erwiesen haben. So kann man beispielsweise<br />

<strong>de</strong>n “Kanten<strong>de</strong>tektor” |∇u| durch eine robustere<br />

Variante |∇uσ| ersetzen , wobei uσ durch eine Faltung<br />

von u <strong>mit</strong> einem Gaußkern Gσ <strong>mit</strong> Standardabweichung<br />

σ entstan<strong>de</strong>n ist [3]. Abbildung 5 zeigt eine Anwendung,<br />

bei <strong><strong>de</strong>r</strong> durch eine solche nichtlineare Diffusionsfilterung<br />

winzige Verkalkungen in <strong><strong>de</strong>r</strong> Mammographie<br />

her<strong>aus</strong>gearbeitet wer<strong>de</strong>n. Für weiterführen<strong>de</strong> Diskussionen<br />

zu nichtlinearen Diffusionsfiltern wird auf die<br />

Monografie [14] verwiesen, die im Internet frei erhältlich<br />

ist.<br />

4 Wellen<strong>aus</strong>breitung<br />

Die bisher betrachteten Diffusionsgleichungen sind Prototypen<br />

für sogenannte parabolische Differentialgleichungen.<br />

Sie üben einen stark glätten<strong>de</strong>n Effekt in positiver<br />

Zeitrichtung <strong>aus</strong>. Wir wollen uns nun einem an<strong><strong>de</strong>r</strong>en<br />

Typ partieller Differentialgleichungen widmen, <strong><strong>de</strong>r</strong> als hyperbolisch<br />

bezeichnet wird und <strong>de</strong>ssen Verhalten sich<br />

durch die Ausbreitung von Wellen illustrieren lässt. Hier<br />

sind Vorwärts- und Rückwärtsrichtung in <strong><strong>de</strong>r</strong> Zeit grundsätzlich<br />

gleichberechtigt, und es kommt nicht notwendigerweise<br />

zu Glättungseffekten. Ganz im Gegenteil: Von<br />

hyperbolischen Differentialgleichungen weiß man, dass<br />

sie selbst bei glatten Anfangsdaten nicht differenzierbare<br />

Lösungen erzeugen können. Solche “Schocks” können<br />

in <strong><strong>de</strong>r</strong> <strong>Bildverarbeitung</strong> durch<strong>aus</strong> wünschenswert<br />

sein, wenn sie als Berandungen von Bildobjekten dienen.<br />

MDMV 20 / 2012 | 82–90 FOKUS 85


Als Protypen für hyperbolische Differentialgleichungen<br />

betrachten wir folgen<strong>de</strong> zwei Evolutionsgleichungen, die<br />

<strong>mit</strong> <strong>de</strong>m Originalbild f als Anfangswert zur Zeit t =0<br />

starten:<br />

∂tu = +|∇u|, (5)<br />

∂tu = −|∇u|. (6)<br />

Die erste Gleichung beschreibt eine sogenannte Dilatation.<br />

Ihre Lösung u(x, y, t) zur Zeit t > 0 ersetzt <strong>de</strong>n<br />

Grauwert f (x, y) durch das Maximum innerhalb einer<br />

Kreisscheibe vom Radius t. In analoger Weise ersetzt die<br />

zweite Gleichung, die eine Erosion simuliert, <strong>de</strong>n Grauwert<br />

durch das Minimum innerhalb einer Kreisscheibe<br />

vom Radius t. Bei<strong>de</strong> Prozesse bil<strong>de</strong>n die Grundb<strong>aus</strong>teine<br />

<strong><strong>de</strong>r</strong> sogenannten mathematischen Morphologie. Dieses<br />

Gebiet wur<strong>de</strong> um 1965 von Serra und Matheron an <strong><strong>de</strong>r</strong><br />

ENS <strong>de</strong>s Mines in Fontainebleau begrün<strong>de</strong>t und zunächst<br />

mengentheoretisch formalisiert [12]. Seit rund zwanzig<br />

Jahren verwen<strong>de</strong>t man auch entsprechen<strong>de</strong> PDE-basierte<br />

Formulierungen; siehe z. B. [1].<br />

Wie <strong><strong>de</strong>r</strong> Leser wohl bereits vermutet hat, wur<strong>de</strong> <strong><strong>de</strong>r</strong> Begriff<br />

<strong><strong>de</strong>r</strong> Erosion durch reale Erosionsvorgänge in <strong><strong>de</strong>r</strong> Natur<br />

motiviert. Dilatation beschreibt einen Ausbreitungsprozess,<br />

wie man ihn in <strong><strong>de</strong>r</strong> Physik vom Huygens-Prinzip<br />

her kennt: Eine Wellenfront breitet sich in äußerer Normalenrichtung<br />

<strong>aus</strong>. Dilatation und Erosion agieren komplementär:<br />

Einer Dilatation <strong>de</strong>s Vor<strong><strong>de</strong>r</strong>grunds entspricht<br />

eine Erosion <strong>de</strong>s Hintergrunds und umgekehrt. Abbildung<br />

6 illustriert die Wirkung von Dilatation und Erosion<br />

auf ein Binärbild von Island.<br />

Abbildung 6. Illustration <strong><strong>de</strong>r</strong> morphologischen Grundprozesse Dilatation<br />

und Erosion. Linke Spalte: Dilatation eines Binärbilds von Island<br />

<strong>mit</strong> wachsen<strong>de</strong>n Evolutionszeiten. Rechte Spalte: Entsprechen<strong>de</strong> Erosion.<br />

Abbildung 7. Links: Fingerabdruck (186 × 186 Pixel) <strong>mit</strong> additivem<br />

Gauß-R<strong>aus</strong>chen. Die R<strong>aus</strong>chvarianz beträgt das Vierfache <strong><strong>de</strong>r</strong> Bildvarianz.<br />

Rechts: Nach koherärenzverstärken<strong><strong>de</strong>r</strong> Schockfilterung.<br />

Abbildung 8. Wen<strong>de</strong>t man koherärenzverstärken<strong>de</strong> Schockfilter<br />

auf Bil<strong><strong>de</strong>r</strong> von Personen an, entstehen karikaturartige Effekte. Links:<br />

Originalbild von Professor Albrecht (Universität <strong>de</strong>s Saarlan<strong>de</strong>s),<br />

480 × 640 Pixel. Rechts: Nach koherärenzverstärken<strong><strong>de</strong>r</strong> Schockfilterung.<br />

Während Dilatation und Erosion für sich genommen nur<br />

von begrenztem Nutzen sind, entstehen durch ihre geschickte<br />

Kombination mächtige <strong>Bildverarbeitung</strong>swerkzeuge.<br />

Beispielsweise verwen<strong>de</strong>t man bei <strong>de</strong>n sogenannten<br />

Schockfiltern die Dilatationsgleichung im Einzugsbereich<br />

<strong><strong>de</strong>r</strong> Maxima, während die Erosionsgleichung im Einzugsbereich<br />

<strong><strong>de</strong>r</strong> Minima agiert [8]. So<strong>mit</strong> breiten sich sowohl<br />

Maxima als auch Minima <strong>aus</strong>, und an <strong><strong>de</strong>r</strong> Grenze<br />

bei<strong><strong>de</strong>r</strong> Einzugsbereiche entsteht eine Diskontinuität<br />

(Schock). Die einzelnen Schockfilter unterschei<strong>de</strong>n sich<br />

insbeson<strong><strong>de</strong>r</strong>e durch verschie<strong>de</strong>ne Definitionen <strong><strong>de</strong>r</strong> Einzugsbereiche.<br />

Beispielsweise kann man diese Einzugsbereiche<br />

so wählen, dass kohärente, flussartige Strukturen<br />

her<strong>aus</strong>gearbeitet wer<strong>de</strong>n [15]. Derartige kohärenzverstärken<strong>de</strong><br />

Schockfilter erlauben es unter an<strong><strong>de</strong>r</strong>em, Fingerabdrucksbil<strong><strong>de</strong>r</strong><br />

in hoher Qualität aufzubereiten (Abbildung<br />

7). Wie so oft im Leben und in <strong><strong>de</strong>r</strong> <strong>Bildverarbeitung</strong><br />

gehen die erwünschten Wirkungen auch <strong>mit</strong> Nebenwirkungen<br />

einher, die manchmal sogar interessanter<br />

sind: Wen<strong>de</strong>t man kohärenzverstärken<strong>de</strong> Schockfilter auf<br />

Porträtaufnahmen von Personen an, so entstehen Karikaturen,<br />

bei <strong>de</strong>nen Frisur, Bart und Brille <strong>mit</strong> beson<strong><strong>de</strong>r</strong>er<br />

Hingabe verstärkt wer<strong>de</strong>n (Abbildung 8).<br />

86 FOKUS MDMV 20 / 2012 | 82–90


5 Wärmeleitung<br />

Neben parabolischen und hyperbolischen Differentialgleichungen<br />

sind nicht zuletzt auch elliptische Differentialgleichungen<br />

von großer Be<strong>de</strong>utung. Sie entstehen beispielsweise<br />

als stationäre Zustän<strong>de</strong> (t → ∞) parabolischer<br />

Prozesse.<br />

Wir möchten in diesem Zusammenhang insbeson<strong><strong>de</strong>r</strong>e<br />

stationäre Wärmeleitungsprozesse betrachten. Bekanntermaßen<br />

folgen Wärmeleitungvorgänge <strong>de</strong>nselben Differentialgleichungen<br />

wie Diffusionsprozesse, so dass wir<br />

auf unseren Kenntnissen <strong>aus</strong> Abschnitt 4 aufbauen können.<br />

Der Unterschied liegt lediglich in <strong><strong>de</strong>r</strong> physikalischen<br />

Interpretation, die im Fall <strong>de</strong>s stationären Zustands für<br />

die Wärmeleitung etwas intuitiver erscheint als für Diffusion.<br />

Wir möchten <strong>I<strong>de</strong>en</strong> <strong>aus</strong> <strong>de</strong>m Bereich <strong><strong>de</strong>r</strong> Wärmeleitung<br />

verwen<strong>de</strong>n, um fehlen<strong>de</strong> Strukturen in Bil<strong><strong>de</strong>r</strong>n zu rekonstruieren.<br />

Dies ist eine typische Interpolationsaufgabe. In<br />

<strong><strong>de</strong>r</strong> <strong>Bildverarbeitung</strong> spricht man auch von Inpainting. Um<br />

Inpaintingprobleme <strong>mit</strong> Wärmeleitungsmo<strong>de</strong>llen zu lösen,<br />

stellen wir uns vor, dass wir alle bekannten Pixel als<br />

kleine Heizkörper auffassen, die <strong>mit</strong> einem Thermostat<br />

zu je<strong><strong>de</strong>r</strong> Zeit auf einer festen Temperatur gehalten wer<strong>de</strong>n,<br />

die ihrem Grauwert entspricht. In <strong>de</strong>n unbekannten<br />

Pixeln lösen wir nun eine Wärmeleitungsgleichung<br />

für t →∞. Im einfachsten Fall einer homogenen Wärmeleitung<br />

be<strong>de</strong>utet dies, dass wir die Laplacegleichung<br />

Δu =0 (7)<br />

verwen<strong>de</strong>n. Die stationäre Temperaturverteilung interpretieren<br />

wir als rekonstruiertes Bild.<br />

Neben <strong><strong>de</strong>r</strong> homogenen Wärmeleitung haben sich anisotrope<br />

Wärmeleitungsprozesse als beson<strong><strong>de</strong>r</strong>s nützlich<br />

erwiesen, insbeson<strong><strong>de</strong>r</strong>e wenn fehlen<strong>de</strong> Kanten in hoher<br />

Qualität rekonstruiert wer<strong>de</strong>n sollen. Hierzu betrachten<br />

wir Gleichungen <strong><strong>de</strong>r</strong> Form<br />

div (D(∇uσ) ∇u) =0. (8)<br />

Der Wärmeleitungstensor D ist eine positiv <strong>de</strong>finite<br />

2 × 2-Matrix <strong>mit</strong> Eigenvektoren ∇uσ und ∇u ⊥ σ ,wobei<br />

uσ wie<strong><strong>de</strong>r</strong>um eine <strong>mit</strong> einem Gaußkern geglättete Version<br />

von u beschreibt. Die Richtung <strong><strong>de</strong>r</strong> Eigenvektoren<br />

verläuft so<strong>mit</strong> senkrecht bzw. parallel zu Bildkanten. Die<br />

entsprechen<strong>de</strong>n Eigenwerte seien durch<br />

g(|∇uσ| 2 )=<br />

1<br />

p 1+|∇uσ| 2 /λ 2<br />

bzw. 1 gegeben. Wir möchten also einen <strong>aus</strong>geprägten<br />

Wärme<strong>aus</strong>gleich längs <strong><strong>de</strong>r</strong> Bildkanten, während wir <strong>de</strong>n<br />

Ausgleich über Kanten hinweg <strong>de</strong>utlich einschränken (je<br />

steiler die Kante, <strong>de</strong>sto stärker). Derartige Mo<strong>de</strong>lle wur<strong>de</strong>n<br />

zuerst im Zusammenhang <strong>mit</strong> Diffusionsfiltern zum<br />

Entr<strong>aus</strong>chen von Bil<strong><strong>de</strong>r</strong>n vorgeschlagen [14], zeigen jedoch<br />

für Interpolationsaufgaben ihre Qualitäten noch<br />

(9)<br />

Abbildung 9. Interpolation <strong>mit</strong>hilfe von Wärmeleitungsmo<strong>de</strong>llen.<br />

Links: Farbbild (438 × 297 Pixel) <strong>mit</strong> überlagertem Text. Rechts:<br />

Eine anisotrope Wärmeleitungsgleichung rekonstruiert die fehlen<strong>de</strong><br />

Information.<br />

<strong>de</strong>utlicher. Abbildung 9 präsentiert eine Inpaintinganwendung<br />

unseres anisotropen Wärmeleitungsmo<strong>de</strong>lls. Wir<br />

erkennen eine realistische Dateninterpolation.<br />

Wer in dieser Richtung einmal Blut geleckt hat, fragt sich<br />

schnell, wie weit man dabei gehen kann. Abbildung 10<br />

zeigt ein Experiment, bei <strong>de</strong>m nur ein kleiner Teil <strong><strong>de</strong>r</strong> gesamten<br />

Bilddaten vorgegeben ist. Nichts<strong>de</strong>strotrotz gelingt<br />

es <strong><strong>de</strong>r</strong> anisotropen Wärmeleitung, im stationären<br />

Fall die Kontur <strong><strong>de</strong>r</strong> Katze sehr gut zu rekonstruieren.<br />

Ein nächster Schritt wäre es nun, diese Konzepte<br />

für Kompressionsanwendungen nutzbar zu machen. Die<br />

Grundi<strong>de</strong>e erscheint simpel: Man speichert die Bilddaten<br />

nur an wenigen Pixeln und rekonstruiert die fehlen<strong>de</strong><br />

Information durch wärmeleitungsbasiertes Inpainting.<br />

Erwartungsgemäß hängt die Qualität <strong><strong>de</strong>r</strong> Rekonstruktion<br />

von <strong><strong>de</strong>r</strong> Wahl <strong><strong>de</strong>r</strong> Pixel ab. Während die anisotrope<br />

Wärmeleitungsgleichung aufgrund ihrer <strong>aus</strong>gefeilten Mo<strong>de</strong>llannahmen<br />

hier recht robust ist, profitiert insbeson<strong><strong>de</strong>r</strong>e<br />

die einfachere homogene Wärmeleitung sehr von<br />

einer guten Pixelwahl.<br />

Abbildung 10. Links oben: Die Form eines zu rekonstruieren<strong>de</strong>n binären<br />

Objekts wur<strong>de</strong> auf 24 kleinen Kreisscheiben vorgegeben. Diese<br />

dienen als Daten für die Interpolation. An allen an<strong><strong>de</strong>r</strong>en Stellen wur<strong>de</strong><br />

<strong>mit</strong> gleichverteiltem R<strong>aus</strong>chen initialisiert. Rechts oben bis rechts<br />

unten: Zeitliche Evolution eines Interpolationsprozesses, <strong><strong>de</strong>r</strong> auf einer<br />

anisotropen Wärme<strong>aus</strong>breitung beruht.<br />

MDMV 20 / 2012 | 82–90 FOKUS 87


Was sind also gute Interpolationsdaten? Im Fall <strong><strong>de</strong>r</strong> homogenen<br />

Wärmeleitung lässt sich diese Frage sogar analytisch<br />

beantworten. In [2] wur<strong>de</strong> <strong>mit</strong> Metho<strong>de</strong>n <strong>aus</strong><br />

<strong>de</strong>m Bereich <strong><strong>de</strong>r</strong> Shapeoptimierung gezeigt, dass man die<br />

Dichte <strong><strong>de</strong>r</strong> zu speichern<strong>de</strong>n Pixel so wählen sollte, dass<br />

sie eine monoton wachsen<strong>de</strong> Funktion von |Δf | ist. Wie<br />

gut dies in <strong><strong>de</strong>r</strong> Praxis funktioniert, illustriert Abbildung<br />

11. Um von <strong><strong>de</strong>r</strong> kontinuierlichen Pixeldichte |Δf | zu einer<br />

konkreten Pixel<strong>aus</strong>wahl zu gelangen, wur<strong>de</strong> das bereits<br />

vorgestellte elektrostatische Haftoning verwen<strong>de</strong>t.<br />

Wir erkennen, dass sich das Bild von Felix Klein schon<br />

<strong>aus</strong> lediglich 10 % aller Pixel <strong>mit</strong> hoher Genauigkeit rekonstruieren<br />

lässt.<br />

Aktuelle Kompressionsstandards wie JPEG und JPEG<br />

2000 sind völlig an<strong><strong>de</strong>r</strong>sartig aufgebaut und beruhen auf<br />

orthogonalen Transformationen (diskrete Kosinustransformation<br />

bei JPEG, diskrete Wavelettransformation bei<br />

JPEG 2000). In <strong><strong>de</strong>r</strong> Transformationsdomaine wer<strong>de</strong>n visuell<br />

wenig relevante Koeffizienten ungenauer gespeichert<br />

o<strong><strong>de</strong>r</strong> sogar komplett weggelassen. Diese Kompressionsansätze<br />

sind hochgradig optimiert. Um <strong>mit</strong> ihnen <strong>mit</strong>halten<br />

zu können, muss man ebenfalls zahlreiche Optimierungsschritte<br />

durchführen, bei <strong>de</strong>nen insbeson<strong><strong>de</strong>r</strong>e auch<br />

<strong>de</strong>n Ort <strong><strong>de</strong>r</strong> zu speichern<strong>de</strong>n Pixel effizient kodiert wird<br />

[6].<br />

Abbildung 11. Oben links: Originalbild von Felix Klein, 512 × 720<br />

Pixel. Oben rechts: Betrag <strong>de</strong>s Laplaceoperators. Dunkle Farben repräsentieren<br />

hier hohe Werte. Unten links: Ausgewähle Interpolationspunkte<br />

bei einer gewünschten Dichte von 10 %. Hierzu wur<strong>de</strong><br />

elektrostatisches Halftoning verwen<strong>de</strong>t. Unten rechts: Nach Interpolation<br />

<strong>mit</strong> <strong><strong>de</strong>r</strong> Laplacegleichung.<br />

Abbildung 12. Vergleich verschie<strong>de</strong>ner Kompressionsverfahren bei<br />

einer Kompressionsrate (Reduktion <strong><strong>de</strong>r</strong> Dateigröße) von 104:1. Oben<br />

links: Originalbild, 380 × 431 Pixel. Oben rechts: Komprimiert <strong>mit</strong><br />

JPEG. Man erkennt <strong>de</strong>utliche Blockartefakte. Unten links: Mit <strong>de</strong>m<br />

mo<strong><strong>de</strong>r</strong>neren, waveletbasierten JPEG2000-Verfahren ist die Qualität<br />

wesentlich besser. Unten rechts: Eine Kompression <strong>mit</strong> <strong><strong>de</strong>r</strong> homogenen<br />

Wärmeleitungsgleichung liefert die besten Ergebnisse [6].<br />

Glücklicherweise scheint sich dieser Aufwand <strong>aus</strong>zuzahlen,<br />

wie man in Abbildung 12 erkennt. Bei nicht allzu stark<br />

texturierten Bil<strong><strong>de</strong>r</strong>n und hohen Kompressionsraten ist<br />

unser Wärmeleitungsansatz sowohl <strong>de</strong>m JPEG-Standard<br />

als auch seinem Nachfolger JPEG 2000 qualitativ überlegen.<br />

Zur Zeit forscht unsere Arbeitsgruppe sehr intensiv<br />

an weiteren Verbesserungen dieser PDE-basierten Metho<strong>de</strong>n<br />

zur Datenkompression.<br />

6 Osmose<br />

Nach<strong>de</strong>m wir Diffusionsgleichungen erfolgreich für eine<br />

Reihe von <strong>Bildverarbeitung</strong>sproblemen eingesetzt haben,<br />

wollen wir nun untersuchen, ob sich durch eine<br />

Modifikation dieser Prozesse weitere Anwendungsfel<strong><strong>de</strong>r</strong><br />

erschließen lassen [4]. Diskretisiert man Diffusionsgleichungen<br />

<strong>mit</strong>hilfe expliziter Finite-Differenzen-Verfahren,<br />

so gelangt man zu symmetrischen Markowketten. Symmetrie<br />

be<strong>de</strong>utet, dass die Übergangswahrscheinlichkeit<br />

von Grauwerten zwischen einem Pixel A und seinem<br />

Nachbarpixel B i<strong>de</strong>ntisch ist zur Übergangswahrscheinlichkeit<br />

von B zu A. Diese Symmetrieeigenschaft wird benötigt,<br />

um ein Maximum-Minimum-Prinzip sowie Konvergenz<br />

zu einem konstanten stationären Zustand zu beweisen<br />

(falls man nicht wie im vorherigen Abschnitt zusätzliche<br />

Daten spezifiziert) [14].<br />

88 FOKUS MDMV 20 / 2012 | 82–90


Es wäre spannend zu untersuchen, welche zusätzlichen<br />

Mo<strong>de</strong>llierungsmöglichkeiten sich ergeben, wenn man auf<br />

die Symmetrieeigenschaft verzichtet. Stellt man sich<br />

einen Grauwertübergang zwischen benachbarten Pixeln<br />

als einen Teilchentransport durch eine virtuelle Membran<br />

vor, die sich zwischen <strong>de</strong>n Pixeln befin<strong>de</strong>t, so erinnert<br />

eine unsymmetrische Durchlässigkeit in bei<strong>de</strong>n Richtungen<br />

an Osmoseprozesse. Bei diesen können sich bekanntermaßen<br />

unterschiedliche stationäre Konzentrationen<br />

auf bei<strong>de</strong>n Seiten einstellen. Verwandte osmoseartige<br />

Mo<strong>de</strong>lle für die <strong>Bildverarbeitung</strong> lassen sich durch<br />

Drift-Diffusions-Prozesse beschreiben. Im einfachsten (linearen)<br />

Fall haben diese folgen<strong>de</strong> Struktur:<br />

∂tu =Δu − div (du). (10)<br />

Der Driftvektor d generiert die erwünschte Unsymmetrie<br />

und ist für nicht konstante stationäre Zustän<strong>de</strong><br />

verantwortlich. Wählt man beispielsweise d(x, y) =<br />

∇(ln v(x, y)) <strong>mit</strong> einem nichtnegativen Bild v, sokonvergiert<br />

<strong><strong>de</strong>r</strong> Prozess für t →∞gegen ein Vielfaches von<br />

v. Dieser Zusammenhang erlaubt es uns also, durch Vorgabe<br />

von Ableitungsdaten eines Zielbil<strong>de</strong>s ln v einen Evolutionsprozess<br />

zu konstruieren, <strong>de</strong>ssen stationärer Zustand<br />

w die Gleichung ∇(ln w) = ∇(ln v) erfüllt. In<br />

diesem Sinne gibt es zu je<strong>de</strong>m differenzierbaren positiven<br />

Bild v(x, y) einen induzierten Driftvektor d(x, y) =<br />

∇(ln v(x, y)). Abbildung 13 illustriert die Konvergenz eines<br />

Osmoseprozesses gegen ein vorgegebenes Bild.<br />

Selbstverständlich erscheint es zunächst wenig sinnvoll,<br />

Prozesse zu mo<strong>de</strong>llieren, die im Sinne dieser logarithmischen<br />

Ableitungsdaten gegen einen bereits bekannten<br />

stationären Zustand konvergieren. Spannen<strong><strong>de</strong>r</strong> wird die<br />

Sache jedoch, wenn wir „Ableitungsdaten“ vorschreiben,<br />

Abbildung 13. Osmose erlaubt die Spezifikation eines beliebigen<br />

stationären Zustands. Von links oben bis rechts unten: Zeitliche Evolution<br />

eines Osmoseprozesses.<br />

Abbildung 14. Osmose zum Editieren von Bil<strong><strong>de</strong>r</strong>n. Oben links: Gemäl<strong>de</strong><br />

von Euler. Oben rechts: Zeichnung von Lagrange. Unten links:<br />

Direktes Einsetzen <strong>de</strong>s Kopfes von Lagrange in das Gemäl<strong>de</strong> von Euler<br />

ist sofort als plumpe Bildmanipulation erkennbar. Unten rechts:<br />

Fusionierung über die Driftvektoren eines Osmoseprozesses erlaubt<br />

einen nahtlosen Übergang [4].<br />

die überhaupt nicht exakt integrierbar sind. Dann erzeugt<br />

die Osmose stationäre Zustän<strong>de</strong>, die versuchen, alle<br />

ihnen auferlegten wi<strong><strong>de</strong>r</strong>sprüchlichen Bedingungen möglichst<br />

gut zu approximieren. Dies kann man beispielsweise<br />

dazu verwen<strong>de</strong>n, Bil<strong><strong>de</strong>r</strong> nahtlos zu fusionieren, in<strong>de</strong>m<br />

man in einem Bereich die Ableitungsinformationen (induzierte<br />

Driftvektoren) <strong>de</strong>s einen Bil<strong>de</strong>s und im an<strong><strong>de</strong>r</strong>en<br />

Bereich Ableitungsinformationen <strong>de</strong>s an<strong><strong>de</strong>r</strong>en Bil<strong>de</strong>s vorgibt<br />

und einen Osmoseprozess startet. Das Anfangsbild<br />

ist hierbei kaum relevant: Lediglich sein <strong>mit</strong>tlerer Grauwert<br />

wird erhalten. Ein entsprechen<strong>de</strong>s Beispiel fin<strong>de</strong>t<br />

sich in Abbildung 14, wo es gelungen ist, <strong>mit</strong>hilfe eines<br />

Osmoseprozesses <strong>de</strong>n Kopf von Lagrange nahtlos in ein<br />

Gemäl<strong>de</strong> von Euler zu integrieren [4].<br />

7 Zusammenfassung<br />

<strong>Mathematische</strong> <strong>Bildverarbeitung</strong> ist ein vergleichsweise<br />

junges Gebiet <strong><strong>de</strong>r</strong> angewandten <strong>Mathematik</strong>, <strong>de</strong>ssen Faszination<br />

auch auf <strong><strong>de</strong>r</strong> Tatsache beruht, dass hier die unterschiedlichsten<br />

<strong>I<strong>de</strong>en</strong> <strong>aus</strong> Natur und Technik Einzug gehalten<br />

haben. Es ist eine spannen<strong>de</strong> Frage, warum es gera<strong>de</strong><br />

diese <strong>I<strong>de</strong>en</strong> sind, die sich als beson<strong><strong>de</strong>r</strong>s fruchtbar erwiesen<br />

haben. Viele Prozesse <strong>aus</strong> <strong><strong>de</strong>r</strong> Natur folgen gewissen<br />

Optimalitätsprinzipien und weisen zahlreiche Invarianzen<br />

MDMV 20 / 2012 | 82–90 FOKUS 89


auf. Bei<strong>de</strong>s ist auch für die <strong>Bildverarbeitung</strong> von enormer<br />

Be<strong>de</strong>utung. Zu<strong>de</strong>m ergibt sich hier<strong>aus</strong> auch die Möglichkeit,<br />

von <strong>de</strong>m reichhaltigen Wissen zu profitieren, das<br />

man in an<strong><strong>de</strong>r</strong>en Bereichen über diese Prozesse gewonnen<br />

hat.<br />

<strong>Mathematische</strong> Bildverarbeiter genießen sämtliche Freiheiten,<br />

Mo<strong>de</strong>lle nach <strong>de</strong>n jeweiligen Zielsetzungen zu modifizieren,<br />

und sie können die Auswirkungen ihrer mathematischen<br />

Mo<strong>de</strong>llierungsbestrebungen sofort visuell studieren.<br />

Auch wenn wir uns in diesem Beitrag hauptsächlich<br />

auf Prozesse konzentriert haben, die durch Differentialgleichungen<br />

beschrieben wer<strong>de</strong>n können, soll nicht<br />

unerwähnt bleiben, dass nahezu alle Gebiete <strong><strong>de</strong>r</strong> <strong>Mathematik</strong><br />

ihren Stempel hinterlassen haben. Dadurch ergeben<br />

sich täglich neue und unerwartete mathematische<br />

Her<strong>aus</strong>for<strong><strong>de</strong>r</strong>ungen, und je<strong><strong>de</strong>r</strong> <strong>Mathematik</strong>er ist herzlich<br />

eingela<strong>de</strong>n, zu ihrer Lösung beizutragen.<br />

Danksagung<br />

Es ist mir eine Freu<strong>de</strong>, mich bei allen Kollegen, Mitarbeitern<br />

und Studieren<strong>de</strong>n zu bedanken, die durch ihr Engangement<br />

und ihre <strong>I<strong>de</strong>en</strong> zum Erfolg unserer gemeinsamen<br />

Forschungsanstrengungen beigetragen haben. Nicht<br />

zuletzt gebührt mein beson<strong><strong>de</strong>r</strong>er Dank <strong><strong>de</strong>r</strong> Deutschen<br />

Forschungsgemeinschaft. Sie hat durch die För<strong><strong>de</strong>r</strong>ung<br />

zahlreicher Einzelprojekte sowie durch <strong>de</strong>n Gottfried-<br />

Wilhelm-Leibniz-Preis die finanziellen Vor<strong>aus</strong>setzungen<br />

geschaffen, ohne die die jeweiligen Forschungsvorhaben<br />

nicht realisierbar gewesen wären.<br />

Literatur<br />

[1] L.Alvarez,F.Guichard,P.-L.Lions,andJ.-M.Morel. Axioms<br />

and fundamental equations in image processing. Archive for<br />

Rational Mechanics and Analysis, 123:199–257, 1993.<br />

[2] Z. Belhachmi, D. Bucur, B. Burgeth, and J. Weickert. How to<br />

choose interpolation data in images. SIAM Journal on Applied<br />

Mathematics, 70(1):333–352, 2009.<br />

[3] F. Catté, P.-L. Lions, J.-M. Morel, and T. Coll. Image selective<br />

smoothing and edge <strong>de</strong>tection by nonlinear diffusion. SIAM<br />

Journal on Numerical Analysis, 32:1895–1909, 1992.<br />

[4] K. Hagenburg, M. Breuß, J. Weickert, and O. Vogel. Novel<br />

schemes for hyperbolic p<strong>de</strong>s using osmosis filters from visual<br />

computing. In A. M. Bruckstein, B. ter Haar Romeny, A. M.<br />

Bronstein,andM.M.Bronstein,editors,Scale Space and Variational<br />

Methods in Computer Vision, volume 6667 of Lecture<br />

Notes in Computer Science, pages 532–543. Springer, Berlin,<br />

2012.<br />

[5] T. Iijima. Basic theory of pattern observation. In Papers of<br />

Technical Group on Automata and Automatic Control. IECE,Japan,<br />

December 1959. In Japanese.<br />

[6] M. Mainberger, A. Bruhn, J. Weickert, and S. Forchhammer.<br />

Edge-based compression of cartoon-like images with homogeneous<br />

diffusion. Pattern Recognition, 44(9):1859–1873, 2011.<br />

[7] K.W.MortonandL.M.Mayers. Numerical Solution of Partial<br />

Differential Equations. Cambridge University Press, Cambridge,<br />

UK, second edition, 2005.<br />

[8] S. Osher and L. I. Rudin. Feature-oriented image enhancement<br />

using shock filters. SIAM Journal on Numerical Analysis,<br />

27:919–940, 1990.<br />

[9] P. Perona and J. Malik. Scale space and edge <strong>de</strong>tection using<br />

anisotropic diffusion. IEEE Transactions on Pattern Analysis and<br />

Machine Intelligence, 12:629–639, 1990.<br />

[10] C. Schmaltz, P. Gwos<strong>de</strong>k, and J. Weickert. Electrostatic halftoning.<br />

Computer Graphics Forum, 29(8):2313–2327, December<br />

2010.<br />

[11] C. Schmaltz, P. Gwos<strong>de</strong>k, and J. Weickert. Multi-class electrostatic<br />

halftoning. Technical Report 301, Department of Mathematics,<br />

Saarland University, Saarbrücken, Germany, October<br />

2011.<br />

[12] P. Soille. Morphologische <strong>Bildverarbeitung</strong>. Springer, Berlin,<br />

1998.<br />

[13] T. Teuber, G. Steidl, P. Gwos<strong>de</strong>k, C. Schmaltz, and J. Weickert.<br />

Dithering by differences of convex functions. SIAM Journal on<br />

Imaging Sciences, 4(1):79–108, January 2011.<br />

[14] J. Weickert. Anisotropic Diffusion in Image Processing. Teubner,<br />

Stuttgart, 1998. (http://www.mia.uni-saarland.<strong>de</strong>/weickert/<br />

book.html).<br />

[15] J. Weickert. Coherence-enhancing shock filters. In B. Michaelis<br />

and G. Krell, editors, Pattern Recognition, volume 2781 of<br />

Lecture Notes in Computer Science, pages 1–8. Springer, Berlin,<br />

2003.<br />

Prof. Dr. Joachim Weickert, Fakultät für <strong>Mathematik</strong> und Informatik,<br />

Campus E1.7, Universität <strong>de</strong>s Saarlan<strong>de</strong>s, 66041 Saarbrücken<br />

weickert@mia.uni-saarland.<strong>de</strong><br />

Joachim Weickert ist Professor für <strong>Mathematik</strong><br />

und Informatik an <strong><strong>de</strong>r</strong> Universität <strong>de</strong>s Saarlan<strong>de</strong>s.<br />

Er erhielt ein Diplom in Technomathematik<br />

sowie eine Promotion in <strong><strong>de</strong>r</strong> <strong>Mathematik</strong><br />

von <strong><strong>de</strong>r</strong> Universität Kaiserslautern und hat<br />

sich an <strong><strong>de</strong>r</strong> Universität Mannheim in <strong><strong>de</strong>r</strong> Informatik<br />

habilitiert. Seine Forschunginteressen umfassen<br />

das gesamte Gebiet <strong><strong>de</strong>r</strong> mathematischen<br />

Bildanalyse. Joachim Weickert hat an über 240 Publikationen <strong>mit</strong>gewirkt.<br />

Sein Buch Anisotropic Diffusion in Image Processing zählt <strong>mit</strong><br />

über 1500 Zitationen in Google Scholar zu <strong>de</strong>n meistzitierten Werken<br />

<strong><strong>de</strong>r</strong> mathematischen Bildanalyse. Er ist Chefredakteur <strong><strong>de</strong>r</strong> Fachzeitschrift<br />

Journal of Mathematical Imaging and Vision und gewähltes<br />

Mitglied <strong><strong>de</strong>r</strong> Aca<strong>de</strong>mia Europaea. Im Jahr 2010 wur<strong>de</strong> er <strong>mit</strong> einem<br />

Gottfried-Wilhelm-Leibniz-Preis <strong>aus</strong>gezeichnet.<br />

90 FOKUS MDMV 20 / 2012 | 82–90

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!