29.01.2014 Aufrufe

Großer Beleg Segmentierung von ATPase-gefärbten - Fakultät ...

Großer Beleg Segmentierung von ATPase-gefärbten - Fakultät ...

Großer Beleg Segmentierung von ATPase-gefärbten - Fakultät ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Großer</strong> <strong>Beleg</strong><br />

Bildverarbeitung<br />

Thema:<br />

<strong>Segmentierung</strong> <strong>von</strong> <strong>ATPase</strong>-<strong>gefärbten</strong><br />

Muskelfaserschnitten mittels Seeded-Region-Growing<br />

Alexander Asmus<br />

Lehrstuhl für intelligente Systeme<br />

<strong>Fakultät</strong> Informatik<br />

Technische Universität Dresden<br />

27.05.2008<br />

Betreuung: Dr. Thomas Brox


Hiermit erkläre ich, dass die vorliegende Arbeit <strong>von</strong> mir allein ausgearbeitet und nur<br />

auf Grundlage der angegebenen Quellen angefertigt wurde.<br />

Dresden, 27.05.2008<br />

Alexander Asmus


Zusammenfassung<br />

Die Erkennung und <strong>Segmentierung</strong> <strong>von</strong> Muskelfaserzellen stellt eine wichtige Aufgabe<br />

in der medizinischen Bildverarbeitung dar. Automatisierte Erkennungsverfahren sorgen<br />

dabei für eine Beschleunigung der Analysezeiten und verbessern so den Diagnoseprozess<br />

für Muskelbiopsien. Der in der vorliegenden Arbeit vorgestellte Ansatz des<br />

Seeded-Region-Growings soll einen weiteren Beitrag zur Zellsegmentierung <strong>von</strong> AT-<br />

Pase <strong>gefärbten</strong> Muskelfaserzellen leisten. Der Algortihmus basiert auf der Idee eines<br />

Thresholding basierten Regionswachstums, das über lokale Intensitätsmittelung eine<br />

Regionszugehörigkeit definiert. Um negative Ergebnisse, wie die <strong>Segmentierung</strong> <strong>von</strong><br />

Zellzwischengewebe zu verhindern, verfügt das Seeded-Region-Growing zusätzlich über<br />

eine Formvergleichskomponente, die zellunähnliche <strong>Segmentierung</strong>en reduziert.


Inhaltsverzeichnis<br />

1 Einführung 3<br />

2 Medizinische Grundlagen 5<br />

2.1 Analyse und Gewinnung <strong>von</strong> Muskelfaserschnitten . . . . . . . . . . . . 5<br />

2.2 Probleme und Herausforderungen bestehender Verfahren . . . . . . . . 9<br />

3 Grundlagen der Bildsegmentierung 11<br />

3.1 Regionsbasierte <strong>Segmentierung</strong> . . . . . . . . . . . . . . . . . . . . . . 12<br />

3.1.1 Thresholding . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

3.1.2 k-Means-Clustering . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />

3.2 Kantenbasierte <strong>Segmentierung</strong> . . . . . . . . . . . . . . . . . . . . . . . 19<br />

3.3 Variationsansätze und Energiemininierung . . . . . . . . . . . . . . . . 20<br />

4 Der Seeded-Region-Growing Ansatz 22<br />

4.1 Überblick und Ablauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

4.2 Regionswachstum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

4.2.1 Regionsrepräsentation . . . . . . . . . . . . . . . . . . . . . . . 28<br />

4.2.2 Labeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

4.2.3 2-Means-Clustering . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

5 Formwissen-Erweiterung zur Regionsprüfung 33<br />

5.1 Datenbankaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

5.2 Skalierungsinvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34<br />

5.3 Parzenschätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />

5.4 Gradientenabstieg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

5.5 Parameter des Seeded-Region-Growing . . . . . . . . . . . . . . . . . . 43<br />

6 Fazit 47<br />

6.1 <strong>Segmentierung</strong>sergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . 47<br />

6.2 Qualität und Effizienz der <strong>Segmentierung</strong> . . . . . . . . . . . . . . . . . 47<br />

6.3 Bestehende Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />

6.4 Weiterführende Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . 49<br />

7 Anhang 50


3<br />

1 Einführung<br />

Die Bildsegmentierung und im Besonderen die medizinische Bildverarbeitung sind Anwendungsgebiete<br />

der Informatik, in denen in den letzen Jahren große Fortschritte erreicht<br />

wurden. Typische medizinische Bilddaten, zum Beispiel Röntgenbilder, Computerund<br />

Magnetresonanztomographie (CT,MT), Ultraschallbilder, sowie Gewebeproben aus<br />

Pathologie und Histologie, bieten einen großen Anwendungsbereich für computergestützte<br />

Bildsegmentierung [SSS02]. Durch die Weiterentwicklung und Erforschung <strong>von</strong> bekannten<br />

<strong>Segmentierung</strong>smethoden und neuen Bilderkennungsalgorithmen kann für die<br />

meisten medizinischen Bildgebungsverfahren eine computerbasierte Bildverarbeitung<br />

ermöglicht werden. Vorhandene Applikationen sind, je nach Anwendungsfall, unterschiedlich<br />

stark automatisiert.<br />

Trotz der bisherigen Fortschritte kann man sagen, dass vollautomatisierte Bildsegmentierung<br />

der menschlichen Bilderkennungsleistung weit unterlegen ist. Während der<br />

menschliche bzw. tierische Wahrnehmungsapparat verschiedenste, sehr komplexe <strong>Segmentierung</strong>sprobleme<br />

in kurzer Zeit lösen kann, sind Applikationen zur automatisierten<br />

Bildsegmentierung meist speziell auf einen konkreten Anwendungsfall zugeschnitten. Eine<br />

Veränderung der Randbedingungen, für die ein <strong>Segmentierung</strong>salgorithmus optimiert<br />

ist, führt oft zum Scheitern des <strong>Segmentierung</strong>ssystems. Der Mensch hingegen kann für<br />

beliebige Bilddaten, auch unter sehr schlechten Rahmenbedingungen (Bildstörungen,<br />

Verrauschung, Farbveränderungen) Bildelemente schnell und sicher erkennen. Die Spezialisierung<br />

<strong>von</strong> automatischen <strong>Segmentierung</strong>ssystemen auf eingeschränkte Aufgaben,<br />

führt zu immer neuen Problemstellungen, die mit bisherigen Verfahren nicht zufriedenstellend<br />

zu lösen sind.<br />

Trotz der Überlegenheit der menschlichen Bilderkennungsleistung ist es dennoch erstrebenswert,<br />

<strong>Segmentierung</strong> durch Algorithmen zu automatisieren. Für viele medizinische<br />

Diagnosen müssen zunächst große Mengen <strong>von</strong> Bilddaten analysiert und klassifiziert<br />

werden, um gesicherte Aussagen über die genaue Sachlage zu erhalten.<br />

Die vorliegende Arbeit begründet sich auf der Problemstellung, Muskelfaserzellen vollautomatisch<br />

zu segmentieren. Die Erkennung <strong>von</strong> Zellen kann zwar gut manuell ausgeführt<br />

werden, wird jedoch durch Anwendung <strong>von</strong> automatisierter <strong>Segmentierung</strong><br />

schneller und effizienter. Besonders bei großen Datenmengen kann durch eine ununterbrochene<br />

Analyse durch Computersysteme viel personeller Aufwand verringert werden.<br />

Eine manuelle <strong>Segmentierung</strong> vieler Muskelfaserschnitte ist nicht nur ein zeitaufwendiger,<br />

sondern auch monotoner Arbeitsvorgang. Durch Abnahme der Konzentration<br />

steigt die Wahrscheinlichkeit für ein ungenaues <strong>Segmentierung</strong>sergebnis. Solche Feh-


4 1 EINFÜHRUNG<br />

lerquellen, die eine wissenschaftliche Auswertung der Daten erschweren, können durch<br />

automatisierte Verfahren umgangen werden.<br />

Die folgende Studienarbeit beschäftigt sich mit einem neuen Ansatz zur <strong>Segmentierung</strong><br />

<strong>von</strong> <strong>ATPase</strong>-<strong>gefärbten</strong> Muskelfaserschnitten. Ziel der <strong>Segmentierung</strong> ist das Finden der<br />

im Bild unterschiedlich ein<strong>gefärbten</strong> Muskelfaserzellen und die Definition der Zellkonturen.<br />

Diese Arbeit baut auf den Forschungsthemen zur <strong>Segmentierung</strong> <strong>von</strong> HE-<strong>gefärbten</strong><br />

Muskelfaserzellen auf und soll des Weiteren einen alternativen <strong>Segmentierung</strong>sansatz<br />

zu den Levelset-basierten <strong>Segmentierung</strong>sverfahren in [KBFW05],[KKP98] und [Vos07]<br />

liefern. Die vielfältigen Färbetechniken für Muskelfaserschnitte in der Histologie bieten<br />

ein breites Arbeitsspektrum für verschiedene <strong>Segmentierung</strong>sansätze. Da sich je nach<br />

Färbetechnik die Bildcharakteristika stark unterscheiden, sind viele der bestehenden<br />

Verfahren nur auf eine spezielle Färbetechnik ausgerichtet.<br />

Die Arbeit gliedert sich in insgesamt sechs Kapitel. Im Anschluss an diese Einführung<br />

werden zunächst wichtige Grundlagen über die Gewinnung, Bedeutung und Anwendung<br />

<strong>von</strong> Muskelfaserschnitten in der Medizin gelegt. Im dritten Kapitel werden grundlegende<br />

Techniken zur Bildsegmentierung erklärt, auf die zum Teil in späteren Kapiteln<br />

aufgebaut wird. Kapitel vier und fünf dienen der ausführlichen Beschreibung des vorgestellten<br />

Seeded-Region-Growing Ansatzes und verdeutlichen den Ablauf des Algorithmus,<br />

sowie die zugrundeliegenden mathematischen Details und Informationen zur<br />

Implementierung. Es schließt sich im Kapitel sechs eine abschließende Betrachtung an,<br />

die einen Überblick auf die erzielten Ergebnisse, die Leistungsfähigkeit des Algorithmus<br />

und zukünftige Weiterentwicklung des Seeded-Region-Growings gibt.


5<br />

2 Medizinische Grundlagen<br />

Das folgende Kapitel soll einen Einblick über die gängigen Arbeitstechniken, Anforderungen<br />

und Probleme bei der Analyse <strong>von</strong> Muskelfaserschnitten geben. Im ersten<br />

Teil wird die Arbeitsweise zur Erzeugung der Gewebeproben erklärt. Der zweite Teil<br />

beschäftigt sich mit den Problemen und Herausforderungen, die bisherige manuelle<br />

<strong>Segmentierung</strong>sverfahren mit sich brachten und motiviert den Einsatz automatisierter<br />

Zellsegmentierung in der medizinischen Diagnostik.<br />

2.1 Analyse und Gewinnung <strong>von</strong> Muskelfaserschnitten<br />

Die Entnahme einer Muskelgewebsprobe ist eine häufige diagnostische Maßnahme, um<br />

bestimmte Krankheitsbilder an Muskeln zu untersuchen. Der Vorgang wird als Muskelbiopsie<br />

bezeichnet und kann auf zwei verschiende Arten erfolgen:<br />

• Stanz-Biopsie / Nadel-Biopsie<br />

• offene Biopsie<br />

Die beiden Verfahren unterscheiden sich in Aufwand, Verträglichkeit für den Patienten<br />

und Qualität des gewonnenen Gewebes.<br />

Stanz- und Nadelbiopsie:<br />

Die Stanz- bzw. Nadelbiopsie ist eine schon lange bekannte Entnahmemethode, die aber<br />

seit einigen Jahren wieder verhäuft für Muskeluntersuchungen angewendet wird. Bei der<br />

Ausführung des Eingriffs wird eine Nadel in das zu untersuchende Muskelgewebe eingeführt.<br />

Die Stanz-Nadel verfügt über ein seitliches Fenster, das zur Gewebeextraktion<br />

geöffnet bzw. geschlossen wird. Der große Vorteil der Nadel-Biopsie besteht im geringen<br />

Aufwand des Entnahmevorgangs und in der Verträglichkeit für den Patienten. Der<br />

Eingriff kann mit Hilfe einer lokalen Betäubung sowohl bei Erwachsenen, als auch bei<br />

Kindern durchgeführt werden, ist weitestgehend schmerzfrei und hinterlässt in der Regel<br />

keine Narben an der Einstichstelle. Die Stanzbiopsie ist also für die meisten Patienten<br />

gut verträglich. Da die Extraktion nur ein paar Sekunden in Anspruch nimmt, kann<br />

eine sofortige Begutachtung des gewonnenen Muskelgewebes unter einem Mikroskop<br />

erfolgen. Je nach Qualität der Probe kann über weitere Gewebeentnahmen entschieden<br />

werden. Die bereits verwendete Einstichstelle kann in solchen Fällen mehrmals genutzt<br />

werden. Dies sichert eine möglichst hohe Qualität der gewonnenen Muskelfasern.


6 2 MEDIZINISCHE GRUNDLAGEN<br />

Offene Biopsie:<br />

Bei der offenen Biopsie wird ein Bereich über dem Muskel freigelegt, um ein 3 cm langes<br />

und ca. 0,5 cm dickes Muskelbündel zu entnehmen. Häufig wird zusätzlich ein 0,5 cm 3<br />

großes Muskelstück für weiterführende diagnostische Untersuchungen entnommen. Der<br />

Vorteil einer offenen Muskelbiopsie liegt in der Qualität des gewonnenen Gewebes. Es<br />

ist möglich, größere Gewebsstreifen zu extrahieren, was insbesondere für biochemische<br />

Untersuchungen günstig ist. Des Weiteren können Muskelkontraktionen des Patienten<br />

während des Eingriffs ausgeschlossen werden, was die Qualität der Proben erhöht. Der<br />

Nachteil der offenen Biopsie ist der hohe Aufwand bei der Entnahme, sowie stärkere<br />

Auswirkungen auf den Patienten durch den Umfang des Eingriffs. Der Vorgang zur Gewebeentnahme<br />

ist deutlich komplexer als bei der Stanz-Biopsie, benötigt eine stärkere<br />

Betäubung und kann unter Umständen Narben an der Entnahmestelle hinterlassen.<br />

Der deutlich höhere Stressfaktor für den Patienten ist auch der Grund, weshalb offene<br />

Biopsien seltener ausgeführt und durch die nadel-basierte Variante ersetzt werden<br />

[DS07].<br />

Die Auswahl eines bestimmten Muskels für eine Biopsie hängt <strong>von</strong> dem vorhandenen<br />

oder vermuteten Krankheitsbild des Patienten ab und da<strong>von</strong>, wie stark ein Muskel <strong>von</strong><br />

der Erkrankung beeinflusst ist. Allgemein wird ein Muskel mit einem repräsentativen<br />

Krankheitsbefall gewählt, der jedoch nicht übermäßig stark betroffen oder verfettet<br />

sein sollte. Weitere Kriterien zur Muskelauswahl betreffen den jeweiligen Gesundheitszustand<br />

des Patienten sowie die Erkenntnisse, die aus vorhergehenden Untersuchungen<br />

(u.a. Sonographie, Kernspintomographie) gewonnen wurden. Bei der Entnahme einer<br />

Gewebsprobe ist darauf zu achten, dass der Muskel durch die lokale Betäubung nicht<br />

betroffen ist, da dies zur zeitweiligen Beeinflussung des Gewebes führen kann [DS07].<br />

Aufbereitung des Gewebes:<br />

Da entnommende Muskelfaserproben sehr schnell austrocknen können, jedoch eine längerfristige<br />

Lagerung für spätere Untersuchungen eventuell nötig ist, sollte das Gewebe<br />

möglichst zeitnah eingefroren werden. Ein Einfrieren ist besonders wichtig, wenn biochemische<br />

oder histochemische Analysen erfolgen sollen. Diese Untersuchungen sind auf<br />

möglichst gute Gewebsproben angewiesen, da sonst bestimmte Testverfahren (Färbungen)<br />

nur unzureichende Ergebnisse liefern. Der Gefrierprozess wird in flüssigem Stickstoff<br />

mit anschließender Lagerung bei mindestens −40 ◦ C durchgeführt. Eine Beschleunigung<br />

des Einfrierens kann durch den Einsatz <strong>von</strong> in Flüssigstickstoff gekühltem Isopentan<br />

(−160 ◦ C) erfolgen [DS07]. Flüssiger Stickstoff wird bei Kontakt mit warmen<br />

Objekten sofort gasförmig. Um das einzufrierende Objekt bildet sich eine dünne Gas-


2.1 Analyse und Gewinnung <strong>von</strong> Muskelfaserschnitten 7<br />

schicht, die den Gefrierungprozess verlangsamt. Isopentan hingegen wechselt erst bei<br />

28 ◦ C in den gasförmigen Zustand und verlangsamt den Prozess folglich nicht.<br />

Eine gefrorene Probe wird zur weiteren Analyse in dünne (ca. 6-12 µm) Streifen geschnitten.<br />

Diese dünnen Schichten werden später eingefärbt und unter dem Mikroskop<br />

untersucht und abfotografiert. Wie auch die vorhergehenden Arbeitsschritte hat auch<br />

das Schneiden der Muskelfaserstreifen Einfluss auf die spätere Bildqualität der Probe.<br />

Besonders zu beachten ist die Temperatur des Gewebes beim Schneidevorgang [DS07].<br />

Färbetechniken:<br />

Ziel einer Muskelbiopsie ist es, den Zustand der einzelnen Muskelfaserzellen bewerten<br />

zu können. Da sich Muskelgewebe aus verschiedenen Zellarten zusammensetzt und die<br />

unterschiedlichen Zelltypen gut unterscheidbar sein müssen, werden die gewonnenen<br />

Zell-Präparate eingefärbt. In der Histologie werden dazu mannigfaltige Färbetechniken<br />

verwendet, deren Farbergebnisse verschiedene Eigenschaften des Muskelgewebes hervorheben.<br />

Neben knapp einem Dutzend Standard-Färbetechniken, gibt es weitere spezialisiertere<br />

Verfahren, um gezielt besondere Gewebeeigenschaften aufzuzeigen. Je nach<br />

dem welche Ergebnisse die generell anzuwendenden Färbungen liefern, werden weitere<br />

spezialisiertere Techniken verwendet, um bestimmte Befunde bestätigen zu können.<br />

Zwei der am häufigsten verwendeten Färbetechniken sind die HE-Färbung und <strong>ATPase</strong>-<br />

Färbung. Bei der Hematoxylin-Eosin-Färbung (kurz HE) wird der natürliche Farbstoff<br />

Hematoxylin und ein synthetischer Farbstoff (Eosin) verwendet. Eosin sorgt für eine<br />

rötliche Färbung der Faserzellen, während Hematoxylin insbesondere bei Zellkernen<br />

eine bläuliche Färbung erzeugt. Während zellinnere Strukturen sich gut vom Hintergund<br />

abheben, hat die HE-Färbung den Nachteil, dass keine Unterschiede zwischen<br />

verschiedenen Muskelzellarten zu erkennen sind. Dem gegenüber erzeugt die Adenosin-<br />

Triphosphatase Färbung (kurz <strong>ATPase</strong>) eine eher bräunliche Fällung der einzelnen Muskelfasern.<br />

Je nach pH-Wert der Inkubationslösung sind Kontraste und Färbung stärker<br />

ausgeprägt. Die Helligkeit der jeweiligen Zellen gibt dabei Aufschluss über den Muskelfasertyp<br />

[DS07].<br />

Muskelzelltypen:<br />

Bei Muskelfaserzellen wird zwischen 2 verschiedenen Zelltypen unterschieden, die sich<br />

sowohl in ihrer Funktionsweise, als auch auch in chemischen und enzymatischen Eigenschaften<br />

unterscheiden [DS07]. Die Muskelfaserarten werden durch ihre Farbe, Kontraktionsform,<br />

Ermüdung und durch ihre oxidative, bzw. glykolytische Funktionsweise<br />

unterschieden, woraus sich die Klassifikation aus Tabelle 1 ableitet [DS07].


8 2 MEDIZINISCHE GRUNDLAGEN<br />

Tabelle 1: Klassifikation <strong>von</strong> Muskelfasertypen<br />

Eigenschaft Typ 1 Typ 2a Typ 2b<br />

Farbe rot weiß weiß<br />

Kontraktionsform langsam schnell schnell<br />

Ermüdung resistent resistent sensitiv<br />

Funktionsweise oxidativ oxidativ / glykolytisch glykolytisch<br />

(a) HE-Färbung<br />

(b) <strong>ATPase</strong>-Färbung<br />

Abbildung 1: Muskelfasern mit verschiedenen Färbungen<br />

Wie in Abb. (1) zu erkennen ist, bestehen signifikante Unterschiede zwischen einer<br />

<strong>ATPase</strong>- und einer HE-Färbung. Der HE-gefärbte Faserschnitt zeigt sehr deutlich die<br />

Zelltopologie und verfügt über relativ homogene Farbverteilung im Inneren der Zellen.<br />

Obwohl die verschiedenen Zelltypen nicht zu unterscheiden sind, ist diese Färbetechnik<br />

für eine Kontur-Erkennung durchaus geeignet. Bei der <strong>ATPase</strong>-Färbung zeigen sich die<br />

verschiedenen Zelltypen in unterschiedlichen Helligkeitsstufen. Dadurch ist es möglich,<br />

sehr leicht zwischen den Zelltypen zu unterscheiden und so auch diese zusätzlichen Informationen<br />

in eine medizinische Diagnose einfließen zu lassen. Die Helligkeit eines bestimmten<br />

Muskelzelltyps wird durch den pH-Wert des Inkubationsmediums bestimmt.<br />

Eine Auflistung der Helligkeitsverteilungen bei typischen Inkubations-pH-Werten findet<br />

sich in Tabelle 2. (−) entspricht hell/wenig gefärbt und (+++) entspricht dunkel/stark<br />

gefärbt.


2.2 Probleme und Herausforderungen bestehender Verfahren 9<br />

Tabelle 2: pH-Wert-abhängige Helligkeitsausprägung bei <strong>ATPase</strong><br />

Färbetechnik Typ 1 Typ 2a Typ 2b Typ 2c<br />

<strong>ATPase</strong> bei pH 9.4 + +++ +++ +++<br />

<strong>ATPase</strong> bei pH 4.6 +++ − ++ +++<br />

<strong>ATPase</strong> bei pH 4.3 +++ − − ++(+)<br />

Eine wichtige Eigenschaft bei <strong>ATPase</strong>-Bildern ist eine invertierte Färbung bei Veränderung<br />

des pH-Wertes. Bei einem pH-wert <strong>von</strong> 9,4 sind Typ 1 Zellen hell und Typ 2a/b<br />

dunkler. Genau invers verhält es sich bei einem pH-Wert <strong>von</strong> 4,3 bzw. 4,6. Die Typ<br />

1 Zellen sind nun sehr dunkel, während Typ 2a dunkelbraun und Typ 2b hellbraun<br />

erscheint. Mit varierendem pH-Wert ändert sich bei <strong>ATPase</strong>-Färbung auch der gesamte<br />

Kontrast im Muskelfaserschnitt [DS07].<br />

2.2 Probleme und Herausforderungen bestehender Verfahren<br />

Bestehende Analyseverfahren erfolgen entweder manuell durch einen Arzt oder halbautomatisch<br />

mit Hilfe <strong>von</strong> Softwaresystemen. Im ersten Fall wird die Definition der<br />

Zellkonturen <strong>von</strong> Hand realisiert. Bei der Nutzung <strong>von</strong> halbautomatischen Verfahren<br />

ermittelt ein Softwaresystem die vorhandene Kontur, ist aber auf Assistenz durch einen<br />

Menschen angewiesen. Dies kann beispielsweise durch die Definition <strong>von</strong> Initialkonturen<br />

oder Zellmittelpunkten geschehen, die dann durch das System automatisch verfeinert<br />

und angepasst werden. Anhand der Kontur einer Muskelfaserzelle werden automatisch<br />

ihr Umfang, Durchmesser und Rundung ermittelt. Durch die Analyse <strong>von</strong> mehreren<br />

Muskelfaserschnitten können genug Daten erfasst werden, so dass Rückschlüsse über<br />

den Gesamtzustand des Muskels möglich sind.<br />

Leider sind sowohl manuelle als auch halbautomatische Verfahren sehr zeitaufwendig,<br />

fehleranfällig und für einen Menschen monotone Arbeitsaufgaben. Eine vollautomatische<br />

Verarbeitung ist also wünschenswert. Wie wir im vorhergehenden Abschnitt gesehen<br />

haben, gibt es aber eine Vielzahl verschiedener Färbetechniken, die sehr unterschiedliche<br />

Bildcharakteristiken aufweisen und dadurch ganz spezifische medizinsiche<br />

Aussagen ermöglichen. Für vollautomatisierte Zellerkennung muss der verwendete Algorithmus<br />

meist für die jeweilige Färbetechnik optimiert werden. Dies schränkt eine<br />

universale Anwendung zum Teil ein.<br />

Auf eine vollautomatische <strong>Segmentierung</strong> <strong>von</strong> Zellen wirken aber weitere Probleme,<br />

die es zu lösen gilt. Beispielsweise kann die Qualität der <strong>gefärbten</strong> Gewebeproben sehr<br />

stark variieren. Sowohl die Gewebeentnahme, als auch der Gefrierprozess beeinflus-


10 2 MEDIZINISCHE GRUNDLAGEN<br />

sen die späteren Zellbilder maßgeblich. Durch Fehler beim Schockgefrieren kann es<br />

zu Zerstörungen im Zellmaterial kommen, so dass bei anschließenden enzym-basierten<br />

Färbungen möglicherweise keine optimale Fällung erreicht werden kann. Auch ein Austrocknen<br />

der Probe kann ähnliche Folgen nach sich ziehen. Der Färbeprozess selbst<br />

birgt wiederum viele Fehlerquellen. Je nach pH-Wert der Inkubationslösung zur Aufbereitung<br />

der Gewebeschichten, ergeben sich stärkere oder schwächere Kontraste in<br />

<strong>ATPase</strong>-Bildern. Eine klare <strong>Segmentierung</strong> ist gerade bei nebeneinanderliegenden Zellen<br />

gleichen Typs oftmals schwierig. Teilweise sind die Farbintensitäten innerhalb einer<br />

Zelle sehr wechselhaft, dies erschwert die Erkennung und kann zu Fehlklassifikationen<br />

führen.<br />

Ein robustes vollautomatisches Verfahren zur Muskelzellklassifikation und <strong>Segmentierung</strong><br />

muss mit vielen dieser Fehlerquellen umgehen können und auch für Bilder mit<br />

unterschiedlicher Qualität hinreichend genaue Ergebnisse liefern. Da eine unmittelbare<br />

Überwachung des <strong>Segmentierung</strong>svorgangs durch geschultes Personal nicht vorgesehen<br />

ist, müssen Fehlerraten solcher Systeme sehr niedrig sein.


11<br />

3 Grundlagen der Bildsegmentierung<br />

Die Bildsegmentierung ist ein sehr vielversprechendes Forschungsfeld, in dem immer<br />

wieder neue Probleme auftauchen und formuliert werden. Dank einer aktiven Forschungsarbeit<br />

in den letzten Jahrzehnten, können wir auf eine Vielzahl <strong>von</strong> <strong>Segmentierung</strong>smethoden<br />

zurückgreifen, die teilweise sehr unterschiedliche Ansätze zur Lösung<br />

des <strong>Segmentierung</strong>sproblems wählen. Im nun folgenden Abschnitt soll auf einige der<br />

wichtigsten Methoden genauer eingegangen werden. In Vorbereitung auf die Erläuterungen<br />

in Kapitel (4) (S.22) und Kapitel (5) (S.33), werden hier die zugrunde liegenden<br />

Verfahren (Threshholding, K-Means-Clustering) erläutert.<br />

Einen Überblick über verschiedene praktische <strong>Segmentierung</strong>salgorithmen liefert folgende<br />

Klassifikation, die Erkennungsverfahren nach dem Grad der Automatisierung<br />

unterscheidet [Vos07].<br />

• manuelle <strong>Segmentierung</strong><br />

• halbautomatische <strong>Segmentierung</strong><br />

• vollautomatische <strong>Segmentierung</strong><br />

Wie in den vorhergehenden Kapiteln bereits erwähnt wurde, ist die Automatisierung<br />

eines Erkennungsverfahrens ein wichtiges Ziel in vielen praktischen Anwendungen. Beispielsweise<br />

werden bei der manuellen Auswertung <strong>von</strong> Muskelfaserschnitten für die <strong>Segmentierung</strong><br />

<strong>von</strong> ungefähr 200 Fasern ca. 20 - 30 Minuten benötigt [KKP98]. Für eine<br />

korrekte manuelle Zellsegmentierung wird ausgebildetes Fachpersonal mit fundiertem<br />

Wissen über die Gewebestrukturen <strong>von</strong> Muskelfaserzellen benötigt. Gleichzeitig handelt<br />

es sich aber bei dieser Arbeitsaufgabe um eine sehr zeitintensive und monotone<br />

Tätigkeit, bei der ständige Konzentration erforderlich ist. Eine Automatisierung des<br />

Verfahrens ist also erstrebenswert.<br />

Die halbautomatische Lösung eines <strong>Segmentierung</strong>sproblems umfasst eine Kombination<br />

aus automatisierter Berechnung und manueller Korrektur bzw. Überwachung. Der vom<br />

Menschen auszuführende Anteil der Bilderkennung kann durch partielle Nutzung <strong>von</strong><br />

Computersystemen verkürzt oder zumindest erleichtert werden. Mensch und Computersystem<br />

ergänzen sich durch ihre besonderen Leistungsfähigkeiten. Der menschliche<br />

Wahrnehmungsapparat kann durch seine sichere und schnelle Erkennungsleistung das<br />

Softwaresystem bei der Vorverarbeitung unterstützen, während der Computer für eine<br />

schnelle Verarbeitung und präzise Auswertung der Bilddaten sorgt. Unter bestimmten


12 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />

Umständen kann aber die halbautomatische <strong>Segmentierung</strong> ähnlich zeitintensiv sein,<br />

wie die manuelle Bearbeitung.<br />

Vollautomatische Verfahren ermitteln eine Lösung für das <strong>Segmentierung</strong>sproblem, die<br />

ohne menschliche Überwachung oder Korrektur hinreichend genau ist. Selbst wenn der<br />

Algorithmus zur Lösung des Problems länger benötigt als ein Mensch, so kann die Verarbeitung<br />

sehr leicht parallelisiert und ununterbrochen durchgeführt werden, wodurch<br />

es gerade bei umfangreichen Datensätzen zur Verkürzung <strong>von</strong> Analysezeiten kommt.<br />

Eine zweite Form der Klassifikation <strong>von</strong> <strong>Segmentierung</strong> ist die Unterscheidung nach<br />

dem <strong>Segmentierung</strong>sansatz:<br />

• Regionsbasierte <strong>Segmentierung</strong><br />

• Kantenbasierte <strong>Segmentierung</strong><br />

• Variationsansätze<br />

Jede dieser Herangehensweisen hat bestimmte Vor- und Nachteile, wie in den folgenden<br />

Abschnitten verdeutlicht wird. Zuerst werden die regionsbasierten <strong>Segmentierung</strong>smethoden<br />

erläutert, die im Seeded-Region-Growing eine besondere Rolle spielen.<br />

3.1 Regionsbasierte <strong>Segmentierung</strong><br />

Regionsbasierte <strong>Segmentierung</strong>smethoden versuchen, ein Bild durch die Definition einer<br />

Regionszugehörigkeit in verschiedene Bereiche zu teilen. Die mathematische Modellierung<br />

dieser Regionszugehörigkeit hat den größten Einfluss auf die Qualität der <strong>Segmentierung</strong>sergebnisse.<br />

Oftmals muss das mathematische Modell an lokale Eigenschaften des<br />

Bildes angepasst werden und somit adaptiv sein. Eine globale statische <strong>Segmentierung</strong><br />

auf dem gesamten Bildraum liefert in den meisten Fällen ungenaue und sehr zersplitterte<br />

Bildregionen. Der Vorteil regionsbasierter Verfahren gegenüber kantenbasierten<br />

Methoden ist eine geringere Störanfälligkeit in Bezug auf Rauschen [Mor00].<br />

Im Folgenden sei ein Bild bestehend aus Helligkeitswerten definiert durch I : Ω ↦→ R, das<br />

<strong>Segmentierung</strong>sergebnis sei ein Binärbild mit I ∗ : Ω ↦→ {0, 1}, die Regionszugehörigkeit<br />

wird durch eine Ähnlichkeitsfunktion S : Ω ↦→ R beschrieben. Letztlich bezeichnet Ω<br />

den zweidimensionalen Bildraum.


3.1 Regionsbasierte <strong>Segmentierung</strong> 13<br />

3.1.1 Thresholding<br />

Thresholding ist eine der grundlegendsten <strong>Segmentierung</strong>stechniken. Im allgemeinen<br />

Fall wird die Regionszugehörigkeit eines Pixels p(x, y) durch die Ähnlichkeits- oder<br />

Distanzfunktion S(x, y) und durch einen Schwellwert (Threshold) θ ∈ R definiert. Als<br />

regionszugehörig werden alle Pixel betrachtet, deren Ähnlichkeit S(x, y) kleiner als die<br />

gewählte Schwelle ist.<br />

⎧<br />

⎨1 S(x, y) > θ<br />

I ∗ (x, y) =<br />

mit x, y ∈ Ω (3.1)<br />

⎩<br />

0 S(x, y) ≤ θ<br />

Der Schwellwert in Gleichung (3.1) ist als ein Intensitätswert aufzufassen. Die Funktion<br />

S(x, y) kann beliebig komplex modelliert werden. Ein simples und gerade deswegen<br />

häufig verwendetes Modell ist S(x, y) = I(x, y). Dies bedeutet, dass die Regionszugehörigkeit<br />

lediglich durch den Intensitätswert I eines Pixels (x, y) bestimmt wird.<br />

Daraus resultierend ist der Schwellwert θ als ein Intensitätswert aufzufassen. Der Vorteil<br />

dieser Ähnlichkeitsfunktion liegt in den <strong>Segmentierung</strong>sergebnissen. Diese sind zwar<br />

selten sehr genau, können aber sehr schnell ermittelt werden und sind für eine Vorverarbeitung<br />

meist ausreichend. Der Nachteil einer so simplen Ähnlichkeitsdefinition ist<br />

eine erhöhte Rauschabhängigkeit, da ein Pixel mit zu starker Helligkeitsabweichung<br />

nicht zur Region klassifiziert wird, selbst wenn die Abweichung durch ein allgemeines<br />

Bildrauschen hervorgerufn wird [Mor00]. Kritisch ist auch die Wahl eines geeigneten<br />

Thresholds θ. Dieser ist der wichtigste Parameter, der die <strong>Segmentierung</strong> steuert und<br />

so das Ergebnis maßgeblich beeinflusst. Eine Veränderung <strong>von</strong> θ kann völlig andere <strong>Segmentierung</strong>sergebnisse<br />

bewirken. Bei einfachen Bildern mit klar abgegrenzten Flächen<br />

und möglichst viel Intensitätshomogenität kann ein idealer Threshold schnell gefunden<br />

werden. In solchen Fällen ist Thresholding eine sehr effiziente <strong>Segmentierung</strong>smethode.<br />

Es kann in linearer Zeit, abhängig <strong>von</strong> der Bildgröße, ausgeführt werden, was für viele<br />

<strong>Segmentierung</strong>saufgaben eine sehr gute Komplexität darstellt. Für viele reale Bilder<br />

(Fotos, Videostandbilder) ist es aber weit schwieriger, ein optimales θ zu ermitteln. Es<br />

gibt jedoch einige Algorithmen zur automatischen Abschätzung eines optimalen Thresholds.<br />

Durch Histogramm-Analysen kann man einen möglichst optimalen Threshold<br />

algorithmisch bestimmen [Ots79].<br />

Der oben beschriebene Ansatz berücksichtigt keine Pixelnachbarschaften, wodurch es<br />

leicht zu einer Übersegmentierung kommen kann. Da die <strong>Segmentierung</strong> auf dem gesamten<br />

Bildraum ausgeführt wird, werden alle Pixel des Bildes der Region zugeord-


14 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />

net, deren Intensitäten geeignet sind. Die Klassifikation erfolgt unabhängig da<strong>von</strong>, ob<br />

die entstehenden Regionen zusammenhängend sind oder es zu einer starken Aufsplitterung<br />

kommt. Diese Probleme können aber durch Anpassung an der Ähnlichkeitsdefinition<br />

S(x, y) gemindert werden. Eine Alternative für mehr Rauschresistenz beim<br />

Thresholding ist die Ausnutzung <strong>von</strong> Pixel-Nachbarschaften. S(x, y) ermittelt einen<br />

durchschnittlichen Intensitätswert innerhalb einer Pixelnachbarschaft N.<br />

S(x, y) = 1<br />

|N|<br />

∑<br />

x n ,y n ∈N<br />

I(x n , y n ) (3.2)<br />

Je nach Wahl der Pixelnachbarschaft werden mehr oder weniger Pixel im Mittelwert<br />

verrechnet. Die Nachbarregion zur Mittelwertbestimmung kann zum Beispiel eine 3x3<br />

oder 5x5 Pixel große Zone sein. Es sei angemerkt, dass die Ergebnisse bei einer Mittelung<br />

über eine bestimmte Pixelnachbarschaft identisch zu Ergebnissen ohne Nachbarschaftsmittelung<br />

sind, wenn vor Ausführung der <strong>Segmentierung</strong> eine Bildglättung durch<br />

Faltung mit einem geeigneten Filterkern stattfindet. Je größer die Nachbarschaftszone<br />

gewählt wird, desto stärker muss im alternativen Fall geglättet werden, um gleiche Ergebnisse<br />

zu bekommen. Die Mittelung über eine Pixelnachbarschaft ist also mit einer<br />

Bildglättung vergleichbar [Mor00].<br />

Ein Thresholding kann auf unterschiedliche Weise ausgeführt werden. Der Threshold-<br />

Filter kann global auf das Bild angewendet werden, wie es für Gleichung (3.1) und<br />

(3.2) vorgesehen ist. Bei einer globalen Anwendung ergeben sich aber über den ganzen<br />

Bildraum verteilte, nicht zusammenhängende Regionen, die meist über die zu segmentierenden<br />

Bereiche hinausgehen. Für die meisten Bilder lassen sich durch Definition<br />

eines konstanten, globalen Thresholds keine präzisen <strong>Segmentierung</strong>en erreichen. Als<br />

Alternativen nutzt man u.a. die erwähnte Abschätzung <strong>von</strong> θ, Einbezug der räumlichen<br />

Anordnung der Pixel oder ein iteratives Regionswachstum. Oftmals wird auch<br />

das Multi-Thresholding verwendet, bei dem durch mehrere <strong>Segmentierung</strong>sschritte mit<br />

unterschiedlichem θ die <strong>Segmentierung</strong>sergebnisse verbessert werden können und es zu<br />

weniger Übersegmentierung kommt.<br />

Region-Growing:<br />

Das Wachsen einer Region kann durch Definition eines Startpixels und einer iterativen<br />

Ausbreitung der Region simuliert werden. Ausgehend vom Initialpunkt p s (x s , y s ) (Saat-<br />

Pixel) breitet sich die Region schrittweise über sämtliche Nachbarpixel p n (x n , y n ) aus,


3.1 Regionsbasierte <strong>Segmentierung</strong> 15<br />

die durch S(x n , y n ) als regionszugehörig klassifiziert wurden.<br />

S(x n , y n ) = (I(x s , y s ) − I(x n , y n )) 2 (3.3)<br />

Es wird also die Differenz zwischen dem Saatpixel p s (x s , y s ) und dem zu klassifizierenden<br />

Pixel p n (x n , y n ) berechnet und anschließend, wie in Gleichung (3.1), als Zugehörigkeitskriterium<br />

verwendet. Der Schwellwert θ ist nun als Fehlertoleranz aufzufassen. Je<br />

größer man θ wählt, desto größer ist die Wahrscheinlichkeit, dass ein Pixel zur Region<br />

zugeordnet wird. Das Wachstum einer Region kann, ausgehend vom Saatpixel, durch<br />

Prüfung der 4 bzw. 8 direkten Nachbarpixel geschehen. Das Regionswachstum ist mit<br />

dem aus der Computergrafik bekannten Floodfill-Algorithmus vergleichbar. Die Ähnlichkeitsfunktion<br />

S(x n , y n ) aus Gleichung (3.3) ist wiederum ein einfaches Modell für<br />

ein Regionswachstum. Ebenso ist es möglich, das Modell durch Nachbarschaftsmittelung<br />

oder ein alternatives Distanzmaß anzupassen und so für bestimmte Zwecke zu<br />

optimieren. Ohne weitere Anpassungen kann es beim Modell aus Gleichung (3.3) leicht<br />

zum Auslaufen einer wachsenden Region kommen, so dass die segmentierte Zone den<br />

beabsichtigten <strong>Segmentierung</strong>sbereich verlässt. Dies passiert vor allem an Stellen, wo<br />

die Intensitätswerte einer Zielregion (zum Beispiel eine Muskelzelle) sich nur schwach<br />

vom Bildhintergrund abheben (beispielsweise das Zellzwischengewebe). Es gibt an betreffenden<br />

Stellen demnach nur sehr geringe Intensitätsunterschiede.<br />

Durch Erweiterung der Ähnlichkeitsfunktion S(x n , y n ) aus Gleichung (3.4) kann ein<br />

Auslaufen der wachsenden Region verhindert werden. Statt lediglich die Distanz der<br />

Intensitätswerte als Kriterium zu verwenden, wird auch der räumliche Abstand zwischen<br />

zwei Pixeln einbezogen.<br />

S(x n , y n ) = (1 − α)S I (x n , y n ) + αS D (x n , y n )<br />

S I (x n , y n ) = (I(x s , y s ) − I(x n , y n )) 2<br />

(3.4)<br />

S D (x n , y n ) = (x s − x n ) 2 + (y s − y n ) 2<br />

Je größer die räumliche Distanz zwischen dem Saatpixel p s und einem Pixel p n ist,<br />

desto größer wird der Wert <strong>von</strong> S(x n , y n ) und umso unwahrscheinlicher ist eine Regionszugehörigkeit.<br />

Die Abhängigkeit <strong>von</strong> den Bildintensitäten aus Gleichung (3.3) ist<br />

natürlich weiterhin gegeben. Durch den Parameter α ∈ [0, 1] erfolgt eine Gewichtung,<br />

ob die räumliche Distanz oder die Differenz der Intensitäten einen größeren Einfluss<br />

auf die Pixelklassifikation haben soll. Für α = 0 ergibt sich aus Gleichung (3.4) eine<br />

Äquivalenz zu Gleichung (3.3).


16 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />

Der Vorteil vom Region-Growing im Gegensatz zum klassischen Thresholding liegt in<br />

der Form der extrahierten Regionen. Diese sind nämlich im beschriebenen Fall immer<br />

zusammenhängend. Dennoch wirken sich die Störungen bei den Intensitätswerten<br />

stark auf die Form der wachsenden Regionen aus. Insbesondere bei Muskelfaserschnitten<br />

können neben Störung durch Verrauschung auch andere Bildeigenschaften, wie geringer<br />

Kontrast oder undeutliche Färbung des Zwischengewebes eine <strong>Segmentierung</strong> stark<br />

erschweren. Bei <strong>ATPase</strong>-<strong>gefärbten</strong> Zellschnitten sind besonders bei Zellen mittlerer Helligkeit<br />

(siehe Tabelle 2 und Abb. 1) starke Intensitätsschwankungen vorhanden, die vom<br />

Färbeprozess stammen. Darüber hinaus hebt sich das Zellzwischengewebe an vereinzelten<br />

Stellen nicht stark genug vom Zellhintergrund ab, was zu auslaufenden Regionen bei<br />

der <strong>Segmentierung</strong> führen kann. Eine detaillierte Beschreibung des Regionswachstums<br />

im Seeded-Region-Growing-Ansatz, sowie die Lösungen zur Minderung der genannten<br />

Probleme finden sich in Kapitel (4).<br />

3.1.2 k-Means-Clustering<br />

Als Clustering-Problem bezeichnet man die Aufgabe, eine Menge <strong>von</strong> Datenpunkten<br />

einer bestimmten Anzahl <strong>von</strong> Klassen zuzuordnen. Solche Zuordnungsprobleme treten<br />

in sehr vielen verschiedenen Anwendungen auf, wie unter anderem bei der Datenkompression,<br />

dem Data-Mining, der Bildverarbeitung und der Mustererkennung. Das<br />

k-Means-Clustering stellt eine Möglichkeit zur Lösung eines solchen Zuordnungsverfahrens<br />

dar [KMN + 02a]. K-Means-Clustering ist eine Zuordnung, die ausgehend <strong>von</strong><br />

n vielen Datenpunkten p diese in k viele Klassen einteilt. Jede Klasse K i wird dabei<br />

durch einen Mittelpunkt c i beschrieben. Ein Punkt p des Datensatzes wird einer Klasse<br />

K i zugeordnet, wenn die Distanz zwischen p und c i kleiner ist, als die Abstände zu den<br />

restlichen Klassen. Dies lässt sich formal durch folgende Energiefunktion beschreiben<br />

[Vos07] [dS01].<br />

E(C) =<br />

k∑<br />

i=1<br />

∑<br />

∀p∈K i<br />

‖p − c i ‖ 2 (3.5)<br />

Lösung des k-Means-Clusterings ist also eine Menge C = {c i mit i ∈ [1, k]}, für die die<br />

Energiefunktion aus Gleichung (3.5) ein globales Minimum hat. Dies ist genau dann<br />

der Fall, wenn der Abstand der Punkte p ∈ K i zum Klassenmittelpunkt c i kleiner<br />

ist, als alle Distanzen zu den verbleibenden Mittelpunkten der anderen Klassen. Wird<br />

eine solche Menge C gefunden, so handelt es sich um eine globale Optimierung des


3.1 Regionsbasierte <strong>Segmentierung</strong> 17<br />

Zuordnungsproblems. Das heißt, es gibt keine andere Klassenaufteilung, die eine bessere<br />

Zuordnung ermöglicht.<br />

Das Problem des k-Means-Clusterings ist aber, dass eine globale Optimierung nur<br />

schwer zu ermitteln ist. Es gibt verschiedene Herangehensweisen, um hier eine Lösung<br />

zu finden. Eine der bekanntesten ist der sogenannte Lloyd’s Algorithm“[KMN + 02a].<br />

”<br />

Durch eine einfache Implementierung kann eine Lösung, die ein lokales Minimum für<br />

E(C) darstellt, gefunden werden. Durch ein Iterationsschema können diese lokalen<br />

Lösungen weiter verfeinert werden. Zur Approximation einer relativ guten Lösung nutzt<br />

der Lloyd’s Algorithm“ die Tatsache aus, dass die optimale Positionierung eines Klassenmittelpunktes<br />

c i im Zentrum der durch die Klasse beschriebenen Punkte sein muss.<br />

”<br />

Ausgehend <strong>von</strong> einer Initialisierung der Centroiden c i werden alle Punkte der Datenmenge<br />

anhand ihrer Distanzen zu den Klassen zugeordnet. Anschließend werden die<br />

Mittelpunkte c i durch eine Mittelung über alle in einer Klasse enthaltenen Punkte<br />

neu positioniert. Dadurch ergibt sich ein iteratives Schema, bei dem sich nach jedem<br />

Durchlauf die Klassenmittelpunkte immer näher an eine optimale Postion annähern.<br />

Dieser Prozess wird in Abb. (2) grafisch verdeutlicht. In Tabelle (3) findet sich eine<br />

Ablaufs-Beschreibung des Algorithmus [Vos07].<br />

Tabelle 3: Ablauf vom k-Means-Clustering (Lloyd’s Algorithm)<br />

1. Initialisiere die Klassenmittelpunkte c i<br />

2. Ordne alle Datenpunkte p den Klassen zu<br />

3. Neuberechnung der c i durch Mittelung über Klassenelemente<br />

4. Bei Verschiebung der c i gehe zu Schritt 2, sonst Ende<br />

Der Vorteil dieser Clustering-Methode ist, dass der Algorithmus definitiv k viele Klassen<br />

findet und dabei in den meisten Fällen schon nach wenigen Iterationen zu einem<br />

Klassifikationsergebnis kommt. Je nach Modellierung der Distanz-Funktion kann dieser<br />

Ansatz für verschiedenste Verfahren angewendet werden. Im Beispiel <strong>von</strong> Zellerkennung<br />

kann sowohl eine <strong>Segmentierung</strong>, als auch eine Zell-Typ-Klassifikation erreicht werden.<br />

Letztere Anwendung wurde bereits als Vorverarbeitungsschritt in einer Level-Set basierten<br />

<strong>Segmentierung</strong> in [Vos07] ausgenutzt.<br />

Nachteilig am k-Means-Clustering ist aber, dass die Ergebnisse im besonderen Maße<br />

<strong>von</strong> der Initialisierung der Klassenmittelpunkte c i abhängen. Das bedeutet einerseits:<br />

Eine ungeschickte Initialisierung der Klassenmittelpunkte erhöht die Anzahl der nötigen<br />

Iterationen und damit die Laufzeit. Andererseits können zwei unterschiedliche Positionierungen<br />

der Initialpunkte c i zu verschiedenen Klassifikationen führen. Die Ergebnisse


18 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />

(a) Iteration: 1 (b) Iteration: 2<br />

(c) Iteration: 3 (d) Iteration: 4<br />

Abbildung 2: k-Means-Clustering für k=3 über 4 Iterationen<br />

des iterativen Lösungsverfahrens können im ungünstigen Fall stark vpn der optimalen<br />

Lösung abweichen [KMN + 02b]. Gerade für die Initialisierung der Centroiden muss<br />

daher größerer Aufwand betrieben werden, um möglichst gute Startparameter für den<br />

Algorithmus zu erhalten. Problematisch wird eine Anwendung des k-Means-Clusterings,<br />

wenn die Anzahl der zu findenden Klassen nicht genau bekannt ist. Um einen solchen<br />

Fall handelt es sich bei einer Zellsegmentierung, bei der jede Zelle genau eine Klasse<br />

darstellt. Während bei einer Klassifikation nur die Anzahl der Zelltypen <strong>von</strong> Belang ist<br />

(k = 3), benötigt man für eine <strong>Segmentierung</strong> die Anzahl der Zellen im Bild. Diesen<br />

Wert präzise zu schätzen, ist aber relativ schwierig, ebenso wie eine sichere Positionierung<br />

der Klassenmittelpunkte im Inneren der Zellen.


3.2 Kantenbasierte <strong>Segmentierung</strong> 19<br />

3.2 Kantenbasierte <strong>Segmentierung</strong><br />

Ein kantenbasierter <strong>Segmentierung</strong>sansatz baut auf der Annahme auf, dass innerhalb<br />

eines Bildes die zu erkennenden Regionen durch mehr oder weniger deutliche Kanten<br />

beschrieben werden. Eine Kante wird als eine plötzliche Intensitätsänderung innerhalb<br />

einer gewissen Umgebung angenommen. Aus der Bildverarbeitung kann man auf einige<br />

Filter mit kantendetektorischen Eigenschaften zurückgreifen, wie u.a. den Laplace-<br />

Filter.<br />

Eine Kante kann algorithmisch durch die Berechnung des Gradienten an einer bestimmten<br />

Stelle erkannt werden. Der Gradient (ein Vektor) berechnet sich aus den partiellen<br />

Raumableitungen auf dem Beobachtungsraum. Generell kann ein Gradient für n-<br />

dimensionale Datensätze berechnet werden. Im Falle eines zweidimensionalen Bildes<br />

werden entsprechend die zwei Raumableitungen nach x und y verwendet. Diese Ableitungen<br />

bilden die x- und y-Komponenten des Gradienten-Vektors. In Gleichung (3.6)<br />

findet sich eine mathematische Beschreibung.<br />

grad(I(x, y)) = ∇I(x, y) =<br />

( ∂I(x,y)<br />

∂x<br />

∂I(x,y)<br />

∂y<br />

)<br />

(3.6)<br />

Der Gradient, in der Kurzschreibweise als ∇ notiert, zeigt immer in Richtung des stärksten<br />

Dichteanstiegs eines skalaren Feldes. Für ein Grauwertbild also in die Richtung, in<br />

der sich die Helligkeitswerte am stärksten erhöhen. Der Betrag des Gradienten-Vektors<br />

gibt Aufschluss über die Stärke einer Intensitätsänderung an einer Stelle und ist so besonders<br />

zur Kantenbestimmung in Bildern geeignet. Besonders hohe Gradientenbeträge<br />

sind Indikatoren für Kanten innerhalb des Bildes.<br />

Vorteil <strong>von</strong> kantenbasierten <strong>Segmentierung</strong>smethoden ist, dass sich durch Kantendetektoren<br />

Konturen für verschiedenste Bildbereiche extrahieren lassen. Nachteilig ist<br />

aber, dass es unter Umständen schwierig sein kann, zwischen den Kanten der zu segmentierenden<br />

Objekte und den Kanten <strong>von</strong> irrelevanten Bildregionen zu unterscheiden.<br />

Oftmals sind die aus Kantendetektoren extrahierten Objektkonturen nicht zusammenhängend<br />

und müssen durch weitere Verarbeitungsschritte zusammengefügt oder<br />

vervollständigt werden. Ein häufig verwendeter Ansatz zur Kantensegmentierung ist<br />

der Canny-Algorithmus [Can86].


20 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />

3.3 Variationsansätze und Energiemininierung<br />

Wie auch beim k-Means-Clustering kann man die Güte einer <strong>Segmentierung</strong> durch eine<br />

diskrete bzw. kontinuierliche Kostenfunktion E ausdrücken. Ist die Kostenfunktion E<br />

für einen diskreten Vektor v definiert, so spricht man <strong>von</strong> einer Energiefunktion E(v).<br />

Soll das <strong>Segmentierung</strong>sergebnis jedoch durch eine kontinuierliche Funktion u(x) mit<br />

u(x) : Ω ↦→ R repräsentatiert werden, so spricht man <strong>von</strong> einem Energiefunktional.<br />

Dank einer kontinuierlichen Betrachtung der <strong>Segmentierung</strong> ist es möglich, genauere<br />

Ergebnisse bei einer Bilderkennung zu erreichen, die nicht den Beschränkungen einer<br />

diskreten Repäsentation unterliegen (Abtastung).<br />

u ∗ (x) = arg min<br />

u(x) E(u(x)) (3.7)<br />

Das Energiefunktional aus Gleichung (3.7) verwendet als Parameter die kontinuierliche<br />

Funktion u(x). u(x) stellt eine mögliche Lösung für das <strong>Segmentierung</strong>sproblem dar<br />

und wird durch das Kostenfunktional E auf seine Güte geprüft. Dabei belohnt E(u(x))<br />

positive <strong>Segmentierung</strong>sergebnisse, während negative Ergebnisse zu einer Bestrafung<br />

führen. Belohnungen äußern sich in einer Verringerung bzw. einem sehr niedrigen Anstieg<br />

der Kostenfunktion, Bestrafungen entsprechen folglich einem Kostenanstieg.<br />

Die kontinuierliche Funktion u(x) kann je nach Anwendungsfall unterschiedlich sein.<br />

Denkbar ist eine kontinuierliche Kontur- oder Regionsbeschreibung, eine vollständige<br />

Repräsentation des finalen Ergebnisbildes ist aber auch möglich. Je besser das <strong>Segmentierung</strong>sergebnis<br />

u(x) ist, desto niedriger das Energiefunktional E(u(x)). Neben<br />

Anwendungen in der Bildverarbeitung und <strong>Segmentierung</strong> können Variationsansätze<br />

und Energieminimierung auch für viele andere Anwendungsgebiete <strong>von</strong> Nutzen sein.<br />

Je nach Anpassung des Terms E können verschiedenste Probleme bewertet und gelöst<br />

werden.<br />

Ein Energiefunktional setzt sich generell aus verschiedenen Teilenergien zusammen.<br />

Bei einer Bilderkennung hat jede dieser Teilenergien die Aufgabe, eine bestimmte Eigenschaft<br />

des <strong>Segmentierung</strong>ergebnisses zu garantieren oder zu unterdrücken. Oftmals<br />

widersprechen die angestrebten Ergebniseigenschaften einander, so dass eine optimale<br />

Lösung einen Kompromiss zwischen den Modellannahmen beschreibt. In Gleichung<br />

(3.8) besteht das Energiefunktional aus zwei Teilenergien. E glatt soll sicherstellen, dass<br />

das <strong>Segmentierung</strong>sergebnis möglichst geglättet ist, während E data ein Ergebnis mit


3.3 Variationsansätze und Energiemininierung 21<br />

möglichst viel Ähnlichkeit zu den Quelldaten fordert.<br />

E(u(x)) = E glatt (u(x)) + α · E data (u(x))<br />

E glatt = ‖∇u(x)‖<br />

E data = (u(x) − I(x)) 2<br />

(3.8)<br />

mit α ∈ [0, 1]<br />

Durch die beschriebene Gleichung ließe sich eine Bildglättung realisieren. Der Datenterm<br />

würde für u(x) = I(x) minimal werden, was bedeutet, dass das Ausgangsbild<br />

gleich dem Ergebnisbild wäre. Der Glattheitsterm wird genau dann minimal, wenn der<br />

Gradientenbetrag an jeder Stelle im Ergebnisbild möglichst niedrig ist, es sich also um<br />

ein Bild mit gleichbleibender Intensität handelt. Zwischen diesen beiden Extremen wird<br />

durch die Lösung des Energieminimierungsproblems ein möglichst optimaler Kompromiss<br />

gesucht.<br />

Der Vorteil dieser Verarbeitungsmethode besteht in der hohen Transparenz der getroffenen<br />

Annahmen und Modellierungsentscheidungen. Eine Kombination <strong>von</strong> bereits<br />

erforschten Energiefunktionalen (z.B. Mumford-Shah-Funktional, Cartoonmodell) mit<br />

eigenen Termen ist leicht zu realisieren [PRT07]. Nachteil eines variationalen Lösungsverfahrens<br />

besteht aber in der Lösung des Minimierungsproblems. Ziel ist es, ein globales<br />

Minimum für E(u(x)) zu finden. Gerade besonders anspruchsvolle <strong>Segmentierung</strong>sprobleme<br />

liefern oft Energiefunktionale, die nicht konvex sind und somit statt eines globalen<br />

Extremums verschiedene lokale Extremstellen haben. Für eine Lösung ist es in solchen<br />

Fällen schwer zu entscheiden, ob es sich um das globale Minimum für E(u(x)) handelt<br />

oder ob man nur ein lokales Minimum errechnet hat. Das Finden einer global optimalen<br />

Lösung ist also nicht immer garantiert. Man kann zur Lösung der Energieminimierungsprobleme<br />

zwar auf viele verschiedene Lösungsmethoden zurückgreifen, wie unter<br />

anderem den Gradientenabstieg, das Gauß-Seidel-Verfahren oder die Jakobi-Methode,<br />

das Ermitteln einer global optimalen Lösung bleibt in den meisten Fällen schwierig.


22 4 DER SEEDED-REGION-GROWING ANSATZ<br />

4 Der Seeded-Region-Growing Ansatz<br />

Im folgenden Kapitel wird der Seeded-Region-Growing Ansatz im Detail besprochen.<br />

Neben einer Übersicht über den gesamten Ablauf des Algorithmus, werden in den weiteren<br />

Abschnitten die Realisierung des Regionswachtums, die Regionsrepräsentation,<br />

sowie das Labeling-Verfahren behandelt. Die Formvergleiche, als wichtiges Element im<br />

Seeded-Region-Growing, werden seperat im Kapitel 5 erläutert.<br />

4.1 Überblick und Ablauf<br />

Der Ablauf des Seeded-Region-Growings teilt sich in vier Verarbeitungsphasen, die in<br />

der schematischen Abb. (3) zu sehen sind. Zur Verarbeitung <strong>von</strong> Muskelfaserbildern<br />

durch das Seeded-Region-Growing werden die eigentlich bräunlich <strong>gefärbten</strong> <strong>ATPase</strong>-<br />

Aufnahmen in 8 bit Graustufen-Bilder umgewandelt und durchlaufen anschließend, die<br />

durch drei Schleifenkonstrukte verschachtelten Verarbeitungsphasen. Zunächst werden<br />

wir uns den Bedeutungen der einzelnen Arbeitsabläufe widmen, im Anschluss werden<br />

die Wechselwirkungen durch die Schleifenkonstrukte erklärt.<br />

Abbildung 3: Ablaufphasen im Seeded-Region-Growing<br />

Tabelle 4: Kriterien zur Prüfung <strong>von</strong> Saat-Punkten<br />

Kriterium Bedingung<br />

Bearbeitung s(x,y) ∈ bereits segmentierte Zelle?<br />

Helligkeit I(s(x, y)) ≤ 230<br />

Nachbarschaft ∀ q ∈ N s : |I(p(x, y)) − I(q(x q , y q ))| ≤ θ<br />

Phase 1: Wahl eines Saatpixels<br />

Die Bestimmung der Saat-Pixel erfolgt zufällig und wird für jede zu segmentierende<br />

Zelle ausgeführt. Da die Leistungsfähigkeit vom Seeded-Region-Growing maßgeblich<br />

<strong>von</strong> der Initialisierung der Saatpixel abhängt, erfolgt nach der Wahl des potentiellen


4.1 Überblick und Ablauf 23<br />

Saat-Punktes eine Prüfung auf dessen Eignung. Damit ein zufällig bestimmter Pixel<br />

s(x, y) als Saatpixel akzeptiert wird, muss er die in Tabelle (4) aufgelisteten Kriterien<br />

erfüllen.<br />

Die Motivation zur Erfüllung des ersten Kriteriums liegt klar auf der Hand: Ein Saatpixel,<br />

der sich innerhalb einer bereits bearbeiteten Zelle befindet, hat eine Doppelsegmentierung<br />

zur Folge und wird deswegen abgelehnt.<br />

Das zweite Kriterium soll sicherstellen, dass sich ein Saat-Pixel nicht im Zellzwischengewebe<br />

befindet. Ein Saat-Pixel im Zwischengewebe erschwert die <strong>Segmentierung</strong> und<br />

führt meist nicht zu einem sinnvollen Ergebnis. Das Gewebe zwischen den einzelnen<br />

Muskelfaserzellen ist bei der <strong>ATPase</strong>-Färbung, bis auf wenige Ausnahmen, überwiegend<br />

hell und hebt sich sehr stark <strong>von</strong> schwarzen bzw. mittelgrauen Zellen ab. Dadurch<br />

liefert der Intensitätswert eines Pixels einen guten Anhaltspunkt, um zwischen Zellen<br />

und Zwischengewebe zu unterscheiden. Desweiteren kann durch einen solchen Intensitätstest<br />

auch gut zwischen den verschiedenen Zelltypen unterschieden werden, so dass<br />

in diesem Verarbeitungsschritt auch eine Klassifikation der Zellen nach Zelltyp vorgenommen<br />

wird. Bisweilen kann es bei der Prüfung dies zweiten Kriteriums zu einer<br />

Verwechslung des Zwischengewebes mit besonders hellen Zellen kommen. Da jedoch<br />

die <strong>ATPase</strong>-Färbung je nach pH-Wert im Färbeprozess eine inverse Helligkeitsverteilung<br />

liefert, besteht das <strong>Segmentierung</strong>sziel vornehmlich aus der Konturdefinition für<br />

schwarze und dunkelgraue Zelltypen.<br />

Für das dritte Kriterium wird die Nachbarschaft N s um einen potentiellen Saatpixel<br />

s(x, y) überprüft. Durch ein Thresholding (siehe Gleichung 3.1) wird für alle Pixel<br />

q(x q , y q ) ∈ N s an Hand ihrer Intensität entschieden, ob die Elemente der Nachbarschaft<br />

zum selben Zelltyp wie der Saat-Pixel gehören. Sollte einer der Nachbarpixel einem<br />

anderen Zelltyp bzw. dem Zwischengewebe zugeordnet werden, so wird der Saat-Pixel<br />

verworfen. Es ist in einem solchen Fall da<strong>von</strong> auszugehen, dass sich der Saatpunkt relativ<br />

nah am Rand einer Faserzelle befindet. Ein Saatpunkt, der sich sehr nah am Zellrand<br />

befindet, steigert die Wahrscheinlichkeit zum Auslaufen der wachsenden <strong>Segmentierung</strong>sregion.<br />

Das hier verwendete Thresholding ist identisch mit dem Schwellwert-Test,<br />

der in der 2. Phase des Algortihmus angewendet wird.<br />

Ziel aller drei beschriebenen Kriterien ist eine möglichst optimale Wahl der Saatpixel,<br />

so dass diese zentral innerhalb einer Zelle liegen.<br />

Phase 2: Regionsinitialisierung<br />

Ausgehend vom gewählten Saatpixel wird in Phase zwei ein simples Regionswachstum<br />

initiert. Durch das bereits erwähnte Thresholding aus der zweiten Phase, wird nun ein


24 4 DER SEEDED-REGION-GROWING ANSATZ<br />

Regionswachstum realisiert (siehe Gleichung 3.3). Ausgehend vom Saatpixel werden<br />

die vier Nachbarpixel auf Regionszugehörigkeit geprüft und der Kontur des <strong>Segmentierung</strong>sbereichs<br />

zugeordnet. Für jeden dieser Kontur-Pixel werden wiederum alle vier<br />

Nachbarn abgearbeitet, so dass es zu einer Regionsausbreitung kommen kann (siehe<br />

Abb. 4).<br />

Abbildung 4: Regionsinitialisierung mit 4’er Nachbarschaft<br />

Die Regionsinitialisierung ist nötig, um möglichst schnell eine erste Zellform zu ermitteln,<br />

auf die dann die genaueren und aufwendigeren Regionstests und Formvergleiche<br />

ausgeführt werden. Diese erweiterten Tests benötigen für eine korrekte Ausführung<br />

eine Region mit einer bestimmten Mindestgröße. Das Initialwachstum wird solang ausgeführt,<br />

bis die Region eine ausreichende Größe hat. Das Kriterium dafür ist die Konturlänge<br />

und sollte je nach Auflösung des Ausgangsbildmaterials angepasst werden. Eine<br />

Alternative für das initialisierende Regionswachstum wäre eine statische Zelldefinition<br />

um den Saatpixel. Nachteilig an dieser Variante ist aber, dass es durch die pauschale<br />

Definition einer Initialregion bereits zur Überschreitung <strong>von</strong> Zellgranzen kommen kann.<br />

Eine daraus resultierende Fehlinitialisierung kann der Algorithmus zwar in begrenztem<br />

Maß korrigieren, jedoch verzögert dies die <strong>Segmentierung</strong> und vermidnert die Qualität<br />

der Ergebnisse.<br />

Da <strong>ATPase</strong> gefärbte Muskelfaserschnitte allgemein sehr deutliche Zellwandstrukturen<br />

haben, sollte das Seeded-Region-Growing ursprünglich nur das hier angewendete Regionswachstum<br />

mit einfachem Thresholding verwenden. In den ersten Implementierungen<br />

zeigte sich aber, dass die so segmentierten Regionen nur zum Teil richtig erkannt wurden.<br />

An vielen Stellen wuchsen die Zellbereiche über die Muskelfaserzelle hinaus und<br />

segmentierten das Zellzwischengewebe oder benachbarte Zellen. Auch durch eine Anpassung<br />

des Thresholds θ konnten diese Probleme nicht umgangen werden. Bei niedrigen<br />

Thresholds wurden Zellen mit hohen Intensitätsschwankungen unvollständig segmentiert.<br />

In Abb. (5) kann man ein <strong>Segmentierung</strong>sergebnis sehen, dass bei vollständiger<br />

Anwendung des naiven Regionswachstums entsteht. Die ermittelten Konturen weichen


4.1 Überblick und Ablauf 25<br />

stark <strong>von</strong> den eigentlichen Zellformen ab. Der Thresholding basierte Ansatz konnte also<br />

lediglich für eine Regionsinitialisierung genutzt werden. Die präzise Erkennung <strong>von</strong><br />

Zellkonturen musste durch ein erweitertes Regionswachstum realisiert werden.<br />

(a) Konturen entsprechen 9 Zellregionen<br />

(b) Vergrößerung <strong>von</strong> Bild a<br />

Abbildung 5: <strong>Segmentierung</strong>sergebnis durch simples Region-Growing (θ = 35)<br />

Phase 3: erweitertes Regionswachstum durch 2-Means-Clustering<br />

In der 3. Phase erfolgt das erweiterte Region-Growing. Statt eines einfachen Thresholdings<br />

wie in Phase 2 wird nun ein Zuordnungsverfahren benutzt, dass auf Basis des<br />

2-Means-Clusterings arbeitet. Die Notwendigkeit für einen erweiterten Wachstumsalgorithmus<br />

ergibt sich aus den Beschränkungen, denen der einfache Ansatz unterliegt. Da<br />

es bei <strong>ATPase</strong> <strong>gefärbten</strong> Faserzellen zu Helligkeitsverläufen und körnigeren Bildregionen<br />

kommen kann, besteht die Gefahr, dass ein einfaches Thresholding eine Zellkante<br />

ignoriert und ausläuft oder die wachsende Region es nicht bis zur Zellwand schafft und<br />

vorher durch Intensitätsschwankungen gestoppt wird. Durch das erweiterte Regionswachstum<br />

können solche Effekte zwar nicht vollkommen verhindert, aber zumindest<br />

stark verringert werden. Genaue Details zu dieser Technik werden ausführlich im Abschnitt<br />

(4.2.3) gegeben.<br />

Durch die Erweiterung des Seeded-Region-Growings um das 2-Means-Clustering konnte<br />

nun ein Regionswachstum modelliert werden, dass nicht durch Intensitätsschwankungen<br />

und teilweise undeutliche Zellgrenzen negativ beeinflusst wird. Dennoch können<br />

bestimmte negative Effekte, wie das Auslaufen einer Region, nicht in jedem Fall <strong>von</strong><br />

diesem Wachstumsansatz aufgefangen werden. Besonders in Bildbereichen, in denen


26 4 DER SEEDED-REGION-GROWING ANSATZ<br />

zwei Zellen gleichen Typs und damit gleicher Färbung benachbart sind, kann es leicht<br />

zu einem Auslaufen kommen. In Abb. (6) wurden jeweils die mittelgrauen Zellen segmentiert.<br />

Im Bild (6a) ist die finale Kontur zu sehen. Die Kontur hat an zwei Punkten<br />

einen Weg durch das Grenzgewebe gefunden. In Bild (6c) ist eine Kontur während ihrer<br />

Ausbreitung in die benachbarten schwarzen Zellen zu sehen. Wie in den Bildern(6b und<br />

d), dass eine Ausführung des Wachtums auf die jeweiligen Nachbarzellen nicht zu einer<br />

Übersegmentierung führen muss. Darin zeigt sich, dass das Regionswachstum sehr stark<br />

<strong>von</strong> der Initialisierung der Saatpixel abhängt.<br />

(a) (b) (c) (d)<br />

Abbildung 6: Auslaufen <strong>von</strong> Zellregionen in benachbarte Zellen<br />

Man kann schlussfolgern, dass eine hinreichend genaue Zellsegmentierung nur auf Grundlage<br />

der Intensitätswerte eines Muskelfaserschnittes nur schwer möglich ist. Wenn man<br />

die vielen Faktoren in Betracht zieht, die über die Qualität einer Muskelfaserprobe<br />

entscheiden, so muss eine vollautomatische Zellsegmentierung auch mit Faserbildern<br />

arbeiten können, die an vereinzelten Stellen keine optimale Färbung aufweisen. Da dies<br />

auch durch das erweiterte Regionswachstum nicht erreichbar war, musste das Seeded-<br />

Region-Growing um eine Formvergleichs-Komponente erweitert werden.<br />

Phase 4: Formvergleich mit medizinischer Datenbank<br />

In der 4. Phase wird die sich ausbreitende Region einem Formvergleich mit einer Datenbank<br />

unterzogen. Innerhalb dieser Datenbank befinden sich verschiedene Zellformen,<br />

die mit der aktuellen Form der Region verglichen werden. Das Ziel dieses Vergleichs ist<br />

es, untypische Zellformen, die durch eine auslaufende Region oder durch Einschlüsse<br />

im Inneren des Bereichs verursacht werden, zu erkennen. Beim Auslaufen der Region<br />

werden benachbarte Zellen oder Zwischengewebe mitsegmentiert, dies sorgt für eine zelluntypische<br />

Form, die durch den Datenbank-Vergleich erkannt wird. Im weiteren Verlauf<br />

wirkt sich eine geeignete oder ungeeignete Regionsform entsprechend wachstumsförderlich<br />

bzw. hemmend auf die Regionsentwicklung aus.


4.2 Regionswachstum 27<br />

Für die vorliegende Implementierung wurde eine relativ kleine, statistisch also nicht<br />

aussagekräftige Datenbank verwendet. Bei einem praktischen Einsatz muss auf einen<br />

umfangreichen medizinische Datensatz zurückgegriffen werden, der über viele Beispielformen<br />

mit hoher <strong>Segmentierung</strong>squalität verfügt. Details zum genauen Ablauf der<br />

Formvergleiche finden sich in Kapitel(5).<br />

In der schematischen Übersicht (Abb.3) wird deutlich, dass mehrere verschachtelte<br />

Schleifen verwendet werden, um die <strong>Segmentierung</strong> einer Zelle zu erreichen. Die äußere<br />

Schleife wird so oft durchlaufen, wie sich noch geeignete Saatpixel im Bild finden lassen<br />

und es noch unsegmentierte Zellen im Muskelfaserschnitt gibt.<br />

Die Schleife, die Phase 3 (erweitertes Regionswachstum) umschließt, wird insgesamt<br />

k mal ausgeführt, bis der Algorithmus in Phase 4 eintritt (Formvergleich). Für jeden<br />

Durchlauf <strong>von</strong> Phase 3 wird die gesamte Kontur der aktuellen Region einmal abgearbeitet.<br />

Das bedeutet, für einen Durchlauf kann sich die Kontur um maximal einen Pixel<br />

nach außen oder nach innen bewegen oder sie verbleibt auf ihrer aktuellen Position.<br />

Nach k Durchläufen <strong>von</strong> Phase 3 kann sich die Kontur also um k Pixel verschoben haben.<br />

Je nach dem, wie groß k gewählt wird, konvergiert das Verfahren schneller zu einer<br />

Lösung. Problematisch ist hier eine optimale Abschätzung <strong>von</strong> k, da bei einer zu großen<br />

Schrittweite sich unter Umständen keine Konvergenz einstellt bzw. bei einer zu kleinen<br />

Schrittweite man zu viele Iterationen benötigt, um ein zufriedenstellendes Ergebnis zu<br />

erreichen. Die k vielen Schleifendurchläufe der 3. Phase des Algorithmus dienen als ein<br />

künstliches Zeitschrittmaß und erst wenn alle Schleifendurchläufe abgeschlossen sind,<br />

erfolgt eine Formprüfung.<br />

Die dritte Schleife im System beschreibt die Anzahl der Iterationen, die insgesamt<br />

benötigt werden, bis die Zelle vollständig segmentiert ist. Eine Iteration i besteht aus<br />

einem vollständigen Durchlauf der Phase 3 (mit Schleife) und einer Ausführung <strong>von</strong><br />

Phase 4 (Formvergleich). Sobald das <strong>Segmentierung</strong>sergebnis präzise genug ist (Abbruchkriterium),<br />

gilt die Zelle als erkannt und der Algorithmus startet <strong>von</strong> vorn.<br />

4.2 Regionswachstum<br />

Das Regionswachstum im Seeded-Region-Growing erfolgt auf Grundlage einer Zuordnung<br />

<strong>von</strong> Pixeln zum inneren bzw. äußeren Regionsbereich. Die Prüfung, ob ein Pixel<br />

nach innen oder außen zuzuordnen ist, wird durch eine Mittelwertberechnung realisiert,<br />

die vergleichbar mit einem lokalen 2-Means-Clustering ist.


28 4 DER SEEDED-REGION-GROWING ANSATZ<br />

4.2.1 Regionsrepräsentation<br />

Beim Seeded-Region-Growing wird der segmentierte Bereich durch eine <strong>von</strong> einer Kontur<br />

umgebenen Region beschrieben, die mit Hilfe eines Labelingverfahrens wachsen bzw.<br />

schrumpfen kann. Sämtliche Pixel im Inneren des segmentierten Bereichs erhalten ein<br />

positives Label, während alle äußeren Bildpunkte ein negatives Label erhalten. In Abb.<br />

(7a) findet sich eine schematische Darstellung dieser Regionsrepräsentation.<br />

(a) Regionsrepräsentation durch positive / negative<br />

Labels<br />

(b) Nachbarschaft zur Ermittlung der inneren /<br />

äußeren Mittelwerte<br />

Abbildung 7: Zellrepräsentation und Mittelwertberechnung durch Labels<br />

Die Kontur der segmentierten Region, die in Abb.(7) rot eingefärbt ist, wird durch alle<br />

Pixel beschrieben, deren vier Nachbarbildpunkte unterschiedliche Labelvorzeichen haben.<br />

Ein Vorzeichenwechsel bei den Labels der Konturpixel bewirkt eine Veränderung<br />

des Konturverlaufs. Da in der vorliegenden Implementierung eine 4’er Nachbarschaft<br />

genutzt wird, resultiert daraus eine zwei Pixel breite Kontur, mit einer innen und einer<br />

außen verlaufenden Pixellinie. Wird die Nachbarschaft auf einen größeren Bereich<br />

ausgeweitet, hat dies eine breitere Kontur zur Folge, die aber einen höheren Verarbeitungsaufwand<br />

verursacht.<br />

Zum Zweck einer effizienten Implementierung ist es sinnvoll, alle Pixel, die zur aktuellen<br />

Kontur gehören, in einer seperaten Liste zu speichern, die zur Abarbeitung sequentiell<br />

durchlaufen werden kann. Gleichzeitig ist es vorteilhaft, eine Datenstruktur zu verwalten,<br />

die einen direkten Zugriff auf jeden Bildpunkt samt seines Labels ermöglicht.


4.2 Regionswachstum 29<br />

4.2.2 Labeling<br />

Alle Pixel der aktuellen Regionskontur werden sequentiell abgearbeitet. Der Pixel an<br />

erster Position der Kontur-Liste wird ausgelesen und ein Label-Update berechnet. Ist<br />

nach dem Labelupdate die Bedingung für die Konturzugehörigkeit noch erfüllt, verbleibt<br />

der Pixel in der Konturliste, wird aber vom Anfang der Liste entfernt und am<br />

Ende angefügt. Die Liste <strong>von</strong> Konturpixeln wird also wie eine first-in-first-out Struktur<br />

verwaltet.<br />

Die Berechnung des Label-Updates basiert auf einer Mittelwertberechnung für innere<br />

und äußere Pixel. Innerhalb einer Nachbarschaft werden alle vorhandenen Pixel in die<br />

Berechnung einbezogen. In Abb.(7b) wird diese Nachbarschaft als eine 7x7 Pixel große<br />

Region verdeutlicht. Je nach dem, ob ein Konturpunkt näher am inneren oder äußeren<br />

Mittelwert liegt, wird ein positives oder negatives Labelupdate errechnet. Dieses Update<br />

wird auf das bereits vorhandene Label addiert. Je nach den Intensitätswerten im Bild,<br />

kann es zu Vorzeichenänderungen insbesondere bei den außen liegenden Pixeln kommen.<br />

Durch diese Vorzeichenwechsel verändert sich die Lage der Kontur.<br />

Durch die Addition der Labels bei jedem Umlauf zur Konturverarbeitung kann es an<br />

Stellen, an denen die Region ihr Wachstum bereits eingestellt hat, passieren, dass sich<br />

bei jeder Pixelbearbeitung das Label immer weiter aufsummiert. Für diese Konturpunkte<br />

steigt der Betrag des Labels stetig. Um die Beträge nicht zu groß werden zu lassen,<br />

werden die Labels durch ein Intervall [−a, a] begrenzt. Daraus resultierend erhalten<br />

Pixel, die sehr häufig bearbeitet werden, keinen höheren Wert als a bzw. −a. Das festgelegte<br />

Label-Intervall garantiert demnach ein möglichst dynamisches Konturverhalten,<br />

dass Konturveränderungen auch an Stellen ermöglicht, an denen sich die Kontur über<br />

viele Iterationen hinweg kaum verändert hat. Dies wird besonders wichtig, wenn zu<br />

später die Formvergleiche stattfinden.<br />

4.2.3 2-Means-Clustering<br />

Die Berechnung der Labels erfolgt auf Basis der Intensitätswerte eines Pixels. Zur Labelberechnung<br />

für einen Konturpixel p(x, y) benötigt man den inneren Mittelwert µ in (p)<br />

und den äußeren Mittelwert µ out (p). Die Mittelwerte werden über die Nachbarschaftsregion<br />

N p ermittelt, die den Pixel p(x, y) als Zentrum hat und mit ihrer Form ein Quadrat<br />

einer bestimmten Größe beschreibt (siehe Abb. 7b).<br />

N p setzt sich aus den beiden Teilmengen N in und N out zusammen, so dass N p =<br />

N in ∪ N out gilt. N in enthält dabei alle Pixel, die sich innerhalb der wachsenden Region<br />

befinden und N out entsprechend alle Punkte, die außerhalb des Bereichs liegen. Zur Un-


30 4 DER SEEDED-REGION-GROWING ANSATZ<br />

terscheidung der Lage eines Pixels (innen oder außen) wird die Funktion L : Ω ↦→ [−a, a]<br />

verwendet. L(x, y) entspricht einem Zugriff auf das Label eines Pixels (x, y). Ein positives<br />

Label indiziert einen innen liegenden Pixel und ein negatives Label folglich einen<br />

äußeren Punkt. Die am Anfang des Absatzes erwähnten Mittelwerte berechnen sich<br />

durch das Aufsummieren über die jeweilige Teilmenge N in bzw. N out , dividiert durch<br />

die Kardinalität dieser Mengen (siehe Gleichung 4.1).<br />

µ in (p) = 1<br />

‖N in ‖ ·<br />

µ out (p) = 1<br />

‖N out ‖ ·<br />

∑<br />

I(x, y)<br />

(x,y)∈N in<br />

∑<br />

I(x, y)<br />

(x,y)∈N out<br />

(4.1)<br />

Die Berechnung der Mittelwerte erfolgt analog zu einem 2-Means-Clustering. Bei einer<br />

Veränderung des Konturverlaufs ändert sich auch die Zusammensetzung der Teilmengen<br />

N in/out für einen bestimmten Pixel. Mit zunehmender Konturentwicklung passt sich der<br />

Konturverlauf so an, dass eine optimale Zuordnung der Bildpixel in den inneren bzw.<br />

äußeren Bereich stattfindet. Es sei angemerkt, dass diese 2-Means-Klassifikation nicht<br />

zwangsläufig einer optimalen Zellform entsprechen muss.<br />

Anhand der Werte µ in/out wird nun eine Gaußsche Normalverteilung verwendet, um die<br />

Abweichung der Intensität des Pixels p <strong>von</strong> den Mittelwerten zu bestimmen (siehe Gleichung<br />

4.2). Als Erwartungswert µ für die Gaußverteilung werden die vorher berechneten<br />

Mittelwerte µ in bzw. µ out angenommen. Das Ergebnis der beiden Gaußverteilungen p in<br />

und p out ist eine Wahrscheinlichkeitsdichte und dient als ein Maß für die Abweichung<br />

der Intensität <strong>von</strong> p <strong>von</strong> den Mittelwerten. Je weiter die Intensität I(p) vom Mittelwert<br />

µ in/out abweicht, desto kleiner das Resultat <strong>von</strong> p in/out (siehe Abb. 8). Der Wert ǫ in<br />

der Gleichung für p out stellt sicher, dass die Region eher zu einem Wachstum neigt. Für<br />

den Fall, dass die beiden Mittelwerte µ in/out fast identisch sind, sorgt ǫ dafür, dass die<br />

Wahrscheinlichkeitsdichte p in höhere Werte liefert. Daraus resultiert eine leicht erhöhte<br />

Wahrscheinlichkeit, dass ein Pixel (x,y) eher zum inneren Regionsbereich gezählt wird.<br />

p in (p) = √ 1 · exp<br />

(− (I(p) − µ in(p)) 2 )<br />

2πσ 2σ 2<br />

p out (p) = 1 √<br />

2πσ · exp<br />

(<br />

− (I(p) − µ out(p)) 2 + ǫ<br />

2σ 2 ) (4.2)


4.2 Regionswachstum 31<br />

Abbildung 8: Funktionsbilder der Gleichungen aus dem Regionswachstum. (Labelberechnung)<br />

Ausgehend <strong>von</strong> den Wahrscheinlichkeitsverteilungen aus Gleichung (4.2) können wir<br />

nun eine Kostenfunktion E D (c) formulieren, die für eine Zellregion c die Güte des Konturverlaufs<br />

bewertet. Damit die Energiefunktion E D für die Lösung eines Energieminimierungsproblems<br />

geeignet ist, müssen p in und p out negativ logarithmiert werden. Wie<br />

in den Funktionsbildern in Abb. (8) zu sehen ist, erhält man durch Anwendung des negativen<br />

Logarithmus jeweils quadratische Funktionen für p in und p out . Die Gleichungen<br />

für −logp in/out können auch als (I(p) − µ in/out ) 2 approximiert werden.<br />

Wie in Gleichung (4.4) ersichtlich ist, wird auf die logarithmierten Wahrscheinlichkeitsdichten<br />

die Heaviside-Funktion H mit H : R ↦→ 0, 1 angewandt. Die Funktion H(x) ist<br />

eine in der Bildverarbeitung häufig anzutreffende Gewichtungsfunktion, deren mathematische<br />

Definition für in Gleichung 4.3 vorhanden ist.<br />

⎧<br />

⎨<br />

H(x) =<br />

⎩<br />

1 wenn x > 0<br />

0 wenn x ≤ 0<br />

(4.3)


32 4 DER SEEDED-REGION-GROWING ANSATZ<br />

E D (c) = ∑<br />

(x,y)∈Ω c<br />

(H(L c (x, y)) · (− logp in (x, y))+<br />

(1 − H(L c (x, y))) · (− log p out (x, y)))<br />

(4.4)<br />

Die Kostenfunktion E D (c) errechnet eine Summe über alle Pixel der Regionskontur<br />

Ω c . Alle Punkte, die nicht zur Kontur gehören, werden durch E D (c) nicht verrechnet<br />

und haben nur indirekten Einfluss auf das Regionswachstum (durch die MIttelwerte).<br />

E D enthält für jeden Konturpixel (x, y) genau einen Summanden. Liegt der Pixel<br />

(x, y) nun außerhalb unserer Region, so ist sein Label L c (x, y) negativ. Dadurch bildet<br />

die Heaviside-Funktion auf den Wert 0 ab, folglich besteht der Summand für den Pixel<br />

(x,y) nur aus log p out (x, y) ab. Im Umgekehrten Fall, (x, y) liegt innen, reduziert sich der<br />

Summand auf log p in (x, y). Wie bereits festgestellt wurde, sind log p out/in (x, y) quadratische<br />

Funktionen, deren globale Minima genau an den Stellen der Mittelwerte µ out/in<br />

liegen. Desto näherdie Intensität eines Pixels (x, y) am zugehörigen Mittelwert liegt,<br />

desto niedriger ist der entsprechende Summand. Die Summe über alle Konturpunkte<br />

wird also minimal, wenn die enthaltenen Pixel möglichst nah an ihren zugeordneten<br />

Mittelwerten liegen.<br />

Die Energieminimierung wird beim Seeded-Region-Growing durch einen Gradientenabstieg<br />

realisiert. Die Funktionsweise dieser Lösungsmethode wird in Kapitel (5.4) (S.39)<br />

genau erläutert. Dort wird auch die Herleitung zur Gradientenberechnung ∇E D (c) gegeben,<br />

die für das Lösungsverfahren benötigt wird.


33<br />

5 Formwissen-Erweiterung zur Regionsprüfung<br />

Da sich eine korrekte <strong>Segmentierung</strong> der Muskelfaserzellen nicht in allen Fällen nur<br />

auf Basis der Intensitätswert realisieren lässt, ist es notwendig ein Bewertungssystem<br />

für segmentierte Regionen einzubinden, dass dem Auslaufen <strong>von</strong> Zellregionen entgegenwirken<br />

kann. Wie schon erklärt wurde, kann durch das aufwendig modellierte Regionswachstum<br />

aus Kapitel (4) eine Fehlsegmentierung zwar reduziert, aber nicht vollständig<br />

ausgeschlossen werden. Je nach Qualität der <strong>gefärbten</strong> <strong>ATPase</strong> Muskelfaserschnitte,<br />

kann es vereinzelt zur <strong>Segmentierung</strong> vom Zwischengewebe oder benachbarten Zellen<br />

kommen. Um diesen Effekten entgegenzuwirken, wird ein Zellformvergleich mit einer<br />

medizinischen Datenbank vorgenommen.<br />

5.1 Datenbankaufbau<br />

Die für die vorliegende Implementierung verwendete Testdatenbank besteht aus 15 Zellformen.<br />

Jede Beispielform ist durch ein 257x257 Pixel großes Bild repräsentiert, in dem<br />

die Zelle schwarz (Farbwert 0) und der Hintergrund weiß (Farbwert 255) sind. In der<br />

Implementierung wird jedoch nicht mit den erwähnten Itensitäten gerechnet. Stattdessen<br />

wird dem Farbwert 0 das Label 1 zugeordnet, dem Farbwert 255 hingegen das Label<br />

-1. Auf Basis dieser Labelzuordnung kann eine repräsentatitive Distanz zwischen zwei<br />

Zellformen errechnet werden.<br />

Die Zellformen sind im Bildraum so ausgerichtet, dass der Schwerpunkt einer Zelle identisch<br />

mit dem Bildmittelpunkt (129,129) ist. Die Ausrichtung der Zellformen an ihrem<br />

Schwerpunkt ist wichtig, damit zwei zu vergleichende Zellen bei der Ähnlichkeitsberechnung<br />

möglichst deckungsgleich aufeinander passen. Eine Verschiebung der beiden<br />

Formen resultiert in einer Verfälschung des Formvergleichs.<br />

Während die Schwerpunkte der Datenbankformen nur einmalig berechnet werden müssen<br />

und anschließend unverändert bleiben, muss der Schwerpunkt der wachsenden Zellregion<br />

bei jedem Formvergleich neu berechnet werden (wegen möglicher Formveränderungen).<br />

Da sich die Bildräume der Datenbank (Ω DB ) und der Bildraum der Muskelfaserzellen<br />

(Ω) in ihrer Größe unterscheiden, der Schwerpunkt der wachsenden Zelle aber im<br />

Bildraum Ω errechnet wird, muss eine Transformation für die gesamte aktuelle Zellform<br />

stattfinden. Der dafür nötige Translationsvektor transformiert die segmentierte Region<br />

in den Bildraum Ω DB , so dass die Schwerpunkte der Datenbankformen mit dem der<br />

Zellregion übereinstimmen.


34 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />

(a)<br />

(b)<br />

Abbildung 9: Repräsentation <strong>von</strong> 2 Datenbank-Formen mit eingezeíchnetem Schwerpunkt(rot)<br />

5.2 Skalierungsinvarianz<br />

Für die Durchführung eines Formvergleichs ist, neben der Ausrichtung der Zellformen<br />

am Schwerpunkt, auch die Größe der zu vergleichenden Formen <strong>von</strong> Relevanz. Während<br />

die Beispielzellen in der Datenbank einen ähnlichen Flächeninhalt haben, kann die wachsende<br />

Region signifikant kleiner oder größer als die vorhandenen Datenbankformen sein.<br />

Besonders in den ersten Verarbeitungsdurchläufen ist der ermittelte Bereich meist viel<br />

kleiner, als die Bilder der Datenbank. Zu einem späteren Zeitpunkt, wenn das Regionswachstum<br />

fortgeschritten ist oder es eventuell zu Fehlsegmentierungen kommt, ist der<br />

Bereich meist größer als die Beispielformen. Für den Fall, dass eine Zellregion kleiner<br />

als eine Datenbank-Form ist, liefert der Formverlgeich keinerlei Bestrafung. Umgekehrt,<br />

wenn eine Zelle größer als die Trainingsformen wird, so bestraft der Formvergleich diese<br />

Entwicklung und versucht ihr durch eine entsprechende Labelberechnung entgegen zu<br />

wirken. Die Absicht in dieser Modellierung ist klar: Eine Zellform, die an bestimmten<br />

Stellen Zwischengewebe oder benachbarte Zellen mitsegmentiert, soll durch diese Bestrafung<br />

verhindert werden. Wenn aber die Bilddaten im Muskelfaserschnitt besonders<br />

große Zellen beinhalten, die die Größen der Trainingsformen überschreiten, so wird auch<br />

hier der Formvergleich einem weiteren Wachstum entgegenwirken, selbst wenn es auf<br />

Grundlage des Muskelfaserbildes legitim ist.<br />

Es bietet sich also an dieser Stelle an eine Skalierungsinvarianz zu nutzen. Dazu wird<br />

anhand der Flächeninhalte der Datenbankformen (Berechnung des Durchschnitts) und<br />

der Fläche der aktuellen Zellregion ein Skalierungsfaktor ermittelt. Mit Hilfe dieses Skalierungsfaktors<br />

können nun alle Datenbankformen möglichst passend auf die Zellregion


5.3 Parzenschätzer 35<br />

skaliert werden, so dass Größenunterschiede keinen Einfluss mehr auf den Formvergleich<br />

haben.<br />

In den praktischen Tests zum Seeded-Region-Growing hat sich aber gezeigt, dass der<br />

Formvergleich durch Nutzung der Skalierungsinvarianz nicht mehr so effektiv gegen auslaufende<br />

Zellregionen vorgehen kann. Man steht also vor dem Problem, dass ohne Einsatz<br />

der Skalierungsinvarianz untypische Zellformen zwar bestraft werden, gleichzeitig<br />

aber das Regionswachstum ab einer bestimmten Größe behindert wird. Im umgekehrten<br />

Fall kann eine Zelle zwar beliebig groß werden, es wird aber schwerer ungeeignete Zellformen<br />

zu verhindern. Desweiteren sollte durch die Datenbankzellformen keine Bevorzugung<br />

bestimmter Zellgrößen entstehen, sondern lediglich Zellformen bewertet werden.<br />

Schließlich ist ein Ziel der <strong>Segmentierung</strong> <strong>von</strong> Muskelfaserzellen, die Größenverhältnisse<br />

der erkannten Zelltypen zu berechnen. Wenn durch eine Formdatenbank bestimmte<br />

Zellgrößen bevorzugt werden, kann dadurch die Zellgrößenberechnung verfälscht werden.<br />

Eine optimale Lösung für das umrissene Problem lässt sich nicht einfach finden. Grundsätzlich<br />

gilt, dass der Einfluss der Datenbank auf das <strong>Segmentierung</strong>sergebnis immer niedriger<br />

sein sollte, als der Einfluss, der sich aus den Muskelfaserbildern ergibt. Letztlich<br />

sollen die im Faserschnitt vorhandenen Zellen möglichst unverfälscht erkannt und bewertet<br />

werden. Eine Skalierungsinvarianz ist dann sinnvoll, wenn die Flächeninhalte<br />

der Zellregion massiv <strong>von</strong> denen in der Datenbank abweichen. Es sollte also keine generelle<br />

Skalierungsinvarianz angewendet werden, sondern nur in Fällen, wo mit hoher<br />

Wahrscheinlichkeit <strong>von</strong> einer großen Muskelzelle im Faserbild ausgegangen werden kann.<br />

Durch geeignete Gewichtung zwischen dem Ragionswachstum und dem Formvergleich,<br />

in Kombination mit einer partiellen Skalierungsinvarianz bleiben die <strong>Segmentierung</strong>sergebnisse<br />

möglichst unverfälscht und gleichzeitig können immer noch negative <strong>Segmentierung</strong>en<br />

gehemmt werden.<br />

5.3 Parzenschätzer<br />

Zur Modellierung des Formvergleichs ist die Definition eines Ähnlichkeitsmaßes notwendig.<br />

Betrachtet man eine einzelne Datenbankform, so kann das 257x257 Pixel große<br />

Bild auch als ein Punkt in einem 257x257 dimensionalen Raum aufgefasst werden. Statt<br />

einfach die Distanz zwischen verschiedenen Punkten innerhalb dieses Vektorraumes zu<br />

ermitteln und so ein Ähnlichkeitsmaß zu definieren, kann durch Anwendung des Parzenschätzers<br />

ein Ähnlichkeitsmaß definiert werden, dass die Wahrscheinlichkeitsdichte<br />

über alle vorhandenen Datenbankformen in Betracht zieht.


36 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />

Zunächst wollen wir die allgemeine Funktionsweise des Parzenschätzers erläutern, um<br />

im Anschluss genauer auf die Modifikationen einzugehen, die für das Seeded-Region-<br />

Growing vorgenommen wurden. Der Parzenschätzer errechnet eine Wahrscheinlichkeitsdichte<br />

für einen bestimmten Punkt x in einem Raum R d mit n-vielen Datenpunkten x i .<br />

Die Berechnung der Wahrscheinlichkeitsdichte wird durch die Definition eines Parzenfensters<br />

realisiert. Dieses Fenster ist auf unseren Punkt x zentriert und je nach Größe<br />

des Fensters sind entsprechend mehr oder weniger Datenpunkte x i im Fenster vorhanden.<br />

Im Fall der Zellformvergleiche ist der Punkt x als unsere aktuell wachsende Region<br />

zu verstehen. Die Datenpunkte x i sind die in der Datenbank vorhandenen Zellformen.<br />

Zur Definition eines sogenannten Parzenfensters wählen wir uns einen Bereich N x dessen<br />

Mittelpunkt x ist und der sich innerhalb des Raumes R d befindet. N x kann als Hyperkubus<br />

mit den Kantenlänge h(n) interpretiert werden. Durch Variation der Kantenlänge<br />

können wir das so definierte Parzenfenster in seiner Größe verändern und die Ergebnisse<br />

des Parzenschätzers für ein bestimmtes x lenken. Im Idealfall ist die Größe des Parzenfensters<br />

invers abhängig <strong>von</strong> der Anzahl n der vorhandenen Datenpunkte x i im Raum<br />

R d . Das bedeutet: Je mehr Datenpunkte (Trainingsformen) x i im Raum R d vorhanden<br />

sind, desto kleiner kann das Parzenfenster gewählt werden. Aus Gleichung 5.1 wird die<br />

Definition des Volumens des Hyperkubus bzw. Parzenfensters deutlich [dS01].<br />

V (n) = h d (n) (5.1)<br />

Gleichung 5.2 beschreibt eine Funktion ϕ(v), die für einen Punkt/Vektor v ein Gewicht<br />

definiert. Im vorliegenden Fall bildet ϕ(v) lediglich auf die Gewichte 0 und 1 ab und<br />

dient damit als eine Zählfunktion, die für alle Vektoren v deren Betrag kleiner als 0.5 ist,<br />

eine 1 und sonst eine 0 zurück gibt. Wie wir in der nächsten Gleichung sehen werden,<br />

lässt sich dadurch die Anzahl der Datenpunkte x i errechnen, die sich im Parzenfenster<br />

befinden.<br />

⎧<br />

⎨<br />

ϕ(v) =<br />

⎩<br />

1 wenn |v| ≤ 1/2<br />

0 sonst<br />

(5.2)<br />

Die Funktion k(n) aus Gleichung 5.3 ermittelt die Anzahl der Datenpunkte x i , die sich<br />

innerhalb des um x zentrierten Parzenfensters befinden. Für jede vorhandene Traininsgform<br />

x i wird der Vektor (x − x i ) berechnet und durch die Seitenlänge h(n) des<br />

Hyperkubus normiert. Das bedeutet, dass der Betrag des normierten Vektors genau<br />

dann im Intervall [0, 1/2] liegt, wenn sich x i innerhalb des Parzenfensters befindet. Für


5.3 Parzenschätzer 37<br />

einen solchen Fall bildet die aus Gleichung 5.2 bekannte Funktion ϕ(v) auf den Wert 1<br />

ab. Es werden also alle Datenpunkte x i gezählt, die im Parzenfenster liegen.<br />

k(n) =<br />

n∑<br />

( ) x − xi<br />

ϕ<br />

h(n)<br />

i=1<br />

(5.3)<br />

Mit der Anzahl der im Hyperkubus vorhanden Datenpunkte x i kann nun die Kerndichteschätzung<br />

durch den Parzenschätzer vorgenommen werden. Das Resultat <strong>von</strong> p(x, n)<br />

aus Gleichung (5.4) liefert einen hohen Wert, wenn viele Datenpunkte x i im Parzenfenster<br />

um x vorhanden sind, das heißt wenn unser Punkt x zu möglichst vielen Trainingsformen<br />

x i möglichst ähnlich ist. Je weniger Formen x i in der Nähe des Punktes x<br />

vorhanden sind, desto niedriger das Resultat.<br />

p(x, n) = 1<br />

nV (n) ·<br />

n∑<br />

( ) x − xi<br />

ϕ<br />

h(n)<br />

i=1<br />

(5.4)<br />

Die aus Gleichung (5.4) ermittelte Wahrscheinlichkeitsdichte für einen Punkt x, kann<br />

als ideales Maß für die Ähnlichkeit <strong>von</strong> x zu den vorhandenen Trainingsformen x i genutzt<br />

werden. Zur Anwendung auf den Zellformvergleich, müssen aber noch ein paar<br />

Modifikationen vorgenommen werden. Diese betreffen insbesondere die Definition des<br />

Parzenfensters. Der besprochene Hyperkubus wird durch seine Seitenlänge h(n) definiert,<br />

die wiederum <strong>von</strong> der Anzahl n der vorhanden Trainingsformen abhängt. Die<br />

Modellierung des Parzenfensters durch einen Hyberkubus führt aber zu einer strikten<br />

diskreten Trennung zwischen Trainingsformen, die innerhalb des Fensters liegen und<br />

berücksichtigt werden bzw. Formen die außerhalb sind [dS01].<br />

Für einige Anwendungen ist ein solches Modell zwar ausreichend, doch gerade wenn<br />

die Anzahl der Trainingsformen beschränkt ist, ist es wünschenswert eine eher diffuse<br />

Definition des Parzenfensters zu haben. Statt durch den Hyperkubus eine Selektion<br />

unter den vorhandenen Trainingsformen zu forcieren, ist es besser alle Trainingspunkte<br />

zu berücksichtigen und dabei ihre Distanz zum Fenstermittelpunkt in Betracht zu<br />

ziehen. Dies erreicht man, indem die Kernfunktion ϕ als Gaußverteilung angenommen<br />

wird. Diese Modifikation der Gleichung (5.4) wird in der Formel (5.5) gezeigt. Um zu<br />

verdeutlichen, dass es sich in unserer Anwendung um Zellformen handelt, wird statt<br />

der bisherigen allgemeinen Formulierung x <strong>von</strong> nun an c verwendet. Je stärker sich eine<br />

Trainingsform c i <strong>von</strong> der Zellregion c unterschiedet, desto niedriger das Ergebnis der<br />

Gaußverteilung. Es werden jetzt alle vorhandenen Trainingspunkte berücksichtigt und<br />

nicht nur die innerhalb des beschriebenen Hyperkubus.


38 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />

p(c) = 1 n ·<br />

n∑<br />

i=1<br />

( )<br />

exp − d2 (c, c i )<br />

2σ 2<br />

(5.5)<br />

Die Distanz zwischen zwei Zellformen berechnet sich durch d 2 (c, c i ) und ist in Gleichung<br />

(5.6) gegeben. Für jeden Pixel (x, y) ∈ Ω DB wird die Distanz aus den Labels gebildet<br />

und quadriert. Ω DB ist der 257x257 Pixel große Bildraum in dem die Datenbankformen<br />

repräsentiert werden. Je nachdem, ob das Seeded-Region-Growing nun mit einer Skalierung<br />

der Trainingsformen arbeitet oder nicht, kann der Bildraum Ω DB auch kleiner oder<br />

größer der genannten Ausdehnung sein. Die einzelnen Einträge der Vektoren c bzw. c i ,<br />

entsprechen den einzelnen Pixeln im Datenbankbildraum und ermöglichen einen Zugiff<br />

auf Labels, die die Zellform beschreiben. Der Zugriff auf das Labeling wird durch<br />

L : Ω DB ↦→ −1, 1 realisiert, so dass ein Label <strong>von</strong> −1 einen außerhalb der Zellform liegenden<br />

Pixel (x, y) anzeigt. L(x, y) = 1 entspricht einem innen liegenden Punkt. L(x, y)<br />

ist an dieser Stelle nicht mit den Labels aus dem Bildraum des Muskelfaserschnittes Ω<br />

zu verwechseln.<br />

d 2 (c, c i ) =<br />

∑<br />

(L c (x, y) − L ci (x, y)) 2 (5.6)<br />

(x,y)∈Ω DB<br />

Aus Gleichung 5.5 wird deutlich, dass die Größe des Parzenfensters nun durch die<br />

Standardabweichung σ gesteuert wird. Wie auch in der allgemeinen Definition des Parzenschätzers<br />

ist es besonders wichtig einen geeigneten Wert für σ zu wählen.<br />

σ sollte so gewählt werden, dass die Gaußverteilung für einen bestimmte Trainingsform<br />

c i (der Erwartungswert) möglichst die am nächsten gelegenen anderen Zellformen miteinschließt.<br />

In [dS01] wird eine Standardabweichung <strong>von</strong> σ = 1/ √ n vorgeschlagen, die<br />

als Initialisierung verwendet und im späteren Verlauf optimiert werden kann. Hierbei ist<br />

n die Anzahl der vorhandenen Trainingsformen. Bei anderen <strong>Segmentierung</strong>sverfahren<br />

wurden ebenfalls Kerndichteschätzungen verwendet, um <strong>Segmentierung</strong>sergebnisse mit<br />

bestimmten Trainingsformen zu vergleichen. Die praktischen Tests haben gezeigt, dass<br />

für das Seeded-Region-Growing der <strong>von</strong> Cremers, Osher und Soatto vorgeschlagenen<br />

Ansatz zur Abschätzung <strong>von</strong> σ besonders geeignet ist. Die Abschätzung erfolgt über<br />

die durchschnittliche Distanz jeder Trainingsform zu ihrem nächsten Nachbarn. Mathematisch<br />

ausgedrückt ergibt sich die Formel aus Gleichung (5.7). Es wird also für jede<br />

Trainingsform c i der nächste Nachbar c j ermittelt, der folglich die kürzeste Distanz zu<br />

c i hat. Über diese Distanzen wird anschließend gemittelt [COS06].


5.4 Gradientenabstieg 39<br />

σ 2 = 1 n ·<br />

n∑<br />

i=1<br />

min<br />

i≠j d2 (c i , c j ) (5.7)<br />

Aus den bis hierher erläuterten Gleichungen (5.5 - 5.7) können wir nun eine auf Formwissen<br />

basierte Energiefunktion aufstellen. Die Energiefunktion E v (v für Vorwissen)<br />

wird, wie in Gleichung (5.8) zu sehen ist, negativ logarithmiert. Dies dient der Optimierung<br />

der Energiefunktion für das später angewandte Lösungsverfahren.<br />

E v (c) = − log(p(c)) (5.8)<br />

Die Energiefunktion des Regionswachstums E D (siehe Gleichung 4.4), die auf den Bilddaten<br />

des Muskelfaserschnittes beruht, und die gerade beschriebene Energiefunktion<br />

Ev, die auf dem Vorwissen über mögliche Zellformen basiert, können nun zu einer gemeinsamen<br />

Kostenfunktion E kombiniert werden (siehe Gleichung 5.9). Die Parameter<br />

α und β dienen der Gewichtung zwischen den beiden Energiefunktionen. Da E D und E v<br />

beim zunehmendem Wachstum der Zellregion c gegenläufige <strong>Segmentierung</strong>sziele verfolgen,<br />

ist es nun notwendig dieses Energieminimierungsproblem zu lösen (siehe Kapitel<br />

3.3). E D wird minimal, wenn sich die Zellkontur ideal an den Intensitätswerten im Bild<br />

ausrichtet, während E v für eine Zellform minimal wird, die möglichst nah an den vorgegebenen<br />

Trainingsformen liegt. Man sucht eine Zellform c für die hier ein optimaler<br />

Kompromiss gefunden wird.<br />

E(c) = α · E v (c) + β · E D (c) (5.9)<br />

5.4 Gradientenabstieg<br />

Ausgehend <strong>von</strong> Gleichung (5.9) können wir nun einen Gradientenabstieg durchführen,<br />

um das formulierte Energieminimierungsproblem zu lösen. In Gleichung (5.10) wird<br />

das Vorgehen bei diesem iterativen Lösungsweg verdeutlicht. Unsere wachsende Region<br />

c fassen wir als einen Punkt im Raum R d auf. Für d = 257 · 257 umfasst R d alle<br />

möglichen Formausprägungen, die auf einem Bildraum der Größe 257x257 durch binäre<br />

Formdefinition beschreibbar sind.<br />

In Bezug auf das Iterationsschema aus Gleichung (5.10) können wir für den Punkt c alt<br />

die Kostenfunktion E(c alt ) auswerten. E(c alt ) bewertet die Güte unserer Region und ist<br />

umso kleiner, je besser c alt unseren zwei Modellannahmen E D und E v genügt. Berechnen<br />

wir nun den Gradienten <strong>von</strong> E(c alt ), so zeigt dieser wie gewohnt in Richtung des höchs-


40 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />

ten Dichteanstiegs und weißt so zu den Zellformen in R d , für die unsere Kostenfunktion<br />

am stärksten ansteigen würde und die somit unerwünschte <strong>Segmentierung</strong>sergebnisse<br />

darstellen.<br />

Da der Gradient ∇E(c alt ) ein Vektor ist und auch unser Punkt c alt als ein Ortsvektor<br />

im Raum R d interpretiert werden kann, ist es durch die Subtraktion beider Vektoren<br />

möglich, einen Punkt c neu zuermitteln, für den die Kostenfunktion E(c neu ) kleiner wird<br />

und somit c neu ein besseres <strong>Segmentierung</strong>sergebnis ist. Nach Ausführung der Gleichung<br />

(5.10) gilt also: E(c neu ) < E(c alt ). Wir können so iterativ eine Lösung c ermitteln, die<br />

sich schrittweise immer näher zu einer lokal optimalen Lösung entwickelt.<br />

c neu = c alt − ∇E(c alt ) (5.10)<br />

Um den Gradienten <strong>von</strong> E(c alt ) zu berechnen, benötigen wir die partiellen Ableitungen.<br />

Da c alt auch als Vektor der Form c alt = (c (0,1) c (0,2) · · · c (x,y) · · · c (257,257) ) T geschrieben<br />

werden kann, können wir entsprechend die Kostenfunktion umformulieren als<br />

E(c alt ) = E((c (0,1) c (0,2) · · · c (x,y) · · · c (257,257) ) T ). Die Komponenten des Gradienten<br />

und somit die partiellen Ableitungen werden durch ∂E(c)<br />

∂c (x,y)<br />

definiert. Durch Einsetzen<br />

der Energiefunktionen E D und E v in die Komponenten des Gradienten ∇E(c) ergibt<br />

sich, dass man entsprechend die Gradienten ∇E D und ∇E v berechnet, die anschließend<br />

komponentenweise summiert werden (siehe Gleichung 5.11). Durch die bereits<br />

eingeführten Gewichte α und β erfolgt letztlich eine Skalierung der beiden Gradienten.<br />

Das heißt unser vorläufiges Ergebnis c alt kann sich, je nach Ausprägung der Gewichte,<br />

stärker dem einen <strong>Segmentierung</strong>sziel (E v ) oder dem Anderen (E D ) annähern.<br />

∇E(c) = α · ∇E v (c) + β · ∇E D (c) (5.11)<br />

Wie aus Gleichung (5.11) hervorgeht, müssen die Gradienten für E v (c) und E D (c) errechnet<br />

werden. Zunächst soll dazu die Herleitung für ∇E v (c) erfolgen. Im Anschluss<br />

wird dann die Herleitung des Gardienten für E D (c) präsentiert. In Gleichung (5.8) wurde<br />

E v (x) = −log(p(c)) definiert. Da die Komponenten des Gradienten aus den partiellen<br />

Ableitungen bestehen, können wir anhand der Ableitung E v ′ (c) = −p′ (c)/p(c) mit der<br />

Berechnung fortfahren. Schlussfolgernd aus E v ′ erhalten wir Gleichung (5.12), in der<br />

gezeigt wird, dass man den Gradienten ∇p(c) berechnen muss, um ∇E v (c) zu erhalten.<br />

∇E v (c) = − ∇p(c)<br />

p(c)<br />

(5.12)


5.4 Gradientenabstieg 41<br />

Zur Berechnung des Gradienten <strong>von</strong> p(c) aus Gleichung (5.12) benötigen wir die erste<br />

Ableitung p ′ (c), um auf die partiellen Ableitungen zu schließen. In Gleichung (5.13)<br />

werden die Formeln für p(c), p ′ (c) und daraus folgend ∇p(c) vorgestellt.<br />

p(c) = 1 n ·<br />

p ′ (c) = 1 n ·<br />

∇p(x) = 1 n ·<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

( )<br />

exp − d2 (c, c i )<br />

2σ 2<br />

(<br />

exp − d2 (c, c i )<br />

)<br />

·<br />

2σ 2<br />

( )<br />

exp − d2 (c, c i )<br />

·<br />

2σ 2<br />

(<br />

− d2 ′ )<br />

(c, c i )<br />

2σ 2<br />

( )<br />

− ∇d2 (c, c i )<br />

2σ 2<br />

(5.13)<br />

Aus der letzten Zeile der oberen Gleichung ist ersichtlich, dass wir den Gradienten <strong>von</strong><br />

d 2 (c, c i ) berechnen müssen, um letztlich ein Ergebnis zu erhalten. In Formel (5.14) wird<br />

zuerst die Ableitung d 2 ′ (c, c i ) vorgestellt, um dann den Gradienten und die partielle<br />

Ableitung zu erläutern.<br />

d 2 (c, c i ) =<br />

∑<br />

(L c (x, y) − L ci (x, y)) 2<br />

(x,y)∈Ω DB<br />

d 2 ′ (c, c i ) =<br />

∑<br />

2 · (L c (x, y) − L ci (x, y))<br />

(x,y)∈Ω DB<br />

( ∂d<br />

∇d 2 2 (c, c i )<br />

(c, c i ) =<br />

∂L c (0, 0) · · · ∂d 2 (c, c i )<br />

∂L c (x, y) · · · ∂d 2 (c, c i )<br />

∂L c (257, 257)<br />

∂d 2 (c, c i )<br />

∂L c (x, y) = 2 · (L c(x, y) − L ci (x, y))<br />

) T<br />

(5.14)<br />

Abschließend kann gesagt werden, dass durch die Gradientenabstiegsberechnung für<br />

jeden Pixel innerhalb des Bildraumes Ω DB ein Label berechnet wird. Die Labeluppdates<br />

müssen wieder in den Bildraum des Muskelfaserschnitts Ω transformiert werden, um<br />

dort auf die richtigen Pixel aufsummiert zu werden.<br />

Es verbleibt die Herleitung des Gradienten für die Kostenfunktion E D (c). Analog zur<br />

Gradientendefinition <strong>von</strong> E v (c) gilt auch für ∇E D (c), dass sich die Komponenten des<br />

Gradienten aus den partiellen Ableitungen nach L(x, y) zusammensetzen. Dadurch,<br />

dass die Mittelwerte µ in und µ out vom jeweiligen Konturverlauf abhängen, müssten<br />

bei der partiellen Ableitung des Gradienten auch die Wahrscheinlichkeitsdichtefunktio-


42 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />

nen p in und p out berücksichtigt werden. Zur Vereinfachung wird diese Abhängigkeit im<br />

Gradientenabstieg nicht berücksichtigt. Durch diese Vereinfachung muss bei der Ableitung<br />

der Energiefunktion E D (c) aus Gleichung (5.15) lediglich die Heaviside-Funktion<br />

berücksichtigt werden (siehe Gleichung 5.16).<br />

E D (c) = ∑<br />

(H(L c (x, y)) · (− log p in (x, y))+<br />

(x,y)∈Ω c (5.15)<br />

(1 − H(L c (x, y))) · (− logp out (x, y)))<br />

E D ′ (c) = ∑<br />

(x,y)∈Ω c<br />

H ′ (L c (x, y)) · (− log p in (x, y) + log p out (x, y)) (5.16)<br />

Aus der Ableitung E D ′ (c) können wir nun schlussfolgern, dass sich ∇E D (c) aus dem<br />

Gradienten <strong>von</strong> H(L(x, y)) berechnet (siehe Gleichung 5.17).<br />

∇E D (c) = ∇H(L c (x, y)) · (− logp in (x, y) + log p out (x, y))<br />

(<br />

) T<br />

∂H(L(x, y))<br />

∇H(L(x, y)) = · · · · · ·<br />

(5.17)<br />

∂L(x, y)<br />

∀(x, y) ∈ Ω c<br />

Gradientenvektor <strong>von</strong> H(L(x, y)) enthält als Einträge die partiellen Ableitungen <strong>von</strong><br />

H(L(x, y)). Da die Heaviside-Funktion eigentlich nicht differenzierbar ist, muss man<br />

zur Berechnung der Ableitung eine Approximation für H annehmen. Dazu wird eine<br />

Funktion δ (Dirac-Stoß) eingeführt, unter der Annahme, dass δ(x) = H ′ (x) gilt. Durch<br />

diese Vereinfachung ist es nun möglich eine nummerische Approximation <strong>von</strong> H(x) zu<br />

erhalten, die differenzierbar ist. Eine elegante Vorgehensweise wird dafür in [CV01]<br />

gegeben, wobei die dort vorgeschlagene Approximation <strong>von</strong> H(x) in Gleichung (5.18)<br />

aufgeführt ist.<br />

H ǫ (x) = 1 2<br />

(<br />

1 + 2 π arctan ( x<br />

ǫ) ) (5.18)<br />

Mit Hilfe der Gradienten für E D und E v kann der Gradientenabstieg durchgeführt werden.<br />

Ein Unterschied zwsichen den beiden Herleitungen wirkt sich aber besonders auf<br />

die Implementieruung aus. Während für die Berechnung <strong>von</strong> ∇E v Labels im Bildraum<br />

Ω DB verrechnet werden, wird bei ∇E D lediglich auf dem Bildraum Ω c gearbeitet. Die


5.5 Parameter des Seeded-Region-Growing 43<br />

beiden Räume unterscheiden sich in der Form, dass Ω c nur Pixel der Regionskonutr<br />

enthält, Omega DB hingegen alle Pixel des Datenbankbildraumes umfasst. Damit die<br />

aus dem Formvergleich stammenden Labels sich nicht auf Bildbereiche auswirken, die<br />

für das aus E D erzeugte Labeling nicht beeinflussbar sind, werden die Labelupdates<br />

für beide Energien nur für das sogenannte Narrow-Band, also die Regionskontur aufsummiert.<br />

Dadurch, dass die Labelupdates der beiden Energiefunktionen unabhängig<br />

<strong>von</strong>einander ausgeführt werden und dies unterschiedlich häufig passiert, müssen die<br />

Gradienten entsprechend skaliert werden.<br />

5.5 Parameter des Seeded-Region-Growing<br />

Im folgenden Kapitel wird sich eine Betrachtung über die verschiedenen Parameter<br />

des Seeded-Region-Growings anschließen. Wie wir in den vorangegangenen Abschnitten<br />

gesehen haben, gibt es sehr viele Werte, die den Ablauf des Algorithmus signifikant<br />

beeinflussen. Es ist daher sinnvoll einen Überblick über die <strong>Segmentierung</strong>sergebnisse<br />

bei bestimmten Parametereinstellungen zu geben und die Bedeutung und Auswirkungen<br />

bestimmter Parameter explizit zu erläutern. Die nachfolgende Liste zählt die wichtigsten<br />

Parameter vom Seeded-Region-Growing Ansatz auf und erklärt deren Auswirkungen auf<br />

das <strong>Segmentierung</strong>sergebnis einer Zelle.<br />

• Zeitintervall / Konturdurchläufe (k)<br />

k beschreibt die Anzahl der Abarbeitungen der Kontur. In jedem Abarbeitungszyklus<br />

wird die aktuelle Regionskontur einmal durchlaufen und für jeden Pixel wird<br />

ein Regionswachstumstest (siehe Gleichung 4.2 und 4.4) durchgeführt. Sind k-viele<br />

Zyklen durchlaufen (siehe auch Abb. 3) erfolgt ein Formvergleich. Die Wahl des<br />

Paramters k beeinflusst die Zeitabstände in denen ein Formvergleich stattfindet.<br />

Ein sehr niedriges k sorgt für häufige Formvergleiche. Erfolgen die Datenbankabgleichungen<br />

in kurzer zeitlicher Folge, so garantiert dies eine ständige Kontrolle der<br />

wachsenden Zellregion, steigert aber auch den Rechenaufwand. Die wachsende Region<br />

hat zwischen den Vergleichen kaum Zeit ihre Form signifikant zu verändern.<br />

Gerade bei großen Formdatenbanken können zu häufige Formvergleiche sehr viel<br />

Rechenaufwand nach sich zeihen und so die <strong>Segmentierung</strong> verlangsamen.<br />

Sind die Zeitabstände k für die Formvergleiche zu groß gewählt, so ist es möglich,<br />

dass der Algorithmus nicht die optimale Kontur ermitteln kann, weil der Formvergleich<br />

zu selten stattfindet und im Gegenzug das Regionswachstum auf Basis<br />

der Bilddaten dominiert. Ein weiterer Faktor bei der Wahl des Parameters k


44 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />

ist eine Abstimmung auf die Gewichtung der Datenbanklabels (α).Bei häufigen<br />

Datenbankvergleichen sollte α verkleinert werden, im umgekehrten Fall ist eine<br />

Vergrößerung angemessen.<br />

• Regionsgröße (N p und N s )<br />

Wie in Kapitel (4.2.3) erläutert wurde, erfolgt das Regionswachstum auf Grundlage<br />

der Intensitätswerte im Muskelfaserbild. Der Parameter N p definiert die Größe<br />

einer Nachbarschaftsregion um einen Pixel p. Innerhalb dieser Region werden alle<br />

Pixel anhand ihrer Labels in zwei Klassen unterteilt: Innerhalb bzw. außerhalb<br />

der Region. Für jede dieser Teilmengen, die wir mit N in und N out bezeichnet<br />

hatten, wird ein Mittelwert µ in/out errechnet. Auf Basis dieser Mittelwerte erfolgt<br />

dann eine Klassifizierung des Pixels p. Je größer man die Nachbarschaft N p wählt,<br />

desto großflächiger werden die Intensitätsinformationen in eine Klassifikation <strong>von</strong><br />

p einbezogen. Markante Intensitätsänderungen im Bildraum (z.B. durch Zellzwischengewebe)<br />

wirken sich beim Wachstum der Region früher auf die Mittelwerte<br />

aus, als wenn die betreffende Nachbarschaft N p sehr klein ist. Nachteilig an einer<br />

möglichst großen Nachbarschaft ist aber ein quadratisch ansteigender Rechenaufwand<br />

bei der Mittelwertbildung. Während bei einer 10x10 Pixel großen Region<br />

über 100 Pixel gemittelt werden müssen, sind es bei einer Region <strong>von</strong> 20x20 Pixeln<br />

bereits 400 Bildpunkte. Wie wir im Kapitel (6) sehen werden, kann gerade<br />

die erwähnte Mittelung über Nachbarschaftsregionen weitaus effizienter erfolgen,<br />

als in der vorliegenden Implementierung. Hier hat die Region N p eine Größe <strong>von</strong><br />

30x30 Pixeln. Die Region N s ist mit N p vergleichbar und beschreibt einen Suchraum<br />

in dem die Gültigkeit eines Saatpixels bewertet wird. Je nach Regionsgröße<br />

und dem Threshold θ können die Rückweisungsraten <strong>von</strong> zufällig gewählten Saatpixeln<br />

erhöht oder verringert werden. Je kleiner N s , desto unwahrscheinlicher ist<br />

eine Rückweisung eiens Pixels.<br />

• Standardabweichung (σ)<br />

Je nach Größe <strong>von</strong> σ ergibt sich eine stärkere oder schwächere Streuung der Normalverteilung.<br />

Je größer σ ist, desto breiter streut die Normalverteilung um den<br />

Erwartungswert µ. Wenn die Standardabweichung zu klein gewählt wird, kann im<br />

Fall der Formvergleiche die Normalverteilung keine anderen Datenbank-Formen<br />

miteinschließen. Dies ist für eine Berechnung der Labels ungünstig. Es sollten<br />

sowohl für das Regionswachstum, als auch für die Formvergleiche seperate Standardabweichungen<br />

verwendet werden. Eine gute Annahme für σv 2 (E v) ist der in<br />

Gleichung (5.7) präsentierte Ansatz.


5.5 Parameter des Seeded-Region-Growing 45<br />

• DB-Gewichtung (α)<br />

Der Skalierungsfaktor α verstärkt bzw. vermindert den Einfluss, den die Formvergleiche<br />

auf die Labelentwicklung haben. Wird α zu klein gewählt, so ist der<br />

Einfluss der Datenbankvergleiche möglicherweise zu gering und das auf den Bildinformationen<br />

basierte Regionswachstum dominiert das <strong>Segmentierung</strong>sergebnis.<br />

Ist hingegen α zu groß gewählt, hat die Datenbank zu viel Einfluss auf die <strong>Segmentierung</strong><br />

und behindert das Regionswachstum, so dass das <strong>Segmentierung</strong>sergebnis<br />

sich mehr den Datenbankformen annähert, als sich an den Bilddaten im Muskelfaserschnitt<br />

zu orientieren.<br />

• Bildgewichtung (β)<br />

Der Skalierungsfaktor β hat die gleichen Auswirkungen auf die <strong>Segmentierung</strong>, wie<br />

der Faktor α. Eine Abstimmung beider Werte ist notwendig, damit sich Formvergleich<br />

und Regionswachstum gut miteinander ergänzen. In den vorhanden Bespielbildern<br />

(??) wurde zum Beispiel mit den Werten α = 1000 und β = 1 gearbeitet.<br />

• Labelinterval ([−a, a])<br />

Wie im Abschnitt 4.2.2 bereits erklärt wurde, sind die Labels beim Seeded-Region-<br />

Growing auf ein Intervall [−a, a] beschränkt. Ziel dieser Begrenzung ist es, dass<br />

sich an bestimmten Stellen der Kontur die Labels nicht zu stark in eine Richtung<br />

entwickeln können. An Stellen, wo die Kontur vorerst eine feste Position<br />

eingenommen hat, summieren sich die Labels stark in eine Richtung (positiv bzw.<br />

negativ). Es hat sich gezeigt, dass das Labelinterval so gewählt werden sollte, dass<br />

das Labelupdate der Formvergleiche, innerhalb des Labelintervals liegt. Dadurch,<br />

dass die Formvergleiche seltener stattfinden, als Berechnungen zum Regionswachstum,<br />

müssen die Labelupdates aus dem Datenbankvergleich meist höher gewichtet<br />

werden. Dadurch ergeben sich aber Labelwerte, die merklich größer sind, als<br />

die Labels aus dem Regonswachstum. Sollte das Labelintervall zu klein gewählt<br />

werden, wird damit auch der Einfluss der Formvergleiche stark beschränkt. Ein<br />

Intervall <strong>von</strong> [−20, 20] bzw. [−40, 40] liefert gute <strong>Segmentierung</strong>sergebnisse. Je<br />

nach Initialisierung der außenliegenden Labels, ergibt sich ein schnelles oder verlangsamtes<br />

Regionswachstum. Wird der Bildraum Ω zu Beginn mit L = −20<br />

definiert, verlangsamt sich das Wachstum, da die Labelupdates aus dem Regionswachstum<br />

(E D ) den hohen Betrag der Labelinitialisierung abarbeiten müssen.<br />

Eine Labelinitialisierung <strong>von</strong> L = −1 sorgt hingegen für ein schnelles Wachstum,<br />

da die Labelupdates aus E D schneller einen Vorzeichenwechsel erzeugen können.


46 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />

• Threshold (θ)<br />

Der Threshold θ wird zunächst für die Bewertung der zufällig erzeugten Saatpixel<br />

verwendet. Im weiteren Ablauf des Algorithmus wird θ auch als Threshold<br />

für die Regionsinitialisierung genutzt (siehe Abb. 3). Ein kleiner Threshold beschränkt<br />

die Regionsinitialisierung und sorgt für eine hohe Rückweisungsrate bei<br />

den zufälligen Saatpixeln. Wird θ groß gewählt, ist die Initialisierung der Region<br />

unbeschränkt. Es kann dann leichter zu einer Überschreitung der Faserzelle kommen.<br />

Ebenso steigt die Gültigkeitsrate für die Saatpixel, was im ungünstigen Fall<br />

zu Saatpunkten führen kann, die sehr nah an Zellrändern oder im Zwischengewebe<br />

liegen. Wie in Abschnitt 4 erläutert, wirken sich diese Effekte ungünstig auf<br />

die <strong>Segmentierung</strong> aus. In den <strong>Segmentierung</strong>stests zum Seeded-Region-Growing<br />

hat sich ein Threshold <strong>von</strong> θ ≈ 30 bewährt.<br />

• Offset (ǫ)<br />

Der Offset ǫ dient der Unterstützung des Regionswachstums. Dadurch wird eine<br />

generelle Wachstumsbewegung der Region erzwungen, die aber bereits durch<br />

kleine Intensitätsschwellen gestoppt werden kann. ǫ sollte nicht zu groß gewählt<br />

werden, bei den praktischen Tests hat sich ein Wert <strong>von</strong> 0.5 bewährt.


47<br />

6 Fazit<br />

Im sich anschließenden letzten Abschnitt sollen die <strong>Segmentierung</strong>sergebnisse, die durch<br />

das Seeded-Region-Growing erreicht werden können präsentiert und besprochen werden.<br />

6.1 <strong>Segmentierung</strong>sergebnisse<br />

Die in Abb.(15) dargestellte Bildserie ist Teil der Abbildungen (10)-(14), die im Anhang<br />

zu finden sind. Die Bildreihen entstammen einem vollautomatischen Testdurchlauf des<br />

Seeded-Region-Growings. Die jeweils 8 Entwicklungsschritte des Zellwachstums stellen<br />

lediglich die einzelnen Stadien der Zellregion bei Ausführung eines Formvergleichs dar.<br />

Abbildung 10: 12 Iterationen<br />

Die vom Algorithmus vollautomatisch ermittelte endgültige Zellkontur ist jeweils im<br />

letzten Bild rot eingefärbt. Da zur Ermittlung dieser Kontur für jede Zelle unterschiedlich<br />

viele Iterationen benötigt wurden, findet sich in der Bildunterschrift jeweils eine<br />

Angabe, wie häufig ein Formvergleich ausgeführt wurde, bis die <strong>Segmentierung</strong> abgeschlossen<br />

war. Zur Berechnung der Konturen wurde das Seeded-Region-Growing mit<br />

folgenden Parametereinstellungen ausgeführt: k = 10, θ = 30, N s = 20x20 Pixel, N p =<br />

30x30 Pixel, ǫ = 0.5, σ D = 10, σv 2 = 28000, Labelintervall[−40, 40], α = 10, β = 0.75.<br />

6.2 Qualität und Effizienz der <strong>Segmentierung</strong><br />

Wie man in der Bilderreihe in Abb.(10) und weiteren Bildern im Anhang in Abb.(11) -<br />

(15) erkennen kann, erreicht das Seeded-Region-Growing in Bereichen, wo das Zellzwi-


48 6 FAZIT<br />

schengewebe größenteils deutlich zu erkennen ist und sich die vorhandene Zellform nicht<br />

zu stark <strong>von</strong> denen in der Datenbank unterscheidet, sehr gute <strong>Segmentierung</strong>sergebnisse.<br />

Desweiteren erreicht der hier präsentierte Ansatz gute <strong>Segmentierung</strong>sergebnisse für<br />

Zellen mit sehr wechselhaften Intensitätswerten, wie zum Beispiel im Bild (10 bzw. 11).<br />

Es lässt sich daraus schlussfolgern, dass der präsentierte Ansatz auch bei Bildstörungen<br />

wie Verrauschungen oder Fehler bei den Färbeprozessen für <strong>ATPase</strong> gute <strong>Segmentierung</strong>sergebnisse<br />

liefern kann. Die Qualität der vom Seeded-Region-Growing ermittelten<br />

Zellkonturen hängt <strong>von</strong> dem jeweiligen Zelltyp und seiner Färbung im Bild ab. Dunkel<br />

gefärbte Zellen können zumeist sehr gut erkannt werden und liefern präzise Konturen.<br />

Mittel stark gefärbte Zellen werden trotz Helligkeitsunterschieden im Inneren der<br />

Zellen relativ gut erkannt. Einschlüsse innerhalb eines segmentierten Bereiches treten<br />

zwar auf, werden aber im weiteren Ablauf des Algorithmus durch den Formvergleich<br />

als ungeeignet erkannt und korrigiert.<br />

Bei kritischen Bildregionen, in denen das Zellzwischengewebe partiell nicht sichtbar<br />

ist, kann ein leichtes Auslaufen <strong>von</strong> der Zellregion nicht verhindert werden. Durch eine<br />

möglichst optimale Gewichtung zwischen dem Formvergleich und dem Regionswachstum,<br />

können diese Effekte aber vermindert werden. Als negativ ist hier die große Anzahl<br />

an Parametern zu erwähnen, die die Qualität einer Zellsegmentierung durch das<br />

Seeded-Region-Growing beeinflussen. Es ist dadurch sehr schwer durch Feldversuche<br />

eine optimale Parametereinstellung festzulegen.<br />

6.3 Bestehende Probleme<br />

Das Hauptproblem des Seeded-Region-Growings ist der enorme Berechnungsaufwand,<br />

der sich aus dem 2-Means basierten Regionswachstum ergibt. Für jeden Konturpixel<br />

muss eine Nachbarschaft durchgearbeitet werden, um die inneren und äußeren Mittelwerte<br />

zu erhalten. Bei einer Konturlänge <strong>von</strong> 2000 Pixeln und bei einer Nachbarschaftsgröße<br />

<strong>von</strong> 30x30 Pixeln müssen 30 · 30 · 2.000 = 1.800.000 Pixel verarbeitet werden, um<br />

einen Konturumlauf zu realisieren. Da sich die 30x30 Nachbarschaften bei benachbarten<br />

Konturpunkten zu einem Großteil überschneiden und somit mehrfach verrechnet werden,<br />

gibt es hier viel Potential den Rechenaufwand zu verringern. In der vorliegenden<br />

Implementierung werden diese Überlappungen noch nicht berücksichtigt.<br />

Ein kritischer Punkt beim Seeded-Region-Growing ist die Initialisierung der Saat-Pixel.<br />

Die Position dieser Punkte kann die Qualität der <strong>Segmentierung</strong> stark beeinflussen, so<br />

dass sie dementsprechend sorgfältig ausgewählt werden müssen.


6.4 Weiterführende Entwicklung 49<br />

6.4 Weiterführende Entwicklung<br />

Die weiterführende Entwicklung des Seeded-Region-Growing sollte sich mit der Lösung<br />

der erwähnten Hauptprobleme beschäftigen. Zum Einen wäre eine effizientere Berechnung<br />

der inneren und äußeren Mittelwerte zu nennen, so dass die starke Überlappung<br />

der Nachbarschaftsbereiche für eine schnellere Berechnung ausgenutzt wird. Es ist angedacht,<br />

die <strong>von</strong> [PRT07] und [BC08] vorgeschlagenen Beschleunigungstechniken zur<br />

Gaußfilterung zu verwenden, um die Komplexität des Seeded-Region-Growings maßgeblich<br />

zu verringern. Die Beschleunigungstechnik basiert auf der Idee, dass eine Mittelung<br />

über eine bestimmte Pixelnachbarschaft äquivalent zu einer Gaußfilterung mit<br />

einem bestimmten σ ist. Das gesamte Muskelfaserbild bzw. der relevante Ausschnitt<br />

wird pixelweise über eine Nachbarschaft geglättet, die dem verwendeten Suchfenster<br />

bei der Mittelwertberechnung entspricht. Dieser Filtervorgang wird getrennt für den<br />

inneren Regionsbereich und den äußeren Bereich durchgeführt. Durch eine effiziente<br />

Implementierung des Glättungsfilters, zum Beispiel Boxfilterung oder iterative Filter,<br />

kann die Glättung für jeden Pixel schneller ausgeführt werden.<br />

Weitere Entwicklungen betreffen eine Bewertung der <strong>Segmentierung</strong> unter Ausnutzung<br />

<strong>von</strong> Farbinformationen, die in den <strong>ATPase</strong>-Schnitten ursprünglich vorhanden sind, im<br />

vorliegenden Fall aber nciht berücksichtig wurden. Dadurch könnten Fehlsegmentierungen<br />

an manchen Stellen unter Umständen reduziert werden.<br />

Es bleibt zu testen inwieweit eine automatische Rotationsausrichtung der wachsenden<br />

Region an den Datenbankformen bessere Ergebnisse oder schnellere Berechnungen liefert.<br />

Eine Möglichkeit für eine Rotationsausrichtung der Regionsform wird in [COS06]<br />

gegeben.


50 7 ANHANG<br />

7 Anhang<br />

Die alle für die Testdurchläufe verwendeten Muskelfaserschnitte wurden vom Institut<br />

für Neuropathologie der Universität Saarland in Homburg / Saar zur Verfügung gestellt.<br />

Abbildung 11: 12 Iterationen<br />

Abbildung 12: (10 Iterationen)


51<br />

Abbildung 13: 15 Iterationen<br />

Abbildung 14: 12 Iterationen


52 7 ANHANG<br />

Abbildung 15: 15 Iterationen


LITERATUR 53<br />

Literatur<br />

[BC08]<br />

[Can86]<br />

[COS06]<br />

[CV01]<br />

[dS01]<br />

[DS07]<br />

Thomas Brox and Daniel Cremers. On local region models and the statistical<br />

interpretation of the piecewise smooth mumford-shah functional.<br />

2008.<br />

J. F. Canny. A computational approach to edge detection. IEEE Transactions<br />

on Pattern Analysis and Machine Intelligence, pages 648–698, 1986.<br />

Daniel Cremers, Stanley J. Osher, and Stefano Soatto. Kernel density estimation<br />

and intrinsic alignment for shape priors on level set segmentation.<br />

International Journal of Computervision, 69:335–351, 2006.<br />

Tony F. Chan and Luminita A. Vese. Active contours without edges. IEEE<br />

Transactions on Image Processing, 10(2):266–277, 2001.<br />

J.P. Marques de Sá. Pattern Recognition - Concepts, Methods and Applications.<br />

Springer, 2001.<br />

Victor Dubowitz and Caroline A. Sewry. Muscle Biopsy: A practical approach.<br />

Saunders Elsevier, 2007.<br />

[KBFW05] Yoo-Jin Kim, Thomas Brox, Wolfgang Feiden, and Joachim Weickert. Fully<br />

automated segmentation and morphometrical analysis of muscle fibre<br />

images. pages 1–13, 2005.<br />

[KKP98]<br />

Ales Klemencic, Stanislav Kovacic, and Franjo Pernus. Automated segmentation<br />

of muscle fiber images using active contour models. Cytometry,<br />

32:317–326, 1998.<br />

[KMN + 02a] Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D.<br />

Piatko, Ruth Silverman, and Angela Y. Wu. An efficient k-means clustering<br />

algorithm: Analysis and implementation. IEEE Transactions on<br />

Pattern Analysis and Machine Intelligence, 24 Nr.7:881–892, 2002.<br />

[KMN + 02b] Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D.<br />

Piatko, Ruth Silverman, and Angela Y. Wu. A local search approximation<br />

algorithm for k-means-clustering. Annual ACM Symposium on Computational<br />

Geometry, 18:10–18, 2002.<br />

[Mor00] Bryan S. Morse. Lecture 18: Segmentation(regionbased). pages 1–5, 2000.


54 LITERATUR<br />

[Ots79]<br />

[PRT07]<br />

[SSS02]<br />

[Vos07]<br />

N. Otsu. A threshold selection method from gray-level histograms. IEEE<br />

Transactions on Systems, Man and Cybernetics, 9(1):62–66, 1979.<br />

J. Piovano, M. Rousson, and T.Papadopoulo. Efficient segmentation of<br />

piecewise smooth images. In F. Sgallari, A. Murli, and N. Paragios, editors,<br />

Scale Space and Variational Methods in Computervision. Springer, 2007.<br />

Jasjit S. Suri, Kamaledin Setarehdan, and Sameer Singh. Advanced Algorithmic<br />

Approaches to Medical Image Segmentation. Springer, 2002.<br />

Mark-André Voss. Level set based segmentation of atpase stained muscle<br />

fiber images with multiple regions. Master’s thesis, University of Bonn,<br />

2007.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!