Großer Beleg Segmentierung von ATPase-gefärbten - Fakultät ...
Großer Beleg Segmentierung von ATPase-gefärbten - Fakultät ...
Großer Beleg Segmentierung von ATPase-gefärbten - Fakultät ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Großer</strong> <strong>Beleg</strong><br />
Bildverarbeitung<br />
Thema:<br />
<strong>Segmentierung</strong> <strong>von</strong> <strong>ATPase</strong>-<strong>gefärbten</strong><br />
Muskelfaserschnitten mittels Seeded-Region-Growing<br />
Alexander Asmus<br />
Lehrstuhl für intelligente Systeme<br />
<strong>Fakultät</strong> Informatik<br />
Technische Universität Dresden<br />
27.05.2008<br />
Betreuung: Dr. Thomas Brox
Hiermit erkläre ich, dass die vorliegende Arbeit <strong>von</strong> mir allein ausgearbeitet und nur<br />
auf Grundlage der angegebenen Quellen angefertigt wurde.<br />
Dresden, 27.05.2008<br />
Alexander Asmus
Zusammenfassung<br />
Die Erkennung und <strong>Segmentierung</strong> <strong>von</strong> Muskelfaserzellen stellt eine wichtige Aufgabe<br />
in der medizinischen Bildverarbeitung dar. Automatisierte Erkennungsverfahren sorgen<br />
dabei für eine Beschleunigung der Analysezeiten und verbessern so den Diagnoseprozess<br />
für Muskelbiopsien. Der in der vorliegenden Arbeit vorgestellte Ansatz des<br />
Seeded-Region-Growings soll einen weiteren Beitrag zur Zellsegmentierung <strong>von</strong> AT-<br />
Pase <strong>gefärbten</strong> Muskelfaserzellen leisten. Der Algortihmus basiert auf der Idee eines<br />
Thresholding basierten Regionswachstums, das über lokale Intensitätsmittelung eine<br />
Regionszugehörigkeit definiert. Um negative Ergebnisse, wie die <strong>Segmentierung</strong> <strong>von</strong><br />
Zellzwischengewebe zu verhindern, verfügt das Seeded-Region-Growing zusätzlich über<br />
eine Formvergleichskomponente, die zellunähnliche <strong>Segmentierung</strong>en reduziert.
Inhaltsverzeichnis<br />
1 Einführung 3<br />
2 Medizinische Grundlagen 5<br />
2.1 Analyse und Gewinnung <strong>von</strong> Muskelfaserschnitten . . . . . . . . . . . . 5<br />
2.2 Probleme und Herausforderungen bestehender Verfahren . . . . . . . . 9<br />
3 Grundlagen der Bildsegmentierung 11<br />
3.1 Regionsbasierte <strong>Segmentierung</strong> . . . . . . . . . . . . . . . . . . . . . . 12<br />
3.1.1 Thresholding . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />
3.1.2 k-Means-Clustering . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />
3.2 Kantenbasierte <strong>Segmentierung</strong> . . . . . . . . . . . . . . . . . . . . . . . 19<br />
3.3 Variationsansätze und Energiemininierung . . . . . . . . . . . . . . . . 20<br />
4 Der Seeded-Region-Growing Ansatz 22<br />
4.1 Überblick und Ablauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />
4.2 Regionswachstum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />
4.2.1 Regionsrepräsentation . . . . . . . . . . . . . . . . . . . . . . . 28<br />
4.2.2 Labeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />
4.2.3 2-Means-Clustering . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />
5 Formwissen-Erweiterung zur Regionsprüfung 33<br />
5.1 Datenbankaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />
5.2 Skalierungsinvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34<br />
5.3 Parzenschätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35<br />
5.4 Gradientenabstieg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
5.5 Parameter des Seeded-Region-Growing . . . . . . . . . . . . . . . . . . 43<br />
6 Fazit 47<br />
6.1 <strong>Segmentierung</strong>sergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . 47<br />
6.2 Qualität und Effizienz der <strong>Segmentierung</strong> . . . . . . . . . . . . . . . . . 47<br />
6.3 Bestehende Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />
6.4 Weiterführende Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . 49<br />
7 Anhang 50
3<br />
1 Einführung<br />
Die Bildsegmentierung und im Besonderen die medizinische Bildverarbeitung sind Anwendungsgebiete<br />
der Informatik, in denen in den letzen Jahren große Fortschritte erreicht<br />
wurden. Typische medizinische Bilddaten, zum Beispiel Röntgenbilder, Computerund<br />
Magnetresonanztomographie (CT,MT), Ultraschallbilder, sowie Gewebeproben aus<br />
Pathologie und Histologie, bieten einen großen Anwendungsbereich für computergestützte<br />
Bildsegmentierung [SSS02]. Durch die Weiterentwicklung und Erforschung <strong>von</strong> bekannten<br />
<strong>Segmentierung</strong>smethoden und neuen Bilderkennungsalgorithmen kann für die<br />
meisten medizinischen Bildgebungsverfahren eine computerbasierte Bildverarbeitung<br />
ermöglicht werden. Vorhandene Applikationen sind, je nach Anwendungsfall, unterschiedlich<br />
stark automatisiert.<br />
Trotz der bisherigen Fortschritte kann man sagen, dass vollautomatisierte Bildsegmentierung<br />
der menschlichen Bilderkennungsleistung weit unterlegen ist. Während der<br />
menschliche bzw. tierische Wahrnehmungsapparat verschiedenste, sehr komplexe <strong>Segmentierung</strong>sprobleme<br />
in kurzer Zeit lösen kann, sind Applikationen zur automatisierten<br />
Bildsegmentierung meist speziell auf einen konkreten Anwendungsfall zugeschnitten. Eine<br />
Veränderung der Randbedingungen, für die ein <strong>Segmentierung</strong>salgorithmus optimiert<br />
ist, führt oft zum Scheitern des <strong>Segmentierung</strong>ssystems. Der Mensch hingegen kann für<br />
beliebige Bilddaten, auch unter sehr schlechten Rahmenbedingungen (Bildstörungen,<br />
Verrauschung, Farbveränderungen) Bildelemente schnell und sicher erkennen. Die Spezialisierung<br />
<strong>von</strong> automatischen <strong>Segmentierung</strong>ssystemen auf eingeschränkte Aufgaben,<br />
führt zu immer neuen Problemstellungen, die mit bisherigen Verfahren nicht zufriedenstellend<br />
zu lösen sind.<br />
Trotz der Überlegenheit der menschlichen Bilderkennungsleistung ist es dennoch erstrebenswert,<br />
<strong>Segmentierung</strong> durch Algorithmen zu automatisieren. Für viele medizinische<br />
Diagnosen müssen zunächst große Mengen <strong>von</strong> Bilddaten analysiert und klassifiziert<br />
werden, um gesicherte Aussagen über die genaue Sachlage zu erhalten.<br />
Die vorliegende Arbeit begründet sich auf der Problemstellung, Muskelfaserzellen vollautomatisch<br />
zu segmentieren. Die Erkennung <strong>von</strong> Zellen kann zwar gut manuell ausgeführt<br />
werden, wird jedoch durch Anwendung <strong>von</strong> automatisierter <strong>Segmentierung</strong><br />
schneller und effizienter. Besonders bei großen Datenmengen kann durch eine ununterbrochene<br />
Analyse durch Computersysteme viel personeller Aufwand verringert werden.<br />
Eine manuelle <strong>Segmentierung</strong> vieler Muskelfaserschnitte ist nicht nur ein zeitaufwendiger,<br />
sondern auch monotoner Arbeitsvorgang. Durch Abnahme der Konzentration<br />
steigt die Wahrscheinlichkeit für ein ungenaues <strong>Segmentierung</strong>sergebnis. Solche Feh-
4 1 EINFÜHRUNG<br />
lerquellen, die eine wissenschaftliche Auswertung der Daten erschweren, können durch<br />
automatisierte Verfahren umgangen werden.<br />
Die folgende Studienarbeit beschäftigt sich mit einem neuen Ansatz zur <strong>Segmentierung</strong><br />
<strong>von</strong> <strong>ATPase</strong>-<strong>gefärbten</strong> Muskelfaserschnitten. Ziel der <strong>Segmentierung</strong> ist das Finden der<br />
im Bild unterschiedlich ein<strong>gefärbten</strong> Muskelfaserzellen und die Definition der Zellkonturen.<br />
Diese Arbeit baut auf den Forschungsthemen zur <strong>Segmentierung</strong> <strong>von</strong> HE-<strong>gefärbten</strong><br />
Muskelfaserzellen auf und soll des Weiteren einen alternativen <strong>Segmentierung</strong>sansatz<br />
zu den Levelset-basierten <strong>Segmentierung</strong>sverfahren in [KBFW05],[KKP98] und [Vos07]<br />
liefern. Die vielfältigen Färbetechniken für Muskelfaserschnitte in der Histologie bieten<br />
ein breites Arbeitsspektrum für verschiedene <strong>Segmentierung</strong>sansätze. Da sich je nach<br />
Färbetechnik die Bildcharakteristika stark unterscheiden, sind viele der bestehenden<br />
Verfahren nur auf eine spezielle Färbetechnik ausgerichtet.<br />
Die Arbeit gliedert sich in insgesamt sechs Kapitel. Im Anschluss an diese Einführung<br />
werden zunächst wichtige Grundlagen über die Gewinnung, Bedeutung und Anwendung<br />
<strong>von</strong> Muskelfaserschnitten in der Medizin gelegt. Im dritten Kapitel werden grundlegende<br />
Techniken zur Bildsegmentierung erklärt, auf die zum Teil in späteren Kapiteln<br />
aufgebaut wird. Kapitel vier und fünf dienen der ausführlichen Beschreibung des vorgestellten<br />
Seeded-Region-Growing Ansatzes und verdeutlichen den Ablauf des Algorithmus,<br />
sowie die zugrundeliegenden mathematischen Details und Informationen zur<br />
Implementierung. Es schließt sich im Kapitel sechs eine abschließende Betrachtung an,<br />
die einen Überblick auf die erzielten Ergebnisse, die Leistungsfähigkeit des Algorithmus<br />
und zukünftige Weiterentwicklung des Seeded-Region-Growings gibt.
5<br />
2 Medizinische Grundlagen<br />
Das folgende Kapitel soll einen Einblick über die gängigen Arbeitstechniken, Anforderungen<br />
und Probleme bei der Analyse <strong>von</strong> Muskelfaserschnitten geben. Im ersten<br />
Teil wird die Arbeitsweise zur Erzeugung der Gewebeproben erklärt. Der zweite Teil<br />
beschäftigt sich mit den Problemen und Herausforderungen, die bisherige manuelle<br />
<strong>Segmentierung</strong>sverfahren mit sich brachten und motiviert den Einsatz automatisierter<br />
Zellsegmentierung in der medizinischen Diagnostik.<br />
2.1 Analyse und Gewinnung <strong>von</strong> Muskelfaserschnitten<br />
Die Entnahme einer Muskelgewebsprobe ist eine häufige diagnostische Maßnahme, um<br />
bestimmte Krankheitsbilder an Muskeln zu untersuchen. Der Vorgang wird als Muskelbiopsie<br />
bezeichnet und kann auf zwei verschiende Arten erfolgen:<br />
• Stanz-Biopsie / Nadel-Biopsie<br />
• offene Biopsie<br />
Die beiden Verfahren unterscheiden sich in Aufwand, Verträglichkeit für den Patienten<br />
und Qualität des gewonnenen Gewebes.<br />
Stanz- und Nadelbiopsie:<br />
Die Stanz- bzw. Nadelbiopsie ist eine schon lange bekannte Entnahmemethode, die aber<br />
seit einigen Jahren wieder verhäuft für Muskeluntersuchungen angewendet wird. Bei der<br />
Ausführung des Eingriffs wird eine Nadel in das zu untersuchende Muskelgewebe eingeführt.<br />
Die Stanz-Nadel verfügt über ein seitliches Fenster, das zur Gewebeextraktion<br />
geöffnet bzw. geschlossen wird. Der große Vorteil der Nadel-Biopsie besteht im geringen<br />
Aufwand des Entnahmevorgangs und in der Verträglichkeit für den Patienten. Der<br />
Eingriff kann mit Hilfe einer lokalen Betäubung sowohl bei Erwachsenen, als auch bei<br />
Kindern durchgeführt werden, ist weitestgehend schmerzfrei und hinterlässt in der Regel<br />
keine Narben an der Einstichstelle. Die Stanzbiopsie ist also für die meisten Patienten<br />
gut verträglich. Da die Extraktion nur ein paar Sekunden in Anspruch nimmt, kann<br />
eine sofortige Begutachtung des gewonnenen Muskelgewebes unter einem Mikroskop<br />
erfolgen. Je nach Qualität der Probe kann über weitere Gewebeentnahmen entschieden<br />
werden. Die bereits verwendete Einstichstelle kann in solchen Fällen mehrmals genutzt<br />
werden. Dies sichert eine möglichst hohe Qualität der gewonnenen Muskelfasern.
6 2 MEDIZINISCHE GRUNDLAGEN<br />
Offene Biopsie:<br />
Bei der offenen Biopsie wird ein Bereich über dem Muskel freigelegt, um ein 3 cm langes<br />
und ca. 0,5 cm dickes Muskelbündel zu entnehmen. Häufig wird zusätzlich ein 0,5 cm 3<br />
großes Muskelstück für weiterführende diagnostische Untersuchungen entnommen. Der<br />
Vorteil einer offenen Muskelbiopsie liegt in der Qualität des gewonnenen Gewebes. Es<br />
ist möglich, größere Gewebsstreifen zu extrahieren, was insbesondere für biochemische<br />
Untersuchungen günstig ist. Des Weiteren können Muskelkontraktionen des Patienten<br />
während des Eingriffs ausgeschlossen werden, was die Qualität der Proben erhöht. Der<br />
Nachteil der offenen Biopsie ist der hohe Aufwand bei der Entnahme, sowie stärkere<br />
Auswirkungen auf den Patienten durch den Umfang des Eingriffs. Der Vorgang zur Gewebeentnahme<br />
ist deutlich komplexer als bei der Stanz-Biopsie, benötigt eine stärkere<br />
Betäubung und kann unter Umständen Narben an der Entnahmestelle hinterlassen.<br />
Der deutlich höhere Stressfaktor für den Patienten ist auch der Grund, weshalb offene<br />
Biopsien seltener ausgeführt und durch die nadel-basierte Variante ersetzt werden<br />
[DS07].<br />
Die Auswahl eines bestimmten Muskels für eine Biopsie hängt <strong>von</strong> dem vorhandenen<br />
oder vermuteten Krankheitsbild des Patienten ab und da<strong>von</strong>, wie stark ein Muskel <strong>von</strong><br />
der Erkrankung beeinflusst ist. Allgemein wird ein Muskel mit einem repräsentativen<br />
Krankheitsbefall gewählt, der jedoch nicht übermäßig stark betroffen oder verfettet<br />
sein sollte. Weitere Kriterien zur Muskelauswahl betreffen den jeweiligen Gesundheitszustand<br />
des Patienten sowie die Erkenntnisse, die aus vorhergehenden Untersuchungen<br />
(u.a. Sonographie, Kernspintomographie) gewonnen wurden. Bei der Entnahme einer<br />
Gewebsprobe ist darauf zu achten, dass der Muskel durch die lokale Betäubung nicht<br />
betroffen ist, da dies zur zeitweiligen Beeinflussung des Gewebes führen kann [DS07].<br />
Aufbereitung des Gewebes:<br />
Da entnommende Muskelfaserproben sehr schnell austrocknen können, jedoch eine längerfristige<br />
Lagerung für spätere Untersuchungen eventuell nötig ist, sollte das Gewebe<br />
möglichst zeitnah eingefroren werden. Ein Einfrieren ist besonders wichtig, wenn biochemische<br />
oder histochemische Analysen erfolgen sollen. Diese Untersuchungen sind auf<br />
möglichst gute Gewebsproben angewiesen, da sonst bestimmte Testverfahren (Färbungen)<br />
nur unzureichende Ergebnisse liefern. Der Gefrierprozess wird in flüssigem Stickstoff<br />
mit anschließender Lagerung bei mindestens −40 ◦ C durchgeführt. Eine Beschleunigung<br />
des Einfrierens kann durch den Einsatz <strong>von</strong> in Flüssigstickstoff gekühltem Isopentan<br />
(−160 ◦ C) erfolgen [DS07]. Flüssiger Stickstoff wird bei Kontakt mit warmen<br />
Objekten sofort gasförmig. Um das einzufrierende Objekt bildet sich eine dünne Gas-
2.1 Analyse und Gewinnung <strong>von</strong> Muskelfaserschnitten 7<br />
schicht, die den Gefrierungprozess verlangsamt. Isopentan hingegen wechselt erst bei<br />
28 ◦ C in den gasförmigen Zustand und verlangsamt den Prozess folglich nicht.<br />
Eine gefrorene Probe wird zur weiteren Analyse in dünne (ca. 6-12 µm) Streifen geschnitten.<br />
Diese dünnen Schichten werden später eingefärbt und unter dem Mikroskop<br />
untersucht und abfotografiert. Wie auch die vorhergehenden Arbeitsschritte hat auch<br />
das Schneiden der Muskelfaserstreifen Einfluss auf die spätere Bildqualität der Probe.<br />
Besonders zu beachten ist die Temperatur des Gewebes beim Schneidevorgang [DS07].<br />
Färbetechniken:<br />
Ziel einer Muskelbiopsie ist es, den Zustand der einzelnen Muskelfaserzellen bewerten<br />
zu können. Da sich Muskelgewebe aus verschiedenen Zellarten zusammensetzt und die<br />
unterschiedlichen Zelltypen gut unterscheidbar sein müssen, werden die gewonnenen<br />
Zell-Präparate eingefärbt. In der Histologie werden dazu mannigfaltige Färbetechniken<br />
verwendet, deren Farbergebnisse verschiedene Eigenschaften des Muskelgewebes hervorheben.<br />
Neben knapp einem Dutzend Standard-Färbetechniken, gibt es weitere spezialisiertere<br />
Verfahren, um gezielt besondere Gewebeeigenschaften aufzuzeigen. Je nach<br />
dem welche Ergebnisse die generell anzuwendenden Färbungen liefern, werden weitere<br />
spezialisiertere Techniken verwendet, um bestimmte Befunde bestätigen zu können.<br />
Zwei der am häufigsten verwendeten Färbetechniken sind die HE-Färbung und <strong>ATPase</strong>-<br />
Färbung. Bei der Hematoxylin-Eosin-Färbung (kurz HE) wird der natürliche Farbstoff<br />
Hematoxylin und ein synthetischer Farbstoff (Eosin) verwendet. Eosin sorgt für eine<br />
rötliche Färbung der Faserzellen, während Hematoxylin insbesondere bei Zellkernen<br />
eine bläuliche Färbung erzeugt. Während zellinnere Strukturen sich gut vom Hintergund<br />
abheben, hat die HE-Färbung den Nachteil, dass keine Unterschiede zwischen<br />
verschiedenen Muskelzellarten zu erkennen sind. Dem gegenüber erzeugt die Adenosin-<br />
Triphosphatase Färbung (kurz <strong>ATPase</strong>) eine eher bräunliche Fällung der einzelnen Muskelfasern.<br />
Je nach pH-Wert der Inkubationslösung sind Kontraste und Färbung stärker<br />
ausgeprägt. Die Helligkeit der jeweiligen Zellen gibt dabei Aufschluss über den Muskelfasertyp<br />
[DS07].<br />
Muskelzelltypen:<br />
Bei Muskelfaserzellen wird zwischen 2 verschiedenen Zelltypen unterschieden, die sich<br />
sowohl in ihrer Funktionsweise, als auch auch in chemischen und enzymatischen Eigenschaften<br />
unterscheiden [DS07]. Die Muskelfaserarten werden durch ihre Farbe, Kontraktionsform,<br />
Ermüdung und durch ihre oxidative, bzw. glykolytische Funktionsweise<br />
unterschieden, woraus sich die Klassifikation aus Tabelle 1 ableitet [DS07].
8 2 MEDIZINISCHE GRUNDLAGEN<br />
Tabelle 1: Klassifikation <strong>von</strong> Muskelfasertypen<br />
Eigenschaft Typ 1 Typ 2a Typ 2b<br />
Farbe rot weiß weiß<br />
Kontraktionsform langsam schnell schnell<br />
Ermüdung resistent resistent sensitiv<br />
Funktionsweise oxidativ oxidativ / glykolytisch glykolytisch<br />
(a) HE-Färbung<br />
(b) <strong>ATPase</strong>-Färbung<br />
Abbildung 1: Muskelfasern mit verschiedenen Färbungen<br />
Wie in Abb. (1) zu erkennen ist, bestehen signifikante Unterschiede zwischen einer<br />
<strong>ATPase</strong>- und einer HE-Färbung. Der HE-gefärbte Faserschnitt zeigt sehr deutlich die<br />
Zelltopologie und verfügt über relativ homogene Farbverteilung im Inneren der Zellen.<br />
Obwohl die verschiedenen Zelltypen nicht zu unterscheiden sind, ist diese Färbetechnik<br />
für eine Kontur-Erkennung durchaus geeignet. Bei der <strong>ATPase</strong>-Färbung zeigen sich die<br />
verschiedenen Zelltypen in unterschiedlichen Helligkeitsstufen. Dadurch ist es möglich,<br />
sehr leicht zwischen den Zelltypen zu unterscheiden und so auch diese zusätzlichen Informationen<br />
in eine medizinische Diagnose einfließen zu lassen. Die Helligkeit eines bestimmten<br />
Muskelzelltyps wird durch den pH-Wert des Inkubationsmediums bestimmt.<br />
Eine Auflistung der Helligkeitsverteilungen bei typischen Inkubations-pH-Werten findet<br />
sich in Tabelle 2. (−) entspricht hell/wenig gefärbt und (+++) entspricht dunkel/stark<br />
gefärbt.
2.2 Probleme und Herausforderungen bestehender Verfahren 9<br />
Tabelle 2: pH-Wert-abhängige Helligkeitsausprägung bei <strong>ATPase</strong><br />
Färbetechnik Typ 1 Typ 2a Typ 2b Typ 2c<br />
<strong>ATPase</strong> bei pH 9.4 + +++ +++ +++<br />
<strong>ATPase</strong> bei pH 4.6 +++ − ++ +++<br />
<strong>ATPase</strong> bei pH 4.3 +++ − − ++(+)<br />
Eine wichtige Eigenschaft bei <strong>ATPase</strong>-Bildern ist eine invertierte Färbung bei Veränderung<br />
des pH-Wertes. Bei einem pH-wert <strong>von</strong> 9,4 sind Typ 1 Zellen hell und Typ 2a/b<br />
dunkler. Genau invers verhält es sich bei einem pH-Wert <strong>von</strong> 4,3 bzw. 4,6. Die Typ<br />
1 Zellen sind nun sehr dunkel, während Typ 2a dunkelbraun und Typ 2b hellbraun<br />
erscheint. Mit varierendem pH-Wert ändert sich bei <strong>ATPase</strong>-Färbung auch der gesamte<br />
Kontrast im Muskelfaserschnitt [DS07].<br />
2.2 Probleme und Herausforderungen bestehender Verfahren<br />
Bestehende Analyseverfahren erfolgen entweder manuell durch einen Arzt oder halbautomatisch<br />
mit Hilfe <strong>von</strong> Softwaresystemen. Im ersten Fall wird die Definition der<br />
Zellkonturen <strong>von</strong> Hand realisiert. Bei der Nutzung <strong>von</strong> halbautomatischen Verfahren<br />
ermittelt ein Softwaresystem die vorhandene Kontur, ist aber auf Assistenz durch einen<br />
Menschen angewiesen. Dies kann beispielsweise durch die Definition <strong>von</strong> Initialkonturen<br />
oder Zellmittelpunkten geschehen, die dann durch das System automatisch verfeinert<br />
und angepasst werden. Anhand der Kontur einer Muskelfaserzelle werden automatisch<br />
ihr Umfang, Durchmesser und Rundung ermittelt. Durch die Analyse <strong>von</strong> mehreren<br />
Muskelfaserschnitten können genug Daten erfasst werden, so dass Rückschlüsse über<br />
den Gesamtzustand des Muskels möglich sind.<br />
Leider sind sowohl manuelle als auch halbautomatische Verfahren sehr zeitaufwendig,<br />
fehleranfällig und für einen Menschen monotone Arbeitsaufgaben. Eine vollautomatische<br />
Verarbeitung ist also wünschenswert. Wie wir im vorhergehenden Abschnitt gesehen<br />
haben, gibt es aber eine Vielzahl verschiedener Färbetechniken, die sehr unterschiedliche<br />
Bildcharakteristiken aufweisen und dadurch ganz spezifische medizinsiche<br />
Aussagen ermöglichen. Für vollautomatisierte Zellerkennung muss der verwendete Algorithmus<br />
meist für die jeweilige Färbetechnik optimiert werden. Dies schränkt eine<br />
universale Anwendung zum Teil ein.<br />
Auf eine vollautomatische <strong>Segmentierung</strong> <strong>von</strong> Zellen wirken aber weitere Probleme,<br />
die es zu lösen gilt. Beispielsweise kann die Qualität der <strong>gefärbten</strong> Gewebeproben sehr<br />
stark variieren. Sowohl die Gewebeentnahme, als auch der Gefrierprozess beeinflus-
10 2 MEDIZINISCHE GRUNDLAGEN<br />
sen die späteren Zellbilder maßgeblich. Durch Fehler beim Schockgefrieren kann es<br />
zu Zerstörungen im Zellmaterial kommen, so dass bei anschließenden enzym-basierten<br />
Färbungen möglicherweise keine optimale Fällung erreicht werden kann. Auch ein Austrocknen<br />
der Probe kann ähnliche Folgen nach sich ziehen. Der Färbeprozess selbst<br />
birgt wiederum viele Fehlerquellen. Je nach pH-Wert der Inkubationslösung zur Aufbereitung<br />
der Gewebeschichten, ergeben sich stärkere oder schwächere Kontraste in<br />
<strong>ATPase</strong>-Bildern. Eine klare <strong>Segmentierung</strong> ist gerade bei nebeneinanderliegenden Zellen<br />
gleichen Typs oftmals schwierig. Teilweise sind die Farbintensitäten innerhalb einer<br />
Zelle sehr wechselhaft, dies erschwert die Erkennung und kann zu Fehlklassifikationen<br />
führen.<br />
Ein robustes vollautomatisches Verfahren zur Muskelzellklassifikation und <strong>Segmentierung</strong><br />
muss mit vielen dieser Fehlerquellen umgehen können und auch für Bilder mit<br />
unterschiedlicher Qualität hinreichend genaue Ergebnisse liefern. Da eine unmittelbare<br />
Überwachung des <strong>Segmentierung</strong>svorgangs durch geschultes Personal nicht vorgesehen<br />
ist, müssen Fehlerraten solcher Systeme sehr niedrig sein.
11<br />
3 Grundlagen der Bildsegmentierung<br />
Die Bildsegmentierung ist ein sehr vielversprechendes Forschungsfeld, in dem immer<br />
wieder neue Probleme auftauchen und formuliert werden. Dank einer aktiven Forschungsarbeit<br />
in den letzten Jahrzehnten, können wir auf eine Vielzahl <strong>von</strong> <strong>Segmentierung</strong>smethoden<br />
zurückgreifen, die teilweise sehr unterschiedliche Ansätze zur Lösung<br />
des <strong>Segmentierung</strong>sproblems wählen. Im nun folgenden Abschnitt soll auf einige der<br />
wichtigsten Methoden genauer eingegangen werden. In Vorbereitung auf die Erläuterungen<br />
in Kapitel (4) (S.22) und Kapitel (5) (S.33), werden hier die zugrunde liegenden<br />
Verfahren (Threshholding, K-Means-Clustering) erläutert.<br />
Einen Überblick über verschiedene praktische <strong>Segmentierung</strong>salgorithmen liefert folgende<br />
Klassifikation, die Erkennungsverfahren nach dem Grad der Automatisierung<br />
unterscheidet [Vos07].<br />
• manuelle <strong>Segmentierung</strong><br />
• halbautomatische <strong>Segmentierung</strong><br />
• vollautomatische <strong>Segmentierung</strong><br />
Wie in den vorhergehenden Kapiteln bereits erwähnt wurde, ist die Automatisierung<br />
eines Erkennungsverfahrens ein wichtiges Ziel in vielen praktischen Anwendungen. Beispielsweise<br />
werden bei der manuellen Auswertung <strong>von</strong> Muskelfaserschnitten für die <strong>Segmentierung</strong><br />
<strong>von</strong> ungefähr 200 Fasern ca. 20 - 30 Minuten benötigt [KKP98]. Für eine<br />
korrekte manuelle Zellsegmentierung wird ausgebildetes Fachpersonal mit fundiertem<br />
Wissen über die Gewebestrukturen <strong>von</strong> Muskelfaserzellen benötigt. Gleichzeitig handelt<br />
es sich aber bei dieser Arbeitsaufgabe um eine sehr zeitintensive und monotone<br />
Tätigkeit, bei der ständige Konzentration erforderlich ist. Eine Automatisierung des<br />
Verfahrens ist also erstrebenswert.<br />
Die halbautomatische Lösung eines <strong>Segmentierung</strong>sproblems umfasst eine Kombination<br />
aus automatisierter Berechnung und manueller Korrektur bzw. Überwachung. Der vom<br />
Menschen auszuführende Anteil der Bilderkennung kann durch partielle Nutzung <strong>von</strong><br />
Computersystemen verkürzt oder zumindest erleichtert werden. Mensch und Computersystem<br />
ergänzen sich durch ihre besonderen Leistungsfähigkeiten. Der menschliche<br />
Wahrnehmungsapparat kann durch seine sichere und schnelle Erkennungsleistung das<br />
Softwaresystem bei der Vorverarbeitung unterstützen, während der Computer für eine<br />
schnelle Verarbeitung und präzise Auswertung der Bilddaten sorgt. Unter bestimmten
12 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />
Umständen kann aber die halbautomatische <strong>Segmentierung</strong> ähnlich zeitintensiv sein,<br />
wie die manuelle Bearbeitung.<br />
Vollautomatische Verfahren ermitteln eine Lösung für das <strong>Segmentierung</strong>sproblem, die<br />
ohne menschliche Überwachung oder Korrektur hinreichend genau ist. Selbst wenn der<br />
Algorithmus zur Lösung des Problems länger benötigt als ein Mensch, so kann die Verarbeitung<br />
sehr leicht parallelisiert und ununterbrochen durchgeführt werden, wodurch<br />
es gerade bei umfangreichen Datensätzen zur Verkürzung <strong>von</strong> Analysezeiten kommt.<br />
Eine zweite Form der Klassifikation <strong>von</strong> <strong>Segmentierung</strong> ist die Unterscheidung nach<br />
dem <strong>Segmentierung</strong>sansatz:<br />
• Regionsbasierte <strong>Segmentierung</strong><br />
• Kantenbasierte <strong>Segmentierung</strong><br />
• Variationsansätze<br />
Jede dieser Herangehensweisen hat bestimmte Vor- und Nachteile, wie in den folgenden<br />
Abschnitten verdeutlicht wird. Zuerst werden die regionsbasierten <strong>Segmentierung</strong>smethoden<br />
erläutert, die im Seeded-Region-Growing eine besondere Rolle spielen.<br />
3.1 Regionsbasierte <strong>Segmentierung</strong><br />
Regionsbasierte <strong>Segmentierung</strong>smethoden versuchen, ein Bild durch die Definition einer<br />
Regionszugehörigkeit in verschiedene Bereiche zu teilen. Die mathematische Modellierung<br />
dieser Regionszugehörigkeit hat den größten Einfluss auf die Qualität der <strong>Segmentierung</strong>sergebnisse.<br />
Oftmals muss das mathematische Modell an lokale Eigenschaften des<br />
Bildes angepasst werden und somit adaptiv sein. Eine globale statische <strong>Segmentierung</strong><br />
auf dem gesamten Bildraum liefert in den meisten Fällen ungenaue und sehr zersplitterte<br />
Bildregionen. Der Vorteil regionsbasierter Verfahren gegenüber kantenbasierten<br />
Methoden ist eine geringere Störanfälligkeit in Bezug auf Rauschen [Mor00].<br />
Im Folgenden sei ein Bild bestehend aus Helligkeitswerten definiert durch I : Ω ↦→ R, das<br />
<strong>Segmentierung</strong>sergebnis sei ein Binärbild mit I ∗ : Ω ↦→ {0, 1}, die Regionszugehörigkeit<br />
wird durch eine Ähnlichkeitsfunktion S : Ω ↦→ R beschrieben. Letztlich bezeichnet Ω<br />
den zweidimensionalen Bildraum.
3.1 Regionsbasierte <strong>Segmentierung</strong> 13<br />
3.1.1 Thresholding<br />
Thresholding ist eine der grundlegendsten <strong>Segmentierung</strong>stechniken. Im allgemeinen<br />
Fall wird die Regionszugehörigkeit eines Pixels p(x, y) durch die Ähnlichkeits- oder<br />
Distanzfunktion S(x, y) und durch einen Schwellwert (Threshold) θ ∈ R definiert. Als<br />
regionszugehörig werden alle Pixel betrachtet, deren Ähnlichkeit S(x, y) kleiner als die<br />
gewählte Schwelle ist.<br />
⎧<br />
⎨1 S(x, y) > θ<br />
I ∗ (x, y) =<br />
mit x, y ∈ Ω (3.1)<br />
⎩<br />
0 S(x, y) ≤ θ<br />
Der Schwellwert in Gleichung (3.1) ist als ein Intensitätswert aufzufassen. Die Funktion<br />
S(x, y) kann beliebig komplex modelliert werden. Ein simples und gerade deswegen<br />
häufig verwendetes Modell ist S(x, y) = I(x, y). Dies bedeutet, dass die Regionszugehörigkeit<br />
lediglich durch den Intensitätswert I eines Pixels (x, y) bestimmt wird.<br />
Daraus resultierend ist der Schwellwert θ als ein Intensitätswert aufzufassen. Der Vorteil<br />
dieser Ähnlichkeitsfunktion liegt in den <strong>Segmentierung</strong>sergebnissen. Diese sind zwar<br />
selten sehr genau, können aber sehr schnell ermittelt werden und sind für eine Vorverarbeitung<br />
meist ausreichend. Der Nachteil einer so simplen Ähnlichkeitsdefinition ist<br />
eine erhöhte Rauschabhängigkeit, da ein Pixel mit zu starker Helligkeitsabweichung<br />
nicht zur Region klassifiziert wird, selbst wenn die Abweichung durch ein allgemeines<br />
Bildrauschen hervorgerufn wird [Mor00]. Kritisch ist auch die Wahl eines geeigneten<br />
Thresholds θ. Dieser ist der wichtigste Parameter, der die <strong>Segmentierung</strong> steuert und<br />
so das Ergebnis maßgeblich beeinflusst. Eine Veränderung <strong>von</strong> θ kann völlig andere <strong>Segmentierung</strong>sergebnisse<br />
bewirken. Bei einfachen Bildern mit klar abgegrenzten Flächen<br />
und möglichst viel Intensitätshomogenität kann ein idealer Threshold schnell gefunden<br />
werden. In solchen Fällen ist Thresholding eine sehr effiziente <strong>Segmentierung</strong>smethode.<br />
Es kann in linearer Zeit, abhängig <strong>von</strong> der Bildgröße, ausgeführt werden, was für viele<br />
<strong>Segmentierung</strong>saufgaben eine sehr gute Komplexität darstellt. Für viele reale Bilder<br />
(Fotos, Videostandbilder) ist es aber weit schwieriger, ein optimales θ zu ermitteln. Es<br />
gibt jedoch einige Algorithmen zur automatischen Abschätzung eines optimalen Thresholds.<br />
Durch Histogramm-Analysen kann man einen möglichst optimalen Threshold<br />
algorithmisch bestimmen [Ots79].<br />
Der oben beschriebene Ansatz berücksichtigt keine Pixelnachbarschaften, wodurch es<br />
leicht zu einer Übersegmentierung kommen kann. Da die <strong>Segmentierung</strong> auf dem gesamten<br />
Bildraum ausgeführt wird, werden alle Pixel des Bildes der Region zugeord-
14 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />
net, deren Intensitäten geeignet sind. Die Klassifikation erfolgt unabhängig da<strong>von</strong>, ob<br />
die entstehenden Regionen zusammenhängend sind oder es zu einer starken Aufsplitterung<br />
kommt. Diese Probleme können aber durch Anpassung an der Ähnlichkeitsdefinition<br />
S(x, y) gemindert werden. Eine Alternative für mehr Rauschresistenz beim<br />
Thresholding ist die Ausnutzung <strong>von</strong> Pixel-Nachbarschaften. S(x, y) ermittelt einen<br />
durchschnittlichen Intensitätswert innerhalb einer Pixelnachbarschaft N.<br />
S(x, y) = 1<br />
|N|<br />
∑<br />
x n ,y n ∈N<br />
I(x n , y n ) (3.2)<br />
Je nach Wahl der Pixelnachbarschaft werden mehr oder weniger Pixel im Mittelwert<br />
verrechnet. Die Nachbarregion zur Mittelwertbestimmung kann zum Beispiel eine 3x3<br />
oder 5x5 Pixel große Zone sein. Es sei angemerkt, dass die Ergebnisse bei einer Mittelung<br />
über eine bestimmte Pixelnachbarschaft identisch zu Ergebnissen ohne Nachbarschaftsmittelung<br />
sind, wenn vor Ausführung der <strong>Segmentierung</strong> eine Bildglättung durch<br />
Faltung mit einem geeigneten Filterkern stattfindet. Je größer die Nachbarschaftszone<br />
gewählt wird, desto stärker muss im alternativen Fall geglättet werden, um gleiche Ergebnisse<br />
zu bekommen. Die Mittelung über eine Pixelnachbarschaft ist also mit einer<br />
Bildglättung vergleichbar [Mor00].<br />
Ein Thresholding kann auf unterschiedliche Weise ausgeführt werden. Der Threshold-<br />
Filter kann global auf das Bild angewendet werden, wie es für Gleichung (3.1) und<br />
(3.2) vorgesehen ist. Bei einer globalen Anwendung ergeben sich aber über den ganzen<br />
Bildraum verteilte, nicht zusammenhängende Regionen, die meist über die zu segmentierenden<br />
Bereiche hinausgehen. Für die meisten Bilder lassen sich durch Definition<br />
eines konstanten, globalen Thresholds keine präzisen <strong>Segmentierung</strong>en erreichen. Als<br />
Alternativen nutzt man u.a. die erwähnte Abschätzung <strong>von</strong> θ, Einbezug der räumlichen<br />
Anordnung der Pixel oder ein iteratives Regionswachstum. Oftmals wird auch<br />
das Multi-Thresholding verwendet, bei dem durch mehrere <strong>Segmentierung</strong>sschritte mit<br />
unterschiedlichem θ die <strong>Segmentierung</strong>sergebnisse verbessert werden können und es zu<br />
weniger Übersegmentierung kommt.<br />
Region-Growing:<br />
Das Wachsen einer Region kann durch Definition eines Startpixels und einer iterativen<br />
Ausbreitung der Region simuliert werden. Ausgehend vom Initialpunkt p s (x s , y s ) (Saat-<br />
Pixel) breitet sich die Region schrittweise über sämtliche Nachbarpixel p n (x n , y n ) aus,
3.1 Regionsbasierte <strong>Segmentierung</strong> 15<br />
die durch S(x n , y n ) als regionszugehörig klassifiziert wurden.<br />
S(x n , y n ) = (I(x s , y s ) − I(x n , y n )) 2 (3.3)<br />
Es wird also die Differenz zwischen dem Saatpixel p s (x s , y s ) und dem zu klassifizierenden<br />
Pixel p n (x n , y n ) berechnet und anschließend, wie in Gleichung (3.1), als Zugehörigkeitskriterium<br />
verwendet. Der Schwellwert θ ist nun als Fehlertoleranz aufzufassen. Je<br />
größer man θ wählt, desto größer ist die Wahrscheinlichkeit, dass ein Pixel zur Region<br />
zugeordnet wird. Das Wachstum einer Region kann, ausgehend vom Saatpixel, durch<br />
Prüfung der 4 bzw. 8 direkten Nachbarpixel geschehen. Das Regionswachstum ist mit<br />
dem aus der Computergrafik bekannten Floodfill-Algorithmus vergleichbar. Die Ähnlichkeitsfunktion<br />
S(x n , y n ) aus Gleichung (3.3) ist wiederum ein einfaches Modell für<br />
ein Regionswachstum. Ebenso ist es möglich, das Modell durch Nachbarschaftsmittelung<br />
oder ein alternatives Distanzmaß anzupassen und so für bestimmte Zwecke zu<br />
optimieren. Ohne weitere Anpassungen kann es beim Modell aus Gleichung (3.3) leicht<br />
zum Auslaufen einer wachsenden Region kommen, so dass die segmentierte Zone den<br />
beabsichtigten <strong>Segmentierung</strong>sbereich verlässt. Dies passiert vor allem an Stellen, wo<br />
die Intensitätswerte einer Zielregion (zum Beispiel eine Muskelzelle) sich nur schwach<br />
vom Bildhintergrund abheben (beispielsweise das Zellzwischengewebe). Es gibt an betreffenden<br />
Stellen demnach nur sehr geringe Intensitätsunterschiede.<br />
Durch Erweiterung der Ähnlichkeitsfunktion S(x n , y n ) aus Gleichung (3.4) kann ein<br />
Auslaufen der wachsenden Region verhindert werden. Statt lediglich die Distanz der<br />
Intensitätswerte als Kriterium zu verwenden, wird auch der räumliche Abstand zwischen<br />
zwei Pixeln einbezogen.<br />
S(x n , y n ) = (1 − α)S I (x n , y n ) + αS D (x n , y n )<br />
S I (x n , y n ) = (I(x s , y s ) − I(x n , y n )) 2<br />
(3.4)<br />
S D (x n , y n ) = (x s − x n ) 2 + (y s − y n ) 2<br />
Je größer die räumliche Distanz zwischen dem Saatpixel p s und einem Pixel p n ist,<br />
desto größer wird der Wert <strong>von</strong> S(x n , y n ) und umso unwahrscheinlicher ist eine Regionszugehörigkeit.<br />
Die Abhängigkeit <strong>von</strong> den Bildintensitäten aus Gleichung (3.3) ist<br />
natürlich weiterhin gegeben. Durch den Parameter α ∈ [0, 1] erfolgt eine Gewichtung,<br />
ob die räumliche Distanz oder die Differenz der Intensitäten einen größeren Einfluss<br />
auf die Pixelklassifikation haben soll. Für α = 0 ergibt sich aus Gleichung (3.4) eine<br />
Äquivalenz zu Gleichung (3.3).
16 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />
Der Vorteil vom Region-Growing im Gegensatz zum klassischen Thresholding liegt in<br />
der Form der extrahierten Regionen. Diese sind nämlich im beschriebenen Fall immer<br />
zusammenhängend. Dennoch wirken sich die Störungen bei den Intensitätswerten<br />
stark auf die Form der wachsenden Regionen aus. Insbesondere bei Muskelfaserschnitten<br />
können neben Störung durch Verrauschung auch andere Bildeigenschaften, wie geringer<br />
Kontrast oder undeutliche Färbung des Zwischengewebes eine <strong>Segmentierung</strong> stark<br />
erschweren. Bei <strong>ATPase</strong>-<strong>gefärbten</strong> Zellschnitten sind besonders bei Zellen mittlerer Helligkeit<br />
(siehe Tabelle 2 und Abb. 1) starke Intensitätsschwankungen vorhanden, die vom<br />
Färbeprozess stammen. Darüber hinaus hebt sich das Zellzwischengewebe an vereinzelten<br />
Stellen nicht stark genug vom Zellhintergrund ab, was zu auslaufenden Regionen bei<br />
der <strong>Segmentierung</strong> führen kann. Eine detaillierte Beschreibung des Regionswachstums<br />
im Seeded-Region-Growing-Ansatz, sowie die Lösungen zur Minderung der genannten<br />
Probleme finden sich in Kapitel (4).<br />
3.1.2 k-Means-Clustering<br />
Als Clustering-Problem bezeichnet man die Aufgabe, eine Menge <strong>von</strong> Datenpunkten<br />
einer bestimmten Anzahl <strong>von</strong> Klassen zuzuordnen. Solche Zuordnungsprobleme treten<br />
in sehr vielen verschiedenen Anwendungen auf, wie unter anderem bei der Datenkompression,<br />
dem Data-Mining, der Bildverarbeitung und der Mustererkennung. Das<br />
k-Means-Clustering stellt eine Möglichkeit zur Lösung eines solchen Zuordnungsverfahrens<br />
dar [KMN + 02a]. K-Means-Clustering ist eine Zuordnung, die ausgehend <strong>von</strong><br />
n vielen Datenpunkten p diese in k viele Klassen einteilt. Jede Klasse K i wird dabei<br />
durch einen Mittelpunkt c i beschrieben. Ein Punkt p des Datensatzes wird einer Klasse<br />
K i zugeordnet, wenn die Distanz zwischen p und c i kleiner ist, als die Abstände zu den<br />
restlichen Klassen. Dies lässt sich formal durch folgende Energiefunktion beschreiben<br />
[Vos07] [dS01].<br />
E(C) =<br />
k∑<br />
i=1<br />
∑<br />
∀p∈K i<br />
‖p − c i ‖ 2 (3.5)<br />
Lösung des k-Means-Clusterings ist also eine Menge C = {c i mit i ∈ [1, k]}, für die die<br />
Energiefunktion aus Gleichung (3.5) ein globales Minimum hat. Dies ist genau dann<br />
der Fall, wenn der Abstand der Punkte p ∈ K i zum Klassenmittelpunkt c i kleiner<br />
ist, als alle Distanzen zu den verbleibenden Mittelpunkten der anderen Klassen. Wird<br />
eine solche Menge C gefunden, so handelt es sich um eine globale Optimierung des
3.1 Regionsbasierte <strong>Segmentierung</strong> 17<br />
Zuordnungsproblems. Das heißt, es gibt keine andere Klassenaufteilung, die eine bessere<br />
Zuordnung ermöglicht.<br />
Das Problem des k-Means-Clusterings ist aber, dass eine globale Optimierung nur<br />
schwer zu ermitteln ist. Es gibt verschiedene Herangehensweisen, um hier eine Lösung<br />
zu finden. Eine der bekanntesten ist der sogenannte Lloyd’s Algorithm“[KMN + 02a].<br />
”<br />
Durch eine einfache Implementierung kann eine Lösung, die ein lokales Minimum für<br />
E(C) darstellt, gefunden werden. Durch ein Iterationsschema können diese lokalen<br />
Lösungen weiter verfeinert werden. Zur Approximation einer relativ guten Lösung nutzt<br />
der Lloyd’s Algorithm“ die Tatsache aus, dass die optimale Positionierung eines Klassenmittelpunktes<br />
c i im Zentrum der durch die Klasse beschriebenen Punkte sein muss.<br />
”<br />
Ausgehend <strong>von</strong> einer Initialisierung der Centroiden c i werden alle Punkte der Datenmenge<br />
anhand ihrer Distanzen zu den Klassen zugeordnet. Anschließend werden die<br />
Mittelpunkte c i durch eine Mittelung über alle in einer Klasse enthaltenen Punkte<br />
neu positioniert. Dadurch ergibt sich ein iteratives Schema, bei dem sich nach jedem<br />
Durchlauf die Klassenmittelpunkte immer näher an eine optimale Postion annähern.<br />
Dieser Prozess wird in Abb. (2) grafisch verdeutlicht. In Tabelle (3) findet sich eine<br />
Ablaufs-Beschreibung des Algorithmus [Vos07].<br />
Tabelle 3: Ablauf vom k-Means-Clustering (Lloyd’s Algorithm)<br />
1. Initialisiere die Klassenmittelpunkte c i<br />
2. Ordne alle Datenpunkte p den Klassen zu<br />
3. Neuberechnung der c i durch Mittelung über Klassenelemente<br />
4. Bei Verschiebung der c i gehe zu Schritt 2, sonst Ende<br />
Der Vorteil dieser Clustering-Methode ist, dass der Algorithmus definitiv k viele Klassen<br />
findet und dabei in den meisten Fällen schon nach wenigen Iterationen zu einem<br />
Klassifikationsergebnis kommt. Je nach Modellierung der Distanz-Funktion kann dieser<br />
Ansatz für verschiedenste Verfahren angewendet werden. Im Beispiel <strong>von</strong> Zellerkennung<br />
kann sowohl eine <strong>Segmentierung</strong>, als auch eine Zell-Typ-Klassifikation erreicht werden.<br />
Letztere Anwendung wurde bereits als Vorverarbeitungsschritt in einer Level-Set basierten<br />
<strong>Segmentierung</strong> in [Vos07] ausgenutzt.<br />
Nachteilig am k-Means-Clustering ist aber, dass die Ergebnisse im besonderen Maße<br />
<strong>von</strong> der Initialisierung der Klassenmittelpunkte c i abhängen. Das bedeutet einerseits:<br />
Eine ungeschickte Initialisierung der Klassenmittelpunkte erhöht die Anzahl der nötigen<br />
Iterationen und damit die Laufzeit. Andererseits können zwei unterschiedliche Positionierungen<br />
der Initialpunkte c i zu verschiedenen Klassifikationen führen. Die Ergebnisse
18 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />
(a) Iteration: 1 (b) Iteration: 2<br />
(c) Iteration: 3 (d) Iteration: 4<br />
Abbildung 2: k-Means-Clustering für k=3 über 4 Iterationen<br />
des iterativen Lösungsverfahrens können im ungünstigen Fall stark vpn der optimalen<br />
Lösung abweichen [KMN + 02b]. Gerade für die Initialisierung der Centroiden muss<br />
daher größerer Aufwand betrieben werden, um möglichst gute Startparameter für den<br />
Algorithmus zu erhalten. Problematisch wird eine Anwendung des k-Means-Clusterings,<br />
wenn die Anzahl der zu findenden Klassen nicht genau bekannt ist. Um einen solchen<br />
Fall handelt es sich bei einer Zellsegmentierung, bei der jede Zelle genau eine Klasse<br />
darstellt. Während bei einer Klassifikation nur die Anzahl der Zelltypen <strong>von</strong> Belang ist<br />
(k = 3), benötigt man für eine <strong>Segmentierung</strong> die Anzahl der Zellen im Bild. Diesen<br />
Wert präzise zu schätzen, ist aber relativ schwierig, ebenso wie eine sichere Positionierung<br />
der Klassenmittelpunkte im Inneren der Zellen.
3.2 Kantenbasierte <strong>Segmentierung</strong> 19<br />
3.2 Kantenbasierte <strong>Segmentierung</strong><br />
Ein kantenbasierter <strong>Segmentierung</strong>sansatz baut auf der Annahme auf, dass innerhalb<br />
eines Bildes die zu erkennenden Regionen durch mehr oder weniger deutliche Kanten<br />
beschrieben werden. Eine Kante wird als eine plötzliche Intensitätsänderung innerhalb<br />
einer gewissen Umgebung angenommen. Aus der Bildverarbeitung kann man auf einige<br />
Filter mit kantendetektorischen Eigenschaften zurückgreifen, wie u.a. den Laplace-<br />
Filter.<br />
Eine Kante kann algorithmisch durch die Berechnung des Gradienten an einer bestimmten<br />
Stelle erkannt werden. Der Gradient (ein Vektor) berechnet sich aus den partiellen<br />
Raumableitungen auf dem Beobachtungsraum. Generell kann ein Gradient für n-<br />
dimensionale Datensätze berechnet werden. Im Falle eines zweidimensionalen Bildes<br />
werden entsprechend die zwei Raumableitungen nach x und y verwendet. Diese Ableitungen<br />
bilden die x- und y-Komponenten des Gradienten-Vektors. In Gleichung (3.6)<br />
findet sich eine mathematische Beschreibung.<br />
grad(I(x, y)) = ∇I(x, y) =<br />
( ∂I(x,y)<br />
∂x<br />
∂I(x,y)<br />
∂y<br />
)<br />
(3.6)<br />
Der Gradient, in der Kurzschreibweise als ∇ notiert, zeigt immer in Richtung des stärksten<br />
Dichteanstiegs eines skalaren Feldes. Für ein Grauwertbild also in die Richtung, in<br />
der sich die Helligkeitswerte am stärksten erhöhen. Der Betrag des Gradienten-Vektors<br />
gibt Aufschluss über die Stärke einer Intensitätsänderung an einer Stelle und ist so besonders<br />
zur Kantenbestimmung in Bildern geeignet. Besonders hohe Gradientenbeträge<br />
sind Indikatoren für Kanten innerhalb des Bildes.<br />
Vorteil <strong>von</strong> kantenbasierten <strong>Segmentierung</strong>smethoden ist, dass sich durch Kantendetektoren<br />
Konturen für verschiedenste Bildbereiche extrahieren lassen. Nachteilig ist<br />
aber, dass es unter Umständen schwierig sein kann, zwischen den Kanten der zu segmentierenden<br />
Objekte und den Kanten <strong>von</strong> irrelevanten Bildregionen zu unterscheiden.<br />
Oftmals sind die aus Kantendetektoren extrahierten Objektkonturen nicht zusammenhängend<br />
und müssen durch weitere Verarbeitungsschritte zusammengefügt oder<br />
vervollständigt werden. Ein häufig verwendeter Ansatz zur Kantensegmentierung ist<br />
der Canny-Algorithmus [Can86].
20 3 GRUNDLAGEN DER BILDSEGMENTIERUNG<br />
3.3 Variationsansätze und Energiemininierung<br />
Wie auch beim k-Means-Clustering kann man die Güte einer <strong>Segmentierung</strong> durch eine<br />
diskrete bzw. kontinuierliche Kostenfunktion E ausdrücken. Ist die Kostenfunktion E<br />
für einen diskreten Vektor v definiert, so spricht man <strong>von</strong> einer Energiefunktion E(v).<br />
Soll das <strong>Segmentierung</strong>sergebnis jedoch durch eine kontinuierliche Funktion u(x) mit<br />
u(x) : Ω ↦→ R repräsentatiert werden, so spricht man <strong>von</strong> einem Energiefunktional.<br />
Dank einer kontinuierlichen Betrachtung der <strong>Segmentierung</strong> ist es möglich, genauere<br />
Ergebnisse bei einer Bilderkennung zu erreichen, die nicht den Beschränkungen einer<br />
diskreten Repäsentation unterliegen (Abtastung).<br />
u ∗ (x) = arg min<br />
u(x) E(u(x)) (3.7)<br />
Das Energiefunktional aus Gleichung (3.7) verwendet als Parameter die kontinuierliche<br />
Funktion u(x). u(x) stellt eine mögliche Lösung für das <strong>Segmentierung</strong>sproblem dar<br />
und wird durch das Kostenfunktional E auf seine Güte geprüft. Dabei belohnt E(u(x))<br />
positive <strong>Segmentierung</strong>sergebnisse, während negative Ergebnisse zu einer Bestrafung<br />
führen. Belohnungen äußern sich in einer Verringerung bzw. einem sehr niedrigen Anstieg<br />
der Kostenfunktion, Bestrafungen entsprechen folglich einem Kostenanstieg.<br />
Die kontinuierliche Funktion u(x) kann je nach Anwendungsfall unterschiedlich sein.<br />
Denkbar ist eine kontinuierliche Kontur- oder Regionsbeschreibung, eine vollständige<br />
Repräsentation des finalen Ergebnisbildes ist aber auch möglich. Je besser das <strong>Segmentierung</strong>sergebnis<br />
u(x) ist, desto niedriger das Energiefunktional E(u(x)). Neben<br />
Anwendungen in der Bildverarbeitung und <strong>Segmentierung</strong> können Variationsansätze<br />
und Energieminimierung auch für viele andere Anwendungsgebiete <strong>von</strong> Nutzen sein.<br />
Je nach Anpassung des Terms E können verschiedenste Probleme bewertet und gelöst<br />
werden.<br />
Ein Energiefunktional setzt sich generell aus verschiedenen Teilenergien zusammen.<br />
Bei einer Bilderkennung hat jede dieser Teilenergien die Aufgabe, eine bestimmte Eigenschaft<br />
des <strong>Segmentierung</strong>ergebnisses zu garantieren oder zu unterdrücken. Oftmals<br />
widersprechen die angestrebten Ergebniseigenschaften einander, so dass eine optimale<br />
Lösung einen Kompromiss zwischen den Modellannahmen beschreibt. In Gleichung<br />
(3.8) besteht das Energiefunktional aus zwei Teilenergien. E glatt soll sicherstellen, dass<br />
das <strong>Segmentierung</strong>sergebnis möglichst geglättet ist, während E data ein Ergebnis mit
3.3 Variationsansätze und Energiemininierung 21<br />
möglichst viel Ähnlichkeit zu den Quelldaten fordert.<br />
E(u(x)) = E glatt (u(x)) + α · E data (u(x))<br />
E glatt = ‖∇u(x)‖<br />
E data = (u(x) − I(x)) 2<br />
(3.8)<br />
mit α ∈ [0, 1]<br />
Durch die beschriebene Gleichung ließe sich eine Bildglättung realisieren. Der Datenterm<br />
würde für u(x) = I(x) minimal werden, was bedeutet, dass das Ausgangsbild<br />
gleich dem Ergebnisbild wäre. Der Glattheitsterm wird genau dann minimal, wenn der<br />
Gradientenbetrag an jeder Stelle im Ergebnisbild möglichst niedrig ist, es sich also um<br />
ein Bild mit gleichbleibender Intensität handelt. Zwischen diesen beiden Extremen wird<br />
durch die Lösung des Energieminimierungsproblems ein möglichst optimaler Kompromiss<br />
gesucht.<br />
Der Vorteil dieser Verarbeitungsmethode besteht in der hohen Transparenz der getroffenen<br />
Annahmen und Modellierungsentscheidungen. Eine Kombination <strong>von</strong> bereits<br />
erforschten Energiefunktionalen (z.B. Mumford-Shah-Funktional, Cartoonmodell) mit<br />
eigenen Termen ist leicht zu realisieren [PRT07]. Nachteil eines variationalen Lösungsverfahrens<br />
besteht aber in der Lösung des Minimierungsproblems. Ziel ist es, ein globales<br />
Minimum für E(u(x)) zu finden. Gerade besonders anspruchsvolle <strong>Segmentierung</strong>sprobleme<br />
liefern oft Energiefunktionale, die nicht konvex sind und somit statt eines globalen<br />
Extremums verschiedene lokale Extremstellen haben. Für eine Lösung ist es in solchen<br />
Fällen schwer zu entscheiden, ob es sich um das globale Minimum für E(u(x)) handelt<br />
oder ob man nur ein lokales Minimum errechnet hat. Das Finden einer global optimalen<br />
Lösung ist also nicht immer garantiert. Man kann zur Lösung der Energieminimierungsprobleme<br />
zwar auf viele verschiedene Lösungsmethoden zurückgreifen, wie unter<br />
anderem den Gradientenabstieg, das Gauß-Seidel-Verfahren oder die Jakobi-Methode,<br />
das Ermitteln einer global optimalen Lösung bleibt in den meisten Fällen schwierig.
22 4 DER SEEDED-REGION-GROWING ANSATZ<br />
4 Der Seeded-Region-Growing Ansatz<br />
Im folgenden Kapitel wird der Seeded-Region-Growing Ansatz im Detail besprochen.<br />
Neben einer Übersicht über den gesamten Ablauf des Algorithmus, werden in den weiteren<br />
Abschnitten die Realisierung des Regionswachtums, die Regionsrepräsentation,<br />
sowie das Labeling-Verfahren behandelt. Die Formvergleiche, als wichtiges Element im<br />
Seeded-Region-Growing, werden seperat im Kapitel 5 erläutert.<br />
4.1 Überblick und Ablauf<br />
Der Ablauf des Seeded-Region-Growings teilt sich in vier Verarbeitungsphasen, die in<br />
der schematischen Abb. (3) zu sehen sind. Zur Verarbeitung <strong>von</strong> Muskelfaserbildern<br />
durch das Seeded-Region-Growing werden die eigentlich bräunlich <strong>gefärbten</strong> <strong>ATPase</strong>-<br />
Aufnahmen in 8 bit Graustufen-Bilder umgewandelt und durchlaufen anschließend, die<br />
durch drei Schleifenkonstrukte verschachtelten Verarbeitungsphasen. Zunächst werden<br />
wir uns den Bedeutungen der einzelnen Arbeitsabläufe widmen, im Anschluss werden<br />
die Wechselwirkungen durch die Schleifenkonstrukte erklärt.<br />
Abbildung 3: Ablaufphasen im Seeded-Region-Growing<br />
Tabelle 4: Kriterien zur Prüfung <strong>von</strong> Saat-Punkten<br />
Kriterium Bedingung<br />
Bearbeitung s(x,y) ∈ bereits segmentierte Zelle?<br />
Helligkeit I(s(x, y)) ≤ 230<br />
Nachbarschaft ∀ q ∈ N s : |I(p(x, y)) − I(q(x q , y q ))| ≤ θ<br />
Phase 1: Wahl eines Saatpixels<br />
Die Bestimmung der Saat-Pixel erfolgt zufällig und wird für jede zu segmentierende<br />
Zelle ausgeführt. Da die Leistungsfähigkeit vom Seeded-Region-Growing maßgeblich<br />
<strong>von</strong> der Initialisierung der Saatpixel abhängt, erfolgt nach der Wahl des potentiellen
4.1 Überblick und Ablauf 23<br />
Saat-Punktes eine Prüfung auf dessen Eignung. Damit ein zufällig bestimmter Pixel<br />
s(x, y) als Saatpixel akzeptiert wird, muss er die in Tabelle (4) aufgelisteten Kriterien<br />
erfüllen.<br />
Die Motivation zur Erfüllung des ersten Kriteriums liegt klar auf der Hand: Ein Saatpixel,<br />
der sich innerhalb einer bereits bearbeiteten Zelle befindet, hat eine Doppelsegmentierung<br />
zur Folge und wird deswegen abgelehnt.<br />
Das zweite Kriterium soll sicherstellen, dass sich ein Saat-Pixel nicht im Zellzwischengewebe<br />
befindet. Ein Saat-Pixel im Zwischengewebe erschwert die <strong>Segmentierung</strong> und<br />
führt meist nicht zu einem sinnvollen Ergebnis. Das Gewebe zwischen den einzelnen<br />
Muskelfaserzellen ist bei der <strong>ATPase</strong>-Färbung, bis auf wenige Ausnahmen, überwiegend<br />
hell und hebt sich sehr stark <strong>von</strong> schwarzen bzw. mittelgrauen Zellen ab. Dadurch<br />
liefert der Intensitätswert eines Pixels einen guten Anhaltspunkt, um zwischen Zellen<br />
und Zwischengewebe zu unterscheiden. Desweiteren kann durch einen solchen Intensitätstest<br />
auch gut zwischen den verschiedenen Zelltypen unterschieden werden, so dass<br />
in diesem Verarbeitungsschritt auch eine Klassifikation der Zellen nach Zelltyp vorgenommen<br />
wird. Bisweilen kann es bei der Prüfung dies zweiten Kriteriums zu einer<br />
Verwechslung des Zwischengewebes mit besonders hellen Zellen kommen. Da jedoch<br />
die <strong>ATPase</strong>-Färbung je nach pH-Wert im Färbeprozess eine inverse Helligkeitsverteilung<br />
liefert, besteht das <strong>Segmentierung</strong>sziel vornehmlich aus der Konturdefinition für<br />
schwarze und dunkelgraue Zelltypen.<br />
Für das dritte Kriterium wird die Nachbarschaft N s um einen potentiellen Saatpixel<br />
s(x, y) überprüft. Durch ein Thresholding (siehe Gleichung 3.1) wird für alle Pixel<br />
q(x q , y q ) ∈ N s an Hand ihrer Intensität entschieden, ob die Elemente der Nachbarschaft<br />
zum selben Zelltyp wie der Saat-Pixel gehören. Sollte einer der Nachbarpixel einem<br />
anderen Zelltyp bzw. dem Zwischengewebe zugeordnet werden, so wird der Saat-Pixel<br />
verworfen. Es ist in einem solchen Fall da<strong>von</strong> auszugehen, dass sich der Saatpunkt relativ<br />
nah am Rand einer Faserzelle befindet. Ein Saatpunkt, der sich sehr nah am Zellrand<br />
befindet, steigert die Wahrscheinlichkeit zum Auslaufen der wachsenden <strong>Segmentierung</strong>sregion.<br />
Das hier verwendete Thresholding ist identisch mit dem Schwellwert-Test,<br />
der in der 2. Phase des Algortihmus angewendet wird.<br />
Ziel aller drei beschriebenen Kriterien ist eine möglichst optimale Wahl der Saatpixel,<br />
so dass diese zentral innerhalb einer Zelle liegen.<br />
Phase 2: Regionsinitialisierung<br />
Ausgehend vom gewählten Saatpixel wird in Phase zwei ein simples Regionswachstum<br />
initiert. Durch das bereits erwähnte Thresholding aus der zweiten Phase, wird nun ein
24 4 DER SEEDED-REGION-GROWING ANSATZ<br />
Regionswachstum realisiert (siehe Gleichung 3.3). Ausgehend vom Saatpixel werden<br />
die vier Nachbarpixel auf Regionszugehörigkeit geprüft und der Kontur des <strong>Segmentierung</strong>sbereichs<br />
zugeordnet. Für jeden dieser Kontur-Pixel werden wiederum alle vier<br />
Nachbarn abgearbeitet, so dass es zu einer Regionsausbreitung kommen kann (siehe<br />
Abb. 4).<br />
Abbildung 4: Regionsinitialisierung mit 4’er Nachbarschaft<br />
Die Regionsinitialisierung ist nötig, um möglichst schnell eine erste Zellform zu ermitteln,<br />
auf die dann die genaueren und aufwendigeren Regionstests und Formvergleiche<br />
ausgeführt werden. Diese erweiterten Tests benötigen für eine korrekte Ausführung<br />
eine Region mit einer bestimmten Mindestgröße. Das Initialwachstum wird solang ausgeführt,<br />
bis die Region eine ausreichende Größe hat. Das Kriterium dafür ist die Konturlänge<br />
und sollte je nach Auflösung des Ausgangsbildmaterials angepasst werden. Eine<br />
Alternative für das initialisierende Regionswachstum wäre eine statische Zelldefinition<br />
um den Saatpixel. Nachteilig an dieser Variante ist aber, dass es durch die pauschale<br />
Definition einer Initialregion bereits zur Überschreitung <strong>von</strong> Zellgranzen kommen kann.<br />
Eine daraus resultierende Fehlinitialisierung kann der Algorithmus zwar in begrenztem<br />
Maß korrigieren, jedoch verzögert dies die <strong>Segmentierung</strong> und vermidnert die Qualität<br />
der Ergebnisse.<br />
Da <strong>ATPase</strong> gefärbte Muskelfaserschnitte allgemein sehr deutliche Zellwandstrukturen<br />
haben, sollte das Seeded-Region-Growing ursprünglich nur das hier angewendete Regionswachstum<br />
mit einfachem Thresholding verwenden. In den ersten Implementierungen<br />
zeigte sich aber, dass die so segmentierten Regionen nur zum Teil richtig erkannt wurden.<br />
An vielen Stellen wuchsen die Zellbereiche über die Muskelfaserzelle hinaus und<br />
segmentierten das Zellzwischengewebe oder benachbarte Zellen. Auch durch eine Anpassung<br />
des Thresholds θ konnten diese Probleme nicht umgangen werden. Bei niedrigen<br />
Thresholds wurden Zellen mit hohen Intensitätsschwankungen unvollständig segmentiert.<br />
In Abb. (5) kann man ein <strong>Segmentierung</strong>sergebnis sehen, dass bei vollständiger<br />
Anwendung des naiven Regionswachstums entsteht. Die ermittelten Konturen weichen
4.1 Überblick und Ablauf 25<br />
stark <strong>von</strong> den eigentlichen Zellformen ab. Der Thresholding basierte Ansatz konnte also<br />
lediglich für eine Regionsinitialisierung genutzt werden. Die präzise Erkennung <strong>von</strong><br />
Zellkonturen musste durch ein erweitertes Regionswachstum realisiert werden.<br />
(a) Konturen entsprechen 9 Zellregionen<br />
(b) Vergrößerung <strong>von</strong> Bild a<br />
Abbildung 5: <strong>Segmentierung</strong>sergebnis durch simples Region-Growing (θ = 35)<br />
Phase 3: erweitertes Regionswachstum durch 2-Means-Clustering<br />
In der 3. Phase erfolgt das erweiterte Region-Growing. Statt eines einfachen Thresholdings<br />
wie in Phase 2 wird nun ein Zuordnungsverfahren benutzt, dass auf Basis des<br />
2-Means-Clusterings arbeitet. Die Notwendigkeit für einen erweiterten Wachstumsalgorithmus<br />
ergibt sich aus den Beschränkungen, denen der einfache Ansatz unterliegt. Da<br />
es bei <strong>ATPase</strong> <strong>gefärbten</strong> Faserzellen zu Helligkeitsverläufen und körnigeren Bildregionen<br />
kommen kann, besteht die Gefahr, dass ein einfaches Thresholding eine Zellkante<br />
ignoriert und ausläuft oder die wachsende Region es nicht bis zur Zellwand schafft und<br />
vorher durch Intensitätsschwankungen gestoppt wird. Durch das erweiterte Regionswachstum<br />
können solche Effekte zwar nicht vollkommen verhindert, aber zumindest<br />
stark verringert werden. Genaue Details zu dieser Technik werden ausführlich im Abschnitt<br />
(4.2.3) gegeben.<br />
Durch die Erweiterung des Seeded-Region-Growings um das 2-Means-Clustering konnte<br />
nun ein Regionswachstum modelliert werden, dass nicht durch Intensitätsschwankungen<br />
und teilweise undeutliche Zellgrenzen negativ beeinflusst wird. Dennoch können<br />
bestimmte negative Effekte, wie das Auslaufen einer Region, nicht in jedem Fall <strong>von</strong><br />
diesem Wachstumsansatz aufgefangen werden. Besonders in Bildbereichen, in denen
26 4 DER SEEDED-REGION-GROWING ANSATZ<br />
zwei Zellen gleichen Typs und damit gleicher Färbung benachbart sind, kann es leicht<br />
zu einem Auslaufen kommen. In Abb. (6) wurden jeweils die mittelgrauen Zellen segmentiert.<br />
Im Bild (6a) ist die finale Kontur zu sehen. Die Kontur hat an zwei Punkten<br />
einen Weg durch das Grenzgewebe gefunden. In Bild (6c) ist eine Kontur während ihrer<br />
Ausbreitung in die benachbarten schwarzen Zellen zu sehen. Wie in den Bildern(6b und<br />
d), dass eine Ausführung des Wachtums auf die jeweiligen Nachbarzellen nicht zu einer<br />
Übersegmentierung führen muss. Darin zeigt sich, dass das Regionswachstum sehr stark<br />
<strong>von</strong> der Initialisierung der Saatpixel abhängt.<br />
(a) (b) (c) (d)<br />
Abbildung 6: Auslaufen <strong>von</strong> Zellregionen in benachbarte Zellen<br />
Man kann schlussfolgern, dass eine hinreichend genaue Zellsegmentierung nur auf Grundlage<br />
der Intensitätswerte eines Muskelfaserschnittes nur schwer möglich ist. Wenn man<br />
die vielen Faktoren in Betracht zieht, die über die Qualität einer Muskelfaserprobe<br />
entscheiden, so muss eine vollautomatische Zellsegmentierung auch mit Faserbildern<br />
arbeiten können, die an vereinzelten Stellen keine optimale Färbung aufweisen. Da dies<br />
auch durch das erweiterte Regionswachstum nicht erreichbar war, musste das Seeded-<br />
Region-Growing um eine Formvergleichs-Komponente erweitert werden.<br />
Phase 4: Formvergleich mit medizinischer Datenbank<br />
In der 4. Phase wird die sich ausbreitende Region einem Formvergleich mit einer Datenbank<br />
unterzogen. Innerhalb dieser Datenbank befinden sich verschiedene Zellformen,<br />
die mit der aktuellen Form der Region verglichen werden. Das Ziel dieses Vergleichs ist<br />
es, untypische Zellformen, die durch eine auslaufende Region oder durch Einschlüsse<br />
im Inneren des Bereichs verursacht werden, zu erkennen. Beim Auslaufen der Region<br />
werden benachbarte Zellen oder Zwischengewebe mitsegmentiert, dies sorgt für eine zelluntypische<br />
Form, die durch den Datenbank-Vergleich erkannt wird. Im weiteren Verlauf<br />
wirkt sich eine geeignete oder ungeeignete Regionsform entsprechend wachstumsförderlich<br />
bzw. hemmend auf die Regionsentwicklung aus.
4.2 Regionswachstum 27<br />
Für die vorliegende Implementierung wurde eine relativ kleine, statistisch also nicht<br />
aussagekräftige Datenbank verwendet. Bei einem praktischen Einsatz muss auf einen<br />
umfangreichen medizinische Datensatz zurückgegriffen werden, der über viele Beispielformen<br />
mit hoher <strong>Segmentierung</strong>squalität verfügt. Details zum genauen Ablauf der<br />
Formvergleiche finden sich in Kapitel(5).<br />
In der schematischen Übersicht (Abb.3) wird deutlich, dass mehrere verschachtelte<br />
Schleifen verwendet werden, um die <strong>Segmentierung</strong> einer Zelle zu erreichen. Die äußere<br />
Schleife wird so oft durchlaufen, wie sich noch geeignete Saatpixel im Bild finden lassen<br />
und es noch unsegmentierte Zellen im Muskelfaserschnitt gibt.<br />
Die Schleife, die Phase 3 (erweitertes Regionswachstum) umschließt, wird insgesamt<br />
k mal ausgeführt, bis der Algorithmus in Phase 4 eintritt (Formvergleich). Für jeden<br />
Durchlauf <strong>von</strong> Phase 3 wird die gesamte Kontur der aktuellen Region einmal abgearbeitet.<br />
Das bedeutet, für einen Durchlauf kann sich die Kontur um maximal einen Pixel<br />
nach außen oder nach innen bewegen oder sie verbleibt auf ihrer aktuellen Position.<br />
Nach k Durchläufen <strong>von</strong> Phase 3 kann sich die Kontur also um k Pixel verschoben haben.<br />
Je nach dem, wie groß k gewählt wird, konvergiert das Verfahren schneller zu einer<br />
Lösung. Problematisch ist hier eine optimale Abschätzung <strong>von</strong> k, da bei einer zu großen<br />
Schrittweite sich unter Umständen keine Konvergenz einstellt bzw. bei einer zu kleinen<br />
Schrittweite man zu viele Iterationen benötigt, um ein zufriedenstellendes Ergebnis zu<br />
erreichen. Die k vielen Schleifendurchläufe der 3. Phase des Algorithmus dienen als ein<br />
künstliches Zeitschrittmaß und erst wenn alle Schleifendurchläufe abgeschlossen sind,<br />
erfolgt eine Formprüfung.<br />
Die dritte Schleife im System beschreibt die Anzahl der Iterationen, die insgesamt<br />
benötigt werden, bis die Zelle vollständig segmentiert ist. Eine Iteration i besteht aus<br />
einem vollständigen Durchlauf der Phase 3 (mit Schleife) und einer Ausführung <strong>von</strong><br />
Phase 4 (Formvergleich). Sobald das <strong>Segmentierung</strong>sergebnis präzise genug ist (Abbruchkriterium),<br />
gilt die Zelle als erkannt und der Algorithmus startet <strong>von</strong> vorn.<br />
4.2 Regionswachstum<br />
Das Regionswachstum im Seeded-Region-Growing erfolgt auf Grundlage einer Zuordnung<br />
<strong>von</strong> Pixeln zum inneren bzw. äußeren Regionsbereich. Die Prüfung, ob ein Pixel<br />
nach innen oder außen zuzuordnen ist, wird durch eine Mittelwertberechnung realisiert,<br />
die vergleichbar mit einem lokalen 2-Means-Clustering ist.
28 4 DER SEEDED-REGION-GROWING ANSATZ<br />
4.2.1 Regionsrepräsentation<br />
Beim Seeded-Region-Growing wird der segmentierte Bereich durch eine <strong>von</strong> einer Kontur<br />
umgebenen Region beschrieben, die mit Hilfe eines Labelingverfahrens wachsen bzw.<br />
schrumpfen kann. Sämtliche Pixel im Inneren des segmentierten Bereichs erhalten ein<br />
positives Label, während alle äußeren Bildpunkte ein negatives Label erhalten. In Abb.<br />
(7a) findet sich eine schematische Darstellung dieser Regionsrepräsentation.<br />
(a) Regionsrepräsentation durch positive / negative<br />
Labels<br />
(b) Nachbarschaft zur Ermittlung der inneren /<br />
äußeren Mittelwerte<br />
Abbildung 7: Zellrepräsentation und Mittelwertberechnung durch Labels<br />
Die Kontur der segmentierten Region, die in Abb.(7) rot eingefärbt ist, wird durch alle<br />
Pixel beschrieben, deren vier Nachbarbildpunkte unterschiedliche Labelvorzeichen haben.<br />
Ein Vorzeichenwechsel bei den Labels der Konturpixel bewirkt eine Veränderung<br />
des Konturverlaufs. Da in der vorliegenden Implementierung eine 4’er Nachbarschaft<br />
genutzt wird, resultiert daraus eine zwei Pixel breite Kontur, mit einer innen und einer<br />
außen verlaufenden Pixellinie. Wird die Nachbarschaft auf einen größeren Bereich<br />
ausgeweitet, hat dies eine breitere Kontur zur Folge, die aber einen höheren Verarbeitungsaufwand<br />
verursacht.<br />
Zum Zweck einer effizienten Implementierung ist es sinnvoll, alle Pixel, die zur aktuellen<br />
Kontur gehören, in einer seperaten Liste zu speichern, die zur Abarbeitung sequentiell<br />
durchlaufen werden kann. Gleichzeitig ist es vorteilhaft, eine Datenstruktur zu verwalten,<br />
die einen direkten Zugriff auf jeden Bildpunkt samt seines Labels ermöglicht.
4.2 Regionswachstum 29<br />
4.2.2 Labeling<br />
Alle Pixel der aktuellen Regionskontur werden sequentiell abgearbeitet. Der Pixel an<br />
erster Position der Kontur-Liste wird ausgelesen und ein Label-Update berechnet. Ist<br />
nach dem Labelupdate die Bedingung für die Konturzugehörigkeit noch erfüllt, verbleibt<br />
der Pixel in der Konturliste, wird aber vom Anfang der Liste entfernt und am<br />
Ende angefügt. Die Liste <strong>von</strong> Konturpixeln wird also wie eine first-in-first-out Struktur<br />
verwaltet.<br />
Die Berechnung des Label-Updates basiert auf einer Mittelwertberechnung für innere<br />
und äußere Pixel. Innerhalb einer Nachbarschaft werden alle vorhandenen Pixel in die<br />
Berechnung einbezogen. In Abb.(7b) wird diese Nachbarschaft als eine 7x7 Pixel große<br />
Region verdeutlicht. Je nach dem, ob ein Konturpunkt näher am inneren oder äußeren<br />
Mittelwert liegt, wird ein positives oder negatives Labelupdate errechnet. Dieses Update<br />
wird auf das bereits vorhandene Label addiert. Je nach den Intensitätswerten im Bild,<br />
kann es zu Vorzeichenänderungen insbesondere bei den außen liegenden Pixeln kommen.<br />
Durch diese Vorzeichenwechsel verändert sich die Lage der Kontur.<br />
Durch die Addition der Labels bei jedem Umlauf zur Konturverarbeitung kann es an<br />
Stellen, an denen die Region ihr Wachstum bereits eingestellt hat, passieren, dass sich<br />
bei jeder Pixelbearbeitung das Label immer weiter aufsummiert. Für diese Konturpunkte<br />
steigt der Betrag des Labels stetig. Um die Beträge nicht zu groß werden zu lassen,<br />
werden die Labels durch ein Intervall [−a, a] begrenzt. Daraus resultierend erhalten<br />
Pixel, die sehr häufig bearbeitet werden, keinen höheren Wert als a bzw. −a. Das festgelegte<br />
Label-Intervall garantiert demnach ein möglichst dynamisches Konturverhalten,<br />
dass Konturveränderungen auch an Stellen ermöglicht, an denen sich die Kontur über<br />
viele Iterationen hinweg kaum verändert hat. Dies wird besonders wichtig, wenn zu<br />
später die Formvergleiche stattfinden.<br />
4.2.3 2-Means-Clustering<br />
Die Berechnung der Labels erfolgt auf Basis der Intensitätswerte eines Pixels. Zur Labelberechnung<br />
für einen Konturpixel p(x, y) benötigt man den inneren Mittelwert µ in (p)<br />
und den äußeren Mittelwert µ out (p). Die Mittelwerte werden über die Nachbarschaftsregion<br />
N p ermittelt, die den Pixel p(x, y) als Zentrum hat und mit ihrer Form ein Quadrat<br />
einer bestimmten Größe beschreibt (siehe Abb. 7b).<br />
N p setzt sich aus den beiden Teilmengen N in und N out zusammen, so dass N p =<br />
N in ∪ N out gilt. N in enthält dabei alle Pixel, die sich innerhalb der wachsenden Region<br />
befinden und N out entsprechend alle Punkte, die außerhalb des Bereichs liegen. Zur Un-
30 4 DER SEEDED-REGION-GROWING ANSATZ<br />
terscheidung der Lage eines Pixels (innen oder außen) wird die Funktion L : Ω ↦→ [−a, a]<br />
verwendet. L(x, y) entspricht einem Zugriff auf das Label eines Pixels (x, y). Ein positives<br />
Label indiziert einen innen liegenden Pixel und ein negatives Label folglich einen<br />
äußeren Punkt. Die am Anfang des Absatzes erwähnten Mittelwerte berechnen sich<br />
durch das Aufsummieren über die jeweilige Teilmenge N in bzw. N out , dividiert durch<br />
die Kardinalität dieser Mengen (siehe Gleichung 4.1).<br />
µ in (p) = 1<br />
‖N in ‖ ·<br />
µ out (p) = 1<br />
‖N out ‖ ·<br />
∑<br />
I(x, y)<br />
(x,y)∈N in<br />
∑<br />
I(x, y)<br />
(x,y)∈N out<br />
(4.1)<br />
Die Berechnung der Mittelwerte erfolgt analog zu einem 2-Means-Clustering. Bei einer<br />
Veränderung des Konturverlaufs ändert sich auch die Zusammensetzung der Teilmengen<br />
N in/out für einen bestimmten Pixel. Mit zunehmender Konturentwicklung passt sich der<br />
Konturverlauf so an, dass eine optimale Zuordnung der Bildpixel in den inneren bzw.<br />
äußeren Bereich stattfindet. Es sei angemerkt, dass diese 2-Means-Klassifikation nicht<br />
zwangsläufig einer optimalen Zellform entsprechen muss.<br />
Anhand der Werte µ in/out wird nun eine Gaußsche Normalverteilung verwendet, um die<br />
Abweichung der Intensität des Pixels p <strong>von</strong> den Mittelwerten zu bestimmen (siehe Gleichung<br />
4.2). Als Erwartungswert µ für die Gaußverteilung werden die vorher berechneten<br />
Mittelwerte µ in bzw. µ out angenommen. Das Ergebnis der beiden Gaußverteilungen p in<br />
und p out ist eine Wahrscheinlichkeitsdichte und dient als ein Maß für die Abweichung<br />
der Intensität <strong>von</strong> p <strong>von</strong> den Mittelwerten. Je weiter die Intensität I(p) vom Mittelwert<br />
µ in/out abweicht, desto kleiner das Resultat <strong>von</strong> p in/out (siehe Abb. 8). Der Wert ǫ in<br />
der Gleichung für p out stellt sicher, dass die Region eher zu einem Wachstum neigt. Für<br />
den Fall, dass die beiden Mittelwerte µ in/out fast identisch sind, sorgt ǫ dafür, dass die<br />
Wahrscheinlichkeitsdichte p in höhere Werte liefert. Daraus resultiert eine leicht erhöhte<br />
Wahrscheinlichkeit, dass ein Pixel (x,y) eher zum inneren Regionsbereich gezählt wird.<br />
p in (p) = √ 1 · exp<br />
(− (I(p) − µ in(p)) 2 )<br />
2πσ 2σ 2<br />
p out (p) = 1 √<br />
2πσ · exp<br />
(<br />
− (I(p) − µ out(p)) 2 + ǫ<br />
2σ 2 ) (4.2)
4.2 Regionswachstum 31<br />
Abbildung 8: Funktionsbilder der Gleichungen aus dem Regionswachstum. (Labelberechnung)<br />
Ausgehend <strong>von</strong> den Wahrscheinlichkeitsverteilungen aus Gleichung (4.2) können wir<br />
nun eine Kostenfunktion E D (c) formulieren, die für eine Zellregion c die Güte des Konturverlaufs<br />
bewertet. Damit die Energiefunktion E D für die Lösung eines Energieminimierungsproblems<br />
geeignet ist, müssen p in und p out negativ logarithmiert werden. Wie<br />
in den Funktionsbildern in Abb. (8) zu sehen ist, erhält man durch Anwendung des negativen<br />
Logarithmus jeweils quadratische Funktionen für p in und p out . Die Gleichungen<br />
für −logp in/out können auch als (I(p) − µ in/out ) 2 approximiert werden.<br />
Wie in Gleichung (4.4) ersichtlich ist, wird auf die logarithmierten Wahrscheinlichkeitsdichten<br />
die Heaviside-Funktion H mit H : R ↦→ 0, 1 angewandt. Die Funktion H(x) ist<br />
eine in der Bildverarbeitung häufig anzutreffende Gewichtungsfunktion, deren mathematische<br />
Definition für in Gleichung 4.3 vorhanden ist.<br />
⎧<br />
⎨<br />
H(x) =<br />
⎩<br />
1 wenn x > 0<br />
0 wenn x ≤ 0<br />
(4.3)
32 4 DER SEEDED-REGION-GROWING ANSATZ<br />
E D (c) = ∑<br />
(x,y)∈Ω c<br />
(H(L c (x, y)) · (− logp in (x, y))+<br />
(1 − H(L c (x, y))) · (− log p out (x, y)))<br />
(4.4)<br />
Die Kostenfunktion E D (c) errechnet eine Summe über alle Pixel der Regionskontur<br />
Ω c . Alle Punkte, die nicht zur Kontur gehören, werden durch E D (c) nicht verrechnet<br />
und haben nur indirekten Einfluss auf das Regionswachstum (durch die MIttelwerte).<br />
E D enthält für jeden Konturpixel (x, y) genau einen Summanden. Liegt der Pixel<br />
(x, y) nun außerhalb unserer Region, so ist sein Label L c (x, y) negativ. Dadurch bildet<br />
die Heaviside-Funktion auf den Wert 0 ab, folglich besteht der Summand für den Pixel<br />
(x,y) nur aus log p out (x, y) ab. Im Umgekehrten Fall, (x, y) liegt innen, reduziert sich der<br />
Summand auf log p in (x, y). Wie bereits festgestellt wurde, sind log p out/in (x, y) quadratische<br />
Funktionen, deren globale Minima genau an den Stellen der Mittelwerte µ out/in<br />
liegen. Desto näherdie Intensität eines Pixels (x, y) am zugehörigen Mittelwert liegt,<br />
desto niedriger ist der entsprechende Summand. Die Summe über alle Konturpunkte<br />
wird also minimal, wenn die enthaltenen Pixel möglichst nah an ihren zugeordneten<br />
Mittelwerten liegen.<br />
Die Energieminimierung wird beim Seeded-Region-Growing durch einen Gradientenabstieg<br />
realisiert. Die Funktionsweise dieser Lösungsmethode wird in Kapitel (5.4) (S.39)<br />
genau erläutert. Dort wird auch die Herleitung zur Gradientenberechnung ∇E D (c) gegeben,<br />
die für das Lösungsverfahren benötigt wird.
33<br />
5 Formwissen-Erweiterung zur Regionsprüfung<br />
Da sich eine korrekte <strong>Segmentierung</strong> der Muskelfaserzellen nicht in allen Fällen nur<br />
auf Basis der Intensitätswert realisieren lässt, ist es notwendig ein Bewertungssystem<br />
für segmentierte Regionen einzubinden, dass dem Auslaufen <strong>von</strong> Zellregionen entgegenwirken<br />
kann. Wie schon erklärt wurde, kann durch das aufwendig modellierte Regionswachstum<br />
aus Kapitel (4) eine Fehlsegmentierung zwar reduziert, aber nicht vollständig<br />
ausgeschlossen werden. Je nach Qualität der <strong>gefärbten</strong> <strong>ATPase</strong> Muskelfaserschnitte,<br />
kann es vereinzelt zur <strong>Segmentierung</strong> vom Zwischengewebe oder benachbarten Zellen<br />
kommen. Um diesen Effekten entgegenzuwirken, wird ein Zellformvergleich mit einer<br />
medizinischen Datenbank vorgenommen.<br />
5.1 Datenbankaufbau<br />
Die für die vorliegende Implementierung verwendete Testdatenbank besteht aus 15 Zellformen.<br />
Jede Beispielform ist durch ein 257x257 Pixel großes Bild repräsentiert, in dem<br />
die Zelle schwarz (Farbwert 0) und der Hintergrund weiß (Farbwert 255) sind. In der<br />
Implementierung wird jedoch nicht mit den erwähnten Itensitäten gerechnet. Stattdessen<br />
wird dem Farbwert 0 das Label 1 zugeordnet, dem Farbwert 255 hingegen das Label<br />
-1. Auf Basis dieser Labelzuordnung kann eine repräsentatitive Distanz zwischen zwei<br />
Zellformen errechnet werden.<br />
Die Zellformen sind im Bildraum so ausgerichtet, dass der Schwerpunkt einer Zelle identisch<br />
mit dem Bildmittelpunkt (129,129) ist. Die Ausrichtung der Zellformen an ihrem<br />
Schwerpunkt ist wichtig, damit zwei zu vergleichende Zellen bei der Ähnlichkeitsberechnung<br />
möglichst deckungsgleich aufeinander passen. Eine Verschiebung der beiden<br />
Formen resultiert in einer Verfälschung des Formvergleichs.<br />
Während die Schwerpunkte der Datenbankformen nur einmalig berechnet werden müssen<br />
und anschließend unverändert bleiben, muss der Schwerpunkt der wachsenden Zellregion<br />
bei jedem Formvergleich neu berechnet werden (wegen möglicher Formveränderungen).<br />
Da sich die Bildräume der Datenbank (Ω DB ) und der Bildraum der Muskelfaserzellen<br />
(Ω) in ihrer Größe unterscheiden, der Schwerpunkt der wachsenden Zelle aber im<br />
Bildraum Ω errechnet wird, muss eine Transformation für die gesamte aktuelle Zellform<br />
stattfinden. Der dafür nötige Translationsvektor transformiert die segmentierte Region<br />
in den Bildraum Ω DB , so dass die Schwerpunkte der Datenbankformen mit dem der<br />
Zellregion übereinstimmen.
34 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />
(a)<br />
(b)<br />
Abbildung 9: Repräsentation <strong>von</strong> 2 Datenbank-Formen mit eingezeíchnetem Schwerpunkt(rot)<br />
5.2 Skalierungsinvarianz<br />
Für die Durchführung eines Formvergleichs ist, neben der Ausrichtung der Zellformen<br />
am Schwerpunkt, auch die Größe der zu vergleichenden Formen <strong>von</strong> Relevanz. Während<br />
die Beispielzellen in der Datenbank einen ähnlichen Flächeninhalt haben, kann die wachsende<br />
Region signifikant kleiner oder größer als die vorhandenen Datenbankformen sein.<br />
Besonders in den ersten Verarbeitungsdurchläufen ist der ermittelte Bereich meist viel<br />
kleiner, als die Bilder der Datenbank. Zu einem späteren Zeitpunkt, wenn das Regionswachstum<br />
fortgeschritten ist oder es eventuell zu Fehlsegmentierungen kommt, ist der<br />
Bereich meist größer als die Beispielformen. Für den Fall, dass eine Zellregion kleiner<br />
als eine Datenbank-Form ist, liefert der Formverlgeich keinerlei Bestrafung. Umgekehrt,<br />
wenn eine Zelle größer als die Trainingsformen wird, so bestraft der Formvergleich diese<br />
Entwicklung und versucht ihr durch eine entsprechende Labelberechnung entgegen zu<br />
wirken. Die Absicht in dieser Modellierung ist klar: Eine Zellform, die an bestimmten<br />
Stellen Zwischengewebe oder benachbarte Zellen mitsegmentiert, soll durch diese Bestrafung<br />
verhindert werden. Wenn aber die Bilddaten im Muskelfaserschnitt besonders<br />
große Zellen beinhalten, die die Größen der Trainingsformen überschreiten, so wird auch<br />
hier der Formvergleich einem weiteren Wachstum entgegenwirken, selbst wenn es auf<br />
Grundlage des Muskelfaserbildes legitim ist.<br />
Es bietet sich also an dieser Stelle an eine Skalierungsinvarianz zu nutzen. Dazu wird<br />
anhand der Flächeninhalte der Datenbankformen (Berechnung des Durchschnitts) und<br />
der Fläche der aktuellen Zellregion ein Skalierungsfaktor ermittelt. Mit Hilfe dieses Skalierungsfaktors<br />
können nun alle Datenbankformen möglichst passend auf die Zellregion
5.3 Parzenschätzer 35<br />
skaliert werden, so dass Größenunterschiede keinen Einfluss mehr auf den Formvergleich<br />
haben.<br />
In den praktischen Tests zum Seeded-Region-Growing hat sich aber gezeigt, dass der<br />
Formvergleich durch Nutzung der Skalierungsinvarianz nicht mehr so effektiv gegen auslaufende<br />
Zellregionen vorgehen kann. Man steht also vor dem Problem, dass ohne Einsatz<br />
der Skalierungsinvarianz untypische Zellformen zwar bestraft werden, gleichzeitig<br />
aber das Regionswachstum ab einer bestimmten Größe behindert wird. Im umgekehrten<br />
Fall kann eine Zelle zwar beliebig groß werden, es wird aber schwerer ungeeignete Zellformen<br />
zu verhindern. Desweiteren sollte durch die Datenbankzellformen keine Bevorzugung<br />
bestimmter Zellgrößen entstehen, sondern lediglich Zellformen bewertet werden.<br />
Schließlich ist ein Ziel der <strong>Segmentierung</strong> <strong>von</strong> Muskelfaserzellen, die Größenverhältnisse<br />
der erkannten Zelltypen zu berechnen. Wenn durch eine Formdatenbank bestimmte<br />
Zellgrößen bevorzugt werden, kann dadurch die Zellgrößenberechnung verfälscht werden.<br />
Eine optimale Lösung für das umrissene Problem lässt sich nicht einfach finden. Grundsätzlich<br />
gilt, dass der Einfluss der Datenbank auf das <strong>Segmentierung</strong>sergebnis immer niedriger<br />
sein sollte, als der Einfluss, der sich aus den Muskelfaserbildern ergibt. Letztlich<br />
sollen die im Faserschnitt vorhandenen Zellen möglichst unverfälscht erkannt und bewertet<br />
werden. Eine Skalierungsinvarianz ist dann sinnvoll, wenn die Flächeninhalte<br />
der Zellregion massiv <strong>von</strong> denen in der Datenbank abweichen. Es sollte also keine generelle<br />
Skalierungsinvarianz angewendet werden, sondern nur in Fällen, wo mit hoher<br />
Wahrscheinlichkeit <strong>von</strong> einer großen Muskelzelle im Faserbild ausgegangen werden kann.<br />
Durch geeignete Gewichtung zwischen dem Ragionswachstum und dem Formvergleich,<br />
in Kombination mit einer partiellen Skalierungsinvarianz bleiben die <strong>Segmentierung</strong>sergebnisse<br />
möglichst unverfälscht und gleichzeitig können immer noch negative <strong>Segmentierung</strong>en<br />
gehemmt werden.<br />
5.3 Parzenschätzer<br />
Zur Modellierung des Formvergleichs ist die Definition eines Ähnlichkeitsmaßes notwendig.<br />
Betrachtet man eine einzelne Datenbankform, so kann das 257x257 Pixel große<br />
Bild auch als ein Punkt in einem 257x257 dimensionalen Raum aufgefasst werden. Statt<br />
einfach die Distanz zwischen verschiedenen Punkten innerhalb dieses Vektorraumes zu<br />
ermitteln und so ein Ähnlichkeitsmaß zu definieren, kann durch Anwendung des Parzenschätzers<br />
ein Ähnlichkeitsmaß definiert werden, dass die Wahrscheinlichkeitsdichte<br />
über alle vorhandenen Datenbankformen in Betracht zieht.
36 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />
Zunächst wollen wir die allgemeine Funktionsweise des Parzenschätzers erläutern, um<br />
im Anschluss genauer auf die Modifikationen einzugehen, die für das Seeded-Region-<br />
Growing vorgenommen wurden. Der Parzenschätzer errechnet eine Wahrscheinlichkeitsdichte<br />
für einen bestimmten Punkt x in einem Raum R d mit n-vielen Datenpunkten x i .<br />
Die Berechnung der Wahrscheinlichkeitsdichte wird durch die Definition eines Parzenfensters<br />
realisiert. Dieses Fenster ist auf unseren Punkt x zentriert und je nach Größe<br />
des Fensters sind entsprechend mehr oder weniger Datenpunkte x i im Fenster vorhanden.<br />
Im Fall der Zellformvergleiche ist der Punkt x als unsere aktuell wachsende Region<br />
zu verstehen. Die Datenpunkte x i sind die in der Datenbank vorhandenen Zellformen.<br />
Zur Definition eines sogenannten Parzenfensters wählen wir uns einen Bereich N x dessen<br />
Mittelpunkt x ist und der sich innerhalb des Raumes R d befindet. N x kann als Hyperkubus<br />
mit den Kantenlänge h(n) interpretiert werden. Durch Variation der Kantenlänge<br />
können wir das so definierte Parzenfenster in seiner Größe verändern und die Ergebnisse<br />
des Parzenschätzers für ein bestimmtes x lenken. Im Idealfall ist die Größe des Parzenfensters<br />
invers abhängig <strong>von</strong> der Anzahl n der vorhandenen Datenpunkte x i im Raum<br />
R d . Das bedeutet: Je mehr Datenpunkte (Trainingsformen) x i im Raum R d vorhanden<br />
sind, desto kleiner kann das Parzenfenster gewählt werden. Aus Gleichung 5.1 wird die<br />
Definition des Volumens des Hyperkubus bzw. Parzenfensters deutlich [dS01].<br />
V (n) = h d (n) (5.1)<br />
Gleichung 5.2 beschreibt eine Funktion ϕ(v), die für einen Punkt/Vektor v ein Gewicht<br />
definiert. Im vorliegenden Fall bildet ϕ(v) lediglich auf die Gewichte 0 und 1 ab und<br />
dient damit als eine Zählfunktion, die für alle Vektoren v deren Betrag kleiner als 0.5 ist,<br />
eine 1 und sonst eine 0 zurück gibt. Wie wir in der nächsten Gleichung sehen werden,<br />
lässt sich dadurch die Anzahl der Datenpunkte x i errechnen, die sich im Parzenfenster<br />
befinden.<br />
⎧<br />
⎨<br />
ϕ(v) =<br />
⎩<br />
1 wenn |v| ≤ 1/2<br />
0 sonst<br />
(5.2)<br />
Die Funktion k(n) aus Gleichung 5.3 ermittelt die Anzahl der Datenpunkte x i , die sich<br />
innerhalb des um x zentrierten Parzenfensters befinden. Für jede vorhandene Traininsgform<br />
x i wird der Vektor (x − x i ) berechnet und durch die Seitenlänge h(n) des<br />
Hyperkubus normiert. Das bedeutet, dass der Betrag des normierten Vektors genau<br />
dann im Intervall [0, 1/2] liegt, wenn sich x i innerhalb des Parzenfensters befindet. Für
5.3 Parzenschätzer 37<br />
einen solchen Fall bildet die aus Gleichung 5.2 bekannte Funktion ϕ(v) auf den Wert 1<br />
ab. Es werden also alle Datenpunkte x i gezählt, die im Parzenfenster liegen.<br />
k(n) =<br />
n∑<br />
( ) x − xi<br />
ϕ<br />
h(n)<br />
i=1<br />
(5.3)<br />
Mit der Anzahl der im Hyperkubus vorhanden Datenpunkte x i kann nun die Kerndichteschätzung<br />
durch den Parzenschätzer vorgenommen werden. Das Resultat <strong>von</strong> p(x, n)<br />
aus Gleichung (5.4) liefert einen hohen Wert, wenn viele Datenpunkte x i im Parzenfenster<br />
um x vorhanden sind, das heißt wenn unser Punkt x zu möglichst vielen Trainingsformen<br />
x i möglichst ähnlich ist. Je weniger Formen x i in der Nähe des Punktes x<br />
vorhanden sind, desto niedriger das Resultat.<br />
p(x, n) = 1<br />
nV (n) ·<br />
n∑<br />
( ) x − xi<br />
ϕ<br />
h(n)<br />
i=1<br />
(5.4)<br />
Die aus Gleichung (5.4) ermittelte Wahrscheinlichkeitsdichte für einen Punkt x, kann<br />
als ideales Maß für die Ähnlichkeit <strong>von</strong> x zu den vorhandenen Trainingsformen x i genutzt<br />
werden. Zur Anwendung auf den Zellformvergleich, müssen aber noch ein paar<br />
Modifikationen vorgenommen werden. Diese betreffen insbesondere die Definition des<br />
Parzenfensters. Der besprochene Hyperkubus wird durch seine Seitenlänge h(n) definiert,<br />
die wiederum <strong>von</strong> der Anzahl n der vorhanden Trainingsformen abhängt. Die<br />
Modellierung des Parzenfensters durch einen Hyberkubus führt aber zu einer strikten<br />
diskreten Trennung zwischen Trainingsformen, die innerhalb des Fensters liegen und<br />
berücksichtigt werden bzw. Formen die außerhalb sind [dS01].<br />
Für einige Anwendungen ist ein solches Modell zwar ausreichend, doch gerade wenn<br />
die Anzahl der Trainingsformen beschränkt ist, ist es wünschenswert eine eher diffuse<br />
Definition des Parzenfensters zu haben. Statt durch den Hyperkubus eine Selektion<br />
unter den vorhandenen Trainingsformen zu forcieren, ist es besser alle Trainingspunkte<br />
zu berücksichtigen und dabei ihre Distanz zum Fenstermittelpunkt in Betracht zu<br />
ziehen. Dies erreicht man, indem die Kernfunktion ϕ als Gaußverteilung angenommen<br />
wird. Diese Modifikation der Gleichung (5.4) wird in der Formel (5.5) gezeigt. Um zu<br />
verdeutlichen, dass es sich in unserer Anwendung um Zellformen handelt, wird statt<br />
der bisherigen allgemeinen Formulierung x <strong>von</strong> nun an c verwendet. Je stärker sich eine<br />
Trainingsform c i <strong>von</strong> der Zellregion c unterschiedet, desto niedriger das Ergebnis der<br />
Gaußverteilung. Es werden jetzt alle vorhandenen Trainingspunkte berücksichtigt und<br />
nicht nur die innerhalb des beschriebenen Hyperkubus.
38 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />
p(c) = 1 n ·<br />
n∑<br />
i=1<br />
( )<br />
exp − d2 (c, c i )<br />
2σ 2<br />
(5.5)<br />
Die Distanz zwischen zwei Zellformen berechnet sich durch d 2 (c, c i ) und ist in Gleichung<br />
(5.6) gegeben. Für jeden Pixel (x, y) ∈ Ω DB wird die Distanz aus den Labels gebildet<br />
und quadriert. Ω DB ist der 257x257 Pixel große Bildraum in dem die Datenbankformen<br />
repräsentiert werden. Je nachdem, ob das Seeded-Region-Growing nun mit einer Skalierung<br />
der Trainingsformen arbeitet oder nicht, kann der Bildraum Ω DB auch kleiner oder<br />
größer der genannten Ausdehnung sein. Die einzelnen Einträge der Vektoren c bzw. c i ,<br />
entsprechen den einzelnen Pixeln im Datenbankbildraum und ermöglichen einen Zugiff<br />
auf Labels, die die Zellform beschreiben. Der Zugriff auf das Labeling wird durch<br />
L : Ω DB ↦→ −1, 1 realisiert, so dass ein Label <strong>von</strong> −1 einen außerhalb der Zellform liegenden<br />
Pixel (x, y) anzeigt. L(x, y) = 1 entspricht einem innen liegenden Punkt. L(x, y)<br />
ist an dieser Stelle nicht mit den Labels aus dem Bildraum des Muskelfaserschnittes Ω<br />
zu verwechseln.<br />
d 2 (c, c i ) =<br />
∑<br />
(L c (x, y) − L ci (x, y)) 2 (5.6)<br />
(x,y)∈Ω DB<br />
Aus Gleichung 5.5 wird deutlich, dass die Größe des Parzenfensters nun durch die<br />
Standardabweichung σ gesteuert wird. Wie auch in der allgemeinen Definition des Parzenschätzers<br />
ist es besonders wichtig einen geeigneten Wert für σ zu wählen.<br />
σ sollte so gewählt werden, dass die Gaußverteilung für einen bestimmte Trainingsform<br />
c i (der Erwartungswert) möglichst die am nächsten gelegenen anderen Zellformen miteinschließt.<br />
In [dS01] wird eine Standardabweichung <strong>von</strong> σ = 1/ √ n vorgeschlagen, die<br />
als Initialisierung verwendet und im späteren Verlauf optimiert werden kann. Hierbei ist<br />
n die Anzahl der vorhandenen Trainingsformen. Bei anderen <strong>Segmentierung</strong>sverfahren<br />
wurden ebenfalls Kerndichteschätzungen verwendet, um <strong>Segmentierung</strong>sergebnisse mit<br />
bestimmten Trainingsformen zu vergleichen. Die praktischen Tests haben gezeigt, dass<br />
für das Seeded-Region-Growing der <strong>von</strong> Cremers, Osher und Soatto vorgeschlagenen<br />
Ansatz zur Abschätzung <strong>von</strong> σ besonders geeignet ist. Die Abschätzung erfolgt über<br />
die durchschnittliche Distanz jeder Trainingsform zu ihrem nächsten Nachbarn. Mathematisch<br />
ausgedrückt ergibt sich die Formel aus Gleichung (5.7). Es wird also für jede<br />
Trainingsform c i der nächste Nachbar c j ermittelt, der folglich die kürzeste Distanz zu<br />
c i hat. Über diese Distanzen wird anschließend gemittelt [COS06].
5.4 Gradientenabstieg 39<br />
σ 2 = 1 n ·<br />
n∑<br />
i=1<br />
min<br />
i≠j d2 (c i , c j ) (5.7)<br />
Aus den bis hierher erläuterten Gleichungen (5.5 - 5.7) können wir nun eine auf Formwissen<br />
basierte Energiefunktion aufstellen. Die Energiefunktion E v (v für Vorwissen)<br />
wird, wie in Gleichung (5.8) zu sehen ist, negativ logarithmiert. Dies dient der Optimierung<br />
der Energiefunktion für das später angewandte Lösungsverfahren.<br />
E v (c) = − log(p(c)) (5.8)<br />
Die Energiefunktion des Regionswachstums E D (siehe Gleichung 4.4), die auf den Bilddaten<br />
des Muskelfaserschnittes beruht, und die gerade beschriebene Energiefunktion<br />
Ev, die auf dem Vorwissen über mögliche Zellformen basiert, können nun zu einer gemeinsamen<br />
Kostenfunktion E kombiniert werden (siehe Gleichung 5.9). Die Parameter<br />
α und β dienen der Gewichtung zwischen den beiden Energiefunktionen. Da E D und E v<br />
beim zunehmendem Wachstum der Zellregion c gegenläufige <strong>Segmentierung</strong>sziele verfolgen,<br />
ist es nun notwendig dieses Energieminimierungsproblem zu lösen (siehe Kapitel<br />
3.3). E D wird minimal, wenn sich die Zellkontur ideal an den Intensitätswerten im Bild<br />
ausrichtet, während E v für eine Zellform minimal wird, die möglichst nah an den vorgegebenen<br />
Trainingsformen liegt. Man sucht eine Zellform c für die hier ein optimaler<br />
Kompromiss gefunden wird.<br />
E(c) = α · E v (c) + β · E D (c) (5.9)<br />
5.4 Gradientenabstieg<br />
Ausgehend <strong>von</strong> Gleichung (5.9) können wir nun einen Gradientenabstieg durchführen,<br />
um das formulierte Energieminimierungsproblem zu lösen. In Gleichung (5.10) wird<br />
das Vorgehen bei diesem iterativen Lösungsweg verdeutlicht. Unsere wachsende Region<br />
c fassen wir als einen Punkt im Raum R d auf. Für d = 257 · 257 umfasst R d alle<br />
möglichen Formausprägungen, die auf einem Bildraum der Größe 257x257 durch binäre<br />
Formdefinition beschreibbar sind.<br />
In Bezug auf das Iterationsschema aus Gleichung (5.10) können wir für den Punkt c alt<br />
die Kostenfunktion E(c alt ) auswerten. E(c alt ) bewertet die Güte unserer Region und ist<br />
umso kleiner, je besser c alt unseren zwei Modellannahmen E D und E v genügt. Berechnen<br />
wir nun den Gradienten <strong>von</strong> E(c alt ), so zeigt dieser wie gewohnt in Richtung des höchs-
40 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />
ten Dichteanstiegs und weißt so zu den Zellformen in R d , für die unsere Kostenfunktion<br />
am stärksten ansteigen würde und die somit unerwünschte <strong>Segmentierung</strong>sergebnisse<br />
darstellen.<br />
Da der Gradient ∇E(c alt ) ein Vektor ist und auch unser Punkt c alt als ein Ortsvektor<br />
im Raum R d interpretiert werden kann, ist es durch die Subtraktion beider Vektoren<br />
möglich, einen Punkt c neu zuermitteln, für den die Kostenfunktion E(c neu ) kleiner wird<br />
und somit c neu ein besseres <strong>Segmentierung</strong>sergebnis ist. Nach Ausführung der Gleichung<br />
(5.10) gilt also: E(c neu ) < E(c alt ). Wir können so iterativ eine Lösung c ermitteln, die<br />
sich schrittweise immer näher zu einer lokal optimalen Lösung entwickelt.<br />
c neu = c alt − ∇E(c alt ) (5.10)<br />
Um den Gradienten <strong>von</strong> E(c alt ) zu berechnen, benötigen wir die partiellen Ableitungen.<br />
Da c alt auch als Vektor der Form c alt = (c (0,1) c (0,2) · · · c (x,y) · · · c (257,257) ) T geschrieben<br />
werden kann, können wir entsprechend die Kostenfunktion umformulieren als<br />
E(c alt ) = E((c (0,1) c (0,2) · · · c (x,y) · · · c (257,257) ) T ). Die Komponenten des Gradienten<br />
und somit die partiellen Ableitungen werden durch ∂E(c)<br />
∂c (x,y)<br />
definiert. Durch Einsetzen<br />
der Energiefunktionen E D und E v in die Komponenten des Gradienten ∇E(c) ergibt<br />
sich, dass man entsprechend die Gradienten ∇E D und ∇E v berechnet, die anschließend<br />
komponentenweise summiert werden (siehe Gleichung 5.11). Durch die bereits<br />
eingeführten Gewichte α und β erfolgt letztlich eine Skalierung der beiden Gradienten.<br />
Das heißt unser vorläufiges Ergebnis c alt kann sich, je nach Ausprägung der Gewichte,<br />
stärker dem einen <strong>Segmentierung</strong>sziel (E v ) oder dem Anderen (E D ) annähern.<br />
∇E(c) = α · ∇E v (c) + β · ∇E D (c) (5.11)<br />
Wie aus Gleichung (5.11) hervorgeht, müssen die Gradienten für E v (c) und E D (c) errechnet<br />
werden. Zunächst soll dazu die Herleitung für ∇E v (c) erfolgen. Im Anschluss<br />
wird dann die Herleitung des Gardienten für E D (c) präsentiert. In Gleichung (5.8) wurde<br />
E v (x) = −log(p(c)) definiert. Da die Komponenten des Gradienten aus den partiellen<br />
Ableitungen bestehen, können wir anhand der Ableitung E v ′ (c) = −p′ (c)/p(c) mit der<br />
Berechnung fortfahren. Schlussfolgernd aus E v ′ erhalten wir Gleichung (5.12), in der<br />
gezeigt wird, dass man den Gradienten ∇p(c) berechnen muss, um ∇E v (c) zu erhalten.<br />
∇E v (c) = − ∇p(c)<br />
p(c)<br />
(5.12)
5.4 Gradientenabstieg 41<br />
Zur Berechnung des Gradienten <strong>von</strong> p(c) aus Gleichung (5.12) benötigen wir die erste<br />
Ableitung p ′ (c), um auf die partiellen Ableitungen zu schließen. In Gleichung (5.13)<br />
werden die Formeln für p(c), p ′ (c) und daraus folgend ∇p(c) vorgestellt.<br />
p(c) = 1 n ·<br />
p ′ (c) = 1 n ·<br />
∇p(x) = 1 n ·<br />
n∑<br />
i=1<br />
n∑<br />
i=1<br />
n∑<br />
i=1<br />
( )<br />
exp − d2 (c, c i )<br />
2σ 2<br />
(<br />
exp − d2 (c, c i )<br />
)<br />
·<br />
2σ 2<br />
( )<br />
exp − d2 (c, c i )<br />
·<br />
2σ 2<br />
(<br />
− d2 ′ )<br />
(c, c i )<br />
2σ 2<br />
( )<br />
− ∇d2 (c, c i )<br />
2σ 2<br />
(5.13)<br />
Aus der letzten Zeile der oberen Gleichung ist ersichtlich, dass wir den Gradienten <strong>von</strong><br />
d 2 (c, c i ) berechnen müssen, um letztlich ein Ergebnis zu erhalten. In Formel (5.14) wird<br />
zuerst die Ableitung d 2 ′ (c, c i ) vorgestellt, um dann den Gradienten und die partielle<br />
Ableitung zu erläutern.<br />
d 2 (c, c i ) =<br />
∑<br />
(L c (x, y) − L ci (x, y)) 2<br />
(x,y)∈Ω DB<br />
d 2 ′ (c, c i ) =<br />
∑<br />
2 · (L c (x, y) − L ci (x, y))<br />
(x,y)∈Ω DB<br />
( ∂d<br />
∇d 2 2 (c, c i )<br />
(c, c i ) =<br />
∂L c (0, 0) · · · ∂d 2 (c, c i )<br />
∂L c (x, y) · · · ∂d 2 (c, c i )<br />
∂L c (257, 257)<br />
∂d 2 (c, c i )<br />
∂L c (x, y) = 2 · (L c(x, y) − L ci (x, y))<br />
) T<br />
(5.14)<br />
Abschließend kann gesagt werden, dass durch die Gradientenabstiegsberechnung für<br />
jeden Pixel innerhalb des Bildraumes Ω DB ein Label berechnet wird. Die Labeluppdates<br />
müssen wieder in den Bildraum des Muskelfaserschnitts Ω transformiert werden, um<br />
dort auf die richtigen Pixel aufsummiert zu werden.<br />
Es verbleibt die Herleitung des Gradienten für die Kostenfunktion E D (c). Analog zur<br />
Gradientendefinition <strong>von</strong> E v (c) gilt auch für ∇E D (c), dass sich die Komponenten des<br />
Gradienten aus den partiellen Ableitungen nach L(x, y) zusammensetzen. Dadurch,<br />
dass die Mittelwerte µ in und µ out vom jeweiligen Konturverlauf abhängen, müssten<br />
bei der partiellen Ableitung des Gradienten auch die Wahrscheinlichkeitsdichtefunktio-
42 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />
nen p in und p out berücksichtigt werden. Zur Vereinfachung wird diese Abhängigkeit im<br />
Gradientenabstieg nicht berücksichtigt. Durch diese Vereinfachung muss bei der Ableitung<br />
der Energiefunktion E D (c) aus Gleichung (5.15) lediglich die Heaviside-Funktion<br />
berücksichtigt werden (siehe Gleichung 5.16).<br />
E D (c) = ∑<br />
(H(L c (x, y)) · (− log p in (x, y))+<br />
(x,y)∈Ω c (5.15)<br />
(1 − H(L c (x, y))) · (− logp out (x, y)))<br />
E D ′ (c) = ∑<br />
(x,y)∈Ω c<br />
H ′ (L c (x, y)) · (− log p in (x, y) + log p out (x, y)) (5.16)<br />
Aus der Ableitung E D ′ (c) können wir nun schlussfolgern, dass sich ∇E D (c) aus dem<br />
Gradienten <strong>von</strong> H(L(x, y)) berechnet (siehe Gleichung 5.17).<br />
∇E D (c) = ∇H(L c (x, y)) · (− logp in (x, y) + log p out (x, y))<br />
(<br />
) T<br />
∂H(L(x, y))<br />
∇H(L(x, y)) = · · · · · ·<br />
(5.17)<br />
∂L(x, y)<br />
∀(x, y) ∈ Ω c<br />
Gradientenvektor <strong>von</strong> H(L(x, y)) enthält als Einträge die partiellen Ableitungen <strong>von</strong><br />
H(L(x, y)). Da die Heaviside-Funktion eigentlich nicht differenzierbar ist, muss man<br />
zur Berechnung der Ableitung eine Approximation für H annehmen. Dazu wird eine<br />
Funktion δ (Dirac-Stoß) eingeführt, unter der Annahme, dass δ(x) = H ′ (x) gilt. Durch<br />
diese Vereinfachung ist es nun möglich eine nummerische Approximation <strong>von</strong> H(x) zu<br />
erhalten, die differenzierbar ist. Eine elegante Vorgehensweise wird dafür in [CV01]<br />
gegeben, wobei die dort vorgeschlagene Approximation <strong>von</strong> H(x) in Gleichung (5.18)<br />
aufgeführt ist.<br />
H ǫ (x) = 1 2<br />
(<br />
1 + 2 π arctan ( x<br />
ǫ) ) (5.18)<br />
Mit Hilfe der Gradienten für E D und E v kann der Gradientenabstieg durchgeführt werden.<br />
Ein Unterschied zwsichen den beiden Herleitungen wirkt sich aber besonders auf<br />
die Implementieruung aus. Während für die Berechnung <strong>von</strong> ∇E v Labels im Bildraum<br />
Ω DB verrechnet werden, wird bei ∇E D lediglich auf dem Bildraum Ω c gearbeitet. Die
5.5 Parameter des Seeded-Region-Growing 43<br />
beiden Räume unterscheiden sich in der Form, dass Ω c nur Pixel der Regionskonutr<br />
enthält, Omega DB hingegen alle Pixel des Datenbankbildraumes umfasst. Damit die<br />
aus dem Formvergleich stammenden Labels sich nicht auf Bildbereiche auswirken, die<br />
für das aus E D erzeugte Labeling nicht beeinflussbar sind, werden die Labelupdates<br />
für beide Energien nur für das sogenannte Narrow-Band, also die Regionskontur aufsummiert.<br />
Dadurch, dass die Labelupdates der beiden Energiefunktionen unabhängig<br />
<strong>von</strong>einander ausgeführt werden und dies unterschiedlich häufig passiert, müssen die<br />
Gradienten entsprechend skaliert werden.<br />
5.5 Parameter des Seeded-Region-Growing<br />
Im folgenden Kapitel wird sich eine Betrachtung über die verschiedenen Parameter<br />
des Seeded-Region-Growings anschließen. Wie wir in den vorangegangenen Abschnitten<br />
gesehen haben, gibt es sehr viele Werte, die den Ablauf des Algorithmus signifikant<br />
beeinflussen. Es ist daher sinnvoll einen Überblick über die <strong>Segmentierung</strong>sergebnisse<br />
bei bestimmten Parametereinstellungen zu geben und die Bedeutung und Auswirkungen<br />
bestimmter Parameter explizit zu erläutern. Die nachfolgende Liste zählt die wichtigsten<br />
Parameter vom Seeded-Region-Growing Ansatz auf und erklärt deren Auswirkungen auf<br />
das <strong>Segmentierung</strong>sergebnis einer Zelle.<br />
• Zeitintervall / Konturdurchläufe (k)<br />
k beschreibt die Anzahl der Abarbeitungen der Kontur. In jedem Abarbeitungszyklus<br />
wird die aktuelle Regionskontur einmal durchlaufen und für jeden Pixel wird<br />
ein Regionswachstumstest (siehe Gleichung 4.2 und 4.4) durchgeführt. Sind k-viele<br />
Zyklen durchlaufen (siehe auch Abb. 3) erfolgt ein Formvergleich. Die Wahl des<br />
Paramters k beeinflusst die Zeitabstände in denen ein Formvergleich stattfindet.<br />
Ein sehr niedriges k sorgt für häufige Formvergleiche. Erfolgen die Datenbankabgleichungen<br />
in kurzer zeitlicher Folge, so garantiert dies eine ständige Kontrolle der<br />
wachsenden Zellregion, steigert aber auch den Rechenaufwand. Die wachsende Region<br />
hat zwischen den Vergleichen kaum Zeit ihre Form signifikant zu verändern.<br />
Gerade bei großen Formdatenbanken können zu häufige Formvergleiche sehr viel<br />
Rechenaufwand nach sich zeihen und so die <strong>Segmentierung</strong> verlangsamen.<br />
Sind die Zeitabstände k für die Formvergleiche zu groß gewählt, so ist es möglich,<br />
dass der Algorithmus nicht die optimale Kontur ermitteln kann, weil der Formvergleich<br />
zu selten stattfindet und im Gegenzug das Regionswachstum auf Basis<br />
der Bilddaten dominiert. Ein weiterer Faktor bei der Wahl des Parameters k
44 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />
ist eine Abstimmung auf die Gewichtung der Datenbanklabels (α).Bei häufigen<br />
Datenbankvergleichen sollte α verkleinert werden, im umgekehrten Fall ist eine<br />
Vergrößerung angemessen.<br />
• Regionsgröße (N p und N s )<br />
Wie in Kapitel (4.2.3) erläutert wurde, erfolgt das Regionswachstum auf Grundlage<br />
der Intensitätswerte im Muskelfaserbild. Der Parameter N p definiert die Größe<br />
einer Nachbarschaftsregion um einen Pixel p. Innerhalb dieser Region werden alle<br />
Pixel anhand ihrer Labels in zwei Klassen unterteilt: Innerhalb bzw. außerhalb<br />
der Region. Für jede dieser Teilmengen, die wir mit N in und N out bezeichnet<br />
hatten, wird ein Mittelwert µ in/out errechnet. Auf Basis dieser Mittelwerte erfolgt<br />
dann eine Klassifizierung des Pixels p. Je größer man die Nachbarschaft N p wählt,<br />
desto großflächiger werden die Intensitätsinformationen in eine Klassifikation <strong>von</strong><br />
p einbezogen. Markante Intensitätsänderungen im Bildraum (z.B. durch Zellzwischengewebe)<br />
wirken sich beim Wachstum der Region früher auf die Mittelwerte<br />
aus, als wenn die betreffende Nachbarschaft N p sehr klein ist. Nachteilig an einer<br />
möglichst großen Nachbarschaft ist aber ein quadratisch ansteigender Rechenaufwand<br />
bei der Mittelwertbildung. Während bei einer 10x10 Pixel großen Region<br />
über 100 Pixel gemittelt werden müssen, sind es bei einer Region <strong>von</strong> 20x20 Pixeln<br />
bereits 400 Bildpunkte. Wie wir im Kapitel (6) sehen werden, kann gerade<br />
die erwähnte Mittelung über Nachbarschaftsregionen weitaus effizienter erfolgen,<br />
als in der vorliegenden Implementierung. Hier hat die Region N p eine Größe <strong>von</strong><br />
30x30 Pixeln. Die Region N s ist mit N p vergleichbar und beschreibt einen Suchraum<br />
in dem die Gültigkeit eines Saatpixels bewertet wird. Je nach Regionsgröße<br />
und dem Threshold θ können die Rückweisungsraten <strong>von</strong> zufällig gewählten Saatpixeln<br />
erhöht oder verringert werden. Je kleiner N s , desto unwahrscheinlicher ist<br />
eine Rückweisung eiens Pixels.<br />
• Standardabweichung (σ)<br />
Je nach Größe <strong>von</strong> σ ergibt sich eine stärkere oder schwächere Streuung der Normalverteilung.<br />
Je größer σ ist, desto breiter streut die Normalverteilung um den<br />
Erwartungswert µ. Wenn die Standardabweichung zu klein gewählt wird, kann im<br />
Fall der Formvergleiche die Normalverteilung keine anderen Datenbank-Formen<br />
miteinschließen. Dies ist für eine Berechnung der Labels ungünstig. Es sollten<br />
sowohl für das Regionswachstum, als auch für die Formvergleiche seperate Standardabweichungen<br />
verwendet werden. Eine gute Annahme für σv 2 (E v) ist der in<br />
Gleichung (5.7) präsentierte Ansatz.
5.5 Parameter des Seeded-Region-Growing 45<br />
• DB-Gewichtung (α)<br />
Der Skalierungsfaktor α verstärkt bzw. vermindert den Einfluss, den die Formvergleiche<br />
auf die Labelentwicklung haben. Wird α zu klein gewählt, so ist der<br />
Einfluss der Datenbankvergleiche möglicherweise zu gering und das auf den Bildinformationen<br />
basierte Regionswachstum dominiert das <strong>Segmentierung</strong>sergebnis.<br />
Ist hingegen α zu groß gewählt, hat die Datenbank zu viel Einfluss auf die <strong>Segmentierung</strong><br />
und behindert das Regionswachstum, so dass das <strong>Segmentierung</strong>sergebnis<br />
sich mehr den Datenbankformen annähert, als sich an den Bilddaten im Muskelfaserschnitt<br />
zu orientieren.<br />
• Bildgewichtung (β)<br />
Der Skalierungsfaktor β hat die gleichen Auswirkungen auf die <strong>Segmentierung</strong>, wie<br />
der Faktor α. Eine Abstimmung beider Werte ist notwendig, damit sich Formvergleich<br />
und Regionswachstum gut miteinander ergänzen. In den vorhanden Bespielbildern<br />
(??) wurde zum Beispiel mit den Werten α = 1000 und β = 1 gearbeitet.<br />
• Labelinterval ([−a, a])<br />
Wie im Abschnitt 4.2.2 bereits erklärt wurde, sind die Labels beim Seeded-Region-<br />
Growing auf ein Intervall [−a, a] beschränkt. Ziel dieser Begrenzung ist es, dass<br />
sich an bestimmten Stellen der Kontur die Labels nicht zu stark in eine Richtung<br />
entwickeln können. An Stellen, wo die Kontur vorerst eine feste Position<br />
eingenommen hat, summieren sich die Labels stark in eine Richtung (positiv bzw.<br />
negativ). Es hat sich gezeigt, dass das Labelinterval so gewählt werden sollte, dass<br />
das Labelupdate der Formvergleiche, innerhalb des Labelintervals liegt. Dadurch,<br />
dass die Formvergleiche seltener stattfinden, als Berechnungen zum Regionswachstum,<br />
müssen die Labelupdates aus dem Datenbankvergleich meist höher gewichtet<br />
werden. Dadurch ergeben sich aber Labelwerte, die merklich größer sind, als<br />
die Labels aus dem Regonswachstum. Sollte das Labelintervall zu klein gewählt<br />
werden, wird damit auch der Einfluss der Formvergleiche stark beschränkt. Ein<br />
Intervall <strong>von</strong> [−20, 20] bzw. [−40, 40] liefert gute <strong>Segmentierung</strong>sergebnisse. Je<br />
nach Initialisierung der außenliegenden Labels, ergibt sich ein schnelles oder verlangsamtes<br />
Regionswachstum. Wird der Bildraum Ω zu Beginn mit L = −20<br />
definiert, verlangsamt sich das Wachstum, da die Labelupdates aus dem Regionswachstum<br />
(E D ) den hohen Betrag der Labelinitialisierung abarbeiten müssen.<br />
Eine Labelinitialisierung <strong>von</strong> L = −1 sorgt hingegen für ein schnelles Wachstum,<br />
da die Labelupdates aus E D schneller einen Vorzeichenwechsel erzeugen können.
46 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG<br />
• Threshold (θ)<br />
Der Threshold θ wird zunächst für die Bewertung der zufällig erzeugten Saatpixel<br />
verwendet. Im weiteren Ablauf des Algorithmus wird θ auch als Threshold<br />
für die Regionsinitialisierung genutzt (siehe Abb. 3). Ein kleiner Threshold beschränkt<br />
die Regionsinitialisierung und sorgt für eine hohe Rückweisungsrate bei<br />
den zufälligen Saatpixeln. Wird θ groß gewählt, ist die Initialisierung der Region<br />
unbeschränkt. Es kann dann leichter zu einer Überschreitung der Faserzelle kommen.<br />
Ebenso steigt die Gültigkeitsrate für die Saatpixel, was im ungünstigen Fall<br />
zu Saatpunkten führen kann, die sehr nah an Zellrändern oder im Zwischengewebe<br />
liegen. Wie in Abschnitt 4 erläutert, wirken sich diese Effekte ungünstig auf<br />
die <strong>Segmentierung</strong> aus. In den <strong>Segmentierung</strong>stests zum Seeded-Region-Growing<br />
hat sich ein Threshold <strong>von</strong> θ ≈ 30 bewährt.<br />
• Offset (ǫ)<br />
Der Offset ǫ dient der Unterstützung des Regionswachstums. Dadurch wird eine<br />
generelle Wachstumsbewegung der Region erzwungen, die aber bereits durch<br />
kleine Intensitätsschwellen gestoppt werden kann. ǫ sollte nicht zu groß gewählt<br />
werden, bei den praktischen Tests hat sich ein Wert <strong>von</strong> 0.5 bewährt.
47<br />
6 Fazit<br />
Im sich anschließenden letzten Abschnitt sollen die <strong>Segmentierung</strong>sergebnisse, die durch<br />
das Seeded-Region-Growing erreicht werden können präsentiert und besprochen werden.<br />
6.1 <strong>Segmentierung</strong>sergebnisse<br />
Die in Abb.(15) dargestellte Bildserie ist Teil der Abbildungen (10)-(14), die im Anhang<br />
zu finden sind. Die Bildreihen entstammen einem vollautomatischen Testdurchlauf des<br />
Seeded-Region-Growings. Die jeweils 8 Entwicklungsschritte des Zellwachstums stellen<br />
lediglich die einzelnen Stadien der Zellregion bei Ausführung eines Formvergleichs dar.<br />
Abbildung 10: 12 Iterationen<br />
Die vom Algorithmus vollautomatisch ermittelte endgültige Zellkontur ist jeweils im<br />
letzten Bild rot eingefärbt. Da zur Ermittlung dieser Kontur für jede Zelle unterschiedlich<br />
viele Iterationen benötigt wurden, findet sich in der Bildunterschrift jeweils eine<br />
Angabe, wie häufig ein Formvergleich ausgeführt wurde, bis die <strong>Segmentierung</strong> abgeschlossen<br />
war. Zur Berechnung der Konturen wurde das Seeded-Region-Growing mit<br />
folgenden Parametereinstellungen ausgeführt: k = 10, θ = 30, N s = 20x20 Pixel, N p =<br />
30x30 Pixel, ǫ = 0.5, σ D = 10, σv 2 = 28000, Labelintervall[−40, 40], α = 10, β = 0.75.<br />
6.2 Qualität und Effizienz der <strong>Segmentierung</strong><br />
Wie man in der Bilderreihe in Abb.(10) und weiteren Bildern im Anhang in Abb.(11) -<br />
(15) erkennen kann, erreicht das Seeded-Region-Growing in Bereichen, wo das Zellzwi-
48 6 FAZIT<br />
schengewebe größenteils deutlich zu erkennen ist und sich die vorhandene Zellform nicht<br />
zu stark <strong>von</strong> denen in der Datenbank unterscheidet, sehr gute <strong>Segmentierung</strong>sergebnisse.<br />
Desweiteren erreicht der hier präsentierte Ansatz gute <strong>Segmentierung</strong>sergebnisse für<br />
Zellen mit sehr wechselhaften Intensitätswerten, wie zum Beispiel im Bild (10 bzw. 11).<br />
Es lässt sich daraus schlussfolgern, dass der präsentierte Ansatz auch bei Bildstörungen<br />
wie Verrauschungen oder Fehler bei den Färbeprozessen für <strong>ATPase</strong> gute <strong>Segmentierung</strong>sergebnisse<br />
liefern kann. Die Qualität der vom Seeded-Region-Growing ermittelten<br />
Zellkonturen hängt <strong>von</strong> dem jeweiligen Zelltyp und seiner Färbung im Bild ab. Dunkel<br />
gefärbte Zellen können zumeist sehr gut erkannt werden und liefern präzise Konturen.<br />
Mittel stark gefärbte Zellen werden trotz Helligkeitsunterschieden im Inneren der<br />
Zellen relativ gut erkannt. Einschlüsse innerhalb eines segmentierten Bereiches treten<br />
zwar auf, werden aber im weiteren Ablauf des Algorithmus durch den Formvergleich<br />
als ungeeignet erkannt und korrigiert.<br />
Bei kritischen Bildregionen, in denen das Zellzwischengewebe partiell nicht sichtbar<br />
ist, kann ein leichtes Auslaufen <strong>von</strong> der Zellregion nicht verhindert werden. Durch eine<br />
möglichst optimale Gewichtung zwischen dem Formvergleich und dem Regionswachstum,<br />
können diese Effekte aber vermindert werden. Als negativ ist hier die große Anzahl<br />
an Parametern zu erwähnen, die die Qualität einer Zellsegmentierung durch das<br />
Seeded-Region-Growing beeinflussen. Es ist dadurch sehr schwer durch Feldversuche<br />
eine optimale Parametereinstellung festzulegen.<br />
6.3 Bestehende Probleme<br />
Das Hauptproblem des Seeded-Region-Growings ist der enorme Berechnungsaufwand,<br />
der sich aus dem 2-Means basierten Regionswachstum ergibt. Für jeden Konturpixel<br />
muss eine Nachbarschaft durchgearbeitet werden, um die inneren und äußeren Mittelwerte<br />
zu erhalten. Bei einer Konturlänge <strong>von</strong> 2000 Pixeln und bei einer Nachbarschaftsgröße<br />
<strong>von</strong> 30x30 Pixeln müssen 30 · 30 · 2.000 = 1.800.000 Pixel verarbeitet werden, um<br />
einen Konturumlauf zu realisieren. Da sich die 30x30 Nachbarschaften bei benachbarten<br />
Konturpunkten zu einem Großteil überschneiden und somit mehrfach verrechnet werden,<br />
gibt es hier viel Potential den Rechenaufwand zu verringern. In der vorliegenden<br />
Implementierung werden diese Überlappungen noch nicht berücksichtigt.<br />
Ein kritischer Punkt beim Seeded-Region-Growing ist die Initialisierung der Saat-Pixel.<br />
Die Position dieser Punkte kann die Qualität der <strong>Segmentierung</strong> stark beeinflussen, so<br />
dass sie dementsprechend sorgfältig ausgewählt werden müssen.
6.4 Weiterführende Entwicklung 49<br />
6.4 Weiterführende Entwicklung<br />
Die weiterführende Entwicklung des Seeded-Region-Growing sollte sich mit der Lösung<br />
der erwähnten Hauptprobleme beschäftigen. Zum Einen wäre eine effizientere Berechnung<br />
der inneren und äußeren Mittelwerte zu nennen, so dass die starke Überlappung<br />
der Nachbarschaftsbereiche für eine schnellere Berechnung ausgenutzt wird. Es ist angedacht,<br />
die <strong>von</strong> [PRT07] und [BC08] vorgeschlagenen Beschleunigungstechniken zur<br />
Gaußfilterung zu verwenden, um die Komplexität des Seeded-Region-Growings maßgeblich<br />
zu verringern. Die Beschleunigungstechnik basiert auf der Idee, dass eine Mittelung<br />
über eine bestimmte Pixelnachbarschaft äquivalent zu einer Gaußfilterung mit<br />
einem bestimmten σ ist. Das gesamte Muskelfaserbild bzw. der relevante Ausschnitt<br />
wird pixelweise über eine Nachbarschaft geglättet, die dem verwendeten Suchfenster<br />
bei der Mittelwertberechnung entspricht. Dieser Filtervorgang wird getrennt für den<br />
inneren Regionsbereich und den äußeren Bereich durchgeführt. Durch eine effiziente<br />
Implementierung des Glättungsfilters, zum Beispiel Boxfilterung oder iterative Filter,<br />
kann die Glättung für jeden Pixel schneller ausgeführt werden.<br />
Weitere Entwicklungen betreffen eine Bewertung der <strong>Segmentierung</strong> unter Ausnutzung<br />
<strong>von</strong> Farbinformationen, die in den <strong>ATPase</strong>-Schnitten ursprünglich vorhanden sind, im<br />
vorliegenden Fall aber nciht berücksichtig wurden. Dadurch könnten Fehlsegmentierungen<br />
an manchen Stellen unter Umständen reduziert werden.<br />
Es bleibt zu testen inwieweit eine automatische Rotationsausrichtung der wachsenden<br />
Region an den Datenbankformen bessere Ergebnisse oder schnellere Berechnungen liefert.<br />
Eine Möglichkeit für eine Rotationsausrichtung der Regionsform wird in [COS06]<br />
gegeben.
50 7 ANHANG<br />
7 Anhang<br />
Die alle für die Testdurchläufe verwendeten Muskelfaserschnitte wurden vom Institut<br />
für Neuropathologie der Universität Saarland in Homburg / Saar zur Verfügung gestellt.<br />
Abbildung 11: 12 Iterationen<br />
Abbildung 12: (10 Iterationen)
51<br />
Abbildung 13: 15 Iterationen<br />
Abbildung 14: 12 Iterationen
52 7 ANHANG<br />
Abbildung 15: 15 Iterationen
LITERATUR 53<br />
Literatur<br />
[BC08]<br />
[Can86]<br />
[COS06]<br />
[CV01]<br />
[dS01]<br />
[DS07]<br />
Thomas Brox and Daniel Cremers. On local region models and the statistical<br />
interpretation of the piecewise smooth mumford-shah functional.<br />
2008.<br />
J. F. Canny. A computational approach to edge detection. IEEE Transactions<br />
on Pattern Analysis and Machine Intelligence, pages 648–698, 1986.<br />
Daniel Cremers, Stanley J. Osher, and Stefano Soatto. Kernel density estimation<br />
and intrinsic alignment for shape priors on level set segmentation.<br />
International Journal of Computervision, 69:335–351, 2006.<br />
Tony F. Chan and Luminita A. Vese. Active contours without edges. IEEE<br />
Transactions on Image Processing, 10(2):266–277, 2001.<br />
J.P. Marques de Sá. Pattern Recognition - Concepts, Methods and Applications.<br />
Springer, 2001.<br />
Victor Dubowitz and Caroline A. Sewry. Muscle Biopsy: A practical approach.<br />
Saunders Elsevier, 2007.<br />
[KBFW05] Yoo-Jin Kim, Thomas Brox, Wolfgang Feiden, and Joachim Weickert. Fully<br />
automated segmentation and morphometrical analysis of muscle fibre<br />
images. pages 1–13, 2005.<br />
[KKP98]<br />
Ales Klemencic, Stanislav Kovacic, and Franjo Pernus. Automated segmentation<br />
of muscle fiber images using active contour models. Cytometry,<br />
32:317–326, 1998.<br />
[KMN + 02a] Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D.<br />
Piatko, Ruth Silverman, and Angela Y. Wu. An efficient k-means clustering<br />
algorithm: Analysis and implementation. IEEE Transactions on<br />
Pattern Analysis and Machine Intelligence, 24 Nr.7:881–892, 2002.<br />
[KMN + 02b] Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D.<br />
Piatko, Ruth Silverman, and Angela Y. Wu. A local search approximation<br />
algorithm for k-means-clustering. Annual ACM Symposium on Computational<br />
Geometry, 18:10–18, 2002.<br />
[Mor00] Bryan S. Morse. Lecture 18: Segmentation(regionbased). pages 1–5, 2000.
54 LITERATUR<br />
[Ots79]<br />
[PRT07]<br />
[SSS02]<br />
[Vos07]<br />
N. Otsu. A threshold selection method from gray-level histograms. IEEE<br />
Transactions on Systems, Man and Cybernetics, 9(1):62–66, 1979.<br />
J. Piovano, M. Rousson, and T.Papadopoulo. Efficient segmentation of<br />
piecewise smooth images. In F. Sgallari, A. Murli, and N. Paragios, editors,<br />
Scale Space and Variational Methods in Computervision. Springer, 2007.<br />
Jasjit S. Suri, Kamaledin Setarehdan, and Sameer Singh. Advanced Algorithmic<br />
Approaches to Medical Image Segmentation. Springer, 2002.<br />
Mark-André Voss. Level set based segmentation of atpase stained muscle<br />
fiber images with multiple regions. Master’s thesis, University of Bonn,<br />
2007.