Großer Beleg Segmentierung von ATPase-gefärbten - Fakultät ...

Großer Beleg 

Bildverarbeitung 

Thema: 

Segmentierung von ATPase-gefärbten 

Muskelfaserschnitten mittels Seeded-Region-Growing 

Alexander Asmus 

Lehrstuhl für intelligente Systeme 

Fakultät Informatik 

Technische Universität Dresden 

27.05.2008 

Betreuung: Dr. Thomas Brox

Hiermit erkläre ich, dass die vorliegende Arbeit von mir allein ausgearbeitet und nur 

auf Grundlage der angegebenen Quellen angefertigt wurde. 

Dresden, 27.05.2008 

Alexander Asmus

Zusammenfassung 

Die Erkennung und Segmentierung von Muskelfaserzellen stellt eine wichtige Aufgabe 

in der medizinischen Bildverarbeitung dar. Automatisierte Erkennungsverfahren sorgen 

dabei für eine Beschleunigung der Analysezeiten und verbessern so den Diagnoseprozess 

für Muskelbiopsien. Der in der vorliegenden Arbeit vorgestellte Ansatz des 

Seeded-Region-Growings soll einen weiteren Beitrag zur Zellsegmentierung von AT- 

Pase gefärbten Muskelfaserzellen leisten. Der Algortihmus basiert auf der Idee eines 

Thresholding basierten Regionswachstums, das über lokale Intensitätsmittelung eine 

Regionszugehörigkeit definiert. Um negative Ergebnisse, wie die Segmentierung von 

Zellzwischengewebe zu verhindern, verfügt das Seeded-Region-Growing zusätzlich über 

eine Formvergleichskomponente, die zellunähnliche Segmentierungen reduziert.

Inhaltsverzeichnis 

1 Einführung 3 

2 Medizinische Grundlagen 5 

2.1 Analyse und Gewinnung von Muskelfaserschnitten . . . . . . . . . . . . 5 

2.2 Probleme und Herausforderungen bestehender Verfahren . . . . . . . . 9 

3 Grundlagen der Bildsegmentierung 11 

3.1 Regionsbasierte Segmentierung . . . . . . . . . . . . . . . . . . . . . . 12 

3.1.1 Thresholding . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 

3.1.2 k-Means-Clustering . . . . . . . . . . . . . . . . . . . . . . . . . 16 

3.2 Kantenbasierte Segmentierung . . . . . . . . . . . . . . . . . . . . . . . 19 

3.3 Variationsansätze und Energiemininierung . . . . . . . . . . . . . . . . 20 

4 Der Seeded-Region-Growing Ansatz 22 

4.1 Überblick und Ablauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 

4.2 Regionswachstum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

4.2.1 Regionsrepräsentation . . . . . . . . . . . . . . . . . . . . . . . 28 

4.2.2 Labeling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 

4.2.3 2-Means-Clustering . . . . . . . . . . . . . . . . . . . . . . . . . 29 

5 Formwissen-Erweiterung zur Regionsprüfung 33 

5.1 Datenbankaufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 

5.2 Skalierungsinvarianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 

5.3 Parzenschätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 

5.4 Gradientenabstieg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

5.5 Parameter des Seeded-Region-Growing . . . . . . . . . . . . . . . . . . 43 

6 Fazit 47 

6.1 Segmentierungsergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . 47 

6.2 Qualität und Effizienz der Segmentierung . . . . . . . . . . . . . . . . . 47 

6.3 Bestehende Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 

6.4 Weiterführende Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . 49 

7 Anhang 50

3 

1 Einführung 

Die Bildsegmentierung und im Besonderen die medizinische Bildverarbeitung sind Anwendungsgebiete 

der Informatik, in denen in den letzen Jahren große Fortschritte erreicht 

wurden. Typische medizinische Bilddaten, zum Beispiel Röntgenbilder, Computerund 

Magnetresonanztomographie (CT,MT), Ultraschallbilder, sowie Gewebeproben aus 

Pathologie und Histologie, bieten einen großen Anwendungsbereich für computergestützte 

Bildsegmentierung [SSS02]. Durch die Weiterentwicklung und Erforschung von bekannten 

Segmentierungsmethoden und neuen Bilderkennungsalgorithmen kann für die 

meisten medizinischen Bildgebungsverfahren eine computerbasierte Bildverarbeitung 

ermöglicht werden. Vorhandene Applikationen sind, je nach Anwendungsfall, unterschiedlich 

stark automatisiert. 

Trotz der bisherigen Fortschritte kann man sagen, dass vollautomatisierte Bildsegmentierung 

der menschlichen Bilderkennungsleistung weit unterlegen ist. Während der 

menschliche bzw. tierische Wahrnehmungsapparat verschiedenste, sehr komplexe Segmentierungsprobleme 

in kurzer Zeit lösen kann, sind Applikationen zur automatisierten 

Bildsegmentierung meist speziell auf einen konkreten Anwendungsfall zugeschnitten. Eine 

Veränderung der Randbedingungen, für die ein Segmentierungsalgorithmus optimiert 

ist, führt oft zum Scheitern des Segmentierungssystems. Der Mensch hingegen kann für 

beliebige Bilddaten, auch unter sehr schlechten Rahmenbedingungen (Bildstörungen, 

Verrauschung, Farbveränderungen) Bildelemente schnell und sicher erkennen. Die Spezialisierung 

von automatischen Segmentierungssystemen auf eingeschränkte Aufgaben, 

führt zu immer neuen Problemstellungen, die mit bisherigen Verfahren nicht zufriedenstellend 

zu lösen sind. 

Trotz der Überlegenheit der menschlichen Bilderkennungsleistung ist es dennoch erstrebenswert, 

Segmentierung durch Algorithmen zu automatisieren. Für viele medizinische 

Diagnosen müssen zunächst große Mengen von Bilddaten analysiert und klassifiziert 

werden, um gesicherte Aussagen über die genaue Sachlage zu erhalten. 

Die vorliegende Arbeit begründet sich auf der Problemstellung, Muskelfaserzellen vollautomatisch 

zu segmentieren. Die Erkennung von Zellen kann zwar gut manuell ausgeführt 

werden, wird jedoch durch Anwendung von automatisierter Segmentierung 

schneller und effizienter. Besonders bei großen Datenmengen kann durch eine ununterbrochene 

Analyse durch Computersysteme viel personeller Aufwand verringert werden. 

Eine manuelle Segmentierung vieler Muskelfaserschnitte ist nicht nur ein zeitaufwendiger, 

sondern auch monotoner Arbeitsvorgang. Durch Abnahme der Konzentration 

steigt die Wahrscheinlichkeit für ein ungenaues Segmentierungsergebnis. Solche Feh-

4 1 EINFÜHRUNG 

lerquellen, die eine wissenschaftliche Auswertung der Daten erschweren, können durch 

automatisierte Verfahren umgangen werden. 

Die folgende Studienarbeit beschäftigt sich mit einem neuen Ansatz zur Segmentierung 

von ATPase-gefärbten Muskelfaserschnitten. Ziel der Segmentierung ist das Finden der 

im Bild unterschiedlich eingefärbten Muskelfaserzellen und die Definition der Zellkonturen. 

Diese Arbeit baut auf den Forschungsthemen zur Segmentierung von HE-gefärbten 

Muskelfaserzellen auf und soll des Weiteren einen alternativen Segmentierungsansatz 

zu den Levelset-basierten Segmentierungsverfahren in [KBFW05],[KKP98] und [Vos07] 

liefern. Die vielfältigen Färbetechniken für Muskelfaserschnitte in der Histologie bieten 

ein breites Arbeitsspektrum für verschiedene Segmentierungsansätze. Da sich je nach 

Färbetechnik die Bildcharakteristika stark unterscheiden, sind viele der bestehenden 

Verfahren nur auf eine spezielle Färbetechnik ausgerichtet. 

Die Arbeit gliedert sich in insgesamt sechs Kapitel. Im Anschluss an diese Einführung 

werden zunächst wichtige Grundlagen über die Gewinnung, Bedeutung und Anwendung 

von Muskelfaserschnitten in der Medizin gelegt. Im dritten Kapitel werden grundlegende 

Techniken zur Bildsegmentierung erklärt, auf die zum Teil in späteren Kapiteln 

aufgebaut wird. Kapitel vier und fünf dienen der ausführlichen Beschreibung des vorgestellten 

Seeded-Region-Growing Ansatzes und verdeutlichen den Ablauf des Algorithmus, 

sowie die zugrundeliegenden mathematischen Details und Informationen zur 

Implementierung. Es schließt sich im Kapitel sechs eine abschließende Betrachtung an, 

die einen Überblick auf die erzielten Ergebnisse, die Leistungsfähigkeit des Algorithmus 

und zukünftige Weiterentwicklung des Seeded-Region-Growings gibt.

5 

2 Medizinische Grundlagen 

Das folgende Kapitel soll einen Einblick über die gängigen Arbeitstechniken, Anforderungen 

und Probleme bei der Analyse von Muskelfaserschnitten geben. Im ersten 

Teil wird die Arbeitsweise zur Erzeugung der Gewebeproben erklärt. Der zweite Teil 

beschäftigt sich mit den Problemen und Herausforderungen, die bisherige manuelle 

Segmentierungsverfahren mit sich brachten und motiviert den Einsatz automatisierter 

Zellsegmentierung in der medizinischen Diagnostik. 

2.1 Analyse und Gewinnung von Muskelfaserschnitten 

Die Entnahme einer Muskelgewebsprobe ist eine häufige diagnostische Maßnahme, um 

bestimmte Krankheitsbilder an Muskeln zu untersuchen. Der Vorgang wird als Muskelbiopsie 

bezeichnet und kann auf zwei verschiende Arten erfolgen: 

• Stanz-Biopsie / Nadel-Biopsie 

• offene Biopsie 

Die beiden Verfahren unterscheiden sich in Aufwand, Verträglichkeit für den Patienten 

und Qualität des gewonnenen Gewebes. 

Stanz- und Nadelbiopsie: 

Die Stanz- bzw. Nadelbiopsie ist eine schon lange bekannte Entnahmemethode, die aber 

seit einigen Jahren wieder verhäuft für Muskeluntersuchungen angewendet wird. Bei der 

Ausführung des Eingriffs wird eine Nadel in das zu untersuchende Muskelgewebe eingeführt. 

Die Stanz-Nadel verfügt über ein seitliches Fenster, das zur Gewebeextraktion 

geöffnet bzw. geschlossen wird. Der große Vorteil der Nadel-Biopsie besteht im geringen 

Aufwand des Entnahmevorgangs und in der Verträglichkeit für den Patienten. Der 

Eingriff kann mit Hilfe einer lokalen Betäubung sowohl bei Erwachsenen, als auch bei 

Kindern durchgeführt werden, ist weitestgehend schmerzfrei und hinterlässt in der Regel 

keine Narben an der Einstichstelle. Die Stanzbiopsie ist also für die meisten Patienten 

gut verträglich. Da die Extraktion nur ein paar Sekunden in Anspruch nimmt, kann 

eine sofortige Begutachtung des gewonnenen Muskelgewebes unter einem Mikroskop 

erfolgen. Je nach Qualität der Probe kann über weitere Gewebeentnahmen entschieden 

werden. Die bereits verwendete Einstichstelle kann in solchen Fällen mehrmals genutzt 

werden. Dies sichert eine möglichst hohe Qualität der gewonnenen Muskelfasern.

6 2 MEDIZINISCHE GRUNDLAGEN 

Offene Biopsie: 

Bei der offenen Biopsie wird ein Bereich über dem Muskel freigelegt, um ein 3 cm langes 

und ca. 0,5 cm dickes Muskelbündel zu entnehmen. Häufig wird zusätzlich ein 0,5 cm 3 

großes Muskelstück für weiterführende diagnostische Untersuchungen entnommen. Der 

Vorteil einer offenen Muskelbiopsie liegt in der Qualität des gewonnenen Gewebes. Es 

ist möglich, größere Gewebsstreifen zu extrahieren, was insbesondere für biochemische 

Untersuchungen günstig ist. Des Weiteren können Muskelkontraktionen des Patienten 

während des Eingriffs ausgeschlossen werden, was die Qualität der Proben erhöht. Der 

Nachteil der offenen Biopsie ist der hohe Aufwand bei der Entnahme, sowie stärkere 

Auswirkungen auf den Patienten durch den Umfang des Eingriffs. Der Vorgang zur Gewebeentnahme 

ist deutlich komplexer als bei der Stanz-Biopsie, benötigt eine stärkere 

Betäubung und kann unter Umständen Narben an der Entnahmestelle hinterlassen. 

Der deutlich höhere Stressfaktor für den Patienten ist auch der Grund, weshalb offene 

Biopsien seltener ausgeführt und durch die nadel-basierte Variante ersetzt werden 

[DS07]. 

Die Auswahl eines bestimmten Muskels für eine Biopsie hängt von dem vorhandenen 

oder vermuteten Krankheitsbild des Patienten ab und davon, wie stark ein Muskel von 

der Erkrankung beeinflusst ist. Allgemein wird ein Muskel mit einem repräsentativen 

Krankheitsbefall gewählt, der jedoch nicht übermäßig stark betroffen oder verfettet 

sein sollte. Weitere Kriterien zur Muskelauswahl betreffen den jeweiligen Gesundheitszustand 

des Patienten sowie die Erkenntnisse, die aus vorhergehenden Untersuchungen 

(u.a. Sonographie, Kernspintomographie) gewonnen wurden. Bei der Entnahme einer 

Gewebsprobe ist darauf zu achten, dass der Muskel durch die lokale Betäubung nicht 

betroffen ist, da dies zur zeitweiligen Beeinflussung des Gewebes führen kann [DS07]. 

Aufbereitung des Gewebes: 

Da entnommende Muskelfaserproben sehr schnell austrocknen können, jedoch eine längerfristige 

Lagerung für spätere Untersuchungen eventuell nötig ist, sollte das Gewebe 

möglichst zeitnah eingefroren werden. Ein Einfrieren ist besonders wichtig, wenn biochemische 

oder histochemische Analysen erfolgen sollen. Diese Untersuchungen sind auf 

möglichst gute Gewebsproben angewiesen, da sonst bestimmte Testverfahren (Färbungen) 

nur unzureichende Ergebnisse liefern. Der Gefrierprozess wird in flüssigem Stickstoff 

mit anschließender Lagerung bei mindestens −40 ◦ C durchgeführt. Eine Beschleunigung 

des Einfrierens kann durch den Einsatz von in Flüssigstickstoff gekühltem Isopentan 

(−160 ◦ C) erfolgen [DS07]. Flüssiger Stickstoff wird bei Kontakt mit warmen 

Objekten sofort gasförmig. Um das einzufrierende Objekt bildet sich eine dünne Gas-

2.1 Analyse und Gewinnung von Muskelfaserschnitten 7 

schicht, die den Gefrierungprozess verlangsamt. Isopentan hingegen wechselt erst bei 

28 ◦ C in den gasförmigen Zustand und verlangsamt den Prozess folglich nicht. 

Eine gefrorene Probe wird zur weiteren Analyse in dünne (ca. 6-12 µm) Streifen geschnitten. 

Diese dünnen Schichten werden später eingefärbt und unter dem Mikroskop 

untersucht und abfotografiert. Wie auch die vorhergehenden Arbeitsschritte hat auch 

das Schneiden der Muskelfaserstreifen Einfluss auf die spätere Bildqualität der Probe. 

Besonders zu beachten ist die Temperatur des Gewebes beim Schneidevorgang [DS07]. 

Färbetechniken: 

Ziel einer Muskelbiopsie ist es, den Zustand der einzelnen Muskelfaserzellen bewerten 

zu können. Da sich Muskelgewebe aus verschiedenen Zellarten zusammensetzt und die 

unterschiedlichen Zelltypen gut unterscheidbar sein müssen, werden die gewonnenen 

Zell-Präparate eingefärbt. In der Histologie werden dazu mannigfaltige Färbetechniken 

verwendet, deren Farbergebnisse verschiedene Eigenschaften des Muskelgewebes hervorheben. 

Neben knapp einem Dutzend Standard-Färbetechniken, gibt es weitere spezialisiertere 

Verfahren, um gezielt besondere Gewebeeigenschaften aufzuzeigen. Je nach 

dem welche Ergebnisse die generell anzuwendenden Färbungen liefern, werden weitere 

spezialisiertere Techniken verwendet, um bestimmte Befunde bestätigen zu können. 

Zwei der am häufigsten verwendeten Färbetechniken sind die HE-Färbung und ATPase- 

Färbung. Bei der Hematoxylin-Eosin-Färbung (kurz HE) wird der natürliche Farbstoff 

Hematoxylin und ein synthetischer Farbstoff (Eosin) verwendet. Eosin sorgt für eine 

rötliche Färbung der Faserzellen, während Hematoxylin insbesondere bei Zellkernen 

eine bläuliche Färbung erzeugt. Während zellinnere Strukturen sich gut vom Hintergund 

abheben, hat die HE-Färbung den Nachteil, dass keine Unterschiede zwischen 

verschiedenen Muskelzellarten zu erkennen sind. Dem gegenüber erzeugt die Adenosin- 

Triphosphatase Färbung (kurz ATPase) eine eher bräunliche Fällung der einzelnen Muskelfasern. 

Je nach pH-Wert der Inkubationslösung sind Kontraste und Färbung stärker 

ausgeprägt. Die Helligkeit der jeweiligen Zellen gibt dabei Aufschluss über den Muskelfasertyp 

[DS07]. 

Muskelzelltypen: 

Bei Muskelfaserzellen wird zwischen 2 verschiedenen Zelltypen unterschieden, die sich 

sowohl in ihrer Funktionsweise, als auch auch in chemischen und enzymatischen Eigenschaften 

unterscheiden [DS07]. Die Muskelfaserarten werden durch ihre Farbe, Kontraktionsform, 

Ermüdung und durch ihre oxidative, bzw. glykolytische Funktionsweise 

unterschieden, woraus sich die Klassifikation aus Tabelle 1 ableitet [DS07].


Tabelle 1: Klassifikation von Muskelfasertypen 

Eigenschaft Typ 1 Typ 2a Typ 2b 

Farbe rot weiß weiß 

Kontraktionsform langsam schnell schnell 

Ermüdung resistent resistent sensitiv 

Funktionsweise oxidativ oxidativ / glykolytisch glykolytisch 

(a) HE-Färbung 

(b) ATPase-Färbung 

Abbildung 1: Muskelfasern mit verschiedenen Färbungen 

Wie in Abb. (1) zu erkennen ist, bestehen signifikante Unterschiede zwischen einer 

ATPase- und einer HE-Färbung. Der HE-gefärbte Faserschnitt zeigt sehr deutlich die 

Zelltopologie und verfügt über relativ homogene Farbverteilung im Inneren der Zellen. 

Obwohl die verschiedenen Zelltypen nicht zu unterscheiden sind, ist diese Färbetechnik 

für eine Kontur-Erkennung durchaus geeignet. Bei der ATPase-Färbung zeigen sich die 

verschiedenen Zelltypen in unterschiedlichen Helligkeitsstufen. Dadurch ist es möglich, 

sehr leicht zwischen den Zelltypen zu unterscheiden und so auch diese zusätzlichen Informationen 

in eine medizinische Diagnose einfließen zu lassen. Die Helligkeit eines bestimmten 

Muskelzelltyps wird durch den pH-Wert des Inkubationsmediums bestimmt. 

Eine Auflistung der Helligkeitsverteilungen bei typischen Inkubations-pH-Werten findet 

sich in Tabelle 2. (−) entspricht hell/wenig gefärbt und (+++) entspricht dunkel/stark 

gefärbt.

2.2 Probleme und Herausforderungen bestehender Verfahren 9 

Tabelle 2: pH-Wert-abhängige Helligkeitsausprägung bei ATPase 

Färbetechnik Typ 1 Typ 2a Typ 2b Typ 2c 

ATPase bei pH 9.4 + +++ +++ +++ 

ATPase bei pH 4.6 +++ − ++ +++ 

ATPase bei pH 4.3 +++ − − ++(+) 

Eine wichtige Eigenschaft bei ATPase-Bildern ist eine invertierte Färbung bei Veränderung 

des pH-Wertes. Bei einem pH-wert von 9,4 sind Typ 1 Zellen hell und Typ 2a/b 

dunkler. Genau invers verhält es sich bei einem pH-Wert von 4,3 bzw. 4,6. Die Typ 

1 Zellen sind nun sehr dunkel, während Typ 2a dunkelbraun und Typ 2b hellbraun 

erscheint. Mit varierendem pH-Wert ändert sich bei ATPase-Färbung auch der gesamte 

Kontrast im Muskelfaserschnitt [DS07]. 

2.2 Probleme und Herausforderungen bestehender Verfahren 

Bestehende Analyseverfahren erfolgen entweder manuell durch einen Arzt oder halbautomatisch 

mit Hilfe von Softwaresystemen. Im ersten Fall wird die Definition der 

Zellkonturen von Hand realisiert. Bei der Nutzung von halbautomatischen Verfahren 

ermittelt ein Softwaresystem die vorhandene Kontur, ist aber auf Assistenz durch einen 

Menschen angewiesen. Dies kann beispielsweise durch die Definition von Initialkonturen 

oder Zellmittelpunkten geschehen, die dann durch das System automatisch verfeinert 

und angepasst werden. Anhand der Kontur einer Muskelfaserzelle werden automatisch 

ihr Umfang, Durchmesser und Rundung ermittelt. Durch die Analyse von mehreren 

Muskelfaserschnitten können genug Daten erfasst werden, so dass Rückschlüsse über 

den Gesamtzustand des Muskels möglich sind. 

Leider sind sowohl manuelle als auch halbautomatische Verfahren sehr zeitaufwendig, 

fehleranfällig und für einen Menschen monotone Arbeitsaufgaben. Eine vollautomatische 

Verarbeitung ist also wünschenswert. Wie wir im vorhergehenden Abschnitt gesehen 

haben, gibt es aber eine Vielzahl verschiedener Färbetechniken, die sehr unterschiedliche 

Bildcharakteristiken aufweisen und dadurch ganz spezifische medizinsiche 

Aussagen ermöglichen. Für vollautomatisierte Zellerkennung muss der verwendete Algorithmus 

meist für die jeweilige Färbetechnik optimiert werden. Dies schränkt eine 

universale Anwendung zum Teil ein. 

Auf eine vollautomatische Segmentierung von Zellen wirken aber weitere Probleme, 

die es zu lösen gilt. Beispielsweise kann die Qualität der gefärbten Gewebeproben sehr 

stark variieren. Sowohl die Gewebeentnahme, als auch der Gefrierprozess beeinflus-


sen die späteren Zellbilder maßgeblich. Durch Fehler beim Schockgefrieren kann es 

zu Zerstörungen im Zellmaterial kommen, so dass bei anschließenden enzym-basierten 

Färbungen möglicherweise keine optimale Fällung erreicht werden kann. Auch ein Austrocknen 

der Probe kann ähnliche Folgen nach sich ziehen. Der Färbeprozess selbst 

birgt wiederum viele Fehlerquellen. Je nach pH-Wert der Inkubationslösung zur Aufbereitung 

der Gewebeschichten, ergeben sich stärkere oder schwächere Kontraste in 

ATPase-Bildern. Eine klare Segmentierung ist gerade bei nebeneinanderliegenden Zellen 

gleichen Typs oftmals schwierig. Teilweise sind die Farbintensitäten innerhalb einer 

Zelle sehr wechselhaft, dies erschwert die Erkennung und kann zu Fehlklassifikationen 

führen. 

Ein robustes vollautomatisches Verfahren zur Muskelzellklassifikation und Segmentierung 

muss mit vielen dieser Fehlerquellen umgehen können und auch für Bilder mit 

unterschiedlicher Qualität hinreichend genaue Ergebnisse liefern. Da eine unmittelbare 

Überwachung des Segmentierungsvorgangs durch geschultes Personal nicht vorgesehen 

ist, müssen Fehlerraten solcher Systeme sehr niedrig sein.

11 

3 Grundlagen der Bildsegmentierung 

Die Bildsegmentierung ist ein sehr vielversprechendes Forschungsfeld, in dem immer 

wieder neue Probleme auftauchen und formuliert werden. Dank einer aktiven Forschungsarbeit 

in den letzten Jahrzehnten, können wir auf eine Vielzahl von Segmentierungsmethoden 

zurückgreifen, die teilweise sehr unterschiedliche Ansätze zur Lösung 

des Segmentierungsproblems wählen. Im nun folgenden Abschnitt soll auf einige der 

wichtigsten Methoden genauer eingegangen werden. In Vorbereitung auf die Erläuterungen 

in Kapitel (4) (S.22) und Kapitel (5) (S.33), werden hier die zugrunde liegenden 

Verfahren (Threshholding, K-Means-Clustering) erläutert. 

Einen Überblick über verschiedene praktische Segmentierungsalgorithmen liefert folgende 

Klassifikation, die Erkennungsverfahren nach dem Grad der Automatisierung 

unterscheidet [Vos07]. 

• manuelle Segmentierung 

• halbautomatische Segmentierung 

• vollautomatische Segmentierung 

Wie in den vorhergehenden Kapiteln bereits erwähnt wurde, ist die Automatisierung 

eines Erkennungsverfahrens ein wichtiges Ziel in vielen praktischen Anwendungen. Beispielsweise 

werden bei der manuellen Auswertung von Muskelfaserschnitten für die Segmentierung 

von ungefähr 200 Fasern ca. 20 - 30 Minuten benötigt [KKP98]. Für eine 

korrekte manuelle Zellsegmentierung wird ausgebildetes Fachpersonal mit fundiertem 

Wissen über die Gewebestrukturen von Muskelfaserzellen benötigt. Gleichzeitig handelt 

es sich aber bei dieser Arbeitsaufgabe um eine sehr zeitintensive und monotone 

Tätigkeit, bei der ständige Konzentration erforderlich ist. Eine Automatisierung des 

Verfahrens ist also erstrebenswert. 

Die halbautomatische Lösung eines Segmentierungsproblems umfasst eine Kombination 

aus automatisierter Berechnung und manueller Korrektur bzw. Überwachung. Der vom 

Menschen auszuführende Anteil der Bilderkennung kann durch partielle Nutzung von 

Computersystemen verkürzt oder zumindest erleichtert werden. Mensch und Computersystem 

ergänzen sich durch ihre besonderen Leistungsfähigkeiten. Der menschliche 

Wahrnehmungsapparat kann durch seine sichere und schnelle Erkennungsleistung das 

Softwaresystem bei der Vorverarbeitung unterstützen, während der Computer für eine 

schnelle Verarbeitung und präzise Auswertung der Bilddaten sorgt. Unter bestimmten

12 3 GRUNDLAGEN DER BILDSEGMENTIERUNG 

Umständen kann aber die halbautomatische Segmentierung ähnlich zeitintensiv sein, 

wie die manuelle Bearbeitung. 

Vollautomatische Verfahren ermitteln eine Lösung für das Segmentierungsproblem, die 

ohne menschliche Überwachung oder Korrektur hinreichend genau ist. Selbst wenn der 

Algorithmus zur Lösung des Problems länger benötigt als ein Mensch, so kann die Verarbeitung 

sehr leicht parallelisiert und ununterbrochen durchgeführt werden, wodurch 

es gerade bei umfangreichen Datensätzen zur Verkürzung von Analysezeiten kommt. 

Eine zweite Form der Klassifikation von Segmentierung ist die Unterscheidung nach 

dem Segmentierungsansatz: 

• Regionsbasierte Segmentierung 

• Kantenbasierte Segmentierung 

• Variationsansätze 

Jede dieser Herangehensweisen hat bestimmte Vor- und Nachteile, wie in den folgenden 

Abschnitten verdeutlicht wird. Zuerst werden die regionsbasierten Segmentierungsmethoden 

erläutert, die im Seeded-Region-Growing eine besondere Rolle spielen. 

3.1 Regionsbasierte Segmentierung 

Regionsbasierte Segmentierungsmethoden versuchen, ein Bild durch die Definition einer 

Regionszugehörigkeit in verschiedene Bereiche zu teilen. Die mathematische Modellierung 

dieser Regionszugehörigkeit hat den größten Einfluss auf die Qualität der Segmentierungsergebnisse. 

Oftmals muss das mathematische Modell an lokale Eigenschaften des 

Bildes angepasst werden und somit adaptiv sein. Eine globale statische Segmentierung 

auf dem gesamten Bildraum liefert in den meisten Fällen ungenaue und sehr zersplitterte 

Bildregionen. Der Vorteil regionsbasierter Verfahren gegenüber kantenbasierten 

Methoden ist eine geringere Störanfälligkeit in Bezug auf Rauschen [Mor00]. 

Im Folgenden sei ein Bild bestehend aus Helligkeitswerten definiert durch I : Ω ↦→ R, das 

Segmentierungsergebnis sei ein Binärbild mit I ∗ : Ω ↦→ {0, 1}, die Regionszugehörigkeit 

wird durch eine Ähnlichkeitsfunktion S : Ω ↦→ R beschrieben. Letztlich bezeichnet Ω 

den zweidimensionalen Bildraum.

3.1 Regionsbasierte Segmentierung 13 

3.1.1 Thresholding 

Thresholding ist eine der grundlegendsten Segmentierungstechniken. Im allgemeinen 

Fall wird die Regionszugehörigkeit eines Pixels p(x, y) durch die Ähnlichkeits- oder 

Distanzfunktion S(x, y) und durch einen Schwellwert (Threshold) θ ∈ R definiert. Als 

regionszugehörig werden alle Pixel betrachtet, deren Ähnlichkeit S(x, y) kleiner als die 

gewählte Schwelle ist. 

⎧ 

⎨1 S(x, y) > θ 

I ∗ (x, y) = 

mit x, y ∈ Ω (3.1) 

⎩ 

0 S(x, y) ≤ θ 

Der Schwellwert in Gleichung (3.1) ist als ein Intensitätswert aufzufassen. Die Funktion 

S(x, y) kann beliebig komplex modelliert werden. Ein simples und gerade deswegen 

häufig verwendetes Modell ist S(x, y) = I(x, y). Dies bedeutet, dass die Regionszugehörigkeit 

lediglich durch den Intensitätswert I eines Pixels (x, y) bestimmt wird. 

Daraus resultierend ist der Schwellwert θ als ein Intensitätswert aufzufassen. Der Vorteil 

dieser Ähnlichkeitsfunktion liegt in den Segmentierungsergebnissen. Diese sind zwar 

selten sehr genau, können aber sehr schnell ermittelt werden und sind für eine Vorverarbeitung 

meist ausreichend. Der Nachteil einer so simplen Ähnlichkeitsdefinition ist 

eine erhöhte Rauschabhängigkeit, da ein Pixel mit zu starker Helligkeitsabweichung 

nicht zur Region klassifiziert wird, selbst wenn die Abweichung durch ein allgemeines 

Bildrauschen hervorgerufn wird [Mor00]. Kritisch ist auch die Wahl eines geeigneten 

Thresholds θ. Dieser ist der wichtigste Parameter, der die Segmentierung steuert und 

so das Ergebnis maßgeblich beeinflusst. Eine Veränderung von θ kann völlig andere Segmentierungsergebnisse 

bewirken. Bei einfachen Bildern mit klar abgegrenzten Flächen 

und möglichst viel Intensitätshomogenität kann ein idealer Threshold schnell gefunden 

werden. In solchen Fällen ist Thresholding eine sehr effiziente Segmentierungsmethode. 

Es kann in linearer Zeit, abhängig von der Bildgröße, ausgeführt werden, was für viele 

Segmentierungsaufgaben eine sehr gute Komplexität darstellt. Für viele reale Bilder 

(Fotos, Videostandbilder) ist es aber weit schwieriger, ein optimales θ zu ermitteln. Es 

gibt jedoch einige Algorithmen zur automatischen Abschätzung eines optimalen Thresholds. 

Durch Histogramm-Analysen kann man einen möglichst optimalen Threshold 

algorithmisch bestimmen [Ots79]. 

Der oben beschriebene Ansatz berücksichtigt keine Pixelnachbarschaften, wodurch es 

leicht zu einer Übersegmentierung kommen kann. Da die Segmentierung auf dem gesamten 

Bildraum ausgeführt wird, werden alle Pixel des Bildes der Region zugeord-


net, deren Intensitäten geeignet sind. Die Klassifikation erfolgt unabhängig davon, ob 

die entstehenden Regionen zusammenhängend sind oder es zu einer starken Aufsplitterung 

kommt. Diese Probleme können aber durch Anpassung an der Ähnlichkeitsdefinition 

S(x, y) gemindert werden. Eine Alternative für mehr Rauschresistenz beim 

Thresholding ist die Ausnutzung von Pixel-Nachbarschaften. S(x, y) ermittelt einen 

durchschnittlichen Intensitätswert innerhalb einer Pixelnachbarschaft N. 

S(x, y) = 1 

|N| 

∑ 

x n ,y n ∈N 

I(x n , y n ) (3.2) 

Je nach Wahl der Pixelnachbarschaft werden mehr oder weniger Pixel im Mittelwert 

verrechnet. Die Nachbarregion zur Mittelwertbestimmung kann zum Beispiel eine 3x3 

oder 5x5 Pixel große Zone sein. Es sei angemerkt, dass die Ergebnisse bei einer Mittelung 

über eine bestimmte Pixelnachbarschaft identisch zu Ergebnissen ohne Nachbarschaftsmittelung 

sind, wenn vor Ausführung der Segmentierung eine Bildglättung durch 

Faltung mit einem geeigneten Filterkern stattfindet. Je größer die Nachbarschaftszone 

gewählt wird, desto stärker muss im alternativen Fall geglättet werden, um gleiche Ergebnisse 

zu bekommen. Die Mittelung über eine Pixelnachbarschaft ist also mit einer 

Bildglättung vergleichbar [Mor00]. 

Ein Thresholding kann auf unterschiedliche Weise ausgeführt werden. Der Threshold- 

Filter kann global auf das Bild angewendet werden, wie es für Gleichung (3.1) und 

(3.2) vorgesehen ist. Bei einer globalen Anwendung ergeben sich aber über den ganzen 

Bildraum verteilte, nicht zusammenhängende Regionen, die meist über die zu segmentierenden 

Bereiche hinausgehen. Für die meisten Bilder lassen sich durch Definition 

eines konstanten, globalen Thresholds keine präzisen Segmentierungen erreichen. Als 

Alternativen nutzt man u.a. die erwähnte Abschätzung von θ, Einbezug der räumlichen 

Anordnung der Pixel oder ein iteratives Regionswachstum. Oftmals wird auch 

das Multi-Thresholding verwendet, bei dem durch mehrere Segmentierungsschritte mit 

unterschiedlichem θ die Segmentierungsergebnisse verbessert werden können und es zu 

weniger Übersegmentierung kommt. 

Region-Growing: 

Das Wachsen einer Region kann durch Definition eines Startpixels und einer iterativen 

Ausbreitung der Region simuliert werden. Ausgehend vom Initialpunkt p s (x s , y s ) (Saat- 

Pixel) breitet sich die Region schrittweise über sämtliche Nachbarpixel p n (x n , y n ) aus,


die durch S(x n , y n ) als regionszugehörig klassifiziert wurden. 

S(x n , y n ) = (I(x s , y s ) − I(x n , y n )) 2 (3.3) 

Es wird also die Differenz zwischen dem Saatpixel p s (x s , y s ) und dem zu klassifizierenden 

Pixel p n (x n , y n ) berechnet und anschließend, wie in Gleichung (3.1), als Zugehörigkeitskriterium 

verwendet. Der Schwellwert θ ist nun als Fehlertoleranz aufzufassen. Je 

größer man θ wählt, desto größer ist die Wahrscheinlichkeit, dass ein Pixel zur Region 

zugeordnet wird. Das Wachstum einer Region kann, ausgehend vom Saatpixel, durch 

Prüfung der 4 bzw. 8 direkten Nachbarpixel geschehen. Das Regionswachstum ist mit 

dem aus der Computergrafik bekannten Floodfill-Algorithmus vergleichbar. Die Ähnlichkeitsfunktion 

S(x n , y n ) aus Gleichung (3.3) ist wiederum ein einfaches Modell für 

ein Regionswachstum. Ebenso ist es möglich, das Modell durch Nachbarschaftsmittelung 

oder ein alternatives Distanzmaß anzupassen und so für bestimmte Zwecke zu 

optimieren. Ohne weitere Anpassungen kann es beim Modell aus Gleichung (3.3) leicht 

zum Auslaufen einer wachsenden Region kommen, so dass die segmentierte Zone den 

beabsichtigten Segmentierungsbereich verlässt. Dies passiert vor allem an Stellen, wo 

die Intensitätswerte einer Zielregion (zum Beispiel eine Muskelzelle) sich nur schwach 

vom Bildhintergrund abheben (beispielsweise das Zellzwischengewebe). Es gibt an betreffenden 

Stellen demnach nur sehr geringe Intensitätsunterschiede. 

Durch Erweiterung der Ähnlichkeitsfunktion S(x n , y n ) aus Gleichung (3.4) kann ein 

Auslaufen der wachsenden Region verhindert werden. Statt lediglich die Distanz der 

Intensitätswerte als Kriterium zu verwenden, wird auch der räumliche Abstand zwischen 

zwei Pixeln einbezogen. 

S(x n , y n ) = (1 − α)S I (x n , y n ) + αS D (x n , y n ) 

S I (x n , y n ) = (I(x s , y s ) − I(x n , y n )) 2 

(3.4) 

S D (x n , y n ) = (x s − x n ) 2 + (y s − y n ) 2 

Je größer die räumliche Distanz zwischen dem Saatpixel p s und einem Pixel p n ist, 

desto größer wird der Wert von S(x n , y n ) und umso unwahrscheinlicher ist eine Regionszugehörigkeit. 

Die Abhängigkeit von den Bildintensitäten aus Gleichung (3.3) ist 

natürlich weiterhin gegeben. Durch den Parameter α ∈ [0, 1] erfolgt eine Gewichtung, 

ob die räumliche Distanz oder die Differenz der Intensitäten einen größeren Einfluss 

auf die Pixelklassifikation haben soll. Für α = 0 ergibt sich aus Gleichung (3.4) eine 

Äquivalenz zu Gleichung (3.3).


Der Vorteil vom Region-Growing im Gegensatz zum klassischen Thresholding liegt in 

der Form der extrahierten Regionen. Diese sind nämlich im beschriebenen Fall immer 

zusammenhängend. Dennoch wirken sich die Störungen bei den Intensitätswerten 

stark auf die Form der wachsenden Regionen aus. Insbesondere bei Muskelfaserschnitten 

können neben Störung durch Verrauschung auch andere Bildeigenschaften, wie geringer 

Kontrast oder undeutliche Färbung des Zwischengewebes eine Segmentierung stark 

erschweren. Bei ATPase-gefärbten Zellschnitten sind besonders bei Zellen mittlerer Helligkeit 

(siehe Tabelle 2 und Abb. 1) starke Intensitätsschwankungen vorhanden, die vom 

Färbeprozess stammen. Darüber hinaus hebt sich das Zellzwischengewebe an vereinzelten 

Stellen nicht stark genug vom Zellhintergrund ab, was zu auslaufenden Regionen bei 

der Segmentierung führen kann. Eine detaillierte Beschreibung des Regionswachstums 

im Seeded-Region-Growing-Ansatz, sowie die Lösungen zur Minderung der genannten 

Probleme finden sich in Kapitel (4). 

3.1.2 k-Means-Clustering 

Als Clustering-Problem bezeichnet man die Aufgabe, eine Menge von Datenpunkten 

einer bestimmten Anzahl von Klassen zuzuordnen. Solche Zuordnungsprobleme treten 

in sehr vielen verschiedenen Anwendungen auf, wie unter anderem bei der Datenkompression, 

dem Data-Mining, der Bildverarbeitung und der Mustererkennung. Das 

k-Means-Clustering stellt eine Möglichkeit zur Lösung eines solchen Zuordnungsverfahrens 

dar [KMN + 02a]. K-Means-Clustering ist eine Zuordnung, die ausgehend von 

n vielen Datenpunkten p diese in k viele Klassen einteilt. Jede Klasse K i wird dabei 

durch einen Mittelpunkt c i beschrieben. Ein Punkt p des Datensatzes wird einer Klasse 

K i zugeordnet, wenn die Distanz zwischen p und c i kleiner ist, als die Abstände zu den 

restlichen Klassen. Dies lässt sich formal durch folgende Energiefunktion beschreiben 

[Vos07] [dS01]. 

E(C) = 

k∑ 

i=1 

∑ 

∀p∈K i 

‖p − c i ‖ 2 (3.5) 

Lösung des k-Means-Clusterings ist also eine Menge C = {c i mit i ∈ [1, k]}, für die die 

Energiefunktion aus Gleichung (3.5) ein globales Minimum hat. Dies ist genau dann 

der Fall, wenn der Abstand der Punkte p ∈ K i zum Klassenmittelpunkt c i kleiner 

ist, als alle Distanzen zu den verbleibenden Mittelpunkten der anderen Klassen. Wird 

eine solche Menge C gefunden, so handelt es sich um eine globale Optimierung des


Zuordnungsproblems. Das heißt, es gibt keine andere Klassenaufteilung, die eine bessere 

Zuordnung ermöglicht. 

Das Problem des k-Means-Clusterings ist aber, dass eine globale Optimierung nur 

schwer zu ermitteln ist. Es gibt verschiedene Herangehensweisen, um hier eine Lösung 

zu finden. Eine der bekanntesten ist der sogenannte Lloyd’s Algorithm“[KMN + 02a]. 

” 

Durch eine einfache Implementierung kann eine Lösung, die ein lokales Minimum für 

E(C) darstellt, gefunden werden. Durch ein Iterationsschema können diese lokalen 

Lösungen weiter verfeinert werden. Zur Approximation einer relativ guten Lösung nutzt 

der Lloyd’s Algorithm“ die Tatsache aus, dass die optimale Positionierung eines Klassenmittelpunktes 

c i im Zentrum der durch die Klasse beschriebenen Punkte sein muss. 

” 

Ausgehend von einer Initialisierung der Centroiden c i werden alle Punkte der Datenmenge 

anhand ihrer Distanzen zu den Klassen zugeordnet. Anschließend werden die 

Mittelpunkte c i durch eine Mittelung über alle in einer Klasse enthaltenen Punkte 

neu positioniert. Dadurch ergibt sich ein iteratives Schema, bei dem sich nach jedem 

Durchlauf die Klassenmittelpunkte immer näher an eine optimale Postion annähern. 

Dieser Prozess wird in Abb. (2) grafisch verdeutlicht. In Tabelle (3) findet sich eine 

Ablaufs-Beschreibung des Algorithmus [Vos07]. 

Tabelle 3: Ablauf vom k-Means-Clustering (Lloyd’s Algorithm) 

1. Initialisiere die Klassenmittelpunkte c i 

2. Ordne alle Datenpunkte p den Klassen zu 

3. Neuberechnung der c i durch Mittelung über Klassenelemente 

4. Bei Verschiebung der c i gehe zu Schritt 2, sonst Ende 

Der Vorteil dieser Clustering-Methode ist, dass der Algorithmus definitiv k viele Klassen 

findet und dabei in den meisten Fällen schon nach wenigen Iterationen zu einem 

Klassifikationsergebnis kommt. Je nach Modellierung der Distanz-Funktion kann dieser 

Ansatz für verschiedenste Verfahren angewendet werden. Im Beispiel von Zellerkennung 

kann sowohl eine Segmentierung, als auch eine Zell-Typ-Klassifikation erreicht werden. 

Letztere Anwendung wurde bereits als Vorverarbeitungsschritt in einer Level-Set basierten 

Segmentierung in [Vos07] ausgenutzt. 

Nachteilig am k-Means-Clustering ist aber, dass die Ergebnisse im besonderen Maße 

von der Initialisierung der Klassenmittelpunkte c i abhängen. Das bedeutet einerseits: 

Eine ungeschickte Initialisierung der Klassenmittelpunkte erhöht die Anzahl der nötigen 

Iterationen und damit die Laufzeit. Andererseits können zwei unterschiedliche Positionierungen 

der Initialpunkte c i zu verschiedenen Klassifikationen führen. Die Ergebnisse


(a) Iteration: 1 (b) Iteration: 2 

(c) Iteration: 3 (d) Iteration: 4 

Abbildung 2: k-Means-Clustering für k=3 über 4 Iterationen 

des iterativen Lösungsverfahrens können im ungünstigen Fall stark vpn der optimalen 

Lösung abweichen [KMN + 02b]. Gerade für die Initialisierung der Centroiden muss 

daher größerer Aufwand betrieben werden, um möglichst gute Startparameter für den 

Algorithmus zu erhalten. Problematisch wird eine Anwendung des k-Means-Clusterings, 

wenn die Anzahl der zu findenden Klassen nicht genau bekannt ist. Um einen solchen 

Fall handelt es sich bei einer Zellsegmentierung, bei der jede Zelle genau eine Klasse 

darstellt. Während bei einer Klassifikation nur die Anzahl der Zelltypen von Belang ist 

(k = 3), benötigt man für eine Segmentierung die Anzahl der Zellen im Bild. Diesen 

Wert präzise zu schätzen, ist aber relativ schwierig, ebenso wie eine sichere Positionierung 

der Klassenmittelpunkte im Inneren der Zellen.

3.2 Kantenbasierte Segmentierung 19 

3.2 Kantenbasierte Segmentierung 

Ein kantenbasierter Segmentierungsansatz baut auf der Annahme auf, dass innerhalb 

eines Bildes die zu erkennenden Regionen durch mehr oder weniger deutliche Kanten 

beschrieben werden. Eine Kante wird als eine plötzliche Intensitätsänderung innerhalb 

einer gewissen Umgebung angenommen. Aus der Bildverarbeitung kann man auf einige 

Filter mit kantendetektorischen Eigenschaften zurückgreifen, wie u.a. den Laplace- 

Filter. 

Eine Kante kann algorithmisch durch die Berechnung des Gradienten an einer bestimmten 

Stelle erkannt werden. Der Gradient (ein Vektor) berechnet sich aus den partiellen 

Raumableitungen auf dem Beobachtungsraum. Generell kann ein Gradient für n- 

dimensionale Datensätze berechnet werden. Im Falle eines zweidimensionalen Bildes 

werden entsprechend die zwei Raumableitungen nach x und y verwendet. Diese Ableitungen 

bilden die x- und y-Komponenten des Gradienten-Vektors. In Gleichung (3.6) 

findet sich eine mathematische Beschreibung. 

grad(I(x, y)) = ∇I(x, y) = 

( ∂I(x,y) 

∂x 

∂I(x,y) 

∂y 

) 

(3.6) 

Der Gradient, in der Kurzschreibweise als ∇ notiert, zeigt immer in Richtung des stärksten 

Dichteanstiegs eines skalaren Feldes. Für ein Grauwertbild also in die Richtung, in 

der sich die Helligkeitswerte am stärksten erhöhen. Der Betrag des Gradienten-Vektors 

gibt Aufschluss über die Stärke einer Intensitätsänderung an einer Stelle und ist so besonders 

zur Kantenbestimmung in Bildern geeignet. Besonders hohe Gradientenbeträge 

sind Indikatoren für Kanten innerhalb des Bildes. 

Vorteil von kantenbasierten Segmentierungsmethoden ist, dass sich durch Kantendetektoren 

Konturen für verschiedenste Bildbereiche extrahieren lassen. Nachteilig ist 

aber, dass es unter Umständen schwierig sein kann, zwischen den Kanten der zu segmentierenden 

Objekte und den Kanten von irrelevanten Bildregionen zu unterscheiden. 

Oftmals sind die aus Kantendetektoren extrahierten Objektkonturen nicht zusammenhängend 

und müssen durch weitere Verarbeitungsschritte zusammengefügt oder 

vervollständigt werden. Ein häufig verwendeter Ansatz zur Kantensegmentierung ist 

der Canny-Algorithmus [Can86].


3.3 Variationsansätze und Energiemininierung 

Wie auch beim k-Means-Clustering kann man die Güte einer Segmentierung durch eine 

diskrete bzw. kontinuierliche Kostenfunktion E ausdrücken. Ist die Kostenfunktion E 

für einen diskreten Vektor v definiert, so spricht man von einer Energiefunktion E(v). 

Soll das Segmentierungsergebnis jedoch durch eine kontinuierliche Funktion u(x) mit 

u(x) : Ω ↦→ R repräsentatiert werden, so spricht man von einem Energiefunktional. 

Dank einer kontinuierlichen Betrachtung der Segmentierung ist es möglich, genauere 

Ergebnisse bei einer Bilderkennung zu erreichen, die nicht den Beschränkungen einer 

diskreten Repäsentation unterliegen (Abtastung). 

u ∗ (x) = arg min 

u(x) E(u(x)) (3.7) 

Das Energiefunktional aus Gleichung (3.7) verwendet als Parameter die kontinuierliche 

Funktion u(x). u(x) stellt eine mögliche Lösung für das Segmentierungsproblem dar 

und wird durch das Kostenfunktional E auf seine Güte geprüft. Dabei belohnt E(u(x)) 

positive Segmentierungsergebnisse, während negative Ergebnisse zu einer Bestrafung 

führen. Belohnungen äußern sich in einer Verringerung bzw. einem sehr niedrigen Anstieg 

der Kostenfunktion, Bestrafungen entsprechen folglich einem Kostenanstieg. 

Die kontinuierliche Funktion u(x) kann je nach Anwendungsfall unterschiedlich sein. 

Denkbar ist eine kontinuierliche Kontur- oder Regionsbeschreibung, eine vollständige 

Repräsentation des finalen Ergebnisbildes ist aber auch möglich. Je besser das Segmentierungsergebnis 

u(x) ist, desto niedriger das Energiefunktional E(u(x)). Neben 

Anwendungen in der Bildverarbeitung und Segmentierung können Variationsansätze 

und Energieminimierung auch für viele andere Anwendungsgebiete von Nutzen sein. 

Je nach Anpassung des Terms E können verschiedenste Probleme bewertet und gelöst 

werden. 

Ein Energiefunktional setzt sich generell aus verschiedenen Teilenergien zusammen. 

Bei einer Bilderkennung hat jede dieser Teilenergien die Aufgabe, eine bestimmte Eigenschaft 

des Segmentierungergebnisses zu garantieren oder zu unterdrücken. Oftmals 

widersprechen die angestrebten Ergebniseigenschaften einander, so dass eine optimale 

Lösung einen Kompromiss zwischen den Modellannahmen beschreibt. In Gleichung 

(3.8) besteht das Energiefunktional aus zwei Teilenergien. E glatt soll sicherstellen, dass 

das Segmentierungsergebnis möglichst geglättet ist, während E data ein Ergebnis mit

3.3 Variationsansätze und Energiemininierung 21 

möglichst viel Ähnlichkeit zu den Quelldaten fordert. 

E(u(x)) = E glatt (u(x)) + α · E data (u(x)) 

E glatt = ‖∇u(x)‖ 

E data = (u(x) − I(x)) 2 

(3.8) 

mit α ∈ [0, 1] 

Durch die beschriebene Gleichung ließe sich eine Bildglättung realisieren. Der Datenterm 

würde für u(x) = I(x) minimal werden, was bedeutet, dass das Ausgangsbild 

gleich dem Ergebnisbild wäre. Der Glattheitsterm wird genau dann minimal, wenn der 

Gradientenbetrag an jeder Stelle im Ergebnisbild möglichst niedrig ist, es sich also um 

ein Bild mit gleichbleibender Intensität handelt. Zwischen diesen beiden Extremen wird 

durch die Lösung des Energieminimierungsproblems ein möglichst optimaler Kompromiss 

gesucht. 

Der Vorteil dieser Verarbeitungsmethode besteht in der hohen Transparenz der getroffenen 

Annahmen und Modellierungsentscheidungen. Eine Kombination von bereits 

erforschten Energiefunktionalen (z.B. Mumford-Shah-Funktional, Cartoonmodell) mit 

eigenen Termen ist leicht zu realisieren [PRT07]. Nachteil eines variationalen Lösungsverfahrens 

besteht aber in der Lösung des Minimierungsproblems. Ziel ist es, ein globales 

Minimum für E(u(x)) zu finden. Gerade besonders anspruchsvolle Segmentierungsprobleme 

liefern oft Energiefunktionale, die nicht konvex sind und somit statt eines globalen 

Extremums verschiedene lokale Extremstellen haben. Für eine Lösung ist es in solchen 

Fällen schwer zu entscheiden, ob es sich um das globale Minimum für E(u(x)) handelt 

oder ob man nur ein lokales Minimum errechnet hat. Das Finden einer global optimalen 

Lösung ist also nicht immer garantiert. Man kann zur Lösung der Energieminimierungsprobleme 

zwar auf viele verschiedene Lösungsmethoden zurückgreifen, wie unter 

anderem den Gradientenabstieg, das Gauß-Seidel-Verfahren oder die Jakobi-Methode, 

das Ermitteln einer global optimalen Lösung bleibt in den meisten Fällen schwierig.

22 4 DER SEEDED-REGION-GROWING ANSATZ 

4 Der Seeded-Region-Growing Ansatz 

Im folgenden Kapitel wird der Seeded-Region-Growing Ansatz im Detail besprochen. 

Neben einer Übersicht über den gesamten Ablauf des Algorithmus, werden in den weiteren 

Abschnitten die Realisierung des Regionswachtums, die Regionsrepräsentation, 

sowie das Labeling-Verfahren behandelt. Die Formvergleiche, als wichtiges Element im 

Seeded-Region-Growing, werden seperat im Kapitel 5 erläutert. 

4.1 Überblick und Ablauf 

Der Ablauf des Seeded-Region-Growings teilt sich in vier Verarbeitungsphasen, die in 

der schematischen Abb. (3) zu sehen sind. Zur Verarbeitung von Muskelfaserbildern 

durch das Seeded-Region-Growing werden die eigentlich bräunlich gefärbten ATPase- 

Aufnahmen in 8 bit Graustufen-Bilder umgewandelt und durchlaufen anschließend, die 

durch drei Schleifenkonstrukte verschachtelten Verarbeitungsphasen. Zunächst werden 

wir uns den Bedeutungen der einzelnen Arbeitsabläufe widmen, im Anschluss werden 

die Wechselwirkungen durch die Schleifenkonstrukte erklärt. 

Abbildung 3: Ablaufphasen im Seeded-Region-Growing 

Tabelle 4: Kriterien zur Prüfung von Saat-Punkten 

Kriterium Bedingung 

Bearbeitung s(x,y) ∈ bereits segmentierte Zelle? 

Helligkeit I(s(x, y)) ≤ 230 

Nachbarschaft ∀ q ∈ N s : |I(p(x, y)) − I(q(x q , y q ))| ≤ θ 

Phase 1: Wahl eines Saatpixels 

Die Bestimmung der Saat-Pixel erfolgt zufällig und wird für jede zu segmentierende 

Zelle ausgeführt. Da die Leistungsfähigkeit vom Seeded-Region-Growing maßgeblich 

von der Initialisierung der Saatpixel abhängt, erfolgt nach der Wahl des potentiellen

4.1 Überblick und Ablauf 23 

Saat-Punktes eine Prüfung auf dessen Eignung. Damit ein zufällig bestimmter Pixel 

s(x, y) als Saatpixel akzeptiert wird, muss er die in Tabelle (4) aufgelisteten Kriterien 

erfüllen. 

Die Motivation zur Erfüllung des ersten Kriteriums liegt klar auf der Hand: Ein Saatpixel, 

der sich innerhalb einer bereits bearbeiteten Zelle befindet, hat eine Doppelsegmentierung 

zur Folge und wird deswegen abgelehnt. 

Das zweite Kriterium soll sicherstellen, dass sich ein Saat-Pixel nicht im Zellzwischengewebe 

befindet. Ein Saat-Pixel im Zwischengewebe erschwert die Segmentierung und 

führt meist nicht zu einem sinnvollen Ergebnis. Das Gewebe zwischen den einzelnen 

Muskelfaserzellen ist bei der ATPase-Färbung, bis auf wenige Ausnahmen, überwiegend 

hell und hebt sich sehr stark von schwarzen bzw. mittelgrauen Zellen ab. Dadurch 

liefert der Intensitätswert eines Pixels einen guten Anhaltspunkt, um zwischen Zellen 

und Zwischengewebe zu unterscheiden. Desweiteren kann durch einen solchen Intensitätstest 

auch gut zwischen den verschiedenen Zelltypen unterschieden werden, so dass 

in diesem Verarbeitungsschritt auch eine Klassifikation der Zellen nach Zelltyp vorgenommen 

wird. Bisweilen kann es bei der Prüfung dies zweiten Kriteriums zu einer 

Verwechslung des Zwischengewebes mit besonders hellen Zellen kommen. Da jedoch 

die ATPase-Färbung je nach pH-Wert im Färbeprozess eine inverse Helligkeitsverteilung 

liefert, besteht das Segmentierungsziel vornehmlich aus der Konturdefinition für 

schwarze und dunkelgraue Zelltypen. 

Für das dritte Kriterium wird die Nachbarschaft N s um einen potentiellen Saatpixel 

s(x, y) überprüft. Durch ein Thresholding (siehe Gleichung 3.1) wird für alle Pixel 

q(x q , y q ) ∈ N s an Hand ihrer Intensität entschieden, ob die Elemente der Nachbarschaft 

zum selben Zelltyp wie der Saat-Pixel gehören. Sollte einer der Nachbarpixel einem 

anderen Zelltyp bzw. dem Zwischengewebe zugeordnet werden, so wird der Saat-Pixel 

verworfen. Es ist in einem solchen Fall davon auszugehen, dass sich der Saatpunkt relativ 

nah am Rand einer Faserzelle befindet. Ein Saatpunkt, der sich sehr nah am Zellrand 

befindet, steigert die Wahrscheinlichkeit zum Auslaufen der wachsenden Segmentierungsregion. 

Das hier verwendete Thresholding ist identisch mit dem Schwellwert-Test, 

der in der 2. Phase des Algortihmus angewendet wird. 

Ziel aller drei beschriebenen Kriterien ist eine möglichst optimale Wahl der Saatpixel, 

so dass diese zentral innerhalb einer Zelle liegen. 

Phase 2: Regionsinitialisierung 

Ausgehend vom gewählten Saatpixel wird in Phase zwei ein simples Regionswachstum 

initiert. Durch das bereits erwähnte Thresholding aus der zweiten Phase, wird nun ein


Regionswachstum realisiert (siehe Gleichung 3.3). Ausgehend vom Saatpixel werden 

die vier Nachbarpixel auf Regionszugehörigkeit geprüft und der Kontur des Segmentierungsbereichs 

zugeordnet. Für jeden dieser Kontur-Pixel werden wiederum alle vier 

Nachbarn abgearbeitet, so dass es zu einer Regionsausbreitung kommen kann (siehe 

Abb. 4). 

Abbildung 4: Regionsinitialisierung mit 4’er Nachbarschaft 

Die Regionsinitialisierung ist nötig, um möglichst schnell eine erste Zellform zu ermitteln, 

auf die dann die genaueren und aufwendigeren Regionstests und Formvergleiche 

ausgeführt werden. Diese erweiterten Tests benötigen für eine korrekte Ausführung 

eine Region mit einer bestimmten Mindestgröße. Das Initialwachstum wird solang ausgeführt, 

bis die Region eine ausreichende Größe hat. Das Kriterium dafür ist die Konturlänge 

und sollte je nach Auflösung des Ausgangsbildmaterials angepasst werden. Eine 

Alternative für das initialisierende Regionswachstum wäre eine statische Zelldefinition 

um den Saatpixel. Nachteilig an dieser Variante ist aber, dass es durch die pauschale 

Definition einer Initialregion bereits zur Überschreitung von Zellgranzen kommen kann. 

Eine daraus resultierende Fehlinitialisierung kann der Algorithmus zwar in begrenztem 

Maß korrigieren, jedoch verzögert dies die Segmentierung und vermidnert die Qualität 

der Ergebnisse. 

Da ATPase gefärbte Muskelfaserschnitte allgemein sehr deutliche Zellwandstrukturen 

haben, sollte das Seeded-Region-Growing ursprünglich nur das hier angewendete Regionswachstum 

mit einfachem Thresholding verwenden. In den ersten Implementierungen 

zeigte sich aber, dass die so segmentierten Regionen nur zum Teil richtig erkannt wurden. 

An vielen Stellen wuchsen die Zellbereiche über die Muskelfaserzelle hinaus und 

segmentierten das Zellzwischengewebe oder benachbarte Zellen. Auch durch eine Anpassung 

des Thresholds θ konnten diese Probleme nicht umgangen werden. Bei niedrigen 

Thresholds wurden Zellen mit hohen Intensitätsschwankungen unvollständig segmentiert. 

In Abb. (5) kann man ein Segmentierungsergebnis sehen, dass bei vollständiger 

Anwendung des naiven Regionswachstums entsteht. Die ermittelten Konturen weichen

4.1 Überblick und Ablauf 25 

stark von den eigentlichen Zellformen ab. Der Thresholding basierte Ansatz konnte also 

lediglich für eine Regionsinitialisierung genutzt werden. Die präzise Erkennung von 

Zellkonturen musste durch ein erweitertes Regionswachstum realisiert werden. 

(a) Konturen entsprechen 9 Zellregionen 

(b) Vergrößerung von Bild a 

Abbildung 5: Segmentierungsergebnis durch simples Region-Growing (θ = 35) 

Phase 3: erweitertes Regionswachstum durch 2-Means-Clustering 

In der 3. Phase erfolgt das erweiterte Region-Growing. Statt eines einfachen Thresholdings 

wie in Phase 2 wird nun ein Zuordnungsverfahren benutzt, dass auf Basis des 

2-Means-Clusterings arbeitet. Die Notwendigkeit für einen erweiterten Wachstumsalgorithmus 

ergibt sich aus den Beschränkungen, denen der einfache Ansatz unterliegt. Da 

es bei ATPase gefärbten Faserzellen zu Helligkeitsverläufen und körnigeren Bildregionen 

kommen kann, besteht die Gefahr, dass ein einfaches Thresholding eine Zellkante 

ignoriert und ausläuft oder die wachsende Region es nicht bis zur Zellwand schafft und 

vorher durch Intensitätsschwankungen gestoppt wird. Durch das erweiterte Regionswachstum 

können solche Effekte zwar nicht vollkommen verhindert, aber zumindest 

stark verringert werden. Genaue Details zu dieser Technik werden ausführlich im Abschnitt 

(4.2.3) gegeben. 

Durch die Erweiterung des Seeded-Region-Growings um das 2-Means-Clustering konnte 

nun ein Regionswachstum modelliert werden, dass nicht durch Intensitätsschwankungen 

und teilweise undeutliche Zellgrenzen negativ beeinflusst wird. Dennoch können 

bestimmte negative Effekte, wie das Auslaufen einer Region, nicht in jedem Fall von 

diesem Wachstumsansatz aufgefangen werden. Besonders in Bildbereichen, in denen


zwei Zellen gleichen Typs und damit gleicher Färbung benachbart sind, kann es leicht 

zu einem Auslaufen kommen. In Abb. (6) wurden jeweils die mittelgrauen Zellen segmentiert. 

Im Bild (6a) ist die finale Kontur zu sehen. Die Kontur hat an zwei Punkten 

einen Weg durch das Grenzgewebe gefunden. In Bild (6c) ist eine Kontur während ihrer 

Ausbreitung in die benachbarten schwarzen Zellen zu sehen. Wie in den Bildern(6b und 

d), dass eine Ausführung des Wachtums auf die jeweiligen Nachbarzellen nicht zu einer 

Übersegmentierung führen muss. Darin zeigt sich, dass das Regionswachstum sehr stark 

von der Initialisierung der Saatpixel abhängt. 

(a) (b) (c) (d) 

Abbildung 6: Auslaufen von Zellregionen in benachbarte Zellen 

Man kann schlussfolgern, dass eine hinreichend genaue Zellsegmentierung nur auf Grundlage 

der Intensitätswerte eines Muskelfaserschnittes nur schwer möglich ist. Wenn man 

die vielen Faktoren in Betracht zieht, die über die Qualität einer Muskelfaserprobe 

entscheiden, so muss eine vollautomatische Zellsegmentierung auch mit Faserbildern 

arbeiten können, die an vereinzelten Stellen keine optimale Färbung aufweisen. Da dies 

auch durch das erweiterte Regionswachstum nicht erreichbar war, musste das Seeded- 

Region-Growing um eine Formvergleichs-Komponente erweitert werden. 

Phase 4: Formvergleich mit medizinischer Datenbank 

In der 4. Phase wird die sich ausbreitende Region einem Formvergleich mit einer Datenbank 

unterzogen. Innerhalb dieser Datenbank befinden sich verschiedene Zellformen, 

die mit der aktuellen Form der Region verglichen werden. Das Ziel dieses Vergleichs ist 

es, untypische Zellformen, die durch eine auslaufende Region oder durch Einschlüsse 

im Inneren des Bereichs verursacht werden, zu erkennen. Beim Auslaufen der Region 

werden benachbarte Zellen oder Zwischengewebe mitsegmentiert, dies sorgt für eine zelluntypische 

Form, die durch den Datenbank-Vergleich erkannt wird. Im weiteren Verlauf 

wirkt sich eine geeignete oder ungeeignete Regionsform entsprechend wachstumsförderlich 

bzw. hemmend auf die Regionsentwicklung aus.

4.2 Regionswachstum 27 

Für die vorliegende Implementierung wurde eine relativ kleine, statistisch also nicht 

aussagekräftige Datenbank verwendet. Bei einem praktischen Einsatz muss auf einen 

umfangreichen medizinische Datensatz zurückgegriffen werden, der über viele Beispielformen 

mit hoher Segmentierungsqualität verfügt. Details zum genauen Ablauf der 

Formvergleiche finden sich in Kapitel(5). 

In der schematischen Übersicht (Abb.3) wird deutlich, dass mehrere verschachtelte 

Schleifen verwendet werden, um die Segmentierung einer Zelle zu erreichen. Die äußere 

Schleife wird so oft durchlaufen, wie sich noch geeignete Saatpixel im Bild finden lassen 

und es noch unsegmentierte Zellen im Muskelfaserschnitt gibt. 

Die Schleife, die Phase 3 (erweitertes Regionswachstum) umschließt, wird insgesamt 

k mal ausgeführt, bis der Algorithmus in Phase 4 eintritt (Formvergleich). Für jeden 

Durchlauf von Phase 3 wird die gesamte Kontur der aktuellen Region einmal abgearbeitet. 

Das bedeutet, für einen Durchlauf kann sich die Kontur um maximal einen Pixel 

nach außen oder nach innen bewegen oder sie verbleibt auf ihrer aktuellen Position. 

Nach k Durchläufen von Phase 3 kann sich die Kontur also um k Pixel verschoben haben. 

Je nach dem, wie groß k gewählt wird, konvergiert das Verfahren schneller zu einer 

Lösung. Problematisch ist hier eine optimale Abschätzung von k, da bei einer zu großen 

Schrittweite sich unter Umständen keine Konvergenz einstellt bzw. bei einer zu kleinen 

Schrittweite man zu viele Iterationen benötigt, um ein zufriedenstellendes Ergebnis zu 

erreichen. Die k vielen Schleifendurchläufe der 3. Phase des Algorithmus dienen als ein 

künstliches Zeitschrittmaß und erst wenn alle Schleifendurchläufe abgeschlossen sind, 

erfolgt eine Formprüfung. 

Die dritte Schleife im System beschreibt die Anzahl der Iterationen, die insgesamt 

benötigt werden, bis die Zelle vollständig segmentiert ist. Eine Iteration i besteht aus 

einem vollständigen Durchlauf der Phase 3 (mit Schleife) und einer Ausführung von 

Phase 4 (Formvergleich). Sobald das Segmentierungsergebnis präzise genug ist (Abbruchkriterium), 

gilt die Zelle als erkannt und der Algorithmus startet von vorn. 

4.2 Regionswachstum 

Das Regionswachstum im Seeded-Region-Growing erfolgt auf Grundlage einer Zuordnung 

von Pixeln zum inneren bzw. äußeren Regionsbereich. Die Prüfung, ob ein Pixel 

nach innen oder außen zuzuordnen ist, wird durch eine Mittelwertberechnung realisiert, 

die vergleichbar mit einem lokalen 2-Means-Clustering ist.


4.2.1 Regionsrepräsentation 

Beim Seeded-Region-Growing wird der segmentierte Bereich durch eine von einer Kontur 

umgebenen Region beschrieben, die mit Hilfe eines Labelingverfahrens wachsen bzw. 

schrumpfen kann. Sämtliche Pixel im Inneren des segmentierten Bereichs erhalten ein 

positives Label, während alle äußeren Bildpunkte ein negatives Label erhalten. In Abb. 

(7a) findet sich eine schematische Darstellung dieser Regionsrepräsentation. 

(a) Regionsrepräsentation durch positive / negative 

Labels 

(b) Nachbarschaft zur Ermittlung der inneren / 

äußeren Mittelwerte 

Abbildung 7: Zellrepräsentation und Mittelwertberechnung durch Labels 

Die Kontur der segmentierten Region, die in Abb.(7) rot eingefärbt ist, wird durch alle 

Pixel beschrieben, deren vier Nachbarbildpunkte unterschiedliche Labelvorzeichen haben. 

Ein Vorzeichenwechsel bei den Labels der Konturpixel bewirkt eine Veränderung 

des Konturverlaufs. Da in der vorliegenden Implementierung eine 4’er Nachbarschaft 

genutzt wird, resultiert daraus eine zwei Pixel breite Kontur, mit einer innen und einer 

außen verlaufenden Pixellinie. Wird die Nachbarschaft auf einen größeren Bereich 

ausgeweitet, hat dies eine breitere Kontur zur Folge, die aber einen höheren Verarbeitungsaufwand 

verursacht. 

Zum Zweck einer effizienten Implementierung ist es sinnvoll, alle Pixel, die zur aktuellen 

Kontur gehören, in einer seperaten Liste zu speichern, die zur Abarbeitung sequentiell 

durchlaufen werden kann. Gleichzeitig ist es vorteilhaft, eine Datenstruktur zu verwalten, 

die einen direkten Zugriff auf jeden Bildpunkt samt seines Labels ermöglicht.


4.2.2 Labeling 

Alle Pixel der aktuellen Regionskontur werden sequentiell abgearbeitet. Der Pixel an 

erster Position der Kontur-Liste wird ausgelesen und ein Label-Update berechnet. Ist 

nach dem Labelupdate die Bedingung für die Konturzugehörigkeit noch erfüllt, verbleibt 

der Pixel in der Konturliste, wird aber vom Anfang der Liste entfernt und am 

Ende angefügt. Die Liste von Konturpixeln wird also wie eine first-in-first-out Struktur 

verwaltet. 

Die Berechnung des Label-Updates basiert auf einer Mittelwertberechnung für innere 

und äußere Pixel. Innerhalb einer Nachbarschaft werden alle vorhandenen Pixel in die 

Berechnung einbezogen. In Abb.(7b) wird diese Nachbarschaft als eine 7x7 Pixel große 

Region verdeutlicht. Je nach dem, ob ein Konturpunkt näher am inneren oder äußeren 

Mittelwert liegt, wird ein positives oder negatives Labelupdate errechnet. Dieses Update 

wird auf das bereits vorhandene Label addiert. Je nach den Intensitätswerten im Bild, 

kann es zu Vorzeichenänderungen insbesondere bei den außen liegenden Pixeln kommen. 

Durch diese Vorzeichenwechsel verändert sich die Lage der Kontur. 

Durch die Addition der Labels bei jedem Umlauf zur Konturverarbeitung kann es an 

Stellen, an denen die Region ihr Wachstum bereits eingestellt hat, passieren, dass sich 

bei jeder Pixelbearbeitung das Label immer weiter aufsummiert. Für diese Konturpunkte 

steigt der Betrag des Labels stetig. Um die Beträge nicht zu groß werden zu lassen, 

werden die Labels durch ein Intervall [−a, a] begrenzt. Daraus resultierend erhalten 

Pixel, die sehr häufig bearbeitet werden, keinen höheren Wert als a bzw. −a. Das festgelegte 

Label-Intervall garantiert demnach ein möglichst dynamisches Konturverhalten, 

dass Konturveränderungen auch an Stellen ermöglicht, an denen sich die Kontur über 

viele Iterationen hinweg kaum verändert hat. Dies wird besonders wichtig, wenn zu 

später die Formvergleiche stattfinden. 

4.2.3 2-Means-Clustering 

Die Berechnung der Labels erfolgt auf Basis der Intensitätswerte eines Pixels. Zur Labelberechnung 

für einen Konturpixel p(x, y) benötigt man den inneren Mittelwert µ in (p) 

und den äußeren Mittelwert µ out (p). Die Mittelwerte werden über die Nachbarschaftsregion 

N p ermittelt, die den Pixel p(x, y) als Zentrum hat und mit ihrer Form ein Quadrat 

einer bestimmten Größe beschreibt (siehe Abb. 7b). 

N p setzt sich aus den beiden Teilmengen N in und N out zusammen, so dass N p = 

N in ∪ N out gilt. N in enthält dabei alle Pixel, die sich innerhalb der wachsenden Region 

befinden und N out entsprechend alle Punkte, die außerhalb des Bereichs liegen. Zur Un-


terscheidung der Lage eines Pixels (innen oder außen) wird die Funktion L : Ω ↦→ [−a, a] 

verwendet. L(x, y) entspricht einem Zugriff auf das Label eines Pixels (x, y). Ein positives 

Label indiziert einen innen liegenden Pixel und ein negatives Label folglich einen 

äußeren Punkt. Die am Anfang des Absatzes erwähnten Mittelwerte berechnen sich 

durch das Aufsummieren über die jeweilige Teilmenge N in bzw. N out , dividiert durch 

die Kardinalität dieser Mengen (siehe Gleichung 4.1). 

µ in (p) = 1 

‖N in ‖ · 

µ out (p) = 1 

‖N out ‖ · 

∑ 

I(x, y) 

(x,y)∈N in 

∑ 

I(x, y) 

(x,y)∈N out 

(4.1) 

Die Berechnung der Mittelwerte erfolgt analog zu einem 2-Means-Clustering. Bei einer 

Veränderung des Konturverlaufs ändert sich auch die Zusammensetzung der Teilmengen 

N in/out für einen bestimmten Pixel. Mit zunehmender Konturentwicklung passt sich der 

Konturverlauf so an, dass eine optimale Zuordnung der Bildpixel in den inneren bzw. 

äußeren Bereich stattfindet. Es sei angemerkt, dass diese 2-Means-Klassifikation nicht 

zwangsläufig einer optimalen Zellform entsprechen muss. 

Anhand der Werte µ in/out wird nun eine Gaußsche Normalverteilung verwendet, um die 

Abweichung der Intensität des Pixels p von den Mittelwerten zu bestimmen (siehe Gleichung 

4.2). Als Erwartungswert µ für die Gaußverteilung werden die vorher berechneten 

Mittelwerte µ in bzw. µ out angenommen. Das Ergebnis der beiden Gaußverteilungen p in 

und p out ist eine Wahrscheinlichkeitsdichte und dient als ein Maß für die Abweichung 

der Intensität von p von den Mittelwerten. Je weiter die Intensität I(p) vom Mittelwert 

µ in/out abweicht, desto kleiner das Resultat von p in/out (siehe Abb. 8). Der Wert ǫ in 

der Gleichung für p out stellt sicher, dass die Region eher zu einem Wachstum neigt. Für 

den Fall, dass die beiden Mittelwerte µ in/out fast identisch sind, sorgt ǫ dafür, dass die 

Wahrscheinlichkeitsdichte p in höhere Werte liefert. Daraus resultiert eine leicht erhöhte 

Wahrscheinlichkeit, dass ein Pixel (x,y) eher zum inneren Regionsbereich gezählt wird. 

p in (p) = √ 1 · exp 

(− (I(p) − µ in(p)) 2 ) 

2πσ 2σ 2 

p out (p) = 1 √ 

2πσ · exp 

( 

− (I(p) − µ out(p)) 2 + ǫ 

2σ 2 ) (4.2)


Abbildung 8: Funktionsbilder der Gleichungen aus dem Regionswachstum. (Labelberechnung) 

Ausgehend von den Wahrscheinlichkeitsverteilungen aus Gleichung (4.2) können wir 

nun eine Kostenfunktion E D (c) formulieren, die für eine Zellregion c die Güte des Konturverlaufs 

bewertet. Damit die Energiefunktion E D für die Lösung eines Energieminimierungsproblems 

geeignet ist, müssen p in und p out negativ logarithmiert werden. Wie 

in den Funktionsbildern in Abb. (8) zu sehen ist, erhält man durch Anwendung des negativen 

Logarithmus jeweils quadratische Funktionen für p in und p out . Die Gleichungen 

für −logp in/out können auch als (I(p) − µ in/out ) 2 approximiert werden. 

Wie in Gleichung (4.4) ersichtlich ist, wird auf die logarithmierten Wahrscheinlichkeitsdichten 

die Heaviside-Funktion H mit H : R ↦→ 0, 1 angewandt. Die Funktion H(x) ist 

eine in der Bildverarbeitung häufig anzutreffende Gewichtungsfunktion, deren mathematische 

Definition für in Gleichung 4.3 vorhanden ist. 

⎧ 

⎨ 

H(x) = 

⎩ 

1 wenn x > 0 

0 wenn x ≤ 0 

(4.3)


E D (c) = ∑ 

(x,y)∈Ω c 

(H(L c (x, y)) · (− logp in (x, y))+ 

(1 − H(L c (x, y))) · (− log p out (x, y))) 

(4.4) 

Die Kostenfunktion E D (c) errechnet eine Summe über alle Pixel der Regionskontur 

Ω c . Alle Punkte, die nicht zur Kontur gehören, werden durch E D (c) nicht verrechnet 

und haben nur indirekten Einfluss auf das Regionswachstum (durch die MIttelwerte). 

E D enthält für jeden Konturpixel (x, y) genau einen Summanden. Liegt der Pixel 

(x, y) nun außerhalb unserer Region, so ist sein Label L c (x, y) negativ. Dadurch bildet 

die Heaviside-Funktion auf den Wert 0 ab, folglich besteht der Summand für den Pixel 

(x,y) nur aus log p out (x, y) ab. Im Umgekehrten Fall, (x, y) liegt innen, reduziert sich der 

Summand auf log p in (x, y). Wie bereits festgestellt wurde, sind log p out/in (x, y) quadratische 

Funktionen, deren globale Minima genau an den Stellen der Mittelwerte µ out/in 

liegen. Desto näherdie Intensität eines Pixels (x, y) am zugehörigen Mittelwert liegt, 

desto niedriger ist der entsprechende Summand. Die Summe über alle Konturpunkte 

wird also minimal, wenn die enthaltenen Pixel möglichst nah an ihren zugeordneten 

Mittelwerten liegen. 

Die Energieminimierung wird beim Seeded-Region-Growing durch einen Gradientenabstieg 

realisiert. Die Funktionsweise dieser Lösungsmethode wird in Kapitel (5.4) (S.39) 

genau erläutert. Dort wird auch die Herleitung zur Gradientenberechnung ∇E D (c) gegeben, 

die für das Lösungsverfahren benötigt wird.

33 

5 Formwissen-Erweiterung zur Regionsprüfung 

Da sich eine korrekte Segmentierung der Muskelfaserzellen nicht in allen Fällen nur 

auf Basis der Intensitätswert realisieren lässt, ist es notwendig ein Bewertungssystem 

für segmentierte Regionen einzubinden, dass dem Auslaufen von Zellregionen entgegenwirken 

kann. Wie schon erklärt wurde, kann durch das aufwendig modellierte Regionswachstum 

aus Kapitel (4) eine Fehlsegmentierung zwar reduziert, aber nicht vollständig 

ausgeschlossen werden. Je nach Qualität der gefärbten ATPase Muskelfaserschnitte, 

kann es vereinzelt zur Segmentierung vom Zwischengewebe oder benachbarten Zellen 

kommen. Um diesen Effekten entgegenzuwirken, wird ein Zellformvergleich mit einer 

medizinischen Datenbank vorgenommen. 

5.1 Datenbankaufbau 

Die für die vorliegende Implementierung verwendete Testdatenbank besteht aus 15 Zellformen. 

Jede Beispielform ist durch ein 257x257 Pixel großes Bild repräsentiert, in dem 

die Zelle schwarz (Farbwert 0) und der Hintergrund weiß (Farbwert 255) sind. In der 

Implementierung wird jedoch nicht mit den erwähnten Itensitäten gerechnet. Stattdessen 

wird dem Farbwert 0 das Label 1 zugeordnet, dem Farbwert 255 hingegen das Label 

-1. Auf Basis dieser Labelzuordnung kann eine repräsentatitive Distanz zwischen zwei 

Zellformen errechnet werden. 

Die Zellformen sind im Bildraum so ausgerichtet, dass der Schwerpunkt einer Zelle identisch 

mit dem Bildmittelpunkt (129,129) ist. Die Ausrichtung der Zellformen an ihrem 

Schwerpunkt ist wichtig, damit zwei zu vergleichende Zellen bei der Ähnlichkeitsberechnung 

möglichst deckungsgleich aufeinander passen. Eine Verschiebung der beiden 

Formen resultiert in einer Verfälschung des Formvergleichs. 

Während die Schwerpunkte der Datenbankformen nur einmalig berechnet werden müssen 

und anschließend unverändert bleiben, muss der Schwerpunkt der wachsenden Zellregion 

bei jedem Formvergleich neu berechnet werden (wegen möglicher Formveränderungen). 

Da sich die Bildräume der Datenbank (Ω DB ) und der Bildraum der Muskelfaserzellen 

(Ω) in ihrer Größe unterscheiden, der Schwerpunkt der wachsenden Zelle aber im 

Bildraum Ω errechnet wird, muss eine Transformation für die gesamte aktuelle Zellform 

stattfinden. Der dafür nötige Translationsvektor transformiert die segmentierte Region 

in den Bildraum Ω DB , so dass die Schwerpunkte der Datenbankformen mit dem der 

Zellregion übereinstimmen.

34 5 FORMWISSEN-ERWEITERUNG ZUR REGIONSPRÜFUNG 

(a) 

(b) 

Abbildung 9: Repräsentation von 2 Datenbank-Formen mit eingezeíchnetem Schwerpunkt(rot) 

5.2 Skalierungsinvarianz 

Für die Durchführung eines Formvergleichs ist, neben der Ausrichtung der Zellformen 

am Schwerpunkt, auch die Größe der zu vergleichenden Formen von Relevanz. Während 

die Beispielzellen in der Datenbank einen ähnlichen Flächeninhalt haben, kann die wachsende 

Region signifikant kleiner oder größer als die vorhandenen Datenbankformen sein. 

Besonders in den ersten Verarbeitungsdurchläufen ist der ermittelte Bereich meist viel 

kleiner, als die Bilder der Datenbank. Zu einem späteren Zeitpunkt, wenn das Regionswachstum 

fortgeschritten ist oder es eventuell zu Fehlsegmentierungen kommt, ist der 

Bereich meist größer als die Beispielformen. Für den Fall, dass eine Zellregion kleiner 

als eine Datenbank-Form ist, liefert der Formverlgeich keinerlei Bestrafung. Umgekehrt, 

wenn eine Zelle größer als die Trainingsformen wird, so bestraft der Formvergleich diese 

Entwicklung und versucht ihr durch eine entsprechende Labelberechnung entgegen zu 

wirken. Die Absicht in dieser Modellierung ist klar: Eine Zellform, die an bestimmten 

Stellen Zwischengewebe oder benachbarte Zellen mitsegmentiert, soll durch diese Bestrafung 

verhindert werden. Wenn aber die Bilddaten im Muskelfaserschnitt besonders 

große Zellen beinhalten, die die Größen der Trainingsformen überschreiten, so wird auch 

hier der Formvergleich einem weiteren Wachstum entgegenwirken, selbst wenn es auf 

Grundlage des Muskelfaserbildes legitim ist. 

Es bietet sich also an dieser Stelle an eine Skalierungsinvarianz zu nutzen. Dazu wird 

anhand der Flächeninhalte der Datenbankformen (Berechnung des Durchschnitts) und 

der Fläche der aktuellen Zellregion ein Skalierungsfaktor ermittelt. Mit Hilfe dieses Skalierungsfaktors 

können nun alle Datenbankformen möglichst passend auf die Zellregion

5.3 Parzenschätzer 35 

skaliert werden, so dass Größenunterschiede keinen Einfluss mehr auf den Formvergleich 

haben. 

In den praktischen Tests zum Seeded-Region-Growing hat sich aber gezeigt, dass der 

Formvergleich durch Nutzung der Skalierungsinvarianz nicht mehr so effektiv gegen auslaufende 

Zellregionen vorgehen kann. Man steht also vor dem Problem, dass ohne Einsatz 

der Skalierungsinvarianz untypische Zellformen zwar bestraft werden, gleichzeitig 

aber das Regionswachstum ab einer bestimmten Größe behindert wird. Im umgekehrten 

Fall kann eine Zelle zwar beliebig groß werden, es wird aber schwerer ungeeignete Zellformen 

zu verhindern. Desweiteren sollte durch die Datenbankzellformen keine Bevorzugung 

bestimmter Zellgrößen entstehen, sondern lediglich Zellformen bewertet werden. 

Schließlich ist ein Ziel der Segmentierung von Muskelfaserzellen, die Größenverhältnisse 

der erkannten Zelltypen zu berechnen. Wenn durch eine Formdatenbank bestimmte 

Zellgrößen bevorzugt werden, kann dadurch die Zellgrößenberechnung verfälscht werden. 

Eine optimale Lösung für das umrissene Problem lässt sich nicht einfach finden. Grundsätzlich 

gilt, dass der Einfluss der Datenbank auf das Segmentierungsergebnis immer niedriger 

sein sollte, als der Einfluss, der sich aus den Muskelfaserbildern ergibt. Letztlich 

sollen die im Faserschnitt vorhandenen Zellen möglichst unverfälscht erkannt und bewertet 

werden. Eine Skalierungsinvarianz ist dann sinnvoll, wenn die Flächeninhalte 

der Zellregion massiv von denen in der Datenbank abweichen. Es sollte also keine generelle 

Skalierungsinvarianz angewendet werden, sondern nur in Fällen, wo mit hoher 

Wahrscheinlichkeit von einer großen Muskelzelle im Faserbild ausgegangen werden kann. 

Durch geeignete Gewichtung zwischen dem Ragionswachstum und dem Formvergleich, 

in Kombination mit einer partiellen Skalierungsinvarianz bleiben die Segmentierungsergebnisse 

möglichst unverfälscht und gleichzeitig können immer noch negative Segmentierungen 

gehemmt werden. 

5.3 Parzenschätzer 

Zur Modellierung des Formvergleichs ist die Definition eines Ähnlichkeitsmaßes notwendig. 

Betrachtet man eine einzelne Datenbankform, so kann das 257x257 Pixel große 

Bild auch als ein Punkt in einem 257x257 dimensionalen Raum aufgefasst werden. Statt 

einfach die Distanz zwischen verschiedenen Punkten innerhalb dieses Vektorraumes zu 

ermitteln und so ein Ähnlichkeitsmaß zu definieren, kann durch Anwendung des Parzenschätzers 

ein Ähnlichkeitsmaß definiert werden, dass die Wahrscheinlichkeitsdichte 

über alle vorhandenen Datenbankformen in Betracht zieht.


Zunächst wollen wir die allgemeine Funktionsweise des Parzenschätzers erläutern, um 

im Anschluss genauer auf die Modifikationen einzugehen, die für das Seeded-Region- 

Growing vorgenommen wurden. Der Parzenschätzer errechnet eine Wahrscheinlichkeitsdichte 

für einen bestimmten Punkt x in einem Raum R d mit n-vielen Datenpunkten x i . 

Die Berechnung der Wahrscheinlichkeitsdichte wird durch die Definition eines Parzenfensters 

realisiert. Dieses Fenster ist auf unseren Punkt x zentriert und je nach Größe 

des Fensters sind entsprechend mehr oder weniger Datenpunkte x i im Fenster vorhanden. 

Im Fall der Zellformvergleiche ist der Punkt x als unsere aktuell wachsende Region 

zu verstehen. Die Datenpunkte x i sind die in der Datenbank vorhandenen Zellformen. 

Zur Definition eines sogenannten Parzenfensters wählen wir uns einen Bereich N x dessen 

Mittelpunkt x ist und der sich innerhalb des Raumes R d befindet. N x kann als Hyperkubus 

mit den Kantenlänge h(n) interpretiert werden. Durch Variation der Kantenlänge 

können wir das so definierte Parzenfenster in seiner Größe verändern und die Ergebnisse 

des Parzenschätzers für ein bestimmtes x lenken. Im Idealfall ist die Größe des Parzenfensters 

invers abhängig von der Anzahl n der vorhandenen Datenpunkte x i im Raum 

R d . Das bedeutet: Je mehr Datenpunkte (Trainingsformen) x i im Raum R d vorhanden 

sind, desto kleiner kann das Parzenfenster gewählt werden. Aus Gleichung 5.1 wird die 

Definition des Volumens des Hyperkubus bzw. Parzenfensters deutlich [dS01]. 

V (n) = h d (n) (5.1) 

Gleichung 5.2 beschreibt eine Funktion ϕ(v), die für einen Punkt/Vektor v ein Gewicht 

definiert. Im vorliegenden Fall bildet ϕ(v) lediglich auf die Gewichte 0 und 1 ab und 

dient damit als eine Zählfunktion, die für alle Vektoren v deren Betrag kleiner als 0.5 ist, 

eine 1 und sonst eine 0 zurück gibt. Wie wir in der nächsten Gleichung sehen werden, 

lässt sich dadurch die Anzahl der Datenpunkte x i errechnen, die sich im Parzenfenster 

befinden. 

⎧ 

⎨ 

ϕ(v) = 

⎩ 

1 wenn |v| ≤ 1/2 

0 sonst 

(5.2) 

Die Funktion k(n) aus Gleichung 5.3 ermittelt die Anzahl der Datenpunkte x i , die sich 

innerhalb des um x zentrierten Parzenfensters befinden. Für jede vorhandene Traininsgform 

x i wird der Vektor (x − x i ) berechnet und durch die Seitenlänge h(n) des 

Hyperkubus normiert. Das bedeutet, dass der Betrag des normierten Vektors genau 

dann im Intervall [0, 1/2] liegt, wenn sich x i innerhalb des Parzenfensters befindet. Für

5.3 Parzenschätzer 37 

einen solchen Fall bildet die aus Gleichung 5.2 bekannte Funktion ϕ(v) auf den Wert 1 

ab. Es werden also alle Datenpunkte x i gezählt, die im Parzenfenster liegen. 

k(n) = 

n∑ 

( ) x − xi 

ϕ 

h(n) 

i=1 

(5.3) 

Mit der Anzahl der im Hyperkubus vorhanden Datenpunkte x i kann nun die Kerndichteschätzung 

durch den Parzenschätzer vorgenommen werden. Das Resultat von p(x, n) 

aus Gleichung (5.4) liefert einen hohen Wert, wenn viele Datenpunkte x i im Parzenfenster 

um x vorhanden sind, das heißt wenn unser Punkt x zu möglichst vielen Trainingsformen 

x i möglichst ähnlich ist. Je weniger Formen x i in der Nähe des Punktes x 

vorhanden sind, desto niedriger das Resultat. 

p(x, n) = 1 

nV (n) · 

n∑ 

( ) x − xi 

ϕ 

h(n) 

i=1 

(5.4) 

Die aus Gleichung (5.4) ermittelte Wahrscheinlichkeitsdichte für einen Punkt x, kann 

als ideales Maß für die Ähnlichkeit von x zu den vorhandenen Trainingsformen x i genutzt 

werden. Zur Anwendung auf den Zellformvergleich, müssen aber noch ein paar 

Modifikationen vorgenommen werden. Diese betreffen insbesondere die Definition des 

Parzenfensters. Der besprochene Hyperkubus wird durch seine Seitenlänge h(n) definiert, 

die wiederum von der Anzahl n der vorhanden Trainingsformen abhängt. Die 

Modellierung des Parzenfensters durch einen Hyberkubus führt aber zu einer strikten 

diskreten Trennung zwischen Trainingsformen, die innerhalb des Fensters liegen und 

berücksichtigt werden bzw. Formen die außerhalb sind [dS01]. 

Für einige Anwendungen ist ein solches Modell zwar ausreichend, doch gerade wenn 

die Anzahl der Trainingsformen beschränkt ist, ist es wünschenswert eine eher diffuse 

Definition des Parzenfensters zu haben. Statt durch den Hyperkubus eine Selektion 

unter den vorhandenen Trainingsformen zu forcieren, ist es besser alle Trainingspunkte 

zu berücksichtigen und dabei ihre Distanz zum Fenstermittelpunkt in Betracht zu 

ziehen. Dies erreicht man, indem die Kernfunktion ϕ als Gaußverteilung angenommen 

wird. Diese Modifikation der Gleichung (5.4) wird in der Formel (5.5) gezeigt. Um zu 

verdeutlichen, dass es sich in unserer Anwendung um Zellformen handelt, wird statt 

der bisherigen allgemeinen Formulierung x von nun an c verwendet. Je stärker sich eine 

Trainingsform c i von der Zellregion c unterschiedet, desto niedriger das Ergebnis der 

Gaußverteilung. Es werden jetzt alle vorhandenen Trainingspunkte berücksichtigt und 

nicht nur die innerhalb des beschriebenen Hyperkubus.


p(c) = 1 n · 

n∑ 

i=1 

( ) 

exp − d2 (c, c i ) 

2σ 2 

(5.5) 

Die Distanz zwischen zwei Zellformen berechnet sich durch d 2 (c, c i ) und ist in Gleichung 

(5.6) gegeben. Für jeden Pixel (x, y) ∈ Ω DB wird die Distanz aus den Labels gebildet 

und quadriert. Ω DB ist der 257x257 Pixel große Bildraum in dem die Datenbankformen 

repräsentiert werden. Je nachdem, ob das Seeded-Region-Growing nun mit einer Skalierung 

der Trainingsformen arbeitet oder nicht, kann der Bildraum Ω DB auch kleiner oder 

größer der genannten Ausdehnung sein. Die einzelnen Einträge der Vektoren c bzw. c i , 

entsprechen den einzelnen Pixeln im Datenbankbildraum und ermöglichen einen Zugiff 

auf Labels, die die Zellform beschreiben. Der Zugriff auf das Labeling wird durch 

L : Ω DB ↦→ −1, 1 realisiert, so dass ein Label von −1 einen außerhalb der Zellform liegenden 

Pixel (x, y) anzeigt. L(x, y) = 1 entspricht einem innen liegenden Punkt. L(x, y) 

ist an dieser Stelle nicht mit den Labels aus dem Bildraum des Muskelfaserschnittes Ω 

zu verwechseln. 

d 2 (c, c i ) = 

∑ 

(L c (x, y) − L ci (x, y)) 2 (5.6) 

(x,y)∈Ω DB 

Aus Gleichung 5.5 wird deutlich, dass die Größe des Parzenfensters nun durch die 

Standardabweichung σ gesteuert wird. Wie auch in der allgemeinen Definition des Parzenschätzers 

ist es besonders wichtig einen geeigneten Wert für σ zu wählen. 

σ sollte so gewählt werden, dass die Gaußverteilung für einen bestimmte Trainingsform 

c i (der Erwartungswert) möglichst die am nächsten gelegenen anderen Zellformen miteinschließt. 

In [dS01] wird eine Standardabweichung von σ = 1/ √ n vorgeschlagen, die 

als Initialisierung verwendet und im späteren Verlauf optimiert werden kann. Hierbei ist 

n die Anzahl der vorhandenen Trainingsformen. Bei anderen Segmentierungsverfahren 

wurden ebenfalls Kerndichteschätzungen verwendet, um Segmentierungsergebnisse mit 

bestimmten Trainingsformen zu vergleichen. Die praktischen Tests haben gezeigt, dass 

für das Seeded-Region-Growing der von Cremers, Osher und Soatto vorgeschlagenen 

Ansatz zur Abschätzung von σ besonders geeignet ist. Die Abschätzung erfolgt über 

die durchschnittliche Distanz jeder Trainingsform zu ihrem nächsten Nachbarn. Mathematisch 

ausgedrückt ergibt sich die Formel aus Gleichung (5.7). Es wird also für jede 

Trainingsform c i der nächste Nachbar c j ermittelt, der folglich die kürzeste Distanz zu 

c i hat. Über diese Distanzen wird anschließend gemittelt [COS06].

5.4 Gradientenabstieg 39 

σ 2 = 1 n · 

n∑ 

i=1 

min 

i≠j d2 (c i , c j ) (5.7) 

Aus den bis hierher erläuterten Gleichungen (5.5 - 5.7) können wir nun eine auf Formwissen 

basierte Energiefunktion aufstellen. Die Energiefunktion E v (v für Vorwissen) 

wird, wie in Gleichung (5.8) zu sehen ist, negativ logarithmiert. Dies dient der Optimierung 

der Energiefunktion für das später angewandte Lösungsverfahren. 

E v (c) = − log(p(c)) (5.8) 

Die Energiefunktion des Regionswachstums E D (siehe Gleichung 4.4), die auf den Bilddaten 

des Muskelfaserschnittes beruht, und die gerade beschriebene Energiefunktion 

Ev, die auf dem Vorwissen über mögliche Zellformen basiert, können nun zu einer gemeinsamen 

Kostenfunktion E kombiniert werden (siehe Gleichung 5.9). Die Parameter 

α und β dienen der Gewichtung zwischen den beiden Energiefunktionen. Da E D und E v 

beim zunehmendem Wachstum der Zellregion c gegenläufige Segmentierungsziele verfolgen, 

ist es nun notwendig dieses Energieminimierungsproblem zu lösen (siehe Kapitel 

3.3). E D wird minimal, wenn sich die Zellkontur ideal an den Intensitätswerten im Bild 

ausrichtet, während E v für eine Zellform minimal wird, die möglichst nah an den vorgegebenen 

Trainingsformen liegt. Man sucht eine Zellform c für die hier ein optimaler 

Kompromiss gefunden wird. 

E(c) = α · E v (c) + β · E D (c) (5.9) 

5.4 Gradientenabstieg 

Ausgehend von Gleichung (5.9) können wir nun einen Gradientenabstieg durchführen, 

um das formulierte Energieminimierungsproblem zu lösen. In Gleichung (5.10) wird 

das Vorgehen bei diesem iterativen Lösungsweg verdeutlicht. Unsere wachsende Region 

c fassen wir als einen Punkt im Raum R d auf. Für d = 257 · 257 umfasst R d alle 

möglichen Formausprägungen, die auf einem Bildraum der Größe 257x257 durch binäre 

Formdefinition beschreibbar sind. 

In Bezug auf das Iterationsschema aus Gleichung (5.10) können wir für den Punkt c alt 

die Kostenfunktion E(c alt ) auswerten. E(c alt ) bewertet die Güte unserer Region und ist 

umso kleiner, je besser c alt unseren zwei Modellannahmen E D und E v genügt. Berechnen 

wir nun den Gradienten von E(c alt ), so zeigt dieser wie gewohnt in Richtung des höchs-


ten Dichteanstiegs und weißt so zu den Zellformen in R d , für die unsere Kostenfunktion 

am stärksten ansteigen würde und die somit unerwünschte Segmentierungsergebnisse 

darstellen. 

Da der Gradient ∇E(c alt ) ein Vektor ist und auch unser Punkt c alt als ein Ortsvektor 

im Raum R d interpretiert werden kann, ist es durch die Subtraktion beider Vektoren 

möglich, einen Punkt c neu zuermitteln, für den die Kostenfunktion E(c neu ) kleiner wird 

und somit c neu ein besseres Segmentierungsergebnis ist. Nach Ausführung der Gleichung 

(5.10) gilt also: E(c neu ) < E(c alt ). Wir können so iterativ eine Lösung c ermitteln, die 

sich schrittweise immer näher zu einer lokal optimalen Lösung entwickelt. 

c neu = c alt − ∇E(c alt ) (5.10) 

Um den Gradienten von E(c alt ) zu berechnen, benötigen wir die partiellen Ableitungen. 

Da c alt auch als Vektor der Form c alt = (c (0,1) c (0,2) · · · c (x,y) · · · c (257,257) ) T geschrieben 

werden kann, können wir entsprechend die Kostenfunktion umformulieren als 

E(c alt ) = E((c (0,1) c (0,2) · · · c (x,y) · · · c (257,257) ) T ). Die Komponenten des Gradienten 

und somit die partiellen Ableitungen werden durch ∂E(c) 

∂c (x,y) 

definiert. Durch Einsetzen 

der Energiefunktionen E D und E v in die Komponenten des Gradienten ∇E(c) ergibt 

sich, dass man entsprechend die Gradienten ∇E D und ∇E v berechnet, die anschließend 

komponentenweise summiert werden (siehe Gleichung 5.11). Durch die bereits 

eingeführten Gewichte α und β erfolgt letztlich eine Skalierung der beiden Gradienten. 

Das heißt unser vorläufiges Ergebnis c alt kann sich, je nach Ausprägung der Gewichte, 

stärker dem einen Segmentierungsziel (E v ) oder dem Anderen (E D ) annähern. 

∇E(c) = α · ∇E v (c) + β · ∇E D (c) (5.11) 

Wie aus Gleichung (5.11) hervorgeht, müssen die Gradienten für E v (c) und E D (c) errechnet 

werden. Zunächst soll dazu die Herleitung für ∇E v (c) erfolgen. Im Anschluss 

wird dann die Herleitung des Gardienten für E D (c) präsentiert. In Gleichung (5.8) wurde 

E v (x) = −log(p(c)) definiert. Da die Komponenten des Gradienten aus den partiellen 

Ableitungen bestehen, können wir anhand der Ableitung E v ′ (c) = −p′ (c)/p(c) mit der 

Berechnung fortfahren. Schlussfolgernd aus E v ′ erhalten wir Gleichung (5.12), in der 

gezeigt wird, dass man den Gradienten ∇p(c) berechnen muss, um ∇E v (c) zu erhalten. 

∇E v (c) = − ∇p(c) 

p(c) 

(5.12)

5.4 Gradientenabstieg 41 

Zur Berechnung des Gradienten von p(c) aus Gleichung (5.12) benötigen wir die erste 

Ableitung p ′ (c), um auf die partiellen Ableitungen zu schließen. In Gleichung (5.13) 

werden die Formeln für p(c), p ′ (c) und daraus folgend ∇p(c) vorgestellt. 

p(c) = 1 n · 

p ′ (c) = 1 n · 

∇p(x) = 1 n · 

n∑ 

i=1 

n∑ 

i=1 

n∑ 

i=1 

( ) 

exp − d2 (c, c i ) 

2σ 2 

( 

exp − d2 (c, c i ) 

) 

· 

2σ 2 

( ) 

exp − d2 (c, c i ) 

· 

2σ 2 

( 

− d2 ′ ) 

(c, c i ) 

2σ 2 

( ) 

− ∇d2 (c, c i ) 

2σ 2 

(5.13) 

Aus der letzten Zeile der oberen Gleichung ist ersichtlich, dass wir den Gradienten von 

d 2 (c, c i ) berechnen müssen, um letztlich ein Ergebnis zu erhalten. In Formel (5.14) wird 

zuerst die Ableitung d 2 ′ (c, c i ) vorgestellt, um dann den Gradienten und die partielle 

Ableitung zu erläutern. 

d 2 (c, c i ) = 

∑ 

(L c (x, y) − L ci (x, y)) 2 

(x,y)∈Ω DB 

d 2 ′ (c, c i ) = 

∑ 

2 · (L c (x, y) − L ci (x, y)) 

(x,y)∈Ω DB 

( ∂d 

∇d 2 2 (c, c i ) 

(c, c i ) = 

∂L c (0, 0) · · · ∂d 2 (c, c i ) 

∂L c (x, y) · · · ∂d 2 (c, c i ) 

∂L c (257, 257) 

∂d 2 (c, c i ) 

∂L c (x, y) = 2 · (L c(x, y) − L ci (x, y)) 

) T 

(5.14) 

Abschließend kann gesagt werden, dass durch die Gradientenabstiegsberechnung für 

jeden Pixel innerhalb des Bildraumes Ω DB ein Label berechnet wird. Die Labeluppdates 

müssen wieder in den Bildraum des Muskelfaserschnitts Ω transformiert werden, um 

dort auf die richtigen Pixel aufsummiert zu werden. 

Es verbleibt die Herleitung des Gradienten für die Kostenfunktion E D (c). Analog zur 

Gradientendefinition von E v (c) gilt auch für ∇E D (c), dass sich die Komponenten des 

Gradienten aus den partiellen Ableitungen nach L(x, y) zusammensetzen. Dadurch, 

dass die Mittelwerte µ in und µ out vom jeweiligen Konturverlauf abhängen, müssten 

bei der partiellen Ableitung des Gradienten auch die Wahrscheinlichkeitsdichtefunktio-


nen p in und p out berücksichtigt werden. Zur Vereinfachung wird diese Abhängigkeit im 

Gradientenabstieg nicht berücksichtigt. Durch diese Vereinfachung muss bei der Ableitung 

der Energiefunktion E D (c) aus Gleichung (5.15) lediglich die Heaviside-Funktion 

berücksichtigt werden (siehe Gleichung 5.16). 

E D (c) = ∑ 

(H(L c (x, y)) · (− log p in (x, y))+ 

(x,y)∈Ω c (5.15) 

(1 − H(L c (x, y))) · (− logp out (x, y))) 

E D ′ (c) = ∑ 

(x,y)∈Ω c 

H ′ (L c (x, y)) · (− log p in (x, y) + log p out (x, y)) (5.16) 

Aus der Ableitung E D ′ (c) können wir nun schlussfolgern, dass sich ∇E D (c) aus dem 

Gradienten von H(L(x, y)) berechnet (siehe Gleichung 5.17). 

∇E D (c) = ∇H(L c (x, y)) · (− logp in (x, y) + log p out (x, y)) 

( 

) T 

∂H(L(x, y)) 

∇H(L(x, y)) = · · · · · · 

(5.17) 

∂L(x, y) 

∀(x, y) ∈ Ω c 

Gradientenvektor von H(L(x, y)) enthält als Einträge die partiellen Ableitungen von 

H(L(x, y)). Da die Heaviside-Funktion eigentlich nicht differenzierbar ist, muss man 

zur Berechnung der Ableitung eine Approximation für H annehmen. Dazu wird eine 

Funktion δ (Dirac-Stoß) eingeführt, unter der Annahme, dass δ(x) = H ′ (x) gilt. Durch 

diese Vereinfachung ist es nun möglich eine nummerische Approximation von H(x) zu 

erhalten, die differenzierbar ist. Eine elegante Vorgehensweise wird dafür in [CV01] 

gegeben, wobei die dort vorgeschlagene Approximation von H(x) in Gleichung (5.18) 

aufgeführt ist. 

H ǫ (x) = 1 2 

( 

1 + 2 π arctan ( x 

ǫ) ) (5.18) 

Mit Hilfe der Gradienten für E D und E v kann der Gradientenabstieg durchgeführt werden. 

Ein Unterschied zwsichen den beiden Herleitungen wirkt sich aber besonders auf 

die Implementieruung aus. Während für die Berechnung von ∇E v Labels im Bildraum 

Ω DB verrechnet werden, wird bei ∇E D lediglich auf dem Bildraum Ω c gearbeitet. Die

5.5 Parameter des Seeded-Region-Growing 43 

beiden Räume unterscheiden sich in der Form, dass Ω c nur Pixel der Regionskonutr 

enthält, Omega DB hingegen alle Pixel des Datenbankbildraumes umfasst. Damit die 

aus dem Formvergleich stammenden Labels sich nicht auf Bildbereiche auswirken, die 

für das aus E D erzeugte Labeling nicht beeinflussbar sind, werden die Labelupdates 

für beide Energien nur für das sogenannte Narrow-Band, also die Regionskontur aufsummiert. 

Dadurch, dass die Labelupdates der beiden Energiefunktionen unabhängig 

voneinander ausgeführt werden und dies unterschiedlich häufig passiert, müssen die 

Gradienten entsprechend skaliert werden. 

5.5 Parameter des Seeded-Region-Growing 

Im folgenden Kapitel wird sich eine Betrachtung über die verschiedenen Parameter 

des Seeded-Region-Growings anschließen. Wie wir in den vorangegangenen Abschnitten 

gesehen haben, gibt es sehr viele Werte, die den Ablauf des Algorithmus signifikant 

beeinflussen. Es ist daher sinnvoll einen Überblick über die Segmentierungsergebnisse 

bei bestimmten Parametereinstellungen zu geben und die Bedeutung und Auswirkungen 

bestimmter Parameter explizit zu erläutern. Die nachfolgende Liste zählt die wichtigsten 

Parameter vom Seeded-Region-Growing Ansatz auf und erklärt deren Auswirkungen auf 

das Segmentierungsergebnis einer Zelle. 

• Zeitintervall / Konturdurchläufe (k) 

k beschreibt die Anzahl der Abarbeitungen der Kontur. In jedem Abarbeitungszyklus 

wird die aktuelle Regionskontur einmal durchlaufen und für jeden Pixel wird 

ein Regionswachstumstest (siehe Gleichung 4.2 und 4.4) durchgeführt. Sind k-viele 

Zyklen durchlaufen (siehe auch Abb. 3) erfolgt ein Formvergleich. Die Wahl des 

Paramters k beeinflusst die Zeitabstände in denen ein Formvergleich stattfindet. 

Ein sehr niedriges k sorgt für häufige Formvergleiche. Erfolgen die Datenbankabgleichungen 

in kurzer zeitlicher Folge, so garantiert dies eine ständige Kontrolle der 

wachsenden Zellregion, steigert aber auch den Rechenaufwand. Die wachsende Region 

hat zwischen den Vergleichen kaum Zeit ihre Form signifikant zu verändern. 

Gerade bei großen Formdatenbanken können zu häufige Formvergleiche sehr viel 

Rechenaufwand nach sich zeihen und so die Segmentierung verlangsamen. 

Sind die Zeitabstände k für die Formvergleiche zu groß gewählt, so ist es möglich, 

dass der Algorithmus nicht die optimale Kontur ermitteln kann, weil der Formvergleich 

zu selten stattfindet und im Gegenzug das Regionswachstum auf Basis 

der Bilddaten dominiert. Ein weiterer Faktor bei der Wahl des Parameters k


ist eine Abstimmung auf die Gewichtung der Datenbanklabels (α).Bei häufigen 

Datenbankvergleichen sollte α verkleinert werden, im umgekehrten Fall ist eine 

Vergrößerung angemessen. 

• Regionsgröße (N p und N s ) 

Wie in Kapitel (4.2.3) erläutert wurde, erfolgt das Regionswachstum auf Grundlage 

der Intensitätswerte im Muskelfaserbild. Der Parameter N p definiert die Größe 

einer Nachbarschaftsregion um einen Pixel p. Innerhalb dieser Region werden alle 

Pixel anhand ihrer Labels in zwei Klassen unterteilt: Innerhalb bzw. außerhalb 

der Region. Für jede dieser Teilmengen, die wir mit N in und N out bezeichnet 

hatten, wird ein Mittelwert µ in/out errechnet. Auf Basis dieser Mittelwerte erfolgt 

dann eine Klassifizierung des Pixels p. Je größer man die Nachbarschaft N p wählt, 

desto großflächiger werden die Intensitätsinformationen in eine Klassifikation von 

p einbezogen. Markante Intensitätsänderungen im Bildraum (z.B. durch Zellzwischengewebe) 

wirken sich beim Wachstum der Region früher auf die Mittelwerte 

aus, als wenn die betreffende Nachbarschaft N p sehr klein ist. Nachteilig an einer 

möglichst großen Nachbarschaft ist aber ein quadratisch ansteigender Rechenaufwand 

bei der Mittelwertbildung. Während bei einer 10x10 Pixel großen Region 

über 100 Pixel gemittelt werden müssen, sind es bei einer Region von 20x20 Pixeln 

bereits 400 Bildpunkte. Wie wir im Kapitel (6) sehen werden, kann gerade 

die erwähnte Mittelung über Nachbarschaftsregionen weitaus effizienter erfolgen, 

als in der vorliegenden Implementierung. Hier hat die Region N p eine Größe von 

30x30 Pixeln. Die Region N s ist mit N p vergleichbar und beschreibt einen Suchraum 

in dem die Gültigkeit eines Saatpixels bewertet wird. Je nach Regionsgröße 

und dem Threshold θ können die Rückweisungsraten von zufällig gewählten Saatpixeln 

erhöht oder verringert werden. Je kleiner N s , desto unwahrscheinlicher ist 

eine Rückweisung eiens Pixels. 

• Standardabweichung (σ) 

Je nach Größe von σ ergibt sich eine stärkere oder schwächere Streuung der Normalverteilung. 

Je größer σ ist, desto breiter streut die Normalverteilung um den 

Erwartungswert µ. Wenn die Standardabweichung zu klein gewählt wird, kann im 

Fall der Formvergleiche die Normalverteilung keine anderen Datenbank-Formen 

miteinschließen. Dies ist für eine Berechnung der Labels ungünstig. Es sollten 

sowohl für das Regionswachstum, als auch für die Formvergleiche seperate Standardabweichungen 

verwendet werden. Eine gute Annahme für σv 2 (E v) ist der in 

Gleichung (5.7) präsentierte Ansatz.

5.5 Parameter des Seeded-Region-Growing 45 

• DB-Gewichtung (α) 

Der Skalierungsfaktor α verstärkt bzw. vermindert den Einfluss, den die Formvergleiche 

auf die Labelentwicklung haben. Wird α zu klein gewählt, so ist der 

Einfluss der Datenbankvergleiche möglicherweise zu gering und das auf den Bildinformationen 

basierte Regionswachstum dominiert das Segmentierungsergebnis. 

Ist hingegen α zu groß gewählt, hat die Datenbank zu viel Einfluss auf die Segmentierung 

und behindert das Regionswachstum, so dass das Segmentierungsergebnis 

sich mehr den Datenbankformen annähert, als sich an den Bilddaten im Muskelfaserschnitt 

zu orientieren. 

• Bildgewichtung (β) 

Der Skalierungsfaktor β hat die gleichen Auswirkungen auf die Segmentierung, wie 

der Faktor α. Eine Abstimmung beider Werte ist notwendig, damit sich Formvergleich 

und Regionswachstum gut miteinander ergänzen. In den vorhanden Bespielbildern 

(??) wurde zum Beispiel mit den Werten α = 1000 und β = 1 gearbeitet. 

• Labelinterval ([−a, a]) 

Wie im Abschnitt 4.2.2 bereits erklärt wurde, sind die Labels beim Seeded-Region- 

Growing auf ein Intervall [−a, a] beschränkt. Ziel dieser Begrenzung ist es, dass 

sich an bestimmten Stellen der Kontur die Labels nicht zu stark in eine Richtung 

entwickeln können. An Stellen, wo die Kontur vorerst eine feste Position 

eingenommen hat, summieren sich die Labels stark in eine Richtung (positiv bzw. 

negativ). Es hat sich gezeigt, dass das Labelinterval so gewählt werden sollte, dass 

das Labelupdate der Formvergleiche, innerhalb des Labelintervals liegt. Dadurch, 

dass die Formvergleiche seltener stattfinden, als Berechnungen zum Regionswachstum, 

müssen die Labelupdates aus dem Datenbankvergleich meist höher gewichtet 

werden. Dadurch ergeben sich aber Labelwerte, die merklich größer sind, als 

die Labels aus dem Regonswachstum. Sollte das Labelintervall zu klein gewählt 

werden, wird damit auch der Einfluss der Formvergleiche stark beschränkt. Ein 

Intervall von [−20, 20] bzw. [−40, 40] liefert gute Segmentierungsergebnisse. Je 

nach Initialisierung der außenliegenden Labels, ergibt sich ein schnelles oder verlangsamtes 

Regionswachstum. Wird der Bildraum Ω zu Beginn mit L = −20 

definiert, verlangsamt sich das Wachstum, da die Labelupdates aus dem Regionswachstum 

(E D ) den hohen Betrag der Labelinitialisierung abarbeiten müssen. 

Eine Labelinitialisierung von L = −1 sorgt hingegen für ein schnelles Wachstum, 

da die Labelupdates aus E D schneller einen Vorzeichenwechsel erzeugen können.


• Threshold (θ) 

Der Threshold θ wird zunächst für die Bewertung der zufällig erzeugten Saatpixel 

verwendet. Im weiteren Ablauf des Algorithmus wird θ auch als Threshold 

für die Regionsinitialisierung genutzt (siehe Abb. 3). Ein kleiner Threshold beschränkt 

die Regionsinitialisierung und sorgt für eine hohe Rückweisungsrate bei 

den zufälligen Saatpixeln. Wird θ groß gewählt, ist die Initialisierung der Region 

unbeschränkt. Es kann dann leichter zu einer Überschreitung der Faserzelle kommen. 

Ebenso steigt die Gültigkeitsrate für die Saatpixel, was im ungünstigen Fall 

zu Saatpunkten führen kann, die sehr nah an Zellrändern oder im Zwischengewebe 

liegen. Wie in Abschnitt 4 erläutert, wirken sich diese Effekte ungünstig auf 

die Segmentierung aus. In den Segmentierungstests zum Seeded-Region-Growing 

hat sich ein Threshold von θ ≈ 30 bewährt. 

• Offset (ǫ) 

Der Offset ǫ dient der Unterstützung des Regionswachstums. Dadurch wird eine 

generelle Wachstumsbewegung der Region erzwungen, die aber bereits durch 

kleine Intensitätsschwellen gestoppt werden kann. ǫ sollte nicht zu groß gewählt 

werden, bei den praktischen Tests hat sich ein Wert von 0.5 bewährt.

47 

6 Fazit 

Im sich anschließenden letzten Abschnitt sollen die Segmentierungsergebnisse, die durch 

das Seeded-Region-Growing erreicht werden können präsentiert und besprochen werden. 

6.1 Segmentierungsergebnisse 

Die in Abb.(15) dargestellte Bildserie ist Teil der Abbildungen (10)-(14), die im Anhang 

zu finden sind. Die Bildreihen entstammen einem vollautomatischen Testdurchlauf des 

Seeded-Region-Growings. Die jeweils 8 Entwicklungsschritte des Zellwachstums stellen 

lediglich die einzelnen Stadien der Zellregion bei Ausführung eines Formvergleichs dar. 

Abbildung 10: 12 Iterationen 

Die vom Algorithmus vollautomatisch ermittelte endgültige Zellkontur ist jeweils im 

letzten Bild rot eingefärbt. Da zur Ermittlung dieser Kontur für jede Zelle unterschiedlich 

viele Iterationen benötigt wurden, findet sich in der Bildunterschrift jeweils eine 

Angabe, wie häufig ein Formvergleich ausgeführt wurde, bis die Segmentierung abgeschlossen 

war. Zur Berechnung der Konturen wurde das Seeded-Region-Growing mit 

folgenden Parametereinstellungen ausgeführt: k = 10, θ = 30, N s = 20x20 Pixel, N p = 

30x30 Pixel, ǫ = 0.5, σ D = 10, σv 2 = 28000, Labelintervall[−40, 40], α = 10, β = 0.75. 

6.2 Qualität und Effizienz der Segmentierung 

Wie man in der Bilderreihe in Abb.(10) und weiteren Bildern im Anhang in Abb.(11) - 

(15) erkennen kann, erreicht das Seeded-Region-Growing in Bereichen, wo das Zellzwi-

48 6 FAZIT 

schengewebe größenteils deutlich zu erkennen ist und sich die vorhandene Zellform nicht 

zu stark von denen in der Datenbank unterscheidet, sehr gute Segmentierungsergebnisse. 

Desweiteren erreicht der hier präsentierte Ansatz gute Segmentierungsergebnisse für 

Zellen mit sehr wechselhaften Intensitätswerten, wie zum Beispiel im Bild (10 bzw. 11). 

Es lässt sich daraus schlussfolgern, dass der präsentierte Ansatz auch bei Bildstörungen 

wie Verrauschungen oder Fehler bei den Färbeprozessen für ATPase gute Segmentierungsergebnisse 

liefern kann. Die Qualität der vom Seeded-Region-Growing ermittelten 

Zellkonturen hängt von dem jeweiligen Zelltyp und seiner Färbung im Bild ab. Dunkel 

gefärbte Zellen können zumeist sehr gut erkannt werden und liefern präzise Konturen. 

Mittel stark gefärbte Zellen werden trotz Helligkeitsunterschieden im Inneren der 

Zellen relativ gut erkannt. Einschlüsse innerhalb eines segmentierten Bereiches treten 

zwar auf, werden aber im weiteren Ablauf des Algorithmus durch den Formvergleich 

als ungeeignet erkannt und korrigiert. 

Bei kritischen Bildregionen, in denen das Zellzwischengewebe partiell nicht sichtbar 

ist, kann ein leichtes Auslaufen von der Zellregion nicht verhindert werden. Durch eine 

möglichst optimale Gewichtung zwischen dem Formvergleich und dem Regionswachstum, 

können diese Effekte aber vermindert werden. Als negativ ist hier die große Anzahl 

an Parametern zu erwähnen, die die Qualität einer Zellsegmentierung durch das 

Seeded-Region-Growing beeinflussen. Es ist dadurch sehr schwer durch Feldversuche 

eine optimale Parametereinstellung festzulegen. 

6.3 Bestehende Probleme 

Das Hauptproblem des Seeded-Region-Growings ist der enorme Berechnungsaufwand, 

der sich aus dem 2-Means basierten Regionswachstum ergibt. Für jeden Konturpixel 

muss eine Nachbarschaft durchgearbeitet werden, um die inneren und äußeren Mittelwerte 

zu erhalten. Bei einer Konturlänge von 2000 Pixeln und bei einer Nachbarschaftsgröße 

von 30x30 Pixeln müssen 30 · 30 · 2.000 = 1.800.000 Pixel verarbeitet werden, um 

einen Konturumlauf zu realisieren. Da sich die 30x30 Nachbarschaften bei benachbarten 

Konturpunkten zu einem Großteil überschneiden und somit mehrfach verrechnet werden, 

gibt es hier viel Potential den Rechenaufwand zu verringern. In der vorliegenden 

Implementierung werden diese Überlappungen noch nicht berücksichtigt. 

Ein kritischer Punkt beim Seeded-Region-Growing ist die Initialisierung der Saat-Pixel. 

Die Position dieser Punkte kann die Qualität der Segmentierung stark beeinflussen, so 

dass sie dementsprechend sorgfältig ausgewählt werden müssen.

6.4 Weiterführende Entwicklung 49 

6.4 Weiterführende Entwicklung 

Die weiterführende Entwicklung des Seeded-Region-Growing sollte sich mit der Lösung 

der erwähnten Hauptprobleme beschäftigen. Zum Einen wäre eine effizientere Berechnung 

der inneren und äußeren Mittelwerte zu nennen, so dass die starke Überlappung 

der Nachbarschaftsbereiche für eine schnellere Berechnung ausgenutzt wird. Es ist angedacht, 

die von [PRT07] und [BC08] vorgeschlagenen Beschleunigungstechniken zur 

Gaußfilterung zu verwenden, um die Komplexität des Seeded-Region-Growings maßgeblich 

zu verringern. Die Beschleunigungstechnik basiert auf der Idee, dass eine Mittelung 

über eine bestimmte Pixelnachbarschaft äquivalent zu einer Gaußfilterung mit 

einem bestimmten σ ist. Das gesamte Muskelfaserbild bzw. der relevante Ausschnitt 

wird pixelweise über eine Nachbarschaft geglättet, die dem verwendeten Suchfenster 

bei der Mittelwertberechnung entspricht. Dieser Filtervorgang wird getrennt für den 

inneren Regionsbereich und den äußeren Bereich durchgeführt. Durch eine effiziente 

Implementierung des Glättungsfilters, zum Beispiel Boxfilterung oder iterative Filter, 

kann die Glättung für jeden Pixel schneller ausgeführt werden. 

Weitere Entwicklungen betreffen eine Bewertung der Segmentierung unter Ausnutzung 

von Farbinformationen, die in den ATPase-Schnitten ursprünglich vorhanden sind, im 

vorliegenden Fall aber nciht berücksichtig wurden. Dadurch könnten Fehlsegmentierungen 

an manchen Stellen unter Umständen reduziert werden. 

Es bleibt zu testen inwieweit eine automatische Rotationsausrichtung der wachsenden 

Region an den Datenbankformen bessere Ergebnisse oder schnellere Berechnungen liefert. 

Eine Möglichkeit für eine Rotationsausrichtung der Regionsform wird in [COS06] 

gegeben.

50 7 ANHANG 

7 Anhang 

Die alle für die Testdurchläufe verwendeten Muskelfaserschnitte wurden vom Institut 

für Neuropathologie der Universität Saarland in Homburg / Saar zur Verfügung gestellt. 


Abbildung 12: (10 Iterationen)

51 


Abbildung 14: 12 Iterationen

52 7 ANHANG 

Abbildung 15: 15 Iterationen

LITERATUR 53 

Literatur 

[BC08] 

[Can86] 

[COS06] 

[CV01] 

[dS01] 

[DS07] 

Thomas Brox and Daniel Cremers. On local region models and the statistical 

interpretation of the piecewise smooth mumford-shah functional. 

2008. 

J. F. Canny. A computational approach to edge detection. IEEE Transactions 

on Pattern Analysis and Machine Intelligence, pages 648–698, 1986. 

Daniel Cremers, Stanley J. Osher, and Stefano Soatto. Kernel density estimation 

and intrinsic alignment for shape priors on level set segmentation. 

International Journal of Computervision, 69:335–351, 2006. 

Tony F. Chan and Luminita A. Vese. Active contours without edges. IEEE 

Transactions on Image Processing, 10(2):266–277, 2001. 

J.P. Marques de Sá. Pattern Recognition - Concepts, Methods and Applications. 

Springer, 2001. 

Victor Dubowitz and Caroline A. Sewry. Muscle Biopsy: A practical approach. 

Saunders Elsevier, 2007. 

[KBFW05] Yoo-Jin Kim, Thomas Brox, Wolfgang Feiden, and Joachim Weickert. Fully 

automated segmentation and morphometrical analysis of muscle fibre 

images. pages 1–13, 2005. 

[KKP98] 

Ales Klemencic, Stanislav Kovacic, and Franjo Pernus. Automated segmentation 

of muscle fiber images using active contour models. Cytometry, 

32:317–326, 1998. 

[KMN + 02a] Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D. 

Piatko, Ruth Silverman, and Angela Y. Wu. An efficient k-means clustering 

algorithm: Analysis and implementation. IEEE Transactions on 

Pattern Analysis and Machine Intelligence, 24 Nr.7:881–892, 2002. 

[KMN + 02b] Tapas Kanungo, David M. Mount, Nathan S. Netanyahu, Christine D. 

Piatko, Ruth Silverman, and Angela Y. Wu. A local search approximation 

algorithm for k-means-clustering. Annual ACM Symposium on Computational 

Geometry, 18:10–18, 2002. 

[Mor00] Bryan S. Morse. Lecture 18: Segmentation(regionbased). pages 1–5, 2000.

54 LITERATUR 

[Ots79] 

[PRT07] 

[SSS02] 

[Vos07] 

N. Otsu. A threshold selection method from gray-level histograms. IEEE 

Transactions on Systems, Man and Cybernetics, 9(1):62–66, 1979. 

J. Piovano, M. Rousson, and T.Papadopoulo. Efficient segmentation of 

piecewise smooth images. In F. Sgallari, A. Murli, and N. Paragios, editors, 

Scale Space and Variational Methods in Computervision. Springer, 2007. 

Jasjit S. Suri, Kamaledin Setarehdan, and Sameer Singh. Advanced Algorithmic 

Approaches to Medical Image Segmentation. Springer, 2002. 

Mark-André Voss. Level set based segmentation of atpase stained muscle 

fiber images with multiple regions. Master’s thesis, University of Bonn, 

2007.

Großer Beleg Segmentierung von ATPase-gefärbten - Fakultät ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?