Konvertering av rasterbild till vektorbild för datorstödd ... - KTH

Konvertering av rasterbild 

till vektorbild för datorstödd 

illustration och animation 

J O H A N K O T L I N S K I 

Examensarbete 

Stockholm, Sverige 2006

Konvertering av rasterbild 

till vektorbild för datorstödd 

illustration och animation 

J O H A N K O T L I N S K I 

Examensarbete i datalogi om 20 poäng 

vid Programmet för medieteknik 

Kungliga Tekniska Högskolan år 2006 

Handledare på CSC var Lars Kjelldahl 

Examinator var Lars Kjelldahl 

TRITA-CSC-E 2006:095 

ISRN-KTH/CSC/E--06/095--SE 

ISSN-1653-5715 

Kungliga tekniska högskolan 

Skolan för datavetenskap och kommunikation 

KTH CSC 

100 44 Stockholm 

URL: www.csc.kth.se

Sammanfattning 

Idag sker mycket av arbetet inom illustration och animation med hjälp 

av datorer. Allt fler delar av arbetsprocessen sker digitalt, ofta med hjälp 

av något grafiskt vektorformat. De flesta illustratörer väljer dock fortfarande 

att skissa med papper och penna. Processen att konvertera den ursprungliga 

blyertsskissen till vektorgrafik är ett ofta tröttsamt och tidsödande arbete. 

Detta examensarbete har som syfte att utveckla en applikation för att 

hjälpa illustratörer att konvertera sina skisser till vektorgrafik på ett enkelt 

sätt. Många av de tekniska problemen inom arbetet ligger nära traditionella 

områden som OCR (optical character recognition) och kartdigitalisering. 

Tyngdvikten i arbetet ligger på att utvärdera, implementera och anpassa 

befintliga algoritmer, samt att konstruera kompletterande metoder där så 

krävs. 

Resultatet av arbetet är en Windows-applikation som konverterar inskannade 

skisser i rasterformat till vektorgrafik (EPS-format). Applikationen har 

ett grafiskt gränssnitt som är rimligt lättanvänt och ger användaren direkt 

återkoppling vid parameterändringar.

Abstract 

Conversion of raster image to vector image for computer aided 

illustration and animation 

These days, many illustrators and animators use computers in their daily 

work. Drawing programs based on vector graphics are in common use. For 

various reasons, most illustrators still prefer to sketch using traditional pen 

and paper. The sketches must then be digitised and converted to vector 

format for further editing. Doing this conversion manually can be a tedious 

and time-consuming task. 

The aim of this project is to create an application for converting scanned 

sketches to vector graphics in a simple and efficient way. The application 

is supposed to help illustrators and animators. Many of the problems encountered 

are familiar from similar problem areas (e.g. OCR, CAD, GIS). 

Existing algorithms are evaluated, implemented and adapted, and complementing 

methods are created when necessary. 

The end result of the project is a Windows application that converts digitised 

hand-drawn sketches to vector graphics. The application has a graphical 

user interface that is easy to use and gives direct feedback on parameter 

changes.

Förord 

I denna rapport beskrivs mitt examensarbete vid Nada, KTH. Arbetet är 

gjort inom ämnesområdet datalogi. Uppdragsgivare är Ola Persson, som arbetar 

som frilansare inom illustration och animation. Ola är initiativtagare 

till projektet och har varit ett ovärderligt stöd under det kontinuerliga arbetet. 

Jonna Olsson har i ett parallellt examensarbete undersökt MDI-aspekter, 

designat användargränssnitt och varit till stor hjälp för mig i att slutföra detta 

arbete. Björn Eiderbäck och Lars Kjelldahl har ställt upp som handledare 

och rådgivare. Ett stort tack går ut till de illustratörer och animatörer som 

bidragit med synpunkter och värdefulla insikter angående projektet; ingen 

nämnd, ingen glömd. Ett sista tack får gå till min hund Nixon, som har varit 

ett troget sällskap under rapportskrivandet, och till min flickvän Rebecca 

som finansierat det.

Innehåll 

1 Inledning 1 

1.1 Bakgrund . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 

1.2 Syfte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 

1.3 Metodik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 

1.4 Avgränsning . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 

1.5 Rapportens struktur . . . . . . . . . . . . . . . . . . . . . . . 3 

2 En introduktion till vektorisering 4 

2.1 Vad är vektorisering? . . . . . . . . . . . . . . . . . . . . . . . 4 

2.2 Olika typer av vektorisering . . . . . . . . . . . . . . . . . . . 5 

2.3 Användning i näringsliv och forskning . . . . . . . . . . . . . . 5 

2.3.1 Computer-Aided Design . . . . . . . . . . . . . . . . . 5 

2.3.2 Geographic Information Systems . . . . . . . . . . . . 5 

2.3.3 Optical Character Recognition . . . . . . . . . . . . . . 6 

2.3.4 Illustration och animation . . . . . . . . . . . . . . . . 6 

2.4 Översikt över befintliga vektoriserare . . . . . . . . . . . . . . 7 

2.5 Speciella behov hos illustratörer . . . . . . . . . . . . . . . . . 8 

2.5.1 Estetik . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 

2.5.2 Inmaterial . . . . . . . . . . . . . . . . . . . . . . . . . 8 

2.5.3 Maner . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 

2.5.4 Gränssnitt . . . . . . . . . . . . . . . . . . . . . . . . . 10 

3 Teori 11 

3.1 Binärisering . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 

3.1.1 Otsu-binärisering . . . . . . . . . . . . . . . . . . . . . 13 

3.1.2 Lokal kontrast-metoden . . . . . . . . . . . . . . . . . 13 

3.2 Vektorisering . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 

3.2.1 Att förtunna eller ej . . . . . . . . . . . . . . . . . . . 17 

3.3 Bezierkurvor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

3.3.1 Historik . . . . . . . . . . . . . . . . . . . . . . . . . . 18 

3.3.2 Matematik . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.3.3 Användningsområden . . . . . . . . . . . . . . . . . . . 19 

3.3.4 Från polylinje till bezierkurva . . . . . . . . . . . . . . 19 

3.4 PostScript . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 

4 Lösning 21 

4.1 Desaturering . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 

4.2 Binärisering . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 

4.2.1 Global binärisering . . . . . . . . . . . . . . . . . . . . 23 

4.2.2 Lokalt adaptiv binärisering . . . . . . . . . . . . . . . . 23 

4.3 Hålifyllning . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 

4.4 Generering av avståndskarta . . . . . . . . . . . . . . . . . . . 24 

4.5 Ythantering . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 

4.6 Förtunning . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

4.7 Konvertering till polylinjer . . . . . . . . . . . . . . . . . . . . 27 

4.7.1 Knytpunktslinjer . . . . . . . . . . . . . . . . . . . . . 28 

4.7.2 Frilagda linjer . . . . . . . . . . . . . . . . . . . . . . . 29 

4.7.3 Cirklar . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 

4.8 Borttagning av korta linjer . . . . . . . . . . . . . . . . . . . . 30 

4.9 Borttagning av överflödiga punkter . . . . . . . . . . . . . . . 31 

4.10 Hantering av förgreningar . . . . . . . . . . . . . . . . . . . . 32 

4.10.1 T-förgreningar . . . . . . . . . . . . . . . . . . . . . . . 32 

4.10.2 Falska Y-förgreningar . . . . . . . . . . . . . . . . . . . 33 

4.11 Knäsplittring . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 

4.12 Konvertering till bezierkurvor . . . . . . . . . . . . . . . . . . 36 

4.13 Export till PostScript . . . . . . . . . . . . . . . . . . . . . . . 37 

5 Resultat och diskussion 38 

5.1 Prestanda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 

5.2 Kvalitativa resultat . . . . . . . . . . . . . . . . . . . . . . . . 38 

5.3 Exempelbilder . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

5.4 Slutsats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 

6 Förslag för vidareutveckling 50 

6.1 Stöd för varierande bildupplösning . . . . . . . . . . . . . . . . 50 

6.2 Förbättrat användargränssnitt . . . . . . . . . . . . . . . . . . 50 

6.3 Multiplattformsstöd . . . . . . . . . . . . . . . . . . . . . . . . 50 

Litteraturförteckning 51

Kapitel 1 

Inledning 

1.1 Bakgrund 

Att göra tecknad film kan idag innebära mycket digitalt arbete, då mer och 

mer av animationsprocessen blir datorstödd. Samma sak gäller för illustratörer: 

mer och mer av arbetet kan utföras med hjälp av datorn. Men fortfarande 

arbetar många illustratörer och animatörer med papper och penna 

i den inledande skissfasen. Skisserna görs med blyertspenna på papper, och 

digitaliseras (t.ex. med skanner) för vidare bearbetning i datorn. 

Att manuellt konvertera en inskannad blyertsskiss till en färdig vektorgrafikbild 

kan vara både tidsödande och tråkigt. Det finns ett antal program i 

dagsläget för att stödja animation och illustration. Vi har dock inte hittat 

något tillgängligt program som stödjer denna del av processen på ett tillfredsställande 

sätt. För att snabba upp denna icke-kreativa del av att illustrera 

eller producera tecknad film kan det vara bra med ytterligare datorstöd. 

Exjobbet har utförts i samarbete med Jonna Olsson, som har stått för 

MDI-delen av detta projekt. Hon har varit ansvarig för att utföra användartester 

och utforma gränssnitt med hjälp av participatory design-metoden. 

Hon har varit en mycket viktig hjälp med att se till att applikationen blivit 

praktiskt användbar för slutanvändare. 

Uppdragsgivare för projektet är Ola Persson, frilansare som arbetar med 

animation och illustration i 2D och 3D. Ola arbetar bland annat för webbyråer 

och TV/film-producenter, däribland Speedway, TV4, MediTV och 

Kanal 5. 

1

1.2 Syfte 

Syftet med arbetet är att skapa en applikation som hjälper illustratörer och 

animatörer att konvertera inskannade skisser till vektorgrafik. Applikationens 

ändamål är att spara tid genom att enkelt och snabbt generera vektorgrafik i 

ett format lämpligt för vidare bearbetning. Ett sekundärt mål är att applikationen 

ska vara lättanvänd. Antalet parametrar och inställningsmöjligheter 

ska om möjligt hållas nere. 

1.3 Metodik 

Utvecklingsarbetet har skett enligt XP-metodiken (extreme programming). 

Den överlägset största fördelen med XP har varit att vi satt upp ett schema 

med täta iterationer, där vi fått kontinuerlig feedback från uppdragsgivaren. 

Det har varit ett naturligt sätt att arbeta, eftersom det liknar hur kreativa 

människor som t.ex. vår uppdragsgivare arbetar. Det har också gjort det 

lättare för oss att fokusera på det problem som har varit viktigast för stunden, 

och undvika att sväva ut på tekniska stickspår som kanske inte varit så viktiga 

för slutresultatet. 

Utvecklingen av applikationen har skett i Visual Studio, MFC och C++. 

Tanken har från början varit att hålla isär gränssnitt och bildbehandling, så 

att applikationen ska gå att portera mellan olika plattformar. 

1.4 Avgränsning 

Projektet är avgränsat till att understödja vektorisering av inskannade skisser. 

En mycket tydlig avgränsning är att programmet inte ämnar att vara 

en generell konverterare, utan att det ska möta just de specifika krav som 

illustratörer och animatörer har. Samtidigt är det värt att understryka att 

applikationen inte är ämnad att växa ut till att bli en fullfjädrad animationsstudio. 

En ytterligare avgränsning följer av att projektet utförs inom ramen för 

ett examensarbete på 20 poäng. På grund av tidsbegränsningen detta innebär, 

är det rimligt att anta att applikationen främst kommer ge en fingervisning 

om vilka möjligheter som finns inom området. Kanske kan den också 

fungera som prototyp för fortsatt arbete med en mer komplett applikation. 

2

1.5 Rapportens struktur 

Rapporten inleds med en överblick över vektorisering: inom vilka områden 

vektorisering spelar en betydande roll, samt vad det finns för särskilda aspekter 

att tänka på när man ska göra en vektoriserare för illustratörer. 

I kapitlet ”Teori” följer en översikt över vissa termer inom datorgrafik och 

bildbehandling som jag tror kan vara nödvändiga för att kunna ta sig igenom 

resten av rapporten. 

I kapitlet ”Lösning” följer redogörelsen för min lösning, med betoning på 

de bildanalys- och vektor-algoritmer jag har använt. För en redogörelse för 

utformningen av användargränssnittet måste jag hänvisa till Olsson (2005). 

Kapitlet ”Resultat och diskussion”innehåller en redogörelse för de resultat 

som uppnåtts, samt en sammanfattning av de slutsatser jag tycker man kan 

dra utifrån detta arbete. 

Slutligen presenterar jag i kapitlet ”Förslag för vidareutveckling” några 

idéer för hur man kan vidareutveckla de metoder som presenteras här. 

Så långt som möjligt har jag försökt översätta de engelska uttryck som 

förekommer inom ämnesområdet till passande svenska uttryck. Ibland har 

detta inte varit möjligt, då det inte finns bra svenska översättningar som har 

samma precisa innebörd som den engelska benämningen. I dessa fall har jag 

valt att behålla det engelska uttrycket, alternativt att ge både den svenska 

och engelska termen. 

3

Kapitel 2 

En introduktion till 

vektorisering 

2.1 Vad är vektorisering? 

I datorgrafikens värld är vektorisering liktydigt med konvertering från rastergrafik 

till vektorgrafik. 1 Ett annat uttryck för vektorisering är raster- till 

vektor-konvertering. 

Rastergrafik beskriver en bild genom att den delas upp i ett rutnät. Varje 

ruta tilldelas ett värde som kan beskriva t.ex. intensitet. Dessa rutor brukar 

kallas bildpunkter eller pixlar. Rasterdata får man vid t.ex. skanning och 

fotografering med digitalkamera. Eftersom en rasterbild måste lagras med 

information om varje pixel så kräver de generellt sett stort lagringsutrymme. 

När den geometriska upplösningen dubblas kommer datamängden fyradubblas, 

eftersom antalet pixlar dubblas både horisontellt och vertikalt. 

Vektorgrafik representerar bilder med olika geometriska mönster, som linjer, 

ytor och kurvor. Fördelen med vektorgrafik jämfört med rastergrafik är 

att vektorbilder är mer resurssnåla, och att de lämpar sig mycket bättre för 

vidare bearbetning. Vektorbilder kan enkelt roteras, skalas om, osv., utan 

någon kvalitetsförlust. Jämfört med rastergrafik är det ett mycket lämpligt 

format för t.ex. ingenjörer och illustratörer att arbeta i. 

1 Utanför datorgrafikens värld är autovektorisering en sorts processorberoende optimeringsteknik 

som härstammar från superdatorer. Det är dock inte vad detta projekt handlar 

om. 

4

2.2 Olika typer av vektorisering 

Man kan dela upp olika vektoriseringsmetoder efter dess grad av automatisering. 

Automatisk vektorisering är när ett datorprogram vektoriserar rasterbilder 

helt automatiskt, utan påverkan av användare. 

Halvautomatisk vektorisering är när ett datorprogram kan vektorisera 

rasterbilder, men kräver ett visst understöd från användaren. Det kan 

röra sig om att användaren markerar start- och ändpunkt på en linje, 

och programmet sedan vektoriserar linjen automatiskt. 

Manuell vektorisering kan ske t.ex. med hjälp av till exempel ett digitalt 

ritbord eller mus. 

Vilken variant man väljer är helt beroende av tillämpning. Manuell vektorisering 

har givetvis högst noggrannhet, men också det som är mest kostsamt 

i termer av arbetsinsats. Helautomatisk vektorisering kräver ingen översyn 

men ger ett mindre tillförlitligt resultat. 

Denna applikation kommer ligga någonstans mellan automatisk och halvautomatisk 

vektorisering. Idealet är att vektoriseringen ska ske automatiskt, 

men ibland kommer användaren vilja ändra inställningar. 

2.3 Användning i näringsliv och forskning 

Vilka områden inom datalogin använder redan idag vektorisering, eller närliggande 

metoder? 

2.3.1 Computer-Aided Design 

Computer-Aided Design (CAD) innehåller en bred uppsjö av datorbaserade 

verktyg som syftar till att stödja bland annat ingenjörer och arkitekter i arbetet 

med teknisk design. Detta område är själva vaggan för all vektorgrafik 

(läs mer om detta i kapitel 3.3). Vektorisering används här för att konvertera 

skisser och riktningar på fysiskt papper till digital form. Graden av automatisering 

beror på tillämpning. 

2.3.2 Geographic Information Systems 

Geographic Information Systems (GIS) är datorsystem genom vilka man kan 

hantera geografisk information. Enkelt uttryckt kan man säga att det är en 

5

smart digital karta. Ett populärt exempel på GIS är Google Earth. Tekniken 

används även inom lantmäteri, projektering för infrastruktur etc. 

Vektorisering är mycket viktigt inom GIS. Dels i fallet då man vill digitalisera 

en befintlig pappersbaserad karta, dels i fallet då man vill konvertera 

en satellitbild till något mer hanterligt format. 

Även med stöd av en automatisk vektoriserare, är det till stor del ett 

manuellt arbete att digitalisera kartor. Detta eftersom det kan finnas många 

olika sorters information i varje kartbild: vägar, konturer, gränser, och så 

vidare. Varje sorts information bör hanteras separat och delas upp i olika 

lager, något som kräver ett visst mått av intelligens. Mjukvaruverktygen blir 

dock allt mer sofistikerade, och övertar allt större delar av denna tidskrävande 

process (Eastern Region Geography, 2006). 

2.3.3 Optical Character Recognition 

Optical Character Recognition (OCR), handlar om datorstyrd inläsning och 

digitalisering av text. Det vanligaste tillämpningsområdet är att konvertera 

skannad text i rastergrafikformat till ren digital text, representerat i t.ex. 

ASCII eller Unicode. Indatatexten kan beroende på tillämpning antingen 

vara maskinskriven eller handskriven. 

OCR är ett forskningsområde med en gedigen historia. De första försöken 

att känna igen bokstäver automatiskt gjordes redan före andra världskriget, 

och på 1950-talet började forskningen ta fart på allvar. På den tiden förlitade 

man sig på specialutvecklad optik och mekaniska lösningar. Nu för tiden är 

det självklart att OCR sker digitalt, tack vare utvecklingen inom skanner- och 

datorteknik. Dagens utmaning ligger ofta i att välja och implementera redan 

befintliga metoder på bästa sätt, snarare än att utveckla nya (Association 

for Automatic Identification and Mobility, 2006). 

På grund av ibland stora datamängder, är automatisk vektorisering ofta 

ett krav. Exempel kan vara Postens maskiner som automatiskt läser adresser 

för brev, eller CSN:s automatiska inläsning av blanketter. Ett annat aktuellt 

fall där man behöver ta hjälp av OCR, är kamerorna som läser av passerande 

bilar vid Stockholms vägtullar. 

2.3.4 Illustration och animation 

Det är inte bara inom ingenjörsmässiga områden som vektorisering kan komma 

till användning. Även inom kreativa områden som illustration, animation, 

arkitektur och typsnittstillverkning används vektorgrafik av många i det vardagliga 

arbetet. 

6

(a) Originalbild. 

(b) Vektorisering med konturlinjer. 

(c) Vektorisering med mittlinje. 

Figur 2.1: Jämförelse av mittlinjes- och konturlinjes-vektorisering. 

Man skulle kunna tro att nya hjälpmedel som digitala ritbräden leder 

till att arbetsprocessen nu går mot att bli digital från början till slut. Men 

något som visat sig vid intervjuer vi har gjort med fackmän, är att de allra 

flesta illustratörer fortfarande ritar skisser traditionellt, med papper och 

penna (Olsson, 2005). Dessa skisser skannas eller fotograferas sedan, för att 

ofta vektoriseras manuellt i datorn. Denna manuella vektorisering är både 

tidskrävande och enahanda. 

2.4 Översikt över befintliga vektoriserare 

Orsaken till att illustratörer vektoriserar sina skisser manuellt är inte att det 

saknas automatiska vektoriserare till hemdatorer. Tvärtom finns det redan 

ett antal befintliga verktyg för vektorisering. Hur kommer det sig att de inte 

används? 

I min studie har jag hittat ett antal vektoriserare som är till för att konvertera 

tekniska ritningar och kartor. Främsta skälet till att de inte är användbara 

för vårt syfte är att de enbart konverterar till räta linjer eller perfekta 

matematiska bågar. 

Det finns även vektoriserare som har ett mer generellt syfte, att återskapa 

originalbilden så bra som möjligt, fast i vektorformat. Syftet med detta är 

att vinna vektorbildernas största fördelar, dvs. att kunna skala och rotera 

bilden utan förlust, och att spara lagringsutrymme. Vektorbilderna som dessa 

vektoriserare genererar blir också ofta mycket lika originalet. 

Tyvärr är de bilder som generella vektoriserare skapar från skisser ofta 

inte lämpade för vidare bearbetning. Skälet till detta är att de flesta generella 

vektoriserare enbart följer konturlinjer, och inte mittlinjer [figur 2.1]. 

Detta leder till att linjer blir representerade som fyllda ytor snarare än rena 

7

linjer, något som förhindrar illustratörer från att arbeta vidare med skisserna 

i datorn på ett effektivt sätt. Samma sak gäller för vektoriserare som är 

specialiserade för typsnittskonvertering. 

Det finns även ett fåtal generella vektoriserare som detekterar mittlinjer. 

Under våra efterforskningar lyckades vi bara hitta en som var allmänt känt 

och använt av illustratörer, Adobe Streamline. Programmet gav enligt oss ett 

mediokert resultat, var föråldrat och lämnat utan underhåll av tillverkaren. 

2.5 Speciella behov hos illustratörer 

Vad är det som skiljer illustratörers vektoriseringsbehov från ingenjörer som 

arbetar med CAD? 

2.5.1 Estetik 

En mycket tydlig skillnad är att estetik blir viktigt på ett helt annat sätt. 

Uppdragsgivaren ville understryka vikten av matematik: 

– Ju mer matematik det är i en linje, desto mer känsla blir det i 

den! 

Idealet är att en linje beskrivs av en ren bezierkurva. 

Visserligen är det även i CAD viktigt att en linje blir matematiskt korrekt. 

Men där är syftet helt annorlunda. Fokus i CAD ligger på att autodetektera 

räta linjer, cirklar och bågar, medan det för illustratören mer handlar om att 

renodla en frihandsritad linje så långt det är matematiskt möjligt, i syftet 

att framhäva känslan i linjen. 

2.5.2 Inmaterial 

En annan skillnad är typen av inmaterial. I fallet med CAD är det ofta så 

att ritningar är mycket noggrant och tydligt renritade. Med verkliga skisser 

är linjer lite smutsiga, linjeintensitet kan variera mellan olika partier av bilder, 

linjer kan ha suddats ut och ritats dit igen, kladd på papperet, o.s.v. 

Visserligen går det alltid att renrita även skisser. Men det är en stor tidsvinst 

för illustratören om skisser inte behöver renritas särskilt noggrant, utan 

även lite smutsigare bilder kan godtas. (Se figur 2.2 för jämförelse mellan en 

blyertsskiss och en renritad tuschbild.) 

8

(a) Grov skiss. 

(b) Renritad skiss. 

Figur 2.2: Jämförelse mellan blyertsskiss och tuschat slutresultat. 

9

2.5.3 Maner 

Ett ord som ofta dök upp i intervjuer med illustratörer, var maner. Denna 

term avser en konstnärs typiska särdrag vad gäller teknik och stil. I diskussioner 

tog illustratörer ofta upp hur man kan använda funktioner i datorprogram 

för att uppnå ett visst maner. Det är tydligt att många illustratörer 

idag använder illustrations- och bildbehandlingsprogram på kreativa sätt, 

som kanske skiljer sig från de ursprungliga tekniska ändamålen. 

Diskussionen om maner understryker hur förhållningssättet till ämnet 

skiljer sig mellan ingenjörer och illustratörer. För ingenjörer är noggrannhet 

och objektiv trogenhet till originalet det viktigaste, medan illustratörers verk 

främst bedöms subjektivt efter dess konstnärliga och estetiska uttryck. Detta 

är givetvis något som påverkar vilka kvalitéer som bör prioriteras hos en 

vektoriserare för illustratörer. Till viss del bör man t.ex. hålla öppet för att 

applikationen i slutändan kanske kommer användas till fler ändamål än vad 

som från början är tänkt. 

2.5.4 Gränssnitt 

Ytterligare något som särskiljer illustratörer, är hur applikationens gränssnitt 

bör utformas. Man får inte glömma bort att grundsyftet med applikationen är 

att spara tid. En stressad illustratör kanske inte har mer än fem, tio minuter 

att lägga på att testa ut ett nytt program av den här typen. Gränssnittet bör 

därför vara enkelt och lättförståeligt, och allra helst ska applikationen ge ett 

gott resultat utan att användaren behöver ändra några inställningar i detalj. 

En konsekvens av detta blir att man bör välja algoritmer som inte kräver en 

mängd manuella inställningar och kalibreringar från användarens sida. 

10

Kapitel 3 

Teori 

I detta kapitel går jag igenom olika teorier som är centrala för projektet. 

Binärisering (3.1) innefattar konvertering från gråskalebild till svart-vit bild, 

något som underlättar vidare behandling. Vektorisering (3.2) innefattar själva 

konverteringen från raster- till vektorbild. För att slutresultatet ska bli 

användbart, vill vi även konvertera vektorlinjerna till estetiskt tilltalande 

bezierkurvor (3.3). Slutresultatet sparas sedan i PostScript-format (3.4). 

3.1 Binärisering 

Binärisering, ofta även kallat tröskling, är en grundläggande och mycket ofta 

använd operation inom datorseende och digital bildbehandling. I typfallet 

utgår man ifrån en gråskalebild som man vill konvertera till en binär (svartvit) 

bild. Syftet är att intensitetsnivån ska representera om pixeln är en del 

av ett sökt objekt eller ej. I vårt fall vill vi utföra binärisering för att särskilja 

bakgrunden (papperet) från de linjer som ingår i skissen. 1 

Att utföra själva binäriseringen utifrån ett givet tröskelvärde är trivialt; 

om en pixels intensitet ligger under tröskelvärdet räknas det som en objektpixel. 

Att automatiskt hitta lämpliga tröskelvärden för intensiteten är 

betydligt svårare. På grund av problemets vikt, har ämnet studerats i decennier 

och ett stort antal metoder har föreslagits. Eftersom problemet har 

studerats så länge, kan man tycka att det redan nu borde finnas en passande 

lösning för varje tänkbart område. I praktiken dyker dock problem av nya ka- 

1 För klarhetens skull bör nämnas att tröskling och binärisering inte är synonyma begrepp. 

Tröskling är ett allmänt begrepp som syftar på att dela upp bilden i ett antal 

segment utifrån olika tröskelvärden. Vid binärisering vill man dela upp bilden i exakt två 

segment, varken mer eller mindre. 

11

aktärer upp regelbundet, och utmaningen i att automatiskt hitta passande 

tröskelvärden är fortfarande aktuell (Drobchenko m.fl., 2005). 

Sezgin och Sankur (2004) presenterar en uttömmande överblick, kategorisering 

och kvalitativ jämförelse mellan olika binäriseringsmetoder. Metoderna 

kategoriseras där i sex grupper efter vilka typer av information de utnyttjar. 

Histogramformsbaserade metoder utgår från egenskaper i histogrammets 

form, såsom toppar, dalar och krökningar. Om histogrammet exempelvis 

har två toppar och en dal emellan dem, bör tröskelvärdet ligga 

i dalen. 

Klusterbaserade metoder antar att histogramnivåerna kan delas upp i 

två separata kluster, alternativt modelleras som en blandning av två 

normalfördelningar. Någon statistisk metod används sedan för att hitta 

ett lämpligt tröskelvärde. Otsus metod är ett klassiskt exempel (se 

3.1.1). 

Entropibaserade metoder liknar ofta klusterbaserade metoder, men utgår 

från histogrammets entropi snarare än att anta att det kan delas 

upp i kluster. En tolkning är att maximering av entropin också maximerar 

graden av informationsöverföring. 

Objekt-attribut-baserade metoder söker likheter mellan originalet och 

den trösklade bilden. En metod är att genomföra kantdetektion på originalet 

och den trösklade bilden, och därefter undersöka om kanterna 

hamnar på samma ställe. 

Spatiala metoder utnyttjar, förutom histogramnivåer, även beroenden mellan 

närliggande pixlar. Ett enkelt exempel är att utnyttja att en pixel 

sannolikt tillhör samma segment som dess grannar. 

Lokalt adaptiva metoder skiljer sig från tidigare nämnda metoder genom 

att inte sätta något globalt tröskelvärde som gäller för hela bilden. 

Istället beräknas ett separat tröskelvärde för varje pixel. Detta kan 

vara nödvändigt om intensiteten varierar mellan olika delar av bilden. 

Globala metoder kan ofta anpassas till att bli lokalt adaptiva, t.ex. 

genom att utföra dem i ett lokalt fönster. 

Inom mitt arbete har jag bekantat mig närmare med följande binäriseringsalgoritmer: 

Otsu-metoden, Kittler och Illingworth-metoden samt lokal 

kontrast-metoden. Otsus samt Kittler och Illingworths metoder tillhör gruppen 

klusterbaserade binäriserare, medan lokal kontrast-metoden är en enkel 

lokal adaptiv metod. För att ge ett exempel för respektive grupp vill jag här 

presentera Otsu-metoden samt lokal kontrast-metoden. 

12

3.1.1 Otsu-binärisering 

Otsus metod är en klusterbaserad trösklingsmetod som bygger på att man 

minimerar den viktade summan av inom-klass-variansen hos objekt- respektive 

bakgrunds-pixlar (Otsu, 1979). Metoden ger bra resultat när antalet 

pixlar i respektive klass ligger nära varandra. 

Otsus metod är en av de mest använda och refererade trösklingsmetoderna. 

Den är mycket robust, och ger goda resultat för de flesta typer av 

indata. Ibland misslyckas den dock med att hitta ett lämpligt tröskelvärde 

om antalet objektpixlar understiger 5% av den totala bilden (Drobchenko 

m.fl., 2005). 

Inom-klass-variansen definieras som den viktade summan av respektive 

klusters varians: 

där 

σ 2 Inom(T ) = n B (T )σ 2 B(T ) + n O (T )σ 2 O(T ) (3.1) 

∑T −1 

n B (T ) = p(i) (3.2) 

i=0 

N−1 

∑ 

n O (T ) = p(i) (3.3) 

i=T 

σ 2 B(T ) = variansen av bakgrundspixlarna (under tröskelvärdet) (3.4) 

σ 2 O(T ) = variansen av objektpixlarna (över tröskelvärdet) (3.5) 

och [0, N − 1] är mängden intensitetsnivåer (i vårt fall, 256). 

3.1.2 Lokal kontrast-metoden 

Vid lokal adaptiv tröskling sätter man en lokal tröskelnivå för varje enskild 

pixel. En enkel variant, lokal kontrast-metoden, är att för varje pixel använda 

ett fönster av storlek b×b ur vilket man räknar fram medelvärdet mean. Det 

lokala tröskelvärdet sätts till (mean−C). För ett lågt värde på C riskerar man 

att få mycket brus i bilden, eftersom även låga avvikelser från bakgrunden 

detekteras som en objektpixel. Ju högre värde på C, desto färre objektpixlar 

kommer detekteras (Sezgin och Sankur, 2004). 

13

3.2 Vektorisering 

Vektorisering är konsten att konvertera en rasterbild till motsvarande vektorbild. 

Här tar jag främst upp metoder som fokuserar på att vektorisera binära 

rasterbilder, med tyngdpunkt på CAD-ritningar, OCR eller handtecknade 

objekt. 

Liu och Dori (1999) presenterar en bred genomgång över vektoriseringsalgoritmer 

för binära dokumentbilder. Algoritmerna delas in i sex grupper: 

Hough Transform-baserade, förtunningsbaserade, konturbaserade, rungraph-baserade, 

rutnätsbaserade och sparse-pixel-baserade. 

Hough Transform-vektorisering 

Hough Transform-vektorisering kan hitta geometriska mönster genom att bilden 

transformeras till en ny parameterrymd. Resultatet av transformen blir 

att de sökta mönstren framträder som en enskild punkt i den nya parameterrymden. 

Ett exempel är detektion av raka linjer. Man kan anta att linjerna är 

parametriserade i formen ρ = x cos θ + y sin θ, där ρ är avståndet från origo 

och θ är vinkeln från normalen. Man kan då transformera från (x, y)-rymden 

till (ρ, θ)-rymden, där linjerna framstår som punkter. 

Eftersom metoden främst lämpar sig för rena geometriska former är den 

inte användbar för det här projektet. 

Förtunningsbaserad vektorisering 

Förtunningsbaserade algoritmer är troligen den mest beprövade och använda 

gruppen av vektoriseringsalgoritmer. 

Förtunning (även känt som skelettisering) är konsten att reducera ett 

förgrundsobjekt i en binär bild till ett skelett, som i stort representerar ursprungsobjektets 

form. Vid förtunning utsätter man objektet för en iterativ 

erosion där förgrunden skalas bort gradvis från kanterna tills bara en pixel 

återstår. Resultatet blir att ett en pixel brett skelett bildas i mitten av det ursprungliga 

objektet, med objektets ursprungliga topologi och form (Figur 3.1, 

3.2; Fisher m.fl. (1994)). 

Ett problem med klassisk iterativ förtunning kan vara tidsåtgången, som 

är kubisk i förhållande till upplösningen på bilden. Vid klassisk iterativ förtunning 

förlorar man också information om linjebredd. Ett ännu allvarligare 

problem kanske är att förtunning ofta orsakar formdistortion vid förgreningar, 

som man kan se i figur 3.3. Felet som uppstår vid bokstäverna X och T 

kallas ”necking”, medan felet som uppstår vid bokstaven V kallas ”tailing”. 

14

Figur 3.1: Förtunning av en rektangel. 

Figur 3.2: Förtunning av text. 

15

Figur 3.3: Formdistortion vid förtunning av förgreningar. 

Att notera är att de skelett som produceras av förtunningsalgoritmer 

fortfarande är i rasterformat och därför behöver vektoriseras i ett senare steg 

genom kalkering linje för linje. 

En mycket noggrann genomgång av förtunning och olika algoritmer för 

ändamålet finns i Lam m.fl. (1992). Tyvärr kan man kanske säga att det är en 

artikel som blivit aningen föråldrad. Ämnet förtunning är fortfarande under 

utveckling, och sedan 1992 har det hänt en del, framförallt i forskningen om 

hur man kan parallellisera förtunning för att uppnå hastighetsförbättringar. 

En nyare algoritm som är värd att nämnas är MB2 (Bernard och Manzanera, 

1999). 

Konturbaserad vektorisering 

Konturbaserad vektorisering strävar efter att vara snabbare och exaktare än 

förtunning. Idén är att hitta linjeobjektets konturlinjer, och därefter räkna ut 

mittenpunkterna genom att parallellt följa konturlinjerna på varsin sida av 

linjen. Den här gruppen av algoritmer är i allmänhet snabbare än de förtunnande 

algoritmerna och har också lättare att hitta linjebredden. Det stora 

problemet med algoritmer av den här typen är hur man ska hantera förgreningar. 

De är olämpliga för vektorisering av stökiga kurvor och linjer som 

korsar varandra, alltså är de troligen inte lämpliga för det här examensarbetet. 

Run-graph-baserad vektorisering 

Run-graph-baserad vektorisering bygger på att man konverterar bilden till 

en ”run graph”-representation i ett förberedande steg. En run graph är en 

enkel vektorrepresentation som delar upp bilden i horisontella och vertikala 

16

linjer. Ett ”run” är antingen vertikalt eller horisontellt, och representerar den 

maximala sekvensen av svarta pixlar i den riktningen. Ett run kan definieras 

med riktning, startpunkt och längd. 

Run-graph-baserad vektorisering är ofta snabbare än förtunnande, men 

är bäst lämpad till att vektorisera raka linjer och därför kanske inte helt 

lämpad till det här projektet. 

Rutnätsbaserad vektorisering 

Rutnätsbaserade metoder syftar på att dela upp hela bilden i ett rutnät och 

att detektera mönster enbart genom att titta efter svarta pixlar i rutornas 

skärning. Metoden är främst ämnad att vektorisera bilder på t.ex. logiska 

diagram, och är inte lämpad att hantera frihandslinjer. 

Sparse-pixel-vektorisering 

Sparse-pixel-vektorisering (SPV) syftar på att alla pixlar inte undersöks vid 

vektoriseringen. Algoritmen följer enbart en en pixel bred linje inuti förgrundsarean. 

Inte ens varje pixel inom den linjen undersöks, utan algoritmen stegar 

dessutom fram med en variabel steglängd. På grund av att relativt få pixlar 

måste undersökas blir algoritmen också snabb. Eftersom steglängden kan 

varieras, har algoritmen också en möjlighet att stega över förgreningar. 

Något som talar emot algoritmen, är att författarna själva menar att 

den inte är helt robust och kräver en del efterbearbetning. Speciellt kan det 

bli problem vid kanter och förgreningar, att det blir vissa glapp mellan de 

olika vektorerna. Tombre m.fl. (2000) rapporterar även att SPV tenderar att 

detektera falska förgreningar och dubbellinjer. 

En undersökning om hur man lämpligast väljer parametrar till SPV finns 

i Wenyin m.fl. (1999). 

3.2.1 Att förtunna eller ej 

Tombre och Tabbone (2000) jämför förtunnande och konturföljande vektorisering. 

Det som talar för förtunnande algoritmer är att de är bevisat robusta 

och precisa, medan det som talar emot dem är att linjeändar och förgreningar 

kan bli förvridna. Slutsatsen är att konturföljning är det bättre alternativet 

i de fall man på förhand har god kännedom om indata, men att man 

generellt hellre bör använda förtunning och hantera de förvanskningar som 

uppstår med efterbehandling. I deras mening är den mest lovande idén att introducera 

modeller av ”ideala” förgreningar (T-förgreningar, L-förgreningar, 

X-förgreningar, Y-förgreningar, . . . ) och för varje förgrening se om det går 

17

att applicera någon av idealförgreningarna. Samma åsikt uttrycks i Tombre 

m.fl. (2000). 

3.3 Bezierkurvor 

3.3.1 Historik 

Bezierkurvan är en ekvation som har en mängd användningsområden, bland 

annat inom datorgrafik. Ekvationen utvecklades på oberoende håll; under 

1959 av P. de Casteljau, och 1962 av Pierre Beziér, som var anställd på 

Renaults CAD/CAM-avdelning (Watt, 2000; Schneider, 1988). 

3.3.2 Matematik 

p 0 

p 3 

p 1 

p 2 

Figur 3.4: Bezierkurva. 

En kubisk bezierkurva representeras av fyra punkter: en startpunkt p 0 , 

en ändpunkt p 3 och två kontrollpunkter p 1 , p 2 . [Figur 3.4] Kurvan börjar i p 0 

och går i riktning mot p 1 , och anländer i p 3 i riktning från p 2 . Oftast kommer 

inte kurvan passera genom kontrollpunkterna; de är bara där för att ange 

riktningen. Intuitivt kan man uppfatta avståndet mellan p 0 och p 1 som ”hur 

länge” kurvan rör sig mot p 1 , innan den börjar svänga av mot p 3 . 

Den parametriska formen av ekvationen är: 

B(t) = p 0 (1 − t) 3 + 3p 1 t(1 − t) 2 + 3p 2 t 2 (1 − t) + p 3 t 3 , t ∈ [0, 1] (3.6) 

Kurvan lämnar p 0 vid t = 0, och anländer i p 3 vid t = 1. 

18

3.3.3 Användningsområden 

Bezierkurvor används inom en bred mängd områden. Relevant för den här 

rapporten är att de är grundläggande för den utritningsmodell som används 

i Adobe PostScript. Bezierkurvor är också standard i formgivningsprogram 

som Adobe Illustrator, Macromedia Freehand och Fontographer, samt en 

mängd vanliga 3D-program. 

Bezierkurvor är inte det enda sättet att skapa vackra vektorformer. Hur 

kommer det sig att just den har blivit så populär? Några av dess främsta 

meriter är att den underliggande matematiken är enkel, samt att kopplingen 

mellan de fyra styrpunkterna och den resulterande kurvan är intuitiv även 

för personer utan matematiska kunskaper. I praktiken är bezierkurvor ett 

smidigt men också kraftfullt verktyg, som ger utmärkt kontroll över kurvans 

dynamik. 

3.3.4 Från polylinje till bezierkurva 

Samtliga vektoriseringsalgoritmer jag tidigare nämnt genererar polylinjer. I 

det här examensarbetet är det även ett krav från uppdragsgivaren att linjerna 

ska renodlas och konverteras till bezierkurvor. Skälet är att bezierkurvor både 

är vackrare och enklare att bearbeta manuellt än polylinjer. 

Det finns vissa generella problem med att konvertera polylinjer till bezierkurvor. 

Ett problem är att det ofta inte räcker med en bezierkurva för att 

representera en polylinje, på grund av naturliga begränsningar hos bezierkurvor. 

Det är t.ex. omöjligt att passa in bezierkurvor till polylinjer som innehåller 

hörn eller har fler än två böjningar (Shao och Zhou, 1996). Därför måste 

man kunna använda delvis approximation, där en linje kan representeras av 

flera bezierkurvor som är kopplade till varandra. För att linjen fortfarande 

ska se jämn ut, är det viktigt att se till att tangenterna vid de skarvpunkter 

där bezierkurvor möts är riktade från varandra (Schneider, 1988). 

Schneiders algoritm 

Schneider (1988) presenterar en adaptiv algoritm för att passa in bezierkurvor 

till polylinjer. Algoritmen genererar en initial inpassning som sedan 

gradvis förbättras genom iteration. Inpassningen sker inom en felmarginal 

som specifieras av användaren. Denna algoritm är något av en klassisk numerisk 

standardalgoritm som ofta blir refererad till. Den finns också flera 

färdiga implementationer tillgängliga under GPL. 

I sammanfattning fungerar Schneiders algoritm såhär: användaren anger 

ett tröskelvärde för hur stora avvikelser som kan tolereras från den ursprung- 

19

liga polylinjen. Man börjar från ena änden av polylinjen, och försöker gradvis 

passa in längre och längre bezierkurvor. När tröskelvärdet överskrids, delas 

polylinjen av och man fortsätter med en ny bezierkurva. 

Ett lågt tröskelvärde leder garanterat till en hög detaljnoggrannhet, men 

kan också innebära en överdriven användning av bezierkurvor. I vårt fall vill 

vi representera bilden med så få bezierkurvor som möjligt, utan att bildens 

betydelse går förlorad. (Se gärna diskussionen om estetik i kapitel 2.5.1.) 

Shaos och Zhous algoritm 

Shao och Zhou (1996) introducerar en metod som liknar Schneiders. Den sker 

i två steg; det första identifierar signifikanta punkter från polylinjen, och det 

andra genomför kurvinpassning med en iterativ viktad minsta-kvadratenmetod. 

Enligt författarnas utsago är algoritmen mycket pålitlig och robust. 

Algoritmen fäster särskild vikt vid att hitta lämpliga skarvpunkter och hörnpunkter, 

på ett mer genomtänkt sätt än Schneiders metod. Detta leder också 

till ett slutresultat som använder färre bezierkurvor. Just att få ett slutresultat 

med så få bezierkurvor som möjligt är som sagt eftersträvansvärt både 

tekniskt och estetiskt. 

3.4 PostScript 

PostScript är ett programmeringsspråk med vars hjälp man kan beskriva hur 

en sida ska se ut vid utskrift, antingen på en datorskärm eller på en skrivare. 

Det introducerades av Adobe Systems 1985. Allt i dokumenten, även typsnitt, 

specifieras i termer av raka linjer och kubiska bezierkurvor (Adobe, 2006). 

Encapsulated PostScript är ett standardformat för att importera och exportera 

PostScript-filer. Syftet med EPS-filer är att de ska kunna inkluderas 

som illustrationer i vanliga PostScript-dokument. 

En smärre brist med PostScript-standarden, för detta examensarbete, är 

att det inte finns något direkt stöd för linjer och kurvor med varierande bredd. 

Det gör att det i vissa fall blir svårt att uppnå ett perfekt slutresultat. 

En fördel med formatet är att PostScript-filer är rena textfiler och därför 

mycket enkla att generera. 

20

Kapitel 4 

Lösning 

Det här kapitlet redogör för applikationens algoritmer. För enkelhetens skull, 

presenteras de olika bildbehandlingsmetoderna i den ordning de utförs i systemet. 

Förutom bildbehandling, ingick det även i uppdraget att implementera 

ett gränssnitt för att styra konverteringen. Gränssnittets utformning kommer 

inte beskrivas i detalj här. En närmare beskrivning går istället att hitta i 

Olsson (2005). För de otåliga finns en skärmdump i figur 4.1. 

Hela implementationen med källkod finns tillgänglig på http://sf.net/ 

projects/linetracer/. 

4.1 Desaturering 

Så snart en bild lästs in, konverteras den till 8-bitars gråskala för vidare 

hantering. Konverteringen görs på enklast tänkbara sätt: genom att ta medelvärdet 

av intensiteten för röd, blå och grön-komponenterna. 

Denna metod är egentligen inte formellt korrekt, eftersom de olika färgkomponenterna 

bidrar olika mycket till den upplevda intensiteten. Det spelar 

dock ingen roll i det här sammanhanget, eftersom vi kan anta att hela skissen 

är ritad med en och samma penna. 

4.2 Binärisering 

Vi vill nu omvandla vår gråskalebild till en binär (svart-vit) bild, där pixelintensiteten 

avgör om en pixel tillhör bakgrunden eller en skissad linje. 

21

Figur 4.1: Gränssnittet. 

22

4.2.1 Global binärisering 

Det enklaste sättet att implementera binärisering är att sätta ett globalt tröskelvärde, 

och klassificiera alla pixlar med intensitet ovan detta tröskelvärde 

som bakgrund, och alla under som skissad linje. 

Jag började med att implementera Otsus metod för global tröskelvärdesdetektion. 

Otsu-metoden visade sig vara enkel att implementera, beräkningsmässigt 

snabb, och fungerade så bra som man kan förvänta sig. Jag testade 

även att implementera Kittler och Illingworths iterativa metod (Kittler och 

Illingworth, 1986). Den gav dock ingen tydlig förbättring på verkliga skisser, 

och då Otsu-metoden gav intryck av att vara robustare valde jag att behålla 

den. 

4.2.2 Lokalt adaptiv binärisering 

För vårt problem visade det sig snart att det inte är tillräckligt att endast 

ha ett globalt tröskelvärde. I verkliga skisser är det normalt att linjer skiljer 

betydligt i svärta, beroende på hur mycket energi, tryck och noggrannhet 

tecknaren lagt i dem. Med enbart ett globalt tröskelvärde, riskerar tydliga 

men svaga linjer att falla under tröskelvärdet. Jag behövde därför komplettera 

Otsu-metoden med ytterligare en metod för att plocka upp dessa linjer. 

Jag valde att implementera lokal kontrast-metoden (se 3.1.2) med en fönsterstorlek 

av 7x7 pixlar. 

Att notera är att lokal kontrast-metoden här enbart används för att hitta 

svaga linjer som av Otsu-metoden detekterats som vita pixlar, men borde 

varit svarta. Någon ändring från svarta pixlar till vita sker ej. 

Prestandamässigt går detta steg i processen relativt långsamt, på grund 

av att man måste göra 49 läsaccesser per pixel. Det är troligen acceptabelt att 

binäriseringsprocessen tar relativt lång tid, eftersom den förhoppningsvis blir 

lyckad från första början, och därefter inte behöver göras om på grund av att 

användaren ändrar inställningar. För högre upplösningar och bildstorlekar 

riskerar dock detta beräkningssteg bli en flaskhals. 

4.3 Hålifyllning 

Vid tester på verkliga skisser, hände det ibland att de svarta streck som 

detekterades innehöll enstaka vita pixlar. Ofta var det på grund av dubbelstreck, 

att användaren gjort flera pennstreck för att rita ut en och samma 

linje. Vidare behandling skulle resultera i att även den slutliga vektorbilden 

innehöll dubbelstreck. För att bättre fånga användarens intention, implementerade 

jag en enkel algoritm för att omvandla dubbelstreck till enkelstreck. 

23

Algoritmen fyller i samtliga slutna vita ytor vars storlek är mindre än tio 

pixlar. 

I gränssnittet lade jag in ett skjutreglage med texten ”Hole Filling” för 

att kunna ändra den maximala storleken på de ytor som ska tas bort. I 

användartester visar det sig dock att detta reglage sällan eller aldrig används. 

Antingen misstolkas texten, eller så behöver värdet inte justeras i praktiken. 

4.4 Generering av avståndskarta 

I detta steg bygger vi en avståndskarta (distance map) där varje värde anger 

avståndet till närmsta bakgrundspixel i den binära bilden som producerats i 

föregående steg. Denna information kan vara användbar i kommande beräkningar 

(t.ex. avsnitt 4.10.2). 

0 0 0 1 0 

0 1 1 1 0 

1 1 1 1 0 

1 1 1 1 1 

1 1 1 0 0 

(a) Indata. 1 indikerar 

förgrundspixel. 

0 0 0 3 0 

0 3 3 4 0 

3 4 6 7 0 

3 6 8 10 3 

3 6 9 0 0 

(b) Första passet. 

0 0 0 3 0 

0 3 3 3 0 

3 4 6 3 0 

3 6 4 3 3 

3 6 3 0 0 

(c) Andra passet. 

Figur 4.2: Generering av avståndskarta. 

Jag har valt att använda en algoritm som arbetar i två pass. Första 

passet hanterar pixlar radvis från övre vänstra till nedre högra hörnet. Förgrundspixlar 

sätts till det minsta värdet av följande: värdet ovanför plus 3, 

värdet till vänster plus 3, värdet snett ovanför till vänster plus 4 samt värdet 

snett ovanför till höger plus 4. [figur 4.2b] 

Andra passet går i motsatt riktning, och arbetar radvis från nedre högra 

till övre vänstra hörnet. Förgrundspixlar sätts till det minsta värdet av 

följande: nuvarande värde, värdet till höger plus 3, värdet nedanför plus 3, 

värdet snett nedåt till höger plus 4 samt värdet snett nedåt till vänster plus 

4. [Figur 4.2c] 

Skälet till att öka värdena med 3 och 4 istället för med 1 och √ 2 är att 

det i vissa fall är enklare att arbeta med heltal än flyttal. Det är ofta det 

relativa värdet som är viktigt, snarare än det absoluta avståndet till närmsta 

bakgrundspixel. 

24

4.5 Ythantering 

Under projektets gång, blev det tydligt att många skisser inte bara innehåller 

linjer, utan även fyllda ytor. Sådana kan produceras avsiktligt, där detaljer 

som hår, pupiller etc. fyllts i av användaren. Det finns även fall då ytor 

bildas oavsiktligt, till exempel i det fall flera linjer går ihop och tillsammans 

bildar en yta. I det fall man försöker detektera en yta som en linje, kommer 

konturinformation oundvikligen gå förlorad, om man (som i vårt fall) inte 

har möjlighet att kompensera genom att variera linjetjockleken. 

Det som i vårt fall är intressant i ytor, är ytans konturer, snarare än 

att ytan ska vara fylld med färg. Jag konstruerade följande algoritm för att 

ersätta ytor med dess konturlinjer: 

1. Kopiera källbitmappen till en arbetsbitmapp. [Figur 4.3a] 

2. Erodera arbetsbitmappen radie max gånger. [Figur 4.3b] 

3. Ta bort de svarta ytor i arbetsbitmappen som är mindre än area min . 

4. Utför dilation på arbetsbitmappen radie max gånger. [Figur 4.3c] 

5. Utför logiskt OCH på källbitmappen med den inverterade arbetsbitmappen. 

[Figur 4.3d] 

6. Utför kantdetektion på arbetsbitmappen (dvs. ta bort alla svarta pixlar 

som bara har svarta grannar). [Figur 4.3e] 

7. Utför logiskt ELLER på källbitmappen med arbetsbitmappen. Resultatet 

erhålls nu i källbitmappen. [Figur 4.3f] 

radie max är den maximalt tillåtna linjeradien. Linjer eller ytor med större 

radie än radie max skall behandlas som ytor. area min är den undre storleksgränsen 

på vilka ytor som ska ersättas med konturlinjer. För denna applikation 

är radie max satt till två, medan area min är satt till 30. 

Fördelen med algoritmen är att den är stabil och enkel att implementera. 

Man kan dock få problem vid hanteringen av kantiga ytor, då spetsarna riskerar 

att bli avrundade. Algoritmen fyller så att säga inte ända ut i spetsarna. 

En intressant bieffekt av den här algoritmen är att den öppnar upp applikationen 

för fler användningsområden än att hantera skisser. Eftersom 

applikationen inte längre är begränsad till att enbart använda streckbilder, 

kan man även behandla t.ex. fotografier med acceptabelt resultat. Applikationen 

har redan används till att behandla fotografier inför presentationer av 

vetenskapliga undersökningar; genom att konvertera fotografier till enkla vektorbilder 

kan man skydda de fotograferade människornas identitet, samtidigt 

som fotografiets innebörd (människors position, gester o.s.v.) bibehålls. 

25

(a) Källbitmapp. 

(b) Eroderad arbetsbitmapp. 

(c) Arbetsbitmapp efter borttagning 

av små ytor och dilation. 

(d) Källbitmapp efter logiskt 

OCH med den inverterade arbetsbitmappen. 

(e) Arbetsbitmapp efter kantdetektion. 

(f) Källbitmapp efter logiskt EL- 

LER med arbetsbitmappen. 

Figur 4.3: Exempelsteg för omvandling av ytor till slutna konturlinjer. 

26

4.6 Förtunning 

Målet med förtunning är att tunna ut alla linjer så att dess bredd inte är 

större än maximalt en pixel. Detta är ett nödvändigt förberedande steg för 

att sedan kunna göra om linjerna till polylinjer. 

Augmented Fast Marching Method 

Jag började med att implementera ”Augmented Fast Marching Method”(AF- 

MM), en algoritm som genererar skelett för planära objekt (Telea och van 

Wijk, 2002). Algoritmen är inte helt olik traditionell förtunning, men är snabbare 

och har även fördelen att den bibehåller information om linjebredd. Den 

går tillväga så att pixlar sätts upp längs med objektets kanter, och att pixlarna 

sedan får marschera in mot mitten av objektet. Pixlarnas avståndsvärde 

till kanten ökar med ett givet värde för varje steg. Linjers mittpunkter detekteras 

när pixlar från ej angränsande kanter krockar med varandra. 

Tyvärr visade det sig att AFMM ibland genererade skelett som var två 

pixlar breda, något som ledde till problem vid efterföljande konvertering från 

skelett till polylinje. Jag övergav därför AFMM till förmån för mer klassiska 

iterativa förtunningsmetoder. 

Zhang-Suen, Stentiford 

Jag implementerade nu Zhang-Suens och Stentifords klassiska algoritmer för 

linjeförtunning, i dess enklaste former (Zhang och Suen, 1984; Stentiford och 

Mortimer, 1983). Jag lät dock bli att implementera Stentifords olika förhanteringssteg, 

eftersom de främst är ämnade för förtunning av handskriven text. 

I slutändan valde jag att använda Stentiford, då den lär vara bättre ämnad 

för linjer som följer kurvor, medan Zhang-Suen lär vara bättre lämpad 

för raka linjer (WinTopo, 2006). För den som är intresserad av ytterligare 

förbättringar finns en algoritm som kombinerar Stentiford, Zhang-Suen och 

Holt beskriven i Parker (1996). 

4.7 Konvertering till polylinjer 

I detta steg konverteras bilden från raster- till vektorgrafik. Algoritmerna 

som används här har jag skrivit själv, även om det troligtvis är andra som 

har uppfunnit liknande algoritmer långt tidigare. 

Uppgiften här är att hitta de en pixel breda linjer som finns på vår rasterbild, 

och konvertera dem linje för linje. Grundtanken är att hitta linjernas 

ändpunkter, och därefter följa linjens bana pixel för pixel till dess ände. Saken 

27

kompliceras av att vi har vissa specialfall. Till exempel tillhör vissa pixlar 

flera linjer (de är s.k. knytpunkter), medan andra linjer saknar ändpixlar 

(cirklar). 

4.7.1 Knytpunktslinjer 

En knytpunkt definierar jag här som en punkt som är ändpunkt för minst 

tre separata linjer. En knytpunktslinje definieras omvänt som en linje som 

har sin ände i en knytpunkt. 

Detektion 

X 

X 

X 

P 

X 

X 

(a) Indata. 

1 2 

P 3 

4 5 

(b) Varje 

förgrundspixel 

får ett unikt 

värde. 

1 1 

P 3 

4 3 

(c) Närliggande 

förgrundspixlar 

sätts till 

samma värde. 

Figur 4.4: Identifiering av knytpunkt P. 

Min idé för hur man kan identifiera en knytpunkt är att hitta hur många 

linjer som skjuter ut ur en given förgrundspunkt. Om tre eller fler linjer 

skjuter ut från punkten, räknas det som en knytpunkt. 

Detektionsalgoritmen jag har använt illustreras i figur 4.4. Indata (figur 

4.4a) visar omgivningen kring den möjliga förgrundspunkten P, där X 

markerar förgrundspixlar. I figur 4.4b ges varje förgrundspixel ett unikt värde. 

I figur 4.4c går vi ett varv medsols runt förgrundspixlarna; om flera pixlar 

i rad har samma värde, sätts de till samma. Efter detta steg återstår att räkna 

samman hur många olika värden som finns i matrisen. Om fler än två 

olika värden finns, är punkten P en knytpunkt. 1, 3 och 4 är tre olika värden; 

alltså är P en knytpunkt! 

Hantering 

Vid detektion av en knytpunktspixel, tas den bort från indata-bitmappen, 

och sparas istället undan i en separat knytpunkts-bitmapp. Syftet med det, 

är att se till att alla förgrundspixlar i indatabilden tillhör exakt en linje, och 

att inga linjer gränsar till en annan linje. Detta gör det enkelt att kalkera 

linjer. 

28

När alla knytpunkter hittats, går vi igenom dem en efter en, och kalkerar 

samtliga linjer som utgår från respektive knytpunkt. (Se metodbeskrivning i 

algoritm 1.) 

Algoritm 1 Kalkering av knytpunktslinjer. 

1: for all knots in knot image do 

2: create new polyline line 

3: set pos x,y to knot position 

4: add pos x,y to line 

5: while neighbors to pos x,y exist on input image do 

6: pick closest neighbor (orthogonal neighbors preferred over diagonal) 

7: set pos x,y to neighbor position 


9: clear pixel at pos x,y 

10: end while 

11: if any neighbor to pos x,y exists on knot image then 

12: pick closest knot neighbor 

13: add knot neighbor position to line 

14: end if 

{completed trace of line} 

15: end for 

4.7.2 Frilagda linjer 

En frilagd linje är här en linje som har en ändpunkt som är skild från startpunkten, 

och som inte skär några andra linjer. Frilagda linjer är relativt enkla 

att hantera, tack vare att vi i föregående steg gjort oss av med alla besvärliga 

knytpunkter. 

Detektion av ändpunkt sker med samma metod som i avsnitt 4.7.1, med 

skillnaden att ändpunkter till frilagda linjer har en och endast en linje som 

skjuter ut ur punkten. Hanteringen är också en enklare variant av den som 

beskrivs i avsnitt 4.7.1, med skillnaden att man här inte behöver göra någon 

särskild hantering för knytpunkter. (Se metodbeskrivning i algoritm 2.) 

4.7.3 Cirklar 

Cirklar definieras här som en linje som startar och slutar i samma punkt. Alla 

linjer som inte är knytpunktslinjer eller frilagda linjer kan antas vara cirklar. 

Efter föregående beräkningssteg kan vi utgå från att det bara finns cirklar 

kvar i indata-bitmappen. Min metod för cirkelkalkering beskrivs i algoritm 3. 

29

Algoritm 2 Kalkering av frilagda linjer. 

1: for all pos x,y do 

2: if pos x,y is a line end then 




6: while neighbors to pos x,y exist do 

7: pick closest neighbor 




11: end while 


12: end if 

13: end for 

Ett brist är att det inte sker någon särskild hantering för att se till att 

riktningarna vid linjens båda ändpunkter blir motsatta. Vid bezierkonvertering 

riskerar det att bli en kant i från början jämna cirklar. 

4.8 Borttagning av korta linjer 

(a) Utan borttagning. 

(b) Med borttagning. 

Figur 4.5: Borttagning av korta linjer. 

Första steget efter raster- till vektor-konverteringen är att ta bort korta 

linjer. Syftet med detta är att städa bort oavsiktliga linjer som uppkommit 

till följd av smuts och fläckar på papperet, eller linjer som är bieffekter av 

30

Algoritm 3 Kalkering av cirklar. 

1: for all startpos x,y do 

2: if pixel at startpos x,y is set then 


4: add startpos x,y to line 


6: set pos x,y to startpos x,y 

7: while neighbors to pos x,y exist do 

8: pick closest neighbor 




12: end while 

13: add startpos x,y to line {start point equals stop point} 


14: end if 

15: end for 

skeletteringsalgoritmen. För att behålla konnektiviteten i bilden tas endast 

svanslinjer 1 eller fritt hängande linjer bort. [Figur 4.5] 

Minsta tillåtna linjelängd kan ställas om med en skjutregel i gränssnittet. 

Grundinställningen är fyra punkter. 

4.9 Borttagning av överflödiga punkter 

För att snabba upp vidare behandling, minskar vi nu datamängden genom 

att ta bort överflödiga punkter från polylinjerna. Algoritmen nöjer sig med 

att behålla var fjärde punkt i linjerna. Enligt Schneider (1988) är detta i 

praktiken tillräckligt för att behålla all information från skeletteringen. 

Jag gjorde ett försök med att ta bort fler punkter än så, som en sorts 

linjeförenkling. Min tanke var att man vid t.ex. raka sträckor i linjen borde 

kunna gå ner till ännu större avstånd mellan punkterna. Det visade sig dock 

att allt för glesa punkter orsakade buggar vid den kommande bezierkurvekonverteringen. 

Algoritmen som används där (beskriven i 4.12) är ganska 

känslig och behöver många indatapunkter för att fungera väl. 

1 Svanslinje definieras här som en linje som är sammankopplad med andra linjer i en 

och endast en ändpunkt. 

31

4.10 Hantering av förgreningar 

I detta steg sker särskild behandling för T- och Y-förgreningar. Ett skäl till 

att detta behövs är att sådana förgreningar ofta förvanskas vid förtunningen. 

Det sker också för att förbereda för den kommande bezierkonverteringen, så 

att den kan ge ett så bra slutresultat som möjligt. 

De metoder som används i det här kapitlet har jag utformat med syftet 

att lösa de specifika problem som uppstår vid vektorisering av handritade 

linjeskisser. För andra typer av indata (t.ex. tekniska ritningar) är de metoder 

och konstanter jag kommit fram till kanske inte så lämpliga. 

4.10.1 T-förgreningar 

A 

B 

C 

Figur 4.6: En T-förgrening med tre polylinjer A, B och C. 

Figur 4.6 är ett exempel på en T-förgrening där de tre linjerna A, B och 

C möts. Illustratörens syfte med linjerna A och B är inte att de ska vara 

två separata linjer, utan att de ska tolkas som en linje AB. Ett problem vid 

T-förgreningar är att förgreningspunkten mellan linjerna A, B och C ofta är 

förvanskad på grund av ”necking”. (Förgreningspunkten drar ofta åt linjen 

C, snarare än att följa linjerna A och B.) 

Detektion 

Första steget är att avgöra om korsningen verkligen är en T-korsning. Det 

görs genom att analysera linjernas riktning från förgreningspunkten g. Vektorn 

a 1 ⃗a 2 , där a 1 är den punkt i linjen A som är närmast g, antas representera 

linjens riktning. [Figur 4.7] 

Förgreningen antas vara en T-förgrening, där A och B bör sammanfogas 

till linjen AB, om 

32

a 2 a 1 b 1 b 2 

g 

c 1 

c 2 

Figur 4.7: Detektion av T-förgrening. 

a 1 ⃗a 2 , 

⃗ b 1 b 2 och 

c 1 ⃗c 2 analyseras. 

där â, ˆb, ĉ, motsvarar enhetsvektorerna för 

Åtgärd 

â · ˆb < −0.8, och (4.1) 

â · ĉ > −0.75, och (4.2) 

ˆb · ĉ > −0.75 (4.3) 

a 1 ⃗a 2 , 

⃗ b 1 b 2 , 

c 1 ⃗c 2 . 

När detektionen lyckats, vill vi korrigera förgreningspunkten g så att den 

bättre följer linjerna A och B. Min lösning är att flytta punkten g så att den 

hamnar i skärningspunkten mellan de tänkta linjerna a 1 b 1 och gc 1 . 

4.10.2 Falska Y-förgreningar 

Falsk Y-förgrening är min egen benämning på ”tailing”, en vanlig förvanskning 

vid skelettering. Den syftar på när de resulterande polylinjerna visar 

en tydlig Y-förgrening, med tre skilda polylinjer, när originalbilden i själva 

verket består av två linjer som gradvis glider ihop till en. [Figur 4.8] 

Detektion 

Detektion av falska Y-förgreningar sker på samma sätt som detektion av T- 

förgreningar. Förgreningen antas vara en falsk Y-förgrening, där A och B 

gradvis går samman till linjen C [Figur 4.9], om 

â · ĉ < k, och (4.4) 

ˆb · ĉ < k (4.5) 

33

(a) Original. Två linjer går ihop till 

en, och bildar ett V. 

(b) Resulterande polylinjer. Tydlig 

Y-form. 

Figur 4.8: Exempel på falsk Y-förgrening (”tailing”). 

A 

B 

C 

Figur 4.9: Y-förgrening. Linjerna A och B går ihop till linjen C. 

34

där 

{ 

−0.7 om C är en svanslinje, 

k = 

−0.8 om C:s båda ändar är sammanfogade med andra linjer. 

(4.6) 

k sätts till ett mer inklusivt värde om linjen C är en svanslinje, eftersom det 

i de fallen är betydligt mer vanligt med falska Y-förgreningar. 

Åtgärd 

(a) En falsk Y-förgrening 

med tydlig tailing. 

(b) Resultat. Den tidigare 

punkten p har tagits bort 

och linjerna är ej längre 

sammankopplade. 

(c) q a och q b kopplas till 

punkten q c , som bildar nya 

grenpunkten q. 

Figur 4.10: Borttagning av punkter som uppstått till följd av tailing. 

Vi vill nu motverka eventuell tailing i den funna falska Y-förgreningen. 

Detta görs med hjälp av den avståndskarta som byggdes i avsnitt 4.4. Vi 

börjar med att för varje polylinje ap, bp, cp [Figur 4.10a] räkna ut medianlinjebredden 

vid samtliga punkter. Vi tar därefter bort de punkter runt punkten 

p, vars linjebredd är större än respektive linjes medianbredd. (Se algoritm 4.) 

Efter att ha tagit bort punkter som uppstått på grund av tailing, är det 

möjligt att linjerna inte längre sitter ihop. [Figur 4.10b] Jag använder två 

olika metoder för att koppla ihop linjerna igen, beroende på om linjen qc är en 

svanslinje eller ej. Om qc inte är en svanslinje, gör vi en enkel koppling mellan 

punkterna q a och q c samt q b och q c . Linjen qc lämnas intakt. [Figur 4.10c] 

Om qc är en svanslinje, väljer vi istället att kopiera över punkterna i linjen qc 

till linjerna qa och qb, och sedan ta bort linjen qc helt. Slutresultatet blir att 

vi istället för tre linjer qa, qb, qc får två linjer aqc, bqc. Detta ger ett bättre 

35

Algoritm 4 Borttagning av punkter som uppstått till följd av tailing. 

1: for all line in polylines ap, bp, cp do 

2: removed points count = 0 

3: set median width to the median line width of all points in line 

4: set curr point to p 

5: while line width at curr point > median width and 

removed points count < 6 do 

6: remove curr point from line 

7: set curr point to next point in line 

8: increase removed points count 

9: end while 

10: end for 

resultat vid den kommande bezierkonverteringen, eftersom de två linjerna då 

kommer glida samman på ett vackert sätt och mötas i ändpunkten c. 

4.11 Knäsplittring 

I detta steg markeras eventuella knän (dvs. skarpa vinklar) i polylinjerna, så 

att den kommande bezierkonverteringen ska kunna göra ett bättre jobb med 

att bryta upp polylinjer. 

a 

p 

b 

Figur 4.11: Detektion av knäpunkt. 

En punkt p definieras som en knäpunkt om 

där A = ⃗pa, B = ⃗ pb. [Figur 4.11] 

Â · ˆB > −0.3 (4.7) 

4.12 Konvertering till bezierkurvor 

Nu är det till sist dags att konvertera våra polylinjer till bezierkurvor. För 

detta valde jag att implementera Schneiders metod, en ofta använd iterativ 

algoritm. (Se avsnitt 3.3.4 för beskrivning.) Jag har även förbättrat algoritmen 

så att den tar stöd av de knäpunkter som räknats fram i föregående 

avsnitt, för att bryta upp linjer på så lämpliga ställen som möjligt. 

36

Ett problem med Schneiders metod är att den i vissa fall inte tycks vara 

helt stabil. Den kräver rätt många och täta punkter i polylinjerna för att 

fungera bra. För vissa polylinjer kan den generera kurvor som ser mycket 

konstiga ut, och avviker markant från den ursprungliga linjen. Särskilt gäller 

det för kortare polylinjer med få punkter, då man satt en mycket låg 

feltolerans. I framtiden kan det vara intressant att försöka implementera någon 

annan algoritm. T.ex. Shao och Zhou (1996) beskriver en algoritm som 

lär vara stabilare och ge bättre resultat än Schneiders metod, och som inte 

behöver någon särskild behandling för att hitta lämpliga brytpunkter. 

En mängd exempelbilder som visar resultatet av bezierkonverteringen 

finns i avsnitt 5.3. 

4.13 Export till PostScript 

Det avslutande steget är att exportera den resulterande vektorbilden till Encapsulated 

PostScript-format. Detta steg är mest en ren implementationsfråga, 

och kommer därför inte beskrivas i detalj. 

Något som bör hållas i åtanke här, är att vissa linjer bör exporteras tillsammans 

som en sammansatt linje. Jag tänker här på linjer som fortsätter in 

i varandra, och därför uppfattas som samma linje. Exempel på sådana linjer 

är de motriktade linjer som uppkommer vid T-förgreningar, och långa linjer 

som styckas upp vid bezierkonverteringen. Skälet till att sådana linjer bör 

exporteras som en sammansatt linje är att de då blir enklare att bearbeta 

vidare manuellt. 

Om en ändpunkt tillhör två separata linjer, bör linjerna exporteras tillsammans. 

Om en ändpunkt tillhör fler än två separata linjer, bör de linjer 

som har motsatt riktning kring ändpunkten exporteras tillsammans. 

Programlista 4.1: PostScript-exempel. En sammansatt linje med två bezierkurvor. 

Linjen går från punkten (1,1) genom (2,2) till (3,1). 

1 1 moveto 

1 2 1 2 2 2 curveto 

3 2 3 2 3 1 curveto 

s t r o k e 

37

Kapitel 5 

Resultat och diskussion 

5.1 Prestanda 

Algoritmerna som beskrivits har implementerats i C++ och testkörts på en 

bärbar PC med en 1.5 GHz Intel Pentium M-processor och 760 MB RAM. 

Tidsåtgången har befunnits vara kvadratisk mot upplösningen på bilden. 

Storlek i pixlar Beräkningstid (s) 

400x300 1 

1500x1200 3 

2600x2600 10 

5200x5200 60 

Tabell 5.1: Tidsåtgång 

5.2 Kvalitativa resultat 

En informell jämförelse mellan denna applikation och andra vektoriserare 

visar att applikationen står sig väl i konkurrensen. 

Jämfört med de program som är specialiserade mot CAD och GIS är 

applikationen mycket mer lämplig för att konvertera skisser, då den stödjer 

konvertering till bezierkurvor. Den är också mer tidsbesparande än de 

vektoriserare som enbart kalkerar konturer. 

En ny konkurrent är Live Trace-funktionen i Adobe Illustrator CS2, som 

släpptes i arbetets slutskede och visade sig vara ungefär likvärdig med vår applikation. 

Tydligt är att Live Trace har bättre knähantering, detekterar olika 

linjebredder och ger ett allmänt stabilt och buggfritt intryck. Vår applikation 

har dock bättre binärisering och ythantering, samt erbjuder mer direkt 

38

återkoppling. För att göra en mer rättvisande jämförelse krävs antagligen 

användartester. 

En tydlig brist är att vår applikation beter sig mycket olika för olika 

upplösningar på indata. Den beter sig som bäst när indata har en upplösning 

på mellan 150 och 300 DPI. Under 150 DPI får algoritmerna för få pixlar att 

arbeta med [figur 5.2], över 300 DPI tar de för lång tid. Ett enkelt sätt att 

åtgärda det problemet kan vara att lägga till funktionalitet för att skala om 

bilden i början av hanteringen. 

5.3 Exempelbilder 

På följande sidor presenterar jag några exempel för hur vektoriseringen kan 

falla ut. 

Den brinnande katten är ritad av Frans Carlqvist, den irländska fågelvätten 

av Ola Persson. Fotografiet är taget av Mats Andrén. 

5.4 Slutsats 

Arbetet har resulterat i en applikation för att stödja illustratörer i processen 

att konvertera handritade skisser till vektorformat. Applikationen ger mycket 

lovande resultat. Trots att merparten av algoritmerna är väl beprövade från 

andra områden, indikerar resultaten att man kan få speciella fördelar genom 

att kombinera och anpassa algoritmerna på ett sätt som är speciellt ämnat att 

tillgodose illustratörers behov. Troligen kommer de metoder som utvecklats 

här vara överlägsna mer generella vektoriseringsmetoder, så länge det gäller 

just att konvertera skisser av illustratörer och animatörer. 

39

Figur 5.1: 359x295 pixlar, 72 DPI. Original. Bilden är något beskuren. 

Figur 5.2: 359x295 pixlar, 72 DPI. Resultatet har blivit mindre lyckat. Eftersom 

ingen kompensation gjorts för den låga upplösningen, har algoritmerna 

fått för få pixlar att arbeta med. 

40


41

Figur 5.4: 1494x1228 pixlar, 300 DPI. Resultatet har blivit betydligt mer 

lyckat än i figur 5.2. En del av linjerna i originalet har varit tillräckligt breda 

för att bli tolkade som ytor, och har därför genererat dubbellinjer. Det är 

osäkert om användaren önskar det resultatet eller ej, därför bör man kunna 

ställa om tröskelnivån för maximal linjebredd i gränssnittet. 

42

Figur 5.5: Samma som figur 5.4. Bezierkurvornas ändpunkter är markerade. 

43


44

Figur 5.7: 945x778 pixlar, 300 DPI. Ett i praktiken användbart resultat, även 

om viss efterbearbetning krävs. Applikationen är specialiserad på att hantera 

illustrationer av denna typ. 

45

Figur 5.8: Samma som figur 5.7. Bezierkurvornas ändpunkter är markerade. 

46

Figur 5.9: 400x300 pixlar. Original. 

47

Figur 5.10: 400x300 pixlar. Efter manuella justeringar av binäriseringsparametrarna, 

kan man få användbara resultat även vid konvertering av fotografier. 

48

Figur 5.11: Ungefär samma som figur 5.10. Bezierkurvornas ändpunkter är 

markerade. 

49

Kapitel 6 

Förslag för vidareutveckling 

6.1 Stöd för varierande bildupplösning 

En tydlig brist i programmet är att både slutresultat och beräkningstid varierar 

dramatiskt med upplösning och bildstorlek. Ett effektivt sätt att komma 

runt detta problem kan vara att implementera ett skalningsfilter som sätts 

in direkt efter desatureringen. 

6.2 Förbättrat användargränssnitt 

Implementera de förbättringar till gränssnittet som föreslås i Olsson (2005). 

6.3 Multiplattformsstöd 

Många illustratörer använder Mac hellre än Windows. Därför kan det vara 

en god idé att skriva om gränssnittet med stöd av något multiplattforms- 

GUI-ramverk, till exempel wxWidgets/wxPython. 

50

Litteraturförteckning 

Adobe. Postscript turns 20, maj 2006. URL http://www.adobe.com/ 

products/postscript/pdfs/postscript_is_20.pdf. 

Association for Automatic Identification and Mobility, 2006. Optical character 

recognition (ocr), sep 2000. URL http://www.aimglobal.org/ 

technologies/othertechnologies/ocr.pdf. 

Bernard, Thierry M. och Manzanera, Antoine. Improved low complexity 

fully parallel thinning algorithm. I: Proc. Int. Conf. on Image Analysis 

and Processing, ss 215–220, Venice, Italy, september 1999. IEEE Computer 

Society. 

Drobchenko, A., Vartiainen, J., Kamarainen, J.-K., Lensu, L., och Kälviäinen, 

H. Thresholding based detection of fine and sparse details. I: Proc. 

of the IAPR Conf. on Machine Vision Applications, ss 257–260, Tsukuba 

Science City, Japan, 2005. 

Eastern Region Geography, 2006. Geographic information systems, maj 2006. 

URL http://erg.usgs.gov/isb/pubs/gis_poster/. 

Fisher, Bob, Perkins, Simon, Walker, Ashley, och Wolfart, Erik. Hypermedia 

image processing reference, 1994. URL http://www.cee.hw.ac.uk/hipr/ 

html/hipr\_top.html. 

Kittler, J. och Illingworth, J. Minimum error thresholding. Pattern Recogn., 

19(1):41–47, 1986. ISSN 0031-3203. 

Lam, Louisa, Lee, Seong-Whan, och Suen, Ching Y. Thinning methodologiesa 

comprehensive survey. IEEE Trans. Pattern Anal. Mach. Intell., 14(9): 

869–885, 1992. ISSN 0162-8828. 

Liu, Wenyin och Dori, Dov. From rasters to vectors: Extracting visual information 

from line drawings. Pattern Analysis and Applications, 2(1):10–21, 

1999. 

51

Olsson, Jonna. Från skiss till vektorgrafik - en studie om utökat datorstöd 

för animatörer och illustratörer. Examensarbete, KTH, 2005. TRITA-NA- 

E05117. 

Otsu, N. A threshold selection method from gray level histograms. IEEE 

Trans. Systems, Man and Cybernetics, 9:62–66, mars 1979. 

Parker, James R. Algorithms for Image Processing and Computer Vision. 

Wiley, 1996. PAR j 96:1 1.Ex. 

Schneider, Philip J. Phoenix: An interactive curve design system based on 

the automatic fitting of hand-sketched curves. Examensarbete, University 

of Washington, 1988. 

Sezgin, M. och Sankur, B. A survey over image thresholding techniques and 

quantitative performance evaluation. Journal of Electronic Imaging, 13(1): 

146–165, januari 2004. 

Shao, L. och Zhou, H. Curve fitting with bezier cubics. GMIP, 58:223–232, 

1996. 

Stentiford, F.W.M. och Mortimer, R.G. Some new heuristics for thinning 

binary handprinted characters for ocr. SMC, 13:81–84, 1983. 

Telea, Alexandru och van Wijk, Jarke J. An augmented fast marching method 

for computing skeletons and centerlines. I: VISSYM ’02: Proceedings 

of the symposium on Data Visualisation 2002, ss 251–ff, Aire-la-Ville, Switzerland, 

Switzerland, 2002. Eurographics Association. ISBN 1-58113-536- 

X. 

Tombre, K. och Tabbone, S. Vectorization in graphics recognition: to thin or 

not to thin. I: Proceedings of the 15th International Conference on Pattern 

Recognition, Barcelona (Spain), band 2, ss 91–96, september 2000. 

Tombre, Karl, Ah-Soon, Christian, Dosch, Philippe, Masini, Gérald, och 

Tabbone, Salvatore. Stable and robust vectorization: How to make the 

right choices. Lecture Notes in Computer Science, 1941:3–??, 2000. URL 

http://citeseer.ist.psu.edu/tombre99stable.html. 

Watt, Alan H. 3D Computer Graphics, 3rd edition. Addison Wesley, 2000. 

Wenyin, Liu, Wang, Xiaoyu, Tang, Long, och Dori, Dov. Impact of sparse 

pixel vectorization algorithm parameters on line segmentation performance. 

I: GREC, ss 335–344, 1999. 

52

WinTopo, 2006. Wintopo onlinedokumentation, maj 2006. URL 

http://homepage.ntlworld.com/heatons/softsoft/wintopo/help/ 

html/vectorise.htm. 

Zhang, T. Y. och Suen, C. Y. A fast parallel algorithm for thinning digital 

patterns. Commun. ACM, 27(3):236–239, 1984. ISSN 0001-0782. 

53

TRITA-CSC-E 2006:095 

ISRN-KTH/CSC/E--06/095--SE 

ISSN-1653-5715 

www.kth.se

Konvertering av rasterbild till vektorbild för datorstödd ... - KTH

Create successful ePaper yourself

Delete template?

Save as template?