10.09.2013 Views

Kvalitetskontroll av klasseinndelte statistiske kart - Norsk Nettskole

Kvalitetskontroll av klasseinndelte statistiske kart - Norsk Nettskole

Kvalitetskontroll av klasseinndelte statistiske kart - Norsk Nettskole

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Innledning<br />

<strong>Kvalitetskontroll</strong> <strong>av</strong> <strong>klasseinndelte</strong> <strong>statistiske</strong> <strong>kart</strong><br />

Jan Ketil Rød<br />

Institutt for Geomatikk<br />

NTNU<br />

jan.rod@geomatikk.ntnu.no<br />

Statistiske <strong>kart</strong> er en type tematiske <strong>kart</strong> som fremstiller en eller et fåtall antall<br />

variabler. Variabelen(e) finnes lagret i en tabell som kobles mot et grense<strong>kart</strong>. Én rad i<br />

tabellen korresponderer vanligvis med én geografisk enhet i <strong>kart</strong>et. Både enhetens<br />

nivå, for eksempel fylke eller kommune, og geografisk område, for eksempel<br />

Trøndelag, korresponderer både for tabell og <strong>kart</strong> slik som vist i figur 1.<br />

KOMMUNE N<strong>av</strong>n Instpl67<br />

1601 Trondheim 59,6<br />

1612 Hemne 59,9<br />

1613 Snillfjord 130,6<br />

1617 Hitra 90,9<br />

1620 Frøya 63,6<br />

1621 Ørland 59<br />

1622 Agdenes 85,5<br />

1624 Rissa 82,7<br />

1627 Bjugn 93,6<br />

1630 Åfjord 120<br />

1632 Roan 67,5<br />

1633 Osen 75,9<br />

1634 Oppdal 51,3<br />

1635 Rennebu 70,1<br />

1636 Meldal 67,7<br />

1638 Orkdal 70,5<br />

1640 Røros 80,2<br />

1644 Holtålen 101,7<br />

1648 MidtreGaul 118,7<br />

1653 Melhus 85,3<br />

1657 Skaun 97,4<br />

1662 Klæbu 245<br />

1663 Malvik 74,5<br />

1664 Selbu 57,2<br />

1665 Tydal 161,8<br />

1702 Steinkjer 54,8<br />

1703 Namsos 46,4<br />

1711 Meråker 130<br />

1714 Stjørdal 77,3<br />

1717 Frosta 64,8<br />

1718 Leksvik 78,8<br />

1719 Levanger 53,2<br />

1721 Verdal 75,7<br />

1723 Mosvik 125<br />

1724 Verran 61,1<br />

1725 Namdalsei 74,7<br />

1729 Inderøy 76,1<br />

1736 Snåsa 90,5<br />

1738 Lierne 116<br />

1739 Røyrvik 371,8<br />

1740 Namsskog 109,3<br />

1742 Grong 101,5<br />

1743 Høylandet 105<br />

1744 Overhalla 91,9<br />

1748 Fosnes 118,9<br />

1749 Flatanger 115,7<br />

1750 Vikna 106,5<br />

1751 Nærøy 75,7<br />

1755 Leka 103,2<br />

KOMMUNE N<strong>av</strong>n Instpl67<br />

1601 Trondheim 59,6<br />

Figur 1: Kobling <strong>av</strong> tabell og <strong>kart</strong> for produksjon <strong>av</strong> <strong>statistiske</strong> <strong>kart</strong>.<br />

Grense<strong>kart</strong>et blir symbolisert med tegn hvis uttrykk (størrelsesvariasjon eller<br />

lyshetsvariasjon) korresponderer, mer eller mindre, med variabelens verdibredde.<br />

Fordelen med <strong>statistiske</strong> <strong>kart</strong> er at det ofte er lettere, eller kanskje først da blir mulig, å<br />

1


oppdage eventuelle geografiske mønstre; hvor det er høye verdier og hvor det er l<strong>av</strong>e<br />

verdier <strong>av</strong> en bestemt variabel. Det er vanlig å skille mellom absolutte og relative<br />

variabelverdier. Størrelsesproporsjonale <strong>kart</strong> anbefales benyttes for å fremstille<br />

absolutte tallverdier mens skr<strong>av</strong>ur<strong>kart</strong> anbefales for å fremstille relative tallverdier.<br />

Absolutte tallverdier kan for eksempel være:<br />

• Antall individer som utgjør befolkningsmengden<br />

• Antall individer i en bestemt aldersgruppe eller <strong>av</strong> et bestemt kjønn<br />

• Antall sysselsatte totalt eller antall sysselsatte innen en bestemt sektor<br />

Relative verdier utrykkes ofte som prosenter og er utledede verdier fra absolutte<br />

verdier, som for eksempel:<br />

• Befolkningstetthet der absolutte befolkningstall er dividert med bebodd<br />

areal<br />

• Befolkningsandel der en bestemt gruppe <strong>av</strong> befolkningen, som for<br />

eksempel befolkningen over 67 år, er dividert med total befolkning<br />

• Sysselsetting innen en bestemt sektor dividert med total sysselsetting.<br />

I skr<strong>av</strong>ur<strong>kart</strong>et fremstilles variabelverdiene etter metaforen desto mørkere<br />

symbolisering desto høyere verdi. For eksempel: lys blåfarge – l<strong>av</strong> verdi, mørk<br />

blåfarge – høy verdi. Begrunnet ut fra øyets begrensede mulighet til å differensiere<br />

mellom et større antall lyshetsvariasjoner, er det blitt en <strong>kart</strong>ografisk tradisjon å vise<br />

variabelverdiene i skr<strong>av</strong>ur<strong>kart</strong>et med et l<strong>av</strong>t antall klasser, typisk fire til seks klasser.<br />

Klasseløse eller <strong>klasseinndelte</strong> skr<strong>av</strong>ur<strong>kart</strong><br />

Hvordan en skal klasseinndele et større antall variabelverdier til et mindre antall<br />

klasser er et problem som er behørig diskutert innenfor den <strong>kart</strong>ografiske litteratur. De<br />

fleste mente det var best å ha et begrenset antall klasser, men Waldo Tobler mente at<br />

vi ikke burde klasseinndele overhode (Tobler, 1973). Tobler fremhevet at for<br />

klasseløse skr<strong>av</strong>ur<strong>kart</strong> korresponderer symboliseringen (‘the visual intensity’) med de<br />

underliggende dat<strong>av</strong>erdier (‘the data intensity’) og at disse <strong>kart</strong>ene dermed ikke har<br />

klassifikasjonsfeil (Tobler 1973, 262). Dobson kritiserte Tobler’s løsning og hevdet at<br />

den ikke hadde noen tilfredstillende løsning med hensyn til ”persepsjonsfeil”<br />

(‘perceptual error’) som var en funksjon som økte med et økende antall klasser<br />

(Dobson 1973, 359).<br />

2


Mange år senere revitaliserte Kennedy (1994) denne debatten og utfordret<br />

hovedargumentet for å klasseinndele, nemlig for å unngå en degenerert lesbarhet.<br />

Kennedy utfordret dermed påstanden om at den høye nøyaktigheten for klasseløse<br />

skr<strong>av</strong>ur<strong>kart</strong> kun var <strong>av</strong> matematisk og ikke perseptuell art. Hun konkluderte med at en<br />

er i stand til å regionalisere romlige mønstre i klasseløse skr<strong>av</strong>ur<strong>kart</strong> selv på grunn <strong>av</strong><br />

det store antall klasser, samt at en er i ganske bra stand til å skille mellom<br />

lyshetsvariasjoner i klasseløse <strong>kart</strong> (Kennedy 1994, 19). Det siste kan dessuten enkelt<br />

forbedres med å implementere interaktivitet i programpakken slik at brukeren ved en<br />

musbevegelse over de geografiske enheter i et klasseløst <strong>kart</strong>, får frem de<br />

underliggende dat<strong>av</strong>erdien relatert til denne enhet. Slik kan en sammenlikne<br />

dat<strong>av</strong>erdier mellom tilgrensende enheter (nabo kommuner). En er dermed ikke<br />

<strong>av</strong>hengig <strong>av</strong> å diskriminere lyshetsvariasjonene for å verdi sammenlikne områder.<br />

Kennedy’s motivasjon for å gjenoppta debatten om klasseløse skr<strong>av</strong>ur<strong>kart</strong> synes å<br />

være at ikke alle <strong>kart</strong>produsenter har <strong>kart</strong>ografisk opplæring, noe som hun mener gjør<br />

debatten enda mer aktuell i dag siden tilgjengelig teknologi gjør det mulig for<br />

nærmest hvem som helst å produsere <strong>kart</strong> (Kennedy 1994, 16). Kartene produsert <strong>av</strong><br />

slike ”nye” <strong>kart</strong>produsenter kan være estetisk attraktive, men meget unøyaktige.<br />

Følgelig fremhever hun at det er en forpliktelse å kommunisere strukturen til de<br />

underliggende data (Kennedy 1994, 20), eller sagt på en annen måte: vi har en<br />

forpliktelse til å lage nøyaktige skr<strong>av</strong>ur<strong>kart</strong>. Jeg vil legge til at selv erfarne <strong>kart</strong><br />

produsenter kan ha vanskelig å oppfylle dette, simpelthen fordi det ikke er vanlig i<br />

GIS eller <strong>kart</strong>ografiske programpakker og ha noe system for kvalitetsrapportering.<br />

Dermed vet en ikke om de aktuelle skr<strong>av</strong>ur<strong>kart</strong> en måtte produsere kommuniserer<br />

strukturen til de underliggende data.<br />

Behov for kvalitetsrapport<br />

Denne presentasjonen er om kvalitetskontroll <strong>av</strong> <strong>klasseinndelte</strong> <strong>statistiske</strong> <strong>kart</strong>. Det er<br />

flere <strong>av</strong> de typer <strong>kart</strong> som kommer innunder benevnelsen <strong>statistiske</strong> <strong>kart</strong> hvor<br />

utformingen <strong>av</strong> disse <strong>kart</strong> innebærer en klasseinndeling. Imidlertid skal jeg begrense<br />

meg her til den mest vanlige type <strong>statistiske</strong> <strong>kart</strong> hvor klasseinndeling inngår; nemlig<br />

skr<strong>av</strong>ur<strong>kart</strong>et. Kvalitet er en viktig egenskap for alle <strong>kart</strong>ografiske produkter og det<br />

stilles etter hvert kr<strong>av</strong> til leverandører <strong>av</strong> geodata at disse skal rapportere kvaliteten på<br />

sine data. Dette er blitt særlig gjeldende som en følge <strong>av</strong> internasjonalt<br />

3


standardiseringsarbeid; når data skal deles er dokumentasjon <strong>av</strong> kvalitet viktig.<br />

Mindre aktivitet synes det å være rundt dokumentasjon <strong>av</strong> <strong>kart</strong>ografiske<br />

sluttprodukter. Det er ingen grunn til å la dette være ugjort når det gjelder<br />

<strong>klasseinndelte</strong> skr<strong>av</strong>ur<strong>kart</strong> for her finnes det metoder for å dokumentere kvalitet <strong>av</strong><br />

<strong>klasseinndelte</strong> skr<strong>av</strong>ur<strong>kart</strong> (Jenks og Caspall, 1971).<br />

Som allerede nevnt er det vanlig å klasseinndele variabelen som skal fremstilles i<br />

skr<strong>av</strong>ur<strong>kart</strong> for å forenkle det visuelle uttrykket slik at <strong>kart</strong>et skal være et ”effektivt<br />

kommunikasjonsmedium”. MacEachren kritiserer denne iveren etter forenkling, en<br />

kritikk jeg deler:<br />

‘In many cases we seem to h<strong>av</strong>e lost sight of the fact that maps are intended to communicate<br />

something about geographic reality. We h<strong>av</strong>e instead limited our attention to evaluating the<br />

reader’s ability to interpret the mapped representation of that reality. To evaluate<br />

‘communication effectiveness’ of a thematic map, we must first know the underlying accuracy<br />

of that map’ (MacEachren 1985, 38).<br />

I følge MacEachren (1985, 39) vil den underliggende nøyaktighet til et hvilket som<br />

helst kvantitativt statistisk <strong>kart</strong> være <strong>av</strong>hengig <strong>av</strong> fire faktorer:<br />

1. Prosedyre for <strong>kart</strong>produksjon,<br />

2. Metoder for datainnsamling,<br />

3. Strategier for data klassifikasjon, og<br />

4. Symbolisering.<br />

Mens MacEachren’s artikkel vier spesiell oppmerksomhet til nøyaktighet relatert til<br />

symbolisering <strong>av</strong> skr<strong>av</strong>ur<strong>kart</strong> (den fjerde faktor), vies oppmerksomheten her til<br />

nøyaktighet relatert til data klassifikasjon (den tredje faktor). Et mål for<br />

klassifikasjonsnøyaktighet som er utviklet er GVF indeksen. GVF er en forkortelse<br />

for Goodness of Variance Fit. Før jeg kommer inn på hva denne GVF indeksen kan<br />

fortelle oss om klassifikasjonsnøyaktighet skal jeg motivere litt om hvorfor en bør<br />

angi klassifikasjonsnøyaktigheten. Jeg skal gjennomføre denne motivasjonen med<br />

utganspunkt i to ”case” som jeg har hentet fra programpakken Statistisk Sett – Utforsk<br />

Norge på egen hånd som er utviklet <strong>av</strong> Statens Kartverk, Statistisk Sentralbyrå og<br />

Geodata. Statistiske data og <strong>kart</strong>data fra disse to ”case” er også benyttet i en<br />

egenutviklet programpakke, GIB, for nettopp å kunne angi klassifikasjonsnøyaktighet.<br />

4


I figur 2 ser vi to <strong>kart</strong> som er produsert i programpakken Statistisk Sett. Begge <strong>kart</strong>ene<br />

fremstiller variabelen befolkning per 1.1.1998, aldersgruppe 67 år og over, prosent <strong>av</strong><br />

total befolkning inndelt i det samme antall klasser og med lik symbolisering, men<br />

metode for å klasseinndele dat<strong>av</strong>erdiene er forskjellig. I <strong>kart</strong>et til venstre, som er<br />

prototype<strong>kart</strong>et (”default” løsning), er ”kvantil” metoden benyttet og i <strong>kart</strong>et til høyre<br />

er ”like intervall” metoden benyttet. Det geografiske mønsteret er ganske likt i begge<br />

<strong>kart</strong>ene, men <strong>kart</strong>et til venstre forsterker en kontrast mellom et ”fjordbelte” og innland<br />

og forsterker dermed inntrykket <strong>av</strong> at de gamle bor i de grisgrendte bygdene mens de<br />

unge bor i byer, bynære områder eller tettsteder. I <strong>kart</strong>et til høyre er det et ganske likt<br />

bilde som dannes, men kontrastene er her mye mer dempet – bildet er mer nyansert.<br />

Hvilke <strong>av</strong> <strong>kart</strong>ene er det mest nøyaktige? Hvordan kan slik nøyaktighet angis?<br />

Figur 2: Befolkning per 1.1.1998, aldersgruppe 67 år og over, prosent <strong>av</strong> total befolkning<br />

fremstilt etter henholdsvis kvantil (venstre) og like intervall (høyre) inndeling.<br />

I figur 3 vises også to <strong>kart</strong> produsert i programpakken Statistisk Sett. Her fremstilles<br />

variabelen eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over.<br />

Igjen vises samme variabel inndelt i det samme antall klasser og med lik<br />

symbolisering, men metode for å klasseinndele dat<strong>av</strong>erdiene er forskjellig. Igjen er<br />

<strong>kart</strong>et til venstre prototypeløsningen, en kvantilinndeling i fire klasser, mens for <strong>kart</strong>et<br />

til venstre er metoden ”like intervall” benyttet. Kontrasten mellom disse to <strong>kart</strong>ene er<br />

betydelig. Hvilket <strong>av</strong> disse <strong>kart</strong>ene som benyttes for å formidle nivået på<br />

5


eldreomsorgen blant trøndelagskommunene vil resultere i to vidt forskjellige<br />

tolkninger <strong>av</strong> velferdsnivået. Hvilket <strong>av</strong> <strong>kart</strong>ene er nærmest virkeligheten? Igjen – vi<br />

har behov for å kunne angi kvalitet.<br />

Figur 3: Eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over, fremstilt etter<br />

henholdsvis kvantil (venstre) og like intervall (høyre) inndeling.<br />

Visualisering og nummerisk angivelse <strong>av</strong> nøyaktighet<br />

Det er to komponenter som her foreslås å kunne utgjøre en kvalitetsrapport for<br />

skr<strong>av</strong>ur<strong>kart</strong>: visualisering <strong>av</strong> nøyaktighet og en nummerisk angivelse <strong>av</strong> nøyaktighet.<br />

For å angi nøyaktighet foreslås det å bruke to mål; GVF (Goodness of Variance Fit)<br />

og SDCMc (Standard Deviation Class Means – per klasse). GVF verdien sier noe om<br />

den totale nøyaktighet til <strong>kart</strong>et, mens SDCMc sier noe om feilbidraget til GVF<br />

verdien fra de enkelte klassene. Både visualisering og nummerisk angivelse <strong>av</strong><br />

nøyaktighet tar utgangspunkt i et sorterte stolpediagram <strong>av</strong> den variabel som<br />

fremstilles i skr<strong>av</strong>ur<strong>kart</strong>. For variabelen befolkning per 1.1.1998, aldersgruppe 67 år<br />

og over, prosent <strong>av</strong> total befolkning for de to trøndelagsfylkene vil diagrammet se ut<br />

som vist i figur 4.<br />

6


Min: 7,4<br />

Figur 4: Sortert stolpediagram for variabelen befolkning per 1.1.1998, aldersgruppe 67 år og<br />

over, prosent <strong>av</strong> total befolkning for de to trøndelagsfylkene som består <strong>av</strong> 49 kommuner.<br />

Minimumsverdier for dette datasettet er 7,4% mens maksimumsverdien er 23,8%.<br />

Som n<strong>av</strong>net på GVF indeksen antyder, Goodness of Variance Fit, er nøyaktigheten et<br />

mål på hvor godt to kurver sammenfaller. Den ene kurven er variabelens fordeling,<br />

som vist i figur 4, mens den andre kurven er kurven for den <strong>klasseinndelte</strong> fordeling<br />

(se figur 5).<br />

orginal distribusjon<br />

klasseinndelt distribusjon (kvantiler)<br />

1. klasse<br />

12 obs.<br />

2. klasse<br />

12 obs.<br />

49 kommuner<br />

7<br />

3. klasse<br />

12 obs.<br />

4. klasse<br />

13 obs.<br />

Max: 23,8<br />

Figur 5: Kurvesammenlikning for variabelens originale fordeling og den <strong>klasseinndelte</strong><br />

fordeling (kvantil inndeling).


Nøyaktighetsmålene beregnes ved følgende fremgangsmåte:<br />

1. Beregn aritmetisk gjennomsnitt <strong>av</strong> hver klasse: Z c .<br />

2. For hver klasse, beregn summen <strong>av</strong> de kvadrerte <strong>av</strong>vik mellom<br />

klassegjennomsnitt og observasjonsverdi: ∑ −<br />

2<br />

( c ) Z x . Denne verdien<br />

kalles for SDCMc. (Summen <strong>av</strong> <strong>av</strong>vikene (ikke de kvadrerte) mellom<br />

klassegjennomsnitt og observasjonsverdi er enkelt å visualisere slik som<br />

det er vist i figur 6).<br />

3. Summer for alle klassene: ∑∑ −<br />

2<br />

( c ) Z x . Denne verdien kalles for<br />

SDCM (Standard Deviation Class Means).<br />

4. Beregn aritmetisk gjennomsnitt for alle observasjonsverdier: X<br />

5. Beregn summen <strong>av</strong> de kvadrerte <strong>av</strong>vik mellom observasjonsverdiene og<br />

gjennomsnittet, for hele datasettet: ∑ − ( X<br />

8<br />

i<br />

x i<br />

2<br />

)<br />

i<br />

. Denne verdien kalles for<br />

SDAM (Standard Deviation, Array Mean).<br />

6. GVF verdien beregnes på grunnlag <strong>av</strong> SDCM og SDAM:<br />

GVF<br />

SDAM − SDCM<br />

SDAM<br />

= .<br />

GVF verdien er altså et mål på klasseinndelingens <strong>statistiske</strong> tilpassing i forhold til de<br />

opprinnelige data. Verdien for GVF indeksen er mellom 0 og 1 der høye verdier betyr<br />

en god statistisk tilpassing mellom de opprinnelige data – altså desto høyere GVF<br />

verdi desto mer nøyaktig er skr<strong>av</strong>ur<strong>kart</strong>et.<br />

Feilareal<br />

Mål på<br />

nøyaktighet<br />

Figur 6: Visualisering og mål på nøyaktighet (skjermbilde fra GIB). Variabel er her<br />

”eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over”.


I figur 6 vises det sorterte stolpediagrammet for variabelen ”eldreomsorg 1997,<br />

institusjonsplasser per 1000 innbyggere 67 år og over” klasseinndelt i fire tilnærmet<br />

like klasser (kvartilinndeling). Klassifikasjonsfeil visualiseres her som <strong>av</strong>viket<br />

mellom observasjonsverdiene og klassens gjennomsnitt. Det resulterende feilareal for<br />

denne klassifikasjonsfeil vises med en rød farge. Desto mindre dette feilarealet er,<br />

desto bedre samsvar er det mellom fordelingen <strong>av</strong> de opprinnelige dat<strong>av</strong>erdiene og<br />

den <strong>klasseinndelte</strong> fordeling. Som en forstår ut fra figur 5 og 6 vil nøyaktigheten øke<br />

med et økende antall klasser. Perfekt samsvar oppnås når antall klasser tilsvarer antall<br />

observasjoner med unike verdier. Dette gir en GVF verdi lik en. Et klasseløst<br />

skr<strong>av</strong>ur<strong>kart</strong> har et antall klasser likt antall unike observasjonsverdier og vil følgelig<br />

være det mest nøyaktige skr<strong>av</strong>ur<strong>kart</strong>.<br />

Når klassegrenser plasseres mellom to observasjonsverdier som er nær hverandre i<br />

verdi slik som klassegrensen mellom tredje og fjerde klasse, fremheves det i <strong>kart</strong>et en<br />

forskjell som ikke finnes i <strong>kart</strong>et (se figur 7). Videre finnes det i datasettet store<br />

forskjeller mellom de 13 observasjonene helt til høyre i diagrammet som er blitt<br />

tilordner den fjerde klassen. Dermed skjules det i <strong>kart</strong>et en forskjell som finnes i<br />

datasettet. For <strong>klasseinndelte</strong> <strong>kart</strong> gjelder at desto større homogenitet innad i klassene<br />

(liten varians) og desto større heterogenitet mellom klassene (stor varians), desto<br />

bedre GVF verdi og desto bedre klassifikasjon. Følgelig vil kvantil inndelingen som<br />

er benyttet for <strong>kart</strong>et i figur 6, gi en dårlig GVF verdi.<br />

9<br />

a)<br />

b)


Figur 7: Plassering <strong>av</strong> klassegrenser som medfører at variasjon som finnes i datasettet skjules<br />

(b) i <strong>kart</strong>et og at en forskjell som ikke (eller i liten grad) finnes i datasettet (b) blir fremhevet i<br />

<strong>kart</strong>et. Variabelen er ”eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over”<br />

Som en kvalitetssikring vil jeg foreslå at prototype <strong>kart</strong>et som systemet velger som<br />

default blir det skr<strong>av</strong>ur<strong>kart</strong> som er klasseinndelt etter den metode som resulterer i den<br />

beste GVF verdien. Tilsvarende kunne en kvalitetskontroll innebære at en fikk<br />

respons på en bestemt klasseinndeling på hvor god klasseinndelingen var og gi<br />

mulighet til at brukeren kan gjøre om på klassifikasjonen om GVF verdien viser seg å<br />

være for dårlig. Jeg har utviklet en programpakke der dette er inkludert som et<br />

interaktivt brukergrensesnitt. Endringer som gjøres i en interaktiv tegnforklaring<br />

medfører at diagram og <strong>kart</strong> blir oppdatert (se figur 8).<br />

a)<br />

c)<br />

Figur 8: Sammenkoblede vinduer. Gjøres det endringer i den interaktive tegnforklaringen (b)<br />

eller i diagrammet (c) oppdateres <strong>kart</strong>, diagram og statistikken i den interaktive tegnforklaringen<br />

Variabelen er her ”eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over”.<br />

Vi har nå et verktøy for å sammenlikne nøyaktighet mellom skr<strong>av</strong>ur<strong>kart</strong> med ulike<br />

klasseinndelinger og den generelle anbefaling er å velge den klasseinndeling som<br />

10<br />

b)


medfører den GVF verdi som er nærmest verdien en. ”Case’ene” i denne<br />

presentasjonen hadde følgende GVF verdier:<br />

Kvantil Like intervall<br />

Andel eldre 0,855 0,901<br />

Eldreomsorg 0,473 0,844<br />

Konkluderende perspektiv<br />

I følge Declercq (1995) er GVF verdien 0,95 en terskel for hva en kan betrakte som<br />

god klassifikasjon. Klassifikasjoner som resulterer i en GVF verdi lik eller større enn<br />

0,95 vil dermed bli betraktet som en god klassifikasjon. For de ”case” som er<br />

presentert her behøves det, i alle fall om metodene kvantiler og like intervall skal<br />

benyttes, et større antall klasser enn de vanlige mellom fire til seks. Basert på<br />

Kennedy’s konklusjon over, vil det her anbefales, enten å benytte et klasseløst <strong>kart</strong><br />

eller benytte den klasseinndeling som gir høyest GVF og gjerne om nødvendig øke<br />

antall klasser for å sikre en høyere GVF verdi. Om en har en GVF verdi lik eller større<br />

enn 0,95 er det større sannsynlighet for at det romlige mønsteret i skr<strong>av</strong>ur<strong>kart</strong>et<br />

korresponderer med det reelle og det er mindre sannsynlighet for at <strong>kart</strong>et enten<br />

fremhever geografiske forskjeller som ikke finnes i datasettet, eller skjuler<br />

geografiske forskjeller som finnes i datasettet.<br />

Referanser<br />

Declercq F A N 1995 Choropleth map accuracy and the number of class intervals in<br />

Cartography crossing borders 17 th International Cartographic Conference<br />

Barcelone Sept. 1995, 918–922<br />

Dobson M W 1973 Choropleth maps without class intervals? A comment.<br />

Geographical Analysis 5 (3) 358–360<br />

Jenks and Caspall F C 1971 Error on choroplethic maps: definition, measurement,<br />

reduction Annals of the Association of American Geographers 61 (2) 217–244<br />

11


Kennedy S 1994 Unclassed choropleth maps revisited / Some guidelines for the<br />

construction of unclassed and classed choropleth maps Cartographica 31 (1) 16–<br />

25<br />

MacEachren A M 1985 Accuracy of thematic maps / Implications of choropleth<br />

symbolization Cartographica 22 (1) 38–58<br />

Tobler W R 1973 Choropleth maps without class intervals? Geographical Analysis 5<br />

262–264<br />

12

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!