Kvalitetskontroll av klasseinndelte statistiske kart - Norsk Nettskole
Kvalitetskontroll av klasseinndelte statistiske kart - Norsk Nettskole
Kvalitetskontroll av klasseinndelte statistiske kart - Norsk Nettskole
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Innledning<br />
<strong>Kvalitetskontroll</strong> <strong>av</strong> <strong>klasseinndelte</strong> <strong>statistiske</strong> <strong>kart</strong><br />
Jan Ketil Rød<br />
Institutt for Geomatikk<br />
NTNU<br />
jan.rod@geomatikk.ntnu.no<br />
Statistiske <strong>kart</strong> er en type tematiske <strong>kart</strong> som fremstiller en eller et fåtall antall<br />
variabler. Variabelen(e) finnes lagret i en tabell som kobles mot et grense<strong>kart</strong>. Én rad i<br />
tabellen korresponderer vanligvis med én geografisk enhet i <strong>kart</strong>et. Både enhetens<br />
nivå, for eksempel fylke eller kommune, og geografisk område, for eksempel<br />
Trøndelag, korresponderer både for tabell og <strong>kart</strong> slik som vist i figur 1.<br />
KOMMUNE N<strong>av</strong>n Instpl67<br />
1601 Trondheim 59,6<br />
1612 Hemne 59,9<br />
1613 Snillfjord 130,6<br />
1617 Hitra 90,9<br />
1620 Frøya 63,6<br />
1621 Ørland 59<br />
1622 Agdenes 85,5<br />
1624 Rissa 82,7<br />
1627 Bjugn 93,6<br />
1630 Åfjord 120<br />
1632 Roan 67,5<br />
1633 Osen 75,9<br />
1634 Oppdal 51,3<br />
1635 Rennebu 70,1<br />
1636 Meldal 67,7<br />
1638 Orkdal 70,5<br />
1640 Røros 80,2<br />
1644 Holtålen 101,7<br />
1648 MidtreGaul 118,7<br />
1653 Melhus 85,3<br />
1657 Skaun 97,4<br />
1662 Klæbu 245<br />
1663 Malvik 74,5<br />
1664 Selbu 57,2<br />
1665 Tydal 161,8<br />
1702 Steinkjer 54,8<br />
1703 Namsos 46,4<br />
1711 Meråker 130<br />
1714 Stjørdal 77,3<br />
1717 Frosta 64,8<br />
1718 Leksvik 78,8<br />
1719 Levanger 53,2<br />
1721 Verdal 75,7<br />
1723 Mosvik 125<br />
1724 Verran 61,1<br />
1725 Namdalsei 74,7<br />
1729 Inderøy 76,1<br />
1736 Snåsa 90,5<br />
1738 Lierne 116<br />
1739 Røyrvik 371,8<br />
1740 Namsskog 109,3<br />
1742 Grong 101,5<br />
1743 Høylandet 105<br />
1744 Overhalla 91,9<br />
1748 Fosnes 118,9<br />
1749 Flatanger 115,7<br />
1750 Vikna 106,5<br />
1751 Nærøy 75,7<br />
1755 Leka 103,2<br />
KOMMUNE N<strong>av</strong>n Instpl67<br />
1601 Trondheim 59,6<br />
Figur 1: Kobling <strong>av</strong> tabell og <strong>kart</strong> for produksjon <strong>av</strong> <strong>statistiske</strong> <strong>kart</strong>.<br />
Grense<strong>kart</strong>et blir symbolisert med tegn hvis uttrykk (størrelsesvariasjon eller<br />
lyshetsvariasjon) korresponderer, mer eller mindre, med variabelens verdibredde.<br />
Fordelen med <strong>statistiske</strong> <strong>kart</strong> er at det ofte er lettere, eller kanskje først da blir mulig, å<br />
1
oppdage eventuelle geografiske mønstre; hvor det er høye verdier og hvor det er l<strong>av</strong>e<br />
verdier <strong>av</strong> en bestemt variabel. Det er vanlig å skille mellom absolutte og relative<br />
variabelverdier. Størrelsesproporsjonale <strong>kart</strong> anbefales benyttes for å fremstille<br />
absolutte tallverdier mens skr<strong>av</strong>ur<strong>kart</strong> anbefales for å fremstille relative tallverdier.<br />
Absolutte tallverdier kan for eksempel være:<br />
• Antall individer som utgjør befolkningsmengden<br />
• Antall individer i en bestemt aldersgruppe eller <strong>av</strong> et bestemt kjønn<br />
• Antall sysselsatte totalt eller antall sysselsatte innen en bestemt sektor<br />
Relative verdier utrykkes ofte som prosenter og er utledede verdier fra absolutte<br />
verdier, som for eksempel:<br />
• Befolkningstetthet der absolutte befolkningstall er dividert med bebodd<br />
areal<br />
• Befolkningsandel der en bestemt gruppe <strong>av</strong> befolkningen, som for<br />
eksempel befolkningen over 67 år, er dividert med total befolkning<br />
• Sysselsetting innen en bestemt sektor dividert med total sysselsetting.<br />
I skr<strong>av</strong>ur<strong>kart</strong>et fremstilles variabelverdiene etter metaforen desto mørkere<br />
symbolisering desto høyere verdi. For eksempel: lys blåfarge – l<strong>av</strong> verdi, mørk<br />
blåfarge – høy verdi. Begrunnet ut fra øyets begrensede mulighet til å differensiere<br />
mellom et større antall lyshetsvariasjoner, er det blitt en <strong>kart</strong>ografisk tradisjon å vise<br />
variabelverdiene i skr<strong>av</strong>ur<strong>kart</strong>et med et l<strong>av</strong>t antall klasser, typisk fire til seks klasser.<br />
Klasseløse eller <strong>klasseinndelte</strong> skr<strong>av</strong>ur<strong>kart</strong><br />
Hvordan en skal klasseinndele et større antall variabelverdier til et mindre antall<br />
klasser er et problem som er behørig diskutert innenfor den <strong>kart</strong>ografiske litteratur. De<br />
fleste mente det var best å ha et begrenset antall klasser, men Waldo Tobler mente at<br />
vi ikke burde klasseinndele overhode (Tobler, 1973). Tobler fremhevet at for<br />
klasseløse skr<strong>av</strong>ur<strong>kart</strong> korresponderer symboliseringen (‘the visual intensity’) med de<br />
underliggende dat<strong>av</strong>erdier (‘the data intensity’) og at disse <strong>kart</strong>ene dermed ikke har<br />
klassifikasjonsfeil (Tobler 1973, 262). Dobson kritiserte Tobler’s løsning og hevdet at<br />
den ikke hadde noen tilfredstillende løsning med hensyn til ”persepsjonsfeil”<br />
(‘perceptual error’) som var en funksjon som økte med et økende antall klasser<br />
(Dobson 1973, 359).<br />
2
Mange år senere revitaliserte Kennedy (1994) denne debatten og utfordret<br />
hovedargumentet for å klasseinndele, nemlig for å unngå en degenerert lesbarhet.<br />
Kennedy utfordret dermed påstanden om at den høye nøyaktigheten for klasseløse<br />
skr<strong>av</strong>ur<strong>kart</strong> kun var <strong>av</strong> matematisk og ikke perseptuell art. Hun konkluderte med at en<br />
er i stand til å regionalisere romlige mønstre i klasseløse skr<strong>av</strong>ur<strong>kart</strong> selv på grunn <strong>av</strong><br />
det store antall klasser, samt at en er i ganske bra stand til å skille mellom<br />
lyshetsvariasjoner i klasseløse <strong>kart</strong> (Kennedy 1994, 19). Det siste kan dessuten enkelt<br />
forbedres med å implementere interaktivitet i programpakken slik at brukeren ved en<br />
musbevegelse over de geografiske enheter i et klasseløst <strong>kart</strong>, får frem de<br />
underliggende dat<strong>av</strong>erdien relatert til denne enhet. Slik kan en sammenlikne<br />
dat<strong>av</strong>erdier mellom tilgrensende enheter (nabo kommuner). En er dermed ikke<br />
<strong>av</strong>hengig <strong>av</strong> å diskriminere lyshetsvariasjonene for å verdi sammenlikne områder.<br />
Kennedy’s motivasjon for å gjenoppta debatten om klasseløse skr<strong>av</strong>ur<strong>kart</strong> synes å<br />
være at ikke alle <strong>kart</strong>produsenter har <strong>kart</strong>ografisk opplæring, noe som hun mener gjør<br />
debatten enda mer aktuell i dag siden tilgjengelig teknologi gjør det mulig for<br />
nærmest hvem som helst å produsere <strong>kart</strong> (Kennedy 1994, 16). Kartene produsert <strong>av</strong><br />
slike ”nye” <strong>kart</strong>produsenter kan være estetisk attraktive, men meget unøyaktige.<br />
Følgelig fremhever hun at det er en forpliktelse å kommunisere strukturen til de<br />
underliggende data (Kennedy 1994, 20), eller sagt på en annen måte: vi har en<br />
forpliktelse til å lage nøyaktige skr<strong>av</strong>ur<strong>kart</strong>. Jeg vil legge til at selv erfarne <strong>kart</strong><br />
produsenter kan ha vanskelig å oppfylle dette, simpelthen fordi det ikke er vanlig i<br />
GIS eller <strong>kart</strong>ografiske programpakker og ha noe system for kvalitetsrapportering.<br />
Dermed vet en ikke om de aktuelle skr<strong>av</strong>ur<strong>kart</strong> en måtte produsere kommuniserer<br />
strukturen til de underliggende data.<br />
Behov for kvalitetsrapport<br />
Denne presentasjonen er om kvalitetskontroll <strong>av</strong> <strong>klasseinndelte</strong> <strong>statistiske</strong> <strong>kart</strong>. Det er<br />
flere <strong>av</strong> de typer <strong>kart</strong> som kommer innunder benevnelsen <strong>statistiske</strong> <strong>kart</strong> hvor<br />
utformingen <strong>av</strong> disse <strong>kart</strong> innebærer en klasseinndeling. Imidlertid skal jeg begrense<br />
meg her til den mest vanlige type <strong>statistiske</strong> <strong>kart</strong> hvor klasseinndeling inngår; nemlig<br />
skr<strong>av</strong>ur<strong>kart</strong>et. Kvalitet er en viktig egenskap for alle <strong>kart</strong>ografiske produkter og det<br />
stilles etter hvert kr<strong>av</strong> til leverandører <strong>av</strong> geodata at disse skal rapportere kvaliteten på<br />
sine data. Dette er blitt særlig gjeldende som en følge <strong>av</strong> internasjonalt<br />
3
standardiseringsarbeid; når data skal deles er dokumentasjon <strong>av</strong> kvalitet viktig.<br />
Mindre aktivitet synes det å være rundt dokumentasjon <strong>av</strong> <strong>kart</strong>ografiske<br />
sluttprodukter. Det er ingen grunn til å la dette være ugjort når det gjelder<br />
<strong>klasseinndelte</strong> skr<strong>av</strong>ur<strong>kart</strong> for her finnes det metoder for å dokumentere kvalitet <strong>av</strong><br />
<strong>klasseinndelte</strong> skr<strong>av</strong>ur<strong>kart</strong> (Jenks og Caspall, 1971).<br />
Som allerede nevnt er det vanlig å klasseinndele variabelen som skal fremstilles i<br />
skr<strong>av</strong>ur<strong>kart</strong> for å forenkle det visuelle uttrykket slik at <strong>kart</strong>et skal være et ”effektivt<br />
kommunikasjonsmedium”. MacEachren kritiserer denne iveren etter forenkling, en<br />
kritikk jeg deler:<br />
‘In many cases we seem to h<strong>av</strong>e lost sight of the fact that maps are intended to communicate<br />
something about geographic reality. We h<strong>av</strong>e instead limited our attention to evaluating the<br />
reader’s ability to interpret the mapped representation of that reality. To evaluate<br />
‘communication effectiveness’ of a thematic map, we must first know the underlying accuracy<br />
of that map’ (MacEachren 1985, 38).<br />
I følge MacEachren (1985, 39) vil den underliggende nøyaktighet til et hvilket som<br />
helst kvantitativt statistisk <strong>kart</strong> være <strong>av</strong>hengig <strong>av</strong> fire faktorer:<br />
1. Prosedyre for <strong>kart</strong>produksjon,<br />
2. Metoder for datainnsamling,<br />
3. Strategier for data klassifikasjon, og<br />
4. Symbolisering.<br />
Mens MacEachren’s artikkel vier spesiell oppmerksomhet til nøyaktighet relatert til<br />
symbolisering <strong>av</strong> skr<strong>av</strong>ur<strong>kart</strong> (den fjerde faktor), vies oppmerksomheten her til<br />
nøyaktighet relatert til data klassifikasjon (den tredje faktor). Et mål for<br />
klassifikasjonsnøyaktighet som er utviklet er GVF indeksen. GVF er en forkortelse<br />
for Goodness of Variance Fit. Før jeg kommer inn på hva denne GVF indeksen kan<br />
fortelle oss om klassifikasjonsnøyaktighet skal jeg motivere litt om hvorfor en bør<br />
angi klassifikasjonsnøyaktigheten. Jeg skal gjennomføre denne motivasjonen med<br />
utganspunkt i to ”case” som jeg har hentet fra programpakken Statistisk Sett – Utforsk<br />
Norge på egen hånd som er utviklet <strong>av</strong> Statens Kartverk, Statistisk Sentralbyrå og<br />
Geodata. Statistiske data og <strong>kart</strong>data fra disse to ”case” er også benyttet i en<br />
egenutviklet programpakke, GIB, for nettopp å kunne angi klassifikasjonsnøyaktighet.<br />
4
I figur 2 ser vi to <strong>kart</strong> som er produsert i programpakken Statistisk Sett. Begge <strong>kart</strong>ene<br />
fremstiller variabelen befolkning per 1.1.1998, aldersgruppe 67 år og over, prosent <strong>av</strong><br />
total befolkning inndelt i det samme antall klasser og med lik symbolisering, men<br />
metode for å klasseinndele dat<strong>av</strong>erdiene er forskjellig. I <strong>kart</strong>et til venstre, som er<br />
prototype<strong>kart</strong>et (”default” løsning), er ”kvantil” metoden benyttet og i <strong>kart</strong>et til høyre<br />
er ”like intervall” metoden benyttet. Det geografiske mønsteret er ganske likt i begge<br />
<strong>kart</strong>ene, men <strong>kart</strong>et til venstre forsterker en kontrast mellom et ”fjordbelte” og innland<br />
og forsterker dermed inntrykket <strong>av</strong> at de gamle bor i de grisgrendte bygdene mens de<br />
unge bor i byer, bynære områder eller tettsteder. I <strong>kart</strong>et til høyre er det et ganske likt<br />
bilde som dannes, men kontrastene er her mye mer dempet – bildet er mer nyansert.<br />
Hvilke <strong>av</strong> <strong>kart</strong>ene er det mest nøyaktige? Hvordan kan slik nøyaktighet angis?<br />
Figur 2: Befolkning per 1.1.1998, aldersgruppe 67 år og over, prosent <strong>av</strong> total befolkning<br />
fremstilt etter henholdsvis kvantil (venstre) og like intervall (høyre) inndeling.<br />
I figur 3 vises også to <strong>kart</strong> produsert i programpakken Statistisk Sett. Her fremstilles<br />
variabelen eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over.<br />
Igjen vises samme variabel inndelt i det samme antall klasser og med lik<br />
symbolisering, men metode for å klasseinndele dat<strong>av</strong>erdiene er forskjellig. Igjen er<br />
<strong>kart</strong>et til venstre prototypeløsningen, en kvantilinndeling i fire klasser, mens for <strong>kart</strong>et<br />
til venstre er metoden ”like intervall” benyttet. Kontrasten mellom disse to <strong>kart</strong>ene er<br />
betydelig. Hvilket <strong>av</strong> disse <strong>kart</strong>ene som benyttes for å formidle nivået på<br />
5
eldreomsorgen blant trøndelagskommunene vil resultere i to vidt forskjellige<br />
tolkninger <strong>av</strong> velferdsnivået. Hvilket <strong>av</strong> <strong>kart</strong>ene er nærmest virkeligheten? Igjen – vi<br />
har behov for å kunne angi kvalitet.<br />
Figur 3: Eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over, fremstilt etter<br />
henholdsvis kvantil (venstre) og like intervall (høyre) inndeling.<br />
Visualisering og nummerisk angivelse <strong>av</strong> nøyaktighet<br />
Det er to komponenter som her foreslås å kunne utgjøre en kvalitetsrapport for<br />
skr<strong>av</strong>ur<strong>kart</strong>: visualisering <strong>av</strong> nøyaktighet og en nummerisk angivelse <strong>av</strong> nøyaktighet.<br />
For å angi nøyaktighet foreslås det å bruke to mål; GVF (Goodness of Variance Fit)<br />
og SDCMc (Standard Deviation Class Means – per klasse). GVF verdien sier noe om<br />
den totale nøyaktighet til <strong>kart</strong>et, mens SDCMc sier noe om feilbidraget til GVF<br />
verdien fra de enkelte klassene. Både visualisering og nummerisk angivelse <strong>av</strong><br />
nøyaktighet tar utgangspunkt i et sorterte stolpediagram <strong>av</strong> den variabel som<br />
fremstilles i skr<strong>av</strong>ur<strong>kart</strong>. For variabelen befolkning per 1.1.1998, aldersgruppe 67 år<br />
og over, prosent <strong>av</strong> total befolkning for de to trøndelagsfylkene vil diagrammet se ut<br />
som vist i figur 4.<br />
6
Min: 7,4<br />
Figur 4: Sortert stolpediagram for variabelen befolkning per 1.1.1998, aldersgruppe 67 år og<br />
over, prosent <strong>av</strong> total befolkning for de to trøndelagsfylkene som består <strong>av</strong> 49 kommuner.<br />
Minimumsverdier for dette datasettet er 7,4% mens maksimumsverdien er 23,8%.<br />
Som n<strong>av</strong>net på GVF indeksen antyder, Goodness of Variance Fit, er nøyaktigheten et<br />
mål på hvor godt to kurver sammenfaller. Den ene kurven er variabelens fordeling,<br />
som vist i figur 4, mens den andre kurven er kurven for den <strong>klasseinndelte</strong> fordeling<br />
(se figur 5).<br />
orginal distribusjon<br />
klasseinndelt distribusjon (kvantiler)<br />
1. klasse<br />
12 obs.<br />
2. klasse<br />
12 obs.<br />
49 kommuner<br />
7<br />
3. klasse<br />
12 obs.<br />
4. klasse<br />
13 obs.<br />
Max: 23,8<br />
Figur 5: Kurvesammenlikning for variabelens originale fordeling og den <strong>klasseinndelte</strong><br />
fordeling (kvantil inndeling).
Nøyaktighetsmålene beregnes ved følgende fremgangsmåte:<br />
1. Beregn aritmetisk gjennomsnitt <strong>av</strong> hver klasse: Z c .<br />
2. For hver klasse, beregn summen <strong>av</strong> de kvadrerte <strong>av</strong>vik mellom<br />
klassegjennomsnitt og observasjonsverdi: ∑ −<br />
2<br />
( c ) Z x . Denne verdien<br />
kalles for SDCMc. (Summen <strong>av</strong> <strong>av</strong>vikene (ikke de kvadrerte) mellom<br />
klassegjennomsnitt og observasjonsverdi er enkelt å visualisere slik som<br />
det er vist i figur 6).<br />
3. Summer for alle klassene: ∑∑ −<br />
2<br />
( c ) Z x . Denne verdien kalles for<br />
SDCM (Standard Deviation Class Means).<br />
4. Beregn aritmetisk gjennomsnitt for alle observasjonsverdier: X<br />
5. Beregn summen <strong>av</strong> de kvadrerte <strong>av</strong>vik mellom observasjonsverdiene og<br />
gjennomsnittet, for hele datasettet: ∑ − ( X<br />
8<br />
i<br />
x i<br />
2<br />
)<br />
i<br />
. Denne verdien kalles for<br />
SDAM (Standard Deviation, Array Mean).<br />
6. GVF verdien beregnes på grunnlag <strong>av</strong> SDCM og SDAM:<br />
GVF<br />
SDAM − SDCM<br />
SDAM<br />
= .<br />
GVF verdien er altså et mål på klasseinndelingens <strong>statistiske</strong> tilpassing i forhold til de<br />
opprinnelige data. Verdien for GVF indeksen er mellom 0 og 1 der høye verdier betyr<br />
en god statistisk tilpassing mellom de opprinnelige data – altså desto høyere GVF<br />
verdi desto mer nøyaktig er skr<strong>av</strong>ur<strong>kart</strong>et.<br />
Feilareal<br />
Mål på<br />
nøyaktighet<br />
Figur 6: Visualisering og mål på nøyaktighet (skjermbilde fra GIB). Variabel er her<br />
”eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over”.
I figur 6 vises det sorterte stolpediagrammet for variabelen ”eldreomsorg 1997,<br />
institusjonsplasser per 1000 innbyggere 67 år og over” klasseinndelt i fire tilnærmet<br />
like klasser (kvartilinndeling). Klassifikasjonsfeil visualiseres her som <strong>av</strong>viket<br />
mellom observasjonsverdiene og klassens gjennomsnitt. Det resulterende feilareal for<br />
denne klassifikasjonsfeil vises med en rød farge. Desto mindre dette feilarealet er,<br />
desto bedre samsvar er det mellom fordelingen <strong>av</strong> de opprinnelige dat<strong>av</strong>erdiene og<br />
den <strong>klasseinndelte</strong> fordeling. Som en forstår ut fra figur 5 og 6 vil nøyaktigheten øke<br />
med et økende antall klasser. Perfekt samsvar oppnås når antall klasser tilsvarer antall<br />
observasjoner med unike verdier. Dette gir en GVF verdi lik en. Et klasseløst<br />
skr<strong>av</strong>ur<strong>kart</strong> har et antall klasser likt antall unike observasjonsverdier og vil følgelig<br />
være det mest nøyaktige skr<strong>av</strong>ur<strong>kart</strong>.<br />
Når klassegrenser plasseres mellom to observasjonsverdier som er nær hverandre i<br />
verdi slik som klassegrensen mellom tredje og fjerde klasse, fremheves det i <strong>kart</strong>et en<br />
forskjell som ikke finnes i <strong>kart</strong>et (se figur 7). Videre finnes det i datasettet store<br />
forskjeller mellom de 13 observasjonene helt til høyre i diagrammet som er blitt<br />
tilordner den fjerde klassen. Dermed skjules det i <strong>kart</strong>et en forskjell som finnes i<br />
datasettet. For <strong>klasseinndelte</strong> <strong>kart</strong> gjelder at desto større homogenitet innad i klassene<br />
(liten varians) og desto større heterogenitet mellom klassene (stor varians), desto<br />
bedre GVF verdi og desto bedre klassifikasjon. Følgelig vil kvantil inndelingen som<br />
er benyttet for <strong>kart</strong>et i figur 6, gi en dårlig GVF verdi.<br />
9<br />
a)<br />
b)
Figur 7: Plassering <strong>av</strong> klassegrenser som medfører at variasjon som finnes i datasettet skjules<br />
(b) i <strong>kart</strong>et og at en forskjell som ikke (eller i liten grad) finnes i datasettet (b) blir fremhevet i<br />
<strong>kart</strong>et. Variabelen er ”eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over”<br />
Som en kvalitetssikring vil jeg foreslå at prototype <strong>kart</strong>et som systemet velger som<br />
default blir det skr<strong>av</strong>ur<strong>kart</strong> som er klasseinndelt etter den metode som resulterer i den<br />
beste GVF verdien. Tilsvarende kunne en kvalitetskontroll innebære at en fikk<br />
respons på en bestemt klasseinndeling på hvor god klasseinndelingen var og gi<br />
mulighet til at brukeren kan gjøre om på klassifikasjonen om GVF verdien viser seg å<br />
være for dårlig. Jeg har utviklet en programpakke der dette er inkludert som et<br />
interaktivt brukergrensesnitt. Endringer som gjøres i en interaktiv tegnforklaring<br />
medfører at diagram og <strong>kart</strong> blir oppdatert (se figur 8).<br />
a)<br />
c)<br />
Figur 8: Sammenkoblede vinduer. Gjøres det endringer i den interaktive tegnforklaringen (b)<br />
eller i diagrammet (c) oppdateres <strong>kart</strong>, diagram og statistikken i den interaktive tegnforklaringen<br />
Variabelen er her ”eldreomsorg 1997, institusjonsplasser per 1000 innbyggere 67 år og over”.<br />
Vi har nå et verktøy for å sammenlikne nøyaktighet mellom skr<strong>av</strong>ur<strong>kart</strong> med ulike<br />
klasseinndelinger og den generelle anbefaling er å velge den klasseinndeling som<br />
10<br />
b)
medfører den GVF verdi som er nærmest verdien en. ”Case’ene” i denne<br />
presentasjonen hadde følgende GVF verdier:<br />
Kvantil Like intervall<br />
Andel eldre 0,855 0,901<br />
Eldreomsorg 0,473 0,844<br />
Konkluderende perspektiv<br />
I følge Declercq (1995) er GVF verdien 0,95 en terskel for hva en kan betrakte som<br />
god klassifikasjon. Klassifikasjoner som resulterer i en GVF verdi lik eller større enn<br />
0,95 vil dermed bli betraktet som en god klassifikasjon. For de ”case” som er<br />
presentert her behøves det, i alle fall om metodene kvantiler og like intervall skal<br />
benyttes, et større antall klasser enn de vanlige mellom fire til seks. Basert på<br />
Kennedy’s konklusjon over, vil det her anbefales, enten å benytte et klasseløst <strong>kart</strong><br />
eller benytte den klasseinndeling som gir høyest GVF og gjerne om nødvendig øke<br />
antall klasser for å sikre en høyere GVF verdi. Om en har en GVF verdi lik eller større<br />
enn 0,95 er det større sannsynlighet for at det romlige mønsteret i skr<strong>av</strong>ur<strong>kart</strong>et<br />
korresponderer med det reelle og det er mindre sannsynlighet for at <strong>kart</strong>et enten<br />
fremhever geografiske forskjeller som ikke finnes i datasettet, eller skjuler<br />
geografiske forskjeller som finnes i datasettet.<br />
Referanser<br />
Declercq F A N 1995 Choropleth map accuracy and the number of class intervals in<br />
Cartography crossing borders 17 th International Cartographic Conference<br />
Barcelone Sept. 1995, 918–922<br />
Dobson M W 1973 Choropleth maps without class intervals? A comment.<br />
Geographical Analysis 5 (3) 358–360<br />
Jenks and Caspall F C 1971 Error on choroplethic maps: definition, measurement,<br />
reduction Annals of the Association of American Geographers 61 (2) 217–244<br />
11
Kennedy S 1994 Unclassed choropleth maps revisited / Some guidelines for the<br />
construction of unclassed and classed choropleth maps Cartographica 31 (1) 16–<br />
25<br />
MacEachren A M 1985 Accuracy of thematic maps / Implications of choropleth<br />
symbolization Cartographica 22 (1) 38–58<br />
Tobler W R 1973 Choropleth maps without class intervals? Geographical Analysis 5<br />
262–264<br />
12