88 geoforum.dk - GeoForum Danmark

geoforum.dk

88 geoforum.dk - GeoForum Danmark

Fortæl mig, hvor du bor og jeg

skal sige dig, hvem du er…

Af Anne Jacobsen, PhD GIS projektleder, Atkins Danmark A/S

Sune Djurhuus, MSc GIS specialist, Atkins Danmark A/S

Erik Sommer, Chefkonsulent, Danmarks Statistik

’Fortæl mig, hvor du bor og jeg

skal sige dig, hvem du er, og hvad

du har brug for” er blevet et mantra

inden for markedsføring. Der er

et stort potentiale for at gøre brug

af de samme former for analyse

inden for lokalplanlægning, forskning

og i sundhedssektoren, men

hvilke data er det egentlig, der ligger

til grund for disse analyser og

hvordan får man kortlagt individbaserede

oplysninger på landsplan

Det handler denne artikel om, som

beskriver, hvorledes et nyt produkt

– klyngebaseret kvadratnetsegmentering

- anonymiserer og kortlægger

offentlige individbaserede statistiske

data ud fra det geografiske

grundprincip, at ’vi ligner vores

naboer’. Produktet er udviklet i et

samarbejde mellem Atkins og Danmarks

Statistik (DSt).

Anonymisering

Til anonymisering af individbaserede

statistiske data har DSt i

sam arbejde med Kort- og Matrikelstyrelsen

udviklet det Det danske

Kvadratnet. Det danske Kvadratnet

består af kvadratiske celler, hvor

hver enkelt celle udgør sin egen

geografiske region. Ved at knytte

alle adresser inden for en given celle

sammen, kan der ved overholdelse

af en række diskretionskrav,

beregnes en gennemsnitsværdi for

de pågældende husstande. Den

mindste netstørrelse i Det danske

Kvadratnet er en kvadratisk celle

på 100 x 100 meter. Der findes

mere end 416.000 beboede 100

x 100 meter celler i Danmark pr.

1.1.2007.

når der er mindst 20 husstande i

et sammenlagt område eller i en

celle. Det betyder i praksis, at der

skal foretages sammenlægninger

af de enkelte 100x100 meter

celler førend data kan frigives.

En optælling af antal personer

og husstande i kvadratnetceller

ud fra bopælsadresser muliggør

sammenlæg ninger af celler. Når

der er foretaget de nødvendige

sammenlægninger af celler, kan

demografiske og socioøkonomiske

statistiske data leveres.

Klyngedannelse

Det springende punkt er sammenlægningen

af celler - den såkaldte

klyngedannelse. Der skal træffes

valg for klyngedannelsen, således

at de husstande, der lægges sammen,

ligner hinanden mest muligt

og dermed optimerer gennemsnittet.

Hidtil har det været brugerens

opgave at sammensætte klyngerne.

Men hvordan Det har ofte vist

sig uoverskueligt og klyngestrukturen

har derfor været baseret på

administrative grænser som for

eksempel postnumre (figur 1).

Med det nye produkt, som Atkins

og DSt har udviklet, er det muligt

at øge detaljeringsgraden helt ned

til klynger af kvadratnetceller med

tilsammen mindst 20 husstande

og på denne måde opnå den højst

tilladte detaljeringsgrad under diskretionskravene.

Det nye produkt – klyngebaseret

kvadratnetsegmentering

Klyngebaseret kvadratnetsegmentering

tager udgangspunkt i geografien

og den statistiske fordeling

af den pågældende variabel f.eks.

indkomst. Kvadratnetcellerne sorteres

på kommuneniveau efter en

variabels faldende gennemsnit og

segmenteres (grupperes) herefter

i klynger. Af diskretionshensyn begrænses

sortering til kvadratnet-

Diskretionskrav

Der skal være et tilstrækkeligt

antal husstande i en eller sammenlagte

celler før et gennemsnit

kan frigives. For eksempel frigives

kun nøgletal (gennemsnitstal),

Figur 1. Indkomstfordelingen i Københavns-området fordelt på postnumre. Indkomstfordelingen

er baseret på gennemsnitlig husstandsbruttoindkomst i skatteåret

2005 opgjort pr. 1.1.2006.

6 geoforum.dk88 • oktober 2007

More magazines by this user
Similar magazines