18.01.2013 Views

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

kunn<strong>en</strong> e<strong>en</strong>hed<strong>en</strong> verouder<strong>en</strong> of over gaan in andere e<strong>en</strong>hed<strong>en</strong>. Voorbeeld<strong>en</strong> daarvan zijn fusies of<br />

splitsing<strong>en</strong> van bedrijv<strong>en</strong>.<br />

1.2 Plaats in het statistiekproces<br />

<strong>Koppel<strong>en</strong></strong> van gegev<strong>en</strong>s beperkt zich niet tot één specifieke plek in het statistische proces. In feite<br />

kan op elke plek in het statistische proces wel sprake zijn van het koppel<strong>en</strong> van gegev<strong>en</strong>s. Aan de<br />

inputkant begint het al bij de opbouw van het statistisch kader. Veelal is e<strong>en</strong> combinatie van<br />

bronn<strong>en</strong> nodig om zo’n kader of rugg<strong>en</strong>graat sam<strong>en</strong> te stell<strong>en</strong>. Dat geldt bijvoorbeeld voor het<br />

Algeme<strong>en</strong> Bedrijv<strong>en</strong> Register (of de E<strong>en</strong>hed<strong>en</strong>base) bij de economische statistiek<strong>en</strong>. Daarbij wordt<br />

onder meer gebruik gemaakt van gekoppelde gegev<strong>en</strong>s van de Kamer van Koophandel <strong>en</strong> de<br />

Belastingdi<strong>en</strong>st. Bij het verwerkingsproces kan het koppel<strong>en</strong> van bestand<strong>en</strong> op verschill<strong>en</strong>de<br />

manier<strong>en</strong> word<strong>en</strong> ingezet. Bijvoorbeeld als extra informatie bij het controler<strong>en</strong> van de kwaliteit van<br />

de data of bij het afleid<strong>en</strong> van data, bijvoorbeeld bij het imputer<strong>en</strong>. Bij de output gaat het vooral om<br />

het verkrijg<strong>en</strong> van nieuwe informatie door het combiner<strong>en</strong> van gegev<strong>en</strong>s uit verschill<strong>en</strong>de bronn<strong>en</strong>.<br />

1.3 Afbak<strong>en</strong>ing <strong>en</strong> relatie met andere thema’s<br />

In dit themarapport word<strong>en</strong> in eerste instantie koppelmethod<strong>en</strong> besprok<strong>en</strong> die tot doel hebb<strong>en</strong><br />

gegev<strong>en</strong>s van dezelfde e<strong>en</strong>hed<strong>en</strong>, maar weergegev<strong>en</strong> in verschill<strong>en</strong>de bestand<strong>en</strong>, met elkaar in<br />

verband te br<strong>en</strong>g<strong>en</strong>.<br />

<strong>Koppel<strong>en</strong></strong> is gerelateerd aan andere onderdel<strong>en</strong> van de Method<strong>en</strong>reeks, zoals:<br />

• (micro-)integratie van gegev<strong>en</strong>s. Daarbij word<strong>en</strong> gegev<strong>en</strong>s met elkaar geconfronteerd,<br />

waarmee allerlei verschill<strong>en</strong> manifest word<strong>en</strong>. Deze verschill<strong>en</strong> di<strong>en</strong><strong>en</strong> verklaard <strong>en</strong><br />

vervolg<strong>en</strong>s weggewerkt te word<strong>en</strong>. Het confronter<strong>en</strong> van de gegev<strong>en</strong>s is slechts mogelijk<br />

nadat de bestand<strong>en</strong> gekoppeld zijn;<br />

• coder<strong>en</strong>. Daarbij word<strong>en</strong> omschrijving<strong>en</strong>, die door respond<strong>en</strong>t<strong>en</strong> in hun eig<strong>en</strong> bewoording<strong>en</strong><br />

gegev<strong>en</strong> zijn, gekoppeld aan codes uit e<strong>en</strong> classificatie. Hier speelt onder andere het probleem<br />

om woord<strong>en</strong> te kunn<strong>en</strong> koppel<strong>en</strong>, wet<strong>en</strong>de dat er spellingsfout<strong>en</strong> of grammaticafout<strong>en</strong><br />

gemaakt kunn<strong>en</strong> zijn of dat synoniem<strong>en</strong>, hyponiem<strong>en</strong> of hyperoniem<strong>en</strong> gebruikt kunn<strong>en</strong> zijn.<br />

• uitzett<strong>en</strong> van steekproev<strong>en</strong>. Het doel hierbij is om contactinformatie van steekproefe<strong>en</strong>hed<strong>en</strong><br />

(person<strong>en</strong>, bedrijv<strong>en</strong>) te koppel<strong>en</strong> aan interviewers voor het afnem<strong>en</strong> van interviews. Bij<br />

CAPI-interviews gaat het bijvoorbeeld om de woonadress<strong>en</strong> van person<strong>en</strong> die in e<strong>en</strong><br />

steekproef zijn getrokk<strong>en</strong> <strong>en</strong> die bezocht moet<strong>en</strong> word<strong>en</strong> door interviewers voor het afnem<strong>en</strong><br />

van interviews. Bij het toewijz<strong>en</strong> van adress<strong>en</strong> aan interviewers w<strong>en</strong>st m<strong>en</strong> rek<strong>en</strong>ing te houd<strong>en</strong><br />

met de maximale interviewcapaciteit van e<strong>en</strong> interviewer <strong>en</strong> de reisafstand<strong>en</strong> van interviewers<br />

naar woonadress<strong>en</strong> van de steekproefperson<strong>en</strong>. De interviewcapaciteit per interviewer di<strong>en</strong>t<br />

gerespecteerd te word<strong>en</strong> <strong>en</strong> de reiskost<strong>en</strong> geminimaliseerd.<br />

• disseminatie van gegev<strong>en</strong>s. <strong>Koppel<strong>en</strong></strong> van gegev<strong>en</strong>s is noodzakelijk om statistische gegev<strong>en</strong>s<br />

in hun onderlinge sam<strong>en</strong>hang te zi<strong>en</strong> <strong>en</strong> te pres<strong>en</strong>ter<strong>en</strong>.<br />

Afbak<strong>en</strong>ing:<br />

E<strong>en</strong> methode die op het eerste oog e<strong>en</strong> koppelmethode lijkt te zijn, <strong>en</strong> die bek<strong>en</strong>d staat onder de<br />

naam statistisch of synthetisch koppel<strong>en</strong>, is in werkelijkheid e<strong>en</strong> imputatiemethode. De int<strong>en</strong>tie<br />

achter deze methode is namelijk verschill<strong>en</strong>d van die van de hier behandelde koppelmethod<strong>en</strong>. Het<br />

6

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!