Koppelen 910Leon Willenborg en Nico Heerschap - CBS
Koppelen 910Leon Willenborg en Nico Heerschap - CBS
Koppelen 910Leon Willenborg en Nico Heerschap - CBS
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
kunn<strong>en</strong> e<strong>en</strong>hed<strong>en</strong> verouder<strong>en</strong> of over gaan in andere e<strong>en</strong>hed<strong>en</strong>. Voorbeeld<strong>en</strong> daarvan zijn fusies of<br />
splitsing<strong>en</strong> van bedrijv<strong>en</strong>.<br />
1.2 Plaats in het statistiekproces<br />
<strong>Koppel<strong>en</strong></strong> van gegev<strong>en</strong>s beperkt zich niet tot één specifieke plek in het statistische proces. In feite<br />
kan op elke plek in het statistische proces wel sprake zijn van het koppel<strong>en</strong> van gegev<strong>en</strong>s. Aan de<br />
inputkant begint het al bij de opbouw van het statistisch kader. Veelal is e<strong>en</strong> combinatie van<br />
bronn<strong>en</strong> nodig om zo’n kader of rugg<strong>en</strong>graat sam<strong>en</strong> te stell<strong>en</strong>. Dat geldt bijvoorbeeld voor het<br />
Algeme<strong>en</strong> Bedrijv<strong>en</strong> Register (of de E<strong>en</strong>hed<strong>en</strong>base) bij de economische statistiek<strong>en</strong>. Daarbij wordt<br />
onder meer gebruik gemaakt van gekoppelde gegev<strong>en</strong>s van de Kamer van Koophandel <strong>en</strong> de<br />
Belastingdi<strong>en</strong>st. Bij het verwerkingsproces kan het koppel<strong>en</strong> van bestand<strong>en</strong> op verschill<strong>en</strong>de<br />
manier<strong>en</strong> word<strong>en</strong> ingezet. Bijvoorbeeld als extra informatie bij het controler<strong>en</strong> van de kwaliteit van<br />
de data of bij het afleid<strong>en</strong> van data, bijvoorbeeld bij het imputer<strong>en</strong>. Bij de output gaat het vooral om<br />
het verkrijg<strong>en</strong> van nieuwe informatie door het combiner<strong>en</strong> van gegev<strong>en</strong>s uit verschill<strong>en</strong>de bronn<strong>en</strong>.<br />
1.3 Afbak<strong>en</strong>ing <strong>en</strong> relatie met andere thema’s<br />
In dit themarapport word<strong>en</strong> in eerste instantie koppelmethod<strong>en</strong> besprok<strong>en</strong> die tot doel hebb<strong>en</strong><br />
gegev<strong>en</strong>s van dezelfde e<strong>en</strong>hed<strong>en</strong>, maar weergegev<strong>en</strong> in verschill<strong>en</strong>de bestand<strong>en</strong>, met elkaar in<br />
verband te br<strong>en</strong>g<strong>en</strong>.<br />
<strong>Koppel<strong>en</strong></strong> is gerelateerd aan andere onderdel<strong>en</strong> van de Method<strong>en</strong>reeks, zoals:<br />
• (micro-)integratie van gegev<strong>en</strong>s. Daarbij word<strong>en</strong> gegev<strong>en</strong>s met elkaar geconfronteerd,<br />
waarmee allerlei verschill<strong>en</strong> manifest word<strong>en</strong>. Deze verschill<strong>en</strong> di<strong>en</strong><strong>en</strong> verklaard <strong>en</strong><br />
vervolg<strong>en</strong>s weggewerkt te word<strong>en</strong>. Het confronter<strong>en</strong> van de gegev<strong>en</strong>s is slechts mogelijk<br />
nadat de bestand<strong>en</strong> gekoppeld zijn;<br />
• coder<strong>en</strong>. Daarbij word<strong>en</strong> omschrijving<strong>en</strong>, die door respond<strong>en</strong>t<strong>en</strong> in hun eig<strong>en</strong> bewoording<strong>en</strong><br />
gegev<strong>en</strong> zijn, gekoppeld aan codes uit e<strong>en</strong> classificatie. Hier speelt onder andere het probleem<br />
om woord<strong>en</strong> te kunn<strong>en</strong> koppel<strong>en</strong>, wet<strong>en</strong>de dat er spellingsfout<strong>en</strong> of grammaticafout<strong>en</strong><br />
gemaakt kunn<strong>en</strong> zijn of dat synoniem<strong>en</strong>, hyponiem<strong>en</strong> of hyperoniem<strong>en</strong> gebruikt kunn<strong>en</strong> zijn.<br />
• uitzett<strong>en</strong> van steekproev<strong>en</strong>. Het doel hierbij is om contactinformatie van steekproefe<strong>en</strong>hed<strong>en</strong><br />
(person<strong>en</strong>, bedrijv<strong>en</strong>) te koppel<strong>en</strong> aan interviewers voor het afnem<strong>en</strong> van interviews. Bij<br />
CAPI-interviews gaat het bijvoorbeeld om de woonadress<strong>en</strong> van person<strong>en</strong> die in e<strong>en</strong><br />
steekproef zijn getrokk<strong>en</strong> <strong>en</strong> die bezocht moet<strong>en</strong> word<strong>en</strong> door interviewers voor het afnem<strong>en</strong><br />
van interviews. Bij het toewijz<strong>en</strong> van adress<strong>en</strong> aan interviewers w<strong>en</strong>st m<strong>en</strong> rek<strong>en</strong>ing te houd<strong>en</strong><br />
met de maximale interviewcapaciteit van e<strong>en</strong> interviewer <strong>en</strong> de reisafstand<strong>en</strong> van interviewers<br />
naar woonadress<strong>en</strong> van de steekproefperson<strong>en</strong>. De interviewcapaciteit per interviewer di<strong>en</strong>t<br />
gerespecteerd te word<strong>en</strong> <strong>en</strong> de reiskost<strong>en</strong> geminimaliseerd.<br />
• disseminatie van gegev<strong>en</strong>s. <strong>Koppel<strong>en</strong></strong> van gegev<strong>en</strong>s is noodzakelijk om statistische gegev<strong>en</strong>s<br />
in hun onderlinge sam<strong>en</strong>hang te zi<strong>en</strong> <strong>en</strong> te pres<strong>en</strong>ter<strong>en</strong>.<br />
Afbak<strong>en</strong>ing:<br />
E<strong>en</strong> methode die op het eerste oog e<strong>en</strong> koppelmethode lijkt te zijn, <strong>en</strong> die bek<strong>en</strong>d staat onder de<br />
naam statistisch of synthetisch koppel<strong>en</strong>, is in werkelijkheid e<strong>en</strong> imputatiemethode. De int<strong>en</strong>tie<br />
achter deze methode is namelijk verschill<strong>en</strong>d van die van de hier behandelde koppelmethod<strong>en</strong>. Het<br />
6