Koppelen 910Leon Willenborg en Nico Heerschap - CBS
Koppelen 910Leon Willenborg en Nico Heerschap - CBS
Koppelen 910Leon Willenborg en Nico Heerschap - CBS
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
2. Het koppelcriterium dat m<strong>en</strong> w<strong>en</strong>st te gebruik<strong>en</strong> om koppelkandidat<strong>en</strong> te kunn<strong>en</strong><br />
berek<strong>en</strong><strong>en</strong>. Dit koppelcriterium toegepast op de koppelbestand<strong>en</strong> levert e<strong>en</strong> KK-graph op.<br />
3. Bij grote koppelbestand<strong>en</strong> kan het nodig zijn om met e<strong>en</strong> stratificatie te werk<strong>en</strong> die de<br />
zoekruimte voor het vind<strong>en</strong> van koppelkandidat<strong>en</strong> beperkt. Hiervoor word<strong>en</strong> zog<strong>en</strong>aamde<br />
blockvariabel<strong>en</strong> gebruikt. Eén (of meer) blokvariabel<strong>en</strong> kunn<strong>en</strong> word<strong>en</strong> gebruikt om zo’n<br />
stratificatie te berek<strong>en</strong><strong>en</strong>.<br />
4. Graadrestricties die geld<strong>en</strong> voor de koppelgraph. Dit betek<strong>en</strong>t dus dat koppeling<strong>en</strong> 1:1,<br />
1:n, m:1 of m:n moet<strong>en</strong> zijn. Het kan ook zijn dat de m of n van bov<strong>en</strong> begr<strong>en</strong>sd moet zijn.<br />
Dat één record aan meerdere records uit het andere bestand te koppel<strong>en</strong> is kan voorkom<strong>en</strong><br />
als de peildata van de koppelbestand<strong>en</strong> verschill<strong>en</strong>.<br />
Nadat e<strong>en</strong> koppelmodel zonder koppelgewicht<strong>en</strong> is gespecificeerd als optimaliseringsprobleem, is<br />
het zaak dit probleem op te loss<strong>en</strong>. Oplossingsmethod<strong>en</strong> voor dit soort modell<strong>en</strong> besprek<strong>en</strong> we in<br />
hoofdstuk 6.<br />
4.5.3 <strong>Koppel<strong>en</strong></strong> op secundaire sleutels, met koppelgewicht<strong>en</strong><br />
Voor koppelproblem<strong>en</strong> met koppelgewicht<strong>en</strong> zijn er, in aanvulling op de 4 items die in paragraaf<br />
4.5.2 word<strong>en</strong> g<strong>en</strong>oemd, nog e<strong>en</strong> aantal andere zak<strong>en</strong> te specificer<strong>en</strong>, namelijk:<br />
5. Wijze van berek<strong>en</strong>ing van de koppelgewicht<strong>en</strong>. Bij het berek<strong>en</strong><strong>en</strong> van de KK-graph kunn<strong>en</strong><br />
tev<strong>en</strong>s deze gewicht<strong>en</strong> word<strong>en</strong> berek<strong>en</strong>d.<br />
6. Cut-off 13 waarde die aan geeft welke koppeling<strong>en</strong> m<strong>en</strong> nog w<strong>en</strong>st te accepter<strong>en</strong> als<br />
acceptabel. Dit is e<strong>en</strong> drempelwaarde die ervoor zorgt koppelgewicht<strong>en</strong> die te klein zijn,<br />
dat wil zegg<strong>en</strong> b<strong>en</strong>ed<strong>en</strong> e<strong>en</strong> door de koppelaar aan te gev<strong>en</strong> b<strong>en</strong>ed<strong>en</strong>gr<strong>en</strong>s, di<strong>en</strong><strong>en</strong> niet<br />
beschouwd te word<strong>en</strong> als kandidaat-koppeling<strong>en</strong>. Met deze cut-off-waard<strong>en</strong> kan m<strong>en</strong> het<br />
risico beïnvloed<strong>en</strong> koppeling<strong>en</strong> te miss<strong>en</strong>, maar tev<strong>en</strong>s, <strong>en</strong> dat is de keerzijde, om<br />
koppeling<strong>en</strong> t<strong>en</strong> onrechte te mak<strong>en</strong>.<br />
7. Specificatie van de doelfunctie, bij het gebruik van koppelgewicht<strong>en</strong>. In de regel is dit<br />
e<strong>en</strong>voudigweg de som van de koppelgewicht<strong>en</strong> van de kant<strong>en</strong> in e<strong>en</strong> toegelat<strong>en</strong><br />
koppelgraph.<br />
Oplossingsmethod<strong>en</strong> voor dit soort modell<strong>en</strong> besprek<strong>en</strong> we in hoofdstuk 7.<br />
E<strong>en</strong> koppelprobleem – afgezi<strong>en</strong> van e<strong>en</strong> koppelprobleem op e<strong>en</strong> primaire sleutel - will<strong>en</strong> we in dit<br />
stuk definiër<strong>en</strong> als e<strong>en</strong> optimaliseringsprobleem. Hierbij moet, op basis van criteria die moet<strong>en</strong><br />
geld<strong>en</strong> voor de oplossing, e<strong>en</strong> subgraph van de KK-graph wordt bepaald die de doelfunctie in het<br />
probleem optimaliseert.<br />
13 Hierbij kan ook tegelijkertijd word<strong>en</strong> gewerkt met e<strong>en</strong> bov<strong>en</strong>- <strong>en</strong> ondergr<strong>en</strong>s. Alle koppeling<strong>en</strong> met<br />
gewicht<strong>en</strong> bov<strong>en</strong> de bov<strong>en</strong>gr<strong>en</strong>s word<strong>en</strong> als ware koppeling<strong>en</strong> gezi<strong>en</strong>. Alle koppeling<strong>en</strong> b<strong>en</strong>ed<strong>en</strong> de<br />
b<strong>en</strong>ed<strong>en</strong>gr<strong>en</strong>s word<strong>en</strong> als ware mismatches gezi<strong>en</strong>. Koppeling<strong>en</strong> die in het gebied ligg<strong>en</strong> tuss<strong>en</strong> deze twee<br />
gr<strong>en</strong>z<strong>en</strong> betreff<strong>en</strong> de twijfelgevall<strong>en</strong> <strong>en</strong> word<strong>en</strong> aangebod<strong>en</strong> aan de koppelspecialist. Door te spel<strong>en</strong> met de<br />
bov<strong>en</strong>- <strong>en</strong> ondergr<strong>en</strong>s kan de omvang van het aantal twijfelgevall<strong>en</strong> word<strong>en</strong> beperkt of uitgebreid.<br />
38