Koppelen 910Leon Willenborg en Nico Heerschap - CBS
Koppelen 910Leon Willenborg en Nico Heerschap - CBS
Koppelen 910Leon Willenborg en Nico Heerschap - CBS
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
4.5 Werkwijz<strong>en</strong><br />
Stel we hebb<strong>en</strong> twee bestand<strong>en</strong> die gekoppeld moet<strong>en</strong> word<strong>en</strong>. Eerst wordt vastgesteld welke<br />
koppelsleutel moet word<strong>en</strong> gebruikt. Naast de koppelsleutel zoud<strong>en</strong> nog andere groothed<strong>en</strong> <strong>en</strong><br />
parameters gebruikt kunn<strong>en</strong> word<strong>en</strong>, zoals gewicht<strong>en</strong> <strong>en</strong> cut-off-waard<strong>en</strong>. Het doel is vervolg<strong>en</strong>s<br />
om te kom<strong>en</strong> tot e<strong>en</strong> criterium om records uit bestand A te koppel<strong>en</strong> aan records uit bestand B.<br />
Indi<strong>en</strong> dit criterium wordt toegepast op de records in bestand<strong>en</strong> A <strong>en</strong> B levert dat par<strong>en</strong> records op<br />
die ieder aan het koppelcriterium voldo<strong>en</strong> <strong>en</strong> die dus koppelbaar zijn. Dergelijke informatie is weer<br />
te gev<strong>en</strong> in de vorm van e<strong>en</strong> KK-graph.<br />
Afhankelijk van de gekoz<strong>en</strong> koppelmethode, kan het zijn dat de sterkte van de koppeling<strong>en</strong> nog<br />
moet word<strong>en</strong> uitgedrukt, in de vorm van koppelgewicht<strong>en</strong>. Hiervoor moet dan eerst e<strong>en</strong> geschikte<br />
karakterisering word<strong>en</strong> gevond<strong>en</strong> om die te bepal<strong>en</strong>. Soms kan het koppelcriterium daarbij word<strong>en</strong><br />
gebruikt, waarbij bijvoorbeeld de mate van afwijking van het ideaal kan word<strong>en</strong> gekwantificeerd.<br />
Figuur 4.3: Twee mogelijke koppeling<strong>en</strong><br />
a<br />
b<br />
Mogelijke koppeling<strong>en</strong> bij 1:1 koppeling: 1. {a,c} <strong>en</strong> {b,d} <strong>en</strong> 2. {b,c}<br />
Indi<strong>en</strong> de KK-graph is sam<strong>en</strong>gesteld, al of niet met koppelgewicht<strong>en</strong>, is het daarna van belang om<br />
e<strong>en</strong> geschikte doelfunctie te formuler<strong>en</strong>, die aangeeft wat voor soort koppeling<strong>en</strong> m<strong>en</strong> zoekt.<br />
Verder moet<strong>en</strong> er criteria word<strong>en</strong> geformuleerd waaraan de oplossing moet voldo<strong>en</strong>. Dit soort<br />
criteria hebb<strong>en</strong> veelal te mak<strong>en</strong> met de maximale graad voor alle punt<strong>en</strong> van de koppelgraph. In<br />
veel gevall<strong>en</strong> moet bijvoorbeeld geld<strong>en</strong> dat de graad maximaal 1 mag zijn. Dit zou bijvoorbeeld<br />
kunn<strong>en</strong> geld<strong>en</strong> als de te koppel<strong>en</strong> e<strong>en</strong>hed<strong>en</strong> person<strong>en</strong> zijn. Er zijn echter ook situaties waarbij e<strong>en</strong><br />
1:n koppeling mogelijk is. Dit is bijvoorbeeld het geval bij splitsing<strong>en</strong> van bedrijv<strong>en</strong>, waarbij één<br />
bedrijf in twee of meer onderdel<strong>en</strong> wordt gesplitst die ieder afzonderlijk doorgaan. Ook e<strong>en</strong><br />
36<br />
c<br />
d