18.01.2013 Views

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4.5 Werkwijz<strong>en</strong><br />

Stel we hebb<strong>en</strong> twee bestand<strong>en</strong> die gekoppeld moet<strong>en</strong> word<strong>en</strong>. Eerst wordt vastgesteld welke<br />

koppelsleutel moet word<strong>en</strong> gebruikt. Naast de koppelsleutel zoud<strong>en</strong> nog andere groothed<strong>en</strong> <strong>en</strong><br />

parameters gebruikt kunn<strong>en</strong> word<strong>en</strong>, zoals gewicht<strong>en</strong> <strong>en</strong> cut-off-waard<strong>en</strong>. Het doel is vervolg<strong>en</strong>s<br />

om te kom<strong>en</strong> tot e<strong>en</strong> criterium om records uit bestand A te koppel<strong>en</strong> aan records uit bestand B.<br />

Indi<strong>en</strong> dit criterium wordt toegepast op de records in bestand<strong>en</strong> A <strong>en</strong> B levert dat par<strong>en</strong> records op<br />

die ieder aan het koppelcriterium voldo<strong>en</strong> <strong>en</strong> die dus koppelbaar zijn. Dergelijke informatie is weer<br />

te gev<strong>en</strong> in de vorm van e<strong>en</strong> KK-graph.<br />

Afhankelijk van de gekoz<strong>en</strong> koppelmethode, kan het zijn dat de sterkte van de koppeling<strong>en</strong> nog<br />

moet word<strong>en</strong> uitgedrukt, in de vorm van koppelgewicht<strong>en</strong>. Hiervoor moet dan eerst e<strong>en</strong> geschikte<br />

karakterisering word<strong>en</strong> gevond<strong>en</strong> om die te bepal<strong>en</strong>. Soms kan het koppelcriterium daarbij word<strong>en</strong><br />

gebruikt, waarbij bijvoorbeeld de mate van afwijking van het ideaal kan word<strong>en</strong> gekwantificeerd.<br />

Figuur 4.3: Twee mogelijke koppeling<strong>en</strong><br />

a<br />

b<br />

Mogelijke koppeling<strong>en</strong> bij 1:1 koppeling: 1. {a,c} <strong>en</strong> {b,d} <strong>en</strong> 2. {b,c}<br />

Indi<strong>en</strong> de KK-graph is sam<strong>en</strong>gesteld, al of niet met koppelgewicht<strong>en</strong>, is het daarna van belang om<br />

e<strong>en</strong> geschikte doelfunctie te formuler<strong>en</strong>, die aangeeft wat voor soort koppeling<strong>en</strong> m<strong>en</strong> zoekt.<br />

Verder moet<strong>en</strong> er criteria word<strong>en</strong> geformuleerd waaraan de oplossing moet voldo<strong>en</strong>. Dit soort<br />

criteria hebb<strong>en</strong> veelal te mak<strong>en</strong> met de maximale graad voor alle punt<strong>en</strong> van de koppelgraph. In<br />

veel gevall<strong>en</strong> moet bijvoorbeeld geld<strong>en</strong> dat de graad maximaal 1 mag zijn. Dit zou bijvoorbeeld<br />

kunn<strong>en</strong> geld<strong>en</strong> als de te koppel<strong>en</strong> e<strong>en</strong>hed<strong>en</strong> person<strong>en</strong> zijn. Er zijn echter ook situaties waarbij e<strong>en</strong><br />

1:n koppeling mogelijk is. Dit is bijvoorbeeld het geval bij splitsing<strong>en</strong> van bedrijv<strong>en</strong>, waarbij één<br />

bedrijf in twee of meer onderdel<strong>en</strong> wordt gesplitst die ieder afzonderlijk doorgaan. Ook e<strong>en</strong><br />

36<br />

c<br />

d

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!