18.01.2013 Views

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

Koppelen 910Leon Willenborg en Nico Heerschap - CBS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2. Het koppelcriterium dat m<strong>en</strong> w<strong>en</strong>st te gebruik<strong>en</strong> om koppelkandidat<strong>en</strong> te kunn<strong>en</strong><br />

berek<strong>en</strong><strong>en</strong>. Dit koppelcriterium toegepast op de koppelbestand<strong>en</strong> levert e<strong>en</strong> KK-graph op.<br />

3. Bij grote koppelbestand<strong>en</strong> kan het nodig zijn om met e<strong>en</strong> stratificatie te werk<strong>en</strong> die de<br />

zoekruimte voor het vind<strong>en</strong> van koppelkandidat<strong>en</strong> beperkt. Hiervoor word<strong>en</strong> zog<strong>en</strong>aamde<br />

blockvariabel<strong>en</strong> gebruikt. Eén (of meer) blokvariabel<strong>en</strong> kunn<strong>en</strong> word<strong>en</strong> gebruikt om zo’n<br />

stratificatie te berek<strong>en</strong><strong>en</strong>.<br />

4. Graadrestricties die geld<strong>en</strong> voor de koppelgraph. Dit betek<strong>en</strong>t dus dat koppeling<strong>en</strong> 1:1,<br />

1:n, m:1 of m:n moet<strong>en</strong> zijn. Het kan ook zijn dat de m of n van bov<strong>en</strong> begr<strong>en</strong>sd moet zijn.<br />

Dat één record aan meerdere records uit het andere bestand te koppel<strong>en</strong> is kan voorkom<strong>en</strong><br />

als de peildata van de koppelbestand<strong>en</strong> verschill<strong>en</strong>.<br />

Nadat e<strong>en</strong> koppelmodel zonder koppelgewicht<strong>en</strong> is gespecificeerd als optimaliseringsprobleem, is<br />

het zaak dit probleem op te loss<strong>en</strong>. Oplossingsmethod<strong>en</strong> voor dit soort modell<strong>en</strong> besprek<strong>en</strong> we in<br />

hoofdstuk 6.<br />

4.5.3 <strong>Koppel<strong>en</strong></strong> op secundaire sleutels, met koppelgewicht<strong>en</strong><br />

Voor koppelproblem<strong>en</strong> met koppelgewicht<strong>en</strong> zijn er, in aanvulling op de 4 items die in paragraaf<br />

4.5.2 word<strong>en</strong> g<strong>en</strong>oemd, nog e<strong>en</strong> aantal andere zak<strong>en</strong> te specificer<strong>en</strong>, namelijk:<br />

5. Wijze van berek<strong>en</strong>ing van de koppelgewicht<strong>en</strong>. Bij het berek<strong>en</strong><strong>en</strong> van de KK-graph kunn<strong>en</strong><br />

tev<strong>en</strong>s deze gewicht<strong>en</strong> word<strong>en</strong> berek<strong>en</strong>d.<br />

6. Cut-off 13 waarde die aan geeft welke koppeling<strong>en</strong> m<strong>en</strong> nog w<strong>en</strong>st te accepter<strong>en</strong> als<br />

acceptabel. Dit is e<strong>en</strong> drempelwaarde die ervoor zorgt koppelgewicht<strong>en</strong> die te klein zijn,<br />

dat wil zegg<strong>en</strong> b<strong>en</strong>ed<strong>en</strong> e<strong>en</strong> door de koppelaar aan te gev<strong>en</strong> b<strong>en</strong>ed<strong>en</strong>gr<strong>en</strong>s, di<strong>en</strong><strong>en</strong> niet<br />

beschouwd te word<strong>en</strong> als kandidaat-koppeling<strong>en</strong>. Met deze cut-off-waard<strong>en</strong> kan m<strong>en</strong> het<br />

risico beïnvloed<strong>en</strong> koppeling<strong>en</strong> te miss<strong>en</strong>, maar tev<strong>en</strong>s, <strong>en</strong> dat is de keerzijde, om<br />

koppeling<strong>en</strong> t<strong>en</strong> onrechte te mak<strong>en</strong>.<br />

7. Specificatie van de doelfunctie, bij het gebruik van koppelgewicht<strong>en</strong>. In de regel is dit<br />

e<strong>en</strong>voudigweg de som van de koppelgewicht<strong>en</strong> van de kant<strong>en</strong> in e<strong>en</strong> toegelat<strong>en</strong><br />

koppelgraph.<br />

Oplossingsmethod<strong>en</strong> voor dit soort modell<strong>en</strong> besprek<strong>en</strong> we in hoofdstuk 7.<br />

E<strong>en</strong> koppelprobleem – afgezi<strong>en</strong> van e<strong>en</strong> koppelprobleem op e<strong>en</strong> primaire sleutel - will<strong>en</strong> we in dit<br />

stuk definiër<strong>en</strong> als e<strong>en</strong> optimaliseringsprobleem. Hierbij moet, op basis van criteria die moet<strong>en</strong><br />

geld<strong>en</strong> voor de oplossing, e<strong>en</strong> subgraph van de KK-graph wordt bepaald die de doelfunctie in het<br />

probleem optimaliseert.<br />

13 Hierbij kan ook tegelijkertijd word<strong>en</strong> gewerkt met e<strong>en</strong> bov<strong>en</strong>- <strong>en</strong> ondergr<strong>en</strong>s. Alle koppeling<strong>en</strong> met<br />

gewicht<strong>en</strong> bov<strong>en</strong> de bov<strong>en</strong>gr<strong>en</strong>s word<strong>en</strong> als ware koppeling<strong>en</strong> gezi<strong>en</strong>. Alle koppeling<strong>en</strong> b<strong>en</strong>ed<strong>en</strong> de<br />

b<strong>en</strong>ed<strong>en</strong>gr<strong>en</strong>s word<strong>en</strong> als ware mismatches gezi<strong>en</strong>. Koppeling<strong>en</strong> die in het gebied ligg<strong>en</strong> tuss<strong>en</strong> deze twee<br />

gr<strong>en</strong>z<strong>en</strong> betreff<strong>en</strong> de twijfelgevall<strong>en</strong> <strong>en</strong> word<strong>en</strong> aangebod<strong>en</strong> aan de koppelspecialist. Door te spel<strong>en</strong> met de<br />

bov<strong>en</strong>- <strong>en</strong> ondergr<strong>en</strong>s kan de omvang van het aantal twijfelgevall<strong>en</strong> word<strong>en</strong> beperkt of uitgebreid.<br />

38

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!