20.09.2013 Views

Klassificeren van referenties in wetteksten - Leibniz Center for Law ...

Klassificeren van referenties in wetteksten - Leibniz Center for Law ...

Klassificeren van referenties in wetteksten - Leibniz Center for Law ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

5 Resultaten<br />

De parser is getest op de Natuurschoonwet 1928, waar<strong>in</strong> 92 <strong>referenties</strong><br />

voorkwamen. De resultaten <strong>van</strong> klassificatie waren als volgt:<br />

Klasse Frequentie<br />

Def<strong>in</strong>itie 22<br />

Toepass<strong>in</strong>g 8<br />

Gevolg 10<br />

Levensduur 0<br />

Onverm<strong>in</strong>derd 0<br />

Uitzonder<strong>in</strong>g 4<br />

Overig 52<br />

Zoals reeds gezegd is er slechts 1 wettekst gebruikt om de parser te testen.<br />

Hierdoor kan er we<strong>in</strong>ig gezegd worden over trends b<strong>in</strong>nen <strong>wetteksten</strong> <strong>in</strong> het<br />

algemeen.<br />

Wat wel direct opvalt is dat meer dan de helft <strong>van</strong> de <strong>referenties</strong> geklassificeerd<br />

zijn als ‘Overig’. Dat betekent dat meer dan de helft <strong>van</strong> de <strong>referenties</strong> eigenlijk<br />

niet geklassificeerd zijn. Om meer <strong>in</strong>zicht <strong>in</strong> de onderliggende problemen te heb<br />

ik de categorie ‘overig’ opgesplitst <strong>in</strong> vijf groepen, zodat een overzicht gekregen<br />

wordt <strong>in</strong> aantallen waar de problemen nog zitten.<br />

Probleem Frequentie<br />

Technisch probleem 10<br />

Samengestelde referentie 10<br />

Onbekend patroon 14<br />

Onvolledige referentie 13<br />

Werkelijk ‘overig’ 5<br />

Allereerst zijn er dus m<strong>in</strong> of meer triviale problemen <strong>van</strong> technische aard. De<br />

tokenizer <strong>van</strong> de parser maakt bijvoorbeeld onderscheid tussen spaties en enters.<br />

Als een patroon over meer dan 1 regel doorloopt, slaagt de parser er niet altijd <strong>in</strong><br />

dit op te <strong>van</strong>gen. In sommige gevallen wel, maar <strong>in</strong> de meeste gevallen niet.<br />

Waarom dit gebeurt moet nog onderzocht worden, maar dit beïnvloedt de<br />

prestaties <strong>van</strong> de parser behoorlijk.<br />

Daarnaast zijn er drie <strong>in</strong>houdelijke problemen. Ten eerste komen <strong>referenties</strong> vaak<br />

gecomb<strong>in</strong>eerd voor, zoals ‘...dan is artikel 3 <strong>van</strong> de Natuurschoonwet en artikel<br />

24 <strong>van</strong> het Burgelijk Wetboek niet <strong>van</strong> toepass<strong>in</strong>g.’. Alleen <strong>in</strong> de gevallen waar<strong>in</strong><br />

‘artikel 3 <strong>van</strong> de Natuurschoonwet en artikel 24 <strong>van</strong> het Burgelijk Wetboek’

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!