Klassificeren van referenties in wetteksten - Leibniz Center for Law ...
Klassificeren van referenties in wetteksten - Leibniz Center for Law ...
Klassificeren van referenties in wetteksten - Leibniz Center for Law ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
5 Resultaten<br />
De parser is getest op de Natuurschoonwet 1928, waar<strong>in</strong> 92 <strong>referenties</strong><br />
voorkwamen. De resultaten <strong>van</strong> klassificatie waren als volgt:<br />
Klasse Frequentie<br />
Def<strong>in</strong>itie 22<br />
Toepass<strong>in</strong>g 8<br />
Gevolg 10<br />
Levensduur 0<br />
Onverm<strong>in</strong>derd 0<br />
Uitzonder<strong>in</strong>g 4<br />
Overig 52<br />
Zoals reeds gezegd is er slechts 1 wettekst gebruikt om de parser te testen.<br />
Hierdoor kan er we<strong>in</strong>ig gezegd worden over trends b<strong>in</strong>nen <strong>wetteksten</strong> <strong>in</strong> het<br />
algemeen.<br />
Wat wel direct opvalt is dat meer dan de helft <strong>van</strong> de <strong>referenties</strong> geklassificeerd<br />
zijn als ‘Overig’. Dat betekent dat meer dan de helft <strong>van</strong> de <strong>referenties</strong> eigenlijk<br />
niet geklassificeerd zijn. Om meer <strong>in</strong>zicht <strong>in</strong> de onderliggende problemen te heb<br />
ik de categorie ‘overig’ opgesplitst <strong>in</strong> vijf groepen, zodat een overzicht gekregen<br />
wordt <strong>in</strong> aantallen waar de problemen nog zitten.<br />
Probleem Frequentie<br />
Technisch probleem 10<br />
Samengestelde referentie 10<br />
Onbekend patroon 14<br />
Onvolledige referentie 13<br />
Werkelijk ‘overig’ 5<br />
Allereerst zijn er dus m<strong>in</strong> of meer triviale problemen <strong>van</strong> technische aard. De<br />
tokenizer <strong>van</strong> de parser maakt bijvoorbeeld onderscheid tussen spaties en enters.<br />
Als een patroon over meer dan 1 regel doorloopt, slaagt de parser er niet altijd <strong>in</strong><br />
dit op te <strong>van</strong>gen. In sommige gevallen wel, maar <strong>in</strong> de meeste gevallen niet.<br />
Waarom dit gebeurt moet nog onderzocht worden, maar dit beïnvloedt de<br />
prestaties <strong>van</strong> de parser behoorlijk.<br />
Daarnaast zijn er drie <strong>in</strong>houdelijke problemen. Ten eerste komen <strong>referenties</strong> vaak<br />
gecomb<strong>in</strong>eerd voor, zoals ‘...dan is artikel 3 <strong>van</strong> de Natuurschoonwet en artikel<br />
24 <strong>van</strong> het Burgelijk Wetboek niet <strong>van</strong> toepass<strong>in</strong>g.’. Alleen <strong>in</strong> de gevallen waar<strong>in</strong><br />
‘artikel 3 <strong>van</strong> de Natuurschoonwet en artikel 24 <strong>van</strong> het Burgelijk Wetboek’