25.12.2014 Views

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

19<br />

Tabell 1: tagguppsättning för primärstrukturen<br />

starttagg sluttagg beskrivning<br />

avledning<br />

— ramsa med särskilda förbindelser<br />

— artikel för särskild förbindelse<br />

särskild förbindelse – grundord<br />

särskild förbindelse – partikel<br />

— betydelsemoment på 1:a nivån (huvudmoment,<br />

anges i tryck med arabiska siffror)<br />

— betydelsemoment på 2:a nivån (anges i<br />

tryck med gemener)<br />

— betydelsemoment på 3:e nivån (anges i<br />

tryck med grekiska bokstäver)<br />

— betydelsemoment på 4:e nivån (anges i<br />

tryck med grekiska bokstäver kombinerat<br />

med prim-tecken)<br />

— betydelsemoment på 5:e nivån (anges i<br />

tryck med grekiska bokstäver kombinerat<br />

med bis-tecken)<br />

— momentgruppering (syntaktiska kriterier;<br />

anges i tryck med romerska siffror)<br />

— momentgruppering (icke-syntaktiska kriterier;<br />

anges i tryck med versaler)<br />

Det har varit nödvändigt att göra omfattande sorteringar av materialet för att hitta dessa<br />

mönster. För att exemplifiera hur detta kan gå till kan vi återknyta till exemplet med betydelseindelningen<br />

i artikeln champagne ovan. I detta fall skulle man först sortera kontexten<br />

för alla siffror i fetstil i SAOB. Man gör sedan en bedömning om alla siffror är<br />

ordningsnummer i betydelseindelningen. I så fall byter man ut dem mot taggen , o.s.v., som i exemplet ovan. Detta är ett naturligtvis ett starkt förenklat<br />

exempel eftersom det finns miljontals siffror i fetstil i SAOB, vilka förekommer i en<br />

mängd olika funktioner. Mönstren som vi definierar är mycket mer komplicerade, men exemplet<br />

visar på själva tillvägagångssättet. Vi gör omfattande provtaggningar på små partier<br />

från olika delar av <strong>ordbok</strong>en – på grund av den strukturella variationen – innan vi<br />

slutligen taggar hela materialet. Man måste acceptera en viss felprocent på grund av svårigheten<br />

att överblicka strukturen, men den får inte vara större än att felen går att korrigera<br />

manuellt i efterhand. <strong>Om</strong> man taggar 300 000 enheter maskinellt och får med 5 000<br />

andra enheter av misstag, så tar detta lång tid att korrigerera manuellt. Detta kan tyckas<br />

vara en trivial upplysning, men jag vill trycka på att det är <strong>ordbok</strong>ens storlek som karaktäriserar<br />

hela detta projekt och då speciellt svårigheten att överblicka hela materialet.<br />

Makrostrukturen<br />

Det är relativt lätt att hitta gränserna mellan huvudartiklarna i SAOB, eftersom de markeras<br />

typografiskt med ny rad och indrag. Det finns dock en annan typ av artiklar som är<br />

svårare att hitta eftersom uppslagsordet kan stå var som helst på raden, endast åtskilt

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!