Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
19<br />
Tabell 1: tagguppsättning för primärstrukturen<br />
starttagg sluttagg beskrivning<br />
avledning<br />
— ramsa med särskilda förbindelser<br />
— artikel för särskild förbindelse<br />
särskild förbindelse – grundord<br />
särskild förbindelse – partikel<br />
— betydelsemoment på 1:a nivån (huvudmoment,<br />
anges i tryck med arabiska siffror)<br />
— betydelsemoment på 2:a nivån (anges i<br />
tryck med gemener)<br />
— betydelsemoment på 3:e nivån (anges i<br />
tryck med grekiska bokstäver)<br />
— betydelsemoment på 4:e nivån (anges i<br />
tryck med grekiska bokstäver kombinerat<br />
med prim-tecken)<br />
— betydelsemoment på 5:e nivån (anges i<br />
tryck med grekiska bokstäver kombinerat<br />
med bis-tecken)<br />
— momentgruppering (syntaktiska kriterier;<br />
anges i tryck med romerska siffror)<br />
— momentgruppering (icke-syntaktiska kriterier;<br />
anges i tryck med versaler)<br />
Det har varit nödvändigt att göra omfattande sorteringar av materialet för att hitta dessa<br />
mönster. För att exemplifiera hur detta kan gå till kan vi återknyta till exemplet med betydelseindelningen<br />
i artikeln champagne ovan. I detta fall skulle man först sortera kontexten<br />
för alla siffror i fetstil i SAOB. Man gör sedan en bedömning om alla siffror är<br />
ordningsnummer i betydelseindelningen. I så fall byter man ut dem mot taggen , o.s.v., som i exemplet ovan. Detta är ett naturligtvis ett starkt förenklat<br />
exempel eftersom det finns miljontals siffror i fetstil i SAOB, vilka förekommer i en<br />
mängd olika funktioner. Mönstren som vi definierar är mycket mer komplicerade, men exemplet<br />
visar på själva tillvägagångssättet. Vi gör omfattande provtaggningar på små partier<br />
från olika delar av <strong>ordbok</strong>en – på grund av den strukturella variationen – innan vi<br />
slutligen taggar hela materialet. Man måste acceptera en viss felprocent på grund av svårigheten<br />
att överblicka strukturen, men den får inte vara större än att felen går att korrigera<br />
manuellt i efterhand. <strong>Om</strong> man taggar 300 000 enheter maskinellt och får med 5 000<br />
andra enheter av misstag, så tar detta lång tid att korrigerera manuellt. Detta kan tyckas<br />
vara en trivial upplysning, men jag vill trycka på att det är <strong>ordbok</strong>ens storlek som karaktäriserar<br />
hela detta projekt och då speciellt svårigheten att överblicka hela materialet.<br />
Makrostrukturen<br />
Det är relativt lätt att hitta gränserna mellan huvudartiklarna i SAOB, eftersom de markeras<br />
typografiskt med ny rad och indrag. Det finns dock en annan typ av artiklar som är<br />
svårare att hitta eftersom uppslagsordet kan stå var som helst på raden, endast åtskilt