25.12.2014 Views

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

15<br />

Yvonne Cederholm<br />

SGML-taggning av SAOB<br />

I detta avsnitt beskrivs hur den optiskt inlästa texten översätts till SGML-format 1 , där<br />

<strong>ordbok</strong>ens innehållsliga struktur taggas. Målet är att SAOB efter taggningsarbetet skall<br />

kunna användas som en lexikalisk databas, där man kan göra komplexa sökningar som<br />

t.ex. "vilka ord lånades in från engelskan under perioden 1700–1750".<br />

Taggningen gör tolkningen av texten explicit. Den implicita information, som i den<br />

tryckta <strong>ordbok</strong>en signaleras med hjälp av typografin och lätt kan tolkas av en mänsklig<br />

användare, blir genom taggningen också maskinellt sökbar. SGML-taggarna kommer naturligtvis<br />

inte att visas för den mänsklige läsaren, utan varje informationskategori associeras<br />

då med en viss typografi. Typografin behöver inte fastställas en gång för alla. Man<br />

kan välja utformning beroende på vilken läsare man riktar sig till och exempelvis ge <strong>ordbok</strong>en<br />

en mer pedagogisk utformning med utförliga förklaringar, eftersom man inte behöver<br />

ta hänsyn till utrymmet på samma sätt som i tryckta media. Detta avsnitt beskriver<br />

dock endast SGML-taggningen.<br />

Följande exempel får belysa taggningsarbetet. Enligt en vanlig lexikografisk konvention<br />

markeras lexikonartiklars betydelseindelning med siffror. Siffrorna står oftast också<br />

i fetstil för att indelningen skall framgå tydligt. Här följer ett utsnitt ut SAOB-artikeln<br />

champagne, som beskriver sammansättningen champagneglas. Vi ser att i den första versionen<br />

är sammansättningens två betydelser markerade med siffror i fetstil som i en<br />

tryckt <strong>ordbok</strong>. I den andra har vi istället satt in taggen .<br />

— -GLAS -2 1) för drickande av champagne särsk.<br />

afsedt vinglas; vanl. antingen högt o. smalt l.<br />

lågt o. vidt. DA 1824, nr 205, s. 4. De gamla kägelformade<br />

champagneglasen äro de bästa. HAG-<br />

DAL Kok. 1130 (1879). LUNDIN G. Sthm 147 (1880).<br />

KALLSTENIUS Hush. 184 (1896). 2) (i sht best., föga<br />

br.) med champagne fylldt glas. Det är med den första<br />

— -GLAS -2 för drickande av champagne särsk.<br />

afsedt vinglas; vanl. antingen högt o. smalt l.<br />

lågt o. vidt. DA 1824, nr 205, s. 4. De gamla kägelformade<br />

champagneglasen äro de bästa. HAG-<br />

DAL Kok. 1130 (1879). LUNDIN G. Sthm 147 (1880).<br />

KALLSTENIUS Hush. 184 (1896). (i sht best., föga<br />

br.) med champagne fylldt glas. Det är med den första<br />

Den första versionen kan enkelt tolkas av en mänsklig användare. Ett dator som skall<br />

söka i <strong>ordbok</strong>en kan däremot inte "förstå" att just dessa siffror i fetstil markerar en betydelseindelning.<br />

För att programmet skall kunna skilja på dessa siffror och andra siffror i<br />

fetstil i <strong>ordbok</strong>en, måste man lägga till information i form av taggar som gör att programmet<br />

tolkar det som en betydelseindelning. I exemplet ovan lade vi till taggen <br />

1.SGML är en internationell standard som finns beskriven i ISO 8879: Information processing – Text and<br />

office systems – Standard Generalized Markup Language (SGML), Geneva 1986. De som inte är bekanta med<br />

SGML rekommenderas att läsa t.ex An introduction to SGML av Benoît Marchal som finns tillgänglig på<br />

Internet under adressen http://www.brainlink.com/~ben/sgml/ eller kapitel 2 i Burnard &<br />

Sperberg-McQueen Guidelines for Electronic Text Encoding and Interchange (TEI P3) som också ger<br />

en allmän introduktion till SGML.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!