Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
15<br />
Yvonne Cederholm<br />
SGML-taggning av SAOB<br />
I detta avsnitt beskrivs hur den optiskt inlästa texten översätts till SGML-format 1 , där<br />
<strong>ordbok</strong>ens innehållsliga struktur taggas. Målet är att SAOB efter taggningsarbetet skall<br />
kunna användas som en lexikalisk databas, där man kan göra komplexa sökningar som<br />
t.ex. "vilka ord lånades in från engelskan under perioden 1700–1750".<br />
Taggningen gör tolkningen av texten explicit. Den implicita information, som i den<br />
tryckta <strong>ordbok</strong>en signaleras med hjälp av typografin och lätt kan tolkas av en mänsklig<br />
användare, blir genom taggningen också maskinellt sökbar. SGML-taggarna kommer naturligtvis<br />
inte att visas för den mänsklige läsaren, utan varje informationskategori associeras<br />
då med en viss typografi. Typografin behöver inte fastställas en gång för alla. Man<br />
kan välja utformning beroende på vilken läsare man riktar sig till och exempelvis ge <strong>ordbok</strong>en<br />
en mer pedagogisk utformning med utförliga förklaringar, eftersom man inte behöver<br />
ta hänsyn till utrymmet på samma sätt som i tryckta media. Detta avsnitt beskriver<br />
dock endast SGML-taggningen.<br />
Följande exempel får belysa taggningsarbetet. Enligt en vanlig lexikografisk konvention<br />
markeras lexikonartiklars betydelseindelning med siffror. Siffrorna står oftast också<br />
i fetstil för att indelningen skall framgå tydligt. Här följer ett utsnitt ut SAOB-artikeln<br />
champagne, som beskriver sammansättningen champagneglas. Vi ser att i den första versionen<br />
är sammansättningens två betydelser markerade med siffror i fetstil som i en<br />
tryckt <strong>ordbok</strong>. I den andra har vi istället satt in taggen .<br />
— -GLAS -2 1) för drickande av champagne särsk.<br />
afsedt vinglas; vanl. antingen högt o. smalt l.<br />
lågt o. vidt. DA 1824, nr 205, s. 4. De gamla kägelformade<br />
champagneglasen äro de bästa. HAG-<br />
DAL Kok. 1130 (1879). LUNDIN G. Sthm 147 (1880).<br />
KALLSTENIUS Hush. 184 (1896). 2) (i sht best., föga<br />
br.) med champagne fylldt glas. Det är med den första<br />
— -GLAS -2 för drickande av champagne särsk.<br />
afsedt vinglas; vanl. antingen högt o. smalt l.<br />
lågt o. vidt. DA 1824, nr 205, s. 4. De gamla kägelformade<br />
champagneglasen äro de bästa. HAG-<br />
DAL Kok. 1130 (1879). LUNDIN G. Sthm 147 (1880).<br />
KALLSTENIUS Hush. 184 (1896). (i sht best., föga<br />
br.) med champagne fylldt glas. Det är med den första<br />
Den första versionen kan enkelt tolkas av en mänsklig användare. Ett dator som skall<br />
söka i <strong>ordbok</strong>en kan däremot inte "förstå" att just dessa siffror i fetstil markerar en betydelseindelning.<br />
För att programmet skall kunna skilja på dessa siffror och andra siffror i<br />
fetstil i <strong>ordbok</strong>en, måste man lägga till information i form av taggar som gör att programmet<br />
tolkar det som en betydelseindelning. I exemplet ovan lade vi till taggen <br />
1.SGML är en internationell standard som finns beskriven i ISO 8879: Information processing – Text and<br />
office systems – Standard Generalized Markup Language (SGML), Geneva 1986. De som inte är bekanta med<br />
SGML rekommenderas att läsa t.ex An introduction to SGML av Benoît Marchal som finns tillgänglig på<br />
Internet under adressen http://www.brainlink.com/~ben/sgml/ eller kapitel 2 i Burnard &<br />
Sperberg-McQueen Guidelines for Electronic Text Encoding and Interchange (TEI P3) som också ger<br />
en allmän introduktion till SGML.