25.12.2014 Views

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

10<br />

uppslagsord, uttal, ordklassuppgift, översättning och fraseologi är sökbara. Materialet är<br />

också tillgängligt för forskningsändamål.<br />

Uppläggningen av SAOB i mot<strong>svar</strong>ande form kräver självfallet en programmeringsinsats.<br />

Härvid kan institutionen utnyttja erfarenheten från uppbyggnaden av de system<br />

som nu är i drift, främst Lexikalisk databas.<br />

Det faktum att SAOB inte täcker hela alfabetet kan inte betraktas som något hinder.<br />

Partiet fram t.o.m. solanin innehåller som framgått en myckenhet upplysningar. Det blir<br />

inte heller fråga om något systematiskt bortfall med avseende på de sökkategorier som<br />

nämnts tidigare. Det rådande förhållandet aktualiserar emellertid efterhand också frågan<br />

om SAOB:s tekniska produktionssätt. Den rationaliseringsmöjlighet som i första hand anmäler<br />

sig är inkodning och korrigering av redaktörernas lappmanuskript på textskärm.<br />

Detta innebär samtidigt "sättning" och ger sålunda direkt underlag för tryckning. Eftersom<br />

materialet på detta sätt skulle bli tillgängligt i maskinläsbar form, kunde det också<br />

successivt infogas i databasen.<br />

Som databas kan SAOB användas för flera nya syften. Den kan för det första hållas tillgänglig<br />

för forskningen inom olika områden – nationellt och internationellt – för att ge<br />

<strong>svar</strong> på frågor av många olika slag enligt ovan. Varje sökbar kategori kan betraktas som<br />

en ny ingång.<br />

Den kan för det andra tillhandahållas som (kommersiellt tillgänglig) databas för sökning<br />

via terminal på företag eller hos myndigheter respektive via hem-TV genom de nya<br />

medier som nu utvecklas. Att abonnera på databasen kan för många te sig mer lockande<br />

än att köpa boksviten.<br />

För det tredje kan nya publikationer presenteras. Exempel på sådana kan vara en kronologiskt<br />

ordnad <strong>ordbok</strong> med äldsta belägg som sorteringsgrund, ett index över en periods<br />

ordskatt, t.ex. 1600-talets, och en sammanställning av lånord med långivande språk som<br />

indelningsprincip.<br />

För det fjärde kan bearbetningar göras som främjar det fortsatta arbetet vid <strong>ordbok</strong>sredaktionen.<br />

Ett exempel är en baklängeslista över uppslagsorden. Ordbokschefen har förklarat<br />

sig intresserad av en sådan.<br />

För det femte är databasen ett utomordentligt fängslande objekt för lingvistisk forskning.<br />

Undersökningar kan göras av såväl formella som innehållsliga kategorier liksom av<br />

kombinationer av kategorier. I synnerhet vill jag trycka på möjligheten att studera den<br />

svenska vokabulärens semantiska struktur. Som underlag för sådana studier kan olika<br />

slags bearbetningar utföras. En är helt enkelt en framtagning av en konkordans över de<br />

ord i betydelseförklaringarna som inte är formord. En annan, mer avancerad, är algoritmisk<br />

syntaktisk analys av betydelseförklaringarna i syfte att bestämma huvudorden (genus<br />

proximum). Över huvud taget är det viktigt att den utförliga semantiska<br />

informationen i SAOB görs lätt tillgänglig för forskningen.<br />

<strong>Svenska</strong> texter<br />

Ingen <strong>ordbok</strong> över ett levande språk kan täcka dess vokabulär fullständigt. Också SAOB<br />

och Lexikalisk databas är urval. För att få ett ännu fastare grepp om ordbeståndet och för<br />

att skapa underlag för många textuellt inriktade forskningsuppgifter är det därför av stor<br />

vikt att med utrustningens hjälp läsa in texter från den nysvenska epoken (tiden från reformationen<br />

till nu). Detta är fas 2 i projektet.<br />

Avsikten är att läsa in såväl skönlitterära som andra texter enligt en fyllig plan som<br />

senare specificeras. Till texterna utarbetas ordindex. Dessa registrerar samtliga ord i materialen<br />

med källhänvisningar. Vid den närmare utformningen av ordindexen beaktar<br />

man att de 200 vanligaste orden i ett textmaterial <strong>svar</strong>ar för hälften av alla beläggen i texten.<br />

Genom sampling kan den datamängd som gäller formorden således reduceras på olika<br />

sätt vid presentationen av ordindexen. Grundtanken bibehålls: de lexikaliska databaser-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!