Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
9<br />
SAOB som databas<br />
Till hela denna rikt varierade informationsmängd finns det endast en ingång, den alfabetiska,<br />
och den gäller enbart uppslagsorden. Men <strong>svar</strong>en på en stor mängd grundläggande<br />
frågor låter sig inte utletas via den ingången. Frågorna är tvärtom formulerade i helt andra<br />
kategorier: kronologiska, morfologiska, semantiska, stilistiska, etymologiska m.m.<br />
Hur ser det tidiga 1700-talets ordskatt ut Hur har neutrum plural på -er utvecklats Vilka<br />
ord definieras som hyponymer till tillvägagångssätt Vilka ord anges som tillhörande<br />
det ekonomiska området Vilka lånord från engelskan kom in vid tiden för första världskriget<br />
Osv. Vi vet att <strong>svar</strong>en på sådana frågor finns i de tryckta banden, men de är oåtkomliga<br />
för dem som inte gång efter annan vill excerpera hela den väldiga <strong>ordbok</strong>ssviten.<br />
<strong>Om</strong> <strong>ordbok</strong>en vore tillgänglig i databasform, skulle kategorier som de nämnda bli sökbara.<br />
Man kunde få <strong>svar</strong> på frågorna. Fas 1 i projektet avtecknar sig.<br />
Det finns nu nämligen en apparat med vars hjälp tryckt text kan överföras i datamaskinellt<br />
läsbar form och därigenom göras tillgänglig på ett mycket flexibelt sätt. Det är den<br />
optiska läsaren Kurzweil Data Entry Machine. Den består av en skanner (optisk avsökare),<br />
två minidatorer, en textskärm och ett sekundärminne. Vid användning kalibreras den<br />
först med hänsyn till svärta, sidformat m.m. och tränas sedan att känna igen textens typsnitt.<br />
Därefter kan produktionskörning ske. Läshastigheten är 6–12 gånger högre än en<br />
sekreterares skrivhastighet, beroende på textens typografiska karaktär.<br />
Vid körning visar den sådana tecken på skärmen som har lästs osäkert (på grund av<br />
ojämnhet i svärtan, trasiga typer o.d.). Det kräver att en operatör hela tiden är tillgänglig<br />
för att ange den rätta läsningen på dessa punkter.<br />
Utöver de ingrepp som operatören gör i samband med inläsningen kan texten kontrolleras<br />
med hjälp av olika slags program. Dessa kan t.ex. utföra konsekvenskontroller av typen<br />
moment 1 skall följas av moment 2, vänsterparentes skall mot<strong>svar</strong>as av högerparentes<br />
osv. De kan bland annat också kontrollera bokstavskombinationerna (grafotaxen): insprutning<br />
är ett tillåtligt ord men inte insptutning osv.<br />
Kurzweilläsare är i drift vid t.ex. Library of Congress i Washington, New York Public<br />
Library, Oxford University Computing Service och English Department vid University of<br />
Birmingham. Jag har personlig kontakt med dr Susan Hockey i Oxford och med professor<br />
John Sinclair och hans närmaste medarbetare dr Antoinette Renouf i Birmingham. De<br />
båda senare har f.ö. nyligen gjort ett längre studiebesök vid vår institution. I Oxford håller<br />
man på att lägga upp ett datamaskinellt arkiv med texter på olika språk. I Birmingham<br />
har man börjat läsa in ett stort modernt textmaterial. De nämnda forskarnas erfarenhet<br />
är mycket god.<br />
Genom tillmötesgående från Specialsystem Kinnunen & Co AB, Stockholm, har vi låtit<br />
genomföra ett experiment med Kurzweilläsaren. Hos detta företag finns den enda läsaren<br />
i landet. Man har där bland annat läst in den norska lagboken.<br />
Experimentet, som gjordes i april 1980, gick till så, att vi sände ett par sidor av SAOB<br />
(avsnittet serval – servare) till företaget för inläsning. Efter mycket kort träning av systemet<br />
skedde läsningen. Trots att SAOB i själva verket utnyttjar åtta olika stilar, framstod<br />
resultatet som mycket tillfredsställande.<br />
För att SAOB skall kunna lagras på ett sådant sätt att de olika kategorierna av information<br />
blir sökbara fordras en analys av <strong>ordbok</strong>sartiklarnas logiska och typografiska<br />
struktur. Den fasthet som präglar redaktionens arbete är härvid en stor tillgång. Som presentationen<br />
ovan visade är artiklarna uppbyggda enligt ett bestämt mönster.<br />
En struktur- och systemanalys av det erforderliga slaget har jag tidigare utfört. Det<br />
gällde den gången det maskinskrivna manuskriptet till den 1980 publicerade Stora engelsk-svenska<br />
<strong>ordbok</strong>en (Esselte Studium; 1100 sidor, 120 000 uppslagsord). Analysen ledde<br />
till att <strong>ordbok</strong>en datasattes och lagrades i en sådan form, att kategorier som