25.12.2014 Views

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

29<br />

Efter att vi taggat årtalsupgifterna lade vi in en temporär tagg som markerade en sannolik<br />

gräns mellan två språkprov. Med utgångspunkt från årtalet sökte vi oss så baklänges i<br />

språkproven för att identifiera textställe, titel och författare. Det var relativt enkelt att<br />

särskilja dem eftersom de har olika typografisk karaktär. Ca 634 600 författarnamn har<br />

taggats enligt nedanstående exempel:<br />

STRINDBERG<br />

Ca 457 700 titlar (förkortningar) har taggats enligt nedanstående mönster. Förkortningen<br />

SD(A) i exemplet står för Stockholms dagblad.<br />

SD(A)<br />

Ca 527 100 sidhänvisningar och andra hänvisningar till textställen har taggats. Exempel:<br />

2: 19<br />

nr. 5, s. 89<br />

Övriga tillägg och upplysningar i källhänvisningen taggas:<br />

Bib. 1917: de stilla i landet<br />

skolpojksuttryck fr. Uppsala<br />

Allt text mellan gränstaggen och påföljande källhänvisning betraktas som citat och taggas<br />

(språkprov från artikeln malm):<br />

Pröffue edher sielffue, och grant tilsee hwadh Malm j ären,<br />

fördömda Syndare ären j. PHRYGIUS (1615)<br />

De förklarande tilläggen (redaktionell text) i citaten taggas som exemplet nedan<br />

(från artikeln mallig).<br />

Nu har prästen blivit mallig i pipen, sade.. (målargesällerna)<br />

på sitt språk. WÄGNER (1921)<br />

Vi har vid några tillfällen gjort specialundersökningar på uppdrag av olika forskare och<br />

tagit fram språkprov från individuella författare, t.ex. Hedvig Charlotta Nordenflycht och<br />

Andreas Arvidi, och från enskilda verk som t.ex. Serenius ordböcker (se "OSA-databasen<br />

i praktiken" på sidan 59 och framåt.). Resultaten av dessa undersökningar visar klart på<br />

att det finns en stor variation i källhänvisningarna och att man måste normalisera både<br />

författarnamn och titlar för att kunna söka på dem.Författarnamn kan variera. Laurentius<br />

Petri skrivs i de första delarna L. PETRI, men senare sammanskrivet LPETRI. Det är<br />

också mycket vanligt med varianter på titlarnas förkortningar. Exempelvis förkortas August<br />

Strindbergs Bland franska bönder både som FrBönd., vilket överensstämmer med<br />

källförteckningen och som Franska bönd. Detta är naturligtvis trivialt för en mänsklig läsare,<br />

men ställer till problem vid sökningen. För att komma undan sådana problem bygger<br />

vi upp en biografisk databas över varianter. Databasen bygger på SAOB-redaktionens bibliografiska<br />

databas. Uppbyggaden av databasen beskrivs mer utförligt av Sofie Johansson<br />

Kokkinakis i denna rapport (se “Bibliografisk databas” på sidan 37 och framåt.). Hittills<br />

har vi endast använt databasen för att ta fram listor över författarnamn, vilka har använts<br />

vid den automatiska taggningen. Vi kommer relativt snart att börja kontrollera alla källangivelser<br />

automatiskt mot informationen i databasen. Fördelarna med en sådan kontroll<br />

är följande.<br />

• Man kan göra en automatisk korrekturläsning av titlar och namn på författare.<br />

• Man kan identifiera variantformer av titlarna och författarnas namn. Databasen<br />

uppdateras allt efter som man hittar nya varianter.<br />

• Man kan avgöra om osäkra avstavningar i författarnamn och titlar skall tas bort el-

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!