25.12.2014 Views

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

11<br />

na kompletteras med fullständiga index över ordbeståndet i ett stort textmaterial. Också<br />

konkordanser av olika slag kan utarbetas. Svaren på en rad frågor får härigenom ökad säkerhet.<br />

De inlästa texterna låter sig på ett naturligt sätt infogas i Logotekets text- och ordbank.<br />

Detta serviceorgan vid institutionen har kortfattat beskrivits i det föregående.<br />

Den optiska textinläsningen ger så stora material, att vissa datalingvistiska forskningsuppgifter<br />

särskilt framhävs. Det finns anledning att antyda tre av dessa. En av dem<br />

gäller utveckling av metodiken för effektiv lagring av text.<br />

Texten kan naturligtvis lagras sekventiellt, ord för ord i den ordning inläsningen ger.<br />

En sådan lagringsform är användbar för åtskilliga syften. Den kan modifieras genom olika<br />

slag av komprimering, vilket dock fordrar uppackning vid vissa tillämpningar.<br />

Ett fascinerande alternativ är att lagra texten i form av ett länkat nätverk. I detta fall<br />

lagras varje förekommande ordform endast en gång. Genom pekare anges orden i kontexten,<br />

föregående och efterföljande ord i alfabetisk ordning och i frekvensordning m.m.<br />

Nätverket innehåller alltså samtidigt texten själv, alfabetiskt ordindex, konkordans, frekvenslista<br />

m.m. Ändringar i texten medför automatiskt ändringar i ordindex, konkordans<br />

osv.<br />

En annan forskningsuppgift som blir av stor betydelse är algoritmisk analys av löpande<br />

text. Olika slag av syntaktisk analys (s.k. parsing) har prövats på många håll med varierande<br />

resultat. Den nyss nämnda formen för lagring av text synes öppna nya möjligheter.<br />

<strong>Om</strong> textanalysen baseras på ett länkat nätverk, har programmet samtidigt tillgång till<br />

syntagmatisk (kontextuell) och paradigmatisk (gällande alla belägg på samma ordform)<br />

information. Detta i kombination med de kraftfulla lexikaliska databaserna ger den algoritmiska<br />

textanalysen mycket intressanta förutsättningar.<br />

Den sista av de tre forskningsuppgifter jag vill peka på gäller stavning<strong>svar</strong>iationen i<br />

texterna. Den är ju stor i tidigare århundradens texter. Den rymmer emellertid en hel del<br />

regulariteter som kan utnyttjas för att bland annat sammanföra ordformer i ordindexen.<br />

Också detta kräver naturligtvis ett utvecklingsarbete.<br />

* * *<br />

<strong>Svenska</strong> Akademien beslöt att <strong>svar</strong>a för personalkostnaderna, och medel till inköp av läsutrustningen<br />

ställdes till förfogande av Knut och Alice Wallenbergs Stiftelse.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!