Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
Om svar anhålles - Svenska Akademiens ordbok - Göteborgs ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
11<br />
na kompletteras med fullständiga index över ordbeståndet i ett stort textmaterial. Också<br />
konkordanser av olika slag kan utarbetas. Svaren på en rad frågor får härigenom ökad säkerhet.<br />
De inlästa texterna låter sig på ett naturligt sätt infogas i Logotekets text- och ordbank.<br />
Detta serviceorgan vid institutionen har kortfattat beskrivits i det föregående.<br />
Den optiska textinläsningen ger så stora material, att vissa datalingvistiska forskningsuppgifter<br />
särskilt framhävs. Det finns anledning att antyda tre av dessa. En av dem<br />
gäller utveckling av metodiken för effektiv lagring av text.<br />
Texten kan naturligtvis lagras sekventiellt, ord för ord i den ordning inläsningen ger.<br />
En sådan lagringsform är användbar för åtskilliga syften. Den kan modifieras genom olika<br />
slag av komprimering, vilket dock fordrar uppackning vid vissa tillämpningar.<br />
Ett fascinerande alternativ är att lagra texten i form av ett länkat nätverk. I detta fall<br />
lagras varje förekommande ordform endast en gång. Genom pekare anges orden i kontexten,<br />
föregående och efterföljande ord i alfabetisk ordning och i frekvensordning m.m.<br />
Nätverket innehåller alltså samtidigt texten själv, alfabetiskt ordindex, konkordans, frekvenslista<br />
m.m. Ändringar i texten medför automatiskt ändringar i ordindex, konkordans<br />
osv.<br />
En annan forskningsuppgift som blir av stor betydelse är algoritmisk analys av löpande<br />
text. Olika slag av syntaktisk analys (s.k. parsing) har prövats på många håll med varierande<br />
resultat. Den nyss nämnda formen för lagring av text synes öppna nya möjligheter.<br />
<strong>Om</strong> textanalysen baseras på ett länkat nätverk, har programmet samtidigt tillgång till<br />
syntagmatisk (kontextuell) och paradigmatisk (gällande alla belägg på samma ordform)<br />
information. Detta i kombination med de kraftfulla lexikaliska databaserna ger den algoritmiska<br />
textanalysen mycket intressanta förutsättningar.<br />
Den sista av de tre forskningsuppgifter jag vill peka på gäller stavning<strong>svar</strong>iationen i<br />
texterna. Den är ju stor i tidigare århundradens texter. Den rymmer emellertid en hel del<br />
regulariteter som kan utnyttjas för att bland annat sammanföra ordformer i ordindexen.<br />
Också detta kräver naturligtvis ett utvecklingsarbete.<br />
* * *<br />
<strong>Svenska</strong> Akademien beslöt att <strong>svar</strong>a för personalkostnaderna, och medel till inköp av läsutrustningen<br />
ställdes till förfogande av Knut och Alice Wallenbergs Stiftelse.