23.10.2013 Views

Mare Koit

Mare Koit

Mare Koit

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Utilitaarne semantika ja<br />

teksti süntees semantilisest esitusest<br />

<strong>Mare</strong> <strong>Koit</strong><br />

Kraad: füüsika-matemaatikakandidaat<br />

Eriala: matemaatiline küberneetika<br />

Juhendaja: dots Ivar Kull (Tartu)<br />

Oponendid: Dmitri Pospelov (Moskva), Ivar Petersen (Tallinn)<br />

Juhtiv asutus: Moskva insenerifüüsika instituut (MIFI)<br />

Kaitsmisaeg: 24. aprill 1980 [9. märts 1979]<br />

Koht: NSVL Teaduste Akadeemia Arvutuskeskus (Moskva)<br />

[ENSV Teaduste Akadeemia Küberneetika Instituut (Tallinn)]


Taust<br />

• Info esitamine arvutis ja automaatne<br />

infotöötlus<br />

• Eesmärk:<br />

– töötada välja meetod formaliseeritud keelte<br />

modelleerimiseks (algoritmikeeled,<br />

infootsikeeled, piiratud loomulikud keeled<br />

jms),<br />

– uurida meetodi rakendatavust<br />

tehisintellektisüsteemides.


Põhiülesanded<br />

Taust (2)<br />

• töötada välja formaliseeritud keelte<br />

semantika mudel<br />

• töötada välja semantilisest esitusest<br />

teksti sünteesimise meetod<br />

• uurida meetodi rakendatavust (piiratud)<br />

loomuliku keele teksti genereerimiseks


Utilitaarne keel<br />

Paar<br />

(utilitaarne semantika, sünteesialgoritm)<br />

• 2-tasemeline<br />

– Sisutase – mõistete hulk (lihtsas semantilise esituse<br />

keeles)<br />

– Väljendustase – mõisteid väljendavate (semantilisest<br />

esitusest algoritmi abil sünteesitud) tekstide hulk (nt<br />

programmid algoritmikeeltes, päringud infootsikeeltes,<br />

situatsioonikirjeldused piiratud loomulikes keeltes)


Sisukord<br />

Sissejuhatus<br />

Ptk 1. Utilitaarne semantika<br />

Ptk 2. Mõistete analüüsimise algoritmid<br />

Ptk 3. Teksti sünteesi algoritmid<br />

Ptk 4. Teksti sünteesi algoritmide rakendamine<br />

tehisintellektisüsteemides<br />

Kirjandus<br />

Lisa 1. Ptk-s 2 formuleeritud teoreemide tõestused<br />

Lisa 2. Ptk-s 3 formuleeritud lemmade tõestused<br />

Lisa 3. Algoritmid ϕ-keelest vene keelde tõlkimiseks<br />

Lisa 4. Selgitused algoritmide juurde<br />

Lisa 5. Algoritmid ϕ-keelest keelde UTOPIST tõlkimiseks


Ptk 1. Utilitaarne semantika<br />

– Utilitaarse semantika definitsioon<br />

– Mõistete hulga graaf<br />

– Osaline järjestus mõistete hulgal<br />

– Mõiste lahutus<br />

– Utilitaarsed alamsemantikad


Utilitaarne semantika (1)<br />

• Semantika – mõistete hulk<br />

• Mõistete moodustamine<br />

– lihtsad mõisted (nt leiutis, dokument)<br />

– binaarsed seosed (nt sugu-liik, objektomadus)


Utilitaarne semantika (2)<br />

• Olgu<br />

S = {A 1 ,…,A n },<br />

R = {R 1 ,…,R m }.<br />

Tähistame O = S ∪ R.<br />

Olgu G ⊆ {R i A j A k | R i ∈ R; A j , A k ∈ S; i=1,…,m; j,k=1,…,n }.<br />

Def. Semantika M:<br />

1. M sisaldab kõik S ja G elemendid.<br />

2. Kui PMN, M, N ∈ M ja P, S ∈ R, siis<br />

a. SMT ∈ M ==> PSMTN ∈ M,<br />

b. SNT ∈ M ==> PMSNT ∈ M.<br />

3. M sisaldab need ja ainult need sõned, mis kuuluvad sinna 1 või<br />

2 põhjal.


• M*<br />

Utilitaarne semantika (3)<br />

• Sama mis semantika (M), kuid S<br />

asemel S*⊆ S ja G asemel hulk, kust<br />

eemaldatud kõik G sellised korteežid,<br />

milles A j ∈ S \ S*.


Utilitaarne semantika (4)<br />

• Utilitaarse semantika M* kõik mõisted<br />

(v.a need, mis kuuluvad hulka S*) on<br />

kujul<br />

M=M 0 M 1 M 2 ,<br />

kus M 0 ∈ R, M 1 ∈ M*, M 2 ∈ M* ∪ S on<br />

mõiste M nn vahetud moodustajad.


Utilitaarne semantika (5)<br />

• Mõiste esitus puuna<br />

• Mõistest M vahetult genereeritav mõiste P<br />

• Utilitaarse semantika esitus graafina<br />

• Osaline järjestus<br />

• Utilitaarse semantika alamsemantikad<br />

• Utilitaarsete semantikate summa ja korrutis<br />

M* 1 ∪ M* 2 ⊆ M* 1 + M* 2<br />

M* 1 ∩ M* 2 = M* 1 x M* 2<br />

• Edasi uuritakse utilitaarse semantika matemaatilisi<br />

omadusi.<br />

– Utilitaarne semantika on distributiivne võre.


Ptk 2. Mõistete analüüsimise<br />

algoritmid<br />

• Semantilise algoritmi definitsioon<br />

• Vahetute moodustajate leidmise<br />

algoritmid<br />

• Esimese ja teise tuuma leidmise<br />

algoritmid<br />

• Lahutuse ja baasi leidmise algoritmid<br />

• Lahutuse modifitseerimise algoritmid


Mõistete analüüsimise algoritmid (1)<br />

• Olgu antud tähestikud<br />

Z = {>, ->, =>} ja U,<br />

kus Z ∩ U = ∅.<br />

• Vt algoritme (Markovi normaalalgoritme)<br />

kujul<br />

Z = >X 1 U 1 Y 1 > X 2 U 2 Y 2 … > Xk U k Y k ,<br />

kus U i ∈ {->, =>} ja X i , Y i - sõned<br />

tähestikus U.


Mõistete analüüsimise algoritmid (2)<br />

Tähestikud O={A 1,…,A n; R 1,…,R m} ja A.<br />

Algoritmi Z nimetame semantiliseks algoritmiks<br />

tähestikust O tähestikku A, kui<br />

1) algoritm on rakendatav suvalisele<br />

mittetühjale sõnele tähestikust O ja töötleb<br />

selle mingiks sõneks tähestikus A,<br />

2) sõne Z(M) on mittetühi siis ja ainult siis, kui M<br />

on utilitaarse semantika M* mõiste.<br />

• Semantiline algoritm – algoritm, mis tunneb<br />

ära utilitaarse semantika.


Mõistete analüüsimise algoritmid (3)<br />

• Semantiline algoritm, mis leiab mõiste<br />

vahetud moodustajad<br />

• Semantiline algoritm, mis leiab mõiste<br />

1. ja 2. tuuma<br />

• Semantiline algoritm, mis leiab mõiste<br />

lahutuse ja baasi


Ptk 3. Teksti sünteesi algoritmid<br />

• Elementaarne algoritm ja elementaarutilitaarne<br />

keel<br />

• Säilitav algoritm ja utilitaarne keel<br />

• Utilitaarsete keele näiteid


Teksti sünteesi algoritmid (1)<br />

• Vt kahte algoritmi, mis teisendavad suvalise mõiste<br />

selle esituseks (tekstiks) mingis tähestikus A (nt<br />

programmiks programmeerimiskeeles, päringuks<br />

infootsikeeles jms).<br />

• Elementaarne algoritm – semantiline algoritm Z, mille<br />

korral iga mõiste M korral Z(M) sisaldab<br />

mittelõikuvate osahulkadena kõik Z(A i ), kus A i<br />

sisaldub mõistes M (i=1,…,n).<br />

• Säilitav algoritm – semantiline algoritm Z, mille korral<br />

iga mõiste M jaoks<br />

Z(M) = λ 1μ 11 λ 2μ 2 λ 3μ 12 λ 4,<br />

kus μ 11 μ 12 = Z(M 1 ) ja μ 2 = Z(M 2 ).


Keel<br />

Paar (semantika, algoritm)<br />

• Elementaar-utilitaarne keel (nt ϕ-keel, UDK<br />

põhiindeksite hulk)<br />

– Semantika – utilitaarne<br />

– Algoritm – elementaarne<br />

• Utilitaarne keel (nt UDK,<br />

programmeerimiskeeled)<br />

– Semantika – utilitaarne<br />

– Algoritm – säilitav


Ptk 4. Teksti sünteesi algoritmide<br />

rakendamine tehisintellektisüsteemides<br />

• Tõlkimine ϕ-keelest piiratud vene<br />

keelde<br />

– ϕ -avaldise lahutus lihtsateks osadeks<br />

– Teksti genereerimine<br />

• Tõlkimine ϕ-keelest keelde UTOPIST


Teksti genereerimine<br />

• Piiratud vene keel<br />

• semantiliseks esituseks ϕ-avaldis.<br />

• 2 etappi<br />

– Süntaktiline: genereeritakse nn toortekst<br />

(tunnuste ahelate järjend)<br />

– Morfoloogiline: tunnuste ahelad<br />

asendatakse sõnavormidega


Põhitulemused<br />

• Loodud semantika mudel – utilitaarne semantika<br />

• Defineeritud tehted utilitaarsete semantikatega (summa,<br />

korrutis)<br />

• Koostatud (Markovi normaal-)algoritmid) semantikasse<br />

kuuluvate mõistete analüüsimiseks<br />

• Defineeritud (elementaar-utilitaarne ja utilitaarne) keel (2tasemeline<br />

mudel)<br />

• Koostatud algoritmid (elementaarne ja säilitav) teksti sünteesiks<br />

(elementaar-utilitaarses ja utilitaarses keeles<br />

• Koostatud algoritmid tõlkimiseks ϕ-keelest (piiratud) vene<br />

keelde (2 algoritmi) ja keelde UTOPIST.<br />

Väitekirja põhitulemused on avaldatud 2 artiklis (TRÜ Toimetistes):<br />

1974 ja 1975.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!