03.03.2015 Views

Recent Advances in MULTIFLEX, a Morphological Generator of ...

Recent Advances in MULTIFLEX, a Morphological Generator of ...

Recent Advances in MULTIFLEX, a Morphological Generator of ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Recent</strong><strong>Advances</strong><strong>in</strong><strong>MULTIFLEX</strong>,a<br />

<strong>Morphological</strong><strong>Generator</strong><strong>of</strong>Multi-WordUnits<br />

AgataSavary<br />

November17,2008


Morfeusz/<strong>MULTIFLEX</strong>Platform<br />

◮Aim:description<strong>of</strong>morphologyandvariation<strong>of</strong><br />

compounds<br />

◮Informationonthelanguagelevel:classes,categoriesand<br />

values<strong>of</strong>theIPIPANtagset<br />

◮Generat<strong>in</strong>g<strong>in</strong>flectedforms<strong>of</strong>s<strong>in</strong>glewordswithMorfeusz<br />

◮Comb<strong>in</strong><strong>in</strong>g(byagraph)<strong>in</strong>flectedforms<strong>of</strong>s<strong>in</strong>glewordsto<br />

create<strong>in</strong>flectedforms<strong>of</strong>compounds<br />

◮Unificationandvalue<strong>in</strong>heritanceforacompactdescription


Example1:MariaSkłodowska-Curie<br />

MariaSkłodowska-Curie,MariiSkłodowskiej-Curie,...<br />

Skłodowska-Curie,Skłodowskiej-Curie,...<br />

MariaSkłodowska,MariiSkłodowskiej,...<br />

MariaCurie,MariiCurie,...<br />

Skłodowska,Skłodowskiej,...


Annotation<strong>of</strong>componentsand<strong>in</strong>flectiongraph<br />

Maria Skłodowska - Curie<br />

$1 $2 $3 $4 $5<br />

lemma:Maria<br />

class:subst<br />

homonym:0<br />

Nb:sg<br />

Case:nom<br />

Gen:f<br />

lemma:Skłodowska<br />

class:subst<br />

homonym:0<br />

Nb:sg<br />

Case:nom<br />

Gen:f<br />

<br />


Annotatedforms<br />

MariaSkłodowska-Curie MariaSkłodowska-Curie:subst:sg:nom:f<br />

MariiSkłodowskiej-Curie MariaSkłodowska-Curie:subst:sg:gen:f<br />

MariiSkłodowskiej-Curie MariaSkłodowska-Curie:subst:sg:dat:f<br />

Skłodowską-Curie MariaSkłodowska-Curie:subst:sg:<strong>in</strong>st:f<br />

Skłodowskiej MariaSkłodowska-Curie:subst:sg:loc:f


Example2:ulicaMariiSkłodowskiej-Curie<br />

ulicaMariiSkłodowskiej-Curie,ulicyMariiSkłodowskiej-Curie,<br />

...;<br />

ulicaMariiSkłodowskiej,ulicyMariiSkłodowskiej,...;<br />

ulicaMariiCurie,ulicyMariiCurie,...;<br />

ulicaSkłodowskiej-Curie,ulicySkłodowskiej-Curie,...;<br />

ulicaSkłodowskiej,ulicySkłodowskiej,...;<br />

MariiSkłodowskiej-Curie;<br />

MariiSkłodowskiej;<br />

MariiCurie;<br />

Skłodowskiej-Curie;<br />

Skłodowskiej


Flatdescription<strong>of</strong>variants:ulicaMariiSkłodowskiej-Curie<br />

ulica Marii Skłodowskiej - Curie<br />

$1 $2 $3 $4 $5 $6 $7<br />

lemma:ulica<br />

class:subst<br />

homonym:0<br />

Nb:sg<br />

Case:nom<br />

Gen:f<br />

<br />


Newsolution:embeddeddescription<strong>of</strong>ulicaMarii<br />

Skłodowskiej-Curie<br />

ulica MariiSkłodowskiej-Curie<br />

$1 $2 $3<br />

lemma:ulica<br />

class:subst<br />

homonym:0<br />

Nb:sg<br />

Case:nom<br />

Gen:f<br />

lemma:MariaSkłodowska-Curie<br />

class:subst<br />

homonym:0<br />

Nb:sg<br />

Case:gen<br />

Gen:f<br />

<br />


Morphology<strong>of</strong>numerals<strong>in</strong>theIPIPANtagset<br />

Twok<strong>in</strong>ds<strong>of</strong>“traditional”numerals:<br />

◮Card<strong>in</strong>alnumerals(num)-aclassonitsown<br />

◮ haveafixednumber<br />

◮ <strong>in</strong>flect<strong>in</strong>case,gender,andaccomodability<br />

◮ complexmorpho-syntacticbehaviour<br />

◮Ord<strong>in</strong>alnumerals-behavemorphologicallyasadjectives<br />

◮ haveafixednumber<br />

◮ <strong>in</strong>flect<strong>in</strong>case,gender,andaccomodability<br />

Problem:howtodescribemulti-wordnumerals?<br />

-theirnumberis<strong>in</strong>f<strong>in</strong>ite<br />

-theirarespelledwithlettersordigits(dwudziestyvs.20.)<br />

+theirvocabularyissmall<br />

+therules<strong>of</strong>theircreationareveryregular


Ord<strong>in</strong>alnumerals-whatwewish<br />

◮Acanonicalformforeachnumeral:<br />

{dziesięcio-tysięczny,10-cio-tysięczny,10-tysięczny,10000.,10<br />

000.}⇒10000<br />

◮Acompleteannotation:10000:adj:sg:m1:nom,etc.(?)<br />

◮<strong>Morphological</strong>analysis:<br />

dziesięcio-tysięczny⇒10000:adj:sg:m1.m2.m3:nom<br />

◮<strong>Morphological</strong>generation:<br />

10000:adj:sg:m1:nom⇒ {dziesięcio-tysięczny,<br />

10-cio-tysięczny,10-tysięczny,10000.,10000.}


Graph-baseddescription:ord<strong>in</strong>alnumerals0-99(simplified)<br />

<br />

0<br />

LiczPorz1-9<br />

LiczPorz10-19<br />

LiczPorz20-99<br />

:adj<br />

Info<strong>in</strong>sidetheboxes:textualvariants<br />

Infoundertheboxes:canonicalforms


Sub-graph:LiczPorz1-9<br />

<br />

1<br />

<br />

2<br />

<br />

3<br />

<br />

4<br />

<br />

5<br />

<br />

< smy:adj:Case=$c;Gen=$g;Nb=$n;Deg=$d><br />

8<br />

<br />

9


Sub-graph:LiczPorz10-19<br />

<br />

10<br />

<br />

11<br />

<br />

12<br />

<br />

13<br />

<br />

14<br />

<br />

15<br />

<br />

16<br />

<br />

17<br />

<br />

18<br />

<br />

19


Sub-graph:LiczPorz20-99<br />

<br />

2<br />

<br />

3<br />

<br />

4<br />

<br />

5<br />

<br />

6<br />

0<br />

< ><br />

LiczPorz1-9<br />

<br />

7<br />

<br />

8<br />

<br />

9


Perspective:us<strong>in</strong>ggraphsfor“<strong>in</strong>flection”<strong>of</strong>compound<br />

numerals<strong>in</strong><strong>MULTIFLEX</strong><br />

ulica 11 Listopada 1918 roku<br />

$1 $2 $3 $4 $5 $6 $7 $8 $9<br />

lemma:ulica<br />

class:subst<br />

homonym:0<br />

Nb:sg<br />

Case:nom<br />

Gen:f<br />

lemma:11<br />

class:adj<br />

homonym:0<br />

Nb:sg<br />

Case:gen<br />

Gen:m3<br />

Deg:pos<br />

lemma:1918<br />

class:adj<br />

homonym:0<br />

Nb:sg<br />

Case:gen<br />

Gen:m3<br />

Deg:pos


“Inflectedforms”tobegenerated<br />

ulica11Listopada1918roku<br />

ulica11Listopada1918<br />

11Listopada1918roku<br />

ulicaJednastegoListopada1918roku<br />

ulica11-egoListopada1918roku<br />

ulica11ListopadaTysiącDziewięćsetOsiemnastegoroku<br />

?ulica11ListopadaOsiemnastegoroku<br />

etc.


Onestepfurther<br />

ulica 11Listopada1918roku<br />

$1 $2 $3<br />

lemma:ulica<br />

class:subst<br />

homonym:0<br />

Nb:sg<br />

Case:nom<br />

Gen:f<br />

lemma:11.11.1918<br />

class:subst?<br />

homonym:0<br />

Nb:sg<br />

Case:gen<br />

Gen:m3<br />

Graphsdescribepossibledatesandtheirvariants:<br />

11.11.1918<br />

11/11/1918<br />

11listopada1918<br />

11listopadaosiemnastegoroku<br />

jedenastylistopadaosiemnastegoroku<br />

etc.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!