Recent Advances in MULTIFLEX, a Morphological Generator of ...
Recent Advances in MULTIFLEX, a Morphological Generator of ...
Recent Advances in MULTIFLEX, a Morphological Generator of ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Recent</strong><strong>Advances</strong><strong>in</strong><strong>MULTIFLEX</strong>,a<br />
<strong>Morphological</strong><strong>Generator</strong><strong>of</strong>Multi-WordUnits<br />
AgataSavary<br />
November17,2008
Morfeusz/<strong>MULTIFLEX</strong>Platform<br />
◮Aim:description<strong>of</strong>morphologyandvariation<strong>of</strong><br />
compounds<br />
◮Informationonthelanguagelevel:classes,categoriesand<br />
values<strong>of</strong>theIPIPANtagset<br />
◮Generat<strong>in</strong>g<strong>in</strong>flectedforms<strong>of</strong>s<strong>in</strong>glewordswithMorfeusz<br />
◮Comb<strong>in</strong><strong>in</strong>g(byagraph)<strong>in</strong>flectedforms<strong>of</strong>s<strong>in</strong>glewordsto<br />
create<strong>in</strong>flectedforms<strong>of</strong>compounds<br />
◮Unificationandvalue<strong>in</strong>heritanceforacompactdescription
Example1:MariaSkłodowska-Curie<br />
MariaSkłodowska-Curie,MariiSkłodowskiej-Curie,...<br />
Skłodowska-Curie,Skłodowskiej-Curie,...<br />
MariaSkłodowska,MariiSkłodowskiej,...<br />
MariaCurie,MariiCurie,...<br />
Skłodowska,Skłodowskiej,...
Annotation<strong>of</strong>componentsand<strong>in</strong>flectiongraph<br />
Maria Skłodowska - Curie<br />
$1 $2 $3 $4 $5<br />
lemma:Maria<br />
class:subst<br />
homonym:0<br />
Nb:sg<br />
Case:nom<br />
Gen:f<br />
lemma:Skłodowska<br />
class:subst<br />
homonym:0<br />
Nb:sg<br />
Case:nom<br />
Gen:f<br />
<br />
Annotatedforms<br />
MariaSkłodowska-Curie MariaSkłodowska-Curie:subst:sg:nom:f<br />
MariiSkłodowskiej-Curie MariaSkłodowska-Curie:subst:sg:gen:f<br />
MariiSkłodowskiej-Curie MariaSkłodowska-Curie:subst:sg:dat:f<br />
Skłodowską-Curie MariaSkłodowska-Curie:subst:sg:<strong>in</strong>st:f<br />
Skłodowskiej MariaSkłodowska-Curie:subst:sg:loc:f
Example2:ulicaMariiSkłodowskiej-Curie<br />
ulicaMariiSkłodowskiej-Curie,ulicyMariiSkłodowskiej-Curie,<br />
...;<br />
ulicaMariiSkłodowskiej,ulicyMariiSkłodowskiej,...;<br />
ulicaMariiCurie,ulicyMariiCurie,...;<br />
ulicaSkłodowskiej-Curie,ulicySkłodowskiej-Curie,...;<br />
ulicaSkłodowskiej,ulicySkłodowskiej,...;<br />
MariiSkłodowskiej-Curie;<br />
MariiSkłodowskiej;<br />
MariiCurie;<br />
Skłodowskiej-Curie;<br />
Skłodowskiej
Flatdescription<strong>of</strong>variants:ulicaMariiSkłodowskiej-Curie<br />
ulica Marii Skłodowskiej - Curie<br />
$1 $2 $3 $4 $5 $6 $7<br />
lemma:ulica<br />
class:subst<br />
homonym:0<br />
Nb:sg<br />
Case:nom<br />
Gen:f<br />
<br />
Newsolution:embeddeddescription<strong>of</strong>ulicaMarii<br />
Skłodowskiej-Curie<br />
ulica MariiSkłodowskiej-Curie<br />
$1 $2 $3<br />
lemma:ulica<br />
class:subst<br />
homonym:0<br />
Nb:sg<br />
Case:nom<br />
Gen:f<br />
lemma:MariaSkłodowska-Curie<br />
class:subst<br />
homonym:0<br />
Nb:sg<br />
Case:gen<br />
Gen:f<br />
<br />
Morphology<strong>of</strong>numerals<strong>in</strong>theIPIPANtagset<br />
Twok<strong>in</strong>ds<strong>of</strong>“traditional”numerals:<br />
◮Card<strong>in</strong>alnumerals(num)-aclassonitsown<br />
◮ haveafixednumber<br />
◮ <strong>in</strong>flect<strong>in</strong>case,gender,andaccomodability<br />
◮ complexmorpho-syntacticbehaviour<br />
◮Ord<strong>in</strong>alnumerals-behavemorphologicallyasadjectives<br />
◮ haveafixednumber<br />
◮ <strong>in</strong>flect<strong>in</strong>case,gender,andaccomodability<br />
Problem:howtodescribemulti-wordnumerals?<br />
-theirnumberis<strong>in</strong>f<strong>in</strong>ite<br />
-theirarespelledwithlettersordigits(dwudziestyvs.20.)<br />
+theirvocabularyissmall<br />
+therules<strong>of</strong>theircreationareveryregular
Ord<strong>in</strong>alnumerals-whatwewish<br />
◮Acanonicalformforeachnumeral:<br />
{dziesięcio-tysięczny,10-cio-tysięczny,10-tysięczny,10000.,10<br />
000.}⇒10000<br />
◮Acompleteannotation:10000:adj:sg:m1:nom,etc.(?)<br />
◮<strong>Morphological</strong>analysis:<br />
dziesięcio-tysięczny⇒10000:adj:sg:m1.m2.m3:nom<br />
◮<strong>Morphological</strong>generation:<br />
10000:adj:sg:m1:nom⇒ {dziesięcio-tysięczny,<br />
10-cio-tysięczny,10-tysięczny,10000.,10000.}
Graph-baseddescription:ord<strong>in</strong>alnumerals0-99(simplified)<br />
<br />
0<br />
LiczPorz1-9<br />
LiczPorz10-19<br />
LiczPorz20-99<br />
:adj<br />
Info<strong>in</strong>sidetheboxes:textualvariants<br />
Infoundertheboxes:canonicalforms
Sub-graph:LiczPorz1-9<br />
<br />
1<br />
<br />
2<br />
<br />
3<br />
<br />
4<br />
<br />
5<br />
<br />
< smy:adj:Case=$c;Gen=$g;Nb=$n;Deg=$d><br />
8<br />
<br />
9
Sub-graph:LiczPorz10-19<br />
<br />
10<br />
<br />
11<br />
<br />
12<br />
<br />
13<br />
<br />
14<br />
<br />
15<br />
<br />
16<br />
<br />
17<br />
<br />
18<br />
<br />
19
Sub-graph:LiczPorz20-99<br />
<br />
2<br />
<br />
3<br />
<br />
4<br />
<br />
5<br />
<br />
6<br />
0<br />
< ><br />
LiczPorz1-9<br />
<br />
7<br />
<br />
8<br />
<br />
9
Perspective:us<strong>in</strong>ggraphsfor“<strong>in</strong>flection”<strong>of</strong>compound<br />
numerals<strong>in</strong><strong>MULTIFLEX</strong><br />
ulica 11 Listopada 1918 roku<br />
$1 $2 $3 $4 $5 $6 $7 $8 $9<br />
lemma:ulica<br />
class:subst<br />
homonym:0<br />
Nb:sg<br />
Case:nom<br />
Gen:f<br />
lemma:11<br />
class:adj<br />
homonym:0<br />
Nb:sg<br />
Case:gen<br />
Gen:m3<br />
Deg:pos<br />
lemma:1918<br />
class:adj<br />
homonym:0<br />
Nb:sg<br />
Case:gen<br />
Gen:m3<br />
Deg:pos
“Inflectedforms”tobegenerated<br />
ulica11Listopada1918roku<br />
ulica11Listopada1918<br />
11Listopada1918roku<br />
ulicaJednastegoListopada1918roku<br />
ulica11-egoListopada1918roku<br />
ulica11ListopadaTysiącDziewięćsetOsiemnastegoroku<br />
?ulica11ListopadaOsiemnastegoroku<br />
etc.
Onestepfurther<br />
ulica 11Listopada1918roku<br />
$1 $2 $3<br />
lemma:ulica<br />
class:subst<br />
homonym:0<br />
Nb:sg<br />
Case:nom<br />
Gen:f<br />
lemma:11.11.1918<br />
class:subst?<br />
homonym:0<br />
Nb:sg<br />
Case:gen<br />
Gen:m3<br />
Graphsdescribepossibledatesandtheirvariants:<br />
11.11.1918<br />
11/11/1918<br />
11listopada1918<br />
11listopadaosiemnastegoroku<br />
jedenastylistopadaosiemnastegoroku<br />
etc.