23.07.2013 Views

všechny slajdy

všechny slajdy

všechny slajdy

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Sémantické sítě Sémantické sítě<br />

Úvod do počítačové lingvistiky 10/11 21 / 27<br />

Reprezentace slovesn´ych valencí České valenční lexikony<br />

České valenční lexikony<br />

zdroje (lexikony) slovesn´ych valencí:<br />

◮ syntaktické valenční rámce Brief (FI MU, od 1997) cca 15,000 sloves:<br />

lámat hPTc4,hPTc4-hTc7,hPc3-hTc4<br />

◮ valenční rámce v českém wordnetu (FI MU 2000), cca 3,000<br />

slovesn´ych literál˚u (sloveso+v´yznam):<br />

synset: lámat:3, dob´yvat:1, těˇzit:2<br />

valence: kdo1*AG(person:1)=co4*SUBS(substance:1)<br />

valence: co1*AG(institution:1)=co4*SUBS(substance:1)<br />

◮ praˇzsk´y lexikon Vallex 1.0, na začátku roku 2005 cca 1,000 sloves<br />

(ted’ snad aˇz 4,000):<br />

~ impf: lámat<br />

+ ACT(1;obl) PAT(4;obl)<br />

Úvod do počítačové lingvistiky 10/11 23 / 27<br />

Sémantické sítě Sémantické sítě<br />

Úvod do počítačové lingvistiky 10/11 22 / 27<br />

Reprezentace slovesn´ych valencí Valeční lexikon VerbaLex<br />

Valeční lexikon VerbaLex<br />

◮ vznikl na začátku roku 2005, vyuˇzívá vˇsech dostupn´ych zdroj˚u<br />

aktuálně se do něj doplňují slovesa z Briefu<br />

◮ edituje se v jednoduchém textovém formátu, kter´y se pro dalˇsí<br />

zpracování pˇrevádí do XML<br />

◮ vlastnosti:<br />

• dvouúrovňové sémantické role<br />

• odkazy na hypero/hyponymickou hierarchii v českém wordnetu<br />

• odliˇsení ˇzivotnosti a neˇzivotnosti větn´ych člen˚u<br />

• implicitní pozice slovesa<br />

• valenční rámce se odkazují na číslované v´yznamy sloves<br />

◮ exporty z XML do HTML pro prohlíˇzení a PDF pro tisk<br />

Úvod do počítačové lingvistiky 10/11 24 / 27

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!