15.02.2014 Views

Kompletný zborník vo formáte PDF - Jazykovedný ústav Ľudovíta ...

Kompletný zborník vo formáte PDF - Jazykovedný ústav Ľudovíta ...

Kompletný zborník vo formáte PDF - Jazykovedný ústav Ľudovíta ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Z algoritmov dolovania v textoch boli použité klasifikačné aj zhlukovacie algoritmy,<br />

výstupné modely boli reprezentované v jazyku PMML. Metódy na vyhodnotenie<br />

kvality a úspešnosti klasifikácie a zhlukovania poskytla tiež knižnica<br />

Jbowl, vizualizáciu výsledkov a ich následné využitie zabezpečoval samotný<br />

systém GridMiner. Riešiteľmi projektu GridMiner boli Technická univerzita<br />

Viedeň a Technická univerzita Košice.<br />

V oblasti elektronickej verejnej správy (e-Government) sa v rámci 5. rámcového<br />

programu EÚ realizoval projekt Webocracy 4 , ktorého výsledkom bol systém<br />

Webocrat – webovská aplikácia pre podporu participácie občanov v demokratických<br />

procesoch. Knižnica Jbowl bola v systéme Webocrat použitá na podporu<br />

inteligentného vyhľadávania informácií, a to predovšetkým na predspracovanie<br />

a jazykovú analýzu dokumentov a ich následnú indexáciu, t<strong>vo</strong>rbu vektorovej reprezentácie<br />

dokumentov a na dolovanie v textoch (obrázok 3).<br />

ontológia<br />

analýza<br />

dokumentov<br />

indexácia<br />

dolovanie v textoch<br />

(text mining)<br />

vektorová<br />

reprezentácia<br />

fulltextové<br />

vyhľadávanie<br />

inteligentné<br />

vyhľadávanie<br />

Jbowl knižnica<br />

Špecifická funkcionalita systému Webocrat<br />

Obrázok 3. Aplikácia knižnice Jbowl v systéme Webocrat.<br />

V systéme Webocrat boli testované tri rôzne prístupy dolovania znalostí<br />

z textov (Paralič – Bednár, 2003). Pri t<strong>vo</strong>rbe a budovaní ontológií sa využilo<br />

zhlukovanie textov pomocou asociačných pravidiel. Následne sa pre identifikáciu<br />

asociačných vzťahov medzi textami a ontológiou uplatnili algoritmy kategorizácie<br />

textov. Podpora semi-automatickej anotácie textov pojmami znalostného<br />

modelu je azda najdôležitejšou ukážkou komplexného využitia funkcionality<br />

ponúkanej knižnicou Jbowl. Napokon sa index a vektorová reprezentácia<br />

dokumentov využili aj pri fulltexto<strong>vo</strong>m vyhľadávaní, integrovanom do konceptuálneho<br />

vyhľadávania podľa asociovaných pojmov ontológie.<br />

4<br />

http://www.webocrat.sk<br />

129

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!