12.02.2014 Views

A MAGYAR TUDOMÁNYOS AKADÉMIA ... - MTA Sztaki

A MAGYAR TUDOMÁNYOS AKADÉMIA ... - MTA Sztaki

A MAGYAR TUDOMÁNYOS AKADÉMIA ... - MTA Sztaki

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

SZTE MESTERSÉGES INTELLIGENCIA KUTATÓCSOPORT<br />

Vezető: Csirik János, az <strong>MTA</strong> doktora<br />

6720 Szeged, Aradi vértanúk tere 1.<br />

Telefon: (62) 544–126, Fax: (62) 425–508<br />

e-mail: csirik@inf.u-szeged.hu<br />

I. A kutatóhely fő feladatai a beszámolási évben<br />

A csoport a beszámolási évben alapvetően azokon a területeken folytatott kutatásokat, mint az<br />

előző ciklus befejezésekor. A fő hangsúly tehát továbbra is a gépi tanulási algoritmusokon és<br />

azok alkalmazásain volt. Az alkalmazások közül kiemelkedő szerepet kapott a<br />

nyelvtechnológia, mivel a csoport dolgozói bekapcsolódtak az SZTE Informatikai<br />

Tanszékcsoportja által elnyert nagy volumenű pályázatok feladatainak végrehajtásába.<br />

Emellett folytatódtak a beszédfelismerési kutatások, valamint a bioinformatika, az önszervező<br />

rendszerek és a gépi tanulás elmélete területén korábban megkezdett kutatási tevékenységek<br />

és együttműködések.<br />

II. Az év folyamán elért kiemelkedő kutatási és más jellegű eredmények,<br />

azok gazdasági-társadalmi haszna<br />

Természetes nyelvi feldolgozás. A nyelvfüggetlen névelemfelismerés témában a korábbi<br />

kutatásokat folytatva az intézet dolgozói olyan heurisztikákat fejlesztettek ki, amelyek webes<br />

statisztikák vagy online enciklopédiákban talált információk alapján képesek finomítani a<br />

névelemfelismerő rendszerek pontosságát. A 2006-os kutatások továbbfejlesztéseiről a<br />

Journal of American Medical Informatics Association lapban jelent meg cikkük az orvosi<br />

dokumentumok anonimizálása témakörben. A radiológiai leletek BNO-kódolása témakörében<br />

egy nemzetközi kutatás-fejlesztési versenyen vettek részt a csoport kutatói, ahol az általuk<br />

kifejlesztett modell a legjobb minősítést érte el (44 intézet közül). A témához kapcsolódó gépi<br />

tanulási kísérleteket a Languages in Biology and Medicine nemetközi szimpóziumon<br />

ismertették, melynek anyagát a BMC Bioinformatics lap 2008-as közlésre elfogadta. A<br />

névelemek metonimikus használatának felismerése témában a csoport kutatói indultak egy, az<br />

Association of Computational Linguistics által kiírt nyílt kutatás-fejlesztési versenyen, és<br />

5 résztvevő közül az első helyen végeztek. A Magyar WordNet projekt – amely a csoport<br />

koordinációja alatt zajlott – 2007 tavaszán zárult. Eredményeként létrejött a EuroWordNet<br />

szabványt követő magyar ontológia, illetve letették az alapjait a későbbi magyar nyelvű<br />

jelentés-egyértelműsítési kutatásoknak. A magyar-angol gépi fordítórendszer előállítását célzó<br />

projekt keretében a konzorcium elkészítette a fordítórendszer architektúráját és meghatározta<br />

a nyelvtan építésének folyamatát, melynek során a nyelvi szabályok, a névszói szerkezetek és<br />

az igei vonzatkeretek beépültek a fordítóprogram központi rendszerébe. A fordítóprogramra<br />

három alkalmazás épült: egy példamondat-fordító, egy képernyőre írt szöveg megértését<br />

támogató program, és egy sablonkitöltő fordító, melyek elérhetők a www.webforditas.hu<br />

oldalon. A csoport kutatói bekapcsolódtak továbbá egy pszichológiai célú szövegelemzést<br />

kitűző projektbe, melynek célja a nemzeti és etnikai identitás vizsgálata történelmi<br />

eseményekre vonatkozó szövegek narratív alakzatainak számítógépes tartalomelemzése<br />

révén. A csoport dolgozói a kutatást egy szemantikai jegyekkel annotált főnévi adatbázis<br />

létrehozásával támogatták. Az eredményeket 11 fős kutatói team érte el, amelyből 5 fő<br />

dolgozott a kutatócsoportban. A becsült intézeti ráfordítás 9 M Ft volt, továbbá 12,5 M Ft<br />

pályázati forrásból. A projektek ipari partnerek részvételével futnak, így gazdasági<br />

hasznosulásuk bizonyosra vehető.<br />

318

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!