A MAGYAR TUDOMÃNYOS AKADÃMIA ... - MTA Sztaki
A MAGYAR TUDOMÃNYOS AKADÃMIA ... - MTA Sztaki
A MAGYAR TUDOMÃNYOS AKADÃMIA ... - MTA Sztaki
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
SZTE MESTERSÉGES INTELLIGENCIA KUTATÓCSOPORT<br />
Vezető: Csirik János, az <strong>MTA</strong> doktora<br />
6720 Szeged, Aradi vértanúk tere 1.<br />
Telefon: (62) 544–126, Fax: (62) 425–508<br />
e-mail: csirik@inf.u-szeged.hu<br />
I. A kutatóhely fő feladatai a beszámolási évben<br />
A csoport a beszámolási évben alapvetően azokon a területeken folytatott kutatásokat, mint az<br />
előző ciklus befejezésekor. A fő hangsúly tehát továbbra is a gépi tanulási algoritmusokon és<br />
azok alkalmazásain volt. Az alkalmazások közül kiemelkedő szerepet kapott a<br />
nyelvtechnológia, mivel a csoport dolgozói bekapcsolódtak az SZTE Informatikai<br />
Tanszékcsoportja által elnyert nagy volumenű pályázatok feladatainak végrehajtásába.<br />
Emellett folytatódtak a beszédfelismerési kutatások, valamint a bioinformatika, az önszervező<br />
rendszerek és a gépi tanulás elmélete területén korábban megkezdett kutatási tevékenységek<br />
és együttműködések.<br />
II. Az év folyamán elért kiemelkedő kutatási és más jellegű eredmények,<br />
azok gazdasági-társadalmi haszna<br />
Természetes nyelvi feldolgozás. A nyelvfüggetlen névelemfelismerés témában a korábbi<br />
kutatásokat folytatva az intézet dolgozói olyan heurisztikákat fejlesztettek ki, amelyek webes<br />
statisztikák vagy online enciklopédiákban talált információk alapján képesek finomítani a<br />
névelemfelismerő rendszerek pontosságát. A 2006-os kutatások továbbfejlesztéseiről a<br />
Journal of American Medical Informatics Association lapban jelent meg cikkük az orvosi<br />
dokumentumok anonimizálása témakörben. A radiológiai leletek BNO-kódolása témakörében<br />
egy nemzetközi kutatás-fejlesztési versenyen vettek részt a csoport kutatói, ahol az általuk<br />
kifejlesztett modell a legjobb minősítést érte el (44 intézet közül). A témához kapcsolódó gépi<br />
tanulási kísérleteket a Languages in Biology and Medicine nemetközi szimpóziumon<br />
ismertették, melynek anyagát a BMC Bioinformatics lap 2008-as közlésre elfogadta. A<br />
névelemek metonimikus használatának felismerése témában a csoport kutatói indultak egy, az<br />
Association of Computational Linguistics által kiírt nyílt kutatás-fejlesztési versenyen, és<br />
5 résztvevő közül az első helyen végeztek. A Magyar WordNet projekt – amely a csoport<br />
koordinációja alatt zajlott – 2007 tavaszán zárult. Eredményeként létrejött a EuroWordNet<br />
szabványt követő magyar ontológia, illetve letették az alapjait a későbbi magyar nyelvű<br />
jelentés-egyértelműsítési kutatásoknak. A magyar-angol gépi fordítórendszer előállítását célzó<br />
projekt keretében a konzorcium elkészítette a fordítórendszer architektúráját és meghatározta<br />
a nyelvtan építésének folyamatát, melynek során a nyelvi szabályok, a névszói szerkezetek és<br />
az igei vonzatkeretek beépültek a fordítóprogram központi rendszerébe. A fordítóprogramra<br />
három alkalmazás épült: egy példamondat-fordító, egy képernyőre írt szöveg megértését<br />
támogató program, és egy sablonkitöltő fordító, melyek elérhetők a www.webforditas.hu<br />
oldalon. A csoport kutatói bekapcsolódtak továbbá egy pszichológiai célú szövegelemzést<br />
kitűző projektbe, melynek célja a nemzeti és etnikai identitás vizsgálata történelmi<br />
eseményekre vonatkozó szövegek narratív alakzatainak számítógépes tartalomelemzése<br />
révén. A csoport dolgozói a kutatást egy szemantikai jegyekkel annotált főnévi adatbázis<br />
létrehozásával támogatták. Az eredményeket 11 fős kutatói team érte el, amelyből 5 fő<br />
dolgozott a kutatócsoportban. A becsült intézeti ráfordítás 9 M Ft volt, továbbá 12,5 M Ft<br />
pályázati forrásból. A projektek ipari partnerek részvételével futnak, így gazdasági<br />
hasznosulásuk bizonyosra vehető.<br />
318