12.02.2014 Views

A MAGYAR TUDOMÁNYOS AKADÉMIA ... - MTA Sztaki

A MAGYAR TUDOMÁNYOS AKADÉMIA ... - MTA Sztaki

A MAGYAR TUDOMÁNYOS AKADÉMIA ... - MTA Sztaki

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

kommunikációs protokollok és egy, az adott területre jellemző közös fogalmi rendszer –<br />

ún. számítógépes ontológia – kidolgozásához.<br />

– LiWA: Enrichment tools for Web archive (FP7, 2008–2010)<br />

A projekt célja a Web tartalom archiválását „élővé” tenni. A Web tartalom hosszú távú<br />

megőrzése szolgálhat például tudományos vagy piackutatási célokat, vagy dönthet szerzői<br />

jogvitában, stb. A tartalom megőrzése iránt növekvő igényt mutatnak mind a könyvtárak,<br />

mind az archiváló szervezetek, mind a kialakulóban levő piacorientált szolgáltatások. A<br />

Web tartalom bizonyos sajátosságai, gyors dinamikája, illékonysága, formátum és<br />

szolgáltatás variánsai nagy kihívást jelentenek a megőrzés, archiválás területén. A projekt<br />

keretében átlépik a „fagyasztott” pillanatkép megőrzésének kereteit, és a pillanatfelvételek<br />

megőrzésén túl olyan „élő” Web archívumot kívánnak létrehozni, amely<br />

1. hosszú távú interoperabilitást valósít meg az archívumok fejlődése mellett,<br />

2. tiszta minőségű, lényegtelen „zajtól” mentes információt tartalmaz,<br />

3. a formátumok széles választékát öleli fel.<br />

A LiWA projektben az <strong>MTA</strong> SZTAKI szerepe a Web spam szűréssel kapcsolatos<br />

részfeladat vezetése, és szövegbányászati feladatok elvégzésében is közreműködnek.<br />

Hozzájárulásukat a Web spam szűréssel, a képi és szöveges keresőrendszerekkel<br />

kapcsolatos kutatásaik alapozták meg. Európai szintű siker, hogy résztvevői az FP7<br />

Digital Libraries első felhívás 9 támogatást nyert STREP pályázata közül kettőnek.<br />

– i-TRACS: Intelligent Tracking System for Conter-Terrorism (FP6, 2007–2008)<br />

Az i-TRACS projekt célja, hogy egy fejlett, széleskörű adatforrásokat integráló<br />

nyomkövető rendszer fejlesztésével növelje az EU privát és állami intézményeinek<br />

versenyképességét a terror-elhárítás és belbiztonság területein. A projekt megvalósító<br />

konzorcium tagjai mind a technológia, mind a törvényi szabályozás, mind pedig a piacon<br />

elérhető eszközök ismeretével rendelkeznek. A projekt fő kihívása megtalálni az<br />

egyensúlyt a nyomkövetés és a személyes adatok és polgári szabadságjogok védelme<br />

között abból a célból, hogy egy társadalmilag elfogadott, hatékony szoftvertechnológia<br />

jöjjön létre. A projekt keretében olyan újszerű prototípus valósul meg, amely képessé teszi<br />

a megfelelő felhatalmazással bíró szervezetet arra, hogy gyanúsított személyek adatait<br />

összegyűjtsék, kapcsolatrendszerüket, mozgásukat nyomon kövessék, és előkészületben<br />

levő cselekményeik végrehajtását megakadályozzák. A SZTAKI szerepe a projekt<br />

megvalósítása során a rendszer tervezése, illetve olyan adatbányászati eszközök<br />

fejlesztése, amelyek az adatok teljes körének összegyűjtése nélkül, csak a gyanúsított<br />

személyekre vonatkozó lokális lekérdezésekkel képesek kapcsolati hálózatokat feltárni.<br />

– TEXTREND: Intelligens szövegbányász alkalmazásplatform (Jedlik 2008–2010)<br />

A pályázat két, egymásra épülő célja (1) az integrált TEXTrend Platform eszköztár és<br />

szolgáltatási bázis létrehozása, ill. (2) az eszköztár demonstrációs alkalmazásainak<br />

kidolgozása a gazdasági és szakpolitikai döntéshozatal különböző területein. A TEXTrend<br />

platform célja a weben található dinamikus és óriási mennyiségű információ mély<br />

elemzése valamely specifikus területen, mint például a tudomány vagy a gazdasági élet.<br />

Ez alatt az értendő, hogy szemben a szokásos kivonatolási vagy egyszerűen indexelési<br />

szolgáltatásokkal, a weben elérhető adathalmazból minőségileg új információt nyernek ki,<br />

aminek az előállítása egyenesen lehetetlen lenne pusztán emberi erőforrást felhasználva.<br />

Jó példa a trendek elemzése, ahol a cél az, hogy nagy mennyiségű dokumentumból<br />

(blogok, cikkek stb) meghatározzuk, sőt, megjósoljuk a közvélekedés vagy érdeklődés<br />

jellemzőit, vagy időbeli változását. Egy másik példa látens (pl. szociális) struktúrák<br />

felderítése és egy szempillantás alatt áttekinthetővé tétele automatikus szövegfeldolgozás,<br />

188

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!