MOKYMO KURSAS INFORMACINIS RAŠTINGUMAS ... - LiDA

EUROPOS SĄJUNGA 

Europos socialinis fondas 

KURKIME ATEITĮ DRAUGE! 

Projektas 

“Empirinių duomenų ir informacijos HSM tyrimams kaupimas ir valdymas : Lietuvos HSM 

duomenų archyvas (LiDA)” 

SFMIS Nr. BPD2004-ESF-2.5.0-03-05/0042 

MOKYMO KURSAS 

INFORMACINIS RAŠTINGUMAS DUOMENŲ ARCHYVO 

VARTOJIMUI 

KAUNAS, 2008

Autorė: Marija Prokopčik 

Autorė dėkoja kolegėms Jūratei Kuprienei ir dr. Reginai Varnienei už pagalbą 

rengiant mokomąją medžiagą 

2

Turinys 

ĮVADAS .............................................................................................................................................................................. 4 

1. NATŪRALIŲ IR KONTROLIUOJAMŲ KALBŲ SAMPRATA, JŲ PRIVALUMAI, TRŪKUMAI IR 

GALIMYBĖS INFORMACIJOS TVARKYBOS IR IEŠKOS POŽIŪRIU ................................................................ 5 

NATŪRALIŲ IR KONTROLIUOJAMŲ KALBŲ SAMPRATA ....................................................................................................... 5 

NATŪRALIŲ KALBŲ TRŪKUMAI INFORMACIJOS TVARKYBOS IR IEŠKOS POŽIŪRIU ........................................................... 6 

REIKALAVIMAI IPK IR JŲ REALIZAVIMO PRIEMONĖS .......................................................................................................... 8 

KONTROLIUOJAMOS (DIRBTINĖS) KALBOS ......................................................................................................................... 9 

SVARBIAUSIOS DOKUMENTŲ KLASIFIKACIJOS ................................................................................................................... 10 

2. DALYKINĖ TEMINĖ DOKUMENTŲ ANALIZĖ IR INDEKSAVIMO PROCESAS ........................................ 18 

3. KONTROLIUOJAMI ŽODYNAI. TEZAURAI, KAIP LEKSIKOGRAFINĖS KONTROLĖS UŽTIKRINIMO 

PRIEMONĖ ..................................................................................................................................................................... 26 

TEZAURAI, JŲ PASKIRTIS IR FUNKCIJOS ............................................................................................................................. 26 

TEZAURŲ STRUKTŪRA IR FIKSUOJAMI SANTYKIAI ........................................................................................................... 28 

TEZAURŲ RENGIMAS IR VERTINIMAS ................................................................................................................................ 30 

4. SVARBIAUSI HUMANITARINIŲ IR SOCIALINIO MOKSLŲ SRITIES TEZAURAI ................................... 32 

INFORMACIJOS TVARKYMUI IR PAIEŠKAI DUOMENŲ ARCHYVUOSE NAUDOJAMI HSM SRITIES TEZAURAI ................... 38 

LIDA TEZAURAS ................................................................................................................................................................ 41 

5. METADUOMENYS. METADUOMENŲ SCHEMOS IR ELEMENTŲ RINKINIAI. EMPIRINIŲ DUOMENŲ 

APRAŠYMO STANDARTAS IR JO TAIKYMAS ARCHYVO REIKMĖMS. ........................................................ 48 

LIDA IR LINGVISTINIS APRŪPINIMAS ................................................................................................................................. 48 

LIDA – ARCHYVAS ............................................................................................................................................................. 53 

METADUOMENYS ................................................................................................................................................................ 57 

DUBLIN CORE METADUOMENŲ INICIATYVA ....................................................................................................................... 60 

DDI ..................................................................................................................................................................................... 62 

LIDA METADUOMENŲ SĄSAJA SU BIBLIOTEKŲ KATALOGŲ ĮRAŠAIS .................................................................................. 63 

EMPIRINIŲ DUOMENŲ APRAŠYMO STANDARTAS IR JO TAIKYMAS ARCHYVO REIKMĖMS ................................................... 66 

LIDA PRIEIGA IR METADUOMENŲ PERŽIŪRA ..................................................................................................................... 69 

KITI ARCHYVAI IR DUOMENŲ RINKINIŲ PERŽIŪRA ........................................................................................................... 84 

NAUDOTOS LITERATŪROS IR ŠALTINIŲ SĄRAŠAS: ........................................................................................ 86 

SANTRUMPŲ SĄRAŠAS: ............................................................................................................................................. 89 

6. PRIEDAS. MOKYMO KURSO SKAIDRĖS 

3

Įvadas 

Duomenų tvarkymas ir jų paieška socialinės ir humanitarinės srities duomenų archyvuose 

reikalauja atitinkamų teorinių žinių ir praktinių įgūdžių. Lietuvos socialinių ir humanitarinių mokslų 

tyrinėtojai, kurie yra potencialūs LiDA kūrėjai ir naudotojai, neturi pakankamų šios srities žinių ir 

praktinių įgūdžių, neturi patirties naudojant tezaurų tipo kontroliuojamus žodynus, rengiant ir 

tvarkant metaduomenis. 

Mokymo kursas ,,Informacinis raštingumas duomenų archyvo vartojimui“ skirtas socialinių 

ir humanitarinių mokslų duomenų vartotojams – ekspertams, doktorantams, pedagogams, 

dėstytojams, mokslininkams ir kitiems.tyrėjams. Mokymų medžiagos rengimo tikslas yra suteikti 

teorinių žinių ir praktinių įgūdžių, būtinų HSM duomenų organizavimui ir jų paieškai; supažindinti 

su pagrindinėmis informacijos paieškos kalbomis, jų organizavimo būdais ir priemonėmis, HSM 

duomenų analize ir indeksavimo procesais, kontrolės žodynais, visų pirma, tezaurais ir 

svarbiausiomis metaduomenų schemomis; ugdyti gebėjimus naudotis archyvavimo reikmėms 

parengtu lietuvišku HSM tezauru ir empirinių duomenų aprašymo standartu. Mokymo kurso 

medžiagą sudaro šie skyriai: natūralių ir kontroliuojamų kalbų samprata, jų privalumai, trūkumai ir 

galimybės informacijos tvarkybos ir ieškos požiūriu; dalykinė teminė dokumentų analizė ir 

indeksavimo procesas; kontroliuojami žodynai :tezaurai, kaip leksikografinės kontrolės užtikrinimo 

priemonė; svarbiausi HSM srities tezaurai, HSM tezauro lietuvių kalba naudojimas archyvo 

reikmėms; metaduomenys, metaduomenų schemos ir elementų rinkiniai, empirinių duomenų 

aprašymo standartas ir jo taikymas archyvo reikmėms. 

Šiuose skyriuose medžiaga yra pristatoma nuosekliai derinant teorines žinias ir siekiant 

formuoti praktinius įgūdžius. Kiekviena tema pradedama nuo atitinkamos tematikos terminų 

pristatymo, apibrėžimų, medžiagos, kuri reikalinga aptariamos problematikos supratimui. Praktinėje 

dalyje pateikiami konkretūs pavyzdžiai, pristatomos analizuojamų priemonių rengimo ir taikymo 

galimybės organizuojant HSM informaciją archyve ir vykdant jos paiešką. 

4

1. Natūralių ir kontroliuojamų kalbų samprata, jų privalumai, trūkumai ir 

galimybės informacijos tvarkybos ir ieškos požiūriu 

Informacijos tvarkymas ir jos ieška siejama su informacijos organizavimu. Organizuodami 

informaciją, mes ją grupuojame, klasifikuojame, kategorizuojame, t.y. jungiame į klases, grupes, 

kategorijas. 

Informacija organizuojama tam, kad būtų galima surasti mus dominančius objektus, 

informaciją apie juos. Kitas svarbus informacijos organizavimo rezultatas – galimybė išsaugoti ją 

ateities kartoms. 

Mūsų objektas – informacija saugoma archyvuose, bibliotekose ar muziejuose, kitose 

panašiose talpyklose, t.y. kalbama apie informaciją, kuri užfiksuota tam tikrose laikmenose (o jeigu 

virtuali, tai tam tikru būdu apipavidalinta). Būtent šią informaciją – informacijos vienetus, 

informacijos paketus (angl. Information packages), - tai turbūt tiksliausias tinklalapio apibūdinimas, 

turime organizuoti taip, kad ją būtų kiek galint paprasčiau surasti. 

Informacijos vienetus galima organizuoti pagal formalius požymius – autorius, antraštę, 

ISBN ar ISSN numerį, leidimo, vietą, metus, formą. 

Kita galimybė - šių informacijos vienetų organizavimas pagal jų turinį – išskiriant temą, 

dalyką, objektą, t.y. atliekant jų intelektualaus turinio analizę. 

Kiekvieno informacijos vieneto dalykinė (teminė) analizė susijusi su jo intelektualiojo 

turinio nustatymu (apie ką yra informacijos vienetas, jo ,,apie-ybė” – angl. aboutness), atitinkamų 

,,apie-ybę” nusakančių sąvokų pasirinkimu – ,,įžodinimu” ir šių sąvokų išreiškimu konkrečios 

informacijos paieškos kalbos (toliau IPK) terminais. Natūralios kalbos (toliau NK) žodžiai tuo būdu 

išverčiami į IPK terminus. Bendriausiu atveju IPK gali būti dvejopos – linijinės hierarchinės 

struktūros IPK (nuo plačiausios prie siauriausios sąvokos – nuo bendro prie specifinio) – 

hierarchinės klasifikacijos ir žodinės abėcėlinės IPK, kur terminai (panašūs į NK žodžius) dėstomi 

abėcėlės seka. 

Natūralių ir kontroliuojamų kalbų samprata 

Akivaizdu, kad ne vienam kyla klausimas, kam reikalingos IPK, jeigu dabar paieška pagal 

dalyką tapo pagrindiniu informacijos radimo būdu ir ieškodami informacijos vartotojai masiškai 

naudoja NK. Kita vertus nors internete masiškai naudojama paieška pagal natūralios kalbos žodžius 

formuluojamus kaip reikšminiai žodžiai, didžiuliai nerelevančios informacijos kiekiai netenkina 

5

daugelio vartotojų. Akivaizdu, kad didėjant pasiekiamos informacijos kiekiui vien paieškos pagal 

RŽ nepakanka. Daugelis žodžių, o anglų kalboje, kurią taip dažnai naudojame informacijos paieškai, 

beveik visi turi daugiau negu vieną prasmę ar reikšmę, o šios dar po kelis niuansus. Daugelis žodžių 

gali būti daiktavardžiai, veiksmažodžiai, būdvardžiai, prieveiksmiai. Paieškos sistemos, kurios 

tariamai leidžia vartotojui naudoti ,,natūralią kalbą”, iki šiol nesugeba atskirti visų reikšmių ar 

kalbos dalių, ypač kai kalbama apie plačias universalias sistemas. Tam tikrų pasiekimų yra 

siauresnėse sistemose. 

Kita problema tai, kad autoriai, rašantys apie tuos pačius dalykus naudoja skirtingus žodžius 

jiems įvardinti, o tų pačių dalykų ieškantys žmonės neranda reikiamų žodžių jiems pavadinti. Yra 

atlikta daugybė tyrimų, skirtų indeksavimo nuoseklumo reiškiniui. Koks bebūtų tokių tyrimų tikslas 

ir rezultatai, visi jie parodė, kad tai pačiai sąvokai išreikšti žmonės dažnai pasirenka skirtingus 

žodžius, t.y. indeksavimui būdingas nenuoseklumas. 

Tokia situacija rodo, kad norint suderinti visus žodžius, kuriuos būtų galima naudoti sąvokai 

išreikšti ir parodyti visas įmanomas tam tikro žodžio reikšmes, reikalinga tam tikra dirbtinė struktūra 

– informacijos paieškos kalba, kuri paprastai naudojama kaip kontroliuojamas žodynas. 

IPK - dirbtinė kalba, skirta dokumentų ir užklausų turiniui išreikšti ir fiksuoti 

informacijos paieškos sistemoje (toliau IPS). 

Natūralių kalbų trūkumai informacijos tvarkybos ir ieškos požiūriu 

Natūrali kalba (kaip informacijos fiksavimo priemonė inf. tvarkymo ir ieškos požiūriu) 

turi trūkumų, kuriuos leidžia pašalinti arba apriboti IPK ir jų žodynų naudojimas. 

Pagrindinė trūkumų priežastis tai, kad NK turinys ir išraiškos priemonės nėra tapatūs: 

vienas turinys – kelios išraiškos formos. 

NK, viena vertus, būdingas - gausumas (įvairumas, perteklius), kita vertus, yra situacijų, 

kai NK priemonių nepakanka tam tikrai sąvokai išreikšti. 

Gausumas 

Sinonimai 

Sinonimai (gr. synonymos- bendravardis) – skirtingai skambantys, bet tą pačią arba artimą 

prasmę turintys žodžiai, žodžių formos, junginiai. Absoliučių sinonimų (kiškis – zuikis) nėra daug, 

tačiau daug diferencinių (kalbėti – byloti, kampas- kertė), dar daugiau žodžių tampa sinonimais tam 

tikrame kontekste. Taigi tekstų autoriai turi galimybę rinktis įvairius žodžius, žodžių junginius tai 

6

pačiai sąvokai išreikšti. Todėl rengiant kontroliuojamus žodynus taip svarbu nustatyti visus 

sinonimus ir apjungti juos po vienu pavadinimu. Ar ,,drabužiai”, ,,drapanos”, ,,apdaras”, ,,apranga” 

reiškia tą patį dalyką? Jeigu ne tą patį, ar jų skirtumai tokie ryškūs, kad kiekvieną jų būtų galima 

laikyti atskiru leksiniu vienetu? Svarbu nustatyti ir tą, kuris geriausiai žinomas numatomam 

vartotojui. Kita vertus toks pasirinkimas paprastai priklauso nuo rengėjo. 

Žodžių formos 

Vystantis kalbai terminai, kuriuos žymi keli žodžiai, susilieja į vieną (pvz., on line; on-line; 

online). Kartais gali būti naudojamos visos trys formos. Dar vienas žodžių formų įvairovės pvz., yra 

britų ir amerikiečių rašybos būdai (catalog ir catalogue, colour ir color). 

Prielinksniai gali iš esmės pakeisti žodžio reikšmę: lygybė – nelygybė, ginklavimasis ir 

nusiginklavimas. Paprastai kontroliuojamuose žodynuose nėra prasmės naudoti abi sąvokas, nes jos 

dažniausiai nagrinėjamos tik drauge. 

Svarbiausias žodžių formų skirtumas tai - vienaskaita ir daugiskaita. Taisyklės, kurią formą 

naudoti nėra. Paprastai laikoma, kad daugiskaita suponuoja platesnę sąvokos apimtį (pvz., geriau 

knygos, o ne knyga), kita vertus, daugiskaita ir vienaskaita gali turėti skirtingas reikšmes (menas ir 

menai) 

Santrumpos ir akronimai 

Santrumpos ir akronimai tradiciškai yra iššifruojami arba ne priklausomai nuo jų paplitimo, 

numatomų vartotojų ir jų žinių. Dėl globalus paieškos pobūdžio numatyti visus galimus vartotojus 

sudėtinga, todėl paprastai santrumpas ir akronimus reikėtų iššifruoti. Net visuotinai žinomas 

akronimas AIDS ispanų kalba yra SIDA. 

Tikslūs (specifiški) ir bendrieji terminai 

Tai pačiai sąvokai išreikšti galime naudoti tikslius (adekvačius) terminus arba bendruosius 

(apibendrinančius). Pavyzdžiui, „Katės“ kabutės nelietuviškos yra ir kitose teksto vietose yra 

bendresnis terminas, negu „Kačių veislės“, ,,Kačių veislės” bendresnis negu „Siamo katės“, o 

,,Mėlynosios Siamo katės” – dar tikslesnis. Pvz., JAV Kongreso bibliotekos rubrikų sąraše (angl. 

Library of Congress Subject Headings) – tiksliausias terminas –-,,Siamo katės”, o mažesnėms 

viešosioms bibliotekoms skirtame Sears rubrikyne (angl. SEARS list of subject headings) – ,,Katės”, 

nors yra nuoroda, kad esant reikalui galima sukurti terminą konkrečiai kačių veislei. Lietuvos M. 

Mažvydo nacionalinės bibliotekos rubrikyne yra tik vienas terminas – ,,Katės”. 

7

Spendimą apie tikslumą lemia informacijos išteklių pobūdis ir apimtis, vartotojų tipas. Jeigu 

fondas universalus – pakanka termino ,,Katės”, jeigu siauresnis – galima naudoti tikslesnį terminą. 

Visuotinai paplitę /populiarūs terminai ir specialūs terminai 

Kai sąvoką galima išreikšti specialiu ir techniniu terminu, žodyno rengėjai turi nuspręsti, kuri forma 

tinkamesnė. Paprastai specialistams skirtame žodyne bus naudojamas specialus terminas, pvz., 

navikas, neoplazma, o bendros paskirties žodyne bus taikomas paplitęs terminas, pvz. vėžys. Kita 

vertus, atsižvelgiant į tarptautinės autoritetinės kontrolės mastą, paieškos metu turėtų būti 

aktyvuojami abu šie terminai. Tokias galimybes užtikrina ontologijų naudojimas. 

Nepakankamumas 

Homografai 

Homografai tai – žodžiai, turintys vienodą formą, bet skirtingas reikšmes. (Merkurijus – 

planeta, romėnų dievas, automobilis; kasa – plaukų, bilietų, vienas iš žmogaus organų, vėžys – 

gyvūnas ir susirgimas). Kiekviename žodyne turi būti numatytas būdas, kaip atskirti skirtingas 

reikšmes. Galima naudoti pastabas arba homografo sinonimą kaip teiktiną terminą (atitiktinį). 

Vienas būdų, kaip elgtis su homografais yra taikyti pastabas (paaiškinimus). Pavyzdžiui: 

Merkurijus (planeta) 

Merkurijus (Romėnų dievas). 

Paaiškinimai naudojami ir tada, kai reikia parodyti skirtingą termino naudojimo kontekstą: 

Svetimavimas (actekų teisė) 

Svetimavimas (žydų teisė) 

Svetimavimas (zulusų teisė) 

Be to, pastabos padeda paaiškinti nežinomus žodžius. Pavyzdžiui: Zulusai (Pietų Afrikos 

gentis). 

Dirbtinės IPK turėtų eliminuoti arba bent sumažinti šiuos trūkumus. 

Reikalavimai IPK ir jų realizavimo priemonės 

IPK keliami tokie reikalavimai: 

8

• vienareikšmiškumas - viena sąvoka = vienas žodis (išraiškos būdas); Tuo būdu apribojama 

sinonimika, homonimija, NK daugiareikšmiškumas, kalba formalizuojama; 

• aiškus naudingų paieškai loginių santykių ir psichologinių asociacijų fiksavimas tarp IPK 

elementų; 

• atvirumas; - galima keisti, pildyti; 

• naudojimosi patogumas – mnemoniškumas, paprastumas, kompaktiškumas. 

Pagrindinė tokių reikalavimų realizavimo priemonė – atitinkamų IPK elementų ir 

žodyno struktūros pasirinkimas. 

Pagrindiniai IPK elementai; 

• leksiniai vienetai (žodžiai, kodai, indeksai, jų junginiai); 

• paradigminiai santykiai (baziniai, analitiniai) – prasmės (panašumo, skirtumo ir kt.) 

santykiai tarp LV, kurie nepriklauso nuo konteksto, o priklauso nuo paieškos poreikių; 

• sintagminiai santykiai (teksto, gramatiniai, sintaksės) – santykiai tarp LV vienoje paieškos 

charakteristikoje. Jie priklauso nuo konteksto ir gali keistis. 

Kontroliuojamos (dirbtinės) kalbos 

Yra daugybė IPK klasifikavimo kriterijų (IPK struktūros elementai, leksinių vienetų 

koordinavimas arba postkoordinavimas). Mūsų reikmėms pakanka išskirti jau minėtas dviejų 

rūšių IPK – linijinės hierarchinės struktūros IPK, hierarchinės klasifikacijos, (kai einama nuo 

plačiausios prie siauriausios sąvokos – nuo bendro prie specifinio) –arba ir žodinės abėcėlinės IPK, 

kur terminai (panašūs į NK žodžius) dėstomi abėcėlės seka. 

Linijinės hierarchinės struktūros IPK arba hierarchinės klasifikacijos 

Dokumentų arba bibliotekinės klasifikacijos tai – dokumentų (informacijos vienetų) 

skirstymo sistemos, kuriose kiekviena klasė kitų atžvilgiu turi nuolatinę vietą. Klasifikacijos gali 

būti natūralios ir dirbtinės. Natūralios yra paremtos esminiais objektų požymiais, pvz., dokumentų 

klasifikavimas pagal turinį. Dirbtinės klasifikacijos remiasi antraeiliais, neesminiais objektų 

požymiais, pvz., dokumentų klasifikacija pagal dydį arba abėcėliškai pagal autorius, antraštes. 

Paprastai jos atlieka pagalbinį vaidmenį. 

9

Dokumentų arba bibliotekinis bibliografinis klasifikavimas yra tiesiogiai susijęs su mokslo 

klasifikavimu: jis yra antrinis mokslo klasifikavimo atžvilgiu ir nuo jo priklauso arba juo remiasi. 

Svarbiausios dokumentų klasifikacijos 

Melvilio Djuji (Melvil Dewey, 1851 -1931) dešimtainė klasifikacija (DDK) 

Pagrindinė DDK klasių eilė 

000 Generalities Bendrasis 

100 Philosophy & psychology Filosofija ir psichologija 

200 Religion Religija 

300 Social sciences Socialiniai mokslai 

400 Languages Kalbos/Filologija 

500 Natural sciences & mathematics Gamtos mokslai ir matematika 

600 Technology (Applied sciences) Technologija 

mokslai) 

(taikomieji 

700 The arts (Fine and decorative arts) Vaizduojamieji menai 

800 Literature & rhetoric Literatūra 

900 Geography & history Geografija ir istorija 

Sudarant indeksą, pirmasis trijų narių skaičiaus elementas rodo pagrindinę klasę, antrasis 

rodo skyrių, trečias - poskyrį: pvz. 600 Technologija, 610 Medicina, 620 Inžinerija, 630 Žemės ūkis; 

611 – žmogaus anatomija, 612 – žmogaus fiziologija. 

Šiuo metu DDK yra viena labiausiai naudojamų dokumentų klasifikacijų pasaulyje. 

DDK autorines teises turi OCLC (angl. Online computer library center). Leidžiamas pilnas 

ir sutrumpinti (iki 20.000 dokumentų fondui) lentelių variantai, popierine ir elektronine forma 

(WebDewey ir WebDeweyAbridged). 2003 m. išėjo 22 pilnas leidimas. Nuo 1994 m. leidžiamas CD 

Dewey for Windows, nauja medžiaga atsispindi adresu http://www.oclc.org/dewey. 

Universalioji dešimtainė klasifikacija (UDK) 

10

Ši klasifikacija plačiai naudojama Lietuvoje. UDK yra skirta visų žinijos sričių dokumentų 

klasifikavimui. Tai universali, daugiakalbė klasifikavimo sistema, kuri turi dešimtainę indeksaciją, 

hierarchinę skyrių struktūrą, yra sisteminė, t. y. remiasi mokslų sistematika. Tūkstančiai bibliotekų 

pasaulyje naudojasi UDK sisteminiam fondų sustatymui ir paieškai. Kompiuteriniuose kataloguose 

UDK naudojama kaip dalykinio naršymo ir paieškos priemonė. 

Pagrindinė klasių eilė: 

0 Bendrasis sykius 

1 Filosofija. Psichologija 

2 Religija. Teologija 

3 Visuomenės mokslai 

4 [laisvas nuo 1961 m.] 

5 Matematika. Gamtos mokslai 

6 Taikomieji mokslai. Medicina. Technika 

7 Menas. Fotografija. Žaidimai. Sportas 

8 Kalbotyra. Filologija. Grožinė literatūra. Literatūros mokslas 

9 Geografija. Biografijos. Istorija 

Klasės toliau skirstomos taikant dešimtainį principą. Einama nuo plačiausios (bendriausios) 

iki siauriausios (konkrečiausios) sąvokos: 

0 Bendrasis skyrius 

00 Įvadas. Žinių ir kultūros pagrindai 

004 Kompiuterija ir kompiuterinė technologija. Duomenų apdorojimas 

004.4 Programinė įranga 

004.42 Kompiuterio programavimas. Kompiuterinės programos 

004.422 Kompiuterinių programų sudėtinės dalys 

004.422.3 Kintamieji 

004.422.32 Kintamųjų rūšys 

004.422.324 Statinis ir dinaminis kintamasis 

UDK puikiai tinka kompiuterinėms sistemoms. Naudojami charakteringi ženklai leidžia 

atlikti paiešką pagal bet kurį elementą ar jų derinį ir užtikrina paieškos tikslumą. Skaitmeninių kodų 

ir natūralios kalbos aprašymų derinimas užtikrina dvejopo rūšiavimo, pagal numerius ir abėcėlę, 

galimybę (katalogams, autoritetiniams failams, rodyklėms tvarkyti). 

11

1995 metais Lietuvos nacionalinė M. Mažvydo biblioteka pasirašė MRF (angl. angl. Master 

Reference File) failo vertimo ir publikavimo licencijos sutartis su UDK Konsorciumu. Šios sutarties 

pagrindu rengiama lietuviška UDK bazė. 2001 m. UDK bazė integruota į bendrą Lietuvos 

nacionalinės M. Mažvydo bibliotekos LIBIS duomenų bazių struktūrą ir įgyvendinta šios 

bibliotekos kompiuterinio katalogo bibliografinių įrašų bei UDK duomenų bazių sąsaja. 

Žodinės abėcėlinės IPK 

Žodinės abėcėlinės IPK, tai tokios informacijos tvarkybai ir paieškai skirtos kalbos, kurių 

leksiniai vienetai - NK žodžiai ar jų junginiai dėstomi abėcėlės seka. Žodinės abėcėlinės IPK 

abėcėlinės dalykų klasifikacijos ir deskriptorinės kalbos. Žodinės abėcėlinės IPK fiksuojamos 

kontroliuojamuose žodynuose: rubrikynuose, tezauruose ontologijose. 

Abėcėlinės dalykinės IPK 

Dalykinimo esmė - dokumento turinys išreiškiamas tipiniais žodžiais - dalykinėmis 

rubrikomis. IPK žodyne (rubrikyne) rubrikos dėstomos abėcėlės seka. 

Dalykinė rubrika (toliau DR) - trumpa (formalizuota) dalyko žodinė išraiška. 

Atlikus konceptualiąją dokumento analizę ir nustačius reikiamas sąvokas, jos yra 

išreiškiamos, kaip dalykinė(ės) rubrika(os), t.y. natūralios kalbos žodžiai. Taigi dokumentas ,,Etika 

gyvenime ir versle: pažinimas ir taikymas” (Beržinskas, Gediminas 2002. - 286, [1] p.) bus 

indeksuojamas naudojant dalykines rubrikas: verslo etika, asmenybės moralė, protas, moralė ir 

politika, o ne indeksą 17 (UDK), Kita vertus, šie žodžiai rubrikoje yra pasirenkami ne laisvai, o 

naudojant specialų rubrikų sąrašą, žodyną ar vardyną. 

Dalykinant išskiriamas dalykas kaip toks, nesiejant jo su mokslo šaka. Dalyko vieta 

hierarchinėje struktūroje nerodoma. Dalykinant naudojami kontroliuojami žodynai - rubrikynai 

(rubrikų sąrašai, vardynai). 

Populiariausias ir plačiausiai pasaulyje naudojamas kontroliuojamas dalykinių rubrikų 

žodynas yra JAV Kongreso bibliotekos rubrikų sąrašas (angl. Library of Congress Subject Headings 

- LCSH). LCSH apima visą žiniją. Jis naudojamas visų tipų bibliotekose JAV ir kitose anglakalbėse 

pasaulio valstybėse. Bet kuri biblioteka gali teikti savo siūlymus dėl naujų rubrikų įtraukimo. Tokius 

siūlymus teikia apie 100 bibliotekų, jų tarpe ir Lietuvos nacionalinė M. Mažvydo biblioteka. Gauti 

siūlymai svarstomi kiekvieną savaitę. Kasmet įtraukiama apie 8.000 naujų rubrikų. 

12

Tradicinis LCSH įvaizdis – 5 storos raudonos knygos. 2007 m. išėjo 30 leidimas (280.000 

rubrikų ir nuorodų). Tai šios srities pasaulio standartas. Rubrikynas yra išverstas į kitas kalbas, 

naudojamas kaip pagrindas rengiant analogiškus kitų kalbų žodynus, pvz. lietuvių. 

Kitas unifikuoto standartinių dalykinių rubrikų sąrašo pavyzdys tai mažoms ir vidutinėms 

viešosioms ir mokyklų bibliotekoms skirtas Sears dalykinių rubrikų sąrašas (angl. Sears List of 

Subject Headings). Sears rubrikyne naudojami platesni terminai, mažiau yra specifinių, mokslininkų 

auditorijai skirtų terminų. Be to, čia yra mažiau skirsnių. 

LCSH SEARS 

BT Body covering (anatomy) 

Head 

RT Scalp 

NT Beards 

Bristles 

Eyerbrows 

Eyerlashes 

Gray hair 

Guard hair 

Hosehair 

Long hair 

Molting 

Mustaches 

Sale of human hair 

Whiskers 

Wigs 

Wool 

… 

Hair—Coloring 

USE Hair – Dyeing and bleaching 

… 

Hair dyes 

UF Dyes and dyeing – Hair 

Hair tints 

Tints, hair 

BT Hair preparations 

Use for general materials on hair as well as for 

materials on hairdressing and haircutting. 

UF Barbering 

Coiffure 

Haircutting 

Hairdressing 

Hairstyles 

Hairstyling 

BT Head 

Personal grooming 

NT Wigs 

Dalykinė rubrika ,,Plaukai“ (HAIR) iš LCSH ir SEARS rubrikynų 

Lietuvos Martyno Mažvydo bibliotekos rubrikynas yra kuriamas JAV Kongreso 

bibliotekos rubrikyno pagrindu. Tai reiškia, kad jame gali kuriamos naujos lietuviškos rubrikos 

(neturinčios angliškų analogų), bet tai turi būti daroma pagal LCSH sistemos taisykles. Rubrikyną 

kuria Lietuvos nacionalinė biblioteka kaip autoritetinę dalykų bazę UNIMARC formatu. Kitoms 

įstaigoms jis yra parduodamas. Įstaiga įsigijusi rubrikyną įsipareigoja jame nieko nekeisti. 

Rubrikyną dokumentų dalykinimui ir dalykinei paieškai elektroniniuose kataloguose naudoja visos 

13

Lietuvos bibliotekos, todėl jis žinomas vartotojui. Rubrikyne yra apie 150.000 įvairių mokslo sričių 

terminų. 

Dalykinė rubrika ,,Plaukai“ iš Lietuvos nacionalinės M. Mažvydo bibliotekos rubrikyno 

Deskriptorinės IPK 

Šios IPK yra paremtos koodinatinio indeksavimo metodu, kurio esmė yra tai, kad 

indeksuojama paties indeksuojamo teksto žodžiais. 

Indeksuojant, informacinio pranešimo turinys yra išreiškiamas aibe paprastas klases 

žyminčių NK žodžių, arba žodžių junginių, tarp kurių nėra linijinės priklausomybės. Jie žymi 

dokumento koordinates teminių dalykinių požymių erdvėje. Tai leidžia atspindėti bet kurį iš 

anksto nenumatytą dokumento temos, dalyko aspektą. Pagal koordinates atliekama paieška. 

Koordinatinio indeksavimo požymis ir esmė - manipuliavimas paprastomis klasėmis ir 

loginių operatorių naudojimas. Loginiai operatoriai, dar vadinami Būlio operatoriais, jų 

autoriaus Dž. Būlio (George Boole, 1815-1864) garbei, leidžia iš paprastų klasių sudaryti 

sudėtingas. 

• sąjunga (ARBA, U) 

• sankirta (IR, ∩) 

• skirtumas (NE, /) 

14

Sudėtinių klasių susidarymą iš paprastų gerai iliustruoja Veno diagramos. Džono 

Venno (John Venn, 1834-1923) anglų matematiko ir filosofo diagramos skirtos rodyti loginius 

santykius tarp aibių. 

Loginių operatorių naudojimas leidžia iš nedidelio skaičiaus paprastų klasių sukurti 

daug ir įvairių sudėtinių klasių. 

Dar viena svarbi deskriptorinių IPK lyginant su kitomis kalbomis ypatybė yra tai, 

atliekant deskriptorinį indeksavimą yra indeksuojama sąvokomis. Tai leidžia ženkliai apriboti 

indeksavimo subjektyvumą. 

Deskriptorinių kalbų kontrolės priemonė yra tezauras. 

Ontologijos 

Ontologija - tam tikros srities bendrai naudojamų sąvokų/konceptų, esybių tipų, jų 

tarpusavio priklausomybių, sąryšių, aksiomų, dėsningumų ir kt. visumos formalus aprašas. 

Filosofijoje ontologija suteikia kriterijus, kurie leidžia išskirti įvairius objektų tipus 

(konkretūs ir abstraktūs, egzistuojantys ir ne, realūs ir idealūs, priklausomi ir ne) bei jų ryšius 

(santykius, priklausomybes ir pan.) Žodis ontologija pirmiausia yra filosofijos terminas, turintis 

prasmę būtiesar visos tikrovės teorija, naudojamas ir kaip sinonimas terminui metafizika. 

Maždaug nuo 1990 m. šis terminas pradėtas naudoti ir kompiuterijos, dirbtinio intelekto 

srityse, kalbant apie žinių bendrą naudojimą (angl. knowledge sharing), programinių agentų 

tarpusavio sąveiką, visuotinai pripažįstamų (angl. common sense) žinių atvaizdavimą, natūralios 

kalbos apdorojimą ir kt. 

Pagal paskirtį ontologijos skirstomos: 

• žinių vaizdavimo ontologijas; 

• bendrąsias ontologijas, visuotinai naudojamų sąvokų ontologijas; 

• aukščiausio lygio ontologijas, meta–ontologijas; 

• lingvistines ontologijas; 

• nagrinėjimo sričių ontologijas; ir kt. 

Viena iš plačiausiai žinomų ir naudojamų lingvistinių ontologijų yra WordNet 

(www.wordnet.com). 

15

WordNet® – 100.000 žodžių reikšmių sugrupuotų į 5 kategorijas: daiktavardžiai, 

veiksmažodžiai, būdvardžiai, prieveiksmini ir funkciniai žodžiai; jų reikšmės yra susietos 

įvairiais santykiais. 

• Sinonimai - tokios pačios arba labai artimos prasmės žodžiai, kurie gali vienas kitą pakeisti. 

Sinonimijos santykis toks pat kaip santykis USE tradiciniuose kontroliuojamuose 

žodynuose; 

• Koordinuoti terminai.Juos galima laikyti broliais ir seserimis. Jie kilę iš to paties termino. 

Tai toks pat santykis kaip tradicinio kontroliuojamo žodyno susijęs terminas ar asociacija; 

• Hipernimai -tai visų rūšinių elementų gimininiai terminai, pvz. terminas “šeima” yra 

hipernimas terminams ,,kalbų šeima”, ,,kreivių šeima”, ‚‘“globos namai”. Hipernimai 

panašūs į tradicinio kontroliuojamo žodyno santykį ,,platesnis/gimininis terminas”; 

• Hiponimai žymi klasės narius, pvz., ,,kreivių šeima” – termino ,,šeima” hiponimas. 

Hiponimai panašūs į tradicinio kontroliuojamo žodyno santykį ,,siauresnis/rūšinis 

terminas”); 

• Holonimai - tai visumos, kurios dalis yra meronimas pavadinimas. Holonimas tai 

pavadinimas visumos, kuri turi dalis (pvz., šeima turi narius: vaikai, tėvai, seserys ir pan.). 

Holonimai taip pat panašūs į ,,platesnio termino” santykį; 

• Meronimai - kažko sudedamosios dalys ar nariai, pvz., ,,sesuo” tai ,,šeimos” meronimas. 

Meronimai taip pat panašūs į ,,siauresnio termino” santykį); 

• Antonimai turi priešingą reikšmę. Pvz., ,,šaltas” ir ,,karštas” yra antonimai. Tradiciniuose 

kontroliuojamuose žodynuose jie paprastai nėra fiksuojami. 

Kiekvienas žodis gali būti priskirtas 5 kategorijoms ir gali turėti daugelį skirtingų reikšmių. 

Pvz., romance. 

Key: "S:" = Show Synset (semantic) relations, "W:" = Show Word (lexical) relations 

Noun 

• S: (n) love affair, romance (a relationship between two lovers) 

• S: (n) romanticism, romance (an exciting and mysterious quality (as of a heroic time or 

adventure)) 

• S: (n) Romance, Romance language, Latinian language (the group of languages derived 

from Latin) 

• S: (n) love story, romance (a story dealing with love) 

• S: (n) romance (a novel dealing with idealized events remote from everyday life) 

16

Verb 

• S: (v) woo, court, romance, solicit (make amorous advances towards) "John is courting 

Mary" 

• S: (v) romance (have a love affair with) 

• S: (v) chat up, flirt, dally, butterfly, coquet, coquette, romance, philander, mash (talk or 

behave amorously, without serious intentions) "The guys always try to chat up the new 

secretaries"; "My husband never flirts with other women" 

• S: (v) romance (tell romantic or exaggerated lies) "This author romanced his trip to an 

Adjective 

exotic country" 

• S: (adj) Romance, Latin (relating to languages derived from Latin) "Romance languages" 

Atliekant paiešką pagal reikšminius žodžius naudojant lingvistines ontologijas, pradžioje 

išduodami dokumentai, kurie tiksliai atitinka pateiktus terminus pvz., šeimos krizė. Jeigu rezultatas 

netenkina, sistema gali siūlyti kitus variantus, kaip antai:šeimynos krizė, namiškių krizė, namų krizė, 

giminės krizė, terminą ,,krizė” keisti terminu ,,kritinė situacija”, toliau galėtų eiti šeimos padėtis, 

šeimos situacija, santuokos krizė, poros krizė ir t.t. Tokiu būdu plati ontologija gali išplėsti 

pilnateksčių dokumentų paieškos pagal reikšminius žodžius galimybes. 

17

2. Dalykinė teminė dokumentų analizė ir indeksavimo procesas 

Tvarkant ir organizuojant informaciją, yra atliekama informacijos vienetų(dokumentų) 

dalykinė teminė analizė, kurios pagrindu jie yra indeksuojami, t. y. parengiama dokumento paieškos 

charakteristika arba metaduomenys. Informacijos vieneto tvarkybos rezultatas gali būti 

klasifikacijos indeksas, dalykinė rubrika, deskriptorių sąrašas. 

Indeksavimo procesą reglamentuoja ISO -5963-1985 E standartas Documentation – Methods 

for examining documents, determining their subjects and selecting indexing terms. 

Standarte nurodyta, kad indeksavimo procesą sudaro trys etapai, kurie praktikoje dažnai 

persidengia ir vyksta vienu metu: 

• dokumento analizė ir jo dalyko/temos nustatymas; 

• svarbiausių dalyką/temą apibūdinančių sąvokų išaiškinimas; 

• šių sąvokų išreiškimas indeksavimo kalbos terminais (konkrečios IPK leksiniais vienetais). 

Šiame etape natūralios kalbos žodžiai išverčiami į naudojamą IPK. 

Dalykinę (teminę) analizę visų pirma sudaro konceptualioji informacijos vieneto 

(dokumento) analizė. Konceptualioji analizė tai nustatymas, apie ką yra objekto intelektualusis 

turinys, arba koks tas objektas yra. 

Analizuojant apie ką yra informacijos vienetas, reikėtų siekti išsiaiškinti tris pagrindinius 

klausimus: 

• kas tai? 

• kam tai reikalinga/skirta? 

• apie ką tai? 

Atsakant į pirmą klausimą, reikėtų nurodyti kurią nors pagrindinių žinijos formų/kategorijų: 

istorija, filosofija, technika ir pan. 

Remiantis pirmuoju atsakymu, galima atsakyti į antrąjį: ar informacija skirta veterinarui, ar 

zoologui? 

Atsakant į trečią klausimą nurodoma tema. Kita vertus, dalykinėje analizėje reikia atsižvelgti 

į teksto pobūdį (struktūra ir laikmena) ir į dėstymo pobūdį (požiūris, rašymo stilius, auditorija, 

intelektinis lygis). 

Nustatyti apie ką yra informacijos vienetas nėra lengva. Ne visada ir ne kiekvienas 

informacijos vienetas turi aiškiai identifikuojamą ,,apie-ybę” (angl. aboutness). ,,Apie-ybė” gali 

turėti daugybę aspektų ir atsakant į klausimą apie ką tai dažnai tenka išvardyti ne vieną. 

18

Nors kai kurie informacijos vienetai atrodo turi lengvai įvardijamą dalyką, iš tikrųjų viskas 

nėra taip paprasta. Pvz. knyga ,,Sociologijos istorija” skirta sociologijai, bet tiksliau kalbant tai 

knyga apie sociologiją istorijos požiūriu, tačiau tai nėra knyga apie istoriją. Gali būti, kad kitu metu 

ar kitoje vietoje, šios knygos dalyku galėtų būti laikoma istorija. 

Kartais teigiama, kad nemažai sunkumų kyla ir atsakant į klausimą “Kam tai 

reikalinga/skirta?”. Pvz., jau minėta knyga ,,Sociologijos istorija” yra apie sociologiją, kuri 

pateikiama istorijos perspektyvoje. ,,Įvado į sociologiją” tema taip pat yra sociologija, bet abu šie 

šaltiniai yra labai skirtingi. Vartotojas, ieškantis ,,Įvado į sociologiją” nebus patenkintas gavęs 

,,Sociologijos istoriją”. Atsakydami į klausimą apie informacijos paskirtį, galime išvengti tokių 

nesusipratimų. 

Dar vienas svarbus aspektas nustatant dalyką yra kultūrinė aplinka ir išsilavinimas. 

Akivaizdu, kad Rytų ir Vakarų kultūrų atstovai daugelį dalykų mato ir vertina skirtingai. 

Konceptualiosios analizės rezultatas priklauso ir nuo taikomų metodų. 

Taikant tikslinį metodą siekiama nustatyti autoriaus tikslą ar sumanymą. Kai kurie autoriai 

nurodo savo kūrinių tikslinę paskirtį, tačiau dažnai tokios informacijos nėra, arba nurodomi net keli 

tikslai. Taikant pagrindinio dalyko metodą, bandoma nustatyti centrinį objektą, kuris iškyla virš 

likusios informacijos. Kita vertus, centrinio objekto išskyrimas priklauso nuo indeksuotojo ir kūrėjo 

požiūrio, asmeninės nuostatos ar suinteresuotumo. Net to paties asmens požiūris gali pasikeisti per 

kelias savaites. 

Objektyvumo metodas (beje dažniausiai naudojamas atliekant kompiuterinę konceptualiąją 

analizę) paremtas statistikos duomenimis apie dažniausiai naudojamus terminus. Deja, dažnai 

naudojamas terminas gali įvardinti foninius arba susijusius dalykus (pvz., knygoje apie Antrą 

pasaulinį karą bus nuolat minima Vokietija). Kita vertus, terminas tiksliai apibūdinantis, apie ką yra 

informacijos vienetas gali būti nė karto nepaminėtas. (pvz., knygoje apie kurio nors žinomo asmens 

politinę karjerą, toks žodis gali būti nepanaudotas). Taikant atrankos ir atmetimo vienybės metodą, 

ieškoma, kas jungia kūrinį į vieną visumą, suriša, kas buvo pasakyta (atranka) ir nepasakyta 

(atmetimas). Kita vertus, indeksuotojas turėtų būti objektyvus ir turėti pakankamai daug žinių apie 

objektą, kad pajėgtų nustatyti, kas buvo atmesta. 

Akivaizdu, kad vieno teisingo būdo nustatyti apie ką yra informacijos vienetas nėra. Galima 

naudoti vieną kurį ar visus minėtus metodus, tačiau pakeitus metodą gali pakisti ir rezultatas. Vienas 

ir tas pats asmuo gali gauti skirtingą rezultatą naudodamas skirtingus metodus, o keli asmenys 

naudojantys tą patį metodą taip pat gali gauti skirtingą rezultatą. 

19

Dar daugiau keblumų kelia netekstinės informacijos vienetų ,,apie-ybės” nustatytas. Šiuo 

atveju galima taikyti kelis konceptualiosios analizės lygius: 

• teminę aprėptį rodančių sąvokų ar jų grupių identifikavimas; 

• bendras apibūdinimas ir pavaizduotų objektų ar scenų išvardijimas; 

• su pavaizduotais objektais ar scenomis susijusios teminės ar ikonografinės reikšmės 

nustatymas ir interpretavimas. 

Tvarkant meno kūrinius lengviausia išvardinti objektus ir scenas. Be to, galima nustatyti 

dalykinę sąvoką (pvz., mūšio scenos pavaizdavimas) arba iš darbo antraštės nustatyti konkretų 

dalyką (pvz., Žalgirio mūšis). Daug sunkiau nustatyti muzikos kūrinių dalyką apibūdinančias 

sąvokas ar išvardinti, kas pavaizduota. Pakankamai paprasta nusakyti, kaip objektas atrodo, bet 

interpretavimo reikalingos teminės ar ikonografinės netekstinės informacijos vienetų 

identifikavimas reikalauja specialaus rengimo. 

ISO gairėse pažymima, kad atliekant dalykinę teminę informacijos vieneto analizę, nėra 

tikslingą skaityti visą dokumentą. Kita vertus, indeksuotojas turėtų užtikrinti, kad naudinga 

informacija nebus praleista. Todėl nurodomos pagrindinės dokumento dalys, kurioms reikia skirti 

ypatingą dėmesį: 

antraštė; santrauka; turinys; įvadas, pirmieji skyriai, paragrafai ir išvados; iliustracijos, diagramos, 

lentelės ir jų pavadinimai; pabraukti ir kt. išskirti žodžiai ir žodžių junginiai. 

Daugiausiai informacijos duoda antraštė ir santrauka, tačiau jos dažnai gali klaidinti, pvz., 

antraštė gali būti abstrakti, ji visada bus subjektyvi, o santraukos negalima laikyti pakankamu viso 

dokumento pakaitalu. Turinys padeda išaiškinti dalyką ar temą ir identifikuoti potėmes, aspektus. 

Turinys ypač svarbus tvarkant straipsnių rinkinius, konferencijų medžiagą ir pan. Įvade, pirmuose 

skyriuose ir išvadose autoriai ar sudarytojai pristato tikslus, paskirti, apibendrina pateiktą 

informaciją. Iliustracijos, lentelės, jų pavadinimai ypač svarbūs tokiose srityse kaip menas, nes 

padeda lengviau ir tiksliau nustatyti informacijos ,,apie-ybę”. 

Antrajame etape indeksuotojas nustato pagrindines išaiškinto dalyko sąvokas. Šiame etape 

dokumento dalykas formuluojamas natūralios kalbos žodžiais, frazėmis. 

Gairėse pabrėžiama, kad terminai, kuriuos pasirenka ar atmeta indeksuotojas priklauso nuo 

indeksavimo tikslo. Pasirenkant sąvokas būtina atsižvelgti į tai, ar jos gali būti naudingos 

potencialiems sistemos vartotojams. Kita vertus nereikia pamiršti, kad sistema gali naudotis ir kitų 

20

grupių vartotojai, taigi dokumento dalyko arba temos nereikėtų interpretuoti pernelyg siaurai, todėl 

sąvokų skaičiaus riboti nereikia. 

Pasirenkamų sąvokų pobūdis ir jų kiekis priklauso nuo pasirinkto indeksavimo išsamumo. 

Išsamumas tai - analizės metu nustatomų dalykų ir aspektų skaičius. Išsamumas gali būti dviejų 

lygių: gilusis ir apibendrinantis. Giliuoju indeksavimu siekiama išgauti visas pagrindines dokumente 

aptariamas sąvokas, temas ir potėmes. Apibendrinant apsiribojama svarbiausiais, bendraisiais 

dalykais. 

Bibliotekose knygų ir serialinių leidinių indeksavimas tradiciškai yra apibendrinančio lygio, 

giliau indeksuojami straipsniai, knygų skyriai. 

Indeksavimo išsamumas įtakoja paieškos pilnumą ir tikslumą. 

Pilnumas – a : (a + b) x 100 %, kur 

a - visi išduoti relevantūs dokumentai; 

b – visi neišduoti relevantūs dokumentai; 

Tikslumas - a : (a + c) x 100 %, kur 

a - visi išduoti relevantūs dokumentai; 

c – visi išduoti nerelevantūs dokumentai; 

Gilusis indeksavimas didina tikslumą, nes naudojami tikslesni ir specifiškesni terminai. 

Apibendrinimas paprastai didina pilnumą, nes paieškos terminai yra platesni. Apibendrinimas labai 

naudingas ir plačiai taikomas apčiuopiamų išteklių paieškai (knygų, CD, vaizdajuosčių, žurnalų ir 

pan.). 

Ieškant elektroninių išteklių (neapčiuopiamų), atsirandą naujų iššūkių. Ieškant tinkle, tam 

tikrą žodį turintis informacijos vienetas bus išduotas pagal analogišką paieškos žodį, net jeigu 

pastarasis neatspindi jo dalyko ar temos. Dėl tokio žodžių buvimu pagrįsto išdavimo kriterijaus 

ženkliai išauga pilnumas, bet sumažėja tikslumas. 

Kitas svarbus aspektas nustatant indeksavimo išsamumo lygį - ką laikyti analizės vienetu. 

Tradiciškai tai yra bibliotekos ar archyvo fonde saugomi ištekliai. Internete tokio analizės vieneto 

apibrėžimo nėra; tai gali būti elektroninis žurnalas, straipsnis, tinklalapis su visomis nuorodomis ir 

ryšiais, individualus tokio tinklalapio elementas. Neatsakius į šį klausimą, sudėtinga spręsti, koks 

indeksavimo išsamumo lygis gerintų paieškos rezultatus. 

Kitas antrojo indeksavimo etapo uždavinys: sąvokų identifikavimas arba atpažinimas 

21

Informacijos vienetų dalykais gali būti įvairių rūšių sąvokos. Tai gali būti temos arba 

dalykai; pavadinimai (asmenvardžiai, kolektyvų pavadinimai, geografiniai pavadinimai, kiti – 

pastatų, architektūrinių/archeologinių vietovių ir pan.); laikotarpiai, formos. 

Temos. Dauguma žmonių informacijos dalyko apibūdinimui pasirenka temą ar dalyką 

nusakantį terminą. Tema/dalykas gali būti konkreti ir abstrakti. Paprastai tai - pagrindinis 

dokumento dėmesio objektas, tai gali būti viso informacijos vieneto tema. 

Pavadinimai. Dokumento dalykas, ar kuris dalyko aspektas. Tai gali būti asmuo, kolektyvas 

ar institucija, teritorija, ar kita pavadinimą turinti esybė. 

Mes galime turėti dokumentą apie rašytoją, mokslininką, visuomenės veikėją; biblioteką, 

ministeriją, žvejybos įmonę. Dokumentas gali būti apie vietovę (Žemaitija), miestą (Vilnius). 

Ypatingą kategoriją sudaro konkrečių esybių pavadinimai (Rasų kapinės, Žaliasis tiltas, Paryžiaus 

panteonas). 

Laikotarpiai. Laikotarpiai tai - svarbus teminės dalykinės informacijos elementas. 

Laikotarpis konkretina ir (arba) susiaurina dalyko apimtį. Pvz., dokumente apie prieigą prie 

informacijos taikant kompiuterius 8 – ame dešimtmetyje nebus informacijos apie internetą. 

Laikotarpiams žymėti dažnai naudojami jų pavadinimai – Antrasis pasaulinis karas, Renesansas ir 

pan.. 

Forma. Galiausiai nustatoma informacijos vieneto ar jo dalies forma. Formos nustatymas 

nepakeičia dokumento temos arba dalyko, bet gali iš esmės pakeisti požiūrį į jį ar pristatymo būdą. 

Formą apibūdina tie terminai, kurie skirti konkrečių rūšių ar žanrų medžiagai apibūdinti. 

Nustatant informacijos vieneto formą, atsižvelgiama į: 

• fizines charakteristikas (vaizdajuostės, nuotraukos, žemėlapiai ir pan.); 

• konkretų juose esančių duomenų tipą (bibliografijos, klausimynai, statistika); 

• informacijos pateikimo būdą (dienoraščiai, apžvalgos, rodyklės); 

• stilių, paskirtį, tikslinę auditoriją (romanas, komiksas, vadovėlis). 

Formos ir dalyko atskyrimas šiuo metu ypač svarbus, nes vis daugiau tenka organizuoti 

netekstinės informacijos. Pvz., muzikoje formos identifikavimas visada buvo labai svarbus. Dabar 

vis daugiau yra ieškoma kitokių informacijos formų, pvz., piešinių, skaitmeninių žemėlapių, 

skulptūrų reprodukcijų. Atskiriant formą nuo turinio, lengviau kurti sistemas, leidžiančias ieškoti 

informacijos formų. Naujausios metaduomenų sistemos turi specialiai formai skirtas kategorijas, 

pvz., ,,Išteklių tipas” ir ,,Formatas” Dublin Core metaduomenų formato standarte. 

22

Trečiasis etapas - vertimas iš natūralios kalbos į konkrečią indeksavimo kalbą, t.y. 

konceptualiosios analizės rezultatų atvaizdavimas kataloguotojo, klasifikuotojo ar indeksuotojo 

naudojamos schemos (klasifikacijos, rubrikyno, tezauro) leksiniais vienetais. Tai reiškia, kad jeigu 

yra naudojama UDK, sąvoka turi patekti į tam tikrą dešimtainės hierarchinės struktūros vietą. Jeigu 

naudojamas rubrikynas ar tezauras, informacijos vieneto turinį reikia suformuluoti sakiniu, tada 

išskiriami svarbiausi šio sakinio terminai, kurių atitikmenys esantys kontroliuojamame žodyne 

naudojami sąvokoms išreikšti. Tuo būdu dalykinės analizės rezultatas gali būti klasifikacijos 

indeksas(ai), dalykinė(s) rubrika(os) ar deskriptorius(ių) sąrašas. Pvz. dokumento apie pašte 

dirbančių žmonių darbo užmokestį turinys gali būti išreikštas indeksu 656.8: 331.2 (UDK), 

deskriptoriais iš tezauro: Darbo užmokestis, paštas, darbuotojai arba DR iš LNB rubrikyno Paštas, 

tarnautojai, atlyginimas. 

Šiame etape svarbu atsižvelgti į tai, kad kontroliuojamame žodyne gali nebūti reikalingų 

leksinių vienetų. Tada indeksuotojas turėtų pasirinkti artimiausią pagal prasmę leksinį vienetą arba 

papildyti žodyną nauju terminu. 

Specialiai akcentuojama, kad konceptualiosios analizės neturėtų įtakoti žodynas. Pradžioje 

atliekama analizė, po to galvojama apie terminus. Negalima ignoruoti dalyko, aspekto, temos, nes 

manoma, kad nėra tinkamo termino jiems išreikšti. 

Konceptualiosios analizės objektas - idėjos (sąvokos), o ne terminai. Net jeigu indeksuotojo 

ir autoriaus terminai sutampa, gali skirtis jų prasmė. Čia praverčia klasifikavimo principų 

išmanymas, juk klasifikavimas prasideda nuo sąvokų nustatymo. 

Indeksuojant reikia atkreipti dėmesį į: specifinė indeksavimo problemą – nuoseklumą. 

Idealiu atveju dokumentui priskirti terminai (indeksai), jų skaičius ir išsamumo lygis neturi 

priklausyti nuo indeksuotojo. Taigi du indeksuotojai turėtų išskirti tą pačią ,,apie-ybę” ir išreikšti ją 

vienodais terminais iš kontroliuojamo žodyno. Tačiau praktiškai nuoseklumas yra sunkiai 

pasiekiamas. Nuoseklaus ,,apie-ybės” nustatymo sunkumus įrodo nemažai specialių tyrimų. Vienas 

tokių tyrimų parodė, kad objektui ar sąvokai buvo priskirti vidutiniškai 25,6 teminiai pavadinimai. 

Toks rezultatas rodo žmonių nesugebėjimą nustatyti tą pačią dokumento ,,apie-ybę” arba pasirinkti 

vienodus natūralios kalbos žodžius nustatytai ,,apie-ybei” išreikšti. Kita vertus indeksavimo 

nuoseklumas, o tuo pačiu ir nuspėjamumas yra vienas iš informacijos sistemų kokybės faktorių ir 

rodiklių. Šioje vietoje akivaizdi kontroliuojamo žodyno reikšmė: naudojant vienodus 

kontroliuojamus žodynus ir jų taikymo taisykles konceptualiosios analizės rezultatas bus išreikštas 

nuosekliais indeksais, dalykinėmis rubrikomis ar deskriptoriais. 

23

Nuoseklumui pasiekti indeksuotojas turi būti nešališkas, atsisakyti subjektyvumo nustatant 

sąvokas ir pasirenkant indeksavimo terminus, turėti indeksuojamų dokumentų srities žinių, palaikyti 

tiesioginį ryšį su vartotojais. Kadangi indeksavimo procesas yra susijęs su žmonių priimamais 

sprendimais, jis negali būti visiškai nešališkas ir indeksavimo nuoseklumo problema išlieka aktuali 

nepaisant visų standartizavimo pastangų. 

Indeksavimo kokybę įtakojantys faktoriai. ISO standarte nurodoma, kad indeksavimo kokybė 

priklauso nuo šių faktorių: 

• indeksuotojo kvalifikacija (profesionalumas) ir patirtis; 

• indeksavimo priemonių kokybė. 

Greta išskiriamas dar vienas kokybę įtakojantis faktorius. Tai - indeksavimo politika 

(išsamumas ir tikslumas). Indeksavimo politiką apibūdina iš anksto apibrėžtas indeksavimo 

išsamumas ir tikslumas. 

Terminų skaičius 

Dalykinių rubrikų ar deskriptorių priskiriamų vienam dokumentui skaičius priklauso nuo 

daugelio faktorių. Istoriškai šis skaičius kinta. Kortelių kataloguose dalykinių rubrikų skaičiaus 

didėjimas turėjo ekonominių pasekmių ir kėlė nepatogumų vartotojams (brangiau kataloguoti ir 

peržiūrėti, daugiau vietos laikyti katalogui, vartotojams labai dideliu katalogu sudėtingiau naudotis, 

ilgesnė paieška). Viena vertus, kuo daugiau dalykinių rubrikų tuo brangiau indeksuoti, kita vertus – 

jeigu reikia priskirti 2, o ne 10, tenka ilgiau svarstyti, ką pasirinkti, kuri geriau atitinka turinį. 

Kitas aspektas – kai daugiau terminų lengvinama prieiga prie visų išteklių, daugiau prieigos 

taškų, galima išskirti tam tikrus specifinius, netikėtus aspektus. 

Indeksavimo tikslumo matas neegzistuoja. Pagrindinis principas buvo suformuluotas dar 

XIX a pabaigoje, kai Ch. A. Cutteris sukūrė žodyninio katalogo rengimo taisykles. Šio principo 

esmė, kad reikia pasirinkti tiksliausią terminą, kuris apima visą dokumento dalyką, pvz., 

APELSINAI, o ne CITRUSINIAI VAISIAI ir ne VAISIAI arba artimiausią.. 

Indeksavimo nuoseklumas 

Nuoseklumą lemiantys faktoriai : 

• rubrikų skaičius; 

• žodyno dydis ir tikslumas; 

• indeksuotojo asmenybė; 

• turimos priemonės (žodynai, žinynai); 

24

• tvarkomo teksto dydis; 

• indeksuojamo dokumento ir terminų ypatybės (konkretūs objektai - daiktai ir abstraktūs 

objektai -idėjos) 

Indeksavimas nėra savitikslis procesas. Jo kokybė apibudinama pragmatiškai: tai toks 

indeksavimas, kuris leidžia iš duomenų bazės gauti dokumentą, kuris atitinka užklausą ir negauti to, 

kuris užklausos neatitinka. Antra vertus, paieškos rezultatą įtakoja daugelis faktorių: vartotojas (kaip 

jis suvokia ir formuluoja savo poreikį – užklausos turinys ir struktūra – paieškos strategija – 

duomenų bazės turinys - indeksavimo kokybė - žodyno kokybė. Vertindami indeksavimą galime 

kalbėti tik apie konceptualiosios analizės, sąvokų nustatymo ir vertimo kokybę. 

Galimos klaidos: 

• nesugebėjimas atpažinti vartotoją dominančią temą; 

• neteisingai suprastas dalykas/tema – neteisingai nustatyta sąvoka; 

• nesugebėjimas pasirinkti tiksliausią (siauriausią) rubriką/deskriptorių; 

• neteisingos rubrikos/deskriptoriaus pasirinkimas (aplaidumas, neišmanymas). 

Gero indeksavimo matas - geri paieškos rezultatai: tinkamas pilnumas ir tikslumas. 

Absoliučia prasme vienintelės teisingos paieškos charakteristikos nėra. Blogai, jeigu indeksavimas: 

• prieštarauja bendrai politikai (išsamumas); 

• ne tiksliausias terminas; 

• neteisingas terminas; 

• terminas praleidžiamas. 

Indeksavimą įtakoja šie faktoriai: 

indeksuotojas žodynas dokumentas procesas aplinka 

Dalyko/temos 

išmanymas; 

poreikių 

žinojimas; 

patirtis; 

koncentracija; 

teksto 

skaitymas ir 

suvokimas 

tikslumas; 

dviprasmiški 

terminai (be 

pastabų); 

struktūra 

(nuorodos); 

pagalbinės 

priemonės 

dalykas; 

sudėtingumas; 

kalba (rusų ar 

aiškumas); 

apimtis; 

dėstymas; 

apibendrinimas 

taisyklės ir 

instrukcijos; 

dalykinamų 

dok. skaičius; 

išsamumas; 

temperatūra; 

apšvietimas; 

triukšmas 

25

3. Kontroliuojami žodynai. Tezaurai, kaip leksikografinės kontrolės užtikrinimo 

priemonė 

Tezaurai, jų paskirtis ir funkcijos 

Tezauras – tai kontroliuojamas žodynas, kuris užtikrina sistemoje naudojamų terminų 

leksikografinę kontrolę ir jų naudojimo nuoseklumą. 

Toks žodynas – tai sisteminės struktūros žodžių ir žodžių junginių sąrašas, kurio tikslas 

vienareikšmiškai atspindėti dokumentų sistemoje esamų dokumentų ir joje atliekamų paieškų 

konceptualų turinį. Pagrindinis tezauro leksinis vienetas – deskriptorius. 

Tezauras (arba deskriptorių žodyno) – informacijos tvarkybos ir paieškos įrankis: tam tikroje 

sistemoje vartotinų žodžių ir pasakymų sąrašas drauge su jų ryšiais, variantais, sinonimais, tezauro 

naršymo priemonėmis. 

Tezauras yra ideografinis žodynas. Kita žodynų rūšis – leksikografiniai. Ideografiniuose 

žodynuose leksiniai vienetai grupuojami pagal išraiškos (parašymo) panašumą. Tokiuose žodynuose 

einama nuo žodžio prie prasmės. Tai – įvairių kalbų žodynai, pvz., lietuvių – anglų kalbų žodynas. 

Ideografiniuose žodynuose leksiniai vienetai grupuojami pagal prasmės artimumą, t.y. 

einama nuo prasmės prie konkretaus žodžio. Ideografiniai žodynai sudaromi jau daugelį šimtmečių. 

Didžiausią poveikį ir postūmį kurti ideografinius žodynus padarė P. M. Roget‘o ,,Anglų kalbos 

žodžių ir pasakymų tezauras“ (angl. Thesaurus of English words and phrases, 1852). Tai klasikinis 

tradicinio tezauro arba sinonimų žodyno pavyzdys. Šiame žodyne einama nuo vieno termino prie 

kito sinonimiško. Šio žodyno paskirtis - rasti žodį, kuris geriausiai perteikia pranešimo prasmę. 

26

Termino ,,Smallness“ struktūra ir reikšmės iš Roget‘o tezauro. 

http://machaut.uchicago.edu/?action=search&resource=Roget%27s&word=small&searchtype=head 

word 

XX a. antroje pusėje atsiranda naujo tipo – informacijos paieškos tezaurai. Nors tezauras – 

tai ideografinis žodynas, tačiau jis veikia priešingai, negu lingvistinis tezauras. Šiame žodyne daug 

sinonimų apjungiami vienu žodžiu ar žodžių junginiu. 

Ilgą laiką tokius tezaurus naudojo sistemų kūrėjai, IT specialistai, bibliotekininkai. Išplitus 

internetui, tezaurų, kaip kontroliuojamų žodynų reikšmė vėl ima augti. 

Tezaurų, kaip ir kitų kontroliuojamų žodynų reikšmė susijusi su natūralios kalbos 

ypatybėmis, t.y. jos trūkumais informacijos tvarkybos ir ieškos požiūriu. Svarbiausias jų tai, kad 

dokumentų arba informacijos vienetų autorių ir vartotojų, ieškančių šių dokumentų kalba, dažnai 

būna nevienoda. Tezaurų naudojimas ypač svarbus ir naudingas, kai kuriamos duomenų bazės 

jungiamos į informacines sistemas. Norint „susikalbėti” su partneriais, būti teisingai suprastiems ir 

tiksliai suprasti kitus, privalu naudoti tą patį žodyną. Tezaurus informacijos ir duomenų tvarkybai ir 

ieškai naudoja daugelis organizacijų. Kuriami universalūs, šakiniai ir specialūs mikro tezaurai. 

Tezaurai taip pat dažnai tampa paieškos ir yra navigacijos elektroninėse duomenų bazėse 

įrankiai. Jie yra nepakeičiami norint tiksliai įvardinti paieškos tikslą ir greitai surasti ieškomus 

duomenis. Atlikdamas paiešką vartotojas dažnai tezauro nemato arba net nežino, kad toks žodynas 

27

yra naudojamas. Sistemoje vartotojo įvesti reikšminiai žodžiai gali būti automatiškai pakeičiami 

deskriptoriais. Be to, naudojant tezaurą vartotojo nurodomi terminai gali būti automatiškai susieti su 

platesniais, siauresniais ar asociaciniais terminais iš tezauro. 

Tezaurų funkcijos: 

• Vertimas iš natūralios kalbos į deskriptorinę. Tezauras parodo, kurį terminą 

naudoti kiekvienai sąvokai apibrėžti; 

• Informacijos/duomenų paieškai naudingų loginių ryšių ir santykių atspindėjimas; 

• Atitinkamos srities terminijos standartizavimas ir norminimas. 

Tuo būdu tezaurų naudojimas užtikrina: 

• Terminų naudojimo nuoseklumą – terminai teikiami ir formuluojami pagal visiems žinomas 

taisykles; 

• Ryšių tarp leksinių vienetų nustatymą ir fiksavimą - rodo terminų prasmės ryšius; 

• Dokumentų paiešką - tezauras naudojamas kaip informacijos paieškos įrankis. 

Tezaurai gali būti universalūs (visų mokslo sričių) ir specializuoti (vienos ar kelių mokslo 

sričių). Rengiami vienos kalbos ir daugiakalbiai tezaurai. 

Tezaurų rengimą reglamentuoja Tarptautinės standartų organizacijos standartai: 

ISO 2788 – 1986 – Guidelines for the establishment and development of monolingual 

thesauri (Vienakalbio tezauro nustatymo ir sudarymo gairės). 

ISO 5964 – 1985 – Guidelines for the establishment and development of multilingual 

thesauri (Daugiakalbio tezauro nustatymo ir sudarymo gairės). 

Tezaurų struktūra ir fiksuojami santykiai 

Tezauras tai - abėcėlinis deskriptorių ir reikšminių žodžių sąrašas. 

Deskriptorius ir reikšminius žodžius (nedeskriptorius) tezaure jungia sinonimijos arba 

ekvivalentumo santykiai. 

Ekvivalentumas gali būti tikrasis (imanentinis, pvz.: defektas - yda, kiškis - zuikis, 

malūnsparnis -sraigtasparnis, Lietuvos Nacionalinė biblioteka - LNB ir artimas fakultatyvusis, pvz.: 

straipsnis -ataskaita, oras - atmosfera, katalogas – kartoteka, vertybinių popierių rinka – finansų 

rinka. Deskriptoriaus ir nedeskriptoriaus ekvivalentumo santykiai nurodomi tokiais sutrumpinimais: 

- UF (angl. Used for – vartojamas vietoj). Ši santrumpa rodo deskriptoriaus ir 

nedeskriptoriaus, kuriam jis atstovauja, santykius. Pavyzdžiui: 

Malūnsparnis 

28

UF helikopteris 

- USE (naudok) reiškia nedeskriptoriaus ir deskriptoriaus, kurį jis pakeičia santykius. 

Pavyzdžiui: 

helikopteris 

USE malūnsparnis. 

Pagrindiniai prasmės santykiai tarp deskriptorių: 

- giminė – rūšis (bendra/plati ir specifinė/siaura sąvoka), pvz.: baldai – stalai; gėlės – 

ratiliai; sostinės – Vilnius. Jie dar gali būti vadinami hierarchiniais arba pavaldumo santykiais. Šie 

santykiai paprastai žymimi santrumpomis BT (angl. Broader term - platesnis terminas) ir NT 

(narrower term - siauresnis terminas). 

- asociatyvūs santykiai. Jiems žymėti naudojama santrumpa RT ( angl. Related term – 

susijęs terminas). Asociatyvūs santykiai būna įvairių rūšių: 

Objektas – instrumentas (temperatūra - termostatas); 

Objektas – vieta (ligonis - ligoninė); 

Objektas – funkcija (biblioteka – knygų išdavimas) 

Veiksmas – objektas – rezultatas (mezgimas – siūlai - megztinis); 

Panašūs objektai/artimumas (arklys, asilas, mulas); 

Veikėjas – veiksmas (vagis - vagystė); 

Disciplina – objektas (ornitologija - paukštis); 

Priešingybės (judėjimas - ramybė); 

Gretimumas (žiema - sniegas); 

Visuma – dalis (knyga – viršelis). 

Asociatyvūs santykiai visada yra simetriški, pvz.: 

įsiskolinimas 

RT mokumas 

mokumas 

RT įsiskolinimas 

Apibrėžiantys žodžiai (angl. Qualifiers) 

Skliausteliuose nurodomi apibrėžiantys žodžiai homonimų dviprasmiškumui pašalinti ir 

terminų, kurių naudojimas konkrečiame kontekste gali įnešti painiavos, prasmei sukonkretinti. 

Apibrėžiantys žodžiai tampa deskriptoriaus dalimi ir turi būti įtraukiami indeksuojant ar 

atliekant paiešką. Pvz.: 

29

gynyba (teisė) 

gynyba (karyba) 

Vartojimo pastabos (angl. Scope note) 

Vartojimo pastabos naudojamos, kai reikia paaiškinti specialaus termino reikšmę, paaiškinti, 

kaip toks terminas naudojamas arba apriboti termino naudojimo sritį. Kartais pastabos tikslas yra 

įspėti vartotoją, kad tikslingiau būtų naudoti kitą terminą. Pastabos žymimos santrumpa SN. 

Pavyzdžiui: 

Sovietų Sąjunga 

SN: naudojamas 1922-1991; panaikintas 1991. 

Hierarchinių santykių tarp deskriptorių fiksavimas užtikrina galimybę plėsti ir/arba siaurinti 

paiešką pasirenkant patį tiksliausią terminą. Tezaure naudojamos nuorodos į sinonimus leidžia rasti 

alternatyvius paieškos terminus, o asociatyvių terminų fiksavimas rodo sąvokų ryšius. 

Tezaurų rengimas ir vertinimas 

Paprastai išskiriami šie tezauro rengimo etapai: 

• Terminų atranka ir jų įtraukimas į reikšminių žodžių sąrašą. Paprastai terminai yra 

atrenkami iš tam tikros mokslo krypties dokumentų, atliekant pirminį indeksavimą. Šiame etape tarp 

terminų ryšiai nėra nustatomi (dedukcinis metodas). Naudojant indukcinį metodą, nauji terminai 

įtraukiami į tezaurą iš karto nustatant termino priklausomybę vienai ar keletui kategorijų ir 

formuojant atitinkamus ryšius. Gali būti derinami abu terminų atrankos būdai. 

• Terminų verifikavimas. Prieš įtraukiant terminą į reikšminių žodžių sąrašą ir (arba) 

tezaurą turi būti atliekamas jo patikrinimas. Tam naudojami žinynai ir enciklopedijos, jau 

egzistuojantys tezaurai, klasifikatoriai, techninių žurnalų rodyklės, referatinių leidinių rodyklės, 

naujausi žinynai, galima konsultuotis su specialistais. 

• Reikšminių žodžių deskriptorizavimas. Šiame etape vyksta atrinktų terminų 

norminimas ir sąlyginio ekvivalentumo klasių formavimas, kai iš sinonimiškų ar sąlygiškai 

sinonimiškų terminų atrenkami plačiausiai naudojami, stilistiškai neutralūs tokias klases 

atstovaujantys žodžiai. 

• Deskriptorių klasių formavimas ir užrašymas. Tezauro apiforminimas. Kiekvienas 

tezauro leksinis vienetas pateikiamas tam tikra griežtai nustatyta tvarka. Prie jo nurodomi: sinonimai 

ir kiti atitiktiniai terminai, naudojimo pastabos, platesni, siauresni ir susiję terminai. Prie termino 

gali būti pateikiamas jo apibrėžimas ar kiti reikalingi paaiškinimai. Specialios tezaurų kūrimų 

30

programos labai palengvina termino įrašymo darbus automatiškai sukurdamos atvirkštinius ryšius ir 

neleisdamos skirtingų sąvokų reikšti taip pačiais terminais, atitiktinių terminų naudoti ten kur turi 

būti rašomi tik patvirtinti terminai ir t.t. 

• Tezauro kūrimas yra tęstinis procesas, kadangi kiekvienoje mokslo srityje ar kryptyje 

vyksta pokyčiai: atsiranda nauji terminai ar kinta jai reiškiamų sąvokų ribos. Į tezaurą nuolat turi 

būti įtraukiami nauji terminai (paprastai taikant indukcinį metodą), pašalinami seni, neteiktini 

terminai. 

Vertinant parengtus tezaurus siūloma atsižvelgti į tokius kriterijus: 

• Terminologija: ar atitinka mokslo sritį, nuolat atnaujinama ir tiksli? 

• Apimtis: ar tinkamai apibūdina mokslo sritį, nėra per plati ar per siaura? 

• Suskirstymas: ar prasmingas suskirstymas į temas? 

• Apibrėžimai ir pastabos: ar pakankamai išsamiai ir aiškiai apibūdina terminus? 

• Nuorodos: ar pakankamos pagal skaičių ir formą? 

• Formatas: ar aiškus pateikimas? 

• Klasifikacija: ar suderintas su kuria nors klasifikacijos schema? 

31

4. Svarbiausi humanitarinių ir socialinio mokslų srities tezaurai 

Tezaurus informacijos ir duomenų tvarkybai ir ieškai naudoja daugelis organizacijų. Kuriami 

universalūs, šakiniai ir specialūs mikro tezaurai. Sudaromi specialūs elektroninių tezaurų sąrašai 1 . 

Rengiami įvairios apimties, paplitimo ir kokybės HSM srities tezaurai. Šioje srityje galima išskirti 

ERIC, UNESCO tezaurą, ELSST, Sociologinių terminų tezaurą ir kitus. 

ERIC – Informacijos apie švietimo išteklius centras (angl. Education Resources Information 

Center) JAV yra virtuali švietimo išteklių ir informacijos 

biblioteka.http://www.eric.ed.gov/ERICWebPortal/Home.portal?_nfpb=true&_pageLabel=Thesauru 

s&_nfls=false. Informacijai tvarkyti ir paieškai atlikti taikomas ERIC tezauras. Terminai išdėstyti 

abėcėlės seka. 

Tezaure galima pasirinkti terminą iš abėcėlinio sąrašo arba pagal temą. Pvz., pasirinkus 

temą socialinės problemos – social problems, gaunamas sąrašas deskriptorių ir nedeskriptorių, iš 

kurių pasirinkus norimą, pvz., sexual abuse, pristatoma hierarchinė deskriptoriaus struktūra iš kurios 

galima pasirinkti paieškos terminą. Pasirinkus paiekos terminą, gaunamas dokumentų, atitinkančių 

šį dalyką, sąrašas. 

1 Koch T., Controlled vocabularies, thesauri and classification systems available in the WWW. 

[interaktyvus]. [žiūrėta 2006 m. lapkričio 20 d.]. Prieiga per internetą 

http://www.ub2.lu.se/metadata/subject-help.html; 

Web Thesaurus compendium[interaktyvus]. [žiūrėta 2006 m. lapkričio 20 d.]. Prieiga per internetą: 

http://www.ipsi.fraunhofer.de/~lutes/thesoecd.html 

32

UNESCO Tezauras (angl. UNESCO Thesaurus) – tai trikalbis kontroliuojamas šios 

organizacijos žodynas, kuris apima šių sričių terminus: švietimo, mokslo, kultūros, humanitarinių ir 

socialinių mokslų, informacijos ir komunikacijos, politikos, teisės ir ekonomikos. Be to, į tezaurą 

įtraukti valstybių ir įvairių valstybinių grupuočių ar sąjungų (politinių, ekonominių, geografinių, 

etninių, religinių ir pan.) pavadinimai. Visų kalbų versijose yra 87 mikrotezauro terminai, 4261 

deskriptorius, 4049 atvirkštiniai hierarchiniai ryšiai (BT/NT), 5771 asociatyvūs ryšiai (RT). 

Versijoje anglų kalba yra per 2340 atitiktinių terminų ir 600 terminų apibūdinimų. Tezauro paskirtis 

– lengvinti indeksavimą bibliotekose, archyvuose ir panašiose institucijose. 

Tezauras pristatomas dvejopai: kaip abėcėlinė ir hierarchinė struktūra. Pasirinkus reikiamą 

terminą pagal abėcėlę ar iš teminio mikrotezauro, formuluojama užklausa. 

UNESCO tezauras naudojamas ir kaip bazinis tezauras kurti panašios tematikos 

kontroliuojamus žodynus. Tezauro naudojimo principai ir sąlygos 

http://www2.ulcc.ac.uk/unesco/#purc. 

33

Europos kalbų socialinių mokslų tezauras (angl. European Language Social Science 

Thesaurus -ELSST). Jis yra rengiamas remiantis ISO 2788:1986 ir ISO 5964:1985 standartų 

reikalavimais. Jo pagrindą sudaro HASSET (Humanities and Social Science Electronic Thesaurus) 

tezauras anglų kalba. Detalus HASSET tezauras buvo sustambintas, nes ELSST tikslas yra sukurti 

bendrą ontologiją, kuri konkrečių institucijų poreikiams galėtų būti praplėsta terminais, susijusiais 

su kultūriniais ir instituciniais ypatumais. Atlikus dažniausiai UKDA kataloge naudojamų terminų 

analizę buvo atrinkti plačiausi terminai: ekonomika, darbas ir įsidarbinimas, politika, politinės 

sistemos, socialinės problemos, diskriminacija, požiūriai, probleminės grupės, politinės institucijos, 

etninės grupės, gyvenimo sąlygos, socialinė struktūra, duomenys, amžiaus grupės, demografija, 

sociologija, socialinis gerbūvis, aplinkosaugos mokslai, edukologija, identitetas, tautiškumas, šeima, 

religija, analizė, metodologija, šeimos aplinka. Vėliau, derinant su CESSDA (Council of European 

Social Science Data Archives) poreikiais tezauras buvo papildytas kitais plačiais terminais. Šiuo 

metu tezaure pakeikta daugiau kaip 3000 terminų vokiečių, danų, graikų, anglų, ispanų, suomių, 

prancūzų, norvegų ir švedų kalbomis. 

Sociologinių terminų tezauras (angl. Sociological abstracts Thesaurus) 

http://www.csa.com/factsheets/supplements/sociothes.php 

Atliekant paiešką CSA duomenų bazėse vartotojas turi galimybę pasirinkti sritį, pvz., 

humanitariniai mokslai, menai, socialiniai mokslai ir atitinkamos srities tezaurą norima kalba, 

pavyzdžiui, Sociologinių terminų tezaurą ar Politinių mokslų tezaurą anglų kalba. Be to, Tezaurai 

pateikiami kaip hierarchinė struktūra, kai abėcėlinis deskriptorių ir nedeskriptorių sąrašas ir kaip 

permutacinė rodyklė. 

34

Pasirinkus Sociologinių terminų tezauro terminą ,,addiction“, gaunamas sąrašas dokumentų, 

kuriame šis terminas buvo naudotas indeksuojant. 

35

CSA duomenų bazės yra komercinės, todėl neįsigijus prieigos teisių galima tik bandomoji 

paieška. 

Europos švietimo terminų tezauras (angl. Thesaurus for Education Systems in Europe- 

TESE) yra daugiakalbis edukologijos terminų žodynas, sukurtas bendromis Europos komisijos ir 

Europos tarybos pastangomis. http://www.eurydice.org/portal/page/portal/Eurydice 

TESE pateikia edukologijos mokslo krypties terminus: švietimo principai ir sistemos, 

švietimo politika, švietimo institucijos, mokytojai, mokiniai, pastatai ir mokymo įranga, mokymo 

programa ir mokymo dalykai, edukaciniai tyrimai, ugdymo psichologija, sociologija ir ekonomika ir 

kt. Daugiakalbis edukologijos terminų tezauras parengtas pagal ISO 5964 1985 standartą. TESE 

pateikiami terminai 9 kalbomis. 

36

Pasirinkus iš TESE tezauro terminą ,,migracija“ – angl. migration, matome deskriptoriaus 

struktūrą, termino atitikmenis devyniomis kalbomis bei informaciją, kad siauresnis deskriptoriaus 

,,migration“ terminas ,,country of origin“ buvo panaudotas indeksuojant vieną šioje duomenų bazėje 

esantį dokumentą. 

EUROVOC. http://www3.lrs.lt/pls/ev/ev.main. Europos žodynas (tezauras) „EUROVOC“ - 

tai sisteminis žodžių ir žodžių junginių sąrašas. Jo paskirtis – tiksliai atspindėti dokumentų sistemoje 

esančių dokumentų ir joje atliekamų paieškų konceptualų turinį. Tai daugiakalbis tezauras lietuvių, 

anglų, vokiečių ir prancūzų kalbomis sudarytas Europos Bendrijos institucijų dokumentų 

informacijai apdoroti. Tezauras apima 21 sritį, jį sudaro 127 teminiai mikrotezaurai Jis skirtas 

Europos institucijų bibliotekoms, dokumentų tarnyboms ir dokumentų duomenų bazėms bei jų 

paslaugų vartotojams. Nors žodyne svarbiausia Europos Sąjunga, vis dėlto tai yra platus daugiašakis 

tezauras. 

37

Deskriptoriaus ,,pilietinės teisės“ iš EUROVOC tezauro hierarchinė struktūra. 

Informacijos tvarkymui ir paieškai duomenų archyvuose naudojami HSM srities 

tezaurai 

HASSET tezauras 

Jungtinės Karalystės duomenų archyvo (United Kingdom Data Archive, toliau UKDA) 

Humanitarinių ir socialinių mokslų elektroninis tezauro (Humanities and Social Science Electronic 

Thesaurus, toliau HASSET 2 ) pirminis variantas paremtas plačiai žinomu UNESCO tezauru, kurį 

parengė Jean Aitchison (Paris: UNESCO, 1977) (ISBN: 92-3-101469-2). Vėliau jis buvo 

tobulinamas ir dabar naudojamas UKDA online paieškos sistemoje. 

HASSET yra daugiadalykis tezauras. Jį parengė UKDA savo paties tikslams, todėl šio 

žodyno turinys ir aprėptis atspindi UKDA poreikius ir išteklius. Plačiausiai ir išsamiausiai 

pristatytos pagrindinės socialinių mokslų sritys: politika, sociologija, ekonomika, švietimas, teisė, 

nusikalstamumas, demografija, sveikata, užimtumas, ir vis didesnis dėmesys skiriamas 

technologijai. 

Tezaure mažai naudojami tikriniai daiktavardžiai. Geografiniai pavadinimai naudojami tiek, 

kiek jie reikalingi indeksavimui. 

2 HASSET thesaurus. In: UK Data Archive. [interaktyvus]. [žiūrėta 2007 m. 2007 m. rugpjūčio 11 d . Prieiga per 

internetą http://www.data-archive.ac.uk/search/hassetSearch.asp 

38

HASSET sandara ir struktūra atitinka Didžiosios Britanijos standarto (British Standard 

5723:1987) ir ISO 2788-1986 - Establishment and development of monolingual thesauri 

reikalavimus. 

Tezaure fiksuojami įprastiniai santykiai tarp leksinių vienetų (teiktini ir neteiktini terminai, 

žymima USE/UF), hierarchiniai santykiai (platesni ir siauresni terminai, žymima BT/NT) ir 

asociaciniai santykiai (žymima RT). Apibrėžiančių žodžių ir pastabų naudojimas HASSET atitinka 

aukščiau nurodytus principus. 

UKDA skatina nekomercinį HASSET taikymą su sąlyga, kad visais tezauro reprodukavimo 

ar adaptavimo atvejais bus nurodyta UKDA autorystė. 

HASSET termino ,,crime“ struktūra 

Pasirinkus susijusį terminą punishment (CRIME RT PUNISHMENT), gaunamas šiai temai 

skirtų dokumentų sąrašas. 

39

ICPSR Subject Thesaurus 3 

JAV politinių ir socialinių tyrimų universitetų konsorciumo (Inter-university consortium for 

political and social research) dalykinis tezauras (toliau ICPSR tezauras) buvo parengtas 

vadovaujantis Guidelines for the Construction, Format, and Management of Monolingual Thesauri, 

Z39.19-1993 (NISO 1993) nuostatomis. 

ICPSR tezauras yra daugiadalykis. Jis apima visas ICPSR archyvo sritis: politikos mokslai, 

sociologija, istorija, ekonomika, švietimas, teisingumas, gerontologija, demografija, sveikata 

apsauga, teisė ir tarptautiniai santykiai. 

Asmenvardžiai ir geografiniai pavadinimai nėra tezauro leksiniai vienetai. Šie terminai 

įtraukti į specialiai šiam tikslui sudarytus kontroliuojamus sąrašus. ICPSR tezauro įvade pristatomos 

pagrindiniai šio žodyno sudarymo principai: daugiskaitos ir vienaskaitos, žodžių junginių, 

santrumpų ir akronimų, tikrinių daiktavardžių ir pavadinimų naudojimas. 

Tezaure fiksuojami įprastiniai santykiai tarp leksinių vienetų (teiktini ir neteiktini terminai, 

žymima USE/UF), hierarchiniai santykiai, kurie atspindi santykius giminė - rūšis, visuma - dalis, 

klasė - poklasė. Jie žymimi santrumpa BT/NT. Nehierarchiniai santykiai rodo artimus prasminius, 

3 ICPSR Subject Thesaurus. In: Inter university consortium for political and social studies. [interaktyvus]. [žiūrėta 2006 

m. lapkričio 20 d.]. Prieiga per internetą http://www.icpsr.umich.edu/thesaurus/index.html 

40

ne sinonimiškumo, santykius (žymima RT). Apibrėžiančių žodžių ir vartojimo pastabų naudojimas 

ICPSRST atitinka aukščiau nurodytus principus. 

Paieška ICPSR bazėje tezaure pasirinkus terminą occupational categories RT employment 

qualifications RT job skills 

LiDA tezauras 

LiDA tezauro rengimo metodika 

Rengiant LiDA tezaurą ir pasirenkant jo sudarymo metodiką buvo vadovautasi nuostatomis, 

kad LiDA dokumentų tvarkybai ir ieškai reikalingas specialus HSM terminų tezauras lietuvių kalba, 

kuris turi tapti LiDA informacinės sistemos lingvistinio aprūpinimo sudėtine dalimi, užtikrinančia 

duomenų archyve saugomų dokumentų apdorojimo nuoseklumą ir aukštą paieškos kokybę. 

Atlikus kontroliuojamų žodynų rengimo praktikos Lietuvoje analizę 4 , buvo nuspręsta, kad 

LiDA terminų tezauro sudarymui geriausia pasinaudoti esamais šios srities tezaurais anglų kalbą ir 

pasirinkus tinkamiausią bei plačiausiai HSM srityje naudojamą išversti jį į lietuvių kalbą. 

4 Lietuvoje iš esmės nėra originalių tezaurų rengimo patirties. Pirmas ir kol kas vienintelis tezauras 

lietuvių kalba – EUROVOC tezauras, skirtas Europos Bendrijos institucijų dokumentų informacijai 

tvarkyti. Lietuviškasis šio tezauro variantas yra trečiojo 3.1 Europos Bendrijos oficialių publikacijų 

biuro parengto tezauro vertimas. Šis tezauras yra daugiakalbis, greta terminų lietuvių kalba 

pateikiami terminai anglų, vokiečių ir prancūzų kalbomis. Tezauras naudojamas LR Seimo 

informacijos sistemos dokumentų, visų pirma LR teisės aktų tvarkymui ir paieškai. Kita vertus, 

41

Atsižvelgus į pirmoje projekto vykdymo stadijoje tezauro rengėjų atliktos HSM srities 

kontroliuojamų žodynų analizės rezultatus, kai buvo analizuojama įvairių šios srities tezaurų apimtis 

paplitimas, atitikimas ISO standartams, buvo padaryta išvada, kad tinkamiausias LiDA tikslams yra 

HASSET tezauras. Jis sudaro lietuviškojo HSM srities tezauro pagrindą. 

Antra vertus, konkretūs LiDA poreikiai, kaupiamų dokumentų specifika, akademinės 

bendruomenės lūkesčiai, lietuvių kalbos ypatybės reikalauja, kad HASSET tezauro leksika būtų 

atitinkamai adaptuota. Todėl rengiant LiDA tezaurą buvo naudotasi įvairiomis lingvistinėmis 

priemonėmis lietuvių kalba: Lietuvos nacionalinės Martyno Mažvydo bibliotekos rubrikynu, 

EUROVOC tezauru, terminų žodynais ir kt. 

Renkantis tinkamiausią LiDA tezauro rengimo modelį buvo nuspręsta, kad atsižvelgiant į 

Europos ir pasaulio HSM archyvų šiuolaikinę praktiką, reikėtų rengti ne vienos kalbos, o dvikalbį 

anglų – lietuvių kalbų tezaurą. 

Tezaurų rengimo verčiant ir adaptuojant esamus kitų kalbų tezaurus galimybes, metodus, jų 

privalumus ir trūkumus apibūdina ISO 5964 standartas. Šiame dokumente pristatomi trys 

daugiakalbio tezauro kūrimo metodai: 

• Ab initio kūrimas: t.y. naujo žodyno kūrimas, nesiremiant jau egzistuojančio tezauro 

terminais. 

• Jau egzistuojančio vienakalbio tezauro vertimas. 

• Dviem ar keliomis kalbom jau egzistuojančių tezaurų derinimas ir jungimas. 

Pirmojo metodo privalumas – lengva užtikrinti kalbos neutralumą, t.y. išvengiama 

konkrečios kalbos įtakos. Tokio tezauro kūrimo išlaidos yra didelės, kadangi reikia sukurti tezauro 

struktūrą, pateikti sąvokų apibrėžimus ir nustatyti atitikmenis įvairiomis kalbomis. 

Antrojo metodo didelis privalumas tas, kad nereikia kurti reikšminių žodžių masyvo, 

formuoti tezauro struktūros. Didžiausias šio metodo sunkumas tai, kad verčiant ne visada sutampa 

terminais reiškiamų sąvokų ribos ir vieną terminą tenka versti keliais kitos kalbos terminais, gali 

kadangi tezauras yra daugiadalykis juo gali naudotis ir kitos institucijos, visų pirma Europos 

institucijų bibliotekos, dokumentų tarnybos ir dokumentų duomenų bazės bei jų paslaugų vartotojai. 

Nors žodyne svarbiausia Europos Sąjunga, vis dėlto tai yra platus daugiašakis tezauras. Šiuo metu 

yra rengiamas Archeologijos terminų tezauras. 

Lietuvos bibliotekos rengdamos atitinkamus kontroliuojamus žodynus dokumentų tvarkybai ir 

ieškai, kaip antai rubrikynus ar hierarchinės struktūros dokumentų klasifikacijas, taip pat naudojasi 

kitų nacionalinių ar tarptautinių institucijų parengtais žodynais. Taigi kontroliuojamų žodynų 

rengimo Lietuvoje patirtis rodo, kad dažniausiai pasirenkamas atitinkamų tarptautinių žodynų 

vertimo į lietuvių kalbą ir adaptavimo būdas. 

42

skirtis jų loginiai santykiai, hierarchijos lygis ir pan. Kartais visai nėra kitakalbio atitikmens, 

terminų kiekis, jų apimtis gali neatitikti konkrečių atitinkamos sistemos poreikių. 

Taikant trečiąjį metodą problemos kyla dėl tezaurų skirtingos hierarchinės struktūros, taip 

pat dėl svarbių terminų semantikos skirtumų. Todėl tezauro versijos skirtingomis kalbomis gali 

turėti skirtingas hierarchines struktūras. 

Nepaisant aukščiau minėtų trūkumų buvo pasirinktas daugiakalbio tezauro rengimo būdas, 

t.y. jau egzistuojančio vienakalbio žodyno vertimas į lietuvių kalbą ir jo pildymas bei adaptavimas. 

LiDA tezauro naudojimas 

LiDA tezauras tai - dviejų kalbų elektroninis kontroliuojamas žodynas. Žodyne visi terminai 

yra anglų ir lietuvių kalbomis. Vartotojai naudodami lietuviškus terminus gali atlikti angliškų tekstų 

paiešką ir atvirkščiai. 

Tezauras apima daugelį HSM ir kitų mokslo bei praktinės veiklos sričių. 

Pagrindinės tezauro sritys: 

1. aplinkos apsauga, 

2. ekonomika, 

3. energetika, 

4. darbas ir užimtumas, 

5. darbo santykiai, 

6. demografija, 

7. finansai, 

8. gamyba ir technologija, 

9. geografija, 

10. karyba, 

11. komunikacijos, 

12. laisvalaikis, sportas ir kultūra, 

13. lygios galimybės, 

14. medicina, 

15. mokslas, 

16. politika, 

17. pramonė, 

18. prekyba, 

19. religija, 

43

20. socialinė apsauga, 

21. socialinė rūpyba, 

22. socialiniai klausimai, 

23. sociologija, 

24. statistika, 

25. sveikatos apsauga, 

26. šeima ir šeimos ūkis, 

27. švietimas ir ugdymas, 

28. teisė, 

29. transportas, 

30. vaikų teisės, 

31. verslas, 

32. žemės ūkis ir miškininkystė, 

33. žemės ūkio ir maisto produktai, 

34. žiniasklaida, 

35. žmogaus teisės 

36. žmonės su negalia 

Kai kurios sritys yra pristatytos detaliau, kitos fragmentiškai. Detalumas daugiausiai 

priklauso nuo atliekamų HSM srities tyrimų tematikos ir atitinkamos terminologijos poreikių. 

Rengiant LiDA tezaurą, buvo atsisakyta daugelio Jungtinės Karalystė teritorijų, miestų, kitų 

geografinių pavadinimų, taip pat kai kurių Jungtinei Karalystei būdingų daiktų, reiškinių, procesų 

pavadinimų. Kai kuriose vietose prie lietuviško termino vartotojas gali rasti pastabą (Jungtinė 

Karalystė), kuri rodo, kad lietuvių kalba tokio atitikmens nėra, todėl pateikta tik bendroji sąvoka ar 

paaiškinimas. 

Pvz., POOR LAWS - Paramos vargšams įstatymai (Jungtinė Karalystė) 

Kita vertus, dėl būtinumo papildyti LiDA tezaurą lietuviškais terminais, pavadinimais ir 

pan., kurie turi turėti atitikmenį anglų kalba, šie vertiniai gali būti ne visai tikslūs. 

Pvz., Avarinis gyvenamasis fondas – EMERGENCY DWELLING FUND. 

Visais atvejais LiDA tezaure palikta HASSET tezauro deskriptorių straipsnių struktūra ir 

užfiksuoti tokie santykiai tarp leksinių vienetų, kurie buvo originale. 

Taigi LiDA tezaure fiksuojami sinonimijos, gimininiai – rūšiniai ir asociaciniai santykiai. 

44

Deskriptoriaus ir nedeskriptoriaus sinonimijos santykiai žymimi santrumpomis UF (Used for 

– vartojamas vietoj) ir USE (naudok). 

Santrumpa UF rodo deskriptoriaus ir nedeskriptoriaus, kuriam jis atstovauja, santykius. Pvz.: 

COMPLEMENTARY THERAPIES Netradicinis gydymas 

UF COMPLEMENTARY MEDICINE Netradicinė medicina 

UF COMPLEMENTARY HEALTH CARE Netradicinė sveikatos priežiūra 

UF ALTERNATIVE MEDICINE Alternatyvi medicina 

UF ALTERNATIVE THERAPIES Alternatyvus gydymas 

Santrumpa USE (naudok) reiškia nedeskriptoriaus ir deskriptoriaus, kurį jis pakeičia santykius. Pvz: 

COMPLEMENTARY MEDICINE Netradicinė medicina 

USE COMPLEMENTARY THERAPIES Netradicinis gydymas 

COMPLEMENTARY HEALTH CARE Netradicinė sveikatos priežiūra 


ALTERNATIVE MEDICINE Alternatyvi medicina 


ALTERNATIVE THERAPIES Alternatyvus gydymas 


Ieškant informacijos apie dalyką, kuris gali būti pavadintas alternatyvus gydymas, 

alternatyvi medicina, netradicinė sveikatos priežiūra ar netradicinė medicina, reikia vartoti 

deskriptorių Netradicinis gydymas. T. y. sinonimijos arba ekvivalentiškumo santykiai parodo 

indeksuotojui arba vartotojui, kokį deskriptorių reikia naudoti vietoje pasirinkto nedeskriptoriaus. 

Hierarchiniai gimininiai ir rūšiniai santykiai žymimi santrumpomis BT (platesnis terminas), 

kai reikia parodyti santykį tarp specifinio ir bendresnio deskriptoriaus ir NT (siauresnis terminas), 

kai siekiama parodyti santykius tarp bendro ir siauresnės ar konkretesnės prasmės deskriptoriaus. 

Skaitmuo prie santrumpos BT (6) arba (7) rodo skirtingą jų hierarchijos lygį. 

Pavyzdžiui, 

COMPLEMENTARY THERAPIES Netradicinis gydymas 

45

UF COMPLEMENTARY MEDICINE Netradicinė medicina 

UF COMPLEMENTARY HEALTH CARE Netradicinė sveikatos priežiūra 

UF ALTERNATIVE MEDICINE Alternatyvi medicina 

UF ALTERNATIVE THERAPIES Alternatyvus gydymas 

NT(5) ACUPUNCTURE Akupunktūra 

NT(5) CHIROPRACTIC Chiropraktika 

NT(5) FOLK MEDICINE Liaudies medicina 

NT(5) HOMEOPATHY Homeopatija 

BT(6) MEDICAL TREATMENT METHODS Gydymo metodai 

BT(7) MEDICAL SCIENCES Medicinos mokslai 

Asociatyvius deskriptorių santykius rodo santrumpa RT (8) (related term – asociatyvus 

terminas). Pavyzdžiui: 

MARKET ECONOMY Rinkos ekonomika 

BT(6) ECONOMIC SYSTEMS Ekonominės sistemos 

BT(7)ECONOMICS Ekonomika 

RT(8)CAPITALISM Kapitalizmas 

RT(8) ECONOMIC COMPETITION Ekonominė konkurencija 

RT(8)PRIVATIZATION Privatizavimas 

Indeksuotojui ir vartotojui, kuris ketina naudoti tam tikrą deskriptorių asociatyvūs santykiai 

rodo, kad vietoje deskriptoriaus Rinkos ekonomika jis galėtų naudoti terminus Ekonominė 

konkurencija, Privatizavimas ar Kapitalizmas, kurie taip pat tinka konkrečios informacijos 

tvarkymui ar paieškai, o kartais gali net tiksliau išreikšti reikiamą sąvoką. 

Esant reikalui deskriptoriaus reikšmė gali būti siaurinama arba paaiškinama. Pavyzdžiui: 

MONEY SUPPLY – Pinigų pasiūla (pinigų, cirkuliuojančių šalies ekonomikoje, kiekis) 

INCONTINENCE – Nelaikymas (medicina) 

Tezauro kūrimas yra tęstinis procesas, kadangi kiekvienoje mokslo srityje ar kryptyje vyksta 

pokyčiai: atsiranda nauji terminai ar kinta jais reiškiamų sąvokų ribos. Į tezaurą nuolat turi būti 

įtraukiami nauji terminai, pašalinami seni, neteiktini terminai. Akivaizdu, kad kaupiant ir tvarkant 

Lietuvos HSM duomenų archyvą atsiras naujų lietuviškų terminų, kurie būtini indeksavimui ir 

paieškai. Kita vertus, gavus HASSET tezauro papildymus ir pakeitimus atitinkamai turės būti 

modifikuojama angliškoji ir lietuviškoji tezauro leksikos dalis. 

46

Tezauro duomenys yra prieinami LiDA svetainėje: http://www.lidata.eu. 

• pasirinkti kalbą 

• įvesti pirmą raidę arba termino pradžią 

• atlikti paiešką 

• spragtelėti “+”, jeigu domina susiję terminai 

• spragtelėti ant susijusio termino, jeigu domina tolimesnės sąsajos. 

Vadovaujantis minėtomis taisyklėmis pasirenkame lietuvių kalbą, įvedame termino pradžią 

(žm. – ieškome termino ,,žmogaus teisės“) ir atliekame paiešką. Radus terminą, nuspaudžiame ,,+” 

ir gauname susijusių terminų sąrašą. 

Jeigu vartotoją domina tolimesnės sąsajos, reikia spragtelėti ant norimo termino, pvz., Kultūrinės 

teisės. 

47

5. Metaduomenys. Metaduomenų schemos ir elementų rinkiniai. Empirinių 

duomenų aprašymo standartas ir jo taikymas archyvo reikmėms. 

Duomenų archyve LiDA yra kaupiami įvairūs empiriniai (gyventojų surašymų, namų valdų, 

rinkimų, vyriausybės ir savivaldybių, visuomenės nuomonės apklausų ir tyrimų, statistikos ir kt.) 

duomenys, kuriuos sukaupia tyrėjai. Taip pat čia saugomi ir prieinami publikuoti informacinio 

pobūdžio leidiniai (knygos, žurnalai), nepublikuota informacija (mokslinių tyrimų ataskaitos, 

disertacijos) ir mokslinių tyrimų apžvalgos. Visi šie duomenys ir informacija saugoma šiais 

formatais: DDI Document (*.xml); SPSS System (*.sav); SPSS Portable (*.por); SPSS Syntax 

(*.sps); SAS (*.sp1); Stata 7 ir Stata 8 (*.dta); Statistica (*.sta); NSDstat (*.nsf); dBase (*.dbf); DIF 

(*.dif); Delimited Text (*.txt, *.cvs). 

LiDA ir lingvistinis aprūpinimas 

48

HSM duomenų archyvo sukūrimui ir egzistavimui yra būtinas lingvistinis aprūpinimas – 

kitaip tariant archyve talpinamų duomenų bei informacijos aprašymo taisyklių sukūrimas tų 

duomenų pateikimo į archyvą, saugojimo, prieigai užtikrinti. 

LiDA lingvistinio aprūpinimo funkcinei struktūrai turėjo įtakos jau egzistuojantys šalyje ir 

užsienyje atvirieji elektroninių išteklių archyvai. Pirmiausia buvo remiamasi Atvirų archyvų 

iniciatyvos metodologija, kuri pateikta ISO standarte ISO 14721:2003 Space Data and Information 

Transfer System - Open Archival Information System - Reference Model. Šiame standarte 

pakankamai aiškiai išdėstyti pagrindiniai reikalavimai, keliami tokio pobūdžio archyvams. Pagal šį 

modelį sudarytas LiDA lingvistinis aprūpinimas užtikrina šių funkcijų vykdymą: 

• komplektavimą, apima visus veiksmus susijusius su elektroninės informacijos ir duomenų 

surinkimu iš tyrėjų ir patalpinimu į bendrą serverį. Šis procesas reikalauja pasikeisti 

bibliografine ir administracine informacija su tyrėjais; 

• registravimą: naujai gauta elektroninė informacija ar duomenys yra užregistruojami archyve 

ir bibliografinė informacija pateikiama į elektroninius katalogus; 

• patikrinimą: tai procesas, kurio metu atliekamas failų formato bei elektroninės informacijos 

ar duomenų loginio integralumo patikrinimas; 

• katalogavimą: tai elektroninės informacijos ar duomenų metaduomenų įrašo sudarymo 

procedūros, užtikrinančios, kad informacija ar duomenys būtų surastos kataloguose bei 

pasaulio mokslinių tyrimų archyvuose; 

• saugojimo tvarkymą: čia atliekamos tokios procedūros kaip išsaugojimas skaitmeninėse 

laikmenose, pastovus atsarginių kopijų darymas bei kopijavimas įvairiems tikslams. Čia 

ypatingas vaidmuo tenka techniniams metaduomenims, fiksuojantiems informaciją apie 

skaitmeninio objekto migravimą archyve; 

• pakavimą ir pateikimą: užtikrina skaitmeninio objekto prieinamumą, tarnauja statistikai, 

monitoringui ir kitiems tikslams. Jo paskirtis yra skaitmeninio objekto paieška, reikalingos 

skaitmeninio objekto kopijos paieška ir perdavimas į kreipties modulį. Šis procesas gali 

apimti tokias procedūras kaip reikalingos skaitmeninio objekto dalies radimas, kopijavimas 

arba viso teksto pridėjimas, tam tikras skaitmeninio objekto dalies reformatavimas peržiūrai, 

atspausdinimas; 

• kreiptį: užtikrina prieigą prie Archyvo skaitmeninių objektų. Šis procesas apima suradimo 

galimybių suformavimą, vartotojo identifikavimą, vartotojo teisių bei profilio nustatymą ir 

kt.; 

49

integravimą: į bendrą Lietuvos ir Europos mokslinių tyrimų elektroninio turinio erdvę. 

Truputį istorijos. Pagal Bendrojo programavimo dokumentą 2007-2013 metams, iš 2007- 

2013 metams 800 milijonų Lt skiriamų Informacinės visuomenės plėtrai, elektroninio turinio plėtrai 

bus skirta 70%, o infrastruktūros plėtrai, t.y., technikai 30%. Tai yra atvirkštinis santykis, lyginant 

su prieš tai buvusiu santykiu. Į informacinės visuomenės programą buvo įrašyta mokslinių duomenų 

archyvavimo finansavimas, kurio ankstesniame BPD dokumente nebuvo. Taigi, su naujojo BPD 

2007-2013 m. patvirtinimu atsivėrė naujos perspektyvos gauti finansavimą mokslinių duomenų 

archyvų kūrimui. HSM LiDA archyvas yra pirmasis visateksčių mokslinių duomenų archyvas, 

pradėtas kurti 2007 m. 

Tačiau, ar jis buvo kuriamas tuščioje vietoje? Suprantama, kad ne. Pirmiausia buvo 

pasinaudota Slovėnijos bei Vokietijos patirtimi, bei pasisemta patirties iš LNB kartu su partneriais 

vykdomo projekto „Integralios virtualios bibliotekų informacinės sistemos sukūrimas“ (projekto 

svetainė internete http://www.epaveldas.lt). 

50

LNB projektą verta paminėti, nes metodologine prasme jis buvo naudingas, formuojant 

LiDA lingvistinį aprūpinimą. Svarbiausia šio projekto ypatybė tai, kad jame dalyvauja trys 

skirtingos atminties institucijos: archyvai, muziejai ir bibliotekos. Todėl teko ne tik derinti skirtingus 

standartus, bet ir surasti sąlyčio taškus, parengti vieningą metaduomenų parengimo metodologiją, 

kuri galėtų būti atspindėta štai tokia schema: 

Iš schemos mes matome didžiulę įvairovę standartų, naudojamų dokumentų arba 

skaitmeninių objektų aprašymui. Pavyzdžiui, aprašo parengimui: archyvuose ISAD, bibliotekose 

ISBD, muziejuose RIS. 

Sukurto lingvistinio aprūpinimo esmę sudaro tai, kad jis užtikrino galimybę dalyvaujančioms 

institucijoms rengti savo metaduomenis taip, kaip yra įpratusios pagal savo taisykles ir savo srities 

standartus, o portale pateikiami tik labai lakoniški metaduomenys DC formatu. Štai iš čia matomo 

portalo http://www.epaveldas.lt per nuorodą į pirminę sistemą einama toliau į LNB, arba į Dailės 

muziejų ir susipažįstama su išsamiu aprašu. 

51

Ši idėja pasirodė priimtina ir projektuojant LiDA, todėl suformuotas LIDA lingvistinis 

aprūpinimas iš esmės yra grindžiamas čia pateiktu pavyzdžiu. 

LiDA lingvistinis aprūpinimas buvo suformuotas remiantis Lietuvos ir pasaulio šalių 

elektroninių archyvų, katalogų bei juos apibūdinančių dokumentų analize, siekiant nustatyti ir 

pasiūlyti optimaliausią LiDA metaduomenų turinį ir formą, kuo labiau atitinkančius šiuolaikinius 

reikalavimus, keliamus Europos elektroninio turinio prieigai bei siekiant suderinti su Lietuvos 

skaitmeniniu turiniu. 

Suformuotas lingvistinis aprūpinimas leido pasiūlyti HSM duomenų archyvo architektūrą, 

padedančią užtikrinti: 

• spartų duomenų perdavimą, vykdant atskiras užklausas bei operuojant dideliais duomenų 

kiekiais; 

• galimybę palaikyti daugialypės terpės dokumentus, sudarytus iš teksto ir atvaizdų; 

• paskirstyto pradinio duomenų apdorojimo galimybę, kuriai esant projekto partneriai gali 

patys parengti skaitmeninius fondus ir talpinti juos į bendrąją duomenų bazę; 

• archyve saugomiems formaliems dokumentams suteikti nuolatinius vardus. 

Lingvistinis aprūpinimas taip pat užtikrina virtualios sistemos archyvavimą ir objektų erdvės 

tvarkymą: 

• integruojant skaitmeninius objektus įvairiais formatais; 

• formuojant skaitmeninių objektų erdvę taip, kad ją galima kuo efektyviau pateikti paieškai 

ir skaitmeninių objektų pateikimui; 

• užtikrinant skirtingų metaduomenų ir formatų suderinamumą, parengus metaduomenų 

kodavimo sistemų sankirtas. 

HSM duomenų archyvo Lingvistinis aprūpinimas užtikrina monitoringo realizavimą. 

HSM duomenų archyvo Lingvistinis aprūpinimas užtikrins skaitmeninių objektų prieigos ir sklaidos 

realizavimą bei suderinamą su Lietuvos ir Europos skaitmeniniu turiniu: 

• sparčią prieigą prie skaitmeninių objektų saugomų KTU pagrindiniame skaitmeninės 

informacijos Archyve bei išsamių archyvinių aprašų projekto partnerių sistemose; 

• informacijos pateikimą internete per interneto sąsają; 

• patogią prieigą prie dokumentų pagal įvairius jų požymius; 

• paieškos rezultatų išdavimą pagal sąrašą, kuriame turi būti nurodomi užklausą atitinkantys 

dokumentai ar jų dalys. 

52

LiDA – archyvas 

Prieš pradedant LiDA kūrimą, reikėjo atsakyti į esminius klausimus, ar tai bus archyvas, 

atitinkantis archyvų srities ideologiją, standartus ir, ar tai bus visateksčių duomenų bazė. 

Atsižvelgiant į tai, kad į LiDA numatoma talpinti empirinius duomenis: gyventojų surašymų, namų 

valdų, rinkimų, visuomenės nuomonių apklausų ir tyrimų duomenys, akivaizdu, kad turi būti 

kuriamas archyvas, atitinkantis visus reikalavimus, keliamus archyvams. 

LiDA – tai HSM duomenų archyvas. Prieš pristatant mokslinių duomenų archyvavimo 

koncepciją, turime pateikti archyvo sąvoką, kurią mes suprantame kaip skaitmeninių objektų 

saugyklą, atliekančią tradicines kaupimo, saugojimo ir prieigos prie informacijos funkcijas bei 

paskirstytą sistema, platinančią turimą skaitmeninę informaciją bei aktyviai skatinančią bei 

palaikančią šios informacijos kūrimo procesą. 

Jeigu LiDA yra archyvas, tuomet teko susipažinti, pirmiausia, su archyvuose naudojama 

terminologija bei naudojamais standartais. 

Pagal kokius dokumentus ir standartus archyvuose kuriami metaduomenys? 

Pradžioje panagrinėkime fizinių objektų ir skaitmeninių objektų panašumus bei atitinkamus 

jų aprašymus (metaduomenis). Tradiciniai archyviniai fondai ir jų sudėtinės dalys atspindimi 

archyviniuose aprašuose, kurie padeda atitinkamai identifikuoti kiekvieną objektą, suteikia 

informacijos apie jo turinį, struktūrą, sukūrimo kontekstą bei leidžia vartotojui įvertinti, ar objektas 

gali būti jam naudingas. 

Siekiant pateikti rekomendacijas dėl archyvinio aprašo sudarymo, palyginome ISAD (G) 

(Pagrindinis Tarptautinis standartinis arhyvinis aprašymas, angl. General International Standard 

Archival Description 5 ) terminologiją su metaduomenų apibrėžimais: ISAD (G) nurodo, jog tai yra 

bendrosios archyviniams aprašams, nepriklausomai nuo aprašomo vieneto ir pobūdžio bei apimties, 

taisyklės. Jose nurodoma, kaip formuluoti informaciją kiekvienam iš 26 elementų, kurie išdėstyti 6 

pagrindinėse srityse (identifikavimo, konteksto, turinio ir sandaros, prieigos ir naudojimo sąlygų, 

sietinės medžiagos, pastabų), kurios leidžia sudaryti išsamų aprašomo objekto vaizdą. 

ISAD (G) garantuoja išsamių, tinkamų ir aiškių aprašų sudarymą, palengvina informacijos 

apie archyvinę medžiagą sudarymą, palengvina informacijos apie archyvinę medžiagą mainus ir 

paiešką, sudaro galimybę keistis autoritetiniais duomenimis, leidžia sujungti aprašus iš įvairių 

5 http://www.ica.org/en/node/30000 

53

saugyklų į vieningą informacijos sistemą. Todėl galima tvirtinti, kad archyvinis aprašas yra 

archyvinių objektų metaduomenys, kaip kad katalogų įrašai yra bibliotekų metaduomenys. 

Tuo atveju, kai fizinis archyvo objektas yra suskaitmenintas, būtina parengti prieigą prie jo 

turinio. Todėl iškyla būtinybė aprašyti skaitmeninio objekto vaizdą arba jo turinį. Jei objektas yra 

fondas, reikia sudaryti viso fondo archyvinį aprašą su jo hierarchine struktūra, atskleidžiančia jo 

struktūrines dalis. Šis procesas yra vadinamas "aprašomųjų metaduomenų" sudarymu. 

Jeigu archyvinis aprašas gali būti traktuojamas kaip „archyviniai metaduomenys“ ir jeigu 

archyvinis fizinių objektų aprašas ir archyvų skaitmeninių fondų metaduomenys yra, galima daryti 

išvadą, kad skaitmeniniai objektai yra aprašomi taip pat, kaip ir fiziniai objektai. Tai yra labai svarbi 

išvada, kuri gali būti pateikta schematiškai: 

Pagrindinės archyvinio aprašo charakteristikos yra aiškiai suformuluotos ISAD (G). Svarbiausia šio 

standartinio aprašo ypatybė yra ta, kad jis sudaro galimybę atspindėti archyvinį fondą taip, kaip jis 

egzistuoja. Tai reiškia, kad archyvinis aprašas pradedamas rengti nuo pagrindinio, aprašant 

specifinius entitetus, nuo fondo prie bylos (fizinės) ir atskirų jos vienetų. 

Todėl kuriant LiDA buvo nutarta laikytis tos pačios logikos, kurią diktuoja ISAD (G) – 

kurti hierarchinę archyvo struktūrą, išreiškiamą taip, kaip parodyta paveikslėlyje: 

54

Svarbu pastebėti, kad ISAD (G) tinka ir tradicinės formos objektų aprašui ir kompiuterinio 

archyvo objektų aprašui. Jeigu aprašomieji metaduomenys yra naudojami prieigai prie skaitmeninio 

fondo, hierarchinė metaduomenų struktūra turi užtikrinti prieigą prie kiekvieno atskiro fondo 

vieneto, saugomo archyve. Tuo pačiu metu, elektroninėje aplinkoje metaduomenys privalo atkurti 

loginį, o ne fizinį archyve saugomų objektų ryšį. 

Siekiant patenkinti šiuos reikalavimus, aprašomieji metaduomenys privalo turėti tokią pačią 

hierarchinę struktūrą kaip ir tradiciniai. Tai reiškia, kad jie turi būti suderinti su tarptautiniu 

archyviniu aprašu ISAD (G), kuris sudaro galimybę parengti archyvinio aprašo hierarchinę 

struktūrą. Kitaip tariant, pilnesnį ir patogesnį archyvų objektų bei duomenų bazių turinio aprašymą 

elektroninėje aplinkoje. 

Nors ISAD (G) tinka ir skaitmeniniams objektams aprašyti, vis dėl to skaitmeninių objektų 

aprašymui buvo sukurta keletas metaduomenų modelių, pavyzdžiui, Dublin Core, kuris yra šiuo 

metu vienas populiariausių ir Lietuvoje pripažintas šalies standartu (LST ISO 15836:2007: 

Informacija ir dokumentai. Dublin Core metaduomenų elementų grupė (tapatus ISO 15836:2003). 

Dublin Core schema susideda iš elementų. Ji gali palaikyti paprastą ryšį tarp dviejų 

skaitmeninių objektų, kadangi "ryšio" elementas, apibūdinamas kaip "nuoroda į susijusį išteklių" 

turi šiuos "kvalifikatorius": "dalis", "turi dalį". 

Tuo pačiu Dublin Core (DC), kaip ir kiti metaduomenys sukurti skaitmeniniams ištekliams, 

negali pilnai būti pritaikyti siekiant pilnai aprašyti archyvinį skaitmeninį išteklių. Be to, kai kurie 

DC elementai gali sukelti netgi tam tikrą sumaištį, pavyzdžiui, "informacija apie kūrėją". 

Archyvuose kiekvieno archyvinio vieneto aprašas yra reikšmingas tik kai yra aiškiai aprašytas 

55

fondo, kuriam jis priklauso, kūrėjas (angl. Creator). Tik tai kūrėjo istorija ir struktūra gali padėti 

vartotojui suprasti sąlygas, kuriomis dokumentas buvo sukurtas arba surinktas, kritiškai įvertinti 

dokumentų turinį. Šio tipo duomenys yra labai svarbūs aprašui. Būtent tokių duomenų ir trūksta 

Dublin Core. DC elementas vadinamas "kūrėju" yra apibūdinamas kaip už entitetų turinį pirminės 

atsakomybės sritis. Archyvams toks apibūdinimas nėra tinkamas. ISAD (G) kūrėją apibūdina kaip 

"Kolektyvas, šeima arba asmuo sukūręs, surinkęs arba turintis dokumentus savo personalinės 

arba kolektyvinės veiklos metu". 

Žmonės, atsakingi už dokumentų patalpinimą į fondus, dažniausiai skiriasi nuo kūrėjo. Taigi, 

atsižvelgiant į "kūrėjo" apibūdinimą, pateikiamą DC, yra tam tikras prieštaravimas. Jeigu 

naudojamas DC apibrėžimas, neįmanoma pažymėti arba nurodyti, kas surinko ir yra šio dokumento 

(archyvo) savininkas. Vėliau kalbėdami apie DDI kodifikatorių pastebime, jog tyrimo vykdytojas ir 

skaitmeninio dokumento kūrėjas yra atskirti. 

DC metaduomenų schemos sukūrimu buvo siekiama iki minimo sumažinti elementų skaičių, 

siekiant aprašyti skaitmeninius išteklius. Beje, DC yra tik bibliografinis modelis, kuris negali būti 

pakankamai efektyviai pritaikytas, aprašant archyvinius objektus. Todėl praktika rodo, jog be galo 

sunku parengti korektiškus archyvinius aprašus, panaudojant šią metaduomenų schemą. O tai savo 

ruožtu apsunkins ir skaitmeninių objektų paiešką. 

Vėlesnės DC versijos buvo praturtintos semantinėmis priemonėmis. "Kvalifikatorių" dėka 

buvo sudaryta galimybė tiksliau aprašyti kūrėją, pavyzdžiui 

Rengiant Lietuvos HSM duomenų archyvinio aprašo sudarymo taisykles bei kuriant HSM 

duomenų archyvą pirmiausia reikėjo apsispręsti dėl skaitmeninių objektų aprašo išsamumo. Reikėjo 

atsakyti į klausimą, ar skaitmeninio aprašymui pakaks Dubline Core laukų, kuris yra skiriamas 

išteklių pateikimui internete, ar reikės naudoti kitą metaduomenų standartą. 

Siekiant išlaikyti tradiciniuose archyvuose tvarką ir logiką, kuri yra išreiškiama tokia 

schema, buvo pasirinkta, jog privalom sukurti hierarchinę LiDA struktūrą, kuri leistų aprašyti fondą 

taip: pirmiausia parengti failų apyrašą, kuris archyvų standartuose – ISAD (G) vadinamas serija, po 

to atskirą failą, ir jam atskirus esančius dokumentus. Apsisprendus dėl tokios LiDA hierarchinės 

struktūros, tapo akivaizdu, kad DC, nors ir yra skaitmeninių išteklių standartas neužtikrinus tokio 

detalaus duomenų aprašymo. Reikėjo ieškoti schemos, leidžiančios parengti tokio pobūdžio 

metaduomenis ir labiausiai atitinkančius socialinę-humanitarinę mokslų specifiką. 

LiDA archyvinio saugojimo metaduomenų sudarymui buvo pasiūlyta naudoti DDI 

kodifikatorių, leidžiantį apibūdinti bet kokio struktūrinio lygmens išteklius: fondą, atskirą išteklių, 

ištekliaus sudėtinę dalį. 

56

Metaduomenys 

Labai svarbus LiDA lingvistinio aprūpinimo elementas yra metaduomenys. Metaduomenys 

yra struktūriškai apibrėžta informacija, kuri apibūdina, paaiškina dokumentą ar informacinį išteklių, 

nurodo jo buvimo vietą arba kitokiu būdu palengvina jo suradimą, naudojimą arba valdymą. 

Metaduomenys yra informacija apie bet kokio tipo ar rūšies informacijos išteklių. 

Šie duomenys apibūdina tokius informacijos išteklių aspektus: 

• Turinio informacija – vidinė charakteristika, apibūdinanti intelektualiąją informaciją, 

teikiamą informacijos išteklių (pavyzdžiui, tematika, žanras); 

• Konteksto informacija – išorinė charakteristika, apibūdinanti duomenis, susijusius su 

veiksmais informacijos išteklių atžvilgiu (kas, kada, kur, kaip sukūrė/pakeitė/atnaujino arba 

atliko kitus veiksmus su konkrečiu dokumentu); 

57

• Struktūros informacija – vidinė ar išorinė charakteristika, apibrėžianti formalius ryšius 

išteklių viduje ar tarpusavyje. Pavyzdžiui, kai aprašomos dokumento dalys (skyriai, tomai, 

straipsniai), nurodomas jų ryšys su visu dokumentu (vidiniai ryšiai), o kai informacija apie tą 

patį įvykį pateikta skirtinguose informacijos ištekliuose, metaduomenys nurodo į išorinius 

ryšius. 

Lygiai kaip, pavyzdžiui, kataloguotojai nusprendžia, ar katalogo įrašas bus kuriamas visam 

rinkiniui, ar atskirai kiekvienam tomui, taip ir metaduomenų kūrėjas priima panašius sprendimus. 

Metaduomenys taip pat gali būti naudojami bet kuriame informacinio modelio, kurio pagrindu 

sukurti IFLA Funkciniai reikalavimai bibliografiniams įrašams, lygmenyje (kūrinys, išraiška, 

apraiška, dokumentas). Pavyzdžiui, metaduomenų įrašas gali apibūdinti pranešimą, konkrečią 

pranešimo laidą arba atskirą tos pranešimo laidos kopiją. Metaduomenys gali būti įterpti į 

skaitmeninį objektą arba gali būti saugomi atskirai nuo jo. Jie dažnai įterpiami į HTML dokumentus 

ir atvaizdo failų antraštes. 

Metaduomenų saugojimas kartu su jų apibūdinamu objektu užtikrina, kad jie nebus 

prarandami, panaikina duomenų ir metaduomenų susiejimo problemas bei garantuoja, kad kartu su 

objektu bus atnaujinami ir metaduomenys. 

Metaduomenų rūšys 

Pagrindinės metaduomenų funkcijos yra palengvinti skaitmeninių informacijos išteklių 

identifikavimą, vietos nustatymą, išrinkimą, valdymą, naudojimą ir saugojimą tinklinėje aplinkoje. 

Pagal šias funkcijas skiriamos tokios metaduomenų rūšys: 

1. Aprašomieji metaduomenys – tai duomenys, kurie identifikuoja ir apibūdina patį 

informacijos išteklių. Pateikiami pagrindiniai dokumento atributai – kūrėjas (autorius, 

sudarytojas ir pan.), antraštė, dalykas, anotacija ir pan. Tokių metaduomenų pavyzdys – 

katalogo įrašai, pagalbinės rodyklės. 

2. Administravimo metaduomenys yra susiję su atliekamų procesų valdymu. Jie apima įvairius 

technologinius procesus: komplektavimas, skaitmeninimas, autorių teisių apsauga, 

dokumentų priežiūros veiksmai (konservavimas, restauravimas, skaitmeninimas). 

Administravimo metaduomenys paprastai skirstomi į: 

• Autorių teisių valdymo – apibrėžia intelektinės nuosavybės teises ir su jomis susijusias 

naudojimo taisykles bei apribojimus. 

58

• Išsaugojimo – dokumentuoja visus veiksmus, nukreiptus į informacijos išteklių išsaugojimą. 

Tai yra informacija apie fizinę dokumento būklę, atliktus restauravimo, konservavimo, 

skaitmeninimo veiksmus, skaitmenintų ar skaitmeninių dokumentų formatų atnaujinimą ir 

pan. 

• Techninius – ši metaduomenų rūšis siejasi su skaitmeninių ir skaitmenintų išteklių valdymu. 

Skaitmeninėje aplinkoje informacijos išteklių prieinamumas ir išsaugojimas priklauso nuo 

įvairių techninių parametrų – programinės ir techninės įrangos, kuria naudojantis buvo 

sukurti dokumentai, bylų formatų ir suspaudimo metodų ir pan. 

• Naudojimo – metaduomenys, fiksuojantys informacijos išteklių naudojimo pobūdį. (Kaip 

įvairių formatų išteklius galima panaudoti įvairiems tikslams, pavyzdžiui, parodoms.) 

Naudojimo metaduomenys fiksuoja ir pačią vartotojo ir ištekliaus sąveiką (pavyzdžiui, gali 

teikti informaciją apie vartotojo statusą ir jam leidžiamus atlikti veiksmus). 

Metaduomenys paaiškina bet kokio lygio informacijos rinkinius – gali aprašyti 

kolekcijas, atskirą išteklių ar didelio ištekliaus sudedamąją dalį (pavyzdžiui, fotografiją straipsnyje). 

Metaduomenys taip pat gali būti naudojami aprašyti bet kokio lygio informacijos modeliams, 

išvardintiems IFLA (Tarptautinė bibliotekų asociacijų ir jų įstaigų federacija, angl. The International 

Federation of Library Associations and Institutions 6 ) Funkciniuose bibliografinių įrašų 

reikalavimuose (angl. Functional Requirements for Bibliographic Records): darbams, posakiams, 

įrodymams ar užrašams. Pavyzdžiui, metaduomenų įrašas gali aprašyti konferencijos pranešimą arba 

šio pranešimo specialią kopiją. 

Metaduomenų įrašo struktūra 

Metaduomenų įrašas susideda iš tam tikro skaičiaus iš anksto apibrėžtų elementų, 

reprezentuojančių informacijos ištekliaus savybes. Tokių elementų ir jų naudojimo taisyklių rinkinys 

vadinamas metaduomenų schema, nurodanti, kaip ir kokius duomenis apie išteklių būtina pateikti. 

Kiekviena metaduomenų schema paprastai turi ribotą skaičių elementų, kiekvienas elementas turi 

vardą ir atskirą reikšmę. Pačių elementų apibrėžimas ar reikšmė yra žinoma kaip schemos 

semantika. Reikšmės, duotos metaduomenų elementams, yra turinys. Metaduomenų schemos 

paprastai tiksliai apibrėžia elementų vardus ir jų semantiką. Dar schemos gali nusakyti turinio 

taisykles, kaip turinys turi būti formuluojamas (pavyzdžiui, kaip identifikuoti pagrindinį 

6 http://www.ifla.org/ 

59

pavadinimą), turinio atvaizdavimo taisykles (pavyzdžiui, rašybos didžiosiomis raidėmis taisyklės), 

leidžiamas turinio reikšmes (pavyzdžiui, terminai turi būti naudojami iš specialaus kontrolinio 

žodyno). 

Taip pat metaduomenų schema gali pasižymėti specifine sintakse (gali būti metaduomenų 

schema nepriklausoma nuo sintaksės, tai yra be sintaksę nurodančių taisyklių). Sintaksė 

reglamentuoja metaduomenų elementų ir jų turinio kodavimą bei pateikimą elektroninėje terpėje. 

Kodavimui naudojamos vadinamosios žymių kalbos (angl. markup languages) – formalių taisyklių 

ir įrankių rinkinys, kuris leidžia pateikti ir interpretuoti (pavyzdžiui, formatuoti, keistis duomenimis 

tarp įvairių sistemų ir pan.) duomenis skaitmeninėje aplinkoje. Dauguma dabartinių metaduomenų 

schemų naudoja SGML (angl. Standard Generalized Mark-up Language) arba XML (angl. 

Extensible Mark-up Language). SGML labai sudėtinga, todėl dažnai naudojamasi jos poaibiais. 

Ilgainiui paplito SGML poaibis – XML kalba, kuri leidžia aprašyti ir formaliąsias dokumento 

savybes, ir informacijos išteklių turinį, atspindėti metaduomenų elementus ir jų tarpusavio ryšius. 

Dublin Core metaduomenų iniciatyva 

Dublin Core metaduomenų iniciatyvos (angl. Dublin Core, toliau DC) elementų rinkinio 

atsiradimas siejamas su seminaru, vykusiu 1995 Dubline (JAV, Ohio valstija). Šio standarto 

sukūrimą paskatino didėjančių internete prieinamos informacijos masyvų valdymo problemos, nes 

tapo aišku, kad bibliotekininkai nepajėgs vieni registruoti interaktyvius dokumentus. Šio standarto 

esmė – sukurti paprastą metaduomenų schemą, kuri leistų ne profesionalams (pavyzdžiui, leidėjams, 

autoriams) patiems aprašyti elektroninius informacijos išteklius. 

Lietuvoje skaitmeninės interneto informacijos aprašymui buvo patvirtintas LST ISO 

1586:2007. 

Standartą sudaro 15 elementų: 

• Antraštė (angl. Title) – dokumento pavadinimas; 

• Kūrėjas (angl. Creator) – dokumento autorius (pavyzdžiui, asmuo, organizacija, atsakingi už 

dokumento turinį); 

• Tema (angl. Subject and Keywords) – dokumento tematika. Nustatant dalyką ir reikšminius 

žodžius rekomenduojama remtis kontroliuojamais žodynais ar klasifikacijos schemomis. 

• Aprašas (angl. Description) – dokumento turinio santrauka (pavyzdžiui, turinys, laisvos 

formos trumpas turinio aprašymas); 

60

• Leidėjas (angl. Publisher) – įstaiga, asmuo ir pan., išleidę dokumentą; 

• Teikėjas (angl. Contributor) – asmuo, organizacija, atsakinga už informacijos ištekliaus 

turinio teikinius; 

• Data (angl. Date) – reikšmingos dokumento gyvavimo datos (pavyzdžiui, kūrimo, 

atnaujinimo ir kt.). Nurodant datą rekomenduojama vadovautis ISO 8601 standartu; 

• Rūšis (angl. Resource Type) – ištekliaus žanras, paskirtis ir pan. Nustatant ištekliaus rūšį 

patartina naudotis kontroliuojamais žodynais; 

• Formatas (angl. Format) – fizinio ar skaitmeninio ištekliaus parametrai (pavyzdžiui, 

laikmena, dydis, techninė ir programinė įranga). Formatui nustatyti rekomenduojama 

pasitelkti kontroliuojamus žodynus; 

• Identifikatorius (angl. Resource Identifier) – adresas ar skaitmenų eilutė, identifikuojantį 

išteklių, pavyzdžiui, ISBN, Uniform Resource Locator (Unifikuotas ištekliaus adresas), 

Digital Object Identifier (Skaitmeninio objekto identifikatorius); 

• Šaltinis (angl. Source) – dokumentas, kuriam priklauso aprašomas išteklius (pavyzdžiui, 

rinkinys, kuriame yra skyrius ar straipsnis); 

• Kalba (angl. Language) – kalba, kuria parašytas dokumentas. Kalbos santrumpų pateikimui 

rekomenduojama naudotis RFC3066 ir ISO639 standartais; 

• Sąsaja (angl. Relation) – nuoroda į susijusius išteklius; 

• Aprėptis (angl. Coverage) – dokumento turinio geografinės (vietovės pavadinimas), laiko 

(datos), institucinės priklausomybės charakteristikos. Rekomenduojama naudotis 

kontroliuojamais žodynais; 

• Teisės (angl. Rights management) – intelektinės nuosavybės teisių informacija. 

Visi DC elementai yra neprivalomi ir visi kartojami. Elementai gali būti atvaizduojami bet 

kokia tvarka. Atvaizdavimo tvarką gali reglamentuoti žymių kalba. DC metaduomenų schema yra 

nepriklausoma nuo sintaksės. Ir paprastam ir išplėstam DC metaduomenų elementų rinkiniui 

išreikšti gali būti naudojamos įvairios žymių kalbos. 

Populiarus DC metaduomenų schemos naudojimo modelis – pritaikymas savo reikmėms. 

Kadangi schemos naudojimo taisyklės leidžia ją papildyti, dažniausiai pagrindinių elementų skaičius 

papildomas trūkstamais ir reikiamais specifinės srities elementais. Teoretikai tai vertina ir kaip 

privalumą, nes standartas pritaikomas įvairiausiems projektams, ir kaip trūkumą, kadangi taip 

kuriamos visiškai naujos metaduomenų schemos. Dauguma projektų, naudojančių šį metaduomenų 

61

standartą, suprato, jog reikia kurti papildomus elementus ir taisykles – o tai daug pastangų ir laiko 

reikalaujantis darbas. 

Dublin Core ir LiDA 

Archyvuose informacija saugoma keliais lygiais. Tai iliustruoja paveikslėlis: Fondas – tai 

archyve saugoma atskira talpykla. Toje talpykloje gali būti keli vienos grupės failai (bylos). Tuose 

failuose gali būti keli dokumentai. Tai hierarchinė struktūra. Archyvuose saugant informaciją yra 

labai svarbu turėti metaduomenis apie kiekvieną iš šių lygių. Taigi – metaduomenys turi būti 

hierarchinės struktūros. 

Dublin Core branduolio metaduomenų schema gali būti pritaikoma LiDA archyvui kelis 

kartus kartojant tuos pačius elementus. Tačiau tai nėra efektyvu. Todėl buvo nuspręsta ieškoti 

empiriniams duomenims tinkamesnio metaduomenų standarto. 

DDI 

Politinių ir socialinių mokslų tyrimų tarpuniversitetinio konsorciumo (angl. Inter-University 

Consortium for Political and Social Research - ICPSR) projektas Duomenų aprašymo iniciatyva 

(angl. Data Documentation Initiative, toliau DDI) buvo pradėtas 1994 m. Jo tikslas – sukurti 

tarptautinį XML pagrįstą standartą socialinių ir humanitarinių mokslų srities mokslinių tyrimų 

duomenų turiniui ir struktūrai aprašyti, sudarytam aprašui (metaduomenims) atvaizduoti, išsaugoti ir 

keistis. 

DDI paskirtis ir struktūra 

Socialiniuose moksluose metaduomenys apie duomenų rinkinius dažnai vadinami 

kodifikatoriais (angl. codebooks). DDI kodifikatoriai kuriami unifikuotu, griežtai struktūriškai 

sutvarkytu formatu, kuris yra lengvai ir tiksliai paieškomas internete, gali būti tuo pačiu metu 

naudojamas daugialypių duomenų rinkinių, taip pat gali žymiai pagerinti metaduomenų turinį ir 

naudojimą. DDI leidžia hierarchiškai aprašyti: 1) socialinių ir humanitarinių mokslų tyrimus; 2) 

duomenų failus, sukurtas pagal tuos tyrimus; 3) kintamuosius, naudotus tuose duomenų failuose. 

DDI kodifikatorius yra XML dokumento tipo apibrėžtis (DTD), nurodanti elementus, iš 

kurių dokumentas yra sudarytas, tų elementų ypatybes ir loginius ryšius su kitais elementais. DDI 

sudaro per 300 metaduomenų elementų ir atributų, dauguma kurių yra neprivalomi naudoti. Visų šių 

62

elementų vaidmuo ir naudojimas apibrėžtas Žymių bibliotekoje (angl. Tag Library). Elementai 

kodifikatoriuje yra išdėstyti hierarchiškai. 

DDI kodifikatorius susideda iš 5 elementų blokų: 

1. Dokumento aprašymas (angl. Document Description), kurį sudaro bibliografinė informacija, 

paaiškinanti patį kodifikatorių (metaduomenų dokumentą) ir šaltinius, kurie buvo panaudoti 

kodifikatoriui sukurti. 

2. Mokslinio tyrimo aprašymas (angl. Study Description) – elementai, aprašantys atliktą 

mokslinį tyrimą (tyrimo pavadinimas, tyrimo atlikimo metodologija, duomenų turinio 

aprėptis, duomenų prieiga ir pan.). 

3. Duomenų failų aprašymas (angl. Data Files Description) – pateikiama informacija apie 

kiekvieną atskirą failą, kuriame saugomi mokslinio tyrimo duomenys. Tai duomenys apie 

duomenų failo formatą, apimtį, struktūrą, nurodoma failo paleidimo informacija ir pan. 

4. Kintamųjų aprašymas (angl. Variables Description) – elementai, paaiškinantys kintamuosius 

duomenų rinkinyje (formatą, kintamųjų ir reikšmių žymėjimą, apibrėžimus ir pan.). Trečias 

blokas pateikia fizinį mokslinio tyrimo duomenų rinkinio aprašymą, o šis blokas – loginį. 

5. Kita su tyrimu susijusi medžiaga (angl. Other Related Materials) – kiti su moksliniu tyrimu 

susiję dokumentai ar elektroniniai failai (bibliografija, atskiras apklausos elektroninis 

dokumentas, ataskaitos ir pan.). 

Pagrindinis DDI tikslas buvo apibrėžti rinkinį visų galimų elementų ir atributų, naudojamų 

socialinių ir humanitarinių mokslų tyrimų duomenų rinkiniams aprašyti. Todėl rezultate gauta labai 

didelės apimties specifikacija. Į ją galima sudėti bet kokią informaciją, kokia duomenų kūrėjui ar 

naudotojui pasirodys esanti susijusi su duomenų rinkiniu. DDI komitetas sunkiai priėjo sprendimo 

nustatant, kokie elementai yra privalomi, o kokie rekomenduojami. DDI komitetas nustatė „griežtai 

rekomenduojamų“ elementų sąrašą, kurį sudaro 14 elementų, atitinkančių Dublino branduolio (angl. 

Dublin Core) standartą, bei kiti 30 elementų. Taip pat atskiros bendruomenės ir organizacijos 

pradėjo apsibrėžti savus privalomų DDI elementų sąrašus. Tokiu pavyzdžiu gali būti CESSDA 

(angl. Council of European Social Science Data Archives 7 ) DDI projekto grupė, kuri nustatė DDI 

naudojimo taisykles Europos socialinių mokslų duomenų archyvams. Remiantis šiomis 

rekomendacijomis buvo sudarytas šis LiDA kodifikatorius. 

LiDA metaduomenų sąsaja su bibliotekų katalogų įrašais 

7 http://www.nsd.uib.no/cessda/home.html 

63

Siekiant platesnės humanitarinių ir socialinių mokslinių duomenų sklaidos bei kuriamo archyvo 

suderinanmumo su kitomis Lietuvos mokslo įstaigomis, akademinėmis bei mokslinėmis 

bibliotekomis, turi būti galimybė konvertuoti LiDA patalpintų skaitmeninių tyrimų/studijų 

metaduomenis į MARC21 formatą, kuris naudojamas mūsų šalies ir užsienio šalių bibliotekų 

katalogams sudaryti. Šiam tikslui žemiau pateikiama konvertavimo lentelė, leidžianti LiDA archyvo 

metaduomenis konvertuoti į MARC21 formatą. Perspektyvoje reikėtų parengti ir konvertorių į 

UNIMARC formatą, kurį naudoja daugelis Lietuvos ir užsienio šalių bibliotekų. 

DDI, Dublin Core, MARC21 elementų sankirtos 

Sudaryta pagal Mapping to Dublin Core 8 ir Field Mapping Table 9 . 

DDI elemento žyma DDI elemento pavadinimas DC elementas 

2.1.1.1 Tyrimo ar duomenų rinkinio antraštė Antraštė 

MARC21 

elemento žyma 

245 0?$a 

245 0?$b 

2.1.2.1 

Tyrimo ar duomenų rinkinio pirminė 

atsakomybė 

Kūrėjas 

245 0?$c 

700 1#$a 

2.2.1.1 

2.2.1.2 

Reikšminiai žodžiai 

Temų klasifikatorius 

Tema 

650 #7$a 

653 0#$a 

2.2.2 Santrauka Aprašas 520 3#$a 

2.1.3.1 Tyrimo ar duomenų rinkinio leidėjas Leidėjas 260 ##$b 

2.1.3.6 

Tyrimo ar duomenų rinkinio finansavimo 

šaltinis 

2.1.2.2 Kiti tyrimo ar duomenų rinkinio autoriai Teikėjas 

2.1.3.3 

Tyrimo ar duomenų rinkinio išleidimo 

data 

Data 

2.1.4.5 

Tyrimo ar duomenų rinkinio platinimo 

data 

2.2.3.10 Duomenų rūšis Rūšis 

3.1.5 Failo tipas Formatas 

536 ##$a 

700 1#$a 

710 2#$a 

260 ##$c 

260 ##$d 

008 

260 ##$c 

8 

http://www.ddialliance.org/related/dc.html 31 psl. yra parašyta kada pažiūrėta ir pavadinimas puslapio. Suvienodinti 

reikia su 2-3 išnaša? 

9 

http://www.icpsr.umich.edu/ICPSR/or/metadata/table.html 

64

2.1.1.5 

2.3.1.8 

Tyrimo ar duomenų rinkinio 

identifikacinis numeris 

Tyrimo ar duomenų rinkinio šaltinių 

duomenys 

Identifikatorius 

Šaltinis 

-- -- Kalba 10 

2.5 

Kita su tyrimu ar duomenų rinkiniu 

susijusi medžiaga 

2.2.3.1 

Tyrimo ar duomenų rinkinio laiko 

aprėptis 

2.2.3.2 Duomenų surinkimo data 

2.2.3.3 Šalis 

2.2.3.4 

2.1.3.2 

Tyrimo ar duomenų rinkinio geografinė 

aprėptis 

Autorinės teisės į tyrimą ar duomenų 

rinkinį 

Sąsaja 

Aprėptis 

Teisės 

001 

035 ##$a 

490 1#$v 

830 #0$v 

786 1#$a 

786 1#$t 

786 1#$d 

041 0#$a 

041 0#$9 

787 1#$a 

787 1#$t 

787 1#$d 

518 ##$a 

522 ##$a 

506 ##$a 

506 ##$e 

506 ##$g 

590 ##$a 

590 ##$9 

2.1.5.1 

Tyrimo ar duomenų rinkinio serijos 

antraštė 

490 1#$a 

830 #0$a 

2.1.6.1 Tyrimo versija 250 ##$a 

2.2.3.9 Populiacija 567 ##$a 

2.3.1.4 Duomenų atrankos procedūra 567 ##$a 

2.3.1.6 Duomenų rinkimo metodas 567 ##$a 

2.4.1.4 Duomenų rinkinio dydis 516 ##$a 

2.4.2.7 

Prieigos prie tyrimo duomenų rinkinio 

sąlygos 

506 ##$a 

3.1.1 Duomenų failo antraštė 505 0#$a 

10 DDI schemoje kiekvienas elementas turi atributą xml:lang 

65

Empirinių duomenų aprašymo standartas ir jo taikymas archyvo reikmėms 

Toliau pateikiamas LiDA archyve talpinamiems duomenų rinkiniams atprašyti surarytas standartas. 

DDI skyrius 

Tyrimo 

kodifikatoriaus 

aprašas 

Tyrimo 

aprašymas 

DDI 

Nr. 

DDI žyma 

su nuoroda į 

aprašymą 

(angl.) 

Lauko žymos 

pavadinimas 

(ang.) 

Lauko žymos 

pavadinimas 

Lauko žymos turinys 

(aprašymas) 

1.1.1.1 titl Title Dokumento antraštė Pagrindinė dokumento 

antraštė 

1.1.1.2 subTitl Subtitle Paantraštė Antraštė, paaiškinanti ar 

patikslinanti pagrindinę 

antraštę 

1.1.1.3 altTitl Alternative Title Alternatyvi antraštė Kita dokumento antraštė 

1.1.1.4 parTitl Parallel Title Lygiagreti antraštė Pagrindinė dokumento 

1.1.1.5 IDNo Identification 

number 

1.1.3.5 software Software used in 

Production 

Identifikacinis 

numeris 

Naudojama 

programinė įranga 

antraštė kita kalba 

Unikalus dokumento numeris, 

sudaromas pagal archyvo 

patvirtintas taisykles 

Programinės įrangos 

pavadinimas, versija ir 

įdiegimo data 

2.1.1.1 titl Title Tyrimo antraštė Pagrindinė tyrimo antraštė 

2.1.1.2 subTitl Subtitle Paantraštė Antraštė, paaiškinanti ar 

patikslinanti pagrindinę 

antraštę 

2.1.1.3 altTitl Alternative Title Alternatyvi antraštė Kita tyrimo antraštė 

2.1.1.4 parTitl Parallel Title Lygiagreti antraštė Pagrindinė tyrimo antraštė kita 

2.1.1.5 IDNo Identification 

number 

2.1.2.1 AuthEnty Authoring 

Entity/Primary 

Investigator 

2.1.2.2 othId Other 

Identifications/Ack 

nowledgments 

Identifikacinis 

numeris 

Pirminės 

atsakomybės 

duomenys 

kalba 

Unikalus tyrimo numeris, 

sudaromas pagal archyvo 

patvirtintas taisykles 

Asmuo ar organizacija, atlikę 

tyrimą 

Kiti tyrimo autoriai Kitas asmuo ar organizacija, 

atlikę tyrimą 

2.1.3.1 producer Producer Leidėjas/gamintojas Asmuo ar organizacija 

atsakingi už tyrimą 

2.1.3.2 copyright Copyright Autorinė teisė Asmuo/organizacija turinti 

autorines teises į tyrimą 

2.1.3.3 prodDate Date of Production Išleidimo data Tyrimo atlikimo (pabaigos) 

data 

2.1.3.4 prodPlac Place of Production Leidimo vieta Tyrimo atlikusios 

organizacijos adresas 

2.1.3.6 fundAg Fundings Finansavimo šaltinis Tyrimą užsakęs 

asmuo/organizacija 

2.1.4.1 distrbtr Distributor Platintojas Organizacija atsakinga už 

tyrimo duomenų sklaidą 

2.1.4.2 contact Contact Persons Kontaktiniai asmenys Už archyve kaupiamus tyrimo 

duomenis atsakingo asmens 

informacija, skirta 

vartotojams, kuriems gali kilti 

klausimų dėl tyrimo duomenų 

naudojimo tvarkos 

2.1.4.3 depositr Depositor Pateikėjas Asmuo/organizacija, pateikę 

66

2.1.4.4 depDate Date of Deposit Pateikimo data 

tyrimą į archyvą 

Tyrimo pateikimo į archyvą 

data 

2.1.4.5 distDate Date of 

Platinimo data Tyrimo, esančio archyve, 

Distribution 

2.1.5.1 serName Series Name Serijos (apyrašo ar 

failų sąrašo) 

pavadinimas 

sklaidos pradžia 

Serijos (apyrašo-failų sąrašo), 

kuriai priklauso tyrimas, 

pavadinimas 

2.1.5.2 serInfo Series Information Serijos informacija Serijos, kuriai priklauso 

tyrimas, istorija ir įvairių 

2.1.7 biblCit Bibliographic Bibliografinis aprašas 

ypatybių reziumė 

Išsamus tyrimo bibliografinis 

Citation 

aprašas 

2.1.8 holdings Holdings 

Fiziniai vienentai Informacija apie aprašomo 

Information 

tyrimo fizinius ar elektroninius 

vienetus 

2.2.1.1 keyword Keywords Reikšminiai žodžiai Reikšminiai žodžiai 

(rekomenduojama 3-5) 

pasirenkami naudojantis 

kontroliuojamu žodynu 

(tezauru) 

2,2.1.2 topcClas Topic 

Temų klasifikatorius Pagrindinė tyrimo tema, 

Classification 

pasirenkama iš kontroliuojamo 

žodyno (tezauro) 

2.2.2 abstract Abstract Tyrimo santrauka Tekstas, trumpai apibūdinantis 

tyrimo tikslą, esmę ir apimtį 

(rekomenduojama 200-500 

žodžių) 

2.2.3.1 timePrd Time Period Tyrimo laikotarpis Tyrimo atlikimo laikotarpis 

2.2.3.2 collDate Dates of Collection Duomenų surinkimo Duomenų surinkimo 

data 

laikotarpis 

2.2.3.3 nation Countries Šalis Šalis(-ys), kurioje(-iose) 

surinkti duomenys 

2.2.3.4 geogCover Geographic Geografinė aprėptis Geografinė vieta(-os), 

Coverage 

kurioje(-iose) surinkti 

duomenys 

2.2.3.5 geogUnit Geografic Unit Geografinis vienetas Geografinis vienetas(-ai), 

kuriame(-iuose) surinkti 

duomenys (apskritis, rajonas, 

miestas ir kt.) 

2.2.3.6 

/ 

2.2.3.8 

2.2.3.7 

/ 

2.2.3.9 

2.2.3.8 

/ 

2.2.3.1 

0 

anlyUnit Unit or analysis 

(Nesstare) 

Tyrimo objektas Pagrindinis tyrimo analizės ar 

stebėjimo objektas, esantis 

sudėtine bendro tyrimo dalimi. 

Tai gali būti asmuo, šeima, 

institucija, organizacija, 

administracinis vienetas ir 

universe Universe Tiriamoji grupė Grupė asmenų ar kitų tyrimo 

elementų, kurie yra tyrimo 

objektas ir su kuriais susijęs 

pan. 

tyrimo rezultatas 

dataKind Kind of Data Duomenų rūšis Duomenų rūšis naudota 

tyrimui (apklausos ar pžvalgos 

duomenys, administracinių 

įrašų duomenys, eksperimentų 

duomenys, psichologiniai 

67

testai, tekstiniai duomenys, 

koduoti dokumentai ir pan.) 

2.2.4 notes Notes and 

Comments 

Pastabos 

2.3.1.1 timeMeth Time Method Laiko metodas Tyrimo periodiškumas 

(vienkartinis, daugkartinis) 

2.3.1.2 dataCollecto Data Collector Duomenų rinkėjas Asmuo/organizacija, atsakinga 

r 

už apklausos, interviu ar kt. 

duomenų surinkimą 

2.3.1.3 frequenc Frequency of Data Duomenų rinkimo 

Collection dažnumas (jei rinkta 

per keletą kartų, kas 1 

metai, kas 10 metų ir 

pan.) 

2.3.1.4 sampProc Sampling 

Procedure 

Atrankos metodas Tyrimo atrankos metodas 

2.3.1.6 collMode Mode of Data Duomenų rinkimo Metodas naudotas duomenims 

Collection metodas 

rinkti 

2.3.1.7 resInstru Type of Research Tyrimo 

Priemonė, naudota duomenims 

Instrument instrumentarijus rinkti 

2.3.1.8 sources Data Sources Duomenų šaltiniai Šaltiniai, naudoti duomenims 

rinkti (apklausos, stebėjimo 

dokumentų analizės, 

statistiniai kitų tyrimų 

duomenys ir pan.) 

2.1.3.9 collSitu Characteristics of Duomenų rinkimo Svarbių duomenų rinkimo 

Data Collection aplinkybės 

aplinkybių paaiškinimas 

(respondentų 

bendradarbiavimas ir pan.) 

2.3.1.1 weight Weighting Duomenų svėrimas Jei duomenys buvo sverti, 

2 

pateikiami svėrimo aprašymai 

2.3.1.1 cleanOps Cleaning 

Valymo veiksmai Duomenų rinkinio išvalymo 

3 

Operations 

procedūros 

2.3.2 notes Notes and 

Comments 

Pastabos 

2.3.4 stdyClas Class of Study Tyrimo būsena Nurodomas tyrimo būsenos 

numeris arba įrašomas tekstas, 

paaiškinantis tyrimo būseną 

2.4.1.1 accsPlac Locations of Data Duomenų rinkinio Tyrimo skaitmeninio objekto 

Collection saugojimo vieta saugojimo vieta(-os), 

pateikiant jo tikslų elektroninį 

adresą 

2.4.1.2 origArch Original Archive Archyvas, kuriame Archyvas, iš kurio buvo 

Where Collection saugomas tyrimo surinkti tyrimo duomenys. 

Stored 

originalas 

Pirminis archyvas 

2.4.1.3 avlStatus Availability Status Prieigos sąlygos Tyrimo skaitmeninio objekto 

prieigos sąlygos. Jas nustato 

tyrimo autoriai, 

vadovaudamiesi archyvo 

naudojimosi taisyklėmis 

2.4.1.4 collSize Extent of 

Duomenų rinkinio Duomenų rinkinio failų kiekis, 

Collection dydis 

įskaitant tik tuos failus, 

kuriuose yra tyrimo duomenys 

2.4.1.6 fileQnty Number of Files Tyrimo duomenų 

failų skaičius 

Nurodomas failų skačius 

2.4.2.1 confDec Confidentiality Respondentų asmens 

Declaration Text duomenų apsaugos 

reikalavimai 

68

Tyrimo failų 

aprašymas 

2.4.2.3 restrctn Restrictions Apribojimai Naudojimosi tyrimo 

duomenimis apribojimai pagal 

2.4.2.5 citReq Citation 

Requirement 

2.4.2.6 deposReq Deposit 

Requirement 

LiDA prieiga ir metaduomenų peržiūra 

LiDA archyvo katalogas per Nesstar WebView 

Citavimo 

reikalavimai 

Pateikimo į archyvą 

reikalavimai 

LiDA archyvas yra prieinamas per projekto svetainę http://www.lidata.eu.lt: 

archyvo taisykles 

Publikacijos, parengtos tyrimo 

duomenų pagrindu, turi būti 

cituojamos kaip šaltiniai 

nuorodose ar literatūros 

sąraše. 

Reikalavimai vartotojams, 

norintiems kaupti savo tyrimus 

archyve 

2.4.2.7 conditions Access Conditions Prieigos sąlygos Papildoma informacija apie 

prieigos prie tyrimo duomenų 

sąlygas 

2.4.2.8 disclaimer Disclaimer Įspėjimas Informacija apie atsakomybę 

ir sankcijas už neteisingą 

tyrimo duomenų panaudojimą 

2.5.1 relMat Related Materials Susiję dokumentai Su tyrimu betarpiškai susiję 

dokumentai (klausimynas, 

anketos ir pan.) 

2.5.2 relStdy Related Studies Susiję tyrimai Su tyrimu susiję kiti tyrimai 

2.5.3 relPubl Related 

Susijusios 

Su tyrimu susijusios 

Publications publikacijos publikacijos 

2.5.4 othRefs Notes Pastabos Kitos pastabos, susijusios su 

tyrimu (pavyzdžiui, pagrindinė 

kalba, kuria rengiami tyrimo 

duomenys ir metaduomenys) 

3.1.1 fileName File name Failo pavadinimas Tyrimo failo pavadinimas 

3.1.2 fileCont Contents of File Failo turinys Tyrimo failo turinys 

3.1.3.1. caseQnty Overall Case Count Tiriamųjų skaičius Tyrime dalyvavusių tiriamųjų 

2.2 

faile 

kiekis faile 

3.1.3.1. varQnty Overall Variable Kintamųjų skaičius Tyrime panaudotų kintamųjų 

2.1 

Count 

faile 

skaičius faile 

3.1.5 fileType Type of File Failo tipas Tyrimo failo tipas 

3.1.7 filePlac Place of File Failo sukūrimo vieta Archyvas, kuriame yra tyrimo 

Production 

produkcinis failas 

3.1.9 ProcStat Processing Status Failo kūrimo statusas Kuriamo archive tyrimo failo 

statusas 

3.1.12. version Version Versija Kuriamo archive tyrimo failo 

1 

ir/arba jam taikomo šablono 

versija 

3.1.12. verResp Version 

Versijos atsakomybės Tyrimo failo versijos 

2 

Responsibility 

statement 

duomenys 

atsakomybės duomenys 

69

Atidaromas Nesstar WebView langas. Nesstar WebView leidžia: 

• prieigą prie duomenų: juos peržiūrėti, atsisiųsti, eksportuoti, atsispausdinti; 

• duomenų rinkinių, kintamųjų, su tyrimu susijusios medžiagos, lentelių paiešką; 

• duomenų koreliacinę, regresinę, grafinę analizę. 

Prieiga prie duomenų priklauso nuo archyvo savininko, kuris turi parengęs atitinkamas prieigos 

taisykles. Šis taisyklių rinkinys gali būti patalpintas ir parodomas internete, archyvo savininko ar 

archyvo svetainėje. LiDA archyvo prieigos taisyklės prieinamos pagrindiniame projekto svetainės 

lange pasirinkus meniu Naudojimo taisyklės. 

LiDA archyvo duomenų peržiūra 

LiDA Nesstar WebView langas padalintaas į dvi dalis. Kairėje pusėje rodomas LiDA archyve 

saugomų tyrimų rinkinių katalogas, o dešinėje pusėje – pasirinkto tyrimo rinkinio, atskiro tyrimo ar 

jo kintamojo metaduomenys. Metaduomenis taip pat galima peržiūrėti lango viršuje paspaudus 

mygtuką „Description“: 

70

Kairėje lango pusėje esančiame tyrimo duomenų metaduomenų (angl. Metadata) skyriuje 

informacija pateikiama pagal DDI – ji suskirstyta į keturis pagrindinius DDI blokus: Dokumento 

(kodifikatoriaus) aprašymas, tyrimo aprašymas, Duomenų failų aprašymas ir kita susijusi medžiaga. 

Kintamųjų (angl. Variables) skyriuje pateikiama informacija apie visus tyrimo kintamuosius. 

Kintamieji čia sugrupuoti į grupes. 

Norint peržiūrėti visą tyrimo informaciją, kairėje pusėje ties skyriumi reikia spausti 

informaciją išskleidžiančią ikoną . Kai informacija yra visa išskleista ir rodoma dešinėje lango 

pusėje, skyriaus pavadinimas paryškinamas raudonai ir ties juo atsiranda simbolis . 

Dešiniosios lango pusės viršuje yra trys pagrindiniai meniu elementai: Description, 

Tabulation ir Anglysis. Description – peržiūrėti metaduomenis ar informaciją apie kairėje lango 

dalyje pasirinktą tyrimo elementą ar kintamąjį. Tabulation – atlikti kintamųjų analizę. Paspaudus šį 

mygtuką iš pradžių rodoma tuščia lentelė. Norint įdėti kintamąjį į lentelę, reikia spustelėti ant 

kintamojo kairėje lango dalyje ir iš atsiradusio meniu pasirinkti reikiamą operaciją. Taip galima 

įkelti kelis kintamuosius ir juos vėliau analizuoti lango viršuje esančių mygtukų pagalba: 

71

Analysis mygtuko pagalba galima atlikti regresinę ir koreliacinę analizę. 

Duomenų išsaugojimas į savo kompiuterį 

Pasirinkti saugojimui galima metaduomenis HTML ir XML formatu bei tyrimų duomenis įvairias 

formatais. Saugoma tai, kas rodoma dešinėje lango dalyje. Paspaudus mygtuką atidaromas 

langas, kuriame reikia nurodyti kas ir kaip bus saugoma: 

Duomenų eksportas ir spausdinimas 

72

Norint eksportuoti tyrimo duomenis į Excel formatą, spaudžiamas mygtukas , į PDF formatą – 

mygtukas . Norint spausdinti duomenis, spaudžiamas mygtukas . 

Bookmarks 

Ši funkcija naudojama išsaugoti tuo metu rodomą duomenų rinkinio atvaizdavimą, pavyzdžiui, 

informaciją apie kintamąjį, atliktą duomenų analizę ir pan. Išsaugotas duomenų rinkinio 

atvaizdavimas patalpinamas į serverį ir yra matomas kitiems tokias pat teises turintiems vartotojams. 

Norint sukurti Bookmark, reikia spustelti mygtuką ir iš išsiskleidžiančio sąrašo pasirinkti meniu 

Server Bookmark. Atidaromas langas, kuriame reikia nurodyti Bookmark pavadinimą ir aprašyti 

tai, ką norite išsaugoti, kad vėliau peržiūrint būtų galima suprasti, kodėl tai yra svarbu: 

Paspaudus mygtuką Add bookmark, jis parodomas tyrimo elementų rinkinio sąraše kairėje Nesstar 

WebView lango dalyje: 

73

Norint peržiūrėti Bookmark, reikia spustelti pele ant jo pavadinimo ir iš išsiskleidžiančio meniu 

sąrašo pasirinkti reikiamą elementą: 

Paieška 

LiDA Nesstar WebView aplinkoje galima atlikti paprastą ir išplėstinę paieškas. Paprasta paieška 

atliekama pagrindiniame LiDA Nesstar WebView lange kairėje pusėje esančiame paieškos laukelyje 

įrašius užklausą ir paspaudus mygtuką : 

74

Norint atlikti išplėstinę paieška, šalia paprastos paieškos lauko reikia spausti . Atidaromas 

išplėstos paieškos langas: 

75

LiDA prieiga per eLABa 

Taip pat Lietuvoje kuriama Lietuvos akademinė elektroninė biblioteka – eLABa. Prieiga per 

http://elaba.library.lt. Ji skirta Lietuvos mokslo institucijoms, kurių autoriai kuria mokslines ir 

studijų publikacijas, kurias reikia įkelti, saugoti, kataloguoti ir pateikti skaitytojams bei kitoms 

sistemoms. Pagrindinis tikslas – sukurti aplinką bei priemones ir jomis naudojantis rengti, kaupti, 

ilgą laiką saugoti ir įvairiais išvesties būdais pateikti vartotojams Lietuvos mokslo ir studijų 

elektroninius dokumentus. 

eLABa kaupiami, saugomi ir skelbiami eLABa duomenų teikėjų įkelti šių tipų elektroniniai 

dokumentai: 

• Knygos (monografijos, vadovėliai, mokymui skirtos knygos ir pan.); 

• Periodiniai ar vienkartiniai recenzuojami mokslo leidiniai (žurnalai) bei mokslo 

populiarinimo leidiniai (žurnalai), išspausdinti, išleisti kompaktiniais diskais arba paskelbti 

internete; 

• Atskiri moksliniai ir mokslo populiarinimo straipsniai, publikuoti mokslo ir mokslo 

populiarinimo leidiniuose; 

• Pranešimai mokslinėse ar metodinėse konferencijose, seminaruose ir pan.; 

• Studijų baigiamieji darbai, daktaro disertacijos ir jų santraukos; 

• Mokslinių tyrimų ir eksperimentinės plėtros darbų bei projektų ataskaitos; 

• Kita. 

eLABa lange pasirinkite meniu „Ištekliai“ ir iš sąrašo pasirinkite LiDA archyvo nuorodą: 

76

ALEPH paieškos sistemos lange LiDA duomenų galima ieškoti per įvairias paieškas: paprastą, 

keliuose ištekliuose, detalią, komandinę ir išplėstą. Kokią paiešką pasirinkti priklauso nuo to, kokiu 

tikslu ieškote informacijos, kokią pradinę informaciją apie ieškomus leidinius jau turite ir pan.: 

- Paprastą paiešką tikslinga pasirinkti tuomet, jeigu atliekate bendresnio pobūdžio paiešką. 

Šios paieškos metu jūsų pageidaujamo paieškos žodžio arba žodžių ieško visuose paieškos 

laukuose arba viename pasirinktame paieškos lauke, t.y. pagal autoriaus pavardę, tikslią 

antraštę, žodį ar žodžius antraštėje, ISSN, ISBN, leidimo metus ir kt. Paprasta paieška 

dažniausiai naudojasi pradedantieji arba greitą paiešką atliekantys informacijos vartotojai. 

- Detalią paiešką tikslinga pasirinkti tuomet, jeigu žinote tikslius leidinio duomenis arba bent 

kelis bibliografinio aprašo elementus, pavyzdžiui, autorių, antraštė, publikavimo metus, 

leidimo vietą, leidyklą ar kitus duomenis. 

- Paiešką keliuose ištekliuose reikėtų pasirinkti tuomet, jeigu jums reikalingo leidinio ar 

leidinių neradote savo institucijos bibliotekos kataloge arba tuomet, kai jūsų bibliotekos 

kataloge neradote leidinių pagal pasirinktą žodį ar žodžius. Atlikę paiešką sužinosite, kokioje 

Lietuvos akademinėje bibliotekoje ar keliose bibliotekose yra jūsų ieškomas leidinys. 

- Išplėstą paiešką pasirinkite tuomet, jeigu norite suformuluoti sudėtingą paiešką, derinti kelis 

paieškos kriterijus. Rezultatai pateikiami pagal kiekvieną paieškos kriterijų atskirai, o taip 

pat visus paieškos kriterijus atitinkantys paieškos rezultatai. 

- Komandinę paiešką rekomenduojama atlikti didesnę informacijos paieškos patirtį turintiems 

vartotojams, kurie sugeba paiešką suformuluoti laukų komandų pagalba. Šiuo atveju galima 

suformuluoti itin sudėtingą paieškos klausimą, naudoti loginius operatorius, skliaustus ir pan. 

O tai leidžia gauti labai tikslius rezultatus. 

77

Paprastos paieškos langas, kurio laukelyje „Įveskite žodį arba frazę“ įrašoma užklausa ir kituose 

laukeliuose nurodomi užklausą apibūdinantys parametrai: 

Atlikus paiešką, paieškos rezultatai pateikiami lentelėje: 

78

Lentelėje rodomi tik pagrindiniai tyrimo metaduomenys: autorius ir tyrimo antraštė. Norint 

peržiūrėti detalius metaduomenis apie tyrimą, reikia spausti numerį šios lentelės kairėje. Atidaromas 

langas, kuriame rodomi detalūs metaduomenys apie tyrimą. Metaduomenų sąrašo viršuje esanti 

nuoroda „Sąsaja“ skirta atidaryti langą, iš kurio galima parsisiųsti su tyrimu susijusius dokumentus 

ar pačius duomenis. 

79

Duomenims parsisiųsti paspaudus nuorodą „Sąsaja“ atidaromas langas: 

Šiame lange pateikiamas su tyrimu susijusių duomenų ir dokumentų sąrašas. Paspaudus pele ant 

vienos iš sąrašo ikonų, parsiunčiamas duomenų failas ar kompiuterio ekrane parodomas pats 

dokumentas. 

80

LiDA prieiga per Lietuvos virtualią biblioteką 

Lietuvos virtuali biblioteka yra kompleksinė sistema, suteikianti galimybę iš vieningos paieškos 

platformos ieškoti įvairaus tipo dokumentų. Paieška atliekama įvairiuose ištekliuose – 

elektroniniuose kataloguose ir duomenų bazėse. Šiuo metu LVB galite ieškoti ir rasti: 

- bibliografinės informacijos apie socialinius ir humanitarinius mokslinius tyrimus bei rasti ir 

parsisiųsti tų tyrimų duomenis iš LiDA archyvo; 

- bibliografinius duomenis apie leidinius, aprašytus Lietuvos akademinių ir viešųjų bibliotekų 

bei kai kurių užsienio bibliotekų kataloguose; 

- straipsnių, konferencijų pranešimų ir kt. dokumentų, aprašytų institucijų publikacijų 

duomenų bazėse, bibliografinius duomenis ir santraukas. Dalis dokumentų pateikia ryšį į 

visatekstį dokumentą; 

- dokumentų, sukauptų Lietuvoje kuriamose duomenų bazėse Lituanistika, ETD, eLABa, 

LABT katalogas, LiDA bibliografinius duomenis ir/ar pačius visateksčius dokumentus; 

- dokumentų (straipsnių, konferencijų pranešimų, knygų ir kt.), prieinamų per Lietuvos 

institucijose prenumeruojamas užsienio duomenų bazes, bibliografinius duomenis ir/ar 

pačius visateksčius dokumentus. 

LiDA archyvas bus prieinamas taip pat per Lietuvos virtualią biblioteką – http://www.lvb.lt. 

81

Norint atlikti paiešką tik LiDA archyve, reikia nuimti žymėjimus ties kitais informaciniais ištekliais. 

Jei žymėjimai nenuimami, tuo pačiu metu paieška atliekama ir kituose informaciniuose ištekliuose. 

Atlikus paiešką paieškos rezultatai pateikiami lentelės forma. Lentelėje rodomas tik tyrimo autorius 

ir antraštė. 

Norint peržiūrėti detalius metaduomenis apie tyrimą, reikia spausti tyrimo antraštės nuorodą. 

Atidaromas langas, kuriame rodomas išsamių metaduomenų sąrašas: 

82

Norint parsisiųsti tyrimo duomenis ar su tyrimu susijusius dokumentus, reikia spausti „Prieiga“ 

eilutėje esančią nuorodą. Atidaromas langas, kuriame pateikiamas su tyrimu susijusių elektroninių 

dokumentų sąrašas: 

83

Šis langas toks pat kaip eLABa paieškos sistemos. Šiame lange pateikiamas su tyrimu susijusių 

duomenų ir dokumentų sąrašas, kuriame paspaudus pele ant vienos iš sąrašo ikonų, parsiunčiamas 

duomenų failas ar kompiuterio ekrane parodomas pats dokumentas. 

Kiti archyvai ir duomenų rinkinių peržiūra 

Socialinių tyrimų archyvų sąrašus galite rasti LiDA projekto svetainėje http://www.lidata.eu 

pasirinkus meniu punktą Plėtra ir Bendradarbiavimas: 

Taip pat socialinių mokslų duomenų archyvų sąrašą internete pateikia Amsterdamo universiteto 

Sociologijos ir antropologijos departamentas - http://www.sociosite.net/databases.php: 

84

Užsienio šalių duomenų archyvai ir jų paieškos sistemos 

Vokietijos socialinių mokslų infrastruktūros paslaugų asociacijos archyvas (angl. German Social 

Science Infrastructure Services – GESIS) yra prieinamas per internetą adresu 

http://zacat.gesis.org/webview/index.jsp. Šis archyvas kaip ir LiDA naudoja Nesstar WebView 

aplinką duomenų archyvo turiniui atvaizduoti, ieškoti ir analizuoti. 

Jungtinės Karalystės duomenų archyvas (angl. UK Data Archive) yra prieinamas per internetą 

adresu http://www.data-archive.ac.uk/findingData/aboutCat.asp. Pagrindinėje svetainėje pateikiama 

jungtinės paieškos galimybė – galimybė atlikti paiešką vienu metu keliuose Jungtinės Karalystės 

archyvuose. Atlikus paiešką, paieškos rezultatų lange gali būti mygtukas į Nesstar WebView, kurį 

paspaudus patenkama į atitinkamo Jungtinės Karalystės duomenų archyvo Nesstar WebView 

aplinką. 

85

Slovėnijos socialinių mokslų archyvas prieinamas per internetą adresu http://nesstar2.adp.fdv.uni- 

lj.si/webview/. Šis archyvas kaip ir LiDA naudoja Nesstar WebView aplinką duomenų archyvo 

turiniui atvaizduoti, ieškoti ir analizuoti. 

Politinių ir socialinių mokslų tyrimų tarpuniversitetinis konsorciumas (angl. Inter-University 

Consortium for Political and Social Research) savo svetainėje pateikia nuorodą į elektroninį 

archyvą, kuris prieinamas adresu https://www.icpsr.umich.edu/. Tai jungtinė kelių JAV archyvų 

duomenų paieškos ir atvaizdavimo sistema. Archyvų sąrašą galima peržiūrėti internete adresu 

http://www.icpsr.umich.edu/cocoon/ICPSR/all/archives.xml?token=Archives. Šis archyvas turi 

savitą paieškos ir duomenų bei informacijos atvaizdavimo sistemą. Norint peržiūrėti ar atsisiųsti 

duomenis būtina užsiregistruoti – registracija yra paprasta, nemokama ir greita. 

Naudotos literatūros ir šaltinių sąrašas 

Archiv družboslovnih podatkov [interaktyvus]. [Žiūrėta 2008-04-04]. Prieiga per internetą: 

http://nesstar2.adp.fdv.uni-lj.si/webview/ 

Beyond Bookmarks: chemes for Organizing the Web. [interaktyvus]. [žiūrėta 2008 04 15]. 

Prieiga per internetą:http://www.public.iastate.edu/~CYBERSTACKS/CTW.htm 

Borgman, Ch. L. Nuo Gutenbergo iki globalios informacijos infrastruktūros. Informacijos 

prieiga tinklų apraizgytame pasaulyje. 2003. 327 p. 

CAPLAN, Priscilla. Metadata fundamentals for all librarians. Chicago, 2003. 192 p. ISBN 0- 

8389-0847-0. 

Data Documentation Initiative [interaktyvus]. DDI [žiūrėta 2007-12-13]. Prieiga per internetą: 

http://www.icpsr.umich.edu/DDI/ 

Digital Preservation Management [interaktyvus]. Cornell University Library, 2003-2007 [žiūrėta 

2007-12-07]. Prieiga per internetą: http://www.icpsr.umich.edu/dpm/dpm-eng/eng_index.html 

Dublin Core Metadata Initiative [interaktyvus]. DCMI, 1995-2008 [žiūrėta 2007-12-18]. Prieiga 

per internetą: http://dublincore.org/ 

ePaveldas [interaktyvus]. [Žiūrėta 2008-02-06]. Prieiga per internetą: http://www.epaveldas.lt 

Europos žodynas EUROVOC [interaktyvus]. [žiūrėta 2008 04 11]. Prieiga per internetą 

http://www3.lrs.lt/eurovoc 

86

German Social Science Infrastructure Servines [interaktyvus]. 2004 [žiūrėta 2008-04-04]. 

Prieiga per internetą: http://zacat.gesis.org/webview/index.jsp 

Gilchrist A. Thesauri, taxonomies and ontologies – an etymological note//JDOC, vol. 59 No.1, 

2003, p. 7-17. 

Gill T., Gilliland A.J, Woodley M. S. Introduction to metadata: pathways to digital information 

[interaktyvus]. 1998. [žiūrėta 2008 04 11] Prieiga per internetą: 

http://www.getty.edu/research/conducting_research/standards/intrometadata/index/html 

HASSET thesaurus. In: UK Data Archive. [interaktyvus]. [žiūrėta 2008 04 11] . Prieiga per 

internetą http://www.data-archive.ac.uk/search/hassetSearch.asp 

HAYNES, D. Metadata for information management and retrieval. London : Facet 

Publishing, 2004. - xiv, 186 p. : iliustr. - ISBN 1-85604-489-0 

Hunter E.J. Classification made simple. Ashgate, 2002, 150 p. 

Inter-University Consortium for Political and Social Research [interaktyvus]. University of 

Michigan, 2007 [žiūrėta 2008-04-04]. Prieiga per internetą: https://www.icpsr.umich.edu/ 

ISBD(ER): International Standard Bibliographic Description for Electronic Resources 

[interaktyvus]. [Žiūrėta 2008-01-24]. Prieiga per internetą: 

http://www.ifla.org/VII/s13/pubs/isbd3.htm#17 

ISO 14721:2003 Space Data and Information Transfer System - Open Archival Information 

System - Reference Model [interaktyvus]. International Organization for Standardization, 2008 

[žiūrėta 2007-02-04]. Prieiga per internetą: 

http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=24683 

Koch T. Controlled vocabularies, thesauri and classification systems available in the WWW. 

[žiūrėta 2008 04 07] Prieiga per internetą http://www.lub.lu.se/metadata/subject-help.html 

LiDA : Lietuvos HSM duomenų archyvas [interaktyvus]. Kaunas: KTU Politikos ir viešojo 

administravimo institutas, 2008 [žiūrėta 2008-04-03]. Prieiga per internetą: 

http://debian.library.lt/webview/ 

Lietuvos 2004-2006 metų bendrasis programavimo dokumentas [interaktyvus]. Patvirtinta 

Lietuvos Respublikos Vyriausybės 2004 m. rugpjūčio 2 d. nutarimu Nr. 935 (Žin., 2004, Nr. 

123-4486) [žiūrėta 2008-02-04]. Prieiga per internetą: 

http://www.ivpk.lt/fondai/bpd/BPD_2007-03-28_1.doc 

Lietuvos akademinė elektroninė biblioteka eLABa [interaktyvus]. Lietuvos akademinių 

bibliotekų tinklas (LABT), 2005 [žiūrėta 2008-04-03]. Prieiga per internetą: 

http://elaba.library.lt 

Lietuvos virtuali biblioteka [interaktyvus]. Lietuvos akademinių bibliotekų tinklas (LABT) 

[žiūrėta 2008-04-03]. Prieiga per internetą: http://www.lvb.lt 

87

LUPOVICI, C.; MASANES, J. Metadata for the long term preservation of electronic 

publications. Den Haag: Koninklijke Bibliotheek, 2000. 22 p. 

Medical subject headings [interaktyvus]. National Library of Medicine [žiūrėta 2008 m. 04 07] 

Prieiga per internetą http://www.nlm.nih.gov/mesh/ 

Miežinienė A. IPS teorijos raida/ Teoriniai bibliotekininkystės pagrindai: vadovėlis 

bibliotekininkystės ir bibliografijos specialybių studentams/ sudaryta G. Raguotienės. Vilnius: 

Stepono batoro leidykla. 2-asis patais. ir papild. leid. 1990. P. 127-187 

Mokslų klasifikacija. Mokslas ir studijos [interaktyvus]. [Žiūrėta 2008 m. 04 08 d.] 

http://www.mokslas.lt/index.cgi?menu_item=science_directions 

OWL. Web Ontology Language overview. [interaktyvus]. Semantic Web. [žiūrėta 2008 04 

08].Prieiga per internetą: http://www.w3.org/TR/owl-features/. 

Roget’s thesaurus of English words and phrases. [Žiūrėta 2008 04 08]. Prieiga per internetą 

http://leva.leeds.ac.uk/www_rgt/rgt_index.html 

ŠTREIMIKIS, A.; KUČIUKAS, V.; ŽURAUKAS, S.; TARGAMADZĖ, A; ŽALYS, A. Lietuvo 

s akademinė e. biblioteka (eLABa) // Informacijos mokslai = Information Sciences : mokslo 

darbai / Vilniaus universitetas. - ISSN 1392-0561. - Vilnius. - 2007, T. 40, p. 9-24 

Taylor Arlene G. Introduction to cataloging and classification. Tenth ed. /Library and 

Information Text Series. – London, Libraries Unlimited, 2006. P.301- 390. 

Taylor Arlene G. The organization of information. Second ed. /Library and Information Text 

Series. – London, Libraries Unlimited, 2004. P. 10-65, 139-155, 241-295. 

UDC Consortium [interaktyvus]. [žiūrėta 2008 04 02]. Prieiga per internetą 

http://www.udcc.org/ 

UK Data Archive [interaktyvus]. University of Essex, 2002-2008 [žiūrėta 2008-04-04] prieiga 

per internetą: http://www.data-archive.ac.uk/findingData/aboutCat.asp 

Universalioji dešimtainė klasifikacija: Sutrumpintos lentelės/ sudarė A. Miežinienė, M. 

Prokopčik. – Vilnius, 1994. – 476 p. 

Web Thesaurus compendium[interaktyvus]. [žiūrėta 2008 m. 03 15]. Prieiga per internetą: 

http://www.ipsi.fraunhofer.de/~lutes/thesoecd.html 

88

Santrumpų sąrašas 

ALEPH – Integruota bibliotekinė sistema ALEPH (angl. Aleph Integrated Library System) 

BPD – Bendrasis programavimo dokumentas 

CESSDA – Europos socialinių mokslų duomenų archyvų taryva (angl. Council of European Social 

Science Data Archives) 

DC – Dublino branduolys (angl. Dublin Core) 

DDI – Duomenų aprašymo iniciatyva (angl. Data Documentation Initiative) 

DTD – dokumento tipo apibrėžtis (angl. Document Type Definition) 

eLABa - Lietuvos akademinė elektroninė biblioteka 

ETD – Elektroninės tezės ir disertacijos 

HTML – Hiperteksto žymėjimo kalba (angl. Hyper Text Markup Language) 

ICPSR - Politinių ir socialinių mokslų tyrimų tarpuniversitetinis konsorciumas (angl. Inter- 

University Consortium for Political and Social Research) 

IFLA – Tarptautinė bibliotekų asociacijų ir jų įstaigų federacija (angl. International Federation of 

Library Associations and Institutions) 

IPK – Informacijos paieškos kalba 

IPS – Informacijos paieškos sistema 

ISAD – Tarptautinis archyvinio aprašymo standartas (angl. International Standard Archival 

Description) 

ISAD (G) – Bendras tarptautinis archyvinio aprašymo standartas (angl. General International 

Standard Archival Description) 

ISBN – Tarptautinis standartinis knygos numeris (angl. International Standard Book Number) 

ISSN – Tarptautinis standartinis serijos numeris (angl. International Standard Serial Number) 

KTU – Kauno technologijos universitetas 

LABT – Lietuvos akademinių bibliotekų tinklas 

LCSH – JAV Kongreso bibliotekos rubrikynas (angl. Library of Congress Subject Headings)_ 

LNB – Lietuvos nacionalinė Martyno Mažvydo biblioteka 

LV – Leksinis vienetas 

LVB – Lietuvos virtuali biblioteka 

Nesstar – Tikliniai socialinių mokslų įrankiai ir resursai (angl. Networked Social Science Tools and 

Resources) 

NK – Natūrali kalba 

RŽ – Reikšminis žodis 

SGML - Universali dokumentų ženklinimo kalba (angl. Standard Generalized Mark-up Language) 

UNIMARC – Universalus MARC formatas (angl. Universal MARC Format) 

XML – (angl. Extensible Mark-up Language) 

89

MOKYMO KURSAS INFORMACINIS RAŠTINGUMAS ... - LiDA

Create successful ePaper yourself

Delete template?

Save as template?