Pustaha: Jurnal Studi Perpustakaan dan Informasi, Vol.2, No.2, Desember 2006Penggunaan Bahasa Alamiah dan Kosa Kata Terkendali dalam SistemTemu Balik Informasi Berbasis TeksJonner HasugianDepartemen Studi Perpustakaan dan Informasi<strong>Universitas</strong> <strong>Sumatera</strong> <strong>Utara</strong>AbstractLanguage or vocabularies play important role to support both effectiveness and efficiencysearching in text-based information retrieval system. Natural language and controlledvocabulary approach in text-based information retrieval system with both advantages anddisadvantages. Both of the approaches remain in use effectively. However the retrievaltechnique by using combination of natural language and controlled vocabulary is ideal to beused in text-based information retrieval system. Searching by using natural language andcontrolled vocabulary, in fact, are complementary. Efficiency and effectiveness of text-basedinformation retrieval system can be measured from recall and precision.Keywords: Information Retrieval System, Indexing, Natural Language, Controlled Vocabulary1. PendahuluanBahasa dan atau kosa kata (vocabulary)memegang peranan yang sangat pentingdalam efektivitas dan efisiensi penelusuranpada suatu sistem temu balik informasi.(Muddamalle, 1998: 881). Kegiatan penelusuranpada sistem temu balik informasi (STBI)bebasis teks hanya dapat berlangsung bilamenggunakan kosa kata, sebab kosa katainilah yang digunakan sebagai istilah berupaquery penelusuran untuk menemukandokumen yang diinginkan. Dalam STBIberbasis teks, kosa kata itu dapat berupaindeks, seperti indeks subjek, pengarang,judul, maupun istilah lain yang dirumuskandalam tesaurus.Pada dasarnya ada dua bahasa pendekatanpenelusuran yang lazim digunakan dalamSTBI berbasis teks yaitu bahasa alami(natural language), dan kosa kata terkendaliyang sering juga disebut controlledvocabulary. Kedua pendekatan ini sejaksemula telah digunakan secara luas dalamSTBI berbasis teks.Studi tentang efektivitas dan efisiensipenelusuran menggunakan pendekatan bahasaalamiah (natural language) dan kosa kataterkendali (controlled vocabulary) dalamSTBI telah lama dilakukan. Banyak databaseyang dibangun untuk digunakan sebagaieksperimen sarana penelusuran dalam rangkapembuktian efektivitas dan efisiensi darikedua pendekatan tersebut.Muddamalle (1998: 881-883) mencatat bahwasejarah bahasa alamiah (natural language)kontra kosa kata terkendali (controlledvocabulary) dalam STBI dibagi kepada tigaera. Era pertama dimulai pada abad ke-19dengan penekanan kepada popularitaspengindeksan istilah berdasarkan judul (titleterm indexing). Pada era ini kosa kataterkendali atau controlled vocabulary lebihdominan digunakan dalam penelusuran,terutama digunakan untuk menemukancantuman bibliografi dalam katalogberklasifikasi di perpustakaan. Sedangkanpenelusuran berdasarkan bahasa alamiah yangbiasa disebut dengan sebutan free-textsearching atau penelusuran dengan teksbebas, baru dalam tahap permulaan dilakukanpada era ini.Era kedua dimulai pada saat kehadirankomputer dalam sistem temu balik informasi.Pada era ini kegiatan pengindeksan mulaidilakukan dalam bentuk mekanis yaitu berupapengindeksan otomatis. Kemudian, era ketigadimulai pada pertengahan tahun 1970-an, diHalaman 72
Pustaha: Jurnal Studi Perpustakaan dan Informasi, Vol.2, No.2, Desember 2006mana pendekatan yang berbeda dilakukanuntuk menguji isu natural language versuscontrolled vocabulary, melalui pengujianrasio Recall dan Precision dalam STBI padaberbagai database berbasis teks.Para ahli informasi terus melakukan berbagaipenelitian dan percobaan berkenaan dengankedua pendekatan tersebut. Hasil yangdiperoleh bervariasi antara satu peneliti danyang lainnya. Beberapa contoh hasilpenelitian tersebut dapat dilihat di bawah ini.Pada tahun 1976, Barbara Charton melakukanpenelitian melalui penelusuran pada ChemicalAbstracts, untuk menjawab pertanyaanpenelitian, Is a controlled vocabularynecessary? Dalam hasil penelitiannya, diamengemukakan bahwa suatu penelusurandengan teks bebas bisa seefektif penelusuranmenggunakan controlled vocabulary, asalkandilakukan oleh seseorang yang memilikipengalaman dalam penelusuran. Penelusurandengan teks bebas bisa lebih efektif, sebab adakalanya penelusuran menggunakan controlledvocabulary mengorbankan ketepatan dalamkemungkinan mencapai kemudahan.Markey, Atherton, dan Newton (1982),membandingkan 165 pernyataan penelusurandengan teks bebas (free-text searchstatements) yang digunakan dalam mengaksesERIC database untuk mengetahui apakahkonsep ekspresi dengan istilah teks bebas ataubahasa alamiah dapat juga diekspresikan darideskriptor ERIC (ERIC descriptors). Merekamenemukan bahwa salah satu dari setiapdelapan pernyataan penelusuran teks bebasyang tidak direpresentasikan dalam ERICcontrolled vocabulary. Secara keseluruhan,temu balik informasi secara teks bebas (freetextretrieval) dengan menggunakanpendekatan bahasa alamiah menghasilkanperolehan (recall) yang tinggi denganketepatan (precision) yang rendah, dari padamenggunakan pendekatan controlledvocabulary.Calkins (1980) sesuai sitiran Muddamalle(1998: 881-883), dalam hasil pengamatannyakepada sejumlah penelusur yang hanyamenggunakan istilah controlled vocabularydan yang hanya menggunakan penelusuranteks bebas, mengemukakan kesimpulanbahwa penelusuran menggunakan teks bebasdan controlled vocabulary ternyata salingmelengkapi, dan penampilan terbaik yangdicapai dalam penelusuran ialah menggunakankombinasi dari keduanya.Dari ketiga contoh hasil penelitian yangdikemukakan di atas, dapat dilihat bahwaefektivitas dan efisiensi penelusuranmenggunakan pendekatan bahasa alamiahatau penelusuran dengan teks bebas (free-textsearch) ada kalanya lebih baik dari pada kosakata terkendali, demikian sebaliknyapendekatan menggunakan controlledvocabulary ada kalanya lebih baik dari bahasaalamiah. Mengingat banyaknya penelitian daneksperimen yang telah dilakukan untukmenguji kedua pendekatan tersebut, makakeunggulan maupun kelemahan dari keduapendekatan tersebut telah banyak yangdiketahui. Tulisan ini mencoba mengangkatisu tersebut untuk dibahas secara teoretismelalui tinjauan literatur.Sasaran utama yang akan dicapai dalamtulisan ini ialah mengetahui sejumlahkeunggulan dan kelemahan penelusuranmenggunakan pendekatan bahasa alamiah(natural language) dan kosa kata terkendali(controlled vocabulary). Kemudian akandirekomendasikan pendekatan mana yangideal digunakan dalam sistem temu balikinformasi berbasis teks. Akan tetapi sebelumpembahasan itu dilakukan, terlebih dahuluakan dibahas beberapa hal yang menyangkutdengan STBI berbasis teks antara lainmencakup pengertian dan fasilitas STBIberbasis teks, keefektifan STBI berbasis teks,serta pengindeksan dan bahasa indeks dalamSTBI.2. Pengertian, dan Fasilitas STBIBerbasis TeksPada dasarnya sistem temu balik informasiadalah suatu proses untuk mengidentifikasi,kemudian memanggil (retrieve) suatudokumen dari suatu simpanan (file), sebagaijawaban atas pemintaan informasi. Pengertianlain menyatakan bahwa sistem temu balikinformasi adalah proses yang berhubungandengan representasi, penyimpanan, pencarianHalaman 73