(b) Mempunyai representasi dokumen yang konsisten. Kosa kata atau istilah yangdigunakan dalam pengindeksan dokumen pada saat input sistem adalah kosa katayang terkontrol dan standar. Oleh karena itu, bila kosa kata atau istilah tersebutkemudian dijadikan sebagai query untuk pencarian atau penelusuran, maka sudahpasti akan tetap mewakili atau merepresentasikan dokumen yang sama seperti padasaat input sistem dilakukan. Misalnya, pada input sistemdokumen Adirepresentasikan oleh kosa kata atau indeks subjek “MICROBIOLOGY ”, pada waktupencarian, seorang penelusur menggunakan “MICROBIOLOGY” sebagai query-nya,maka penelusur tersebut pasti akan menemukan dokumen A karena representasidokumennya tetap konsisten. Dengan demikian selalu terjadi kesamaan penggunaanistilah diantara pengindeks (indexer) dengan penelusur (searcher)(c) Memudahkan penelusuran komprehensif dengan menyatukan istilah terkait secarasemantis (Lancaster, 1977, 2). Maksudnya, ada kalanya suatu kosa kata atauindeks subjek tertentu mempunyai hubungan makna dengan indeks yang lain,sehingga dapat digunakan untuk memperkuat pencarian. Misalnya untuk mencaridokumen tentang “pengebalan tubuh manusia terhadap penyakit”, maka kosa kataatau indeks subjek yang dapat dijadikan sebaga query ialah “IMMUNIZATION”, akantetapi untuk menguatkan pencarian penelusur juga dapat menggunakan kosa katalain seperti “VACCINATION”, karena kedua kosa kata di atas adalah terkait secarasemantis.(d) Memiliki ambiguity yang sangat kecil. Ambiguitas atau kerancuan dapat diminimizedengan sekecil mungkin karena kosa kata dapat mengontrol sinonim dan homograf.Selain keunggulan, penggunaan kosa kata terkontrol (controlled vocabulary)pada sistem temu kembali juga mempunyai banyak kelemahan, sebagian diantaranyaadalah :(a) Kosa kata terkontrol harus selalu diperbaharui. Perkembangan ilmu dan teknologimenyebabkan munculnya berbagai subjek baru yang sekaligus juga berdampakterhadap pemunculan atau penghilangan suatu istilah atau kosa kata. Oleh karenaitu, suatu tajuk subjek atau tesaurus pada suatu periode tertentu harusdiperbaharui untuk bisa menyesuaikan diri sesuai perkembangan (Muddamalle, 1998: 881). Misalnya, bila kita menelusur dengan istilah atau kosa kata “CANCER”sebagai query pada indeks DDC edisi ke 19, maka kita akan dirujuk dengan kata see“TUMORS”. Sekalipun keduanya semantis, namun terdapat perbedaan. Ini terjadikarena pada indeks DDC edisi ke 19 subjek CANCER belum dijabarkan secara lengkapkarena mungkin pada masa itu istilah cancer masih belum populer. Akan tetapi biladitelusur pada indeks DDC edisi ke 20 dan 21, istilah tersebut telah dijabarkansecara rinci. Hal itu menunjukkan bahwa indeks DDC tersebut diperbaharui secaraberkala.(b) Kosa kata terkontrol (controlled vocabulary) sering dihadapkan kepadaketidakcocokan (incompatibility) istilah diantara satu database dengan databaseyang lainnya pada bidang ilmu yang sama (Lancaster, 1986 : 159). Misalnya, CABCD-ROM dan Agricola CD-ROM adalah dua database yang memuat indeks danabstrak penelitian pada bidang ilmu yang sama yaitu Pertanian. Akan tetapi adakalanya beberapa kosa kata atau istilah yang digunakan untuk indeks subjek padakedua database tersebut berbeda. Hal ini tentunya bisa menyulitkan penelusur bilamelakukan penelusuran pada kedua database tersebut.(c) Kurangnya spesifikasi dalam kosa kata. Berbeda dengan bahasa alamiah, dimanapenelusur dapat menggunakan secara bebas kosa kata yang spesifik. Akan tetapipada kosa kata terkontroll, spesifikasi istilah ditentukan oleh ketersediaannya padaindeks subjek atau tesaurus.(d) Kosa kata terkontrol memiliki struktur yang tidak lengkap. Artinya rincian subjekadalah sangat terbatas untuk pencarian atau penelusuran komprehensif.<strong>©2003</strong> <strong>Digitized</strong> <strong>by</strong> <strong>USU</strong> <strong>digital</strong> <strong>library</strong> 8
(e) Kosa kata terkontrol memerlukan biaya dan upaya yang besar pada waktu inputsistem yaitu pada saat pengindeksan dilakukan. (Lancaster, 177 : 7).5.3. Pendekatan penelusuran yang ideal.Dengan menguraikan sejumlah keunggulan dan kelemahan dalam melakukanpenelusuran menggunakan pendekatan bahasa alamiah (natural language) dan kosakata terkontrol (controlled vocabulary) sebagai mana dijelaskan di atas, maka muculpertanyaan, “pendekatan manakah yang ideal dilakukan dalam melakukan penelusurandalam sistem temu kembali informasi ?“Untuk menjawab pertanyaan tersebut, Manikya Rao Muddamalle (1998 : 881-887) melalui penelitiannya yang berjudul “Natural Language versus ControlledVocabulary in Information Retrieval: a Case Study in Soil Mechanics”, menyatakanbahwa temu kembali bahasa alamiah dan kosa kata terkontrol menunjukkan hasil yangsangat efektif, dengan perbedaan atau dengan batasan yang sangat tipis, hasilnyatidak jauh berbeda. Untuk mencapai temu kembali yang optimum, suatu teknik temukembali dengan kombinasi bahasa alamiah dan kosa kata terkontrol dapat diadopsi.Teknik penelusuran secara kombinasi ini telah diuji, dan ditemukan hasil bahwaterdapat penambahan 5 % hasil temu kembali melebihi atau lebih tinggi dari pada hasiltemu kembali secara terpisah. Oleh karena itu, alternatif bahasa alamiah ataukosakata terkontrol tidak perlu diperlakukan lebih lama sebagai teknik terpisah, akantetapi lebih baik diperlakukan bersama sebagai suatu teknik kombinasi yang ideal.6. KesimpulanBahasa atau kosa kata (vocabulary) memegang peranan yang sangat pentingdalam efektifitas dan efisiensi penelusuran pada suatu sistem temu kembali informasiPendekatan bahasa alamiah dan kosa kata terkontrol dalam sistem temu kembaliinformasi berbasis teks sama-sama memiliki keunggulan dan kelemahan. Keduapendekatan tersebut tetap masih efektif untuk digunakan. Akan tetapi teknik temukembali dengan menggunakan kombinasi dari bahasa alamiah dan kosa kata terkontroladalah bentuk pendekatan yang ideal digunakan dalam temu kembali informasi. Dengandemikian penelusuran menggunakan bahasa alamiah atau natural language dan kosakata terkontrol atau controlled vocabulary ternyata saling melengkapiReferensiDimitroff, Alexandra. “Affective Response and Retrieval Performance: Analysis ofContributing Factors”. Library and Information Science Research. 18,1995 : 121- 132.Frants, Valery I. Automated Information Retrieval: Theory and Methods, AcademicPress, New York, 1997.<strong>©2003</strong> <strong>Digitized</strong> <strong>by</strong> <strong>USU</strong> <strong>digital</strong> <strong>library</strong> 9