(Cross Language (Thai-English) Information Retrieval: Concepts ...
(Cross Language (Thai-English) Information Retrieval: Concepts ...
(Cross Language (Thai-English) Information Retrieval: Concepts ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
128 KKU Science Journal Volume 41 Number 1 Review<br />
3.2.1 ออนโทโลจี (ontology) ต่าง ๆ และเลือกใช้ความหมายที่ถูกต้องเหมาะสมกับ<br />
128<br />
ออนโทโลจีเป็นโครงสร้างข้อมูลที่เก็บ<br />
KKU Science Journal Volume<br />
บริบท ในการน<br />
41 Number<br />
าเทคนิคเครื่องแปลเล็กซิคอนมาใช้กับ<br />
1 Review<br />
ฐานความรู้ในลักษณะของล าดับชั้นของคอนเซฟท์และ ระบบ CLIR นั้นท าได้ง่ายคือการน าเทคนิคนี้มาท าการ<br />
ความสัมพันธ์ระหว่างคอนเซฟท์ต่าง ภาษาคือสามารถรองรับการค้นหาเชิงความหมาย ๆ ข้อดีของการ โดย<br />
แปลเพื่อหาความหมายของคิวรี่หรือความหมายของ<br />
น<br />
ที่ผู้ใช้ทั่วไปสามารถใช้ค<br />
าเอาออนโทโลจีมาใช้ในระบบค้นคืนสารสนเทศข้าม<br />
า<br />
เอกสารนั่นเอง<br />
เอกสารนั่นเอง<br />
โดยทั่วไปแล้วระบบจะเลือกความหมาย<br />
โดยทั่วไปแล้วระบบจะเลือกความหมาย<br />
ภาษาคือสามารถรองรับการค้นหาเชิงความหมาย<br />
ส าคัญในคิวรี่ได้อย่างอิสระ ระบบจะ<br />
โดย ของค<br />
ของค<br />
าศัพท์ที่เหมาะสมที่สุดมาเพียงความหมายเดียว<br />
าศัพท์ที่เหมาะสมที่สุดมาเพียงความหมายเดียว<br />
ที่ผู้ใช้ทั่วไปสามารถใช้ค<br />
ประมวลผลเพื่อหาค าที่มีความหมายเหมือนกัน<br />
า<br />
หรือค า<br />
เท่านั้น<br />
เท่านั้น<br />
การที่ระบบเลือกเพียงความหมายเดียวนี้มี<br />
การที่ระบบเลือกเพียงความหมายเดียวนี้มี<br />
ที่เกี่ยวข้องกัน<br />
ส าคัญในคิวรี่ได้อย่างอิสระ<br />
(related terms) โดยดูจากคอนเซฟท์<br />
ระบบจะ ผลกระทบต่อประสิทธิภาพการค้นคืนข้อมูลของระบบ<br />
ผลกระทบต่อประสิทธิภาพการค้นคืนข้อมูลของระบบ<br />
(concept) ของค าส าคัญในคิวรี่เป็นหลัก ออนโทโลจี<br />
ประมวลผลเพื่อหาค าที่มีความหมายเหมือนกัน หรือค า เนื่องจาก<br />
เนื่องจาก<br />
ระบบค้นคืนสารสนเทศ<br />
ระบบค้นคืนสารสนเทศ<br />
อาจจะมองข้าม<br />
อาจจะมองข้าม<br />
ถือเป็นเทคนิคที่มีศักยภาพสูงในการประยุกต์ใช้กับ เอกสารที่เกี่ยวข้องบางเอกสารไป ตัวอย่างระบบ<br />
ที่เกี่ยวข้องกัน (related terms) โดยดูจากคอนเซฟท์ เอกสารที่เกี่ยวข้องบางเอกสารไป ตัวอย่างระบบ<br />
ระบบแปลภาษา โดยที่ค าศัพท์ที่ต่างภาษากันจะอยู่ แปลภาษาโดยใช้เครื่องแปลเล็กซิคอน เช่นในงานของ<br />
(concept) ของค าส าคัญในคิวรี่เป็นหลัก ออนโทโลจี แปลภาษาโดยใช้เครื่องแปลเล็กซิคอน เช่นในงานของ<br />
ภายใต้คอนเซฟท์เดียวกัน แต่ปัญหาส าคัญคือการสร้าง<br />
ถือเป็นเทคนิคที่มีศักยภาพสูงในการประยุกต์ใช้กับ<br />
Oard et al. (1998)<br />
Oard et al. (1998)<br />
ออนโทโลจียังอาจจะต้องสร้างด้วยมือ เนื่องจากยังไม่มี<br />
ระบบแปลภาษา โดยที่ค าศัพท์ที่ต่างภาษากันจะอยู่<br />
เทคนิคใดที่มีประสิทธิภาพมากพอในการเปลี่ยน<br />
ภายใต้คอนเซฟท์เดียวกัน แต่ปัญหาส าคัญคือการสร้าง 4. แนวทางการพัฒนาระบบค้นคืนสารสนเทศ<br />
(convert) จากข้อมูลในเอกสารเป็นคอนเซฟท์ต่าง ๆ<br />
4. แนวทางการพัฒนาระบบค้นคืนสารสนเทศ<br />
ออนโทโลจียังอาจจะต้องสร้างด้วยมือ เนื่องจากยังไม่มี เชิงความหมาย<br />
ในออนโทโลจีโดยอัตโนมัติและยังมีอัลกอริทึมไม่มากนัก เชิงความหมาย<br />
เทคนิคใดที่มีประสิทธิภาพมากพอในการเปลี่ยน การสร้างระบบค้นคืนสารสนเทศที่จะสามารถ<br />
ในการหาค าศัพท์ที่สัมพันธ์กันแต่ถูกเขียนคนละภาษา การสร้างระบบค้นคืนสารสนเทศที่จะสามารถ<br />
(convert) จากข้อมูลในเอกสารเป็นคอนเซฟท์ต่าง ๆ ค้นหาข้อมูลเชิงความหมายได้นั้น จะต้องมีกลไกรองรับ<br />
กันได้โดยอัตโนมัติ ดังนั้นการพัฒนาแนวคิดในการแก้ไข ค้นหาข้อมูลเชิงความหมายได้นั้น จะต้องมีกลไกรองรับ<br />
ในออนโทโลจีโดยอัตโนมัติและยังมีอัลกอริทึมไม่มากนัก การค้นหาเชิงความหมาย ตัวอย่างเช่น การท าดัชนี การ<br />
ปัญหานี้จึงเป็นจุดหนึ่งที่น่าสนใจ<br />
การค้นหาเชิงความหมาย ตัวอย่างเช่น การท าดัชนี การ<br />
ในการหาค าศัพท์ที่สัมพันธ์กันแต่ถูกเขียนคนละภาษา ท าดัชนีแบบธรรมดา เช่น การท าดัชนีแบบอินเวิร์ท<br />
3.2.3 เครื่องแปลภาษาเล็คซิคอน<br />
าดัชนีแบบธรรมดา เช่น การท าดัชนีแบบอินเวิร์ท<br />
กันได้โดยอัตโนมัติ ดังนั้นการพัฒนาแนวคิดในการแก้ไข (inverted indexing) ไม่สามารถรองรับการค้นคืน<br />
(machine translation lexicon)<br />
(inverted indexing) ไม่สามารถรองรับการค้นคืน<br />
ปัญหานี้จึงเป็นจุดหนึ่งที่น่าสนใจ<br />
ข้อมูลเชิงความหมายได้ ดังนั้นจึงต้องมีการปรับเปลี่ยน<br />
เทคนิคเครื่องแปลเลคซิคอนเป็นอีกวิธีหนึ่งที่ ข้อมูลเชิงความหมายได้ ดังนั้นจึงต้องมีการปรับเปลี่ยน<br />
3.2.3 เครื่องแปลภาษาเล็คซิคอน วิธีการท าดัชนีที่จะสนับสนุนการค้นคืนข้อมูลเชิง<br />
นิยมน ามาใช้ช่วยในการแปลภาษาซึ่งจะท าการ วิธีการท าดัชนีที่จะสนับสนุนการค้นคืนข้อมูลเชิง<br />
(machine translation lexicon)<br />
ความหมาย ในบทความนี้จะขอยกตัวอย่างการท าดัชนี<br />
วิเคราะห์และท าการแปล วัตถุประสงค์ส าคัญของ ความหมาย ในบทความนี้จะขอยกตัวอย่างการท าดัชนี<br />
เทคนิคเครื่องแปลเลคซิคอนเป็นอีกวิธีหนึ่งที่ เพื่อรองรับกลไกลดังกล่าว 2 วิธี ได้แก่ วิธีการ latent<br />
เทคนิคเล็กซิคอนนี้คือการลดความก ากวมของค าศัพท์ เพื่อรองรับกลไกลดังกล่าว 2 วิธี ได้แก่ วิธีการ latent<br />
นิยมน<br />
ต่าง ๆ<br />
ามาใช้ช่วยในการแปลภาษาซึ่งจะท<br />
และเลือกใช้ความหมายที่ถูกต้องเหมาะสมกับ<br />
าการ semantic indexing (LSI) และวิธีการออนโทโลจี<br />
semantic indexing (LSI) และวิธีการออนโทโลจี<br />
วิเคราะห์และท<br />
บริบท ในการน าเทคนิคเครื่องแปลเล็กซิคอนมาใช้กับ<br />
าการแปล วัตถุประสงค์ส าคัญของ (ontology)<br />
(ontology)<br />
เทคนิคเล็กซิคอนนี้คือการลดความก<br />
ระบบ CLIR นั้นท าได้ง่ายคือการน าเทคนิคนี้มาท<br />
ากวมของค าศัพท์<br />
าการ<br />
เทคนิคการ<br />
แปลภาษา<br />
Ontology<br />
Ontology<br />
Bilingual<br />
Dictionary<br />
Dictionary<br />
Machine<br />
Machine<br />
Translation<br />
Lexicons<br />
รูปที่<br />
รูปที่ 4<br />
เทคนิคการแปลข้อมูลเป็นภาษาต่าง<br />
เทคนิคการแปลข้อมูลเป็นภาษาต่าง ๆ