27.10.2014 Views

(Cross Language (Thai-English) Information Retrieval: Concepts ...

(Cross Language (Thai-English) Information Retrieval: Concepts ...

(Cross Language (Thai-English) Information Retrieval: Concepts ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

128 KKU Science Journal Volume 41 Number 1 Review<br />

3.2.1 ออนโทโลจี (ontology) ต่าง ๆ และเลือกใช้ความหมายที่ถูกต้องเหมาะสมกับ<br />

128<br />

ออนโทโลจีเป็นโครงสร้างข้อมูลที่เก็บ<br />

KKU Science Journal Volume<br />

บริบท ในการน<br />

41 Number<br />

าเทคนิคเครื่องแปลเล็กซิคอนมาใช้กับ<br />

1 Review<br />

ฐานความรู้ในลักษณะของล าดับชั้นของคอนเซฟท์และ ระบบ CLIR นั้นท าได้ง่ายคือการน าเทคนิคนี้มาท าการ<br />

ความสัมพันธ์ระหว่างคอนเซฟท์ต่าง ภาษาคือสามารถรองรับการค้นหาเชิงความหมาย ๆ ข้อดีของการ โดย<br />

แปลเพื่อหาความหมายของคิวรี่หรือความหมายของ<br />

น<br />

ที่ผู้ใช้ทั่วไปสามารถใช้ค<br />

าเอาออนโทโลจีมาใช้ในระบบค้นคืนสารสนเทศข้าม<br />

า<br />

เอกสารนั่นเอง<br />

เอกสารนั่นเอง<br />

โดยทั่วไปแล้วระบบจะเลือกความหมาย<br />

โดยทั่วไปแล้วระบบจะเลือกความหมาย<br />

ภาษาคือสามารถรองรับการค้นหาเชิงความหมาย<br />

ส าคัญในคิวรี่ได้อย่างอิสระ ระบบจะ<br />

โดย ของค<br />

ของค<br />

าศัพท์ที่เหมาะสมที่สุดมาเพียงความหมายเดียว<br />

าศัพท์ที่เหมาะสมที่สุดมาเพียงความหมายเดียว<br />

ที่ผู้ใช้ทั่วไปสามารถใช้ค<br />

ประมวลผลเพื่อหาค าที่มีความหมายเหมือนกัน<br />

า<br />

หรือค า<br />

เท่านั้น<br />

เท่านั้น<br />

การที่ระบบเลือกเพียงความหมายเดียวนี้มี<br />

การที่ระบบเลือกเพียงความหมายเดียวนี้มี<br />

ที่เกี่ยวข้องกัน<br />

ส าคัญในคิวรี่ได้อย่างอิสระ<br />

(related terms) โดยดูจากคอนเซฟท์<br />

ระบบจะ ผลกระทบต่อประสิทธิภาพการค้นคืนข้อมูลของระบบ<br />

ผลกระทบต่อประสิทธิภาพการค้นคืนข้อมูลของระบบ<br />

(concept) ของค าส าคัญในคิวรี่เป็นหลัก ออนโทโลจี<br />

ประมวลผลเพื่อหาค าที่มีความหมายเหมือนกัน หรือค า เนื่องจาก<br />

เนื่องจาก<br />

ระบบค้นคืนสารสนเทศ<br />

ระบบค้นคืนสารสนเทศ<br />

อาจจะมองข้าม<br />

อาจจะมองข้าม<br />

ถือเป็นเทคนิคที่มีศักยภาพสูงในการประยุกต์ใช้กับ เอกสารที่เกี่ยวข้องบางเอกสารไป ตัวอย่างระบบ<br />

ที่เกี่ยวข้องกัน (related terms) โดยดูจากคอนเซฟท์ เอกสารที่เกี่ยวข้องบางเอกสารไป ตัวอย่างระบบ<br />

ระบบแปลภาษา โดยที่ค าศัพท์ที่ต่างภาษากันจะอยู่ แปลภาษาโดยใช้เครื่องแปลเล็กซิคอน เช่นในงานของ<br />

(concept) ของค าส าคัญในคิวรี่เป็นหลัก ออนโทโลจี แปลภาษาโดยใช้เครื่องแปลเล็กซิคอน เช่นในงานของ<br />

ภายใต้คอนเซฟท์เดียวกัน แต่ปัญหาส าคัญคือการสร้าง<br />

ถือเป็นเทคนิคที่มีศักยภาพสูงในการประยุกต์ใช้กับ<br />

Oard et al. (1998)<br />

Oard et al. (1998)<br />

ออนโทโลจียังอาจจะต้องสร้างด้วยมือ เนื่องจากยังไม่มี<br />

ระบบแปลภาษา โดยที่ค าศัพท์ที่ต่างภาษากันจะอยู่<br />

เทคนิคใดที่มีประสิทธิภาพมากพอในการเปลี่ยน<br />

ภายใต้คอนเซฟท์เดียวกัน แต่ปัญหาส าคัญคือการสร้าง 4. แนวทางการพัฒนาระบบค้นคืนสารสนเทศ<br />

(convert) จากข้อมูลในเอกสารเป็นคอนเซฟท์ต่าง ๆ<br />

4. แนวทางการพัฒนาระบบค้นคืนสารสนเทศ<br />

ออนโทโลจียังอาจจะต้องสร้างด้วยมือ เนื่องจากยังไม่มี เชิงความหมาย<br />

ในออนโทโลจีโดยอัตโนมัติและยังมีอัลกอริทึมไม่มากนัก เชิงความหมาย<br />

เทคนิคใดที่มีประสิทธิภาพมากพอในการเปลี่ยน การสร้างระบบค้นคืนสารสนเทศที่จะสามารถ<br />

ในการหาค าศัพท์ที่สัมพันธ์กันแต่ถูกเขียนคนละภาษา การสร้างระบบค้นคืนสารสนเทศที่จะสามารถ<br />

(convert) จากข้อมูลในเอกสารเป็นคอนเซฟท์ต่าง ๆ ค้นหาข้อมูลเชิงความหมายได้นั้น จะต้องมีกลไกรองรับ<br />

กันได้โดยอัตโนมัติ ดังนั้นการพัฒนาแนวคิดในการแก้ไข ค้นหาข้อมูลเชิงความหมายได้นั้น จะต้องมีกลไกรองรับ<br />

ในออนโทโลจีโดยอัตโนมัติและยังมีอัลกอริทึมไม่มากนัก การค้นหาเชิงความหมาย ตัวอย่างเช่น การท าดัชนี การ<br />

ปัญหานี้จึงเป็นจุดหนึ่งที่น่าสนใจ<br />

การค้นหาเชิงความหมาย ตัวอย่างเช่น การท าดัชนี การ<br />

ในการหาค าศัพท์ที่สัมพันธ์กันแต่ถูกเขียนคนละภาษา ท าดัชนีแบบธรรมดา เช่น การท าดัชนีแบบอินเวิร์ท<br />

3.2.3 เครื่องแปลภาษาเล็คซิคอน<br />

าดัชนีแบบธรรมดา เช่น การท าดัชนีแบบอินเวิร์ท<br />

กันได้โดยอัตโนมัติ ดังนั้นการพัฒนาแนวคิดในการแก้ไข (inverted indexing) ไม่สามารถรองรับการค้นคืน<br />

(machine translation lexicon)<br />

(inverted indexing) ไม่สามารถรองรับการค้นคืน<br />

ปัญหานี้จึงเป็นจุดหนึ่งที่น่าสนใจ<br />

ข้อมูลเชิงความหมายได้ ดังนั้นจึงต้องมีการปรับเปลี่ยน<br />

เทคนิคเครื่องแปลเลคซิคอนเป็นอีกวิธีหนึ่งที่ ข้อมูลเชิงความหมายได้ ดังนั้นจึงต้องมีการปรับเปลี่ยน<br />

3.2.3 เครื่องแปลภาษาเล็คซิคอน วิธีการท าดัชนีที่จะสนับสนุนการค้นคืนข้อมูลเชิง<br />

นิยมน ามาใช้ช่วยในการแปลภาษาซึ่งจะท าการ วิธีการท าดัชนีที่จะสนับสนุนการค้นคืนข้อมูลเชิง<br />

(machine translation lexicon)<br />

ความหมาย ในบทความนี้จะขอยกตัวอย่างการท าดัชนี<br />

วิเคราะห์และท าการแปล วัตถุประสงค์ส าคัญของ ความหมาย ในบทความนี้จะขอยกตัวอย่างการท าดัชนี<br />

เทคนิคเครื่องแปลเลคซิคอนเป็นอีกวิธีหนึ่งที่ เพื่อรองรับกลไกลดังกล่าว 2 วิธี ได้แก่ วิธีการ latent<br />

เทคนิคเล็กซิคอนนี้คือการลดความก ากวมของค าศัพท์ เพื่อรองรับกลไกลดังกล่าว 2 วิธี ได้แก่ วิธีการ latent<br />

นิยมน<br />

ต่าง ๆ<br />

ามาใช้ช่วยในการแปลภาษาซึ่งจะท<br />

และเลือกใช้ความหมายที่ถูกต้องเหมาะสมกับ<br />

าการ semantic indexing (LSI) และวิธีการออนโทโลจี<br />

semantic indexing (LSI) และวิธีการออนโทโลจี<br />

วิเคราะห์และท<br />

บริบท ในการน าเทคนิคเครื่องแปลเล็กซิคอนมาใช้กับ<br />

าการแปล วัตถุประสงค์ส าคัญของ (ontology)<br />

(ontology)<br />

เทคนิคเล็กซิคอนนี้คือการลดความก<br />

ระบบ CLIR นั้นท าได้ง่ายคือการน าเทคนิคนี้มาท<br />

ากวมของค าศัพท์<br />

าการ<br />

เทคนิคการ<br />

แปลภาษา<br />

Ontology<br />

Ontology<br />

Bilingual<br />

Dictionary<br />

Dictionary<br />

Machine<br />

Machine<br />

Translation<br />

Lexicons<br />

รูปที่<br />

รูปที่ 4<br />

เทคนิคการแปลข้อมูลเป็นภาษาต่าง<br />

เทคนิคการแปลข้อมูลเป็นภาษาต่าง ๆ

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!