การค้นคืนข้อมูลขนาดใหญ่โดยใช้ภาษาสอบถามแบบไม่มีโครงสร้างร่วมกับเทคโนโลยีเว็บเชิงความหมาย
Abstract
บทคัดย่อ
การค้นคืนข้อมูลให้ตรงตามความต้องการของผู้ใช้งานมีความจำเป็นมากในปัจจุบัน เนื่องจากข้อมูลมีปริมาณเพิ่มมากขึ้น ทำให้การประมวลผลล่าช้า และการค้นคืนไม่ตรงตามความต้องการของผู้ใช้งาน วัตถุประสงค์ของงานวิจัยนี้จึงนำฐานข้อมูลไม่สัมพันธ์มาประยุกต์ใช้กับการจัดการข้อมูลขนาดใหญ่โดยใช้ภาษาสอบถามแบบไม่มีโครงสร้างและโครงสร้างออนโทโลยีที่เป็นเทคโนโลยีเว็บเชิงความหมายมาช่วยค้นคืนข้อมูลให้มีประสิทธิภาพมากขึ้น โดยทำการออกแบบโครงสร้างออนโทโลยีเพื่อจัดเก็บลงใน MongoDB ซึ่งเป็นฐานข้อมูลไม่สัมพันธ์จากการวิจัยพบว่าผลการทดสอบความเร็วในการอ่านข้อมูลที่จำนวนเธรดเท่ากับ 100 เพื่อเข้าถึงข้อมูลจำนวน 100,000 แถว ใช้เวลาในการประมวลผลมากที่สุดซึ่งสามารถประมวลผลเสร็จภายในเวลา 36.42 วินาทีส่วนการแก้ไขและการลบข้อมูลพบว่าจำนวนเธรดและจำนวนข้อมูลที่แตกต่างกันส่งผลต่อเวลาในการประมวลผลน้อยมาก ซึ่งสามารถประมวลผลเสร็จภายในเวลาไม่ถึง 1 วินาที
คำสำคัญ: การค้นคืนสารสนเทศ ภาษาสอบถามแบบไม่มีโครงสร้าง ออนโทโลยีเว็บเชิงความหมาย ฐานข้อมูลไม่สัมพันธ์
Abstract
The retrieval of information to meet user’s requirement is crucial in this Big Data era. Due to the increasing volume of data, retrieval suffers from the processing delays and the inaccuracy of the retrieved data. The objective of this research is to combine a non-relational database, which features the management of large volumes of data, with a big data retrieval system based on NoSQL. Ontology structure, a semantic web technology, is employed to enhance the retrieval process by storing in MongoDB, which is a non-relational database. The result shows that the response time of the query operation using 100 threads with 100,000 rows is 36.42 seconds. For the updating and deleting operations, the difference between the thread number and the data size has a minimal effect on the processing time, which is less than 1 second.
Keywords: Information Retrieval, NoSQL, Ontology, Semantic Web, Non-relational Database
ISSN: 2985-2145