การใช้เทคนิคเหมืองข้อมูลเพื่อพัฒนาระบบการจัดเก็บและสืบค้นภูมิปัญญาท้องถิ่นภาคใต้ ในพื้นที่จังหวัดสุราษฎร์ธานี
Abstract
บทคัดย่อ
งานวิจัยชิ้นนี้ ได้รวบรวมบทความภูมิปัญญาท้องถิ่นภาคใต้ในจังหวัดสุราษฎร์ธานี เพื่อทำการเผยแพร่ผ่านเว็บไซต์ บันทึกสถิติการสืบค้นจากการค้นตรงผ่านเว็บไซต์ และการสืบค้นผ่านเว็บกูเกิ้ล มีการรวบรวมข้อมูลสถิติการสืบค้นเพื่อทำการวิเคราะห์หมวดหมู่ ด้วยเทคนิคเคมีนคลัสเตอร์ริง จากผลการวิเคราะห์ชี้ให้เห็นว่าควรจะจัดหมวดหมู่ 15 กลุ่ม เพราะระดับค่า Sig เท่ากับ .000 ค่าผลรวมกำลังสองของค่าความคลาดเคลื่อนเท่ากับ0.81 ใกล้เคียงค่า 0 ข้อมูลในแต่ละกลุ่มกระจุกตัวดีถือว่ายอมรับได้ แต่ละกลุ่มมีความสอดคล้องกันของเนื้อหากับความถี่ของคำค้นในแต่ละบทความมีการนำบทความทั้งหมดวิเคราะห์หมวดหมู่ และวิเคราะห์ความสัมพันธ์ด้วยการวิเคราะห์ฟอมอลคอนเท็กซ์จากออบเจคท์ 15 ออบเจคท์ กับแอตทริบิว 245 แอตทริบิวผลการวิเคราะห์ได้กฎความสัมพันธ์ 319 กฎ ที่มีความสัมพันธ์กับคำค้นของบทความและมีการซ้อนทับของคำค้นในเนื้อหาบทความใช้คำค้นร่วมกัน 45 บทความแทบไม่ใช้ร่วมกัน 87 บทความ และใช้คำค้นร่วมกันมากที่สุด 6 บทความ ผลการวิเคราะห์หมวดหมู่ ด้วยการวิเคราะห์ฟอมอลคอนเท็กซ์ 15 กลุ่ม ใช้เป็นหมวดหมู่ได้ โดยนำหมวดหมู่ และกฎความสัมพันธ์ ไปวิเคราะห์ออกแบบและพัฒนาระบบการจัดเก็บและสืบค้นประกอบด้วยระบบการจัดหมวดหมู่บทความ ระบบจัดทำบทความระบบการสร้างความสัมพันธ์ด้วยกำหนดเมทาเดตา และระบบสืบค้น ผลการทดสอบหาประสิทธิภาพของระบบได้ค่าความแม่นยำ (Precision) 98% ระดับดีมาก ค่าความระลึก (Recall) 81% ระดับดี
คำสำคัญ: ระบบการจัดเก็บและสืบค้น เหมืองข้อมูลวิเคราะห์หมวดหมู่ วิเคราะห์ความสัมพันธ์ฟอมอลคอนเท็กซ์
Abstract
This study was conducted for the research and collection of the articles about local wisdom in Suratthani Province, Southern Thailand which were published on Google website. The searched articles were collected, analyzed, and categorized by K-Means Cluster Technique. The analysis results indicated that the data can be categorized into 15 groups due to the statistical significant value of 0.000 and the sum square error value of 0.81 which was near zero. The data of cluster were concentrated which was reliable. The clusters were congruent with the article contents and the frequency of keywords. All articles were analyzed based on the association rule and categorized by the formal context analysis resulting in 15 objects with 245 attributes. The analysis results generated into 319 association rules relating to the keywords of articles. There were keyword overlaps in 45 articles with the edge count of 87 articles. The highest keyword overlaps were in 6 articles. The results of formal context analysis of 15 groups could be used for category analysis. The categories and the association rules could be used for design, analysis, and development of information storage and retrieval system. This consists of the category system, the article creating system, the metadata related to article system, and the retrieval system. The efficacy of the system and the precision ratio of the prototype was 98% or at the highest level, while the recall ratio of the prototype was 81% or at high level.
Keywords: Information Storage and Retrieval, Data Mining, Cluster Analysis, Association Rules, Formal Context
ISSN: 2985-2145