Page Header

Creating a Prediction Model for Prospective University Student Admissions During the COVID-19 Pandemic Situation: A Case Study of the Faculty of Science at Ubon Ratchathani University

Phaichayon Kongchai, Supawadee Hiranpongsin, Nadh Ditcharoen

Abstract


งานวิจัยนี้มีวัตถุประสงค์เพื่อหาชุดข้อมูลที่เหมาะสมและเพื่อสร้างตัวแบบที่เหมาะสมสำหรับทำนายการรับเข้านักศึกษาใหม่ในระดับมหาวิทยาลัยช่วงสถานการณ์โควิด-19 ด้วยข้อมูลการรับเข้านักศึกษาใหม่ คณะวิทยาศาสตร์ มหาวิทยาลัยอุบลราชธานี ปีการศึกษา 2561–2564 จำนวน 4,748 ระเบียน และ 18 ปัจจัย เปรียบเทียบประสิทธิภาพการทำนายด้วย 5 อัลกอริทึม ได้แก่ แรนดอมฟอเรส นาอีฟเบย์ การถดถอยโลจิสติก ซัพพอร์ตเวกเตอร์ และอองซองค์เบิล และใช้ค่าความถูกต้องเป็นตัวชี้วัดในการประเมินประสิทธิภาพ การทดสอบแบ่งเป็น 2 ส่วน ได้แก่ การทดสอบที่ 1 เป็นการทดสอบหาชุดข้อมูลที่เหมาะสมสำหรับการสร้างตัวแบบเพื่อทำนายการยืนยันสิทธิ์เข้าศึกษาในสถานการณ์โควิด-19 พบว่า ชุดข้อมูลปีการศึกษา 2564 ซึ่งเป็นช่วงที่โควิด-19 ระบาดมาก มีค่าความถูกต้องมากที่สุดเท่ากับร้อยละ 66.67 และการทดสอบที่ 2 เป็นการทดสอบแบ่งชุดข้อมูลปีการศึกษา 2564 ตามจำนวนหลักสูตร ผลการทดลองพบว่า ประสิทธิภาพการทำนายมีค่าความถูกต้องสูงขึ้น โดยหลักสูตรชีววิทยามีค่าความถูกต้องสูงสุด คือ ร้อยละ 78.69 ด้วยอัลกอริทึมนาอีฟเบย์ นอกจากนี้ยังพบว่า อัลกอริทึมซัพพอร์ตเวกเตอร์สามารถทำนายได้ค่าความถูกต้องสูงสุดมากถึง 5 หลักสูตร เมื่อเปรียบเทียบกับอัลกอริทึมที่เหลือข้างต้น ดังนั้น การสร้างตัวแบบโดยการแบ่งข้อมูลตามจำนวนหลักสูตรจะมีประสิทธิภาพมากกว่าการสร้างหนึ่งตัวแบบจากการใช้ชุดข้อมูลทั้งหมด

This research aimed to find a suitable dataset and to create a suitable model for predicting prospective university student admissions during the COVID-19 situation. The student admission information of Faculty of Science, Ubon Ratchathani University, during academic year 2018-2021 consisted of 4,748 records and 18 factors. To compare the predictive performance, five algorithms were used: Random Forest, Naïve Bayes, Logistic Regression, Support Vector Classification, and Ensemble. In addition, the accuracy metric was used for the performance evaluation. This experiment was divided into two parts. The first part of the experiment was to find a suitable data set to create a prediction model for prospective university student admissions during the COVID-19 situation. The results showed that the 2021 academic year dataset, which was during the COVID- 19 pandemic, had the highest accuracy at 66.67%. In the second part of the experiment, the 2021 data set was divided according to the number of courses. The results showed that the prediction performance had a higher accuracy value. The biology course had the highest accuracy of 78.69 percent using the Naïve Bayes algorithm. Furthermore, the support vector classification algorithm was able to predict the highest accuracy for up to 5 courses compared to other algorithms. Therefore, creating a model by dividing the data set according to the number of courses is more efficient than creating one model using the entire dataset.


Keywords



[1] B. Srisombat, “Factors affecting the grouping decision making to continue higher education study in the faculty of science and technology pibulsongkram rajabphat university,” Journal of Humanities and Social Sciences of Pibulsongkram Rajabhat University, vol. 16, no. 2, pp. 189–200, 2015 (in Thai).

[2] S. Srisontisuk, M. buasri, and P. Wanong, “Factors affecting the decision on bachelor degree study at khon kaen university of the students through the thai university central admission system (TCAS System), in the academic year 2019,” Journal of School of Administrative Studies Academic, vol. 3, no. 3, pp. 33–47, 2020 (in Thai).

[3] P. Nittayakamolphun and T. Kaewkwankrai, “Factors affecting learning behavior of students studying statistics for economist,” Journal of Humanities and Social Sciences University of Phayao, vol. 9, no. 2, pp. 213–237, 2021 (in Thai).

[4] P. Jittawitsutigul and J. Sanrat, “The comparison of model efficiency to forecast the number of new students for analysis of factors affecting on admission to nakhon pathom rajabhat university by using ENSEMBLE,” in Proceedings Nakhon Pathom Rajabhat University, 2017 (in Thai).

[5] J. J. Rodriguez, L. I. Kuncheva, and C. J. Alonso, “Rotation forest: A new classifier ensemble method,” IEEE transactions on pattern analysis and machine intelligence, vol. 28, no. 10, pp. 1619–1630, 2006.

[6] M. Pal, “Random forest classifier for remote sensing classification,” International Journal of Remote Sensing, vol. 26, no. 1, pp. 217–222, 2005.

[7] S. Wanon and R. Muangsan, “A study and development of forecasting model for the suitability characteristics on the applying major selection by using data mining techniques,” Journal of Management Sciences Suratthani Rajabhat University, vol. 7, no. 1, pp. 135–152, 2020 (in Thai).

[8] R. Agrawal, T. Imieliński, and A. Swami, “Mining association rules between sets of items in large databases,” in Proceedings the 1993 ACM SIGMOD International Conference on Management of Data, 1993, pp. 207–216.

[9] A. Surawatchayotin and W. Paireekreng, “The predictive model of higher education guidance using integrated techniques for imbalanced data of learner groups,” Journal of Information Science and Technology, vol. 11, no. 1, pp. 65–74. 2021 (in Thai).

[10] N. V. Chawla, K. W. Bowyer, L. O. Hall, and P. W. Kegelmeyer, “SMOTE: Synthetic minority over-sampling technique,” Journal of Artificial Intelligence Research, vol. 16, pp. 321–357, 2002.

[11] W. Prachuabsupakij, T. Boonyoung, and S. Boonsri, “A construction model for predicting student’s academic achievement by smartphone usage behaviors using data mining techniques,” The Journal of KMUTNB, vol. 31, no. 3, pp. 550–560, 2021 (in Thai).

[12] I. Rish, “An empirical study of the naive Bayes classifier, in Proceedings the International Joint Conference on Artificial Intelligence, vol. 3, no. 22, pp. 41–46, 2001.

[13] E. Antipov and E. Pokryshevskaya, “Applying CHAID for logistic regression diagnostics and classification accuracy improvement,” Journal of Targeting, Measurement and Analysis for Marketing, vol. 18, no. 2, pp. 109–117, 2010.

[14] L. Zhang, W. Zhou, and L. Jiao, “Wavelet support vector machine,” Journal of IEEE Transactions on Systems, Man, and Cybernetics, vol. 34, no. 1, pp. 34–39, 2004.

[15] W. N. Street and Y. Kim, “A streaming ensemble algorithm (SEA) for large-scale classification,” in Proceedings of the Seventh Acm Sigkdd International Conference on Knowledge Discovery and Data Mining, 2001, pp. 377–382.

Full Text: PDF

DOI: 10.14416/j.kmutnb.2024.02.002

ISSN: 2985-2145