การลดความผิดพลาดในการพิมพ์ภาษาไทยบนแป้นพิมพ์เสมือนด้วยวิธีปรับพื้นที่ปุ่มเป้าหมายและการใช้แบบจำลองทางภาษา LSTM
Combining Key-target Resizing and LSTM Language Model to Reduce Typos in Thai Soft Keyboard
Abstract
จากความแพร่หลายของการใช้งานสมาร์ทโฟนในปัจจุบันทำให้แป้นพิมพ์เสมือนกลายเป็นหนึ่งในเครื่องมือหลักของการนำเข้าข้อมูลตัวอักษรสู่สมาร์ทโฟน แต่ด้วยขนาดปุ่มที่เล็กของแป้นพิมพ์เสมือนบนสมาร์ทโฟนจึงเป็นเหตุให้ผู้ใช้พิมพ์ผิดพลาดไปจากปุ่มที่ต้องการได้บ่อยครั้ง ซึ่งจากการทบทวนวรรณกรรมผู้วิจัยพบว่ามีการนำเสนอเทคนิคต่าง ๆ ในการแก้ปัญหานี้บนแป้นพิมพ์เสมือนภาษาต่างประเทศ แต่ยังไม่พบงานวิจัยลักษณะนี้สำหรับแป้นพิมพ์เสมือนภาษาไทย จึงเป็นที่มาของงานวิจัยชิ้นนี้ที่ผู้วิจัยทดลองนำคลังคำศัพท์มาตรฐานภาษาไทยมาเป็นชุดข้อมูลเพื่อฝึกสอน สร้าง และทดสอบแบบจำลองภาษา 2 ตัว ได้แก่ แบบจำลองภาษาที่ใช้การเรียนรู้ของเครื่องจักรชนิด Markov Chain และแบบจำลองภาษาที่ใช้การเรียนรู้เชิงลึกชนิด LSTM โดยหน้าที่ของแบบจำลองภาษาแต่ละตัวคือคาดเดาปุ่มบนแป้นพิมพ์เสมือนภาษาไทยตัวถัดไปที่ผู้ใช้น่าจะกด เพื่อให้สมาร์ทโฟนสามารถทำการขยายขนาดปุ่มเป้าหมายให้ใหญ่ขึ้นรอไว้ล่วงหน้าได้ ทั้งนี้โดยมีเป้าหมายเพื่อช่วยลดอัตราการพิมพ์ผิดของผู้ใช้บนแป้นพิมพ์เสมือนภาษาไทย ผลการทดลองพบว่าแบบจำลองภาษาชนิด LSTM ให้ผลลัพธ์การพยากรณ์ที่ดีกว่าชนิด Markov Chain และเมื่อนำแบบจำลองภาษา LSTM ตัวดังกล่าวไปทดลองกับข้อมูลการพิมพ์ของผู้เข้าร่วมการทดลอง 7 คนซึ่งเก็บรวบรวมมาโดยแอปพลิเคชันต้นแบบบนสมาร์ทโฟนที่ผู้วิจัยพัฒนาขึ้น พบว่าการใช้แบบจำลองภาษา LSTM ร่วมกับการขยายขนาดปุ่มล่วงหน้าสามารถช่วยลดความผิดพลาดในการพิมพ์ได้จริง โดยสามารถลดการพิมพ์ผิดได้ทั้งหมด 13 ครั้งจากการพิมพ์ผิดทั้งหมด 257 ครั้งหรือคิดเป็น 5.05%
Recently virtual keyboard has become one of the main user interfaces for entering textual data to a smartphone. For virtual keyboards in foreign languages, there are many researches that study how to reduce typos caused by the small size of each button in the virtual keyboard. Nevertheless, as we do not find this kind of researches for Thai virtual keyboard, we propose our work that experiments and evaluates feasibility of using a combination of language model and key-target resizing technique to reduce typos on Thai virtual keyboard. Our work starts by using standard Thai vocabulary corpuses to train two language models (i.e., Markov Chain and LSTM) in order to predict the most likely buttons that a user will press next. Then, we collect typing data on Thai virtual keyboard from seven users using our prototype system. Finally, we analyze the collected data in conjunction with predicted results from our language model. According to our experimental results, the LSTM based language model performs better than the Markov Chain based language model in predicting the next Thai’s character buttons. When this LSTM language model is used to enlarge six buttons with highest predicted probabilities in advance, results show that it helps reduce typos by 5.05%. More specifically, the number of typos is reduced by 13 out of 257 typos.
Keywords
[1] Advanced Info Services Public Company Limited. (2020, July). Operating and Financial Report. [Online] (in Thai). Available: http:// investor-th.ais.co.th/operational_highlight.html
[2] J. H. Kim, L. Aulck, O. Thamsuwan, M. C. Bartha, and P. W. Johnson, “The effects of virtual keyboard key sizes on typing productivity and physical exposures,” in Human Factors and Ergonomics Socety Annual Meeting, 2013.
[3] T. Baldwin and J. Y. Chai, “Towards online adaptation and personalization of key-target resizing for mobile devices,” presented at the IUI, 2012.
[4] D. Weir, S. Rogers, R. Murray-Smith, and M. Löchtefeld, “A user-specific machine learning approach for improving touch accuracy on mobile devices,” in UIST, Cambridge, Massachusetts, USA, 2012.
[5] National Statistical Office of Thailand, “Household information technology usage survey 2018 Q1,” Ministry of Digital Economy and Society, Bangkok, Thailand, 2018 (in Thai).
[6] Faculty of Arts. (2021, March). Thai National Corpus. [Online] (in Thai). Available: http:// www.arts.chula.ac.th/ling/tnc/
[7] Human Language Technology Laboratory. (2021, March). BEST by Human Language Technology Laboratory, National Electronics and Computer Technology Center. [Online]. Available: http://thailang.nectec.or.th/archive/ indexdca0.html?q=node/21
[8] Mozilla. (2020, November). Mozilla Common Voice GitHub Page. [Online]. Available: https:// github.com/common-voice/common-voice/ tree/main/server/data/th
[9] H. Wassdahl and K. Cho, “Personalized stroke order dependent keyboard with adaptive key-target areas using user generated data,” in HCI Korea, 2016.
[10] Google, Inc. (2021, April). Pixel density. [Online]. Available: https://material.io/design/layout/ pixel-density.html#density-independence
[11] N. Piyapramote. (2021, March). Keyboard ManMan Google Play Store Page. [Online]. Available: https://play.google.com/store/apps/ details?id=net.siamdev.nattster.manman&hl =th&gl=US
[12] J. Himberg, J. Häkkilä, and J. Mäntyjärvi, “On-line personalization of a touch screen based keyboard,” presented at the IUI, Miami, Florida, USA, 2003.
[13] A. Gunawardana, T. Paek, and C. Meek, “Usability guided key-target resizing for soft keyboards,” presented at the IUI, Hong Kong, China, 2010.
DOI: 10.14416/j.kmutnb.2021.09.001
ISSN: 2985-2145