นี่หรือลายมือ

โครงการ การรู้จำลายมือเขียนโดยใช้คอนโวลูชันนอล นิวรอล เน็ตเวิร์ค แยกตามองค์ประกอบคำไทย

Computer Vision Project 2018


Table of Contents

  1. สาระสำคัญของโครงการ
  2. วัตถุประสงค์
  3. ขอบเขตของโครงการ
  4. แผนภาพการทำงาน
  5. ผลการทดลอง
  6. สมาชิก

สาระสำคัญของโครงการ

       ในช่วงเวลาปัจจุบันที่เป็นยุคของการเปลี่ยนแปลงทางเทคโนโลยี เมื่ออุตสาหกรรมต่างๆ ได้หันไปพึ่งพาเทคโนโลยีทางคอมพิวเตอร์แทนแรงงานมนุษย์ดังเช่นสมัยก่อน ทำให้เกิดความจำเป็นในการรวบรวมข้อมูลที่อยู่ในรูปแบบดั้งเดิมและข้อมูลในรูปแบบที่สร้างขึ้นจากคอมพิวเตอร์ไว้ด้วยกัน โดยหนึ่งในข้อมูลที่พบได้ทั่วไปนั้นคือข้อมูลในรูปแบบของข้อความ (text) ซึ่งมักจะเป็นข้อความลายมือบนกระดาษ แต่เนื่องจากว่าลายมือของแต่ละบุคคลนั้นมีความต่างกัน ทั้งวิธีการเขียน และ ความกว้างความยาว ทำให้ปัญหาการรู้จำลายมือด้วยคอมพิวเตอร์นั้นเป็นปัญหาที่ยังคงท้าทายนักวิจัยอยู่จนทุกวันนี้ โครงการการรู้จำลายมือเขียนโดยใช้คอนโวลูชันนอล นิวรอลเน็ตเวิร์ค แยกตามองค์ประกอบคำภาษาไทย จึงมุ่งเน้นที่จะสร้างระบบที่สามารถรู้จำลายมือเขียนภาษาไทยได้อย่างแม่นยำโดยใช้ขั้นตอนวิธีการประมวลผลภาพ (Image Processing) และเทคนิคการเรียนรู้ของเครื่อง (Machine Learning) เพื่อแยกแยะและรู้จำลายมือเขียนภาษาไทย โดยในการทดสอบประสิทธิภาพ จะใช้ชุดข้อมูลที่ถูกจัดเตรียมที่ใช้ในการแข่งขัน BEST 2019 Handwritten Recognition: การรู้จำลายมือเขียน โดยชุดข้อมูลดังกล่าวทางหน่วยปฏิบัติการวิจัยเทคโนโลยีภาพ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) จะเป็นผู้จัดเตรียมเลือกชุดข้อมูลวิธีการประเมินประสิทธิภาพของขั้นตอนวิธีและจัดทำผลเฉลย

วัตถุประสงค์

ขอบเขตของโครงการ

       ระบบที่พัฒนาจะรับข้อมูลนำเข้าเป็นภาพที่ประกอบด้วยอักขระภาษาไทยและตัวเลขอาราบิกเท่านั้น เพียงบรรทัดเดียว ในรูปแบบ png เป็น Gray-scale ซึ่งจะถูกประมวลผลออกมาเป็นข้อความในรูปแบบ UTF-8 ซึ่งเป็นรูปแบบที่ทางการแข่งได้กำหนดไว้

       ตัวอย่างข้อมูลนำเข้า

Imgur

แผนภาพการทำงาน

โมเดล Binary

Binary Model

โมเดล Categorical

Categorical Model

CNN Block

CNN BLock

ผลการทดลอง

Table

สมาชิก

  1. นายอรรถวิท ไชยโรจน์ 5831079921
  2. นายวิวัฒนชัย แสงสง่า 5831065021
  3. นายปัญญาวุธ ศรีอิสรานุสรณ์ 5831039821