มีลุ้น แชทบอทสัญชาติไทย ดึงข้อมูล Pantip ช่วยรันโมเดล

คนไทยก็ทำได้ อีกไม่นานเราจะได้ใช้แชทบอต AI แบบเดียวกับ ChatGPT แต่ต่างตรงที่เข้าใจภาษาไทย และตอบโต้ได้อัตโนมัติ

โปรเจคนี้บอกเลยว่ามีลุ้น เพราะเกิดจากการรวมตัวกันของนักวิจัยไทย และอาสาสมัครมากกว่า 100 คน ที่ซุ่มพัฒนาโปรเจค OpenThaiGPT มานานกว่า 4 เดือน จนล่าสุดเดินหน้ามาถึงเวอร์ชั่น 0.1.0 ที่เปิดให้นักพัฒนาได้ทดลองใช้งานแล้ว

เชื่อว่าคนที่เคยใช้งาน ChatGPT ภาษาอังกฤษมาก่อน คงอยากเห็นแชตบอทภาษาไทยที่ใช้งานได้หลากหลายไม่แพ้ภาษาหลัก อย่าง อังกฤษ และจีน นั่นเป็นหนึ่งในความตั้งใจของ ดร.เทพชัย ทรัพย์นิธิ ผู้อำนวยการกลุ่มวิจัยปัญญาประดิษฐ์ เนคเทค สวทช. และทีมนักวิจัยจากหลากหลายหน่วยงานที่ได้ร่วมมือกันปั้นโปรเจคนี้ขึ้นมา

จากจุดเริ่มต้นของเทคโนโลยี ChatGPT ที่เข้ามาเปิดมิติใหม่ของ AI ให้ทำได้เหนือกว่าการแยกแยะ และจัดกลุ่มข้อมูล แต่ผลงานที่เกิดจากการสร้างสรรค์ของ AI ทำให้มีการใช้งาน ChatGPT อย่างแพร่หลาย จนนำมาสู่การพัฒนาแชทบอทสัญชาติไทย OpenThaiGPT

ด้วยข้อจำกัดของภาษา และเป้าหมายการเทรนด์ AI ให้เข้าใจและแยกแยะภาษาไทยได้นั้น ต้องอาศัยคลังข้อมูลขนาดใหญ่ โดยหลังจากนี้ทีมวิจัยจะเริ่มขยายสเกลการทดสอบสู่ระดับ GPT3 โดยดึงฐานข้อมูลการสนทนาภาษาไทยจากกระทู้ในเว็บบอร์ดยอดนิยมอย่าง pantip.com เพื่อฝึกให้ AI ได้เรียนรู้

นักวิจัย ยอมรับว่า ความยากของโปรเจคนี้อยู่ที่การสร้างโมเดลภาษาไทยขนาดใหญ่ เพื่อให้เป็นคำตอบกลางสำหรับคนทั่วไปสามารถดึงไปใช้ได้ในโจทย์ที่แตกต่าง และต้องการคำตอบที่ไม่เหมือนกัน ยกตัวอย่างเช่น หากต้องการทำแชทบอทให้ตอบคำถามเกี่ยวกับการเมือง ช่วงเลือกตั้ง ก็ต้องมีชุดคำถามและคำตอบเกี่ยวกับการเมืองป้อนเข้าไปให้ AI ได้เรียนรู้

ข้อดีของการพัฒนาโปรเจค คือใช้ฐานของโอเพ่นชอร์ส ที่เปิดให้อาสาสมัครที่สนใจเข้ามามีส่วนร่วมในการพัฒนาและใช้ประโยชน์จาก OpenThaiGPT ได้ โดยอาสาสมัครแต่ละคนจะมีหน้าที่แตกต่างกันไป เช่น คนที่เก่งด้าน AI ก็จะรับหน้าที่เทรนด์ตัวระบบ คนที่เก่งเรื่องภาษาก็ดูเรื่องทำคู่คำถาม คำตอบ เพื่อสอนให้ตัวโมเดลเก่งขึ้น 

รวมถึงงานด้านความปลอดภัย ทำให้ AI ฉลาดพอที่จะตอบคำถามได้อย่างเป็นธรรมชาติ และตัดสินใจได้เองว่าเป็นคำถามที่ควรตอบหรือไม่ หรือจะรับมือในรูปแบบไหน ซึ่งจะมีกลไกเรื่องความโปร่งใส ที่กำลังมองอาสาสมัครเข้ามาร่วมพัฒนาอยู่เช่นกัน

นักวิจัยบอกว่า ในเฟสต่อไปของการพัฒนาไปถึงระดับ GPT3 จะอาศัยความสามารถของ LANTA High-performance computing (HPC) ของคนไทย โดย ThaiSC เข้ามาช่วยเพิ่มทรัพยากรในการรันโมเดล เนื่องจากการขยายสเกลจำเป็นต้องใช้พลังในการประมวลผล และจัดการข้อมูล ทำให้ได้ผลลัพธ์ที่เร็วขึ้น โดยคาดว่าจะเปิดตัวโมเดลได้ในเดือน พ.ค ปี 66 ก่อนที่จะพัฒนารูปแบบหน้าตาให้ใช้งานได้อย่างแพร่หลายต่อไป

OpenThaiGPT จะเป็นประโยชน์กับธุรกิจ ที่สามารถดาวน์โหลดเอาไปใช้งานได้แบบไม่มีค่าใช้จ่าย เช่น การพนักงานผู้ช่วยตอบคำถาม ผู้ช่วยแชท ที่เชื่อมต่อเข้ากับ API ภายนอกได้

สิ่งที่ทีมวิจัยคาดหวัง คือ การสร้างเทคโนโลยีเพื่อใช้เอง จะเปลี่ยนสภาพเป็นผู้ทำมากกว่าผู้ใช้ที่ดี เพราะถ้าเราทำเองได้ การจะปรับปรุงแก้ไขก็ทำได้แบบไม่ถูกจำกัดสิทธิ์ แบบที่ผ่านมา

ใครสนใจเข้าร่วมเป็นอาสาสมัครในโปรเจคนี้ ไปดูข้อมูลเพิ่มเติมได้ครับ >> https://openthaigpt.aieat.or.th/

รู้จัก LANTA Supercomputer ของคนไทย >> https://www.techhub.in.th/lanta-thaisc-supercomputer/

#TechhubUpdate #ChatGPT #OpenThaiGPT #Nectec