ไต้ฝุ่น AI ปัญญาประดิษฐ์สัญชาติไทย โมเดลแรกรองรับภาษาอีสาน

[AI เพื่อคนไทย] ปัจจุบันเรามีโมเดล AI มากมายให้ใช้บริการหลากหลายมาก แต่สำหรับประเทศไทยนั้น การจะหาโมเดล AI ที่เข้าใจ “ภาษาไทย” อย่างแท้จริงเลยนั้น ปัจจุบันก็มีเพียง 3 ตัวในไทย โดยหนึ่งในนั้นคือ “Typhoon” (ไต้ฝุ่น) โครงการปัญญาประดิษฐ์ (AI) ภาษาไทยแบบ Open-source ให้ก้าวสู่ระดับโลก

ก่อนไปจะพูดถึง Typhoon นั้น ก่อนอื่นมารู้จับกับ AWS Generative AI Accelerator (GAIA) กันก่อน โดยเป็นโครงการเฟ้นหาสตาร์ทอัพ (Startup) จากทาง AWS Thailand ที่ต้องการปั้นสตาร์ทอัพในไทยให้กลายเป็น Unicorn ยุค AI เลย

“กลุ่มสตาร์ทอัพคือผู้ใช้งานกลุ่มแรกๆ ที่ตอบรับเทคโนโลยีคลาวด์ของเรา AWS จึงให้ความสำคัญและจัดตั้งทีมงานดูแลสตาร์ทอัพโดยเฉพาะ เพราะเราเข้าใจว่าพวกเขาต้องการมากกว่าแค่เงินทุน”

คุณวัตสัน ถิรภัทรพงศ์, Country Manager ของ AWS ประเทศไทย กล่าว

ทั้งนี้คุณวัตสันยังเผยด้วยว่า AWS จะให้การสนับสนุนสตาร์ทอัพในทุกมิติ ทั้งผ่านโครงการ AWS Activate ที่ตลอด 12 ปีที่ผ่านมา อัดฉีดเครดิตสนับสนุนไปแล้วกว่า 7,000 ล้านดอลลาร์ฯ ทั่วโลก (โดย 2,000 ล้านดอลลาร์ฯ เกิดขึ้นในปีที่แล้วเพียงปีเดียว) ซึ่งผลลัพธ์คือ 70-80% ของ Unicorn ทั่วโลก ล้วนใช้บริการ AWS

สำหรับโครงการ GAIA ถูกออกแบบมาเพื่อช่วยสตาร์ทอัพด้าน Generative AI โดยเฉพาะ จนในที่สุดก็ได้เป็น Typhoon โมเดล AI สัญชาติไทย ซึ่งพัฒนาโดย SCB 10X ที่ได้รับเลือกในครั้งนี้เอง

คำถามถัดมาคือ “ทำไมไทยต้องมีโมเดล AI ของตัวเอง” อย่างที่เกริ่นไปว่าปัจจุบันเรามีโมเดล AI เก่ง ๆ ให้เลือกใช้มากมาย แบรนด์ผู้ให้บริการระดับโลกก็มีไม่น้อย สำหรับข้อสงสัยนี้ก็ได้คุณกสิมะ ธารพิพิธชัย, Head of AI Strategy จาก SCB 10X มาให้คำตอบที่ชัดเจนเลยว่า

“โมเดลต่างประเทศยังมีความแม่นยำต่ำในการทำ OCR (การอ่านอักขระ) กับเอกสารราชการไทย การรู้จำเสียงพูดภาษาไทยก็ยังมีราคาสูง และที่สำคัญคือ ไม่เข้าใจการสลับภาษา (Code-switching) และ ภาษาท้องถิ่น ซึ่งเป็นหัวใจของการสื่อสารในชีวิตประจำวันของคนไทย”

นี่จึงเป็นจุดที่ Typhoon เข้ามาตอบโจทย์ ในฐานะโมเดล AI ภาษาไทยแบบ Open-source ที่มุ่งพัฒนาเพื่อคนไทยโดยเฉพาะ และมองว่าการมี AI ท้องถิ่น (Local AI) จะทำให้สามารถควบคุมและปรับแต่งตัวโมเดล AI ได้ตามบริบทวัฒนธรรมไทย 

“และที่สำคัญเลยคือ ต้นทุนที่ต่ำกว่าแต่ให้ประสิทธิภาพที่สูงกว่า” คุณกสิมะ กล่าวเสริม

ทั้งนี้ทาง SCB 10X ได้ใช้เวลา 2 ปีในการผลักดัน Typhoon จากโมเดลภาษาพื้นฐาน สู่การพัฒนาโมเดลที่หลากหลาย ทั้งโมเดลขนาดเล็ก (SLMs), โมเดลด้านเสียง (ASR), การแปลภาษา (Typhoon Translate) และล่าสุดคือ Typhoon Isan ASR โมเดลแรกที่รองรับ “ภาษาอีสาน” ซึ่งเป็นความท้าทายอย่างมากเพราะต้องสร้างทรัพยากรข้อมูลทั้งหมดจากศูนย์

โดยความสำเร็จครั้งนี้ก็สะท้อนผ่านตัวเลขการใช้งานที่มียอดดาวน์โหลดโมเดลสูงถึง 6.6 ล้านครั้ง และการเรียกใช้ API กว่า 3.5 ล้านครั้ง จากผู้ใช้กว่า 19,000 ราย

“การได้เข้าร่วมโครงการ AWS Startup Loft Accelerator จะช่วยให้เราสามารถขยายการเข้าถึงโมเดลของเราผ่านบริการอย่าง AWS Marketplace ได้มากขึ้น เป้าหมายต่อไปคือการทำให้ AI ของเราน่าเชื่อถือ มีประสิทธิภาพ และมีต้นทุนที่เหมาะสม เพื่อให้คนไทยทุกคนเข้าถึงได้” คุณกสิมะกล่าวปิดท้าย

การผนึกกำลังกันระหว่าง AWS และ SCB 10X ในครั้งนี้ จึงเป็นมากกว่าความร่วมมือทางธุรกิจ แต่มันคือการวางรากฐานที่แข็งแกร่งให้กับอุตสาหกรรม AI ของไทย โดย AWS ทำหน้าที่เป็นแพลตฟอร์มเร่งการเติบโตระดับโลก ในขณะที่ SCB 10X ทำหน้าที่เป็นหัวหอกในการสร้างนวัตกรรมที่เข้าใจบริบทของคนไทยอย่างลึกซึ้ง ซึ่งการเดินทางของ “Typhoon” บนเวทีโลกในครั้งนี้ น่าจับตามองอย่างยิ่งว่าจะเป็นกุญแจสำคัญในการยกระดับเทคโนโลยีดิจิทัลของประเทศไทยในอนาคต