เทคนิคใหม่ Huawei ฝึก AI บนชิป Ascend เทียบแล้วแรงกว่า Deepseek

Huawei Pangu AI โมเดลปัญญาประดิษฐ์เรือธงของ Huawei สร้างความสั่นสะเทือนให้วงการอีกครั้ง หลังทีมวิจัยได้เปิดตัวเทคนิคการฝึก AI รูปแบบใหม่ ที่ชื่อว่า Mixture of Grouped Experts หรือ MoGE ถูกออกแบบมาเพื่อดึงศักยภาพสูงสุดของ Huawei Pangu AI เมื่อทำงานบนชิป Ascend ที่บริษัทผลิตขึ้นเองโดยเฉพาะ

ความก้าวหน้าของ Huawei Pangu AI ในครั้งนี้ ถือเป็นส่วนหนึ่งของยุทธศาสตร์สำคัญในการสร้างความแข็งแกร่งทางเทคโนโลยีและลดการพึ่งพาเทคโนโลยีจากสหรัฐอเมริกา ท่ามกลางมาตรการคว่ำบาตรที่ยังคงดำเนินอยู่

เทคนิค MoGE เบื้องหลังความแรงของ Huawei Pangu AI

เทคนิค MoGE เข้ามาแก้ปัญหาของเทคนิค MoE หรือ Mixture of Experts แบบดั้งเดิมที่โมเดลอื่นใช้งาน ที่มักเกิดปัญหาการกระจายภาระงานในระบบไม่สมดุล โดยจะจัดกลุ่มผู้เชี่ยวชาญหรือโมเดลย่อยในระบบ ทำให้ Huawei Pangu AI สามารถกระจายและจัดการภาระงานได้อย่างมีประสิทธิภาพและสมดุลกว่าเดิม ส่งผลให้ทั้งการฝึกฝน และการประมวลผลเพื่อใช้งานจริง ทำได้รวดเร็วยิ่งขึ้น

จุดที่น่าสนใจที่สุดคือการทดสอบประสิทธิภาพที่เกิดขึ้นบนฮาร์ดแวร์ของ Huawei เอง โดยผลการทดสอบชี้ชัดว่า Huawei Pangu AI ที่ทำงานบนชิปประมวลผล NPU รุ่น Ascend มีประสิทธิภาพอยู่ในระดับ State-of-the-art

ในการทดสอบเปรียบเทียบ Huawei Pangu AI สามารถเอาชนะโมเดลคู่แข่งชื่อดังอย่าง DeepSeek-V3, Qwen2.5 ของ Alibaba และ Llama-405B ของ Meta ได้ในหลายมิติ โดยเฉพาะความสามารถด้านภาษาจีนและความสามารถในการใช้เหตุผล ซึ่งพิสูจน์ให้เห็นถึงการทำงานร่วมกันระหว่างสถาปัตยกรรมซอฟต์แวร์และฮาร์ดแวร์ของ Huawei เอง

ที่มา

scmp