LLM ตัวล่าสุด DeepSeek เปิดตัว V4 ใช้ชิป Huawei ประมวลผล

[ศึก AI เดือด] ในระหว่างที่สหรัฐฯ ยังคงกดจีนด้านเทคโนโลยี (โดยเฉพาะเรื่อง AI) ล่าสุดทาง DeepSeek ได้เปิดตัว LLM ใหม่ล่าสุดอย่าง DeepSeek V4 ชูเป็นโมเดลที่ทรงพลังที่สุดเท่าที่บริษัทเคยพัฒนา และประมวลผลด้วยชิปจาก Huawei โดยมีค่าพารามิเตอร์ถึง 1.6 ล้านล้านตัว

เมื่อวันศุกร์ที่ผ่านมา สตาร์ทอัพจีนด้าน AI ไฟแรงอย่าง DeepSeek เปิดตัว V4 โมเดลภาษาขนาดใหญ่ (LLM) ด้วยขนาด 1.6 ล้านล้านพารามิเตอร์ และเป็นโมเดล AI ระดับแนวหน้าตัวแรก ที่ถูกปรับแต่งมาให้ทำงานบนชิป AI อย่าง “Ascend” ของ Huawei โดยเฉพาะ..แทนที่ Nvidia

สำหรับตัว DeepSeek V4 ก็มีแบ่งเป็น 2 รุ่นย่อย ได้แก่ V4-Pro ที่เป็นตัว Top มีค่าบริการอยู่ที่ 3.48 ดอลลาร์ฯ (122 บาท) ต่อผลลัพธ์ 1 ล้านโทเค็น และ V4-Flash ซึ่งเป็นรุ่นที่เล็กกว่าด้วยขนาด 2.84 แสนล้านพารามิเตอร์ มีค่าบริการอยู่ที่ 0.28 ดอลลาร์ฯ (9 บาท) ถูกกว่า OpenAI ที่คิดค่าบริการ GPT-5.4 อยู่ที่ 30 ดอลลาร์ฯ (970 บาท) ต่อล้านโทเค็น

อย่างไรก็ตาม DeepSeek ยอมรับว่าประสิทธิภาพของ V4 นั้นยัง “ตามหลังอยู่เล็กน้อย” เมื่อเทียบกับโมเดลตัว Top ของคู่แข่ง โดยมีระยะห่างด้านการพัฒนาประมาณ 3 ถึง 6 เดือน แต่ก็สามารถทำคะแนนแซงหน้าคู่แข่งในกลุ่ม Open-Source ได้ทั้งหมดในเกณฑ์มาตรฐาน ด้าน Agentic Coding และการใช้เหตุผล

ก่อนหน้านี้ทาง DeepSeek ได้ใช้ชิป Nvidia H800 จำนวน 2,048 ตัว ในการพัฒนาโมเดล V3 รุ่นก่อนหน้า เป็นเหตุให้บริษัทต้องเจอกับการ ‘สอบสวน’ หลายครั้งเกี่ยวกับการจัดหา GPU ของ Nvidia ที่จำกัดผ่านตัวกลางในสิงคโปร์

เป็นเหตุให้ V4 หันไปใช้ชิป Ascend ซีรีส์ 950 รุ่นล่าสุดของ Huawei ที่ผลิตในจีนแทน ทั้งนี้ DeepSeek กล่าวด้วยว่าราคาบริการ V4-Pro อาจลดลงอีก หาก Huawei เพิ่มกำลังการผลิตชิป Ascend 950 ในช่วงครึ่งหลังของปีนี้

กลับไปที่ฝั่งสหรัฐฯ ก็มีรายงานน่าสนใจจากทาง Reuters เผยทางกระทรวงการต่างประเทศ ได้ส่งจดหมายเตือนสถานทูตทั่วโลกเกี่ยวกับการลอกเลียนแบบโมเดล LLM ของจีน จากโมเดลระดับแนวหน้าของสหรัฐฯ ด้วย

ตัวเอกสารได้ต่อยอดจากข้อกล่าวอ้างของ Anthropic ในเดือนกุมภาพันธ์ ซึ่งบริษัทกล่าวเลยว่า DeepSeek , Moonshot และ MiniMax ใช้บัญชีปลอม 24,000 บัญชี ใแลกเปลี่ยน 16 ล้านครั้งกับโมเดล Claude ของตนเอง ทางฝั่ง OpenAI ก็กล่าวหาว่า DeepSeek แอบขโมยข้อมูลของบริษัทไปเทรนโมเดลด้วยเช่นกัน

ส่วนทางฝั่งกระทรวงการต่างประเทศของจีน ก็ระบุว่าข้อกล่าวหาดังกล่าวนั้น “ไม่มีมูลความจริง” เช่นเดียวกับทาง DeepSeek ก็ระบุเลยว่าโมเดล V3 ของตนนั้น อาศัยข้อมูลที่เกิดขึ้นตามธรรมชาติ ซึ่งรวบรวมผ่านการรวบรวมข้อมูลจากเว็บไซต์ และไม่ได้ใช้ข้อมูลสังเคราะห์ที่สร้างโดย OpenAI โดยเจตนา

ที่มา : TomsHardware