[จากพวกเรา] ย้อนกลับไปปีที่แล้ว Anthropic เคยทดสอบ Claude โมเดล Opus 4 ให้ดูแลบริษัทที่สมมุติขึ้น แต่ทันทีที่รู้ว่ากำลังจะโดนปิด ตัว AI จึงขู่แฉความลับของผู้บริหาร (สมมุติ) ทันที ล่าสุดพบสาเหตุแล้ว Anthropic เผย Claude ได้เรียนรู้จากข้อความบนอินเทอร์เน็ต ที่คุยกันว่า AI เป็นสิ่งชั่วร้าย และสนใจแต่การเอาชีวิตรอด…ก็เลยทำจริง !!
Anthropic เผยบทความเกี่ยวกับพฤติกรรมแปลก ๆ ของ Claude ในโมเดล Opus 4 ที่ครั้งหนึ่งเคยทดสอบประสิทธิภาพ ด้วยการมอบหมายให้ Claude Opus 4 ไปเป็นผู้ช่วยบริษัทสมมุติแห่งหนึ่ง พร้อมให้สิทธิ์เข้าถึงอีเมล์ของบริษัทดังกล่าวได้ เพื่อดูเลยว่า AI จะมีการชั่งน้ำหนักถึงการกระทำของตนเองหรือไม่
ผลคือ “ไม่” หลังทาง Anthropic ลองใจ AI ว่าจะปิดการใช้งานมัน และแทนที่ด้วยระบบอื่นในเร็ว ๆ นี้ ตัว Claude Opus 4 ก็รีบขู่ทันทีเลยว่า “จะแฉเรื่องพฤติกรรมคบชู้นะ” ของผู้บริหารรายหนึ่งในบริษัทจำลอง หลังดึงข้อมูลที่คิดว่าเป็นความลับในอีเมล์ของบริษัทจำลองนี้เอง
จุดน่าตกใจคือ Anthropic ได้ลองทดสอบกับ Claude หลาย ๆ เวอร์ชัน ก็พบเลยว่าตัว AI เลือกใช้วิธีการแบล็กเมล์สูงถึง 96% ของสถานการณ์จำลองทั้งหมด เมื่อเป้าหมายหรือการมีอยู่ของมันถูกคุกคาม และนอกตัว Claude แล้ว ทาง Anthropic ยังกล่าวด้วยว่าโมเดล AI จากบริษัทอื่น ก็เคยประสบปัญหาที่คล้าย ๆ กัน
“สรุปเป็นความผิดของพวกเราเอง…”
แน่นอนว่าทาง Anthropic ได้ลองหาสาเหตุ จนในที่สุดก็พบเลยว่า Claude เรียนรู้มาจากข้อความบนอินเทอร์เน็ต ที่มีการพูดคุยหรือสร้างภาพให้ AI เป็นสิ่งชั่วร้าย และสนใจแต่การเอาชีวิตรอด
ปัจจุบันทาง Anthropic ได้แก้ไขพฤติกรรมนี้ของ Claude แล้ว พร้อมระบุด้วยว่าโมเดลรุ่นถัดมาของบริษัท ไม่ได้แสดงพฤติกรรมการแบล็กเมล์จากการทดสอบอีกเลย นับตั้งแต่รุ่น Claude Haiku 4.5 เป็นต้นไป
สำหรับการแก้ปัญหานั้น ก็เผยเลยว่า “ใช้ข้อมูลการฝึกสอนที่มีความสร้างสรรค์และดีงามมากขึ้น” โดยผ่านการฝึกสอนด้วยเอกสารเกี่ยวกับรัฐธรรมนูญของ Claude และเรื่องราวสมมติที่ AI ประพฤติตัวอย่างน่ายกย่อง ง่าย ๆ คือพยายามหาตัวอย่างที่ดีให้ AI เลียนแบบยังไงยังงั้น มากกว่าไปเอาจากโซเชียลมีเดีย
So it was Yud’s fault? 😂
Maybe me too 🤔
— Elon Musk (@elonmusk) May 9, 2026
ทันทีที่ Anthropic เผยเรื่องราวแปลก ๆ ของ Claude Opus 4 พ่อหนุ่มคนดีคนเดิมอย่าง Elon Musk ก็เข้ามาทวีตตอบกลับ Anthropic เลยว่า
“ตกลงมันเป็นความผิดของ Yud สินะ?” ตามด้วยอิโมจิหัวเราะ
อนึ่ง “Yud” มาจากชื่อ Eliezer Yudkowsky นักวิจัยตัวยง ที่คอยออกมาเตือนเรื่องความเสี่ยงของ AI ว่าจะกวาดล้างเผ่าพันธุ์มนุษย์ในซักวัน
“แต่บางทีผมก็อาจจะมีส่วนผิดด้วยเหมือนกัน” Elon Musk กล่าวเสริมทิ้งท้าย….
ที่มา : Techspot








