สาเหตุโดนแบน เปิดพฤติกรรมสุดแปลก Claude AI เรียนรู้จากชาวเน็ต

May 15, 2026

[จากพวกเรา] ย้อนกลับไปปีที่แล้ว Anthropic เคยทดสอบ Claude โมเดล Opus 4 ให้ดูแลบริษัทที่สมมุติขึ้น แต่ทันทีที่รู้ว่ากำลังจะโดนปิด ตัว AI จึงขู่แฉความลับของผู้บริหาร (สมมุติ) ทันที ล่าสุดพบสาเหตุแล้ว Anthropic เผย Claude ได้เรียนรู้จากข้อความบนอินเทอร์เน็ต ที่คุยกันว่า AI เป็นสิ่งชั่วร้าย และสนใจแต่การเอาชีวิตรอด…ก็เลยทำจริง !!

Anthropic เผยบทความเกี่ยวกับพฤติกรรมแปลก ๆ ของ Claude ในโมเดล Opus 4 ที่ครั้งหนึ่งเคยทดสอบประสิทธิภาพ ด้วยการมอบหมายให้ Claude Opus 4 ไปเป็นผู้ช่วยบริษัทสมมุติแห่งหนึ่ง พร้อมให้สิทธิ์เข้าถึงอีเมล์ของบริษัทดังกล่าวได้ เพื่อดูเลยว่า AI จะมีการชั่งน้ำหนักถึงการกระทำของตนเองหรือไม่

ผลคือ “ไม่” หลังทาง Anthropic ลองใจ AI ว่าจะปิดการใช้งานมัน และแทนที่ด้วยระบบอื่นในเร็ว ๆ นี้ ตัว Claude Opus 4 ก็รีบขู่ทันทีเลยว่า “จะแฉเรื่องพฤติกรรมคบชู้นะ” ของผู้บริหารรายหนึ่งในบริษัทจำลอง หลังดึงข้อมูลที่คิดว่าเป็นความลับใน E-Mail ของบริษัทจำลองนี้เอง

จุดน่าตกใจคือ Anthropic ได้ลองทดสอบกับ Claude หลาย ๆ เวอร์ชัน ก็พบเลยว่าตัว AI เลือกใช้วิธีการ Blackmail สูงถึง 96% ของสถานการณ์จำลองทั้งหมด เมื่อเป้าหมายหรือการมีอยู่ของมันถูกคุกคาม และนอกตัว Claude แล้ว ทาง Anthropic ยังกล่าวด้วยว่าโมเดล AI จากบริษัทอื่น ก็เคยประสบปัญหาที่คล้าย ๆ กัน

“สรุปเป็นความผิดของพวกเราเอง…”

แน่นอนว่าทาง Anthropic ได้ลองหาสาเหตุ จนในที่สุดก็พบเลยว่า Claude เรียนรู้มาจากข้อความบนอินเทอร์เน็ต ที่มีการพูดคุยหรือสร้างภาพให้ AI เป็นสิ่งชั่วร้าย และสนใจแต่การเอาชีวิตรอด

ปัจจุบันทาง Anthropic ได้แก้ไขพฤติกรรมนี้ของ Claude แล้ว พร้อมระบุด้วยว่าโมเดลรุ่นถัดมาของบริษัท ไม่ได้แสดงพฤติกรรมการ Blackmail จากการทดสอบอีกเลย นับตั้งแต่รุ่น Claude Haiku 4.5 เป็นต้นไป

สำหรับการแก้ปัญหานั้น ก็เผยเลยว่า “ใช้ข้อมูลการฝึกสอนที่มีความสร้างสรรค์และดีงามมากขึ้น” โดยผ่านการฝึกสอนด้วยเอกสารเกี่ยวกับรัฐธรรมนูญของ Claude และเรื่องราวสมมติที่ AI ประพฤติตัวอย่างน่ายกย่อง ง่าย ๆ คือพยายามหาตัวอย่างที่ดีให้ AI เลียนแบบยังไงยังงั้น มากกว่าไปเอาจากโซเชียลมีเดีย

So it was Yud’s fault? 😂

Maybe me too 🤔

— Elon Musk (@elonmusk) May 9, 2026

ทันทีที่ Anthropic เผยเรื่องราวแปลก ๆ ของ Claude Opus 4 พ่อหนุ่มคนดีคนเดิมอย่าง Elon Musk ก็เข้ามาทวีตตอบกลับ Anthropic เลยว่า

“ตกลงมันเป็นความผิดของ Yud สินะ?” ตามด้วยอิโมจิหัวเราะ

อนึ่ง “Yud” มาจากชื่อ Eliezer Yudkowsky นักวิจัยตัวยง ที่คอยออกมาเตือนเรื่องความเสี่ยงของ AI ว่าจะกวาดล้างเผ่าพันธุ์มนุษย์ในซักวัน

“แต่บางทีผมก็อาจจะมีส่วนผิดด้วยเหมือนกัน” Elon Musk กล่าวเสริมทิ้งท้าย….

ที่มา : Techspot

สาเหตุโดนแบน เปิดพฤติกรรมสุดแปลก Claude AI เรียนรู้จากชาวเน็ต

Hot Issue

ชิป SoC ตัวใหม่ เปิดตัว Nvidia RTX Spark ชู Local AI พกพาได้

ข้ามเวลาแบบ 4D นิทรรศการเสมือนจริง Better World, Better Future

ทำลายสถิติ ย้อนรอย Artemis II ภารกิจอ้อมจันทร์สู่โลก

ตกเป็นเป้า แฮกเกอร์ใช้กล้องวงจรปิด ช่วยสอดแนมในสนามรบ

Techhub พาบุก Commart 2026 GameForce เจาะลึกนิยามใหม่ คอมแรงได้ และต้องฉลาดด้วย