ล่มทั่วโลก Cloudflare แจ้งเหตุขัดข้อง ทำเว็บล่มเพราะ ‘ไฟล์บวม’

[ไม่ใช่แฮ็ก] เหตุเกิดเมื่อวันอังคารที่ผ่านมา Cloudflare ผู้ให้บริการระบบความปลอดภัยเว็บไซต์ที่ใหญ่ที่สุดในโลก หรือที่หลายคนอาจเคยเห็นโลโก้รูปก้อนเมฆสีส้มก่อนเข้าเว็บเป็นประจำ แต่บริการดังกล่าวกลับ “ล่ม” และทำให้หลายเว็บไซต์ หลายแอปฯ และหลายบริการออนไลน์ (เช่น ChatGPT) ล่มตามไปด้วย นับเป็นเวลาหลายชั่วโมง สร้างความเดือดร้อนทั้งผู้ใช้ และผู้ให้บริการต่าง ๆ ที่ใช้ระบบ Cloudflare เอง จนต้องติดต่อขอโทษลูกค้ากันให้วุ่น

Matthew Prince ผู้ร่วมก่อตั้งและซีอีโอของ Cloudflare ได้ออกแถลงสาเหตุที่ระบบล่มผ่านเว็บ Blog เผยเป็นการล่มครั้งเลวร้ายที่สุดตั้งแต่ปี 2019 มาเลย (หรือในรอบ 6 ปี) ซึ่งสาเหตุในครั้งนี้เลยคือ

“ไฟล์บวม”

ในช่วงแรกทีมงาน Cloudflare เข้าใจว่าปัญหาเกิดจากการโจมตีด้วย DDoS ครั้งใหญ่ (Hyper-scale) แต่ความจริงคือ Bot Management หรือระบบจัดการบอท ที่ถูกออกแบบมาเพื่อช่วยจัดการกับปัญหาต่าง ๆ โดยอัตโนมัติ ทว่าระบบดังกล่าวมีฟีเจอร์บางอย่างที่ทำงานเกิดลิมิต

กล่าวคือทีมงานไปแก้ไขคำสั่ง (Query) ในระบบฐานข้อมูลที่ใช้คัดกรองบอทโดยอัตโนมัติ แต่การแก้ไขดังกล่าวก็ทำให้ระบบเกิดผลิตข้อมูลซ้ำ ๆ ออกมามหาศาล จนเกิดเป็นแถวฟีเจอร์ที่ซ้ำกันจำนวนมาก สุดท้าย Configuration File หรือไฟล์ที่มีการตั้งค่าเกิดขยายใหญ่เกินปกติ และ “บวม” จนระบบประมวลผลรับไม่ไหว (ClickHouse) และน็อคในที่สุด..

เมื่อระบบล่มไปแล้ว Core proxy system ที่จัดการการประมวลผลทราฟฟิกสำหรับบริการของลูกค้า ก็พังลงไปด้วยนั้นเอง เช่น เว็บที่เปิดใช้ฟีเจอร์ “ป้องกันบอท” (เพื่อกันคนหรือ AI มาดูดข้อมูล) ของ Cloudflare แต่ถ้าเว็บไหนไม่ได้ใช้บริการดังกล่าว ก็รอดจากการล่มครั้งนี้เอง

สรุประบบที่ถูกออกแบบมาเพื่อปกป้องเว็บไซต์จาก [บอท] กลับทำงานผิดพลาดจนกัน [มนุษย์] ออกไปเสียเอง

เหตุการณ์นี้เรียกได้เลยว่า “ทีมงานพลาดเอง” ที่ไม่ได้ตรวจสอบโค้ดและทดสอบระบบให้ดี ๆ ก่อนปล่อยออกมา สุดท้ายก็เหมือนเป็นการย้ำเตือนเลยว่า อินเทอร์เน็ตที่เราใช้ทุกวันนี้มันเปราะบางกว่าที่คิด

ที่มา : TheVerge