เบรก GPTBot หลายเว็บส่งสัญญาณบล็อก หลังพบเก็บข้อมูลส่ง ChatGPT

[ปิดประตู] อะไรคือเบื้องหลังความฉลาดของ ChatGPT ว่าทำไมถามอะไรถึงตอบได้เกือบหมด รู้ไปหมดเกือบทุกอย่าง หนึ่งในนั้นก็คือ GPTBot เป็นบอตที่ทำหน้าที่คอยเก็บข้อมูลคอนเทนต์จากเว็บต่าง ๆ แล้วนำมาฝึกตัว AI ดังกล่าวนั้นเอง ทว่าล่าสุดหลาย ๆ เว็บ เริ่มปิดประตูใส่บอตตัวนี้เสียแล้ว

ก่อนอื่นมารู้จักกับ Robots.txt ก่อนซักเล็กน้อย ไฟล์ดังกล่าวอาจเรียกได้ว่าเป็น [กฏ] ที่หากมีแชทบอต AI ตัวไหน ส่งบอตมาเก็บข้อมูลจากเว็บนั้น ๆ ทางเว็บก็จะส่งไฟล์นี้ไปให้บอตอ่านก่อนเลยว่า เก็บข้อมูลตรงไหนได้บ้าง หรือตรงไหนคือ [ฟรีคอนเทนต์] ที่เอาไปใช้งานได้ฟรี และตรงไหนไม่ฟรี

ตัดกลับมาที่ ChatGPT ปัจจุบันเรียกได้ว่าเป็นแชทบอตที่มีชื่อเสียงมากที่สุดของทาง OpenAI โดยมี Large Language Model (LLM) โมเดลภาษาขนาดใหญ่ ที่ได้ GPTBot มาช่วยป้อนข้อมูลจำนวนมากจากอินเทอร์เน็ต หรือเป็นฟรีคอนเทนต์จากหลาย ๆ เว็บนี้เอง ทำให้มีความฉลาดจนทุกวันนี้

ทว่าล่าสุด เริ่มมีหลาย ๆ เว็บปรับกฏ Robots.txt ใหม่ ทำให้ GPTBot ไม่สามารถเข้าถึงข้อมูลได้มากเท่าเมื่อก่อน หรืออาจเข้าถึงไม่ได้เลย หลายบริษัทที่เป็นเจ้าของเว็บ เริ่มไม่สนใจที่จะมีส่วนร่วมในการช่วยปรับปรุง ChatGPT โดยที่ไม่ได้รับผลตอบแทนใด ๆ นั้นเอง

ทางด้าน Deviant Art แพลตฟอร์มรวมภาพวาดและภาพถ่ายชื่อดัง ก็ถึงขั้นเปิดแท็กใหม่อย่าง [NoAI] สำหรับศิลปินหรือผู้สร้างผลงาน ที่ไม่ต้องการให้งานของตน กลายเป็นส่วนหนึ่งของการช่วยฝึก LLM เลยด้วย

หากถามว่าการเคลื่อนไหวครั้งนี้ จะทำให้ ChatGPT หรือบริการแชทบอตตัวอื่น ๆ มีความฉลาดลดลงไปเลยไหม ก็คงตอบได้ว่ายัง เชื่อว่าหลาย ๆ เว็บก็ยังเปิดให้บอตเข้ามาเก็บข้อมูลได้อยู่เป็นจำนวนมาก ที่จะปิดก็อาจเป็นเว็บหรือแพลตฟอร์มชื่อดังมากกว่า และทางผู้พัฒนาแชทบอตเอง ก็ยังมีวิธีฝึกบริการ AI ของตนหลายวิธี ไม่เพียงใช้วิธีนี้วิธีเดียวแน่นอน

ที่มา : Techspot