เกิดอะไรขึ้น AI ตกม้าตาย ทุกครั้งที่อ่านไฟล์ PDF

รู้หรือไม่ว่าไฟล์ PDF ที่เราใช้ส่งงานกันทุกวัน คือศัตรูตัวฉกาจของ AI? แม้ Adobe จะสร้าง PDF มาเพื่อให้เราดูเอกสารได้เหมือนกันทุกดีไวซ์ แต่ความเป๊ะของเลย์เอาต์นี่แหละที่ทำให้ Large Language Models ปวดหัว

ปัญหาหลักคืออะไร? แทนที่ PDF จะเก็บข้อมูลเป็นบรรทัดที่เรียบง่าย แต่มันกลับเก็บข้อมูลเป็น พิกัดกราฟิก ทำให้เวลา AI พยายามอ่านบทความที่เป็น 2 คอลัมน์ หรือเจอรูปภาพแทรก มันมักจะอ่านข้ามฝั่ง หรือเอาเชิงอรรถมาปนกับเนื้อหาหลัก จนเกิดอาการ AI Hallucinations หรือการสรุปข้อมูลแบบมั่วซั่วนั่นเอง

ปัจจุบันเราเริ่มเห็นการขยับตัวของยักษ์ใหญ่ เช่น Adobe Acrobat AI Assistant และ Google Gemini ที่พยายามใส่เครื่องมือช่วยให้ AI เข้าใจโครงสร้าง PDF ได้แม่นยำขึ้น อย่างไรก็ตาม ความท้าทายเรื่องความปลอดภัย ก็ยังเป็นสิ่งที่มองข้ามไม่ได้ เพราะ PDF ยังคงเป็นช่องทางโปรดของเหล่าแฮกเกอร์ในการฝังมัลแวร์

ในมุมมองของ Techhub ผมมองว่าเรื่องนี้ไม่ใช่ความผิดของ PDF แต่มันคือกำแพงสุดท้ายของการเปลี่ยนผ่านสู่โลกดิจิทัลแบบ 100%

ที่ผ่านมาเราใช้ PDF เพื่อเลียนแบบกระดาษ แต่ในโลกที่ AI ทำงานแทนคน เราไม่ต้องการกระดาษจำลอง เราต้องการ Data ที่ไหลลื่น

แต่ว่า PDF จะยังไม่ได้หายไปในเร็วๆ นี้แน่นอน เพราะความน่าเชื่อถือทางกฎหมายและธุรกิจยังสูงมาก แต่เราจะเห็นการใช้ AI-native document หรือ ไฟล์ที่ออกแบบมาให้ AI อ่านง่ายตั้งแต่แรก เพิ่มมากขึ้นในองค์กรที่ต้องการความเร็วในการวิเคราะห์ข้อมูลครับ

ที่มา
https://www.techspot.com/news/111485-humble-pdf-becoming-problem-ai.html