เมินลิขสิทธิ์ เผยรายชื่อ 21 ล้านเพลง ถูกนำไปเทรนโมเดล AI

[งัดกล่องดำ] ยังคงเป็นประเด็นที่ร้อนแรงจนถึงตอนนี้ กับกรณีเพลง AI ที่ระบุได้ว่าใช้เสียงร้องจากศิลปินดัง เช่น Taylor Swift , Bad Bunny และศิลปินระดับโลกอีกมากมาย

พอจะฟ้องร้องก็ติดเรื่อง “หลักฐานเชิงประจักษ์” ที่ระบุชัดเจนว่าโมเดล AI ดังกล่าวใช้ข้อมูลเพลงไปเทรนจริง ๆ จนทำได้เพียงสงสัย และต่อต้านเป็นสัญลักษณ์เท่านั้น ล่าสุดคนพบข้อมูลเชิงประจักษ์ที่ชัดเจนแล้ว

สื่อ The Atlantic ของสหรัฐฯ เผยฐานรายชื่อเพลงกว่า 21 ล้านเพลง ถูกนำไปเทรนหรือฝึกฝนโมเดล AI จำนวน 4 ชุด โดยชุดใหญ่สุดมีเพลงถึง 12 ล้านเพลง ชุดรองลงมามี 9 ล้านเพลง และอีก 2 ชุดย่อยมีชุดละประมาณ 100,000 เพลง

สำหรับชุดที่ 1 เผยมีการรวบรวมโดยกลุ่ม LAION (องค์กรไม่แสวงหากำไรด้าน AI จากเยอรมนี) ส่วนชุดที่ 2 ก็ได้จากขุดคุ้ยข้อมูลโดยตรง ชุดที่ 3 จากทาง Free Music Archive และชุดสุดท้ายมาจากเพลงอิสระและผลงานของศิลปินรายย่อย ที่อาจร่วมด้วยช่วยกันให้ข้อมูล

จากข้อมูลก็ยืนยันเลยว่า ผลงานของ Taylor Swift , Bad Bunny , The Beatles , ABBA, Michael Jackson และ Snoop Dogg ถูกนำไปใช้ฝึกโมเดลอย่างแน่นอน

ส่วนโมเดล AI ที่มีปัญหาดังกล่าวนั้น พบมีความเชื่อมโยงในการใช้ฐานข้อมูลชุด Free Music Archive ไปเทรนโมเดลของตนเอง (อ่านฉบับเต็มได้ที่ https://www.theatlantic.com)

เมื่อมีหลักฐานชิ้นสำคัญที่พิสูจน์ได้ว่ามีการคัดลอกข้อมูลแบบเหมาเข่ง ค่ายเพลงก็เดินหน้าฟ้องร้องลิขสิทธิ์ได้เต็มที่กว่าเคยแน่ ยุคการฝึก AI ก่อน แล้วขอโทษทีหลังในวงการดนตรี อาจกำลังสิ้นสุดลงแล้วครับ

ที่มา : Engadget