Tanpa Izin, Ribuan Video Youtube Dilaporkan Dipakai Perusahaan Teknologi Besar Untuk Melatih AI
Tanpa Izin, Ribuan Video Youtube Dilaporkan Dipakai Perusahaan Teknologi Besar Untuk Melatih AI --free pik.com
PALEMBANG, PALTV.CO.ID,- Perusahaan teknologi besar dilaporkan menggunakan ribuan video YouTube untuk melatih model AI mereka tanpa izin. Sementara itu para kreator menuntut kompensasi atas penggunaan konten mereka yang tidak sah.
AI (kecerdasan buatan) telah menjadi perbincangan utama di dunia teknologi sejak OpenAI meluncurkan ChatGPT pada tahun 2022.
Alat AI ini, yang mampu menjawab berbagai pertanyaan, dengan cepat menjadi viral dan banyak orang mulai bereksperimen dengannya.
ChatGPT dilatih menggunakan GPU dari pembuat chip Nvidia, yang sering disebut sebagai tulang punggung alat AI tersebut. Dengan kemajuan AI, beberapa pertanyaan juga muncul dari waktu ke waktu. Salah satu pertanyaan tersebut adalah bagaimana perusahaan teknologi melatih model AI mereka dan apa saja yang diperlukan untuk itu.
Satu hal yang kita semua tahu sekarang adalah bahwa untuk melatih model AI apa pun, dibutuhkan sejumlah besar data. Dan menurut sebuah laporan baru, perusahaan teknologi besar menggunakan konten yang tersedia di YouTube untuk melatih alat AI mereka. Dalam penyelidikan yang sedang berlangsung oleh Proof News, terungkap bahwa beberapa perusahaan teknologi terkemuka telah menggunakan subtitle dari video YouTube untuk melatih model kecerdasan buatan mereka. Praktik ini secara langsung melanggar kebijakan ketat YouTube terhadap pengunduhan dan penggunaan kontennya tanpa izin eksplisit.
Dataset yang dimaksud dilaporkan mencakup transkrip dari 173.536 video YouTube dari lebih dari 48.000 saluran. Saluran-saluran ini berkisar dari sumber pendidikan seperti Khan Academy dan MIT hingga kreator populer seperti MrBeast dan Marques Brownlee. Dataset ini juga mencakup beberapa subtitle yang diterjemahkan dalam bahasa seperti Jerman dan Arab, meskipun tidak mengandung konten visual dari video tersebut.
Eleuther AI, sebuah laboratorium penelitian nirlaba yang berkomitmen untuk mempromosikan ilmu pengetahuan terbuka, menyusun dataset ini sebagai bagian dari koleksi yang lebih besar yang dikenal sebagai The Pile. The Pile adalah kumpulan berbagai materi dari sumber seperti Parlemen Eropa dan Wikipedia Bahasa Inggris, yang dirilis di bawah lisensi yang permisif untuk tujuan akademik dan penelitian.
Sebuah laporan di Wired mengungkapkan bahwa David Pakman, seorang komentator politik dengan lebih dari 2 juta pelanggan, menyatakan kekecewaannya atas situasi ini. Lebih dari 160 videonya ditemukan dalam dataset tanpa izinnya. Pakman menekankan dampaknya pada mata pencahariannya, menunjukkan bahwa waktu dan sumber daya yang signifikan diinvestasikan dalam memproduksi kontennya. Dia berargumen bahwa perusahaan AI yang mendapatkan keuntungan dari data ini seharusnya memberikan kompensasi kepada para kreator.(*)
Sumber : India Today
Foto : Freefik.com
Cek Berita dan Artikel yang lain di Google News
Sumber: indian today.com