Peneliti Kembangkan 'SpeechSSM', Membuka Peluang Asisten Suara AI yang Aktif 24 Jam

Teknologi SpeechSSM memungkinkan generasi suara yang konsisten dan alami tanpa batasan waktu.--Freepik.com
BACA JUGA:Kemenkum Sumsel Gandeng Fakultas Hukum, Mahasiswa KKN Siap Perkuat Posbakum Desa
BACA JUGA:Bupati PALI Asgianto Lantik Pejabat Eselon III dan IV
Pendekatan ini membuat cerita mengalir dengan mulus dan tetap koheren, meskipun durasi ucapan yang dihasilkan sangat panjang.
Selain itu, penggunaan memori dan beban komputasi tidak meningkat tajam seiring bertambahnya panjang input, sehingga memungkinkan pembelajaran yang stabil dan efisien serta generasi suara berdurasi panjang secara optimal.
SpeechSSM memproses rangkaian suara tak terbatas dengan cara membagi data suara menjadi unit-unit pendek dan tetap (window), memproses masing-masing unit secara independen, lalu menggabungkannya kembali menjadi rangkaian ucapan panjang.
Saat menghasilkan suara, SpeechSSM menggunakan model sintesis audio Non-Autoregressive bernama SoundStorm, yang mampu menghasilkan beberapa bagian suara sekaligus, tidak lagi satu karakter atau kata secara perlahan.
BACA JUGA:Tak Kuat Menanjak, Truk Fuso Lindas Pengendara Sepeda Motor di Banyuasin
BACA JUGA:Duel Sengit di Semifinal: PSG dan Real Madrid Berebut Tiket Final
Ini memungkinkan produksi suara berkualitas tinggi dengan kecepatan tinggi.
Jika model-model sebelumnya umumnya hanya diuji dengan ucapan singkat sekitar 10 detik, Sejin Park merancang tugas evaluasi baru menggunakan dataset buatan timnya sendiri, “LibriSpeech-Long”, yang mampu menguji generasi ucapan hingga 16 menit.
SLM belajar langsung dari ucapan manusia tanpa teks, --Freepik.com
Selain metrik evaluasi PPL (Perplexity), yang hanya mengukur kebenaran tata bahasa, Park memperkenalkan metrik baru seperti SC-L (semantic coherence over time) untuk menilai kesinambungan makna dalam durasi panjang.
N-MOS-TSebagai metrik yang menilai kealamian suara sepanjang waktu, (naturalness mean opinion score over time) memberikan gambaran utuh yang mendukung evaluasi lebih akurat dan berlapis.
BACA JUGA:Mantan Walikota Palembang Harnojoyo Tersangka Baru Proyek Pembangunan Pasar Cinde
BACA JUGA:Rumah Panggung Kayu Milik Warga Tanjung Sejaro Hangus Terbakar
Cek Berita dan Artikel yang lain di Google News
Sumber: tech xplore