Resemble AI Meluncurkan DramaBox, Model Ucapan yang Dapat Dikendalikan Level Sutradara, di Hugging Face Hari Ini

ON2,37%
PROMPT-0,56%
IN1,06%

Menurut Beating, Resemble AI merilis DramaBox, model pembangkitan pidato, di Hugging Face hari ini. Model ini menampilkan kemampuan kontrol tingkat sutradara melalui sintaks prompt yang dipisah—pengguna memasukkan dialog dalam tanda kutip sambil menentukan arahan panggung seperti menghela napas, jeda, atau berbisik di luar kutipan. Model mengubah arahan tersebut menjadi ujaran yang diberi penekanan emosional, bukan membacanya secara harfiah.

DramaBox mendukung voice cloning zero-shot hanya dengan 10 detik audio referensi dan memungkinkan prompt bahasa alami untuk mengatur usia karakter, logat, dan emosi. Output berupa audio kualitas studio stereo 48kHz. Semua audio yang dihasilkan menyertakan watermark Perth tak terlihat yang tahan terhadap kompresi MP3 dan pengeditan audio standar untuk mencegah penyalahgunaan deepfake.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar