Resemble AI сьогодні випускає DramaBox — керовану мовну модель рівня директора — на Hugging Face

ON0,33%
PROMPT-1,37%
IN0,98%

Компанія Beating, Resemble AI сьогодні випустила DramaBox — модель генерації мовлення — на Hugging Face. Модель забезпечує керованість на рівні режисера завдяки розділеному синтаксису підказок: користувачі вводять діалоги в лапках, а сценічні ремарки на кшталт зітхань, пауз або шепоту — поза лапками. Модель передає ці ремарки як емоційно забарвлену мову, а не зачитує їх уголос.

DramaBox підтримує zero-shot клонування голосу лише за 10 секунд еталонного аудіо та дає змогу природними мовними підказками задавати вік персонажа, акцент і емоцію. Вихідне аудіо — 48 кГц стерео студійної якості. Увесь згенерований контент має невидимий водяний знак Perth, стійкий до стиснення MP3, а також стандартні інструменти редагування аудіо, щоб запобігти неправильному використанню deepfake.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів