Resemble AI lança o DramaBox, modelo de fala controlável no nível de diretor, na Hugging Face hoje

ON-0,71%
PROMPT-3,30%
IN1,22%

De acordo com Beating, a Resemble AI lançou o DramaBox, um modelo de geração de fala, na Hugging Face hoje. O modelo oferece controlabilidade no nível de direção por meio de uma sintaxe de prompts separada — os usuários inserem o diálogo entre aspas, enquanto especificam marcações de cena como suspirar, pausas ou sussurros fora das aspas. O modelo transforma essas marcações em fala com inflexão emocional, em vez de lê-las em voz alta.

O DramaBox oferece clonagem de voz zero-shot com apenas 10 segundos de áudio de referência e permite prompts em linguagem natural para definir idade, sotaque e emoção do personagem. A saída é áudio de qualidade de estúdio em estéreo a 48 kHz. Todo áudio gerado inclui uma marca d’água invisível de Perth, resistente à compressão MP3, além de edição de áudio padrão para evitar uso indevido de deepfakes.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários