Resemble AI Phát hành DramaBox, mô hình tạo lời thoại có thể kiểm soát cấp độ giám đốc, trên Hugging Face hôm nay

ON-1,20%
PROMPT-2,26%
IN2,05%

Theo Beating, Resemble AI đã phát hành DramaBox, một mô hình tạo lời thoại, trên Hugging Face vào hôm nay. Mô hình có khả năng kiểm soát cấp độ đạo diễn thông qua cú pháp prompt tách riêng—người dùng nhập thoại trong dấu ngoặc kép, đồng thời chỉ định các chỉ dẫn sân khấu như thở dài, ngắt quãng hoặc thì thầm nằm ngoài dấu ngoặc kép. Mô hình chuyển các chỉ dẫn này thành lời thoại có sắc thái cảm xúc thay vì đọc chúng thành tiếng.

DramaBox hỗ trợ tạo giọng nói theo yêu cầu từ đầu (zero-shot voice cloning) chỉ với 10 giây dữ liệu âm thanh tham chiếu và cho phép dùng prompt bằng ngôn ngữ tự nhiên để thiết lập tuổi nhân vật, giọng địa phương và cảm xúc. Âm thanh đầu ra đạt chất lượng studio stereo 48kHz. Tất cả âm thanh được tạo đều có watermark Perth vô hình, chống chịu tốt với nén MP3 và các thao tác chỉnh sửa âm thanh tiêu chuẩn nhằm ngăn lạm dụng deepfake.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận