Grok lanza clonación de voz: graba un minuto y podrás crear tu propia voz AI

robot
Generación de resúmenes en curso

La noticia de Jièjiè Wǎng indica que Grok ha lanzado una función de clonación de voz, los usuarios solo necesitan grabar un minuto de voz para generar su propia línea de voz AI. Esta función permite a los usuarios grabar voces en la consola de xai, generar un voice_id y conectarse a la API de TTS o voice agent de Grok, aplicable en escenarios como atención al cliente, creación de contenido, personajes de juegos y narración de audiolibros. Los usuarios deben leer en voz alta frases de verificación, el sistema realiza transcripciones en tiempo real mediante STT y compara las características de la grabación, confirmando al hablante antes de generar la línea de voz, para evitar clonar voces de otras personas. Actualmente, la función de voces personalizadas solo está disponible en Estados Unidos, excluyendo Illinois, y la consola permite crear hasta 30 voces personalizadas de forma gratuita, mientras que la capacidad de creación mediante API está disponible solo para equipos empresariales. Las voces personalizadas no tienen costo adicional, pero el uso de la API de voz se factura por volumen: $3.00 por hora en tiempo real y $4.20 por millón de caracteres en conversión de texto a voz.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado