Beatingによると、xAIはGrok Custom VoicesとVoice Libraryを立ち上げ、ユーザーがxAIコンソールで音声を1分間録音して、Grok TTSおよびVoice Agent APIで使用するためのカスタムvoice_idを生成できるようにしました。この機能は、カスタマーサポートのエージェント、コンテンツ制作、ゲームのキャラクター、オーディオブック朗読などの用途に対応しています。
音声クローン作成のプロセスには検証が含まれます。ユーザーは検証用のフレーズを読み上げる必要があり、システムがそれをリアルタイムで文字起こしして、話者の本人確認を行うために完全な録音内容と照合したうえで、音声を生成します。コンソールでは最大30件の無料のカスタムボイスが利用可能で、APIの作成はエンタープライズチームに限って提供されます。Custom Voicesは現在、イリノイ州を除く米国で利用可能です。APIの利用は別途従量課金です。