Sakana AIはKAMEシステムをリリースし、遅延をほぼゼロに抑えながらより深い知識注入を実現

robot
概要作成中

AIMPACT メッセージ、5 月 3 日(UTC+8)、Sakana AIはハイブリッドアーキテクチャのKAMEを発表しました。これにより、ほぼゼロ遅延を維持しながらリアルタイムでバックエンドのLLM知識を注入できます。このシステムは2つの非同期コンポーネントが並行して動作します:フロントエンドはMoshiアーキテクチャに基づくS2Sモジュールで、約80ミリ秒のサイクルで音声を処理し、即座に応答を生成します;バックエンドはSTTコンポーネントと完全なLLMで構成され、部分的な書き起こしを継続的に構築し、オラクルのストリームをフロントエンドに返し、より良いオラクルが到達した場合には途中で応答を修正します。評価では、単独のMoshiが2.05点、KAME+gpt-4.1が6.43点、KAME+claude-opus-4-1が6.23点を獲得し、遅延はすべてMoshiと同等です;リーディングシステムのUnmuteは7.70点を獲得しましたが、遅延は2.1秒に達します。KAMEのバックエンドは独立しており、推論時にLLMを切り替えることができ、再トレーニングは不要です。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし