アリ千問が全モーダル大規模モデル Qwen3.5-Omni を発表、113 種の音声認識に対応

ゲートニュースのメッセージ。3月30日、アリのQianwenが、全モーダル大規模モデルQwen3.5-Omniの提供を開始した。このシリーズには、Plus、Flash、Lightの3種類のサイズに対応するInstruct版が含まれており、256kの長い前後コンテキストをサポートする。モデルは、10時間を超える音声入力および400秒を超える720P(1FPS)の映像・音声入力に対応している。モデルは、大量のテキスト、ビジュアル、ならびに1億時間を超える映像・音声データを用いてネイティブなマルチモーダル事前学習を行い、卓越した全モーダルの認識と生成能力を示している。従来のQwen3-Omniと比べて、Qwen3.5-Omniは多言語能力が大幅に向上しており、113の言語と方言に対応した音声認識および36の言語と方言に対応した音声生成が可能になった。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし