XiaomiのMiMo-V2.5シリーズがオープンソースに:GPT-5.4に対して優れたトークン効率の1Tパラメータ

ゲートニュース メッセージ、4月27日 — XiaomiのMiMoチームが、MITライセンスのもとで大型言語モデルのMiMo-V2.5シリーズをオープンソース化し、商用展開、継続トレーニング、ファインチューニングをサポートしています。両モデルは100万トークンのコンテキストウィンドウを備えています。MiMo-V2.5-Proは純テキストのモジュラ構造による (MoE)モデルで、総パラメータは1.02兆、アクティブパラメータは420億ですが、MiMo-V2.5はネイティブなマルチモーダルモデルで、総パラメータは3,100億、アクティブパラメータは150億であり、テキスト、画像、動画、音声の理解をサポートします。

MiMo-V2.5-Proは、複雑なエージェントおよびプログラミングタスクを対象にしています。ClawEvalベンチマークでは、タスクのトラジェクトリあたり約70,000トークンを消費しながらPass@3で64%を達成し、Claude Opus、Gemini 3.1 Pro、GPT-5.4と比べてトークン数を40%〜60%削減しました。このモデルはSWE-bench Verifiedで78.9を獲得しました。デモでは、V2.5-Proが単独で、北京大学のコンパイラ講義のプロジェクト向けに、4.3時間で完全なSysYからRISC-Vへのコンパイラを実装し、672回のツール呼び出しで、隠しテストセットに対して233/233の完璧なスコアを達成しました。

MiMo-V2.5はマルチモーダルのエージェントシーン向けに設計されており、専用のビジョンエンコーダ (729 million parameters) とオーディオエンコーダ (261 million parameters) を搭載し、Claw-Evalの一般サブセットで62.3をスコアしました。両モデルは、スライディングウィンドウ注意 (SWA) とグローバル注意 (GA) を組み合わせたハイブリッドアーキテクチャを採用し、推論を高速化するために3層のマルチトークン予測 (MTP) モジュールと組み合わせています。モデルの重みはHugging Faceで提供されています。

オープンソースのリリースに加えて、MiMoチームは「Orbit Quadrillion Token Creator Incentive Program(Orbit Quadrillionトークン・クリエイター奨励プログラム)」を立ち上げ、世界中のユーザーに対して30日間で100クアドリリオントークンを無償提供しています。個人の開発者、チーム、企業は、プログラムページから申請でき、評価サイクルは約3営業日です。承認された特典はToken Plansまたは直接クレジットとして配布され、Claude CodeやCursorのようなツールに対応しています。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし