A série MiMo-V2.5 da Xiaomi passa a ser open source: 1T Parâmetros com eficiência de tokens superior face ao GPT-5.4

Mensagem de notícias da Gate, 27 de abril — A equipa MiMo da Xiaomi disponibilizou em código aberto a série MiMo-V2.5 de modelos de linguagem de grande dimensão sob licença MIT, suportando implementação comercial, treino contínuo e afinação (fine-tuning). Ambos os modelos apresentam uma janela de contexto de 1 milhão de tokens. O MiMo-V2.5-Pro é um modelo de mistura de especialistas (mixture-of-experts) de texto puro (MoE) com 1,02 biliões de parâmetros no total e 42 mil milhões de parâmetros ativos, enquanto o MiMo-V2.5 é um modelo nativo multimodal com 310 mil milhões de parâmetros no total e 15 mil milhões de parâmetros ativos, suportando compreensão de texto, imagem, vídeo e áudio.

O MiMo-V2.5-Pro tem como alvo tarefas complexas de agentes e de programação. Nos benchmarks ClawEval, alcançou 64% de Pass@3 consumindo aproximadamente 70.000 tokens por trajetória de tarefa—40% a 60% menos tokens do que a Claude Opus, a Gemini 3.1 Pro e a GPT-5.4. O modelo obteve 78,9 no SWE-bench Verified. Numa demonstração, o V2.5-Pro implementou independentemente um compilador completo SysY para RISC-V para um projeto de curso de compiladores da Universidade de Pequim em 4,3 horas, com 672 chamadas a ferramentas, atingindo uma pontuação perfeita de 233/233 em conjuntos de testes ocultos.

O MiMo-V2.5 foi concebido para cenários de agentes multimodais, equipado com um codificador de visão dedicado (729 milhões de parâmetros) e um codificador de áudio (261 milhões de parâmetros), com uma pontuação de 62,3 no subconjunto geral Claw-Eval. Ambos os modelos utilizam uma arquitetura híbrida que combina atenção por janela deslizante (SWA) e atenção global (GA), associada a um módulo de previsão multi-token com 3 camadas (MTP) para acelerar a inferência. Os pesos do modelo estão disponíveis no Hugging Face.

Em paralelo com o lançamento em código aberto, a equipa MiMo lançou o "Orbit Quadrillion Token Creator Incentive Program", oferecendo 100 biliões de tokens gratuitamente durante 30 dias para utilizadores em todo o mundo. Programadores individuais, equipas e empresas podem candidatar-se através da página do programa, com um ciclo de avaliação de aproximadamente 3 dias úteis; os benefícios aprovados são distribuídos como Token Plans ou créditos diretos, compatíveis com ferramentas como Claude Code e Cursor.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário