Según informó Reuters el 30 de junio, Meituan lanzó el modelo de IA de código abierto LongCat-2.0, con un tamaño de parámetros de 1,6 billones, que emplea una arquitectura de mezcla escasa de expertos (Sparse MoE), entrenado completamente en un superclúster de chips ASIC domésticos, sin utilizar ninguna GPU NVIDIA ni la pila de software CUDA. La ventana de contexto del modelo alcanza 1 millón de tokens.
Especificaciones técnicas de LongCat-2.0 y escenarios de aplicación previstos
LongCat-2.0 emplea una arquitectura de mezcla escasa de expertos (Sparse MoE), similar a las soluciones de DeepSeek y Mixtral de Mistral: el modelo no activa los 1,6 billones de parámetros a la vez, sino que un enrutador interno selecciona un conjunto de submódulos especializados para cada token, reduciendo los costos de inferencia en comparación con un modelo denso del mismo tamaño. Las principales especificaciones técnicas y limitaciones de implementación son las siguientes:
Tamaño de parámetros: 1,6 billones (arquitectura MoE escasa, no activa todos los parámetros a la vez)
Ventana de contexto: 1 millón de tokens (DeepSeek-R1-0528 y GPT-OSS tienen 128 mil)
Hardware de entrenamiento: Superclúster de ASIC domésticos (sin GPU NVIDIA, sin pila de software CUDA)
Aplicaciones previstas: Agentes de IA, herramientas de codificación (comprensión de código, edición de bibliotecas completas, automatización de tareas)
Forma de implementación: Clúster de inferencia a nivel de centro de datos; no compatible con dispositivos de consumo ni la mayoría de implementaciones locales.
Contexto de mercado de la capacitación con chips domésticos y datos de Bernstein
Meituan afirma que la arquitectura central de inferencia de LongCat-2.0 es portátil y puede ejecutarse en el hardware existente en China. Este lanzamiento se produce en un momento en que los controles de exportación de EE.UU. continúan restringiendo la exportación de chips de IA avanzados a empresas chinas.
La firma de investigación de acciones Bernstein estima que NVIDIA posee actualmente aproximadamente el 40% de la participación en el mercado chino de chips de IA, con Huawei teniendo una participación similar; Bernstein también predice que Huawei progresará este año, reduciendo la participación de NVIDIA en el mercado chino en aproximadamente 8 puntos porcentuales.
Estado actual de las afirmaciones de rendimiento: aún sin verificación de terceros
Meituan ha comparado LongCat-2.0 con varios modelos de código cerrado en los benchmarks publicados, pero los informes señalan que estas afirmaciones de rendimiento aún no han recibido una evaluación y verificación de terceros independientes e imparciales.
El informe también señala que la optimización para chips domésticos puede limitar el rendimiento de LongCat-2.0 en hardware NVIDIA, que actualmente domina los centros de datos a nivel mundial. Meituan afirma que su arquitectura central de inferencia sigue siendo portátil, y las pruebas independientes determinarán la disposición de adopción de los desarrolladores fuera de China.
Preguntas frecuentes
¿Para qué escenarios de aplicación es significativa la ventana de contexto de 1 millón de tokens de LongCat-2.0?
Al momento del informe, DeepSeek-R1-0528 y OpenAI GPT-OSS tienen un límite de ventana de contexto de 128 mil tokens; LongCat-2.0 afirma alcanzar 1 millón de tokens, lo que tiene potencial relevancia para aplicaciones de agentes de IA que necesitan procesar bases de código extremadamente largas o cadenas de tareas complejas. Sin embargo, estas afirmaciones de especificaciones están pendientes de verificación independiente.
¿Cuál es el trasfondo de I+D en IA de Meituan?
El negocio principal de Meituan es la entrega de alimentos y servicios de vida local. Entró en el campo de la IA en 2023 tras adquirir la startup de IA Light Year Beyond por 281 millones de dólares, y solo anunció públicamente sus planes de modelos internos en 2025. LongCat-2.0 está posicionado como el motor de inferencia para los agentes de IA y las herramientas de codificación de la empresa.
¿Cuáles son las ventajas y desventajas de la arquitectura MoE escasa de LongCat-2.0 en comparación con un modelo denso de 1,6 billones?
La principal ventaja de la MoE escasa es que no activa todos los parámetros, sino que enruta a submódulos específicos, reduciendo los costos computacionales de inferencia en comparación con un modelo denso de tamaño equivalente. Sin embargo, la arquitectura optimizada para hardware específico (como ASIC domésticos) puede tener limitaciones de rendimiento en otro hardware (como GPU NVIDIA); los resultados de pruebas independientes aún no se han publicado.