NVIDIA lanza los pesos del modelo insignia Cosmos-Reason2-32B y amplía la ventana de contexto a 256K tokens

Beating afirma que NVIDIA ha lanzado los pesos de Cosmos-Reason2-32B, la versión insignia de su modelo de visión-lenguaje (VLM) de razonamiento físico para IA, diseñado para ayudar a robots y sistemas de conducción autónoma a comprender principios espaciales, temporales y físicos. El modelo de 32 mil millones de parámetros, construido sobre Qwen3-VL-32B-Instruct, está disponible bajo la NVIDIA Open Model License para uso comercial.

El modelo puede analizar flujos de video para evaluar la seguridad al conducir, detectar objetos en imágenes con coordenadas 2D/3D y servir como motor de planificación para robots humanoides y vehículos autónomos. En comparación con la generación anterior, Cosmos-Reason2 añade detección de objetos con localización temporal precisa y amplía la ventana de contexto a 256K tokens.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios