Segundo Beating, a NVIDIA lançou os pesos do Cosmos-Reason2-32B, a versão de topo da sua visão-linguagem (VLM) de raciocínio de IA física, concebida para ajudar robôs e sistemas de condução autónoma a compreender princípios espaciais, temporais e físicos. O modelo de 32 mil milhões de parâmetros, construído sobre o Qwen3-VL-32B-Instruct, está disponível sob a NVIDIA Open Model License para uso comercial.
O modelo pode analisar fluxos de vídeo para avaliar a segurança na condução, detetar objetos em imagens com coordenadas 2D/3D e servir como motor de planeamento para robôs humanoides e veículos autónomos. Em comparação com a geração anterior, o Cosmos-Reason2 acrescenta deteção de objetos com localização temporal precisa e alarga a janela de contexto para 256K tokens.