A NVIDIA lança os pesos do modelo flagship Cosmos-Reason2-32B e alarga a janela de contexto para 256K tokens

Segundo Beating, a NVIDIA lançou os pesos do Cosmos-Reason2-32B, a versão de topo da sua visão-linguagem (VLM) de raciocínio de IA física, concebida para ajudar robôs e sistemas de condução autónoma a compreender princípios espaciais, temporais e físicos. O modelo de 32 mil milhões de parâmetros, construído sobre o Qwen3-VL-32B-Instruct, está disponível sob a NVIDIA Open Model License para uso comercial.

O modelo pode analisar fluxos de vídeo para avaliar a segurança na condução, detetar objetos em imagens com coordenadas 2D/3D e servir como motor de planeamento para robôs humanoides e veículos autónomos. Em comparação com a geração anterior, o Cosmos-Reason2 acrescenta deteção de objetos com localização temporal precisa e alarga a janela de contexto para 256K tokens.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário