По данным Beating, NVIDIA выпустила веса для Cosmos-Reason2-32B — флагманской версии физического AI-моделя рассуждений «видение-язык» (VLM), предназначенной, чтобы помочь роботам и системам автономного вождения понимать пространственные, временные и физические принципы. Модель с 32 миллиардами параметров, созданная на базе Qwen3-VL-32B-Instruct, доступна по лицензии NVIDIA Open Model License для коммерческого использования.
Модель может анализировать видеопотоки для оценки безопасности движения, обнаруживать объекты на изображениях с 2D/3D координатами и выступать как планировочный движок для гуманоидных роботов и автономных транспортных средств. По сравнению с предыдущим поколением Cosmos-Reason2 добавляет обнаружение объектов с точной временной локализацией и расширяет контекстное окно до 256K токенов.