За повідомленням Beating, NVIDIA випустила ваги для Cosmos-Reason2-32B — флагманської версії її фізичної AI-розумової візуально-мовної моделі (VLM), створеної, щоб допомагати роботам і системам автономного керування розуміти просторові, часові та фізичні принципи. Модель із 32 мільярдами параметрів, побудована на Qwen3-VL-32B-Instruct, доступна за ліцензією NVIDIA Open Model License для комерційного використання.
Модель може аналізувати відеопотоки для оцінки безпеки руху, виявляти об’єкти на зображеннях із 2D/3D координатами та слугувати планувальним рушієм для гуманоїдних роботів і автономних транспортних засобів. Порівняно з попереднім поколінням Cosmos-Reason2 додає виявлення об’єктів із точним часовим локалізуванням і розширює контекстне вікно до 256K токенів.