Google DeepMind выпустила Gemini Robotics-ER 1.6, робот Spot уже способен автоматически читать приборные панели

robot
Генерация тезисов в процессе

ME News Новости, 14 апреля (UTC+8), по данным мониторинга 1M AI News, Google DeepMind выпустила Gemini Robotics-ER 1.6, позиционируемый как модель высокоуровневого мышления для роботов, которая значительно превосходит предыдущие ER 1.5 и Gemini 3.0 Flash в пространственном мышлении и многовзглядовом понимании. Модель уже доступна для разработчиков через Gemini API и Google AI Studio. Основные обновления включают три способности: 1. Повышенная точность указания: может использоваться для точного обнаружения объектов, подсчёта, пространственного рассуждения (например, «указать все объекты, которые можно поместить в синюю чашку») и планирования траекторий движения, а также правильно отвергать указания на объекты, отсутствующие на изображении 2. Успешное многовзглядовое обнаружение: робот теперь способен объединять изображения с нескольких камер для определения выполнения задачи, сохраняя точность даже при препятствиях или в динамической среде 3. Новая способность чтения приборов: может интерпретировать круглые манометры, вертикальные уровни и цифровые дисплеи, используя агентное зрение (визуальное рассуждение + выполнение кода) для пошагового анализа, сначала увеличивая детали области, затем с помощью указания и вычислений по коду определяя пропорции и интервалы, в конечном итоге объединяя знания о мире для получения показаний Источник этой способности — совместная работа DeepMind и Boston Dynamics. В тот же день Boston Dynamics объявила, что интегрировала Gemini и Gemini Robotics-ER 1.6 в свой продукт Orbit AIVI-Learning, запустив его для всех клиентов AIVI-Learning 8 апреля. После интеграции добавлена поддержка приборных панелей (gauges), и четырёхногие роботы Spot теперь могут самостоятельно патрулировать промышленные объекты и считывать данные с приборов, таких как манометры. Boston Dynamics заявила, что благодаря рассуждению Gemini, базовые показатели и точность AIVI-Learning в задачах визуального осмотра, подсчёта поддонов и обнаружения жидкостей также улучшились. DeepMind утверждает, что ER 1.6 — это «самая безопасная модель робота» компании. В задачах противодействия пространственному рассуждению с соблюдением инструкций уровень безопасности значительно выше, чем у ER 1.5. В тестах по выявлению рисков безопасности на основе реальных сообщений о травмах, модели серии ER показали на 6% выше точности в текстовых сценариях и на 10% — в видеосценариях по сравнению с Gemini 3.0 Flash. (Источник: BlockBeats)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить