Ars Technica · Разработка · 3 ч назад
Робот-собака Boston Dynamics теперь читает показания приборов и термометров с помощью искусственного интеллекта Google
Искусственный интеллект Google позволяет роботам считывать показания приборов во время проверки промышленных объектов.
Подробности
См. Spot read. Робот-собака Boston Dynamics теперь читает показания приборов и термометров с помощью искусственного интеллекта Google. Искусственный интеллект Google позволяет роботам читать показания приборов во время проверки промышленных объектов.
По данным Google DeepMind, новая модель Gemini Robotics-ER 1.6, анонсированная 14 апреля, работает как «модель мышления высокого уровня для робота», который может планировать и выполнять задачи. Эта модель также открывает возможность точного считывания показаний приборов, таких как сложные манометры, и проведения визуальных проверок с использованием смотровых окон, которые обеспечивают прозрачное окно, позволяющее заглянуть внутрь резервуаров и труб — повышение производительности, которое стало возможным благодаря постоянному сотрудничеству Google DeepMind с робототехнической компанией Boston Dynamics.
Boston Dynamics проявляет большой интерес к тестированию как четвероногих, так и человекоподобных роботов-работников на широком спектре промышленных объектов, включая автомобильные заводы Hyundai Motor Group, корпоративного владельца роботизированной компании. Робот-собака компании Спот проходит испытания в качестве робота-инспектора, который бродит по промышленным объектам и все проверяет. Такие обязанности по проверке требуют «сложного визуального мышления» для интерпретации многочисленных стрелок, уровней жидкости, границ контейнеров и делений, а также текста на различных приборах.
Для решения таких задач модель Gemini Robotics-ER 1.6 предоставляет роботам «агентское зрение», которое сочетает в себе визуальное мышление с возможностью выполнения кода для создания «визуального блокнота» для проверки изображений и манипулирования ими. Такое агентное видение было представлено в модели Google Gemini 3.0 Flash еще в январе 2026 года.
Сообщается, что возможности агентного зрения повышают производительность робота при выполнении задач по считыванию показаний приборов с 23 процентов в старой модели Gemini Robotics-ER 1.5 до 98 процентов в новой модели Gemini Robotics-ER 1.6. Для сравнения, Gemini 3.0 Flash обеспечил точность всего 67 процентов.