Стэнфордские ученые повысили точность выполнения роботами команд на 45% с помощью контрастного верификатора CoVer

Исследователи из Стэнфордского университета разработали метод, позволяющий роботам более точно следовать инструкциям человека. Вместо традиционного наращивания объёмов предобучения модели специалисты предложили использовать проверку множества вариантов действий на этапе тестирования. Результаты эксперимента показали повышение успешности выполнения задач до 45% в реальных условиях.

Основная проблема современных моделей типа «зрение — язык — действие» (VLA) заключается в том, что их действия часто расходятся с заданными инструкциями. Авторы работы выяснили, что решение лежит не в масштабировании обучения, а в более тщательной верификации результатов во время развёртывания системы.

Принцип работы нового подхода

Анализ показал: одновременная генерация множества перефразированных инструкций и множества вариантов действий для каждой из них обеспечивает гораздо лучшее разнообразие решений, чем увеличение любого из этих параметров по отдельности. Это даёт возможность эффективнее находить правильное действие в конкретной ситуации.

На основе данных выводов команда создала CoVer — контрастивный верификатор, оценивающий соответствие действия инструкции и визуальной сцене. В отличие от предшествующих методов, он не моделирует физическое поведение объектов, а напрямую проверяет смысловое соответствие команды и выполняемой операции.

Система функционирует в два этапа: сначала языковая модель заранее генерирует множество перефраз инструкции (так называемые «вычисления на этапе загрузки»), затем во время выполнения задачи робот создаёт пакеты действий, а CoVer выбирает оптимальную пару «инструкция — действие».

Результаты испытаний

Новый подход превзошёл методы масштабирования предварительного обучения на тех же данных. В симуляторах прирост успешности составил до 22%, а в реальных экспериментах — 45%. Полученные данные свидетельствуют о том, что для выполнения инструкций выделение дополнительных вычислительных ресурсов на верификацию на этапе развёртывания может быть более эффективным, чем эквивалентные вложения в предварительное обучение.

Таким образом, метод демонстрирует, что повышение точности работы роботов не всегда требует увеличения объёмов обучающих данных или усложнения моделей — достаточно грамотно распределить вычислительные мощности на этапе практического применения системы.

Последние статьи

Related articles