Новая система облегчает просто общение с роботами

Новая система, основанная на компьютерных исследованиях ученых из Университета Брауна, позволяет роботам лучше выполнять устные инструкции, какими бы абстрактными или конкретными они ни были. Разработка, которая была представлена на этой неделе на конференции Robotics: Science and Systems 2017 в Бостоне, — это шаг к роботам, которые могут общаться с людьми.

Исследование проводилось Дилипом Арумугамом и Сиддхартом Карамчитати, оба являются студентами Брауна, когда работа была выполнена (Arumugam теперь является аспирантом Брауна). Они работали с аспирантом Накулом Гопаланом и докторантом Лоусон Л.С. Вонг в лаборатории Стефани Тельлекс, профессора компьютерных наук в Брауне.

«Проблема, которую мы рассматриваем, — это языковое заземление, а это означает, что робот принимает команды на естественном языке и генерирует поведение, которое успешно выполняет заданную задачу», — сказал Арумугам. «Проблема в том, что команды могут иметь разные уровни абстракции, и это может заставить робота планировать свои действия неэффективно или вообще не выполнить задачу».

Например, представьте, что кто-то на складе работает бок о бок с роботизированным погрузчиком. Человек может сказать роботу-партнеру: «Возьми этот поддон». Это очень абстрактная команда, которая подразумевает несколько небольших подэтапов — выравнивание подъемника, установка вилок под ним и подъем. Однако другие общие команды могут быть более мелкозернистыми, включая только одно действие: «Наклоните вилки немного назад», например.

Исследователи говорят, что те разные уровни абстракции могут вызвать проблемы для современных моделей языка роботов. Большинство моделей пытаются идентифицировать сигналы из слов в команде, а также структуру предложения, а затем вывести желаемое действие с этого языка. Результаты вывода затем запускают алгоритм планирования, который пытается решить задачу. Но, не принимая во внимание специфику инструкций, робот может переплатить за простые инструкции или заложить более абстрактные инструкции, которые включают в себя дополнительные подэтапы. Это может привести к неправильным действиям или чрезмерно длинному отставанию планирования до того, как робот предпримет действия.

Но эта новая система добавляет дополнительный уровень сложности существующим моделям. В дополнение к простому выведению желаемой задачи из языка, новая система также анализирует язык, чтобы вывести отчетливый уровень абстракции.

«Это позволяет нам связывать наш вывод о работе, а также наш предполагаемый уровень специфичности с иерархическим планировщиком, поэтому мы можем планировать любой уровень абстракции», — сказал Арумугам. «В свою очередь, мы можем добиться резкого ускорения производительности при выполнении задач по сравнению с существующими системами».

Чтобы развить свою новую модель, исследователи использовали Механический Турк, рынок краудсорсинга Amazon и область виртуальной задачи под названием Cleanup World. Онлайн-домен состоит из нескольких цветных комнат, роботизированного агента и объекта, с которым можно манипулировать — в этом случае — кресла, которое можно перемещать из комнаты в комнату.

Механические туркменские добровольцы наблюдали, как робот-агент выполняет задачу в домене Cleanup World, например, перемещая стул из красной комнаты в соседнюю синюю комнату. Затем добровольцев попросили сказать, какие инструкции они дали бы роботу, чтобы заставить его выполнить задачу, которую они только что наблюдали. Волонтерам были даны указания относительно уровня специфичности, которую должны иметь их направления. Инструкции варьировались от высокого уровня: «Поднимите стул в синюю комнату» на ступенчатый уровень: «Сделайте пять шагов на север, поверните направо, сделайте еще два шага, возьмите стул, поверните налево, поверните налево, возьмите пять Шаги на юг ». Третий уровень абстракции использовал терминологию где-то между этими двумя.

Исследователи использовали устные инструкции добровольцев для обучения своей системы, чтобы понять, какие слова используются в каждом уровне абстракции. Оттуда система научилась выводить не только желаемое действие, но и уровень абстракции команды. Зная обо всех этих вещах, система могла затем запустить свой иерархический алгоритм планирования для решения задачи с соответствующего уровня.

Обучив их системе, исследователи протестировали ее как в виртуальном мире, так и в реальном роботе, подобном Roomba, который работает в физическом мире, подобном пространству Cleanup World. Они показали, что когда робот смог вывести как задачу, так и специфику инструкций, он ответил на команды за одну секунду в 90% случаев. Для сравнения, когда не было выявлено какого-либо уровня специфичности, половина всех задач требовала 20 или более секунд времени планирования.

«В конечном итоге мы хотим видеть роботов, которые являются полезными партнерами в наших домах и на рабочих местах», — сказал Tellex, который специализируется на сотрудничестве с человеческим роботом. «Эта работа является шагом на пути к тому, чтобы люди могли общаться с роботами во многом так же, как мы общаемся друг с другом».

Добавить комментарий


Защитный код
Обновить