Эксперты Калифорнийского университета в Беркли заявили о разработке новой технологии RoVi-Aug, позволяющей роботам в автономном режиме обучаться навыкам друг у друга. Созданная технология основывается на обучении модели выявлению и использованию причинно-следственных связей между действиями робота и выполняемыми задачами.

В процессе функционирования система создаёт синтетические данные, которые адаптируются к разным типам роботизированной техники и углам обзора камер. Такой подход снижает потребность в сборе реальных данных и упрощает процессы обучения роботов. Благодаря этому алгоритму роботы могут намного быстрее осваивать новые задачи и увеличивают успешность их выполнения примерно на 30%.

Одна из команд учёных в рамках проекта Open-X Embodiment смогла объединить в общую систему информацию, собранную с 60 роботов. Это было сделано для того, чтобы они могли обучаться навыкам друг у друга. При этом специалисты отмечают, что этот метод сопряжён с серьёзной проблемой: в собранных данных содержится большое количество информации о конкретных роботах, а углы обзора камер ограничены. В результате роботизированная техника запоминает только ограниченные данные и не может справляться с новыми задачами, если в качестве примера показываются действия роботов другого типа или изменяется положение камеры.

Также используется другой алгоритм под названием Mirage, который способен адаптировать неизвестных роботов с применением так называемой «перекрёстной окраски». Это позволяет сделать их похожими на модели из обучающей выборки. Но эта технология не поддерживает тонкую настройку, и изменение положения камеры может сбить алгоритм с толку.

В Калифорнийском университете разработали собственный метод RoVi-Aug, позволяющий преодолеть вышеуказанные ограничения. Разработчики утверждают, что в отличие от стандартных подходов, объединяющих данные с разных роботов, технология RoVi-Aug фокусируется на обучении моделей пониманию взаимосвязи между действиями роботизированных устройств и выполняемыми задачами.

В процессе своей работы новая архитектура создаёт визуальные синтетические демонстрации, которые изменяются в зависимости от разновидности робота и угла обзора камеры. Это увеличивает уровень универсальности процедуры обучения.

Сама технология состоит из двух основных компонентов. Первый компонент — это модуль дополнения данных о роботах, который называется Ro-Aug. С его помощью формируются демонстрации с разными роботизированными системами. Второй — это модуль дополнения данных о точке зрения (Vi-Aug), необходимый для имитации демонстрации с различных ракурсов камеры.

Комбинация этих модулей создаёт максимально разнообразный датасет для обучения роботов, благодаря чему устройства могут тренироваться на огромном количестве сценариев.


Ещё по теме: