Москва. 6 октября. INTERFAX.RU - Исследователи из университета Карнеги — Меллона в Питтсбурге при помощи нейронных сетей позволили промышленному роботу Baxter самому научиться захватывать манипулятором различные объекты и даже держать пистолет, сообщает сайт N+1 со ссылкой на MIT Technology Review. Препринт опубликован в архиве электронных научных публикаций arXiv.org.
Для обучения на стол перед роботом положили различные предметы - игрушечные пистолеты, пластиковую бутылку, пульт дистанционного управления телевизором и моток скотча. Робот откладывал один из предметов в сторону, определял наиболее выгодную точку захвата и начинал пытаться его брать с разных сторон. Для каждой выбранной зоны захвата Baxter производил 188 попыток, после каждой из которых пытался поднять предмет, чтобы проверить успешность захвата. После фиксации результата захвата робот клал объект на стол, манипулятор поворачивался на 10 градусов и попытка повторялась.
После окончания первой стадии обучения исследователи повторили цикл, представив роботу новый набор предметов, из которых лишь некоторые были знакомы нейросети по предыдущим попыткам. На обучение ушло 10 дней, в течение которых устройство работало до 10 часов в день, поднимая предметы со стола. Всего цикл самообучения поднятию предметов занял у робота 700 часов. Если предмет падал из манипулятора, Baxter просто переходил к следующему предмету. Всего за время обучения робот выполнил около 50 тысяч захватов предметов на столе.
Точность предсказания правильно выбранной позиции манипулятора для захвата после обучения составила 80 процентов. Как отмечают авторы, другие методы выбора места захвата, основанные только на распознавании объектов, справляются в 62 процентах случаев. Исследователи полагают, что их работа поможет при использовании роботов в сложных условиях, где требуется умение адаптироваться к окружающей среде и условиям поставленной задачи.
Робот Baxter обладает классической для многоцелевого промышленного робота компоновкой из двух манипуляторов, в систему управления заложено адаптивное поведение и предусмотрен набор датчиков для отслеживания изменений в окружающей среде. Робот управляется операционной системой для роботов (ROS) с открытым исходным кодом, благодаря чему для исследовательских проектов с машинным обучением часто выбирают именно Baxter. Например, именно эту модель робота исследователи научили распознавать предметы на ощупь и печь блинчики.