Специалисты OpenAI обучают ИИ-системы ловкости человеческих рук

Мы все не раз удивлялись возможностям роботов компании Boston Dynamics. Однако последние наработки некоммерческой организации OpenAI, занимающей исследованиями в области технологий искусственного интеллекта, даже на фоне робо-псов Boston Dynamics выглядят как совершенно иной, более продвинутый уровень. OpenAI представила Dactyl – ИИ-систему, обученную управлению роботизированной рукой. Казалось бы, чего тут впечатляющего? Объясняем. Dactyl – это система, позволяющая роботизированной руке манипулировать физическими объектами на уровне, ранее недостижимом ни одной ИИ-системе. В перспективе система будет способна наделить робота физическим параметром ловкости.

Специалисты OpenAI обучают ИИ-системы ловкости человеческих рук. Фото.

О полноценном уровне ловкости роботизированного тела речи пока не идет, но инженеры OpenAI наконец-то заложили основу.

Ловкость рук и никакого мошенничества

Специалисты OpenAI обучают ИИ-системы ловкости человеческих рук. Ловкость рук и никакого мошенничества. Фото.

Пожалуй, одним из самых прекрасных инструментов, которым нас наделила мать-природа являются руки. Именно человеческие руки, а ни какие-либо другие, включая конечности самых продвинутых обезьян, способны так тонко управлять своими пальцами. Инженеры-робототехники всеми силами пытаются адаптировать ловкостью человеческих рук в своих железных протеже, но каких-то очевидных и значимых подвижек в этом направлении не было уже давно.

Разработанная OpenAI система Dactyl предназначена для, казалось бы, самой простой задачи, с которой справится даже ребенок. Разве для нас сложно взять в руку, скажем, кубик с нанесенными на каждую из его сторон рисунками и перевернуть его на нужную сторону? Для нас, людей, эта задача не составляет никакого труда. Для робота – это настоящая пытка. Но благодаря мощным компьютерам исследователи смогли-таки обучить машину этому трюку всего за 50 часов.

Все дело в практике

Специалисты OpenAI обучают ИИ-системы ловкости человеческих рук. Все дело в практике. Фото.

Обучение системы Dactyl проходило в симуляционной среде. Для этого инженеры создали цифровую копию руки и поместили ее в компьютерную среду, работающую по принципу рандомизации. Инженеры задали определенный набор параметров для среды (например, размер кубика, гравитацию), а затем стали случайно менять эти переменные. Для более быстрого обучения системы исследователи создали сразу несколько таких виртуальных рук. Научив Dactyl адаптироваться к большому разнообразию возможных сценариев внутри виртуальной среды, ученые наделили ИИ-систему опытом, необходимым для адаптации к тем или иным сценариям задачи в реальном мире.

Специалисты OpenAI обучают ИИ-системы ловкости человеческих рук. Все дело в практике. Фото.

Спустя 50 часов тренировок внутри виртуальной среди ИИ-система научилась управлять реальной роботизированной рукой и выполнила 50 поставленных перед ней задач: провернуть кубик на ту или иную сторону, не уронив его и уложившись в 80 секунд для решения одного задания. Для того чтобы система могла «понять» в какую сторону поворачивать кубик, она использует набор камер.

На своем официальном сайте разработчики Dactyl поясняют, что в качестве основы для новой системы они применили алгоритм OpenAI Five, ранее разработанный для создания команды из 5-ти нейронных сетей, способных командно играть в DOTA 2. Эту цифровую братию мы с вами сможем увидеть на главном кибертурнире этого года — The International 2018, ежегодно проводимом компанией Valve.

Эффективность Dactyl доказывает возможность создания универсального алгоритма, способного обучать ИИ-систему на выполнение сразу нескольких задач. Главная польза от такой возможности заключается в том, что в будущем это упростит и ускорит сам процесс обучения систем искусственного интеллекта, поскольку разработчикам не придется с нуля создавать и обучать новые ИИ для решения тех или иных новых задач.

Новости партнеров
Умные напоминания о сообщениях в WhatsApp: как работает новая функция из бета-версии мессенджера
Умные напоминания о сообщениях в WhatsApp: как работает новая функция из бета-версии мессенджера
Что купить на AliExpress? 10 отменных товаров со скидкой из раздела «Распродажа гаджетов»
Что купить на AliExpress? 10 отменных товаров со скидкой из раздела «Распродажа гаджетов»
Эксперт рассказал, как действовать криптотрейдерам, чтобы добиться успеха в этом цикле роста монет
Эксперт рассказал, как действовать криптотрейдерам, чтобы добиться успеха в этом цикле роста монет