«Глубокое обучение» приведет нас к сверхразумным роботам

03.06.2015, обновлено 08.09.2020

Ян Лекун — один из тех, кто выводит популярные интернет-сервисы вроде тех, что обслуживают Facebook, Google и Microsoft, на новый уровень искусственного интеллекта. Будучи главой по исследованиям ИИ в Facebook, Лекун предвидит создание гигантских «нейронных сетей», которые смогут распознавать фотографии и отвечать на обычные запросы людей на их же языке. То же самое движет разработкой распознавания речи на Android-телефонах от Google, сервисом мгновенного перевода в Skype от Microsoft и множеством других онлайн-инструментов, которые могут «обучаться» со временем. Используя большие сети компьютерных процессоров, такие системы чем-то напоминают сети нейронов в человеческом мозге и в некотором роде даже превосходят людей.

Ян Лекун

На этой неделе в научном журнале Nature под авторством Лекуна — также профессора компьютерных наук в Нью-Йоркском университета — и двух других академиков (Джеффа Хинтона и Йошуа Бенгио) появилась работа, раскрывающая детали современного состояния технологии «глубокого обучения». Работа описывает широкий прогресс глубокого обучения в последние годы и раскрывает, как эта технология изменяет наши интернет-сервисы — и будет продолжать изменять их в ближайшие годы.

Но, как Лекун рассказал журналу Wired, глубокое обучение также выходит за рамки Интернета, переходя в устройства, которые могут работать в физическом мире — вроде роботов и самоуправляемых автомобилей. Только на прошлой неделе ученые Калифорнийского университета в Беркли раскрыли роботизированную систему, которая использует глубокое обучение, чтобы научиться закручивать крышку на бутылке. В начале этого года производитель чипов NVIDIA и израильская компания Mobileye раскрыли, что работают над системами глубокого обучения, которые помогут в развитии самоуправляемых автомобилей.

Лекун исследовал похожие типы «роботизированного восприятия» на протяжении десяти лет, опубликовав первую статью на эту тему в 2003 году. Тогда идея заключалась в использовании алгоритмов глубокого обучения как способа для роботов выявлять и избегать препятствия по мере движения по миру — самоуправляемые автомобили работают по схожему принципу. «Сейчас это актуальная тема», говорит он.

Да, Google и многие другие уже продемонстрировали определенные возможности самоуправляемых автомобилей. Но по словами исследователей, в том числе и Лекуна, глубокое обучение может дойти до совершенства — тем же способом, каким оно улучшило технологии распознавания речи и изображений. Алгоритмы глубокого обучения уходят корнями в 80-е годы, но именно сейчас они могут задействовать чрезвычайно мощные сети машин, доступных компаниям и исследователям сегодняшнего дня; эти машины предоставляют мощные инструменты для обучения систем, позволяя анализировать гигантские объемы данных.

«Для нас это шанс изменить модель обучения от очень мелкой и ограниченной статистически к чему-то совершенно открытому», — говорит Себастьян Трун, который помогал запускать проект самоуправляемых автомобилей Google.

Трун ушел из Google, но компания уже изучает возможности использования техники глубокого обучения на своих самоуправляемых автомобилях (первая серия которых выйдет на дороги этим летом). Как говорит один из исследователей Google Джеффа Дина, компания использует эти методики в десятках сервисах, и самоуправляемые автомобили, которые в большой степени полагаются на распознавание изображений, являются одним из очевидных применений.

Тревор Даррелл, один из исследователей, работающих над роботами с глубоким обучением в Беркли, говорит, что его команда тоже исследует возможности использования этой технологии в автономном транспорте. «С точки зрения исследователей, есть много общего в том, чтобы передвинуть манипулятор и вставить колышек в отверстие и чтобы провести автомобиль или самолет через полосу препятствий», говорит он.

Глубокое обучение особенно интересно тем, что трансформирует многие направления исследований. В прошлом, говорит он, ученые использовали отдельные техники для распознавания речи, изображений, перевода и робототехники. Сейчас же один набор техник обслуживает все эти области.

Каков результат? Все эти области внезапно развиваются с высокой скоростью. Распознавание изображений уже удивляет людей. Далее очередь за распознаванием речи. Самоуправляемые автомобили могут появиться на рынке уже в ближайшие пять лет. ИИ постепенно становится все умнее.