Искусственный интеллект стал обучаться в 10 раз быстрее и эффективнее

14 Февраля 2018, Николай Хижняк 8

Подразделение компании Google, занимающееся разработками искусственного интеллекта, сообщило о создании нового метода обучения нейронных сетей, сочетающего использование передовых алгоритмов и старых видеоигр. В качестве среды обучения используются старые видеоигры Atari.

Разработчики DeepMind (напомним, что эти люди создали нейросеть AlphaGo, неоднократно победившую лучших игроков в логическую игру го) считают, что машины способны обучаться так же, как люди. С помощью тренировочной системы DMLab-30, созданной на базе шутера Quake III и аркадных игр Atari (используются 57 различных игр), инженеры разработали новый алгоритм машинного обучения IMPALA (Importance Weighted Actor-Learner Architectures). Он позволяет отдельным частям обучаться выполнению сразу нескольких задач, а потом обмениваться знаниями между собой.

Во многом новая система была основана на более ранней архитектурной системе A3C (Asynchronous Actor-Critic Agents), в которой отдельные агенты исследуют среду, затем процесс приостанавливается, и они обмениваются знаниями с центральным компонентом, «учеником». Что касается IMPALA, то у нее агентов может быть больше, а сам процесс обучения происходит несколько по-другому. В ней агенты посылают информацию сразу двум «ученикам», которые после этого еще и обмениваются данными между собой. Кроме того, если в A3C вычислением градиента функции потерь (другими словами, несоответствия предсказанных и полученных значений параметров) занимаются сами агенты, которые отправляют информацию к центральному ядру, то в системе IMPALA этой задачей занимаются «ученики».


Пример прохождения игры человеком:

Здесь показано, как с такой же задачей справляется система IMPALA:

Одной из основных проблем при разработке ИИ является время и необходимость в высокой вычислительной мощности. Даже в условиях автономности машинам нужны правила, которым они могли бы следовать в ходе собственных экспериментов и поиска путей решения задач. Так как мы не можем просто построить роботов и выпустить их на волю учиться, разработчики используют симуляции и методы глубокого обучения.

Для того чтобы современные нейронные сети могли чему-то научиться, им приходится обрабатывать огромный объем информации, в данном случае — миллиарды кадров. И чем быстрее они это делают, тем меньше времени уходит на обучение.

По словам представителей DeepMind, при наличии достаточного числа процессоров IMPALA достигает производительности в 250 000 кадров/с, или 21 миллиард кадров в день. Это абсолютный рекорд для задач такого рода, сообщает портал The Next Web. Сами же разработчики комментируют, что их система ИИ справляется с задачей лучше, чем аналогичные машины и люди.

В будущем подобные алгоритмы ИИ можно будет использовать в робототехнике. Благодаря оптимизации систем машинного обучения роботы будут быстрее адаптироваться к окружающей среде и работать эффективнее.

Искусственный интеллект стал обучаться в 10 раз быстрее и эффективнее

8 комментариев Оставить свой

  1. pupsikizada

    Самые мощные суперкомпы делают в Китае. Капец чё они там вытворяют, наверное! Только не пиарятся, как гугл.

    Кстати, рассейские суперкампутерщики наладили майнинг на местном пуперкомпьютере (правильно, зачем наука?!).
    Как говорится, информация для сравнения...

  2. uran

    я сам учился на кваке 3 :)

  3. romale

    На атари были хорошие игры в начале 90хх, мы на них выросли, походу только наше поколение сможет противостоять ИИ

  4. IQ

    Прогрессирует, 10*1000*1000000.. Недолго двуногим осталось банковать..

    • MASking

      IQ, В каком смысле? Полное равенство или истребление? В первом случае вам лайк, во втором... причина? У супер интеллекта просто не может быть врагов! Он просчитает вероятности исходов событий на 1000 лет вперед, и предусмотрит места где положить соломку. Люди не истребляют хищников и паразитов полностью, по тому что мы это можем. Также и с ИИ он уничтожит только тех кто действительно попытается его уничтожить, всех остальных не тронет. Да и принципе он будет децентрализованным и полностью удалить не получиться, выживет при любой атаке (локальной или глобальной).

  5. botan

    Вот и я думаю что гугл пиарится....

  6. BunnyCat

    Квака 3 вечна как сама вселенная. Надеюсь ИИ уже научился распрыжке и уже, небось, дефраг мод гоняет на ура. Вот победит Клекса на рельсах на найтмаре - тогда и вернётся к решению наших мирских мелких проблем типа рака, бессмертия, ядерного синтеза и прочей байды :D

  7. doctorwhyy

    Когда перестанете дурить народ, вы же- журналюги с филфака, так потрудитесь же изучить значение слов ИИ. Нейросеть не есть ИИ!

Новый комментарий

Для отправки комментария вы должны авторизоваться или зарегистрироваться.