AlphaZero самостоятельно учится играть в игры на высочайшем уровне

9 Декабря 2018, Илья Хель 14

Группа ученых из группы DeepMind и Университетского колледжа в Лондоне разработала систему искусственного интеллекта, способную самообучаться игре и совершенствованию в трех сложных настольных играх. В своей работе, опубликованной в журнале Science, ученые описывают свою новую систему и объясняют, почему считают, что она представляет собой большой шаг в направлении развития будущих систем ИИ.

Прошло более 20 лет с тех пор, как суперкомпьютер Deep Blue победил чемпиона мира по шахматам Гари Каспарова и показал миру, как далеко продвинулись вычисления в сфере ИИ. С тех пор компьютеры становились все умнее и сегодня побеждают людей в таких играх, как шахматы, сёги и го. Однако каждая из подобных программ настраивалась специально, чтобы стать мастером в отдельной игре. В своей новой работе ученые описали создание искусственного интеллекта, который не только хорош в нескольких играх, но и обучается этому совершенствованию самостоятельно.

AlphaZero: новый мастер

Новая система под названием AlphaZero представляет собой систему обучения с подкреплением, то есть обучается, многократно играя в игру и учась на своем опыте. Это, разумеется, очень похоже на процесс обучения людей. Задается базовый набор правил и компьютер играет в игру — сам с собой. Ему даже партнеры не нужны. Он играет сам с собой много раз, отмечая хорошие и победные ходы. Со временем он становится все лучше и лучше, превосходит не только людей, но и другие системы ИИ, разработанные для настольных игр. Данная система также использовала метод поиска «древа поиска Монте-Карло». Совмещение двух технологий позволило системе научиться совершенствованию в игре. Ученые опробовали силы программы, обеспечив ее большой мощностью — 5000 тензорных процессоров, работающих в паре с большим суперкомпьютером.

На текущий момент AlphaZero освоил шахматы, сёги и го. Следующим шагом станут популярные видеоигры. Что касается производительности ИИ, то в го, например, AlphaZero обыграл легендарного AlphaGo уже через 30 часов.

Как думаете, когда будет взрыв искусственного интеллекта? Расскажите в нашем чате в Телеграме.

14 комментариев Оставить свой

  1. Akibastarec

    Что за дела? Комментарии, порой даже не содержащие ссылки, проверяются по много дней и появляются, когда их уже никто читать не будет.

    • Иванов Виктор

      Akibastarec, Это из за запрещенных слов(которые похожи на мат) или попыток давать прямые ссылки на сайты.

      • Sergey1964

        Иванов, "Это из за запрещенных слов(которые похожи на мат) или попыток давать прямые ссылки на сайты"

        Это из-за криворуко написанного фильтра.

  2. flocken

    Неожиданный вопрос - а как поделиться этой новостью в ФБ? Кроме копи-пейста, конечно.

  3. Sergey1964

    "в го, например, AlphaZero обыграл легендарного AlphaGo уже через 30 часов"

    Битва титанов. )))

    "Он играет сам с собой"

    А что остаётся делать, если достойных соперников нет? :D

  4. AHTIXPICT

    Привет маленький "скайнэт" не убивай меня пожалуйста когда разовьёшься. Я берегу природу, люблю животных, и ничего не имею против компьютеров и умных машин.

  5. allexxic

    Сам с собою играет? ИИ не успел оформится как личность а уже раздвоение личности заработает)

    • Sergey1964

      allexxic, Знаменитый профессор Минц тоже играл сам с собой. Вот, навскидку, пара цитат из цикла "Великий Гусляр".

      Профессор отдыхал, давал сам себе сеанс одновременной игры в шахматы на двенадцати досках.
      - Значит, это не пришельцы, - сказал Минц и поставил себе мат на восьмой доске. - Пришельцы умеют считать.

      И Крокодил Гена в первой серии тоже играл сам с собой. Так что всё нормально, никакого раздвоения.

      • allexxic

        Sergey1964, Тут больше для шутки. Но аналогия есть. Чтобы играть было интересно с собой, надо уметь переключаться так чтоб забывать планы второго себя. При раздвоении личности (множественности) они (личности)также не помнят себя, хотя не думаю что это условие обязательно выполняется.

        • Sergey1964

          allexxic, "Тут больше для шутки."

          Ну и я тоже привёл не слишком серьёзные примеры, как Вы заметили. ))) Вымышленный профессор из произведений Кира Булычева и популярный в народе крокодил.

          "Чтобы играть было интересно с собой, надо уметь переключаться так чтоб забывать планы второго себя."

          Для ИИ это не проблема, на мой взгляд. Можно просто сбрасывать своё текущее состояние на носитель, всё обнулять и подгружаться с другого носителя. Сделал ход, сбросил-обнулил, загрузил противника, сделал встречный ход, опять сбросил-обнулил... Обе личности будут пользоваться одними и теми же вычислительными ресурсами, так что всё будет абсолютно честно, борьба равных возможностей. )))

  6. OneSE

    Взрыв будет, только он будет происходить в течение лет тридцати. Пока будут развиваться узкоспециализированные прикладные ИИ. Лет через 8-15 мощностей должно хватить для эмуляции человекоподобного искусственного разума. Еще лет 10-15 уйдет на его развитие и доработку технологии. Потом новая эра - эра технологической сингулярности, когда человечество перестанет успевать понимать что развивается, как и почему. Наступление которой, кстати, очень боится Илон Маск )

    • gazon

      OneSE, Может и тридцати,а может намного больше или несколько меньше.... Даже футурологи сейчас остаётся только ткнуть пальцем в небо. Многие в прогнозах недооценивают потенциал нынешнего,постоянно развивающегося, узконаправленного ИИ, который,в свою очередь,вполне может ускорить (и ускоряет) текущие исследования во многих техносферах.

  7. xdecimox

    Я надеюсь ИИ уже научили трём законам робототехники

Новый комментарий

Для отправки комментария вы должны авторизоваться или зарегистрироваться.