Всего за 4 часа Google «взрастила» лучшего шахматиста в истории

8 Декабря 2017, Николай Хижняк 27

Шахматы – непростая игра. По крайней мере по человеческим меркам. Но для сверхмощного искусственного интеллекта это обычная забава, которую можно освоить за весьма короткое время. В статье, опубликованной в онлайн-библиотеке Arxiv.org, инженеры из Google в деталях рассказывают о том, как их новейшая ИИ-конфигурация AlphaZero смогла развить «сверхчеловеческие возможности» в шахматах всего за несколько часов.


После того, как в систему внесли лишь базовый набор правил (без стратегий), AlphaZero потребовалось всего четыре часа на то, чтобы освоить игру настолько хорошо, что перед ним пал даже самый сильный в мире шахматный движок Stockfish.

После серии из 100 игр против Stockfish ИИ-алгоритм AlphaZero одержал победу 25 раз за игру белыми фигурами и три раза за игру черными. Все остальные партии обе системы сыграли вничью. В итоге Stockfish не смогла победить ни одного раза, а AlphaZero, в свою очередь, ни одного раза не проиграла.

«У нас появился новый повелитель шахмат. Это без сомнений революционизирует игру, но было бы неплохо подумать и о том, как это может быть применено вне шахмат», — прокомментировал результаты Дэвид Крамалей, исследователь шахматной игры и главный редактор сайта Chessable.

Система AlphaZero основывается на наработках ИИ-алгоритмов AlphaGo и AlphaGo Zero, создателями которых являются инженеры лаборатории искусственного интеллекта DeepMind, принадлежащей Google. DeepMind занимается совершенствованием этих ИИ-алгоритмов уже в течение нескольких лет, попутно побеждая с помощью них лучших в мире игроков в древнюю логическую игру го. Кульминация победной серии состоялась в октябре этого года, когда новая и полностью автономная версия ИИ-алгоритма AlphaGo, обучавшаяся исключительно на игре с самой собой, а не против человеческих оппонентов, победила все свои предыдущие версии.

В то же время предыдущие версии алгоритма AlphaGo Zero частично обучались игре с помощью наблюдения за тем, как играют люди. Таким образом разработчики хотели помочь ей в изучении стратегий игры, но, как оказалось, на самом деле это ее лишь замедлило в развитии. Полное предоставление самой себе при обучении сказалось на существенно более эффективных результатах AlphaGo Zero в соревнованиях один на один.

«Это как наблюдать за инопланетной цивилизацией, изобретающей свою собственную математику», — говорил в интервью порталу Gizmodo еще в октябре Ник Хайнс, ученый MIT, работающий в области компьютерных наук.

«То, что мы здесь видим, это самостоятельная, самодостаточная модель, созданная с исключенным фактором человеческих предрассудков. Она самостоятельно способна обучаться тому, что сама посчитает оптимальным, что, безусловно, будет дифференцировать ее от наших собственных концепций».

Однако развитие сферы ИИ происходит настолько быстро, что то, что было достигнуто к октябрю этого года, могло уже устареть. В опубликованной статье инженеры DeepMind отмечают, как самая последняя версия AlphaZero перешла на новый уровень и способна заниматься решением более широкого круга задач. Это означает, что теперь AlphaZero способна не только великолепно играть в шахматы. Она также отлично справляется с сёги (японской настольной игрой) и го, в которых достигнуть совершенства ей удалось всего за 2 и 8 часов соответственно.

Пока ни инженеры Google, ни инженеры DeepMind открыто не выступали с комментариями по поводу новых результатов своей работы, они ожидают стороннего и независимого экспертного анализа статьи в Arxiv.org. Правда, уже понятно, что восхождение данного алгоритма к вершинам искусственного интеллекта еще далеко до своего завершения, но уже сейчас он настолько крут, что его признают даже гроссмейстеры.

«Всегда хотел узнать, как бы выглядела игра в шахматы между более развитыми видами, высадившимися на Земле. Теперь знаю», — прокомментировал результаты AlphaZero гроссмейстер Петер Хейне Нильсен.

Всего за 4 часа Google «взрастила» лучшего шахматиста в истории

27 комментариев Оставить свой

  1. MASking

    "Всегда хотел узнать, как бы выглядела игра в шахматы между более развитыми видами" - где видео?

    • MASking
      • MASking

        MASking, За четыре часа самообучения алгоритм научился играть в шахматы достаточно хорошо, чтобы обыграть текущего чемпиона среди таких программ – алгоритм Stockfish;
        AlphaZero также два часа обучался игре в японские шахматы (сеги) и тоже смог победить один из лучших алгоритмов в этой области – программу Elmo;
        Новый алгоритм также 8 часов обучался игре в го и смог победить программу AlphaGo, которая в мае 2017 года победила абсолютного чемпиона в го среди людей Кэ Цзе.

        Боюсь представить Третью мировую - Ядерная, Химическая, Биологическая, Напалм? ЖУТЬ...

        • designer_andrew

          MASking, А война не нужна. Люди абсурдно мыслят. Например военный бюджет США столь огромен, что попросту лишает войну всяческого смысла. Лишь на часть средств от военного бюджета можно построить рай на всех территориях "вероятных противников" и они автоматически будут союзниками.
          Ну влейте в Северную Корею ресурсов на 500 миллиардов долларов, так это государство само захочет быть новым американским штатом. Еще несколько таких вливаний и не нужны никакие военные конфликты, никогда. Просто банально дешевле, чем каждый год вливать эти миллиарды просто в никуда, на поддержания никому не нужных авианосцев и т.п..

          • trukhin

            designer_andrew, Ага, и оставили бы без источника финансирования гигантские коммерческие военно-производственные компании США...
            Думаю, они тоже согласны, что так можно победить, но не хотят этого допустить ни в коем случае )))

          • amd212

            designer_andrew, Рассмотрим два крайних сценария
            а). капиталистический - тысяча людей получает по 500 миллионов долларов и сматывает из страны. В Сев. Корее заочно клеймят врагов народа, в США временно подпрыгивают цены на элитные дома, яхты, проституток
            б). социалистическое - каждый кореец разово получает по 20 тысяч долларов. В Сев.Корее подскакивает продажи Фольксвагенов, телевизоров, компьютеров - народ славит партию и Ына за победу над американским империализмом

  2. joshua

    Что-то я не понял.
    Кто с кем бился? И кто кого победил?
    новейшая ИИ-конфигурация AlphaZero и шахматный движок Stockfish?
    Это алгоритм против алгоритма получается или что?
    или это специально заточенный "комп" против обычного компа
    с установленнынм шахматным движком Stockfish?

  3. serikastana

    Я так понимаю, людям уже никогда не выиграть чемпионат между компьютером и человеком

    • rainbringer

      serikastana, Уже давно

    • rainbringer

      serikastana, И в го.

    • pupsikizada

      serikastana, Нейроинтерфейсы должны сравнять шансы...

      • MASking

        pupsikizada, не факт...

        • MASking

          MASking, 1 мозг против 100 тыс ПК с одним ИИ

      • gazon

        pupsikizada, Пока их создадут пройдёт 20-30 лет,мы к тому времени,в лучшем случае,будем прислугой для ИИ :))

  4. ovula

    А кто-то когда-то говорил, что шахматы--это искусство

    • abdula

      ovula, А.А. Алехин

      • ovula

        abdula, Гении тоже могут ошибаться

      • amd212

        abdula, Заведомо предвзятое мнение заинтересованного человека :-)

  5. 1GENKA

    Очень впечатлен! Это просто фантастика!
    Жду когда Альфу научат играть в StarCraft2 :)

  6. trukhin

    А как дела с энергоэффективностью? Просто если этот ИИ для победы над человеческим мозгом потребляет больше энергии, чем мозг человека, то дела ИИ не так хороши, а наши не так уж плохи. Грубо говоря, это означает, что при наличии одинакового количества ресурсов, мы всё ещё победим )))

    • Sergo8787

      trukhin, Так о какой энергии идет речь? Если человеческий мозг потребляет глюкозу, а ИИ электроэнергию))

  7. vit555

    А где найти эти партии, кто подскажет?

    • mvt

      vit555, в поиске пишешь Alphazero vs Stockfish

  8. amd212

    Интересно сколько тысяч процессоров было задействовано и сколько миллиардов партий было сыграно за 4 часа обучения для наработки Базы Знаний ИИ?

  9. jekajeka

    А ссылку на статью?)

  10. realsomebody

    По разговорам у альфазеро было лучше железо, а стокфиш не имел технической поддержки своих разработчиков. У стокфиша был отключен доступ к дебютным базам, в то время как альфазеро пользовался своими, так сказать, наработками при обучении игре. А это,вероятно, огромная база. И похоже стокфишу давалось недостаточно времени на ход. Несколько ошибок стокфиша выглядят странно, даже на моем железе ходы он показывает сильнее в тех же позициях, если дать подумать немного дольше.Также возможно, что "ИИ" готовился к игре против конкретной версии Стокфиша на конкретном железе, и были найдены слабости, по которым затем били уже в матче.

    В общем, пусть участвует в ежегодном турнире комп программ с равными условиями. Пока это похоже на грязноватый пиар.

Новый комментарий

Для отправки комментария вы должны авторизоваться или зарегистрироваться.