AlphaZero самостоятельно учится играть в игры на высочайшем уровне

Группа ученых из группы DeepMind и Университетского колледжа в Лондоне разработала систему искусственного интеллекта, способную самообучаться игре и совершенствованию в трех сложных настольных играх. В своей работе, опубликованной в журнале Science, ученые описывают свою новую систему и объясняют, почему считают, что она представляет собой большой шаг в направлении развития будущих систем ИИ.

Прошло более 20 лет с тех пор, как суперкомпьютер Deep Blue победил чемпиона мира по шахматам Гари Каспарова и показал миру, как далеко продвинулись вычисления в сфере ИИ. С тех пор компьютеры становились все умнее и сегодня побеждают людей в таких играх, как шахматы, сёги и го. Однако каждая из подобных программ настраивалась специально, чтобы стать мастером в отдельной игре. В своей новой работе ученые описали создание искусственного интеллекта, который не только хорош в нескольких играх, но и обучается этому совершенствованию самостоятельно.

AlphaZero: новый мастер

Новая система под названием AlphaZero представляет собой систему обучения с подкреплением, то есть обучается, многократно играя в игру и учась на своем опыте. Это, разумеется, очень похоже на процесс обучения людей. Задается базовый набор правил и компьютер играет в игру — сам с собой. Ему даже партнеры не нужны. Он играет сам с собой много раз, отмечая хорошие и победные ходы. Со временем он становится все лучше и лучше, превосходит не только людей, но и другие системы ИИ, разработанные для настольных игр. Данная система также использовала метод поиска «древа поиска Монте-Карло». Совмещение двух технологий позволило системе научиться совершенствованию в игре. Ученые опробовали силы программы, обеспечив ее большой мощностью — 5000 тензорных процессоров, работающих в паре с большим суперкомпьютером.

На текущий момент AlphaZero освоил шахматы, сёги и го. Следующим шагом станут популярные видеоигры. Что касается производительности ИИ, то в го, например, AlphaZero обыграл легендарного AlphaGo уже через 30 часов.

Как думаете, когда будет взрыв искусственного интеллекта? Расскажите в нашем чате в Телеграме.

Новости партнеров
Правда ли, что быстрая зарядка заставляет смартфон разряжаться быстрее
Правда ли, что быстрая зарядка заставляет смартфон разряжаться быстрее
80 процентов взломанных криптопроектов умирают по вине разработчиков. Как это происходит?
80 процентов взломанных криптопроектов умирают по вине разработчиков. Как это происходит?
Теперь вас будут просить установить мессенджер MAX и на работе. Что изменится с новым законом
Теперь вас будут просить установить мессенджер MAX и на работе. Что изменится с новым законом