DeepMind и Google: битва за контроль над искусственным интеллектом

Илья Хель

Однажды вечером в августе 2010 года в конференц-зале на берегу залива Сан-Франциско на сцену вышел 34-летний лондонец по имени Демис Хассабис. Поднявшись на подиум наигранной походкой человека, пытающегося контролировать свои нервы, он сжал свои губы в непродолжительной улыбке и заговорил: «Что ж, сегодня я хочу поговорить о различных подходах к созданию…». Он остановился, словно осознавая, насколько громко заявляет о своих амбициях. И произнес это: «AGI».

DeepMind и Google: битва за контроль над искусственным интеллектом. Карикатура на Демиса Хассабиса. Фото.

Карикатура на Демиса Хассабиса

Контроль над искусственным инnеллектом

ОИИ (AGI) означает общий искусственный интеллект, гипотетическую компьютерную программу, которая может выполнять интеллектуальные задачи так же хорошо, как и человек, или даже лучше. ОИИ сможет выполнять отдельные задачи — вроде распознавания людей на фото или перевода языков, которые в настоящее время способны выполнять множества отдельных искусственных интеллектов в наших телефонах и компьютеров. Они смогут одновременно поддерживать беседу, играть в шахматы и говорить по-французски. Они смогут разбираться в трудах по физике, писать романы, разрабатывать инвестиционные стратегии и поддерживать непринужденную беседу с незнакомцами. Они будут следить за ядерными реакциями, управлять сетями энергоснабжения и транспортным потоком, и без особых усилий добиваться успеха во всем остальном. ОИИ сделает самые современные ИИ сегодня похожими на карманные калькуляторы.

Единственный интеллект, способный в настоящее время выполнять все эти задачи, принадлежит человеку. Но человеческий разум ограничен размером черепа, в котором находится мозг. Его мощность ограничена ничтожным количеством энергии, которую может обеспечить организм. Поскольку ОИИ будет работать на компьютерах, он не будет страдать от подобных ограничений. Его интеллект будет ограничен только количеством доступных процессоров. ОИИ может начать с мониторинга ядерных реакций. Но достаточно скоро он обнаружит новые источники энергии, переваривая больше работы по физике в секунду, чем способен человек за тысячу лет. Интеллект человеческого уровня, заручившийся скоростью и масштабируемостью компьютеров, избавит нас от проблем. Хассабис заявил английской газете Observer, что ожидает от ОИИ решения, среди прочих дисциплин, таких проблем, как «рак, изменение климата, энергия, геномика, макроэкономика и финансовые системы».

Конференция, на которой выступал Хассабис, называлась Singularity Summit. Сингулярность — первая часть названия — относится к наиболее вероятному последствию появления ОИИ, по мнению футурологов. Поскольку ОИИ будет обрабатывать информацию с высокой скоростью, он очень быстро станет очень умным. Быстрые циклы самосовершенствования приведут к взрыву машинного интеллекта, в результате чего люди останутся нюхать кремниевую пыль. Поскольку это будущее основано исключительно на непроверенных предположениях, почти религиозно предполагают, что сингулярность окажется либо утопией, либо адом.

Судя по названиям выступлений, участники конференции больше верили в первый исход: «Разум и как его построить», «ИИ против старения», «Заменяя наши тела», «Модифицируя границу между жизнью и смертью». Речь Хассабиса, напротив, казалась скучноватой: «Системный нейронаучный подход к созданию ОИИ».

Хассабис шагал между подиумом и экраном, говоря скороговоркой. Он был одет в бордовый джемпер и белую рубашку на пуговицах, как школьник. Его небольшой рост, казалось, только подчеркивал его интеллект. До сих пор, объяснял Хассабис, ученые подходили к ОИИ с двух сторон. Один из подходов, известный как символьный ИИ, пытался описать и запрограммировать все правила, необходимые для системы, которая могла бы мыслить подобно человеку. Этот подход был популярен в 1980-х и 1990-х годах, но не дал желаемых результатов. Хассабис считал, что ментальная архитектура мозга слишком тонка, чтобы описывать ее таким образом.

Другой подход собрал ученых, пытающихся воспроизвести физические сети мозга в цифровой форме. Это имело определенный смысл. В конце концов, мозг это ложе человеческого интеллекта. Но эти исследователи также двигались неверным путем, рассказал Хассабис. Их задача была сродни созданию карты всех звезд во Вселенной. Если глубже, они сосредоточились не на том уровне функционирования мозга. Это было все равно что пытаться понять, как работает Microsoft Excel, взламывая компьютер и изучая взаимодействие транзисторов.

Вместо этого Хассабис предложил золотую середину: ОИИ должен черпать вдохновение из широких методов, с помощью которых мозг обрабатывает информацию, а не из физических систем или конкретных правил, которые он применяет в конкретных ситуациях. Другими словами, он должен сосредоточиться на понимании программного обеспечения мозга, а не его аппаратного обеспечения. Новые методы, такие как функциональная магнитно-резонансная томография (фМРТ), которые позволили заглянуть внутрь мозга во время его работы, намекнули, что такое понимание возможно. Последние исследования, сказал Хассабис, показывают, что мозг обучается, воспроизводя пережитое во время сна, чтобы выявить общие принципы. Исследователи ИИ должны подражать такой системе.

В правом нижнем углу открывающего слайда красуется логотип в виде круглого синего вихря. Два слова, стоящие рядом, напечатаны снизу: DeepMind. Это был первый раз, когда компания упоминалась публично. Хассабис битый год пытался получить приглашение на Singularity Summit. Лекция была его прикрытием. На самом же деле ему нужна была одна минута с Питером Тилем, миллиардером из Кремниевой долины, который финансировал конференцию. Хассабис хотел инвестиций Тиля.

Хассабис никогда не говорил о том, почему ему нужна была поддержка именно Тиля. Но Тиль верил в ОИИ еще больше, чем Хассабис. Выступая на Singularity Summit в 2009 году Тиль сказал, что его самым большим страхом перед будущим было не восстание роботов. Он больше беспокоился о том, что сингулярность наступит нескоро. Мир нуждался в новых технологиях, чтобы предотвратить экономический спад.

DeepMind в итоге собрал 2 миллиона фунтов стерлингов, из которых 1,4 миллиона были Тиля. Когда Google купила компанию в январе 2014 года за 600 миллионов долларов, Тиль и другие первые инвесторы получили прибыль в размере 5000% от своих инвестиций.

Для многих основателей это был бы счастливый конец. Можно было бы отдохнуть, сделать шаг назад, провести время наедине с деньгами. Для Хассабиса же приобретение Google было лишь очередным шагом в его стремлении к ОИИ. Он провел большую часть 2013 года, договариваясь об условиях сделки. DeepMind должна была работать отдельно от своего владельца. Она должна была получить плюсы от владения Google, такие как доступ к денежным потокам и вычислительной мощности, не потеряв контроль.

Хассабис думал, что DeepMind сможет стать гибридом: у него будет двигатель стартапа, мозги величайших университетов и глубокие карманы одной из самых дорогостоящих компаний мира. Каждый ингредиент был на месте, чтобы ускорить прибытие ОИИ и устранить причины человеческих страданий.

Кто такой Демис Хассабис?

Демис Хассабис родился на севере Лондона в 1976 году в семье грека-киприота и китаянки с сингапурской кровью. Он был старшим из трех братьев и сестер. Мать работала в британском универмаге John Lewis, а отец управлял магазином игрушек. Сам Хассабис занялся шахматами в возрасте четырех лет, наблюдая за игрой отца и дяди. Через несколько недель он уже обыгрывал взрослых. К 13 годам он стал вторым в мире лучшим шахматистом в своем возрасте. В восемь лет научился программировать на простеньком компьютере.

Высшее образование Хассабис получил в 1992 году, на два года раньше запланированного срока. Получил работу программиста видеоигр в Bullfrog Productions. Хассабис написал Theme Park, в котором игроки создавали и управляли виртуальным парком развлечений. Игра имела большой успех и была продана тиражом 15 миллионов копий, создав целый жанр игр-симуляторов, цель в которых была не одолеть противника, а оптимизировать функционирование огромной сложной системы, такой как бизнес или город.

Кто такой Демис Хассабис? Кадр из научно-фантастического фильма 2014 года “Из машины”. Фото.

Кадр из научно-фантастического фильма 2014 года “Из машины”

Помимо создания игр, Демис прекрасно в них играл. Будучи подростком, он бегал между этажами на соревнования по настольным играм, одновременно соревнуясь в поединках в шахматы, скрэббл, покер и нарды. В 1995 году, изучая информатику в Кембриджском университете, Хассабис поучаствовал в студенческом турнире по го. Го — древняя настольная стратегическая игра, которая значительно сложнее шахмат. Мастерство должно требовать интуиции, приобретенной многолетним опытом. Никто не знал, играл ли Хассабис вообще в го прежде.

Сперва Хассабис выиграл турнир для начинающих. Затем он одолел победителя опытных игроков, хотя и с гандикапом. Чарльз Мэтьюз, мастер кембриджского го, проводивший турнир, вспоминает шок от того, как опытного игрока уничтожил 19-летний новичок. Мэтьюз взял Хассабиса под свое крыло.

Интеллект и амбиции Хассабиса всегда проявлялись в играх. Игры, в свою очередь, разожгли его увлеченность интеллектом. Наблюдая за своим развитием в шахматах, он задавался вопросом, можно ли запрограммировать компьютеры учиться так же, как это делал он, накапливая опыт. Игры предлагали среду обучения, которой не соответствовал реальный мир. Они были строгими и закрытыми. Поскольку игры отделены от реального мира, их можно практиковать без помех и эффективно осваивать. Игры ускоряют время: игроки создают преступный синдикат за несколько дней и сражаются на Сомме несколько минут.

Летом 1997 года Хассабис отправился в Японию. В мае того года компьютер Deep Blue, принадлежащий IBM, одолел Гарри Каспарова, чемпиона мира по шахматам. Впервые компьютер победил гроссмейстера. Матч привлек внимание всего мира и вызвал обеспокоенность по поводу растущей мощности и потенциальной угрозы компьютеров. Когда Хассабис встретился с Масахико Фуцзувэра, японским мастером настольных игр, он рассказал о планах, в которых сочетались его интересы к стратегическим играм и искусственному интеллекту: однажды он разработает компьютерную программу, чтобы победить величайшего игрока в го.

Хассабис подходил к своей карьере методично. «В возрасте 20 лет Хассабис считал, что определенные вещи должны уже быть на своих местах, прежде чем искусственный интеллект сможет перейти на необходимый ему уровень», говорит Мэтьюз. «У него был план».

В 1998 году он основал собственную игровую студию под названием Elixir. Хассабис сосредоточился на одной чрезвычайно амбициозной игре Republic: The Revolution, сложной политической симуляции. За несколько до этого, еще учась в школе, Хассабис сказал своему другу Мустафе Сулейману, что миру нужны грандиозные симуляции, чтобы смоделировать его сложную динамику и решить самые сложные социальные проблемы. Теперь он попытался сделать это в игре.

Облечь его стремления в код было сложнее, чем ожидалось. Elixir в итоге выпустила урезанную версию игры, чтобы получить теплые отзывы. Другие игры провалились. В апреле 2005 года Хассабис закрыл Elixir. Мэтьюз считает, что Хассабис основал компанию просто для того, чтобы получить управленческий опыт. Теперь Хассабису не хватало только одной важной области знаний, прежде чем он мог начать свой квест в поиске ОИИ. Он должен был понять человеческий мозг.

В 2005 году Хассабис получил докторскую степень по нейронауке в Университетском колледже Лондона. Он опубликовал весьма влиятельное исследование памяти и воображения. Одна из работ, которая с тех пор цитировалась более 1000 раз, показала, что людям с амнезией также трудно представить новый опыт, что предполагает наличие связи между запоминанием и созданием мысленных образов. Хассабис выстраивал понимание мозга, необходимое для овладение ОИИ. Большая часть его работ сводилась к одному вопросу: как человеческий мозг получает и сохраняет концепции и знания?

Хассабис официально учредил DeepMind 15 ноября 2010 года. Миссия компании была заявлена такой же, как и сейчас: «решить интеллект», а затем использовать это для решения всего остального. Как сказал Хассабис участникам Singularity Summit, это означает перевод нашего понимания того, как мозг выполняет задачи, в программное обеспечение, которое сможет использовать те же методы для обучения.

Хассабис ни в коем случае не утверждает, что наука полностью постигла человеческий разум. План по реализации ОИИ было невозможно извлечь из сотен исследований в области нейробиологии. Но он явно верит, что начать работу над ОИИ в той манере, которая ему импонирует, вполне возможно. Однако также возможно и то, что его уверенность превосходит реальность. Мы пока очень мало знаем наверняка о том, как на самом деле функционирует мозг. В 2018 году команда австралийских исследователей поставила под сомнение выводы самого доктора наук Хассабиса. Конечно, это всего лишь один документ, но он показывает, что наука, лежащая в основе работы DeepMind, далеко не доказанная.

Сулейман и Шейн Легг, одержимый ОИИ новозеландец, которого Хассабис также встретил в университете, присоединились как соучредители. Репутация компании быстро росла. Хассабис расцветал. «Он притягивает, как магнит», говорит Бен Фолкнер, бывший руководитель Deep Mind. Многие новобранцы прибыли из Европы. Возможно, величайшим достижением DeepMind было ранний активный наем талантливых людей и удержание самых ярких и лучших из них.

Одна из техник машинного обучения, на которой сосредоточилась компания, выросла из двойного увлечения Хассабиса играми и нейронаукой: обучение с подкреплением. Такая программа построена так, чтобы собирать информацию об окружающей среде, а затем извлекать уроки из нее, многократно воспроизводя  свой опыт — точно так же, как Хассабис описывал активность мозга во время сна в своей лекции на Singularity Summit.

Обучение с подкреплением начинается с чистого листа. Программе показывается виртуальная среда, о которой она ничего не знает, кроме правил, вроде игрового симулятора шахмат или видеоигры. Программа содержит по крайней мере один компонент, известный как нейронная сеть. Она состоит из слоев вычислительных структур, которые просеивают информацию, чтобы идентифицировать определенные особенности или стратегии. Каждый слой исследует среду на своем уровне абстракции. Сперва эти сети имеют минимальный успех, но их ошибки — и это важно — также в них кодируются. Постепенно они становятся все умнее и умнее, экспериментируя с различными стратегиями и получая награду в случае успеха. Если программа перемещает шахматную фигуру и в результате проигрывает игру, больше такой ошибки она не допустит. Большая часть магии искусственного интеллекта заключается в скорости, с которой он повторяет эти задачи.

Работа DeepMind достигла своего апогея в 2016 году, когда команда разработала программу искусственного интеллекта, в которой использовалось обучение с подкреплением наряду с другими методами игры в го. Программа под названием AlphaGo вызвала удивление после того, как обыграла чемпиона мира в матче с пятью играми в Сеуле в 2016 году. Победа машины, которую наблюдали 280 миллионов человек, случилась на десять лет раньше, чем предсказывали машины. В следующем году улучшенная версия AlphaGo победила чемпиона Китая по го.

Кто такой Демис Хассабис? ИИ может многое, а не только то, на что нам хватает фантазии. Фото.

ИИ может многое, а не только то, на что нам хватает фантазии.

Как и Deep Blue в 1997 году, AlphaGo изменил восприятие человеческих достижений. Чемпионы среди людей, блестящие умы планеты, больше не стояли на вершине интеллектуальной пирамиды. Спустя почти 20 лет после того, как Хассабис заявил о своих амбициях Фудзувере, он их исполнил. Хассабис сказал, что этот матч довел его до слез. Он остался благодарен Мэтьюзу.

DeepBlue победил благодаря грубой силе и скорости вычислений, но стиль AlphaGo казался художественным, почти человеческим. Его изощество и изощренность, превосходство вычислительной силы, казалось, показывали, что DeepMind опередил конкурентов в создании программы, которая сможет исцелять болезни и управлять городами.

DeepMind и искусственный интеллект

Хассабис всегда говорил, что DeepMind изменит мир к лучшему. Но в ОИИ нет никакой уверенности. Если он когда-нибудь появится, мы не знаем, будет это к лучшему или худшему, будет ли он подчиняться человеческому контролю. Если и будет, кто будет держать бразды?

С самого начала Хассабис пытался защитить независимость DeepMind. Он всегда настаивал на том, чтобы DeepMind осталась в Лондоне. Когда Google купил компанию в 2014 году, вопрос о контроле стал более актуальным. Хассабису не нужно было продавать DeepMind Google. Наличности хватало, и он набросал бизнес-модель, в рамках которой компания будет разрабатывать игры для финансирования исследований. Денег в Google обещали много, но он не хотел передавать компанию, которую он вырастил. В рамках сделки DeepMind создала соглашение, которое не позволило бы Google в одностороннем порядке взять под контроль интеллектуальную собственность компании. В год, предшествующий приобретению, по словам источникам, обе стороны подписали договор — Соглашение о соблюдении этики и безопасности. Это соглашение было составлено старшими адвокатами в Лондоне.

Соглашение передает контроль над основной технологий ОИИ DeepMind, если она будет создана, в руки управляющего Совета по этике. По словам того же источника, Совет по этике отнюдь не является косметической уступкой со стороны Google, а обеспечивает надежную юридическую поддержку DeepMind для сохранения контроль над его самой ценной и потенциально самой опасной технологией. Имена членов комиссии не были обнародованы, но другой источник, близкий и к DeepMind, и к Google, сообщил, что все трое основателей DeepMind входят в Совет. Сама компания ничего не раскрывает.

Хассабис может определить судьбу DeepMind и другими методами. Один из них — преданность. Сотрудники, как бывшие, так и нынешние, говорят, что исследовательская программа Хассабиса является одной из самых сильных сторон DeepMind. Его программа, которая предлагает увлекательную и важную работу без давления со стороны научных кругов, привлекла сотни самых талантливых экспертов мира. У DeepMind есть дочерние офисы в Париже и Альберте. Многие сотрудники чувствуют большую связь с Хассабисом и его миссией, чем с его корпоративным родителем, которому нужны только доходы. Пока Хассабис сохраняет личную преданность, он обладает значительной властью над своим единственным акционером. Лучше пусть таланты работают на DeepMind удаленно, чем окажутся в Facebook или Apple.

У DeepMind есть еще один источник рычагов, хотя он требует постоянного пополнения: благоприятный ореол. Компания в этом преуспела. AlphaGo был отличной рекламой. После приобретения Google, компания неоднократно производила чудеса, которые привлекали внимание всего мира. Один из примеров программного обеспечения может обнаружить паттерны при сканировании глаза, которые являются индикаторами дегенерации желтого пятна. Другая программа научилась играть в шахматы с нуля, используя архитектуру, сходную с AlphaGo, и стала величайшим игроком всех времен всего через девять часов игры с самой собой. В декабре 2018 года программа AlphaFold оказалась более точной, чем конкуренты, в прогнозировании трехмерной структуры белков из списка составляющих, потенциально способных лечить такие болезни, как Паркинсона и Альцгеймера.

DeepMind особенно гордится разработанными алгоритмами, которые рассчитывают наиболее эффективные средства охлаждения центров обработки данных Google, которые содержат примерно 2,5 миллиона компьютерных серверов. В 2016 году DeepMind заявила, что сократила расходы Google на электроэнергию на 40%. Но некоторые инсайдеры говорят, что это хвастовство преувеличено. Google использовала алгоритмы для оптимизации своих дата-центров задолго до появления DeepMind. Есть мнение, что DeepMind завышает свои заслуги, чтобы приобрести ценность в глазах Alphabet. Родительская компания Google Alphabet платит DeepMind за подобные услуги. В 2017 году последняя выставила Alphabet счет на 54 миллиона фунтов стерлингов. Эти цифры меркнут по сравнению с накладными расходами DeepMind. В том же году она потратила 200 миллионов фунтов на персонал. В целом, в 2017 году DeepMind потеряла 282 миллионов фунтов.

Это копейки для богатого гиганта. Но другие дочерние компании Alphabet привлекли внимание Рут Порат, скупого финансового директора Alphabet. Google Fiber, попытка построить провайдера интернет-услуг, была поставлена на паузу после того, как стало ясно, что инвестиции будут окупаться десятилетиями. Исследователи ИИ также задаются вопросом, «запоратят» ли DeepMind.

Постепенное раскрытие достижений DeepMind в области ИИ является частью стратегии, постепенно выстраивающей репутацию компании. Это особенно ценно в то время, когда Google обвиняют в нарушении конфиденциальности пользователей и распространении фейковых новостей. DeepMind также повезло заполучить сторонника на самом высоком уровне: Ларри Пейдж, один из двух основателей Google, ныне исполнительный директор Alphabet. Пейдж очень близок к Хассабису. Отец Пейджа — Карл — изучал нейросети в 1960-х годах. В начале своей карьеры Пейдж сказал, что создал Google исключительно для того, чтобы основать компанию ИИ.

Тщательный контроль DeepMind над прессой не соответствует академическому духу, который пронизывает компанию. Некоторые ученые жалуются, что им трудно опубликовать свою работу: им приходится преодолевать слои внутреннего одобрения, прежде чем они смогут даже подать работу на конференцию или в журнал. DeepMind считает, что необходимо действовать осторожно, чтобы не напугать публику перспективой ОИИ. Но слишком жесткие обвинения могут испортить академическую атмосферу и ослабить лояльность сотрудников.

DeepMind и искусственный интеллект. Возможно, DeepMind можно назвать главной задачей Google. Фото.

Возможно, DeepMind можно назвать главной задачей Google.

Спустя пять лет после приобретения Google вопрос о том, кто контролирует DeepMind, становится критическим. Основатели и первые сотрудники компании приближаются к тому порогу, когда они могут уйти с финансовой компенсацией, которую они получили от покупки компании (акции Хассабиса, вероятно, стоят порядка 100 миллионов фунтов). Но источник, близкий к компании, предполагает, что Alphabet отодвинула выплаты учредителям на несколько лет. Учитывая свой неустанный фокус, Хассабис вряд ли спрыгнет с корабля. Он интересуется деньгами лишь постольку, поскольку они помогают ему в приближении цели всей своей жизни. Но некоторые коллеги ушли. Три инженера ИИ покинули компанию с начала 2019 года. Бен Лори, один из самых выдающихся инженеров безопасности в мире, вернулся в Google. Это, конечно, не так много, но DeepMind предлагает такую удивительную миссию и достойную оплату, что уходить никто и не должен.

Пока что Google не сильно мешал DeepMind. Но одно недавнее событие вызвало обеспокоенность по поводу того, как долго компания сможет поддерживать свою независимость.

DeepMind, медицина и искусственный интеллект

DeepMind всегда планировала использовать ИИ для улучшения здравоохранения. В феврале 2016 года было создано новое подразделение DeepMind Health во главе с Мустафой Сулейманом, одним из соучредителей компании. Сулейман, чья мать работала медсестрой, надеялся создать программу под названием Streams, которая предупреждала бы врачей об ухудшении здоровья пациента. DeepMind получала бы вознаграждение в зависимости от показателей. Поскольку эта работа требовала доступа к конфиденциальной информации о пациентах, Сулейман создал Независимую экспертную комиссию (IRP), в которую попали хорошие английские специалисты в области здравоохранения и технологий. DeepMind была достаточно мудрой, чтобы осторожничать. Впоследствии британский информационный комиссар обнаружил, что один из партнеров среди больниц нарушил закон при обработке данных пациентов. Тем не менее, к концу 2017 года Сулейман подписал соглашения с четырьмя крупными больницами.

8 ноября 2018 года Google сообщила о создании собственного подразделения здравоохранения — Google Health. Спустя пять дней объявили, что DeepMind Health должна присоединиться к усилиям материнской компании. DeepMind никто не предупреждал. Согласно информации, полученной из запросов о свободе информации, она уведомила об изменении больницы-партнеры только за три дня. DeepMind отказалась сообщать, когда начались дискуссии о слиянии, однако сказала, что короткий промежуток между уведомлением и публичным объявлением отвечает интересам прозрачности. В 2016 году Сулейман написал, что «данные пациента никогда не будут связаны с учетными записями, продуктами или услугами Google». Его обещание, казалось, было нарушено.

Аннексия Google разозлила сотрудников DeepMind Health. По словам людей, близких к команде здравоохранения, все больше сотрудников планируют покинуть компанию после завершения процесса поглощения.

Этот эпизод показывает, что периферийные части работы DeepMind уязвимы для Google. DeepMind заявила, что «мы все согласились с тем, что имеет смысл объединить эти усилия в одном совместном усилии с увеличенными ресурсами». Это вызывает вопрос о том, будет ли Google применять ту же логику к работе DeepMind над ОИИ.

Если смотреть масштабно, DeepMind добилась больших успехов. Она уже создала программное обеспечение, которое может учиться выполнять задачи на сверхчеловеческом уровне. Хассабис часто ссылается на Breakout, видеоигру для консоли Atari. Игрок контролирует летучую мышь, которая может двигаться горизонтально и с ее помощью отбивает мячи, направляя их в блоки выше, которые уничтожаются при столкновении. Игрок побеждает, когда все блоки уничтожены. Проигрывает, если мячик падает мимо платформы. Без человеческих инструкций программа DeepMind не только научилась играть в эту игру, но и забрасывать мячи в пространство за блоками, чтобы использовать преимущество отскоков. Это демонстрирует силу обучения с подкреплением и сверхъестественные способности компьютерных программ DeepMind.

Демонстрация, конечно, впечатляет. Но Хассабис кое-что умалчивает. Если виртуальную платформу поднять хоть ненамного выше, программа допустит ошибку. Навык, которым обзавелась программа DeepMind, настолько ограничен, что она не может реагировать даже на крошечные изменения в окружающей среде, которые человек мог бы с легкостью одолеть. Но в мире есть много тонкостей. Для диагностического интеллекта не существует двух одинаковых органов тела. Для механического интеллекта два похожих двигателя никогда не будут одинаковыми в настройке. Поэтому выпуск программ в дикую природу сопряжен с трудностями.

Второе, о чем редко говорит DeepMind, заключается в том, что успех в виртуальных средах зависит от наличия функции вознаграждения: сигнала, который позволяет программному обеспечению измерять свой прогресс. Программа узнает, что рикошетирование от задней стены увеличивает ее счет. Большая часть работы DeepMind с AlphaGo заключалась в создании функции вознаграждения, совместимой с такой сложной игрой. К сожалению, реальный мир не предлагает простых наград. Прогресс редко измеряется отдельными баллами. Мозг человека получает сигнал об успехе задачи прямо в процессе ее выполнения, а не после.

DeepMind, медицина и искусственный интеллект. DeepMinв умеет играть в StarCraft 2. Фото.

DeepMinв умеет играть в StarCraft 2

DeepMind нашла способ обойти это, используя огромное количество вычислительной мощности. AlphaGo играет в игры тысячи лет человеческого времени, чтобы чему-либо научиться. Многие философы ИИ подозревают, что это решение неприемлемо для задач, которые предлагают более слабое вознаграждение. DeepMind признает существование таких неясностей. Недавно она занялась StarCraft 2, компьютерной стратегией. Решения, принятые в начале игры, имеют последствия, которые проявляются позже, что вполне свойственно извилистой и запоздалой обратной связи реальных задач. В январе программное обеспечение DeepMind обыграло несколько лучших игроков мира, и это было весьма впечатляюще, несмотря на жесткие ограничения. Программы также начали изучать функции вознаграждения, следуя отзывам людей. Но включение человеческих инструкций в цикл создает риск потери масштаба и скорости.

Как нынешние, так и бывшие исследователи из DeepMind и Google на условиях анонимности выразили скепсис в том, что DeepMind сможет добиться ОИИ с помощью таких методов. Для них стремление достичь высокой производительности в смоделированных средах затрудняет решение проблемы функции вознаграждения. И все же именно этот подход лежит в основе DeepMind. В компании есть внутренняя конкуренция, когда программы конкурирующих команд борются за превосходство.

Хассабис всегда видел жизнь как игру. Большая часть его карьеры была посвящена их созданию, большая часть его свободного времени была потрачена на процесс игры в них. В DeepMind он использует их для разработки сильного искусственного интеллекта. Как и его программное обеспечение, Хассабис обучается на собственном опыте. Погоня за ОИИ может в конечном итоге привести в тупик, попутно изобретая полезные медицинские технологии и одолевая лучших в своем мастерстве игроков. Но он также может создать ОИИ прямо под носом у Google, но вне его контроля. И если ему это удастся сделать, Демис Хассабис выиграет в самой сложной игре из всех.

Обсудить статью можно в нашем чате в Телеграме.

По материалам 1843magazine, Хал Ходсон