#чтиво | Создатели Siri изобретают искусственный интеллект заново

Илья Хель

Когда 4 октября 2011 года Apple представила свой iPhone 4s, основной ажиотаж был не вокруг шустрого чипа A5 или улучшенной камеры. Внимание было приковано к необычной новой функции: интеллектуальному помощнику под названием Siri. На первый взгляд, Siri, наделенная женским голосом, казалась почти человеком — она понимала, что вы говорите, и могла отвечать. Хорошо выполняла некоторые просьбы вроде вызова определенных людей или установки будильника. И у нее была индивидуальность, чувство юмора и остроумные шуточки.

Viv Labs

В течение нескольких следующих месяцев, однако, ограничения Siri стали очевидными. Она крайне несамостоятельна. Попросите ее запланировать полет — и она отправит вас на сайты туристических агентств. Попросите ее купить новую книгу — и она предоставит бланк, несмотря на то что книгу продает Apple. Конечно, с 2011 года полномочия Siri были существенно расширены, но… осадочек остался.

Теперь небольшая команда инженеров загадочного стартапа Viv Labs утверждает, что находится на пороге реализации передовых форм искусственного интеллекта, которые убирают эти ограничения. В то время как Siri может выполнять задачи, внедренные инженерами Apple, новая программа Viv сможет обучаться, приобретая практически безграничные возможности. Со временем, говорят они, их создание будет способно использовать ваши личные предпочтения и почти бесконечную паутину связей, чтобы отвечать любому запросу и выполнять практически любое требование.

«Siri — это первая глава в длинной и большой истории», — говорит Даг Киттлаус, один из соучредителей Viv. Он-то уж точно знает. До того как работать над Viv, он помогал создать Siri. Вместе с Адамом Чейером и Крисом Брайхемом.

В течение последних двух лет команда работает над продуктом Viv Labs, который называется Viv и уходит корнями в латинский корень, означающий «жизнь». Их проект был засекречен, но некоторые свидетели, которым удалось познакомиться с ним, говорят о нем в восторженных тонах.

«Планы грандиозные, — говорит Орен Этциони, эксперт, возглавляющий Институт искусственного интеллекта им. Аллена. — Если у команды получится, она приведет нас в будущее разумных агентов и многомиллиардной индустрии».

Viv — не единственная компания, конкурирующая за долю этих миллиардов. Поле искусственного интеллекта стало ареной неистовой гонки корпоративных вооружений, интернет-гиганты раскупают стартапы искусственного интеллекта и таланты. Не так давно Google выложила 500 миллионов долларов за британскую компанию DeepMind и наняла таких мэтров области искусственного интеллекта, как Джеффри Хинтон и Рэй Курцвейл. У Facebook есть своя мощная команда под руководством Яна Лекана из Нью-Йоркского университета. Их цель заключается в создании нового поколения искусственного интеллекта, которое сможет обрабатывать большие объемы данных для прогнозирования и выполнения наших желаний.

Viv стремится быть первым интеллектуальным помощником, который сможет достигнуть этого. Создатели планируют сделать из нее невероятно умный и бесконечно гибкий, но вездесущий интеллект. Создатели Viv надеются, что однажды она будет встроена в многочисленные, подключенные к Интернету, повседневные объекты. Они полагают, что доступ к искусственному интеллекту должен быть таким же, как к электроэнергии. Говоря проще, вы будете подключаться к некоему «глобальному мозгу». И этот мозг будет питать миллион разных приложений и устройств.

«Я очень горжусь Siri и влиянием, которое она оказала на мир, но во многих отношениях оно могло быть больше, — говорит Чейер. — Теперь я хочу сделать нечто большее, чем мобильное, пользовательское, десктопное или коммерческое. Я хочу сделать нечто, что может кардинально изменить создание программного обеспечения».

Лаборатория Viv скрыта за безымянной дверью посреди офисного здания в центре города Сан-Хосе. Посетители заходят в небольшую прихожую и проходят мимо бильярдного стола, чтобы добраться до единственного конференц-зала и бросить взгляд на горстку инженеров, глядящих в таблицы на мониторах. Оказавшись в зале для заседаний, Киттлаус — один из основных вдохновителей продукта — немного приоткрывает завесу тайны над своим детищем.

Он признает, что существует масса систем с голосовой навигацией. В дополнение к Siri есть Google Now, которая может предвосхитить некоторые из ваших потребностей, предупредив, например, что вам нужно выходить в аэропорт на 15 минут раньше из-за пробок. Microsoft, которая десятилетиями применяет методы машинного обучения, недавно тоже представила похожую на Siri программу под названием Cortana. Amazon использует голосовые технологии в продукте Fire TV.

Киттлаус указывает, что все эти услуги довольно ограниченны. Чейер уточняет:

«Google Now обладает огромным полем знаний — вы можете задать вопрос типа «Где родился Авраам Линкольн?» — и получите ответ. Вы можете спросить «Сколько людей там живет?» и снова получите ответ. Но вы не можете спросить «Каково население города, в котором родился Авраам Линкольн?». В системе есть данные по этим двум запросам, но она не может их объединить. Как и Siri, она не может делать ничего, на что ее не запрограммировали кодеры».

Viv обходит эти ограничения путем создания собственного кода на лету и не требует вмешательства программистов. Взять, например, запрос «Найди мне подходящий рейс в Даллас с сиденьем, в котором поместился бы Шакил О’Нил» (баскетболист). Viv разберет фразу и исполнит свой лучший трюк: автоматически сгенерирует быструю и эффективную программу для связи сторонних источников информации, определив массу рейсов с большим количеством места для ног. И все это в доли секунды.

Viv Labs

Viv — открытая система, что позволит бесчисленным применениям и компаниям стать частью ее безграничного мозга. Технические барьеры минимальны, требуют краткого «обучения» (в некоторых случаях — минуты), чтобы Viv могла понимать жаргон конкретной тематики. По мере роста знаний Viv будет расти и ее доходчивость. Создатели проектировали систему на трех принципах, которые сами называют «столпами»: ее будет обучать мир, она будет знать больше, чем ее учат, и она будет учить что-нибудь ежедневно. Как и с другими продуктами в сфере искусственного интеллекта, это обучение включает хитроумные алгоритмы, которые интерпретируют язык и поведение людей, использующих систему. Чем больше людей ее использует, тем умнее она становится. Зная, кто ее пользователи и с какими сервисами они работают, Viv сможет разбираться в этих массивах данных и искать новые способы связи и управления информацией.

Киттлаус говорит, что в конечном итоге родится цифровой ассистент, который знает, что вы хотите, прежде чем вы спросите. Он сможет предвидеть, что кто-то будет неуверенно держать телефон у своего рта, будучи пьяным в баре в 2 утра и говорить «Я пьян». Без каких-либо вопросов, Viv просто свяжется с диспетчером такси, назовет адрес вызова и отвезет пьяного хозяина домой. Все.

Если Киттлаус в некотором роде — Стив Джобс для Viv (он единственный не инженер из 10 членов команды, но отвечает за стратегию и маркетинг), Чейер — это Стив Возняк для компании, ключевой мозг. Но в отличие от капризного создателя Apple II, Чейер агрессивно анализирует каждый аспект своей жизни даже за пределами рабочего места. Будучи ребенком, он собирал кубик Рубика за 26 секунд (и был чемпионом в этом деле). В программирование тоже нырнул с головой.

Он говорит, что использовал особую технику мышления в своих ранних работах, включая самую важную — в SRI International. Именно там в начале 2000-х годов, когда Чейер возглавлял корпус инженеров по созданию искусственного интеллекта при поддержке DARPA, «человекоподобную систему, которая может чувствовать мир, понимать его, осмысливать его, планировать, общаться и действовать». Команда SRI создала нечто под названием «когнитивный ассистент, который учится и организуется», или CALO. Они установили весьма высокую планку для искусственного интеллекта, не в последнюю очередь из-за способности системы понимать естественную речь. Но поскольку пятилетняя программа свернулась, не совсем понятно было, что делать дальше.

Потом появился Киттлаус, который оставил свою работу в Motorola и был в SRI на правах приглашенного предпринимателя. Когда он увидел прототип CALO, он сказал Чейеру, что из этого определенно можно слепить бизнес, поскольку система будет идеальным дополнением к недавно выпущенному iPhone. В 2007 году, с благословения SRI, они лицензировали технологию для стартапа, взяли третьего соучредителя, эксперта в области искусственного интеллекта по имени Том Грубер, и переименовали систему в Siri.

Небольшая команда, которая выросла и пригласила Криса Брайхема, инженера, который впечатлил Чейера в CALO, переехала в Сан-Хосе и работала в течение двух лет.

«Одной из самых трудных частей было понимание естественного языка», — считает Чейер. В конечном счете у них появилось приложение для iPhone, которое могло выполнять ряд интересных задач — вызывать такси, заказывать столики, билеты в кино и поддерживать живую беседу. Публично оно вышло в феврале 2010 года. Три недели спустя позвонил Стив Джобс. Он хотел купить компанию.

«Я был потрясен тем, как хорошо он знал наше приложение», — говорит Чейер. Сначала они отказались продавать компанию, но Джобс настоял. Его основным аргументом было то, что компания Apple сможет показать Siri гораздо более широкой аудитории, нежели мог их стартап. Он пообещал сделать Siri ключевым элементом iPhone. Apple купила компанию в апреле 2010 года за 200 миллионов долларов.

Основная команда Siri пришла в Apple вместе с проектом. Но когда Siri отточили в продукт, который миллионы использовали на нескольких языках, у некоторых членов первоначальной команды возникли проблемы с руководством, которое менее почтительно относилось к их мнению, нежели Джобс. Киттлаус ушел из Apple через день после запуска — в день, когда умер Стив Джобс. Чейер ушел несколько месяцев спустя.

Siri

«Думаю, если бы Стив был жив, я был бы еще в Apple», — говорит Чейер. Грубер, третий соучредитель Siri, остался в Apple.

Спустя несколько месяцев Киттлаус снова связался с Чейером и Брайхемом. Они спросили друг у друга, что думают по поводу того, как мир должен выглядеть через пять лет. Когда они расписали идеи на меловой доске в доме Киттлауса, Брайхем предложил сделать программу, которая воплотит знакомые им вещи по-новому. По мере того как продолжались разговоры, возникла идея искусственного интеллекта на базе облака, глобального мозга.

«Единственный способ сделать вездесущий общительный ассистент — открыть его третьим лицам, чтобы каждый мог внести свою лепту в его создание», — говорит Брайхем.

Оглядываясь назад, они заново создавали Siri, как если бы Apple никогда ее не купила. До продажи у Siri были партнерства с примерно 45 сервисами; Apple сократила их до десятка.

«Siri в 2014 году способна на меньшее, чем в 2010», — говорит Гэри Моргенталер, один из спонсоров оригинального приложения.

Чейер и Брайхем общались с разными экспертами в области искусственного интеллекта, приглашая их подключиться к их небольшой группе. Для создания сложнейших частей архитектуры — которые позволяют Viv понимать язык и писать собственные программы — они пригласили Марка Гейбела из Техасского университета в Далласе. Другой ключевой человек — Дэвид Гондек — один из создателей Watson от IBM.

Финансирование пришло от Солины Чау, бизнес-партнера богатейшего человека в Китае, Ли Кашина. Чау управляет венчурной компанией Horizons Ventures. В дополнение к инвестированию в Facebook, DeepMind и Summly, она помогла оригинальной Siri. Когда основатель Viv попросил у Чау 10 миллионов долларов, она сказала: «Я в деле. Сейчас отправить?».

В начале мая Киттлаус обратился к команде на еженедельной встрече инженеров:

«Вы видите прогресс, видите приближение к точке, где все будет работать».

Основатели Viv видят в ней продукт, не привязанный к производителю аппаратного обеспечения. Они видят ее как сервис, который может быть лицензирован. Представляют, что все, от производителей телевизоров и автомобильных компаний до разработчиков приложений, захотят включить искусственный интеллект Viv, как однажды производители персональных компьютеров хвастались процессорами Intel. Команда Viv хочет войти в пантеон таких знакомых всем символов, как Wi-Fi и Bluetooth.

«Интеллект становится утилитой, — говорит Киттлаус. — Разве не было бы круто, если бы вы могли обращаться ко всему, и все вас узнавало и знало все о вас абсолютно все и вся?»

Киттлаус думает, что Viv будет ключевой в так называемой партнерской экономике. Он приводит в пример Match.com, которые организуют 50 000 свиданий в день. Но что Match.com не может, так это сказать: «Позвольте, я возьму вам билеты. Заказать столик? Послать автомобиль за вами? Не хотите, чтобы за столик прислали цветы?». Viv может обеспечить работу всех этих сервисов.

Строительство такой экосистемы будет трудной задачей, труднее, чем если бы Viv купил один из крупных гигантов. Но продажа Viv Labs будет страшным дежавю для владельцев. Они смогут контролировать процесс только если все будут делать сами.

Получится у них или нет — никто не знает. Потенциал Viv огромен, но это лишь потенциал. Серьезной задачей будет заставить все эти тысячи сторонних компонентов работать совместно. Большинство из тщательно отобранных свидетелей происходящего уверены в успехе. К примеру, Вишал Шарма, который недавно был вице-президентом продукта Google Now. Когда Чейер показал ему, как Viv определяет вино, которое хорошо подойдет к блюду, Шарма растаял. «Я не знаю ни одну систему в мире, которая могла бы ответить на этот вопрос. Многое может пойти не так, но я хотел бы видеть эту систему в действии».

Слишком многое предстоит сделать Viv. Нужно доказать, что навыки программирования компании позволяют включать петабайты данных. Система должна становиться умнее в процессе всеядного обучения. Пользователи должны тянуться к системе, хотя это и не продукт Apple или Google. Нужно заманить разработчиков, которые адаптируют свои продукты для разных платформ. Разработчики Siri уверены, что их следующее творение затмит первое. Но когда и где это случится — на этот вопрос даже Viv не может ответить. Пока что.

По материалам Wired