Автомобиль с глубоким обучением научился самостоятельному вождению за 20 минут

9th July 2018, Илья Хель 27

Группа исследователей английского стартапа Wayve разработала способ применения сети глубокого обучения к автономному вождению. Не так давно представители компании  продемонстрировали, как работает их технология, и предложили вывести настоящий автомобиль на настоящую дорогу и научить его… самостоятельному вождению за 20 минут.


Дело в том, что большинство самоуправляемых автомобилей использует набор камер и датчиков, а также инструменты для составления карт и компьютерного программирования. Но такой подход, по их мнению, упирается в потолок. Автономные автомобили, запрограммированные такими компаниями, как Google, достигли точки, когда они хороши, но недостаточно хороши для повсеместного использования. Это связано с тем, что автомобили пока недостаточно умны, чтобы справляться с множеством условий, существующих на обычной дороге. По мнению ученых, автомобилю нужен более умный компьютер, а не особенные датчики или программирование.

Команда Wayve считает, что более разумный подход заключается в использовании алгоритмов обучения с подкреплением, вроде того, что задействует DeepMind — позволить компьютеру обучаться подобно людям, на практике. Алгоритмы обучения с подкреплением лежат в основе сетей глубокого обучения — они обучаются, повторяя и повторяя задачу, с каждым разом улучшая свой результат. В случае автономного управления транспортным средством это означало бы вождение автомобиля до тех пор, пока он не научится делать это правильно.

Чтобы продемонстрировать, насколько хорошо мог бы сработать такой подход, команда Wayve оснастила Renault Twizy одной камерой, управлением газом, тормозом и рулем, и подключила его к графическому процессору и компьютеру с алгоритмами обучения с подкреплением. Компьютеру «сказали», что оптимальным результатом будет автомобиль, который движется по дороге, не покидая дорогу. Чем дольше он это делает, тем лучше. Затем они добавили водителя и поместили автомобиль на проселочную дорогу. Компьютер научил автомобиль ехать, не съезжая с дороги, за 20 минут.

27 комментариев Оставить свой

  1. mr Vanya

    Deep Reinforcement Learning
    По нашему Обучение методом проб и ошибок (кнута и пряника)
    Всего 20 минут для "не съезжания с просёлочной дороги" впечатляет.
    Интересно, а вот использует-ли гугл DRL одновременно со своими умными датчиками?
    Как следующим этапом будут учить не наезжать на пешехода на просёлочной дороге? Медленно условно "давить" объект, штрафовать программу. Останавливаться перед ... поощрять программу. Объезжать ...? Слетать при этом на обочину ...? Даже может врезаться в дерево ...?
    Дня может и хватить, но будет-ли ИИ так же реагировать на по другому одетых людей, переходящих дорогу задом наперёд, ребёнка или пожилую сгорбленную бабушку. Человека прыгающего, стоящего на голове, ползущего на четвереньках, по пластунски? :-)

    • Desperad0s

      mr, Автомобиль научится объезжать пешехода всего за 20 бабушек

  2. snow1eopard

    Про то что существуют всякие нейронные сети все в курсе, проблема в том, как обучить нейронную сеть, ведь проблема в том, что во всех не типичных ситуациях будет сбой, а сбой очень часто = чья то смерть, поэтому выше человек правильно написал про бабушек, несомненно такая нейронная сеть будет лучшим вариантом, но пока ИИ отработает все нужные навыки, умрет пару милиионов человек, потому что ВСЕ нестандартные ситуации, нужно будет повторить не один десяток раз, а теперь представьте себе количество вариаций таких ситуаций. Самое правильное решение, создать некий виртуальный мир, в котором и будет ездить эта нейронка, а дальше загружать ей по ходу движения все аварийные ситуации из реальной жизни, благо это не сложно, берем записи с камер видеонаблюдения, коих в мире сотни тысяч и погнали обучаться, вот такой вариант будет отличным, но опять же не идеальным и скорее всего будут еще много других не тепичных ситуаций где все же будут гибнуть люди, но я думаю если на все тачки такую после норм обучения поставить аварийность из-за человеческого фактора снизится сразу на 99%, 1% останется на самые нестандартные аварии.

    • doctorwhyy

      snow1eopard, В виртуальном мире не работает теория трёх тел, поэтому эмуляция будет крайне далека от реальности.шах и мат, аналитег

      • reactos

        doctorwhyy, Ну и какое имеет отношение теория трех тел к машинному обучению? Вы тоже не можете их рассчитать, однако это не мешает вам объезжать бабок на дороге.

      • passerby

        doctorwhyy, Да Док.. расскажите нам, как вы свели обучение нейронной сети (а мозг человека это она и есть), к задаче трех тел. И если ваш могучий мозг, решает дифференциальные уравнения второго порядка, лучше чем компьютер, то может вы поможете астрономам рассчитать траектории движения планет и астероидов, силой своей могучей мысли.

        • reactos

          passerby, Что-то мне подсказывает, что наш гуманитарий сдуется ;)

    • lars

      snow1eopard, В политике больших чисел, смерть пары миллионов человек ни чего не значит. Если с ИИ снизит смертность на 50%, то это уже хорошо, ведь в авариях виноваты и водители и пешеходы, следовательно убрав водителей, величина аварий из за их ошибок, невнимательности, значительно сократится. Так же и с пешеходами, которые уроды переходят дороги в темное время суток, в неположенном месте, в темной одежде. Их машина увидит с большей вероятностью.

      • amd212

        lars, Надо чтобы какой яркий лидер мирового уровня взял на себя ответственность и поручился за вашу программу обучения ИИ. И если, убив два миллиона человек ИИ, не сможет водить лучше человека, этого лидера в реале, публично демонстрируя по ютубу камерой в 500 fps, задавят машиной с ИИ.
        Следующего умника придётся ждать долго :-)

        • reactos

          amd212, Ничего страшного не случится, каких-то два миллиона кожаных мешков. Зато технология будет испытана и ИИ станет намного совершенней, принося пользу каждому владельцу замечательных автомобилей Tesla.

          • amd212

            reactos, Ценю ваш сарказм.
            Но ни один Машин Лёнинг алгоритм не гарантирует вам "сходимости". А убивать пару миллионов за парой и ещё пару, потом снова пару ... каждый раз убеждая зрителя, ну вот вот вот ИИ научится водить не хуже человека --- даже для сериала сценарий так себе.

  3. amd212

    Скрипт езды по просёлочной дороге.
    1. перегоняем видео в B&W (1 бит) с неким пороговым значением
    2. вписываем внизу в чёрную область дороги максимальный по ширине прямоугольник с высотой <= 3 длинны автомобиля.
    3. отмечаем середину верхней стороны прямоугольника
    едем туда

    • reactos

      amd212, Продайте скрипт Муску, может тогда он перестанет бабок сбивать.

      • amd212

        reactos, Кроме езды по просёлочной дороге этот скрипт ни на что не годен. И бабку в чёрном он вообще не увидит.
        Вот невесту объедет или затормозит.

        • reactos

          amd212, Значит добавьте еще два пункта в ваш скрипт.
          4. увидеть бабку в черном.
          5. объехать ее.

          • amd212

            reactos, вы первый пункт читали? Там же чёрном по белому написано перевести цветность видео в чёрнобелый бит. Из всех цветов только два - ноль и один. Дорога будет "один" и чёрная бабка "один". Как же скрипт один от один различит?
            Нет, чтобы скрипт работал, надо всех бабок вырядить в белое или полосатое.

            • reactos

              amd212, Это ничего не меняет. Вы никогда на черно-белых фотографиях не видели бабок в черном? Даже если градации всего две, то бабка в черном все равно должна быть идентифицирована, и объехана как опасное препятствие.

              • amd212

                reactos, Ч.б. фотография это размер зерна. С видео или глазом, сетчаткой там ничего общего.
                Вот например как под увеличением выглядит чёрно белая полиграфия.
                С привычным растром там ничего общего. Обрабатывать такое изображение - сплошной геморрой.
                pechatnyj-dvor.su/print/00000307.jpg

            • passerby

              amd212, Если у вас, уже на первом пункте возникают проблемы с определением градаций, то зачем вы их ограничиваете всего двумя и лепите остальные пункты?

              • amd212

                passerby, У меня не возникают. Я описал скрипт "езды по просёлочным дорогам". "Бабок" он не предусматривал.

                • passerby

                  amd212, Будет очень печально, если ваш скрипт все-таки собьет какую нибудь залетную бабку в черном. Советую вам доработать ваш скрипт.

                  • amd212

                    passerby, Там "гольф багги". Максимальная скорость 15 км/ч
                    Наши "бабки" в два раза быстрее бегают.

  4. Ce3apyc

    Научиться не съезжать с дороги - это только малая часть того, что умеет водитель. В остальном, скорее всего, подойдет обычный симулятор с обратной связью для исключения "пройденных" ситуаций. Но сразу возникает другой вопрос - доказательство правильности алгоритма. Сложно будет заставить поверить регулирующие органы, что ИИ будет действовать непредсказуемо и, при этом, правильно.

    • amd212

      Ce3apyc, Организовать госприёмку для ИИ не проблема. В масштабах США организовать пяток полигонов симулирующих разные ландшафты и погодные условия проще пареной репы. Горы, равнина, лес, мегаполис. Слепящее солнце, дождь, снег, чёрный лёд. Выбегающий на дорогу лось, кабан, ребёнок, женщина с велосипедом. Плотный городской трафик, школьная зона, заправка, подземная парковка. Уступи дорогу школьному автобусу, скорой помощи, поезду, пьяному водителю. Объезд временного знака, отвалившегося колеса, открытого люка, черепахи. Ну и т.п.
      Прошёл полигоны - получай сертификат. Дальше саморегуляция через обратную связь от страховой компании. Каждый акцидент разбирается комиссией, устанавливается виновный, в случае ответственности ИИ все машины с этой версией получают +20% к ежемесячным страховым выплатам. Потребитель голосует деньгами.
      При злостных авариях, дорабатываются соответствующие тесты на полигонах (чтобы выявлять выявленный дефект заранее) - ВСЕ ИИ на переаттестацию.

    • reactos

      Ce3apyc, Можно пойти уже известным путем. Например предусмотреть наказания для алгоритмов, в виде лишения свободы, например пять лет с конфискацией всех данных, а особо тяжких случаях стирать из с носителей. Думаю что это должно решить проблему.

      • Ce3apyc

        reactos, +++
        Ага, в пору УК ПК писать;)

  5. bilif

    Истина (как всегда) находится где-то посередине - датчики, базовая программа, базовые ограничения и приоритеты должны видимо изначально прописываться. А способность обучаться и самое главное передавать "опыт" другим машинам это тоже замечательно!
    Автомобили будут со временем становиться "умнее" и это здОрово!

Новый комментарий

Для отправки комментария вы должны авторизоваться или зарегистрироваться.