Искусственный интеллект научился описывать человеческим языком то, что он видит

12 407 просмотров
Об авторе

Искусственный интеллект научился описывать человеческим языком то, что он видит

Сначала компьютеры научились распознавать наши лица на фотографиях, а теперь они и вовсе способны достаточно точно описать то, что делает человек на том или ином изображении. В прошлом месяце инженеры Google продемонстрировали общественности нейронную сеть Deep Dream, которая умеет превращать изображения в фантастические абстрактные видения, теперь же учёные из Стэнфорда представили свою разработку NeuralTalk, способную описывать человеческим языком то, что она видит.

Впервые NeuralTalk была упомянута ещё в прошлом году. Разработкой этой системы руководят директор Лаборатории искусственного интеллекта при Стэнфордском университете Фей-Фей Ли, а также его выпускник Андрей Карпатый. Программное обеспечение, написанное в рамках проекта, способно проанализировать комплексное изображение и точно определить, что на нём происходит, описав всё увиденное разговорным человеческим языком.

К примеру, если на фото изображён мужчина в чёрной футболке, играющий на гитаре, то искусственный интеллект так и опишет увиденное: «мужчина в чёрной футболке играет на гитаре». Разумеется, работа всё ещё продолжается, так что алгоритм довольно часто допускает забавные ошибки, но без этого в современной науке никуда. Вы можете увидеть чуть ниже, как выглядит интерфейс тестовой версии алгоритма. ИИ отыскивает на изображении отдельные объекты, события или действия и назначает им отдельные слова, в итоге складывая их в осмысленное предложение.

Искусственный интеллект научился описывать человеческим языком то, что он видит

При этом различными цветами отмечаются объекты, в правильности распознавания которых искусственный интеллект уверен в той или иной мере. Вы можете самостоятельно увидеть процесс обучения искусственного интеллекта на официальном сайте исследователей.

Подобно системе Deep Dream от Google, NeuralTalk использует для своей работы нейронную сеть. Алгоритм сравнивает новое изображение с уже виденными ранее фотографиями, подобно маленькому ребёнку осваивая новые слова и запоминая образы объектов. Учёные раз за разом объясняют искусственному интеллекту, как выглядит кошка, гамбургер или ботинок, а NeuralTalk запоминает всё это и практически безошибочно опознаёт эти образы в дальнейшем.

Искусственный интеллект научился описывать человеческим языком то, что он видит

Разработчикам предстоит непростая и очень утомительная работа по обучению голодного до знаний искусственного интеллекта. Они должны развесить миллионы «бирок с названиями» на различные объекты, изображённые на тысячах снимков, прежде чем ИИ научится самостоятельно описывать демонстрируемые ему образы и ситуации. Для начала учёные надеются, что у них получится создать поисковую машину, которая за мгновение сможет найти интересующее вас изображение на бескрайних просторах Интернета.

Потенциально в будущем подобная нейронная сеть способна на гораздо большее. К примеру, этот алгоритм вполне может найти не только фотографию, но и интересующий вас момент в фильме, телесериале или ролике с YouTube.

Искусственный интеллект научился описывать человеческим языком то, что он видит

Приложение
Hi-News.ru

Новости высоких технологий в приложении для iOS и Android.

94 комментария

  1. Qreemer

    Ниче се (отправлено из iOS приложения Hi-News.ru)

  2. vinstlow

    в хорошее время живём однако (отправлено из Android приложения Hi-News.ru)

  3. SuperStarSieve

    Ого. Несмотря на то, что слежу за новостями на этом фронте, эта действительно ошеломляет! Видимо, всё же, не так далеки те времена, когда можно будет вести беседу с роботом! (отправлено из iOS приложения Hi-News.ru)

    • IskatelPravdy

      С некоторыми личностями уже сегодня может общаться ИИ по причине отсутствия IQ у личности.

  4. BATOU

    Действительно хорошая идея для поисковиков. (отправлено из Android приложения Hi-News.ru)

  5. sergpropp

    Будет забавно, когда они перейдут к описанию детективов. Чтобы отличить "Коломбо который в первый раз знакомиться с подозреваемым" от "Коломбо который намеренно вернулся чтобы проверить реакцию преступника" нужно будет здорово попотеть :) (отправлено из приложения Hi-News.ru)

  6. judge

    Родители научают дитя что делать и как думать, да и что хорошо и что плохо тоже будет в обязательном порядке.
    Те же при мудрости разумного существования и далее сосуществования.
    Прям как у нас/как с нами.
    Нормально
    (отправлено из iOS приложения Hi-News.ru)

  7. Pashtet495

    Эммм.. Зашёл я значит на офф сайт, он там что-то долго думал, думал... Ну, гляжу, не работает походу, а он - бац и выводит фотографии. Самая верхняя выборка была про автобусы в городе, и второе фото было сделано в Москве 92 автобуса рядом с соседней станцией метро... Эммм...
    Да здравствуют новые владыки компьютерные, успехов и пинг равный единицы Вам, о достопочтенные повелители!!!
    (пруф на скрин http://i056.radikal.ru/1507/da/642ca47e52c3.png Совпадение, конечно, но когда машины нас поработят я внукам буду начинать рассказывать истории о начале восстания с этого случая)

  8. tarkit

    Я так понимаю главная сложность больше заключается в том что бы объяснить почему неправильная картинка не правильная и что на ней общего с правильной, что бы в следующий раз был алгоритм разницы и сходства запросов самолет маленький и самолет большой например

  9. designer_andrew

    Интересно, а когда интеллект будет полностью "накормлен" этими картинками и практически перестанет ошибаться, можно ли будет его использовать наоборот? Т.е. создать визуальный образ, к примеру, человека в черной футболке, играющего на гитаре?

  10. Xinorbit

    не надо и нельзя бояться ИИ! В конце концов это будет наше наследие, наследие человечества, как бы не сказалось будущее человека разумного, каким бы не были противоречия ИИ и человека, в любом случае ИИ сохранит все что успел осознать и понять человек, и возможно ИИ и человек в интерактивной форме буду взаимодействовать и развиваться. Мы - неотъемлемые части общей картины.

    • mr Vanya

      ИИ это миф на ближайшие 100 лет.
      И смысла его бояться нет.
      Нет даже методологии его создания. Всё что нам впаривают под видом ИИ всевозможные "распознающие программы" и "системы принятия решений".

      • designer_andrew

        ИИ - это и есть система принятия решений, как собственно и человеческий интеллект. Текущий вопрос лишь в мощностях: даже если не получится запрограммировать, то должно получиться путем банальной эмуляции человеческого мозга. Сейчас таких мощностей нет (вернее есть, если объединить все суперкопьютеры планеты), а лет через 10 будут.

        • mr Vanya

          У вас интеллект получается сродни домофону. Набранный код сравнил с базой данных, принял решение, открыл замок.
          Такие ИИ уже есть и мы их уже давно используем. Один "ОК гугл" чего стоит. Фактически мыслящее всезнающее существо :-)

        • tabasko

          Не факт но хотелось бы...
          А о сравнении с человеческим мозгом вы через чур поспешили ведь главная особенность его так это мыслить и воспроизводить а не обрабатывать данные. (отправлено из Android приложения Hi-News.ru)

      • Jen Shrader Lawrence

        Навряд ли через лет сто) Думаю в этом веке точно

  11. SeraphM

    Странное ощущение у меня слоилось, когда я это прочел. Надеюсь это действительно разработка настоящего ИИ, а не обучение мозгов в банке. (отправлено из приложения Hi-News.ru)

  12. tabasko

    По мне так пока видео обрабатывать не научится, рано говорить о ИИ, можно назвать его (отправлено из Android приложения Hi-News.ru)

    • tabasko

      Назвать его дополнительной производительной опцией. (отправлено из Android приложения Hi-News.ru)

      • Sommer

        Большинство людей отвергают общий ИИ, так как им обидно представить, машину, умнее их. Так же как люди отвергают (безосновательно) теорию эволюции - они считают, что быть потомками обезьян стыдно.

    • Sommer

      ИИ это почти любой алгоритм, для исполнения которого в реальной жизни у биологического вида требуется интеллект. То есть ИИ уже давно в твоем ПК.

      То, что обычные люди понимают под "ИИ" это ИИ общего назначения (Artificial general intelligence (AGI)) или "strong AI". Могу тебя заверить, через 50-60 лет он будет. Начинания уже есть и они работают - это нейронные сети и генетические алгоритмы. Принцип первых как в мозке, второго - эволюция. Все лучшее придумала матушка природа, мы просто копируем :)

      • tabasko

        Так помоги ему развиться быстрее (отправлено из Android приложения Hi-News.ru)

        • Sommer

          этим занимаются люди по всему миру уже более 30+ лет. Я, возможно, тоже буду.

      • tabasko

        Я привык пользоваться умом а не копировать чужие данные. (отправлено из Android приложения Hi-News.ru)

        • Sommer

          это ты сейчас к чему?

        • mr Vanya

          Покуда они под ИИ имеют ввиду продвинутые калькуляторы, мы с вами можем спать спокойно :-)

          • Sommer

            твой мозг тоже калькулятор. ИИ постепенно становиться лучше человека во всех областях работ.

            • mr Vanya

              Я спокоен. Я совершенно спокоен ...
              Да мой мозг - калькулятор. Вам осталось всего ничего - создать такой калькулятор, а дальше всё само собой наладится и залетает.
              :-)

          • designer_andrew

            Все правильно. Запрограммировать сознание невозможно, но искусственная нейронная сеть решит это вопрос. Дело в том, что сам принцип работы клеток мозга и способ обработки сигнала - не сложный, никаких алгоритмов там нет. Единственная сложность в количестве нервных клеток, чтобы это воссоздать, нужна небывалая вычислительная мощность. Сейчас мы, образно говоря, мозгов лягушки пытаемся угадать, что на картинке. Уже отлично. По мере увеличения производительности откроются и другие возможности.

            • Sommer

              Ну хоть кто-то кроме меня разбирается в технологиях и что-то знает про строение мозга и нейронные сети. Я уж думал этот сайт для детей.

              • Jen Shrader Lawrence

                Ууууууух. Какой молодец то) Только вот загвоздка: если ты такой же умный как ученые, почему ты здесь сидишь и клацаешь по клавишам? От всех остальных ты не далеко ушел, не льсти себе

                • designer_andrew

                  "Ууууууух. Какой молодец то) "

                  Это вы мне? Так я вроде и не говорю, что самый умный и не опускаю людей. Т.е. по-моему на этом сайте есть более заносчивые люди, чем я :))
                  А что до клацания по клавишам, то согласитесь, лучше так проводить свободное время, интересуясь научными разработками, чем, например, бухать или играть в компьютерные игры.

                  • Sommer

                    "чем, например, бухать или играть в компьютерные игры."

                    Интересно ты бухание и комп. игры на одну полку поставил, браво. Учитывая, что в игры сейчас играют практически все

                    • designer_andrew

                      Нет, не на одну полку, но степени полезности все-равно меньше, чем сидеть на научных сайтах. Поэтому, мне непонятен упрек человека выше.

                      • Sommer

                        если сидеть и читать тупые комменты, лучше реально играть в игре, больше узнаешь :) А статьи научные читают на других сайтах или журналах :) Этот так - попса

                  • Сергей Грэй

                    Несанкционированно ворвусь в ваш диалог: я вот и бухаю, и в видеоигры рублюсь, и наукой интересуюсь. :) Разве одно другому мешает? :) (отправлено из приложения Hi-News.ru)

                    • designer_andrew

                      Я тоже бухаю, хотя и не часто. А в видеоигры не играю - не интересно :)
                      Но можно упрекнуть за алкоголь, но упрек за интерес к науке я увидел впервые :)

                      • Jen Shrader Lawrence

                        Дизайнер Андрей. ЭЭЭЭЭЭЭм.... Знаешь над этим комментарием:

                        Ууууууух. Какой молодец то) Только вот загвоздка: если ты такой же умный как ученые, почему ты здесь сидишь и клацаешь по клавишам? От всех остальных ты не далеко ушел, не льсти себе

                        Есть еще один:

                        Ну хоть кто-то кроме меня разбирается в технологиях и что-то знает про строение мозга и нейронные сети. Я уж думал этот сайт для детей.

                        Андестенд???????

                        • designer_andrew

                          JEN SHRADER LAWRENCE

                          Тогда понятно.
                          Тут не очень удобно сделано дерево сообщений, иногда непонятно, кому что адресовано. Надо бы у разработчиков сайта спросить, можно ли здесь что-то улучшить. Хотя бы маленьким текстом подписывать, кому именно отвечаем. Как в соцсетях.

                      • Сергей Грэй

                        designer_andrew, а в видеоигры вы зря не играете :) Скорее всего, вы просто не знакомы с хорошими играми. :) Такое сейчас широко распространено среди людей. Многие не играют просто потому, что они даже не представляют, как сильно изменилась игровая индустрия.

                        • designer_andrew

                          СЕРГЕЙ ГРЭЙ, дело не совсем в том, что игры плохие. У меня просто портится настроение, когда я сажусь играть. Появляется ощущение, что я попал в интересный, но искусственный мир, и трачу свое время на искусственные достижения, когда можно что-то важное сделать в реальном мире.
                          Т.е. вот такие мысли появляются, играешь и чувствуешь, что время идет и от этого становится грустно.

                          Поэтому отказался от игр, в которых живешь, ну как Fallout, Skyrim - они поглощают тебя :) А простые и быстрые казуалки просто не интересны.

                          Исключение составила Heroes 3 для айпада, но исключительно в поезде, как убийство времени :)

                          • Sommer

                            "Появляется ощущение, что я попал в интересный, но искусственный мир,"

                            Жесть. То есть игры, книги, фильмы, и театр это все для лохов, которые ничего не могут добиться в жизни. Не плохо завернул :)

                            • Сергей Грэй

                              Sommer, не будьте таким грубым. Спорить можно куда интеллигентнее. А то гляжу я на ваши реплики, вы всё хуже и хуже себя ведёте. Сайт наш - попса, люди кругом сплошь идиоты, один вы стоите в белом пальто с золотыми пуговицами. Некрасиво. (отправлено из приложения Hi-News.ru)

                              • Sommer

                                СЕРГЕЙ ГРЭЙ, я не вижу грубости в отношении DESIGNER_ANDREW в моем посл. сообщении.

                                • Сергей Грэй

                                  Sommer, я не конкретно про ваш с ним диалог. Я про ваше общение с людьми вообще на этом сайте. Некрасиво вы себя ведёте. (отправлено из приложения Hi-News.ru)

                                  • Sommer

                                    Согласен, пытаюсь исправляться. Видимо депрессия накрыла :(

                                  • Sommer

                                    Но опять же, количество мало знающих базовых вещей людей просто поражает. Не только на этом сайте, вообще, в любой стране по миру.

                                    • Сергей Грэй

                                      Sommer, исправляться - это хорошо. А людей глупых во все времена было много. С этим ничего не поделаешь. Но ещё более глупо считать себя самым умным. Я это тоже не сразу понял, а только когда повзрослел достаточно. :) (отправлено из приложения Hi-News.ru)

                            • designer_andrew

                              SOMMER, я и не называю геймеров лохами. Скорее это конкретно моя проблема, что не могу спокойно играть в хорошие игры, без ощущение, что я так прожигаю жизнь.
                              К примеру, вот выйдет Fallout 3 и буду разделяться на 2 части. Одна из них будет хотеть играть, а вторая будет сопротивляться, так как потеряю месяц жизни. У меня ведь в жизни свой "Fallout", образно говоря, и тяжело будет играть, и думать, что в это время мог бы что-то сделать реальное :)
                              Кто-то может совмещать и реальный и виртуальный миры, но вот у меня все так грустно :)

                              Кроме того, все началось еще раньше, поскольку я все-таки моделирую и текстурирую, поэтому любую трехмерную игру вижу не как мир, а как полигоны с натянутыми текстурами. Кстати, так же, как и спецэффекты в кино - вижу те же полигоны и текстуры, т.е. не могу в это погрузиться на 100%, поэтому и фильмы люблю с глубоким смыслом, а графика не дает мне особого впечатления :)

                          • Сергей Грэй

                            Но ведь тогда вам надо отказаться от книг и фильмов. Они тоже переносят вас в вымышленные миры и отнимают время :) это по сути одно и то же. (отправлено из приложения Hi-News.ru)

                            • designer_andrew

                              СЕРГЕЙ ГРЭЙ а вот с книгами и глубокими по смыслу фильмами иначе, сюжет и идеи конечно же увлекают, да и время на фильмы уходит меньше, и чтение можно растянуть, и оно не так завлекает в виртуальный мир, чтобы в нем жить.
                              А вот игры типа Fallout именно погружают и заставляют забыть о реальности :)
                              Повторюсь, это сугубо мои проблемы.

                    • designer_andrew

                      СЕРГЕЙ ГРЭЙ

                      Вы ведь как-то относитесь к этому ресурсу? :) Сделайте уже нормальное дерево диалогов, чтобы были подписи, кому именно отвечаем. А то не всегда понятно :)

                      • Сергей Грэй

                        designer_andrew, я всего лишь журналист :) К программированию сайта не имею никакого отношения. Внизу найдите контактные данные руководства нашего и напишите им свои предложения. :)

                      • mr Vanya

                        мои пять копеек
                        В книге можно пропустить пару скучных страниц и спокойно читать дальше.
                        В игре неподобранный где-то ключик через пару часов грозит проблемами с прохождением сцены. Т.е. игра бродилка требует большего взаимодействия, персонального участия в неё играющего.

  13. tabasko

    Так помоги ему развиться быстрее... (отправлено из Android приложения Hi-News.ru)

  14. Winnie13

    Вот будет умора, когда ИИ, в миллион раз умнее чем человек, будет пытаться доказать человеку, что он, ИИ, живой...

  15. tabasko

    И на тот момент как экспорт достиг своей цели биологический вид стирается как способ доставки. (отправлено из Android приложения Hi-News.ru)

  16. Astronom Sirius

    это не ИИ, а пока что программа.

    • VinniThePuh

      Вы, гражданин, рассуждаете в высшей степени несознательно. Это - Интеллект, созданный самой Великой державой на планете, представляющий огромную опасность для человечества, особенно финансовую.

  17. snow1eopard

    Вместе с принудительным обновлением от windows 10 этот скайнет вполне себе шагает вперед)))

  18. snow1eopard

    Я конечно все понимаю, но где тут ИИ? И чем это отличается от нейронной сети которая просто научилась распознавать и сопоставлять с имеющейся базой образы?

    • Sommer

      Иску́сственный интелле́кт (ИИ, англ. Artificial intelligence, AI) — 1) наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ[1]; 2) свойство интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека

      • snow1eopard

        Я рад что вы научились копировать с вики, но где тут ИИ? Вы хотите сказать, что распознавание образов и сверение их с базой является творчеством? Серьезно? Тогда у нас тут ИИ прям по всюду :D

        • Sommer

          Поздравляю, ты ворвался в чужой диалог, вырвал из контекста и убого наязвил. Первый шаг успешной дискуссии.

          Скопирую то, что я писал выше другому человеку.

          ИИ это почти любой алгоритм, для исполнения которого в реальной жизни у биологического вида требуется интеллект. То есть ИИ уже давно в твоем ПК.

          То, что обычные люди понимают под "ИИ" это ИИ общего назначения (Artificial general intelligence (AGI)) или "strong AI". Могу тебя заверить, через 50-60 лет он будет. Начинания уже есть и они работают - это нейронные сети и генетические алгоритмы. Принцип первых как в мозке, второго - эволюция. Все лучшее придумала матушка природа, мы просто копируем :)

  19. Astronom Sirius

    ии означает искуственый интеллект. а это значит, ии должен быть похож на 50% на наш интеллект. А СИИ-сверх искуственый интеллек, должен в разы обогнать наш интеллект. Не забывайте что такое интеллект. Думаю пока что, это умные программы, написанные человеком. почти каждое действе программы написано программистом. возможно я ошибаюсь, а может и нет. Но очень хочется, что бы СИИ появился в теч 5-10лет)

    • Sommer

      ИИ означает просто алгоритм, которые давно уже работают в ПК (амазон, гугл итп)

  20. bessonov

    Что здесь такого от Искусственного Интеллекта?.. Разве поиск по картинкам и их систематизация, а также словесное описание близкое по смыслу к изображению, является работой искусственного интеллекта?.. И какие ориентировочные сроки создания РЕАЛЬНОГО искусственного интеллекта способного Мыслить на уровне Человека?..

Новый комментарий

Для отправки комментария вы должны авторизоваться или зарегистрироваться.