Почему ИИ до сих пор не овладел переводом языков в совершенстве?

12 Марта 2018, Илья Хель 15

В мифе про Вавилонскую башню люди задумали построить башню-город, которая достала бы до небес. И тогда Создатель понял, что ничто больше не будет сдерживать людей и возомнят они о себе невесть что. Тогда Бог создал разные языки, чтобы помешать людям и чтобы они больше не могли с легкостью работать сообща. В наше время, благодаря технологиям, мы ощущаем беспрецедентную связанность. Однако мы все еще живем в тени Вавилонской башни. Язык остается барьером в бизнесе и маркетинге. Несмотря на то, что технологические приспособления могут легко и быстро соединяться, люди из разных частей мира зачастую не могут.

Бюро переводов пытаются успевать: делают презентации, контракты, инструкции по аутсорсингу и рекламные объявления для всех желающих. Некоторые агентства также предлагают так называемую “локализацию”. Например, если компания выходит на рынок в Квебеке, ей нужна реклама на квебекском французском, а не на европейском французском языке. Компании могут серьезно пострадать из-за неправильного перевода.

Глобальные рынки ждут, но языковой перевод силами искусственного интеллекта еще не готов, несмотря на недавние достижения в области обработки естественного языка и анализа настроений. У ИИ по-прежнему возникают трудности с обработкой запросов даже на одном языке, не говоря уж про перевод. В ноябре 2016 года Google добавила нейронную сеть в свой переводчик. Но некоторые ее переводы по-прежнему социально и грамматически странные. Почему?


«К чести Google, компания ввела довольно много улучшений, которые появились почти за одну ночь. Но я не особо их использую. Язык — это трудно», говорит Майкл Хаусман, главный научный сотрудник по научным исследованиям в RapportBoost.AI и преподаватель Singularity University.

Он объясняет, что идеальный сценарий для машинного обучения и искусственного интеллекта будет заключаться в фиксированных правилах и четких критериях успеха или неудачи. Шахматы — очевидный пример, а вместе с ними и го. Компьютер очень быстро овладел этими играми, потому что правила их ясные и четкие, а набор ходов ограничен.

«Язык же — почти прямо противоположный. Не существует четких и выверенных правил. Разговор может идти в бесконечном числе разных направлений. И вам, конечно, нужны также помеченные данные. Вам нужно говорить машине, что она делает правильно, а что нет».

Хаусман отметил, что обозначить в языке информационные ярлыки принципиально сложно. «Два переводчика не могут договориться о правильности перевода», говорит он. «Язык — это Дикий Запад с точки зрения данных».

Технологии Google сейчас способны понимать предложения целиком, не пытаясь переводить отдельные слова. Но глюки все равно случаются. Йорг Майфуд, доцент кафедры испанского языка, специалист по латинской литературе в Университете Джексонвилль объясняет, почему точные переводы пока не даются искусственному интеллекту:

«Проблема в том, что понимать предложение целиком пока недостаточно. Так же, как значение отдельного слова зависит от остальной части предложения (по большей части в английском языке), значение предложения зависит от остальной части параграфа и текста в целом, а значение текста зависит от культуры, намерений говорящего и прочего. Сарказм и ирония, например, имеют смысл только в широком контексте. Идиомы также могут быть проблемными для автоматизированного перевода».

«Перевод Google — отличный инструмент, если вы используете его как инструмент, то есть не пытаясь заменить человеческое обучение или понимание», говорит он. «Несколько месяцев назад я пошел покупать дрель в Home Depot и прочитал надпись под машиной: «Saw machine». (Машинная пила). Ниже был испанский перевод ‘La máquina vió,’ что означает “Машина это видела”. “Saw” перевели не как существительное, а как глагол прошедшего времени».

Доктор Майфуд предостерегает: «Мы должны знать о хрупкости такой интерпретации. Потому что переводить — это по сути интерпретировать, не просто идею, но и чувство. Человеческие чувства и идеи, которые могут понять только люди — а иногда даже мы, люди, не можем понять других людей».

Он отметил, что культура, пол и даже возраст могут создавать препятствия для этого понимания, а чрезмерная зависимость от технологий ведет к нашему культурному и политическому упадку. Доктор Майфуд упомянул, что аргентинский писатель Хулио Кортасар называл словари “кладбищами”. Автоматические переводчики можно было бы назвать “зомби”.

Эрик Камбриа, академик, исследующий ИИ, и профессор Технологического университета Наньянга в Сингапуре, занимается по большей части обработкой естественного языка, которая лежит в основе переводчиков на основе ИИ. Как и доктор Майфуд, он видит сложность и сопряженные риски в этом направлении. «Существует очень много вещей, которые мы делаем несознательно, когда читаем текст». Чтение требует выполнения множества несвязанных задач, которые не под силу автоматическим переводчикам.

«Самая большая проблема машинного перевода на сегодня состоит в том, что мы склонны переходить от синтаксической формы предложения на языке ввода к синтаксической форме этого предложения на целевом языке. Мы, люди, так не делаем. Мы сперва расшифровываем значение предложения на входном языке, а затем кодируем это значение на целевом языке».

Кроме того, существуют культурные риски, связанные с этими переводами. Доктор Рамеш Шринивасан, директор Лаборатории цифровых культур в Калифорнийском университете  в Лос-Анджелесе, говорит, что новые технологические инструменты иногда отражают лежащие в основе предубеждения.

«Должно быть два параметра, которые определяют, как мы проектируем “интеллектуальные системы”. Один — это ценности и, можно так сказать, предубеждения того, кто создает системы. Второе — это мир, в котором система будет учиться. Если вы создаете системы ИИ, которые отражают предубеждения своего создателя и широкого мира, иногда бывают весьма впечатляющие провалы».

Доктор Шриванисан говорит, что инструменты перевода должны быть прозрачными в отношении возможностей и ограничений. «Видите ли, идея того, что одна система может взять языки (которые очень разнообразны семантически и синтаксически) и объединить их или в какой-то мере обобщить, либо вообще сделать одним целым, это нелепо».

Мэри Кокран, кофаундер Launching Labs Marketing, видит коммерческий потенциал роста. Она отметила, что списки на онлайн-рынках вроде Amazon можно в теории автоматически переводить и оптимизировать для покупателей в других странах.

«Я считаю, что мы сейчас коснулись лишь верхушки айсберга, так сказать, касательно того, что ИИ может сделать с маркетингом. И с улучшенным переводом и глобализацией по всему миру ИИ не может не привести к взрывному росту рынка».

15 комментариев Оставить свой

  1. Falloutrulezz

    "Почему ИИ до сих пор не овладел переводом языков в совершенстве?"
    Потому что его не существует.

    • MASking

      Falloutrulezz, Боженька ну ты и рубанул!
      ИИ использует нейроны, в которых запутался что истина, а что ложь... типа:
      Saw machine
      -Машинная пила. “Saw” перевели как существительное
      -Машина это видела. “Saw” перевели как глагол прошедшего времени
      даже если оба утверждения правдивы то ИИ вернул результат более частого перевода у которого вес будет больше, вот и вся проблема.
      ИИ использует калибровку весов для определения одного истинного значения среди ложных или менее значимых. Решение - это добавить отображение других вариантов перевода не составит труда - тем более что это способствует обучению ИИ. Ну и самая большая проблема что ИИ воспринимает вес за значимость в сравнении нескольких вариантов и не ставит истину или ложь индивидуально каждому (хотя это можно определить по весу, например 3 из 5 правильные, а 2 из 5 не правильные)

      • MASking

        MASking, Обучение ИИ усложняет тот факт что люди бывают не однозначными и сами порой не могут договорится о правильности решения «Два переводчика не могут договориться о правильности перевода» - в таком случае оба должны быть правильными и отобразится пользователю: первый по весу, остальные как альтернативный перевод

    • MASking

      Falloutrulezz, А и по поводу ИИ - он существует и работает правильно!
      А вот ИР - искусственный разум - пока не изобрели(((((( пока что его заменяет человек Он настраивает, управляет и контролирует ИИ (нейронные сети) "заточенный" под определенные задачи

      • MASking

        MASking, Вот если заменят человека на ИР который будет сам создавать тысячи ИИ для различных задач, который будет оперировать результатами и будет принимать самостоятельно решение - то тогда ИР будет тем под чем подразумевают ИИ - мыслящей системой или аналогом разума человека

      • Pulsar541

        MASking, Не изобрели ИС - искусственное сознание. А ИР и ИИ - это одно и тоже, потому что разум = интеллект.

        • MASking

          Pulsar541, По мне так сознание - это признак функционирования, а вот соображением занимается разум, а интеллект отвечает за знания

        • MASking

          Pulsar541, возможно нейронным сетям не хватает объектного ориентирования и оперирования с данными типа калькулятора только сложнее...
          ну если вы найдете для меня пример калькулятора на нейронной сети, то Я заберу свои слова обратно.... и поставлю знак равенства между разумом и интеллектом

          • MASking

            MASking, пример: разумный человек сможет придумать 1000000 вариантов применения кирпича, а умный-интеллектуальный только 1 - "для строительства стены стены" и все (так как этот единственный ответ чаще всего используется при упоминании кирпича)

    • mr Vanya

      Falloutrulezz, ИИ - это программа выдачи ответов с большой базой данных. Некоторые из них имеют механизмы встроенной обратной связи и могут корректировать или пополнять свою базу данных в процессе взаимодействия с пользователем.

  2. Editor54

    - Паки, паки… иже херувимы! Между прочим, вы меня не так поняли…
    - Языками не владею, ваше благородие.

  3. Doppelman

    Было бы интересно понаблюдать, как многочисленные вчерашние переводчики наполняют рынки поденных рабочих, когда их с лёгкостью заменит машина, а бюро переводов загибаются в попытках впарить "локализацию"

  4. pokkkep

    СТАТЬЯ НИ О ЧЁМ .....

  5. justromagod

    Неубедительно, потому что даже текстовый перевод они не могут сделать нормальный, а это то задача ерундовая.
    ИИ не может решить проблемы языка только потому что ИИ который они там делают не ИИ совсем а нейросети машинные бинарные обученные неправильно.

  6. Static

    ИИ субьективен, и не связан с окружающим миром не единым понятием, в отличии от разума человеческого, который строится на взаимодействии с миром, т. е. окружающий мир для человеческого ума является программой, всвязи с этой программой человеческий ум опираясь уже на накопленный опыт, принимает следующие решение. Ни в одном ИИ этого нет. Для создания ИИ необходимо хотя бы создать систему работающую с большем количеством состояний, чем 2, (0 и 1).

Новый комментарий

Для отправки комментария вы должны авторизоваться или зарегистрироваться.