ИИ уже начал понимать язык животных. Вот что удалось выяснить

Вера Макарова

Искусственный интеллект уже помогает нам командовать Siri и Alexa, но что, если направить эту технологию на другие виды? Несколько крупных научных проектов используют машинное обучение, чтобы расшифровать общение животных. Полноценный «разговор» с котом пока остаётся фантастикой, но первые результаты впечатляют и ставят серьёзные вопросы о природе языка вообще. Неудивительно, что к этой теме такое внимание: учёным уже даже удалось поговорить с китом в ходе отдельного эксперимента.

Может ли искусственный интеллект научить нас понимать животных? Ответ экспертов

Может ли искусственный интеллект научить нас понимать животных? Ответ экспертов

Есть ли язык у животных и как это проверяют учёные

Прежде чем что-то «переводить», нужно понять: а что именно мы переводим? Люди общаются словами, жестами, мимикой. Животные тоже используют сложные сигналы — собаки виляют хвостом, пчёлы танцуют, дельфины щёлкают и свистят, а слоны, как выяснилось, могут обращаться друг к другу по имени. Но можно ли это считать языком?

Дениз Херцинг, научный руководитель Wild Dolphin Project, объясняет ситуацию так: мы пока не знаем, есть ли у животных настоящий язык, но ИИ способен обнаружить в их общении языкоподобные структуры — элементы, напоминающие грамматику или словарь. Если такие паттерны найдутся, это станет серьёзным аргументом в пользу того, что животные общаются сложнее, чем мы думали.

Почему ИИ всегда соглашается с вами и редко спорит: причина может вас насторожить

И здесь появляется главная сложность. Юлия Фишер из Немецкого центра изучения приматов предупреждает: ИИ — не волшебная палочка. Алгоритм может найти закономерности в звуках, но без наблюдений за поведением в реальной среде эти закономерности не имеют смысла. Нужно не просто записать тысячи часов звуков — нужно соотнести их с тем, что животные в этот момент делают. Иначе любые попытки разговаривать с животными так и останутся красивой метафорой.

Как искусственный интеллект и машинное обучение расшифровывают звуки животных

Элоди Брифер, специалист по поведению животных из Копенгагенского университета, объясняет: вокализации животных несут множество типов информации — от идентичности особи до её эмоционального состояния, статуса и даже описания внешних событий. Всё это, в теории, может уловить ИИ.

Ключевую роль играет машинное обучение — разновидность ИИ, которая анализирует данные без жёстких правил. Алгоритм обрабатывает записи и сам находит паттерны. Это та же технология, что стоит за предиктивным текстом в смартфоне и голосовыми помощниками. Разница в том, что «языковые модели» для животных строятся не на словах, а на звуковых сигналах — щелчках, свистах, хрюканье, ультразвуке.

По словам Брифер, преимущество машинного обучения — в масштабе. Там, где человек потратит годы на ручной анализ записей, алгоритм обработает тысячи часов и найдёт закономерности, которые исследователь мог бы пропустить.

Проект Earth Species: расшифровка языка животных

Одна из ключевых организаций в этой области — некоммерческий Earth Species Project, посвящённый расшифровке общения животных с помощью ИИ. Их подход строится на идее, что язык можно представить как геометрическую форму — нечто вроде галактики, где каждое «слово» является звездой, а расстояния между звёздами кодируют смысловые связи. Если формы двух языков совпадают, их можно «наложить» друг на друга и таким образом перевести.

В конце 2021 года Earth Species Project опубликовал в журнале Scientific Reports работу, в которой описал алгоритм, решающий так называемую «проблему коктейльной вечеринки». Представьте шумную вечеринку: множество голосов звучат одновременно, и понять, кто именно говорит, почти невозможно. Та же проблема возникает при записи звуков в группе животных. Алгоритм Earth Species Project сумел определить, какой конкретный дельфин, макак или летучая мышь «говорит» в группе.

Исследователи анализируют спектрограммы звуков животных

Исследователи анализируют спектрограммы звуков животных

Сегодня проект создаёт NatureLM-audio — первую в мире большую аудиоязыковую модель, специально разработанную для анализа вокализаций животных. Она обучена на огромных массивах данных: от человеческой речи и музыки до звуков окружающей среды. Первые результаты показывают, что паттерны, извлечённые из человеческой речи, действительно помогают лучше понимать звуки других видов.

Язык китов и дельфинов изучают Project CETI и DolphinGemmaю

Другой крупный проект — Project CETI (Cetacean Translation Initiative) — сосредоточен на кашалотах. Эти киты общаются ритмичными сериями щелчков, называемыми «кодами». Раньше учёные считали эти звуки чем-то вроде азбуки Морзе. Исследования с использованием генеративных нейросетей (GAN) показали кое-что поразительное: акустические свойства щелчков кашалотов напоминают гласные звуки человеческой речи — с различиями по длительности, частоте и траектории, совсем как у людей.

Исследователи CETI уже идентифицировали 156 различных код и их базовые компоненты — фактически «фонетический алфавит кашалотов». Проект объединяет около 50 учёных из восьми институтов: лингвистов, робототехников, криптографов и морских биологов.

На стороне дельфинов тоже есть новости. Wild Dolphin Project, основанный Дениз Херцинг, в 2013 году добился примечательного результата: исследователи научили группу дельфинов ассоциировать определённый свист с саргассовыми водорослями. Алгоритм машинного обучения затем сумел распознать этот свист в естественной среде. А совсем недавно Google совместно с Wild Dolphin Project и Технологическим институтом Джорджии представил DolphinGemma — ИИ-модель на основе архитектуры Gemma, обученную на многолетней базе звуков атлантических пятнистых дельфинов.

Кашалот в океане: учёные расшифровывают структуру его щелчков-код

Кашалот в океане: учёные расшифровывают структуру его щелчков-код

DolphinGemma работает по принципу «звук на входе — звук на выходе»: модель анализирует последовательности дельфиньих звуков и предсказывает, какой звук последует дальше — примерно как языковая модель предсказывает следующее слово в предложении. При этом модель достаточно компактна (около 400 миллионов параметров), чтобы работать прямо на смартфоне Google Pixel — прямо в поле, под водой.

Как ИИ распознаёт эмоции животных по звукам

Не только китообразные привлекают внимание исследователей. Элоди Брифер и её коллеги обучили ИИ-систему распознавать положительные и отрицательные эмоции в хрюканье, визге и похрюкивании свиней. Это не абстрактное упражнение — понимание эмоций сельскохозяйственных животных может напрямую улучшить условия их содержания.

У грызунов ситуация ещё интереснее. Мыши и крысы общаются в ультразвуковом диапазоне — их «разговоры» человеческое ухо просто не воспринимает. Программа DeepSqueak, разработанная учёными Вашингтонского университета, переводит ультразвуковые сигналы в спектрограммы (визуальные изображения звука) и анализирует их с помощью нейросетей. Оказалось, что у грызунов около 20 типов вокализаций, и они используют разные «песни» в зависимости от ситуации — например, самцы мышей по-разному «поют» в присутствии другого самца и рядом с самкой.

Зачем учёные используют ИИ для понимания языка животных

Помимо очевидного (наконец узнать, что на самом деле думает ваш кот) понимание коммуникации животных имеет вполне практические последствия. Для домашних и сельскохозяйственных животных это вопрос благополучия.

«Для видов, которые живут рядом с нами, понимание их состояния критически важно, потому что их благополучие зависит от нас», — говорит Элоди Брифер, специалист по поведению животных.

Но масштаб потенциальных изменений гораздо шире. Если окажется, что у животных действительно есть элементы языка, это может заставить пересмотреть отношение к ним — в спорте, развлечениях, научных экспериментах и сельском хозяйстве. И дело не только в коммуникации: всё больше данных показывает, что многие виды разумнее, чем мы думали. Учёные из Project CETI уже сотрудничают с юристами из Нью-Йоркского университета, изучая, как открытия в области коммуникации кашалотов могут повлиять на правовой статус животных.

Есть и фундаментальный научный интерес. Изучение коммуникации животных может рассказать нам об эволюции языка как такового.

Дениз Херцинг добавляет ещё более амбициозную перспективу: «Инструменты, которые мы разрабатываем для видов на Земле, могут пригодиться для далёких миров — если мы когда-нибудь встретим другие формы жизни».

Еще больше познавательных статей вы найдете в нашем канале в MAX. Подпишитесь прямо сейчас!

Важно сохранять трезвый взгляд: до реального «разговора» с животными ещё очень далеко. Машинное обучение помогает находить паттерны в звуках, но превращение паттернов в смысл — отдельная и гораздо более сложная задача, которая невозможна без многолетних полевых наблюдений. Тем не менее впервые в истории у учёных есть инструменты, позволяющие обрабатывать данные о коммуникации животных в масштабах, которые раньше были просто немыслимы. И каждый найденный паттерн — это ещё один шаг к пониманию того, насколько сложен и богат мир, который мы делим с миллионами других видов.