Искусственный интеллект уже помогает нам командовать Siri и Alexa, но что, если направить эту технологию на другие виды? Несколько крупных научных проектов используют машинное обучение, чтобы расшифровать общение животных. Полноценный «разговор» с котом пока остаётся фантастикой, но первые результаты впечатляют и ставят серьёзные вопросы о природе языка вообще. Неудивительно, что к этой теме такое внимание: учёным уже даже удалось поговорить с китом в ходе отдельного эксперимента.

Может ли искусственный интеллект научить нас понимать животных? Ответ экспертов
Есть ли язык у животных и как это проверяют учёные
Прежде чем что-то «переводить», нужно понять: а что именно мы переводим? Люди общаются словами, жестами, мимикой. Животные тоже используют сложные сигналы — собаки виляют хвостом, пчёлы танцуют, дельфины щёлкают и свистят, а слоны, как выяснилось, могут обращаться друг к другу по имени. Но можно ли это считать языком?
Дениз Херцинг, научный руководитель Wild Dolphin Project, объясняет ситуацию так: мы пока не знаем, есть ли у животных настоящий язык, но ИИ способен обнаружить в их общении языкоподобные структуры — элементы, напоминающие грамматику или словарь. Если такие паттерны найдутся, это станет серьёзным аргументом в пользу того, что животные общаются сложнее, чем мы думали.
Почему ИИ всегда соглашается с вами и редко спорит: причина может вас насторожить
И здесь появляется главная сложность. Юлия Фишер из Немецкого центра изучения приматов предупреждает: ИИ — не волшебная палочка. Алгоритм может найти закономерности в звуках, но без наблюдений за поведением в реальной среде эти закономерности не имеют смысла. Нужно не просто записать тысячи часов звуков — нужно соотнести их с тем, что животные в этот момент делают. Иначе любые попытки разговаривать с животными так и останутся красивой метафорой.
Как искусственный интеллект и машинное обучение расшифровывают звуки животных
Элоди Брифер, специалист по поведению животных из Копенгагенского университета, объясняет: вокализации животных несут множество типов информации — от идентичности особи до её эмоционального состояния, статуса и даже описания внешних событий. Всё это, в теории, может уловить ИИ.
Ключевую роль играет машинное обучение — разновидность ИИ, которая анализирует данные без жёстких правил. Алгоритм обрабатывает записи и сам находит паттерны. Это та же технология, что стоит за предиктивным текстом в смартфоне и голосовыми помощниками. Разница в том, что «языковые модели» для животных строятся не на словах, а на звуковых сигналах — щелчках, свистах, хрюканье, ультразвуке.
По словам Брифер, преимущество машинного обучения — в масштабе. Там, где человек потратит годы на ручной анализ записей, алгоритм обработает тысячи часов и найдёт закономерности, которые исследователь мог бы пропустить.
Проект Earth Species: расшифровка языка животных
Одна из ключевых организаций в этой области — некоммерческий Earth Species Project, посвящённый расшифровке общения животных с помощью ИИ. Их подход строится на идее, что язык можно представить как геометрическую форму — нечто вроде галактики, где каждое «слово» является звездой, а расстояния между звёздами кодируют смысловые связи. Если формы двух языков совпадают, их можно «наложить» друг на друга и таким образом перевести.
В конце 2021 года Earth Species Project опубликовал в журнале Scientific Reports работу, в которой описал алгоритм, решающий так называемую «проблему коктейльной вечеринки». Представьте шумную вечеринку: множество голосов звучат одновременно, и понять, кто именно говорит, почти невозможно. Та же проблема возникает при записи звуков в группе животных. Алгоритм Earth Species Project сумел определить, какой конкретный дельфин, макак или летучая мышь «говорит» в группе.

Исследователи анализируют спектрограммы звуков животных
Сегодня проект создаёт NatureLM-audio — первую в мире большую аудиоязыковую модель, специально разработанную для анализа вокализаций животных. Она обучена на огромных массивах данных: от человеческой речи и музыки до звуков окружающей среды. Первые результаты показывают, что паттерны, извлечённые из человеческой речи, действительно помогают лучше понимать звуки других видов.
Язык китов и дельфинов изучают Project CETI и DolphinGemmaю
Другой крупный проект — Project CETI (Cetacean Translation Initiative) — сосредоточен на кашалотах. Эти киты общаются ритмичными сериями щелчков, называемыми «кодами». Раньше учёные считали эти звуки чем-то вроде азбуки Морзе. Исследования с использованием генеративных нейросетей (GAN) показали кое-что поразительное: акустические свойства щелчков кашалотов напоминают гласные звуки человеческой речи — с различиями по длительности, частоте и траектории, совсем как у людей.
Исследователи CETI уже идентифицировали 156 различных код и их базовые компоненты — фактически «фонетический алфавит кашалотов». Проект объединяет около 50 учёных из восьми институтов: лингвистов, робототехников, криптографов и морских биологов.
На стороне дельфинов тоже есть новости. Wild Dolphin Project, основанный Дениз Херцинг, в 2013 году добился примечательного результата: исследователи научили группу дельфинов ассоциировать определённый свист с саргассовыми водорослями. Алгоритм машинного обучения затем сумел распознать этот свист в естественной среде. А совсем недавно Google совместно с Wild Dolphin Project и Технологическим институтом Джорджии представил DolphinGemma — ИИ-модель на основе архитектуры Gemma, обученную на многолетней базе звуков атлантических пятнистых дельфинов.

Кашалот в океане: учёные расшифровывают структуру его щелчков-код
DolphinGemma работает по принципу «звук на входе — звук на выходе»: модель анализирует последовательности дельфиньих звуков и предсказывает, какой звук последует дальше — примерно как языковая модель предсказывает следующее слово в предложении. При этом модель достаточно компактна (около 400 миллионов параметров), чтобы работать прямо на смартфоне Google Pixel — прямо в поле, под водой.
Как ИИ распознаёт эмоции животных по звукам
Не только китообразные привлекают внимание исследователей. Элоди Брифер и её коллеги обучили ИИ-систему распознавать положительные и отрицательные эмоции в хрюканье, визге и похрюкивании свиней. Это не абстрактное упражнение — понимание эмоций сельскохозяйственных животных может напрямую улучшить условия их содержания.
У грызунов ситуация ещё интереснее. Мыши и крысы общаются в ультразвуковом диапазоне — их «разговоры» человеческое ухо просто не воспринимает. Программа DeepSqueak, разработанная учёными Вашингтонского университета, переводит ультразвуковые сигналы в спектрограммы (визуальные изображения звука) и анализирует их с помощью нейросетей. Оказалось, что у грызунов около 20 типов вокализаций, и они используют разные «песни» в зависимости от ситуации — например, самцы мышей по-разному «поют» в присутствии другого самца и рядом с самкой.
Зачем учёные используют ИИ для понимания языка животных
Помимо очевидного (наконец узнать, что на самом деле думает ваш кот) понимание коммуникации животных имеет вполне практические последствия. Для домашних и сельскохозяйственных животных это вопрос благополучия.
«Для видов, которые живут рядом с нами, понимание их состояния критически важно, потому что их благополучие зависит от нас», — говорит Элоди Брифер, специалист по поведению животных.
Но масштаб потенциальных изменений гораздо шире. Если окажется, что у животных действительно есть элементы языка, это может заставить пересмотреть отношение к ним — в спорте, развлечениях, научных экспериментах и сельском хозяйстве. И дело не только в коммуникации: всё больше данных показывает, что многие виды разумнее, чем мы думали. Учёные из Project CETI уже сотрудничают с юристами из Нью-Йоркского университета, изучая, как открытия в области коммуникации кашалотов могут повлиять на правовой статус животных.
Есть и фундаментальный научный интерес. Изучение коммуникации животных может рассказать нам об эволюции языка как такового.
Дениз Херцинг добавляет ещё более амбициозную перспективу: «Инструменты, которые мы разрабатываем для видов на Земле, могут пригодиться для далёких миров — если мы когда-нибудь встретим другие формы жизни».
Еще больше познавательных статей вы найдете в нашем канале в MAX. Подпишитесь прямо сейчас!
Важно сохранять трезвый взгляд: до реального «разговора» с животными ещё очень далеко. Машинное обучение помогает находить паттерны в звуках, но превращение паттернов в смысл — отдельная и гораздо более сложная задача, которая невозможна без многолетних полевых наблюдений. Тем не менее впервые в истории у учёных есть инструменты, позволяющие обрабатывать данные о коммуникации животных в масштабах, которые раньше были просто немыслимы. И каждый найденный паттерн — это ещё один шаг к пониманию того, насколько сложен и богат мир, который мы делим с миллионами других видов.



Новости, статьи и анонсы публикаций
Чат с читателямиСвободное общение и обсуждение материалов