Система Google может описать любое изображение понятным языком

Артем Батогов

Современное программное обеспечение уже способно распознать различные объекты на изображении, но оно не может описать увиденное. Однако скоро это может измениться, так как в игру вступают специалисты Google и Стенфордского университета.

Система описания изображения

Их система сочетает в себе две нейронные сети, каждая из которых отвечает за свои задачи. Первая сеть разработана непосредственно для распознавания изображений, в свою очередь, вторая сеть описывает простыми словами увиденную сцену.

Например, вместо того чтобы просто описать изображение как «мотоцикл и человек», система старается более подробно объяснить, что же изображено на картинке: «человек едет на мотоцикле по грязной грунтовой дороге».

Система описания изображения

Конечно, данная система находится на стадии разработки, и в текущий момент она часто может допускать ошибки, сообщает ресурс Engadget. Главной проблемой является маленькая «база знаний» нейронной системы, поэтому в ближайшее время разработчики будут вплотную заниматься обучением сети.

В будущем система описания изображения может найти широкое применение в области искусственного интеллекта и робототехники. Хотя, конечно, до этого момента еще пройдет немало времени.

Новости партнеров
Изображения нового чехла для iPhone 17 Pro. Это фейк?
Изображения нового чехла для iPhone 17 Pro. Это фейк?
Сеть Solana установила рекорд по пропускной способности. Сколько транзакций может обработать блокчейн?
Сеть Solana установила рекорд по пропускной способности. Сколько транзакций может обработать блокчейн?
Чем уникален Google Pixel 10 Pro Fold и почему это лучший складной телефон
Чем уникален Google Pixel 10 Pro Fold и почему это лучший складной телефон