Система Google может описать любое изображение понятным языком

Современное программное обеспечение уже способно распознать различные объекты на изображении, но оно не может описать увиденное. Однако скоро это может измениться, так как в игру вступают специалисты Google и Стенфордского университета.


Их система сочетает в себе две нейронные сети, каждая из которых отвечает за свои задачи. Первая сеть разработана непосредственно для распознавания изображений, в свою очередь, вторая сеть описывает простыми словами увиденную сцену.

Например, вместо того чтобы просто описать изображение как «мотоцикл и человек», система старается более подробно объяснить, что же изображено на картинке: «человек едет на мотоцикле по грязной грунтовой дороге».

Конечно, данная система находится на стадии разработки, и в текущий момент она часто может допускать ошибки, сообщает ресурс Engadget. Главной проблемой является маленькая «база знаний» нейронной системы, поэтому в ближайшее время разработчики будут вплотную заниматься обучением сети.

В будущем система описания изображения может найти широкое применение в области искусственного интеллекта и робототехники. Хотя, конечно, до этого момента еще пройдет немало времени.

Новости партнеров
Как добавить доверенный контакт на Госуслугах и защитить свой аккаунт
Как добавить доверенный контакт на Госуслугах и защитить свой аккаунт
Биткоин, DeFi и токенизация — ключевые драйверы роста крипторынка в 2026 году. Почему?
Биткоин, DeFi и токенизация — ключевые драйверы роста крипторынка в 2026 году. Почему?
Xiaomi обещает 5 лет гарантии на батарею в Redmi Turbo 5 Max: если емкость упадет, ее заменят бесплатно
Xiaomi обещает 5 лет гарантии на батарею в Redmi Turbo 5 Max: если емкость упадет, ее заменят бесплатно