Система Google может описать любое изображение понятным языком

Артем Батогов

Современное программное обеспечение уже способно распознать различные объекты на изображении, но оно не может описать увиденное. Однако скоро это может измениться, так как в игру вступают специалисты Google и Стенфордского университета.

Система описания изображения

Их система сочетает в себе две нейронные сети, каждая из которых отвечает за свои задачи. Первая сеть разработана непосредственно для распознавания изображений, в свою очередь, вторая сеть описывает простыми словами увиденную сцену.

Например, вместо того чтобы просто описать изображение как «мотоцикл и человек», система старается более подробно объяснить, что же изображено на картинке: «человек едет на мотоцикле по грязной грунтовой дороге».

Система описания изображения

Конечно, данная система находится на стадии разработки, и в текущий момент она часто может допускать ошибки, сообщает ресурс Engadget. Главной проблемой является маленькая «база знаний» нейронной системы, поэтому в ближайшее время разработчики будут вплотную заниматься обучением сети.

В будущем система описания изображения может найти широкое применение в области искусственного интеллекта и робототехники. Хотя, конечно, до этого момента еще пройдет немало времени.

Новости партнеров
Председатель Bitmine ждёт болезненной коррекции крипторынка в 2026 году. Стоит ли ему верить?
Председатель Bitmine ждёт болезненной коррекции крипторынка в 2026 году. Стоит ли ему верить?
ТОП-6 Айфонов до 25 тысяч рублей для тех, кто не хочет устанавливать мессенджер MAX на основной
ТОП-6 Айфонов до 25 тысяч рублей для тех, кто не хочет устанавливать мессенджер MAX на основной
Как память объемом 128, 256 и 512 ГБ меняет вес смартфона
Как память объемом 128, 256 и 512 ГБ меняет вес смартфона