Система Google может описать любое изображение понятным языком

Артем Батогов

Современное программное обеспечение уже способно распознать различные объекты на изображении, но оно не может описать увиденное. Однако скоро это может измениться, так как в игру вступают специалисты Google и Стенфордского университета.

Система описания изображения

Их система сочетает в себе две нейронные сети, каждая из которых отвечает за свои задачи. Первая сеть разработана непосредственно для распознавания изображений, в свою очередь, вторая сеть описывает простыми словами увиденную сцену.

Например, вместо того чтобы просто описать изображение как «мотоцикл и человек», система старается более подробно объяснить, что же изображено на картинке: «человек едет на мотоцикле по грязной грунтовой дороге».

Система описания изображения

Конечно, данная система находится на стадии разработки, и в текущий момент она часто может допускать ошибки, сообщает ресурс Engadget. Главной проблемой является маленькая «база знаний» нейронной системы, поэтому в ближайшее время разработчики будут вплотную заниматься обучением сети.

В будущем система описания изображения может найти широкое применение в области искусственного интеллекта и робототехники. Хотя, конечно, до этого момента еще пройдет немало времени.