Система Google может описать любое изображение понятным языком

Современное программное обеспечение уже способно распознать различные объекты на изображении, но оно не может описать увиденное. Однако скоро это может измениться, так как в игру вступают специалисты Google и Стенфордского университета.


Их система сочетает в себе две нейронные сети, каждая из которых отвечает за свои задачи. Первая сеть разработана непосредственно для распознавания изображений, в свою очередь, вторая сеть описывает простыми словами увиденную сцену.

Например, вместо того чтобы просто описать изображение как «мотоцикл и человек», система старается более подробно объяснить, что же изображено на картинке: «человек едет на мотоцикле по грязной грунтовой дороге».

Конечно, данная система находится на стадии разработки, и в текущий момент она часто может допускать ошибки, сообщает ресурс Engadget. Главной проблемой является маленькая «база знаний» нейронной системы, поэтому в ближайшее время разработчики будут вплотную заниматься обучением сети.

В будущем система описания изображения может найти широкое применение в области искусственного интеллекта и робототехники. Хотя, конечно, до этого момента еще пройдет немало времени.

Новости партнеров
Почему Госуслуги просят создать Цифровой ID в MAX, и можно ли его не делать
Почему Госуслуги просят создать Цифровой ID в MAX, и можно ли его не делать
Крупные инвесторы начинают проявлять интерес к криптовалютам после обвала: мнение представителя фонда Bitwise
Крупные инвесторы начинают проявлять интерес к криптовалютам после обвала: мнение представителя фонда Bitwise
Apple случайно раскрыла, почему перестала разрабатывать Mac Pro
Apple случайно раскрыла, почему перестала разрабатывать Mac Pro