Google «заговорил» человеческим голосом

Специалисты поискового гиганта Google опубликовали статью, в которой рассказали о том, что создали генератор речи, способный говорить неотличимым от живого человека голосом. Разработка называется Tacotron 2 и умеет очень качественно преобразовывать текст в речь.

Google «заговорил» человеческим голосом. Фото.

Программа представляет собой две взаимосвязанные нейросети глубокого обучения. Первая нейросеть создаёт на основе текста спектрограмму и передаёт её второму алгоритму WaveNet, который её и озвучивает «голосом». Tacotron 2 знает множество нюансов, без труда справляется со сложными в произношении словами и, читая с листа, учитывает пунктуацию. Благодаря этому, например, она различает конец предложения и начало нового, выделяя их интонацией.

Образцы работы приложения специалисты уже выложили на страничке, посвящённой разработке. Звучит это гораздо лучше, чем монотонные механические голоса современных программ озвучивания, поэтому, надо полагать, Google быстро найдёт разработке применение. WaveNet уже используется в Google Assistant, поэтому Tacotron 2 наверняка станет для неё отличным дополнением.

На данном этапе разработки Tacotron 2 говорит только приятным женским голосом, но, вероятно, в будущем обзаведётся и мужским вариантом, а, учитывая её способность к обучению, возможно, научится и имитировать другие голоса.

Новости партнеров
Романтические схемы обмана в криптовалютах набирают обороты ко Дню святого Валентина. Что происходит?
Романтические схемы обмана в криптовалютах набирают обороты ко Дню святого Валентина. Что происходит?
Как сделать экран смартфона матовым без пленок? Достаточно включить секретный режим в HyperOS
Как сделать экран смартфона матовым без пленок? Достаточно включить секретный режим в HyperOS
Apple назвала дату первой презентации 2026 года. Когда она пройдет и что на ней покажут
Apple назвала дату первой презентации 2026 года. Когда она пройдет и что на ней покажут