В Петербурге в четверг, 21 ноября, представили технологию синтеза речи на основе нейросетей.

С помощью усовершенствованной системе звучание предложения при прочтении текста удалось сделать более плавными и выразительными. Такого прогресса удалось добиться за счет того, что аудиосигналы генерируются нейросетевыми моделями. В технологии используют модуль, который предсказывает ударения в словах, не имеющихся во вложенной базе словаря. Также модуль способен на автоисправление орфографических ошибок.

Как рассказали в Сбербанке, система будет работать на русском, английском и казахском языках. Предполагается, что после следующего года начнут разработку технологии, которая будет имитировать человека почти на 100%.