Исследовательская группа

Прикладное машинное обучение и глубокое обучение

Синтез речи в 2020

April 6

Синтез речи в 2020 году достиг уже достаточного качества, чтобы синтезированную речь можно было спутать с записью настоящего человека. На семинаре рассмотрим, как так получилось.

Будут рассказаны основы работы с аудио и речью для тех, кто никогда ранее не работал в этой области. Будут подробно рассмотрены самые популярные архитектуры для синтеза речи, такие как Tacotron, FastSpeech, будут рассмотрены их основные недостатки и способы их устранения. Будут также подробно рассмотрены различные вокодеры (и будет рассказано, что это такое): от WaveNet и LPCNet до WaveFLow.

Докладчик: Сергей Полежаев.

Язык доклада: русский.

Дата и время: 6-е апреля, 20:00-21:30.

Место: https://zoom.us/j/430117051.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Материалы