Исследовательская группа

Прикладное машинное обучение и глубинное обучение

Generative Adversarial Networks for Waveform Synthesis

December 24

Уважаемые коллеги,

приглашаем Вас посетить семинар "Generative Adversarial Networks for Waveform Synthesis".
Моделирование звуковой аудио формы (Neural Vocoding) является особенно сложной задачей из-за высокого временного разрешения данных (обычно не менее 16000 сэмплов в секунду) и наличия структуры с разными временными рамками, с краткосрочными и долгосрочными зависимостями. Модели основанные на Генеративно-состязательных (GAN) сетях, совершившие большой скачок в этой области за последний год, превосходят аналоги по времени работы и меньшему количеству весов, не уступаю при этом по качеству.
На семинаре мы подробно рассмотрим как базовые GAN-вокодеры (Parallel WaveGAN, MelGAN) так и некоторые более продвинутые (MB-MelGAN, HiFi-GAN, HooliGAN) и сравним их по разным характеристикам перфоманса с сильными бейзлайнами (WaveNet, WaveGlow), в том числе и послушаем демо-записи, чтобы наглядно оценить качество их работы.

Докладчик: Беляев Владислав.
Язык доклада: русский.
Дата и время: 24-е декабря, 19:00-20:30.

Заходите в Zoom: https://clck.ru/Rbv3x

До встречи!