Исследовательская группа

Прикладное машинное обучение и глубокое обучение

VoiceFilter-Lite: целевое разделение голоса при потоковой передаче для распознавания речи на устройстве

March 23

Феномен коктейльной вечеринки заключается в способности слушателя фокусироваться на одном конкретном раздражителе, игнорируя другие. Большинство людей с легкостью справляются с этой задачей, чего нельзя сказать о системах автоматического распознавания речи.

В статье, которая будет рассмотрена на семинаре, авторы представляют VoiceFilter Lite – одноканальную модель разделения речевых сигналов, являющуюся частью системы распознавания речи при потокой передаче сигнала. Модель принимает на вход перекрываемый шумом сигнал таргет-спикера и сохраняет его в чистом виде. 

На семинаре поймём: зачем авторы модели использовали асимметрическую лосс-функцию и механизм адаптивного подавления шума, а также обсудим, как авторы статьи предлагают квантовать VoiceFilter Lite в 8-битную целочисленную модель, чтобы запускать модель на мобильных устройствах в режиме реального времени.

Докладчик: Дарья Дятлова.

Язык доклада: русский.

Дата и время: 23-е марта, 20:00.

https://us02web.zoom.us/j/430117051?pwd=TzdKNGRaUCsyMUZBL1UwWTlsOW8yZz09

Meeting ID: 430 117 051

Passcode: 025987