Исследовательская группа

Агентные системы и обучение с подкреплением

Contrastive learning for Dreamer

7 октября 2020

Dreamer — современный model-based метод обучения с подкреплением, позволяющий значительно сократить взаимодействие со средой при обучении. Важной его составляющей является модель, сжимающая наблюдение получаемое в виде изображения в небольшое латентное представление. Такая модель обычно реализуется в виде вариационного автокодировщика. Однако подход основаный на автокодировщике часто приводит к исчезновению маленьких, но важных при обучении объектов.

В недавней статье был предложен альтернативный способ получения латентного представления, основанный на constrastive learning. На семинаре мы разберем предложенное решение и обсудим полученные результаты.

Докладчик: Константин Махнев.

Язык доклада: русский.

Дата и время: 7-е октября, 20:00-21:30.

Место: https://us02web.zoom.us/j/721102369

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Для получения рассылки о семинаре (с паролем от Zoom) - пишите Алексею Шпильману на alexey@shpilman.com.

Дополнительно