Агентные системы и обучение с подкреплением
Contrastive learning for Dreamer
Dreamer — современный model-based метод обучения с подкреплением, позволяющий значительно сократить взаимодействие со средой при обучении. Важной его составляющей является модель, сжимающая наблюдение получаемое в виде изображения в небольшое латентное представление. Такая модель обычно реализуется в виде вариационного автокодировщика. Однако подход основаный на автокодировщике часто приводит к исчезновению маленьких, но важных при обучении объектов.
В недавней статье был предложен альтернативный способ получения латентного представления, основанный на constrastive learning. На семинаре мы разберем предложенное решение и обсудим полученные результаты.
Докладчик: Константин Махнев.
Язык доклада: русский.
Дата и время: 7-е октября, 20:00-21:30.
Место: https://us02web.zoom.us/j/721102369
Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars
Для получения рассылки о семинаре (с паролем от Zoom) - пишите Алексею Шпильману на alexey@shpilman.com.