Исследовательская группа

Агентные системы и обучение с подкреплением

Модели мира в обучении с подкреплением

September 24

На семинаре будет обсуждаться статья, в которой исследуется способ обучения основанных на нейронных сетях генеративных моделей окружений, часто используемых для обучения с подкреплением.

Построенная модель мира может быть быстро обучена сжатому пространственному и временному представлению окружения.

Так же благодаря признаком, которые учится выделять модель мира, можно обучить компактного агента с простой политикой, который будет эффективно решать поставленную задачу.

Более того, агента можно обучить используя только модель мира без доступа к ральному окружению.

Докладчик: Олег Свидченко

Язык доклада: русский.

Дата и время: 24-е сентября, 18:30-20:00.

Место: Таймс, аудитория 204.

Материалы