Исследовательская группа

Агентные системы и обучение с подкреплением

Improving Generalization in Reinforcement Learning with Mixture Regularization

November 25

В глубоком обучении с подкреплением агенты обучаются на ограниченном наборе сред , что приводит к переобучению и плохому обобщению на новых средах. Данная проблема является серьезным препятствием в использовании RL в реальных приложениях.

Одна из ключевых причин плохой обобщаемости на новых средах - это ограниченная разнородность данных.

Существуют разные методы увлечения данных и их разнородности. В данной статье будет представлен новый метод mixreg, который тренирует агентов на смеси наблюдений из различных сред, что позволяет наиболее эффективно увеличивать разнородность данных. В рамках данного доклада будет обсуждаться эффективность данного метода, его применение к различным RL алгоритмам на примере Procgen benchmark.

Докладчик: Полякова Анна.

Язык доклада: русский.

Дата и время: 25-е ноября, 20:00-21:30.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Для получения рассылки о семинаре (с ссылкой на Zoom) - пишите Алексею Шпильману на alexey@shpilman.com.