Лаборатория искусственного интеллекта
Improving Generalization in Reinforcement Learning with Mixture Regularization
В глубоком обучении с подкреплением агенты обучаются на ограниченном наборе сред , что приводит к переобучению и плохому обобщению на новых средах. Данная проблема является серьезным препятствием в использовании RL в реальных приложениях.
Одна из ключевых причин плохой обобщаемости на новых средах - это ограниченная разнородность данных.
Существуют разные методы увлечения данных и их разнородности. В данной статье будет представлен новый метод mixreg, который тренирует агентов на смеси наблюдений из различных сред, что позволяет наиболее эффективно увеличивать разнородность данных. В рамках данного доклада будет обсуждаться эффективность данного метода, его применение к различным RL алгоритмам на примере Procgen benchmark.
Докладчик: Полякова Анна.
Язык доклада: русский.
Дата и время: 25-е ноября, 20:00-21:30.
Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars
Для получения рассылки о семинаре (с ссылкой на Zoom) - пишите Алексею Шпильману на alexey@shpilman.com.