Исследовательская группа

Агентные системы и обучение с подкреплением

Generating Adjacency-Constrained Subgoals in Hierarchical Reinforcement Learning

February 8

Уважаемые коллеги, 
приглашаем Вас посетить семинар 'Generating Adjacency-Constrained Subgoals in Hierarchical Reinforcement Learning'.

На сегодняшний день одним из многообещающих подходов, который позволит значительно расширить область применения обучения с подкреплением является целенаправленное иерархическое обучение. Данный подход уже показал себя во многих задачах с долгосрочным присвоением кредита и редкими вознаграждениями. 

Однако, при большой размерности пространства целей, возникают трудности как с генерацией подцелей на высоком уровне так и с обучением политики на низком уровне, вследствие чего рассматриваемый подход может оказаться неэффективным. Авторы статьи, о которой пойдет речь, показали, что эта проблема может быть успешно решена путем ограничения пространства действий высокого уровня от всего пространства действий до k-шаговой смежной области текущего состояния.

На семинаре поговорим о теоретическом обосновании подхода, его реализации путем обучения сети смежности, способной различать смежные и несмежные подцели. Также рассмотрим конкретные результаты, которые наглядно продемонстрируют превосходство представленного подхода над SOTA методами в области иерархического обучения с подкреплением.

Докладчик: Мельцер Сергей.

Язык доклада: русский.

Дата и время: 8-е февраля, 20:00.

https://us02web.zoom.us/j/721102369?pwd=S0lCc0ZjeGlGZSsvMTkzbUVJU1podz09

Meeting ID: 721 102 369

Passcode: 024498