Лаборатория искусственного интеллекта
Generating Adjacency-Constrained Subgoals in Hierarchical Reinforcement Learning
Уважаемые коллеги,
приглашаем Вас посетить семинар 'Generating Adjacency-Constrained Subgoals in Hierarchical Reinforcement Learning'.
На сегодняшний день одним из многообещающих подходов, который позволит значительно расширить область применения обучения с подкреплением является целенаправленное иерархическое обучение. Данный подход уже показал себя во многих задачах с долгосрочным присвоением кредита и редкими вознаграждениями.
Однако, при большой размерности пространства целей, возникают трудности как с генерацией подцелей на высоком уровне так и с обучением политики на низком уровне, вследствие чего рассматриваемый подход может оказаться неэффективным. Авторы статьи, о которой пойдет речь, показали, что эта проблема может быть успешно решена путем ограничения пространства действий высокого уровня от всего пространства действий до k-шаговой смежной области текущего состояния.
На семинаре поговорим о теоретическом обосновании подхода, его реализации путем обучения сети смежности, способной различать смежные и несмежные подцели. Также рассмотрим конкретные результаты, которые наглядно продемонстрируют превосходство представленного подхода над SOTA методами в области иерархического обучения с подкреплением.
Докладчик: Мельцер Сергей.
Язык доклада: русский.
Дата и время: 8-е февраля, 20:00.
https://us02web.zoom.us/j/721102369?pwd=S0lCc0ZjeGlGZSsvMTkzbUVJU1podz09
Meeting ID: 721 102 369
Passcode: 024498