Агентные системы и обучение с подкреплением
Перенос знаний между решениями различных видов задач в policy gradient методах
Возможность к обобщению - одна из важных задач в машинном обучении. В обучении с подкреплением она часто встречается в виде задаче об обучении многозадачного агента, который должен не только научиться решать несколько различных задач, но и уметь переносить свой опыт на другие задачи.
На семинаре мы поговорим об одном из подходов к переиспользованию знаний агента, а так же разберем одну из первых статей, в которой предлагается и теоретически обосновывается способ переноса знаний между средами, имеющими различные пространства состояний и действий. Особенность данного метода заключается в том, что он позволяет эффективно учиться решать новые задачи, которые он ранее не решал.
Докладчик: Олег Свидченко.
Язык доклада: русский.
Дата и время: 12-е февраля, 18:30-20:00.
Место: Таймс, аудитория 204.
Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars