JetBrains Research — наука, меняющая мир

Перенос знаний между решениями различных видов задач в policy gradient методах

Возможность к обобщению - одна из важных задач в машинном обучении. В обучении с подкреплением она часто встречается в виде задаче об обучении многозадачного агента, который должен не только научиться решать несколько различных задач, но и уметь переносить свой опыт на другие задачи.

На семинаре мы поговорим об одном из подходов к переиспользованию знаний агента, а так же разберем одну из первых статей, в которой предлагается и теоретически обосновывается способ переноса знаний между средами, имеющими различные пространства состояний и действий. Особенность данного метода заключается в том, что он позволяет эффективно учиться решать новые задачи, которые он ранее не решал.

Докладчик: Олег Свидченко.

Язык доклада: русский.

Дата и время: 12-е февраля, 18:30-20:00.

Место: Таймс, аудитория 204.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars