Агентные системы и обучение с подкреплением
Исследование среды с помощью моделей мира
Исследование среды является одной из важнейших проблем в обучении с подкреплением. Во многом это связано с тем, что для эффективного обучения агенту необходимо получать достаточно разнообразный опыт взаимодействия со средой. На данный момент существует уже достаточно большое количество методов, которые позволяют решать трудные с точки зрения исследования среды задачи. Тем не менее, задача эффективного исследования среды в общем случае является не решенной. Большинство современных подходов основаны на идее внутреннего вознаграждения за новизну информации, полученной агентом о среде.
На семинаре мы разберем статьи "Novelty Search in Representational Space for Sample Efficient Exploration" и "Latent World Models For Intrinsically Motivated Exploration", а также сравним их с другими современными подходами, использующими intrinsic reward.
Докладчики: Александр Никулин и Свидченко Олег.
Язык доклада: русский.
Дата и время: 1-е февраля, 20:00-21:30.
https://us02web.zoom.us/j/721102369?pwd=S0lCc0ZjeGlGZSsvMTkzbUVJU1podz09
Meeting ID: 721 102 369
Passcode: 024498