Агентные системы и обучение с подкреплением
Dream To Control
Большинство существующих алгоритмов обучения с подкреплением исходят из того, что то, как устроена среда, нам не известно. Это накладывает существенные ограничения на возможности обучения агента и класса используемых алгоритмов. Благодаря глубокому обучению, мы можем создать искусственную модель динамики среды тем самым обойдя эти ограничения. Имея такую модель, мы можем применить ее разными способами для повышения эффективности агента.
На семинаре мы рассмотрим две статьи, которые предлагают способы использования обучаемой модели среды, и обсудим преимущества и недостатки каждого из подходов.
Докладчик: Олег Свидченко.
Язык доклада: русский.
Дата и время: 22-е марта, 18:30-20:00.
Место: https://zoom.us/j/721102369
Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars