JetBrains Research — наука, меняющая мир

Dream To Control

Большинство существующих алгоритмов обучения с подкреплением исходят из того, что то, как устроена среда, нам не известно. Это накладывает существенные ограничения на возможности обучения агента и класса используемых алгоритмов. Благодаря глубокому обучению, мы можем создать искусственную модель динамики среды тем самым обойдя эти ограничения. Имея такую модель, мы можем применить ее разными способами для повышения эффективности агента.

На семинаре мы рассмотрим две статьи, которые предлагают способы использования обучаемой модели среды, и обсудим преимущества и недостатки каждого из подходов.

Докладчик: Олег Свидченко.

Язык доклада: русский.

Дата и время: 22-е марта, 18:30-20:00.

Место: https://zoom.us/j/721102369

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars