JetBrains Research — наука, меняющая мир

Agent57: Outperforming the Atari Human Benchmark

Atari57 в последние несколько лет является, наверно, одним из самых популярных наборов сред для обучения с подкреплением, сочетая в себе большое количество разнообразных задач для проверки качества алгоритмов. Большинство алгоритмов обучения с подкреплением успешно превосходят людей в большей части из этих игр, однако до настоящего момента ни один из алгоритмов не мог показывать стабильно высокие результаты во всех играх из представленных.

На семинаре мы рассмотрим статью с алгоритмом Agent57, который стабильно превосходит human baseline в каждой из 57 игр путем сочетания комбинации подходов для эффективного исследования среды и адаптивного механизма выбора между exploration и exploitation

Докладчик: Роман Бельтюков.

Язык доклада: русский.

Дата и время: 6-е апреля, 18:30-20:00.

Место: https://zoom.us/j/721102369

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars