Research group

Agent Systems and Reinforcement Learning

Sample Efficiency in RL

27 April 2020

Чтобы добиться хороших результатов в любой из областей машинного обучения, нужно большое количество данных, например, для обучения агента, который может выполнять сложные задачи, получая на вход лишь набор пикселей, необходимо несколько миллионов взаимодействий со средой. Однако, во-первых, это требует много времени, а во-вторых, иногда нельзя позволить слишком много взаимодействовать со средой, например, когда агент обучается в реальном мире, а не на симуляции.

На семинаре будут рассмотрены существующие подходы к уменьшению количества взаимодействий со средой в RL, а также SOTA алгоритм Contrastive Unsupervised Representation for Reinforcement Learning, вобравший в себя идеи из разных областей машинного обучения.

Докладчик: Владислав Мосин.

Язык доклада: русский.

Дата и время: 27-е апреля, 18:30-20:00.

Место: https://zoom.us/j/721102369

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Resources