Исследовательская группа

Агентные системы и обучение с подкреплением

Causal Inference Q-Network: Toward Resilient Reinforcement Learning

May 17

В последнее время глубокое обучение с подкреплением демонстрирует впечатляющие результаты при решении большого спектра различных задач. Однако на практике большинство алгоритмов сталкиваются с проблемой зашумленных наблюдений (затемнение, изменение яркости, искажения, заморозка изображения и т.д.), что может привести к субоптимальной производительности и возможным проблемам с безопасностью алгоритма. Разработка устойчивого к данным возмущениям алгоритма является важным шагом к применению алгоритмов обучения с подкреплением к задачам реального мира.

На семинаре мы рассмотрим общую схему обучения алгоритмов RL со вспомогательной задачей отслеживания помех (например, искуственнымых шумов). В рамках этой концепции мы обсудим важность причинно-следственной связи и разберем алгоритм RL на основе причинного вывода (causal inference), называемый Causal Inference Q-Network (CIQ), а также сравним эффективность данного алгоритма с бейзлайнами.

Докладчик: Беляев Владислав.

Язык доклада: русский.

Дата и время: 17 мая, 20:00.

https://us02web.zoom.us/j/721102369?pwd=S0lCc0ZjeGlGZSsvMTkzbUVJU1podz09

Meeting ID: 721 102 369

Passcode: 024498