Исследовательская группа

Агентные системы и обучение с подкреплением

Глубокие абстрактные Q-сети

September 17

На семинаре мы обсудим проблемы обучения и планирования в окружениях высокой размерности и с редко выдающейся наградой (например в dungeon crawling играх, таких как Montezuma Revenge и Venture).

Авторы недавней статьи, о которой пойдёт речь, комбинируют современные методы глубинного обучения и методы абстракции, с помощью которых агент может обобщать описание окружения (при этом абстракции задаются людьми).

Этот, основанный на абстракциях, метод показывает в вышеупомянутых играх лучшие результаты, чем современные глубинные Q-сети.

Докладчик: Алексей Шпильман

Язык доклада: русский.

Время: 18:30-20:00.

Место: Таймс, аудитория 204.

Материалы