Исследовательская группа
Лаборатория искусственного интеллекта
Глубокие абстрактные Q-сети
17 сентября
На семинаре мы обсудим проблемы обучения и планирования в окружениях высокой размерности и с редко выдающейся наградой (например в dungeon crawling играх, таких как Montezuma Revenge и Venture).
Авторы недавней статьи, о которой пойдёт речь, комбинируют современные методы глубинного обучения и методы абстракции, с помощью которых агент может обобщать описание окружения (при этом абстракции задаются людьми).
Этот, основанный на абстракциях, метод показывает в вышеупомянутых играх лучшие результаты, чем современные глубинные Q-сети.
Докладчик: Алексей Шпильман
Язык доклада: русский.
Время: 18:30-20:00.
Место: Таймс, аудитория 204.