JetBrains Research — наука, меняющая мир

Глубокое мультиагентное обучение с подкреплением с помощью графов важности

На семинаре мы рассмотрим новый подход для обучения систем с несколькими агентами взаимодействию в кооперативных окружениях. Этот подход (MAGnet) обучает граф важности, с помощью которого в последствии происходит своеобразный обмен сообщениями между агентами.

MAGnet показал лучшие результаты в кооперативной игре Pommerman чем текущие state-of-the-art решения, такие как глубокие Q-сети (Deep Q-Networks), сети по деревьям поиска Монте-Карло (Monte-Carlo Tree Search Nets, MCTSnets) и мульти-агентный глубокий градиент по детерминированной стратегии (Multi-Agent Deep Deterministic Policy Gradient).

Докладчик: Алексей Шпильман.

Язык доклада: русский.

Дата и время: 27-е ноября, 20:30-22:00.

Место: Таймс, белые доски (4 этаж).