JetBrains Research — наука, меняющая мир

Обучение с подкреплением миллионной популяции агентов

В данном докладе будет рассмотрена пара окружений, изучающих большие популяции агентов и показано, чем данные модели могут быть интересны и полезны.

Мы рассмотрим эмпирические исследование по выявлению упорядоченной коллективной динамики, получаемой группой разведчиков, управляемой алгоритмом обучения с подкреплением для миллиона агентов. Авторы одной из статей помещают интеллектуальных агентов в моделируемый естественный контекст и проверяют, могут ли принципы, разработанные в реальном мире, также использоваться для понимания искусственно созданной интеллектуальной популяции. Результаты показывают, что популяционная динамика агентов ИИ, управляемая только индивидуальными личными интересами каждого агента, выявляет упорядоченную модель, аналогичную модели Лотки-Вольтерра, изучаемой в биологии населения. Кроме того, мы обнаруживаем возникающее поведение коллективных адаптаций при изучении того, как групповое поведение агентов будет меняться в зависимости от природных ресурсов. Оба эти открытия могут быть объяснены теорией самоорганизации в природе.

Ссылка на статью: https://arxiv.org/pdf/1709.04511.pdf

Докладчик: Иван Ильчук.

Язык доклада: русский.

Дата и время: 19-е марта, 20:0-21:30.

Место: Таймс, аудитория 204.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars