Исследовательская группа

Агентные системы и обучение с подкреплением

Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets in Chess

21 октября 2020

Человечество на протяжении многих веков не только играет в шахматы, но также активно изучает их.

За годы тренировок мастерство шахматистов стало измеряться, скорее, не их умением быстро анализировать ситуацию, а пониманием, когда и какие заранее заготовленные приёмы нужно применить.

Поэтому постоянно предлагаются новые варианты шахмат. Один из самых популярных -- шахматы Фишера, в которых порядок фигур на доске выбирается случайно среди 960 комбинаций.

Компьютерный анализ таких вариаций пока слишком сложен, но простые модификации исследовать вполне реально.

Авторы статьи, которую мы обсудим, выбрали 10 простых модификаций правил, для каждой обучается модель AlphaZero, отлично показавшая себя в течение последних нескольких лет в шахматах, го и сёги. Такой подход позволяет заменить года опыта, полученного людьми на несколько дней вычислений.

На семинаре мы коротко обсудим идею алгоритма AlphaZero, рассмотрим особенности поставленного эксперимента, затем заглянем внутрь обученных моделей и проведём сравнительный анализ полученных результатов для каждого варианта правил.

Докладчик: Глеб Енгалыч.

Язык доклада: русский.

Дата и время: 21-е октября, 20:00-21:30.

Место: https://us02web.zoom.us/j/721102369

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Для получения рассылки о семинаре (с паролем от Zoom) - пишите Алексею Шпильману на alexey@shpilman.com.

Дополнительно