Research group

Agent Systems and Reinforcement Learning

AlphaGo to MuZero. Победа компьютера над человеком в интеллектуальных играх.

13 April 2020

Победа шахматной программы DeepBlue над чемпионом мира по шахматам Гарри Каспаровым в 1997 году стала символической точкой отсчёта новой эпохи в развитии искусственного интеллекта. Следующим знаменательным событием считается победа AlphaGo, программы для игры в го, над Ли Седолем в 2016 году. За прошедшие четыре года AlphaGo прошла несколько итераций улучшений, превратившись в MuZero, программу, успешно играющую в го, шахматы, сёги и игры Atari.

На семинаре мы обсудим метод Monte Carlo Tree Search, проследим путь развития от AlphaGo до MuZero и разберём алгоритм MuZero, представленный в начале 2020 года, являющийся на сегодняшний день последней вехой развития AlphaGo.

Докладчик: Глеб Енгалыч.

Язык доклада: русский.

Дата и время: 13-е апреля, 18:30-20:00.

Место: https://zoom.us/j/721102369

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Resources