JetBrains Research — наука, меняющая мир

Поиск лучших архитектур нейронных сетей с помощью обучения с подкреплением

Нейронные сети - это мощные и гибкие модели, которые хорошо подходят для решения многих сложных задач обучения в понимании образа, речи и естественного языка. Несмотря на их успех, нейронные сети все еще трудно спроектировать. Обычно это происходит вручную, и требует разработчика набраться «опыта».

На семинаре мы рассмотрим две статьи, в которых описывается метод использования обучения с подкреплением для генерации описаний моделей нейронных сетей. Будет рассказано, как с помощью RL можно сгенерировать сеть, которая превосходит все state-of-the-art алгоритмы на таком датасете как CIFAR-10, и как можно автоматически сконструировать рекуррентную сеть, превосходящую LSTM.

Ссылки на статьи: https://arxiv.org/abs/1611.02167 и https://arxiv.org/pdf/1611.01578.pdf

Докладчик: Александра Малышева.

Язык доклада: русский.

Дата и время: 12-е марта, 20:0-21:30.

Место: Таймс, аудитория 204.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars