JetBrains Research — наука, меняющая мир

Maybe Deep Neural Networks are the Best Choice for Modeling Source Code

Языковые модели успешно применяют при решении таких задач как распознавание речи, машинный перевод, реферирование текста, а также при анализе кода. Предсказания традиционные языковых моделей ограничены словарем. При анализе кода это является существенным недостатком в связи с разнообразием возможных имен идентификаторов. Хотелось бы иметь модель, способную в качестве предсказаний предлагать неологизмы — слова, которых нет в тренировочном корпусе.

На семинаре мы рассмотрим подход, при котором удается обойти это ограничение. Авторы статьи предлагают использовать сегментацию по подсловам, демонстрируют эффективность своего подхода на корпусах на Java, C и Python.

Докладчик: Зарина Курбатова.

Язык доклада: русский.

Дата и время: 8-е мая, 20:00-21:30.

Место: Таймс, аудитория 204.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars