Исследовательская группа

Методы машинного обучения в области программной инженерии

Adversarial robustness of source code models

April 8

В рамках семинара мы обсудим две статьи, поднимающие проблемы применения нейросетевых моделей к коду. Как и в других областях, модели, обученные на исходном коде, по умолчанию не устойчивы к изменению входных данных. Добавление "мертвого" кода или переименование переменных может легко изменить предсказания модели. Обучение устойчивых моделей является нетривиальной задачей, поскольку (1) пространство изменений программ дискретно и бесконечно, (2) код имеет более сложную структуру чем, например, изображения, (3) входные данные для модели могут быть более сложными, чем просто код (например, path-based представление). Мы обсудим две статьи, которые по-разному решают эти проблемы и получают более устойчивые модели для задач предсказания типа переменной и имени метода.

Ссылки на статьи:

https://arxiv.org/pdf/2002.04694.pdf

https://arxiv.org/pdf/2002.03043.pdf

Докладчик: Егор Богомолов.

Язык доклада: русский.

Дата и время: 8-е апреля, 19:30-21:00.

Место: https://zoom.us/j/509624984

Видео с семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Материалы