Методы машинного обучения в области программной инженерии
Finding Similar Code Repositories
Поиск кода (или более специфично, похожих репозиториев) — одна из задач, с которой часто сталкиваются разработчики. На данном семинаре будет рассказано про опыт, полученный докладчиком за время работы в компании source{d}: как можно по-разному сформулировать "похожесть" и выбрать соответствующие пути решения. Один из способов расскажет, как решать проблему "куда бы я еще закоммитил" и покажет, как использовать граф контрибуции разработчиков для этого. Другой подход покажет, как делать поиск семантически похожих репозиториев, используя взвешенные эмбеддинги имен переменных.
В докладе будут затрнуты вопрос, где брать данные, как их предобрабатывать, как переносить опыт из NLP и других областей ML в специфичную область работы с исходным кодом.
Докладчик: Егор Булычев.
Язык доклада: русский.
Дата и время: 6-е мая, 19:30-21:00.
Место: https://zoom.us/j/509624984
Видео с семинаров доступно по ссылке: http://bit.ly/MLJBSeminars