JetBrains Research — наука, меняющая мир

Finding Similar Code Repositories

Поиск кода (или более специфично, похожих репозиториев) — одна из задач, с которой часто сталкиваются разработчики. На данном семинаре будет рассказано про опыт, полученный докладчиком за время работы в компании source{d}: как можно по-разному сформулировать "похожесть" и выбрать соответствующие пути решения. Один из способов расскажет, как решать проблему "куда бы я еще закоммитил" и покажет, как использовать граф контрибуции разработчиков для этого. Другой подход покажет, как делать поиск семантически похожих репозиториев, используя взвешенные эмбеддинги имен переменных.

В докладе будут затрнуты вопрос, где брать данные, как их предобрабатывать, как переносить опыт из NLP и других областей ML в специфичную область работы с исходным кодом.

Докладчик: Егор Булычев.

Язык доклада: русский.

Дата и время: 6-е мая, 19:30-21:00.

Место: https://zoom.us/j/509624984

Видео с семинаров доступно по ссылке: http://bit.ly/MLJBSeminars