Исследовательская группа

Методы машинного обучения в области программной инженерии

Collecting a dataset of bug fixing commits

September 6

6 сентября 2021г. (понедельник), 18:00 МСК

Докладчик: Артём Лобанов

Идея применения машинного обучения для выявления/исправления ошибок в коде волнует умы исследователей по всему миру. Важным шагом на пути к этой светлой цели является получение обширной, репрезентативной и незашумлённой выборки bug-fix коммитов. На данный момент подавляющее число подобных датасетов собирается либо с помощью баг-трекеров, либо с помощью фильтрации коммитов по ключевым словам. Однако, точность и полнота подобных подходов оставляет желать лучшего. Мы решили исследовать применимость методов машинного обучения для майнинга bug-fix коммитов.

На семинаре мы рассмотрим существующие исследования в области классификации коммитов, уделив отдельное внимание проблемам использовавшихся датасетов. Затем обсудим наш подход к решению задачи и то, как наш опыт сбора обучающей выборки и соотносится с законом Мёрфи. В заключение посмотрим на имеющиеся результаты и обсудим перспективы дальнейшего развития проекта.

Язык встречи: Русский

Ссылка на встречу: https://us02web.zoom.us/j/509624984?pwd=dFhRUlowSWprSVAva0JFQ2NUVzZTdz09

Meeting ID: 509 624 984
Passcode: 016883

Запись этой встречи и других семинаров лаборатории можно найти YouTube канале -- https://www.youtube.com/channel/UCdeSxuESqLOxuuwXNnqqbrA.