Machine Learning Methods in Software Engineering
Collecting a dataset of bug fixing commits
6 сентября 2021г. (понедельник), 18:00 МСК
Докладчик: Артём Лобанов
Идея применения машинного обучения для выявления/исправления ошибок в коде волнует умы исследователей по всему миру. Важным шагом на пути к этой светлой цели является получение обширной, репрезентативной и незашумлённой выборки bug-fix коммитов. На данный момент подавляющее число подобных датасетов собирается либо с помощью баг-трекеров, либо с помощью фильтрации коммитов по ключевым словам. Однако, точность и полнота подобных подходов оставляет желать лучшего. Мы решили исследовать применимость методов машинного обучения для майнинга bug-fix коммитов.
На семинаре мы рассмотрим существующие исследования в области классификации коммитов, уделив отдельное внимание проблемам использовавшихся датасетов. Затем обсудим наш подход к решению задачи и то, как наш опыт сбора обучающей выборки и соотносится с законом Мёрфи. В заключение посмотрим на имеющиеся результаты и обсудим перспективы дальнейшего развития проекта.
Язык встречи: Русский
Ссылка на встречу: https://us02web.zoom.us/j/509624984?pwd=dFhRUlowSWprSVAva0JFQ2NUVzZTdz09
Meeting ID: 509 624 984
Passcode: 016883
Запись этой встречи и других семинаров лаборатории можно найти YouTube канале -- https://www.youtube.com/channel/UCdeSxuESqLOxuuwXNnqqbrA.