Методы машинного обучения в области программной инженерии
Применение тематического моделирования в SE
В настоящее время применения тематического моделирования (topic modeling, TM) в области SE достаточно ограничены. В основном TM применяют в code comprehension, чтобы упрощать знакомство с кодовой базой, сопоставляя коду тематическую информацию. Также, в существующих работах по извлечению тем из кода применяют классические методы (LSI, LDA, ARTM), не учитывая специфику кода.
Нам кажется, что применимость TM не ограничена областью code comprehension. В нашей работе мы исследуем новых подход к TM на основании эмбеддингов идентификаторов в коде и предлагаем с его помощью извлекать интерпретируемые факторы из произвольных фрагментов кода (например, проекты, код отдельных программистов, изменения в рамках коммита).
В рамках семинара мы обсудим существующие подходы к тематическому моделированию, подходы к оценке их качества, особенности исходного кода и наши текущие результаты в этой области.
Докладчик: Егор Богомолов.
Язык доклада: русский.
Дата и время: 15-е июля, 17:00-18:30.
Место: https://zoom.us/j/509624984
Видео с семинаров доступно по ссылке: http://bit.ly/MLJBSeminars