Исследовательская группа

Методы машинного обучения в области программной инженерии

Динамика тем в коде

Тимофей БрыксинАктивный

В данном проекте исследуется динамика различных тем в коде и их изменение. Общая идея проекта состоит в следующем: собирается большой корпус кода, в котором делаются "временные срезы", то есть отдельно вынимаются состояния всего корпуса в различные моменты в прошлом. После этого на всех этих данных производится Topic Modeling, что позволяет не просто выделить темы в коде, но и посмотреть, как менялось их соотношение в различные моменты времени. Кроме того, используя информацию о разработчиках, планируется исследовать, как темы менялись с их точки зрения — например, существуют ли зависимости, по котором разработчик имеет высокую вероятность перейти из темы А в тему Б?

Репозиторий проекта на GitHub.

Участники