Исследовательская группа

Методы машинного обучения в области программной инженерии

Studying software evolution using topic models

April 15

Тематическое моделирование широко применяется в самых различных областях науки и ставит перед собой задачу выделения оределённых «тем» в наборе текстовых документов. Традиционно оно связано с естественными языками, но может быть успешно применено и для кода. Кроме моделирования тем в статике, темы часто моделируются в динамике — это используется, например, для визуализации изменений в тематике научных журналов, популярности научных статей на определённые темы или даже для отслеживания популярности новостей или трендов. В случае компьютерного кода ситуация осложняется тем, что новый код — это не только новые созданные проекты (как, например, новые научные статьи или новостные заметки), но и изменённые старые, что усложняет моделирование тем в динамке и делает его более интересным.

На данном семинаре мы разберём цикл научных статей научной группы Thomas et al., которая в начале прошлого десятилетия наиболее плотно и предметно изучала данный вопрос, а также обсудим возможные перспективы продолжения исследований в данной сфере.

Ссылки на статьи:

http://research.cs.queensu.ca/home/sthomas/data/Thomas_2010_SCAM.pdf

http://research.cs.queensu.ca/home/sthomas/data/Thomas_2011_MSR.pdf

http://research.cs.queensu.ca/home/sthomas/data/Thomas_2012_SCP.pdf

Докладчик: Ярослав Голубев.

Язык доклада: русский.

Дата и время: 15-е апреля, 19:30-21:00.

Место: https://zoom.us/j/509624984

Видео с семинаров доступно по ссылке: http://bit.ly/MLJBSeminars

Материалы