Исследовательская группа

Методы машинного обучения в области программной инженерии

Сбор датасета семантических клонов

Тимофей БрыксинАктивный

Данный проект является коллаборацией с Хансом Талером из Линцского университета. Целью проекта является сбор датасета семантических клонов в коде, то есть фрагментов кода, реализующих одну и ту же функциональность по-разному. Данная задача появилась у Ханса из необходимости оценить разработанный им метод поиска семантических клонов при помощи вероятностного моделирования программного обеспечения. Для сбора датасета используются задачи из Google Code Jam и AtCoder.

Репозиторий проекта на GitHub.

Участники