Исследовательская группа

Методы машинного обучения в области программной инженерии

Исследование нарушений лицензирования на GitHub

Брыксин ТимофейАктивный

В данном проекте производится комплексное исследование плагиата в Java-коде на GitHub на уровне методов. Проект состоит из трёх частей: сбор обширного (1.5 Тб) корпуса Java-репозиториев, поиск в нём клонов (с использованием техники, предложенной в соответствующем проекте) и непосредственно анализа клонов на предмет плагиата и нарушения условий лицензирования. В проекте подробно исследуются найденные лицензии и отношения между ними, а найденные похожие фрагменты кода также ранжируются по вероятности нарушения лицензий.

Страница проекта на GitHub.

Участники

Брыксин Тимофей
Голубев Ярослав

Публикации

A Study of Potential Code Borrowing and License Violations in Java Projects on GitHub

June 2020

Yaroslav Golubev, Maria Eliseeva, Nikita Povarov, Timofey Bryksin

Подробнее