Исследовательская группа

Методы машинного обучения в области программной инженерии

Исследование нарушений лицензирования на GitHub

Тимофей БрыксинПриостановлен

В данном проекте производится комплексное исследование плагиата в Java-коде на GitHub на уровне методов. Проект состоит из трёх частей: сбор обширного (1.5 Тб) корпуса Java-репозиториев, поиск в нём клонов (с использованием техники, предложенной в соответствующем проекте) и непосредственно анализа клонов на предмет плагиата и нарушения условий лицензирования. В проекте подробно исследуются найденные лицензии и отношения между ними, а найденные похожие фрагменты кода также ранжируются по вероятности нарушения лицензий.

Страница проекта на GitHub.

Участники

Публикации

On the Nature of Code Cloning in Open-Source Java Projects

October 2021

Yaroslav Golubev and Timofey Bryksin

Подробнее

A Study of Potential Code Borrowing and License Violations in Java Projects on GitHub

June 2020

Yaroslav Golubev, Maria Eliseeva, Nikita Povarov and Timofey Bryksin

Подробнее