JetBrains Research — наука, меняющая мир

Hyperbolic Function Embedding: Learning Hierarchical Representation for Functions of Source Code in Hyperbolic Space

Миллионы строк исходного кода (GitHub, GitLab и т.д.) открыты для программного сообщества в интернете. Изученние такого рода данных могут помочь нам понять общие паттерны при разработке, что в дальнейшем упростит задачи поиска багов, документации и т.п. Поэтому изучение эффективной модели представления функций исходного кода является важной проблемой.


На этом семинаре мы рассмотрим работу, в которой авторы изучили геометрические оссобенности Function Call Graph и пришли к выводу, что построение числового представления для каждой функции в гиперболическом пространстве более эффективно, чем в евклидовом, как это делается в текущих state-of-the-art работах. Авторы работы решают задачи кластеризации функций и предсказывание вызова одной функции из другой, полученные результаты лучше чем в известных работах node2vec и struc2vec, при этом полученный вектор обладает меньшей размерностью, что положительно сказывается на памяти и сложности вычислений.

Ссылка на статью: https://www.mdpi.com/2073-8994/11/2/254/pdf

Докладчик: Егор Спирин.

Язык доклада: русский.

Дата и время: 23-е октября, 19:30-21:00.

Место: Таймс, аудитория 404.

Видео с предыдущих семинаров доступно по ссылке: http://bit.ly/MLJBSeminars