Исследовательская группа

Лаборатория языковых инструментов

Flow2Vec: Value-Flow-Based Precise Code Embedding

March 22

Flow2Vec — это новый подход в статическом анализе кода, который полагается на методы машинного обучения и запросы с контекстно-свободными (КС) ограничениями на графах. Данный подход позволяет строить embedding кода, который сохраняет ассимитричность графа программы, учитывает информацию о потоках данных и о структуре программы, как о наборе процедур с множеством рекурсивных вызовов функций. Построенный embedding можно использовать в дальнейшем в таких задачах, как обобщение или классификация кода, что значительно повышает точность работы и улучшает основные метрики качества конечных алгоритмов.Мы разберем основные шаги построения подобного embedding'а, применение запросов с КС ограничениями в данном процессе, а также посмотрим на возможные приложения наших новейших результатов для вычисления КС запросов в рассматриваемой области.

Докладчик: Егор Орачев

Материалы к докладу:

1. Yulei Sui, Xiao Cheng, Guanqin Zhang, and Haoyu Wang. 2020. Flow2Vec: value-flow-based precise code embedding. Proc. ACM Program. Lang. 4, OOPSLA, Article 233 (November 2020), 27 pages. DOI:https://doi.org/10.1145/3428301

2. Mingdong Ou, Peng Cui, Jian Pei, Ziwei Zhang, and Wenwu Zhu. 2016. Asymmetric Transitivity Preserving Graph Embedding. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '16). Association for Computing Machinery, New York, NY, USA, 1105–1114. DOI:https://doi.org/10.1145/2939672.2939751

3. Arseniy Terekhov, Artyom Khoroshev, Rustam Azimov, and Semyon Grigorev. 2020. Context-Free Path Querying with Single-Path Semantics by Matrix Multiplication. In Proceedings of the 3rd Joint International Workshop on Graph Data Management Experiences & Systems (GRADES) and Network Data Analytics (NDA) (GRADES-NDA'20). Association for Computing Machinery, New York, NY, USA, Article 5, 1–12. DOI:https://doi.org/10.1145/3398682.3399163

4. Egor Orachev, Ilya Epelbaum, Rustam Azimov, Semyon Grigorev. 2020. Context-Free Path Querying by Kronecker Product. https://link.springer.com/chapter/10.1007/978-3-030-5..

Семинар состоится онлайн в 17:30, ссылка на встречу https://meet.google.com/myu-dhmz-gvu.