ОПРЕДЕЛЕНИЕ СХОЖЕСТИ ФРАГМЕНТОВ ИСХОДНЫХ ПРОГРАММНЫХ КОДОВ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ
Н. А. Грибков, Т. Д. Овасапян, Д. А. Москвин Санкт-Петербургский политехнический университет Петра Великого
Аннотация: В статье предлагается метод определения схожести фрагментов исходных программных кодов на основе атрибутных абстрактных синтаксических деревьев и алгоритмов машинного обучения. Преимущества данного метода определены на основании сравнительного анализа существующих подходов к определению программных клонов. Разработанный метод позволяет повысить эффективность обнаружения схожих фрагментов программного кода, по сравнению с аналогами, основанными на анализе AST, за счет обнаружения семантических клонов.
Ключевые слова: программные клоны, синтаксическая схожесть, семантическая схожесть, открытый исходный код.
Страницы 62-71