СЕГМЕНТИРОВАНИЕ ВЫБОРОК ДАННЫХ ПРИ АНАЛИЗЕ СОСТОЯНИЯ БЕЗОПАСНОСТИ УСТРОЙСТВ ИНТЕРНЕТА ВЕЩЕЙ
М. Е. Сухопаров, И. С. Лебедев
Санкт-Петербургский Федеральный исследовательский центр Российской академии наук
Аннотация: Рассмотрена методика сегментирования выборок данных с целью повышения качественных показателей классифицирующих алгоритмов. Она учитывает факторы, которые влияют на изменение диапазонов значений целевых переменных. Выявление воздействий
на текущие и предполагаемые ситуаций дает возможность сегментировать выборки данных. В результате чего уменьшаются диапазоны исследуемых переменных и выбросы, убираются зашумленные данные. Описан проведенный эксперимент с использованием разделенной выборки. Получены результаты оценки для каждого классификатора на общей выборке и на сегментах.
Ключевые слова: сегментирование выборок данных, выявление аномалий, паразитный трафик, информационная безопасность.
Страницы 130-136