МЕТОД КЛАСИФІКАЦІЇ ПСЕВДОВИПАДКОВИХ ПОСЛІДОВНОСТЕЙ СТИСЛИХ ТА ЗАШИФРОВАНИХ ДАНИХ ЗАПОБІГАННЮ ВИТОКУ ІНФОРМАЦІЇ

Автор(и)

  • С.В. Лєнков
  • В.М. Джулій
  • І.В. Муляр

DOI:

https://doi.org/10.17721/2519-481X/2024/82-09

Ключові слова:

псевдовипадкові послідовності, функціональна модель, інформаційна безпека, точність класифікації, зашифровані, стислі дані

Анотація

Розглянута задача розробки методу класифікації псевдовипадкових послідовностей захисту від витоку конфіденційної інформації на основі поділу стислих та зашифрованих даних, може бути використана для виявлення мережевих атак на мережі передачі даних, в засобах запобігання та виявлення витоку інформації, а також в програмних продуктах, що реалізують сервіси електронної пошти.
Показано, що загрози безпеки даних характеризуються набором векторних показників, кількісних та якісних, для їх формалізації необхідне застосування теорії нечітких множин та дискретної математики. Показано неможливість застосування експертних традиційних методів оцінок для визначення більшості розглянутих показників. Для мінімізації ризику витоку конфіденційної інформації пропонується формувати групи співробітників та розраховувати ризик витоку конфіденційних даних для кожної з них.
Сучасні засоби запобігання та виявлення витокам інформації застосовують різні методи проведення аналізу потоку даних. До основних відносяться контекстні та контентні методи. Наведені методи не здатні виявити витік даних у стислому та зашифрованому виді, а додавання цифрових сигнатур дозволяє маскувати зашифровані дані під стислі простим способом, в області безпеки інформації знайшли широке використання поведінкові методи аналізу потоку даних та алгоритми машинного навчання. Однією з основних складностей, в даній ситуації, виступає побудова моделей даних, обробка та пошук ознакового простору.
Запропонований метод класифікації псевдовипадкових послідовностей враховує дискримінуючу здатність статистичних ознак, може бути впроваджений у існуючі засоби запобігання та виявлення витокам інформації з метою усунення зазначених недоліків. Зашифрований потік даних може передаватися з робочих станцій співробітників, різних інформаційних систем, мережевих сховищ.
Для оцінки ефективності запропонованого методу захисту від витоку конфіденційних даних проведені експерименти з визначення точності бінарної класифікації стислих та зашифрованих даних в залежності від типів вхідних послідовностей, що піддаються процедурам стиснення.
У ході практичної реалізації проведено кількісну оцінку точності класифікації псевдовипадкових послідовностей залежно від параметрів запропонованого класифікатора. Обґрунтовано вибір довжини підпослідовності в дев’ять біт, як значення найбільш раціональне, що дозволяє досягти класифікації псевдовипадкових послідовностей високої точності та мінімального часу виконання процедури класифікації. Обґрунтовано вибір скануючого оптимального вікна класифікатора розміром в 500 кб. Залежно від вимог до точності та швидкості аналізу даних запропоновано два режими роботи: сканування випадково вибраного фрагмента файла розміром 500 кб; сканування всього файлу скануючим вікном розміром 500 кб.
Наведено опис місць впровадження запропонованого методу класифікації псевдовипадкових послідовностей у підсистеми захисту електронної пошти, системи виявлення мережевих атак, засоби запобігання та виявлення витокам інформації.

Здійснено порівняльну оцінку запропонованого алгоритму з відомими аналогами в предметній області досліджень.

##submission.downloads##

Опубліковано

2024-10-11

Як цитувати

Лєнков , С., Джулій , В., & Муляр , І. (2024). МЕТОД КЛАСИФІКАЦІЇ ПСЕВДОВИПАДКОВИХ ПОСЛІДОВНОСТЕЙ СТИСЛИХ ТА ЗАШИФРОВАНИХ ДАНИХ ЗАПОБІГАННЮ ВИТОКУ ІНФОРМАЦІЇ. Збірник наукових праць Військового інституту Київського національного університету імені Тараса Шевченка, (82), 77–93. https://doi.org/10.17721/2519-481X/2024/82-09

Номер

Розділ

ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ