📙 Рассмотрены задачи, методы и проблемы классификации сетевого трафика методами машинного обучения и интеллектуального анализа данных. Анализируются актуальные вопросы классификации IP-трафика на основе портов, полезной нагрузки, статистических методов. Рассмотрены важные для практического использования вопросы контроля и анализа сетевого трафика. Анализируются особенности формирования, оценки влияния структуры и объема обучающей и тестирующей выборок на эффективность классификации приложений на уровне пакетов и потоков. Рассмотрена контролируемая и неконтролируемая классификация сетевых приложений WEB (http, https), mail (smtp, imap), Ftp (Ftp-data, Ftp-commands), SSH, Skype, BitTorrent, P2P и др. с использованием алгоритмов классификации ID3, C4.5, CART, SVM, Randomforest, Bootstrap, Baggingи AdaBoost и др. Рассмотрены особенности классификации шифрованного трафика и трафика мобильных приложений Skype, Steam, BitTorrent, YouTube, Vkontakte, Tоrrent и др. Анализируется эволюция алгоритмов потоковой классификации сетевых приложений в режиме реального времени. Для повышения эффективности в условиях априорной неопределенности введено понятие неконтролируемой и полуконтролируемой кластеризации сетевого трафика.
Для широкого круга научных сотрудников и специалистов-практиков в области инфокоммуникаций и информационной безопасности, будет полезна аспирантам, магистрам и бакалаврам соответствующих специальностей.