Статья опубликована в рамках: LVIII Международной научно-практической конференции «Вопросы технических и физико-математических наук в свете современных исследований» (Россия, г. Новосибирск, 21 декабря 2022 г.)

Наука: Информационные технологии

Секция: Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Смольянников И.В., Макаревич А.Д. ИСПОЛЬЗОВАНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧАХ ОРГАНИЗАЦИИ ПЕРЕДАЧИ СЕТЕВОГО ТРАФИКА // Вопросы технических и физико-математических наук в свете современных исследований: сб. ст. по матер. LVIII междунар. науч.-практ. конф. № 12(49). – Новосибирск: СибАК, 2022. – С. 46-53.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов

ИСПОЛЬЗОВАНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧАХ ОРГАНИЗАЦИИ ПЕРЕДАЧИ СЕТЕВОГО ТРАФИКА

Смольянников Илья Викторович

аспирант кафедры Корпоративных Информационных Систем, РТУ МИРЭА,

РФ, г. Москва

Макаревич Артём Денисович

аспирант кафедры Инструментального и Прикладного Программного Обеспечения, РТУ МИРЭА,

РФ, г. Москва

THE USE OF MACHINE LEARNING ALGORITHMS IN THE TASKS OF ORGANIZING THE TRANSMISSION OF NETWORK TRAFFIC

Ilya Smolyannikov

Postgraduate student of the Department of Corporate Information Systems, RTU MIREA,

Russia, Moscow

Artem Makarevich

Postgraduate student of the Department of Instrumental and Applied Software, RTU MIREA,

Russia, Moscow

Ключевые слова: качество обслуживания; машинное обучение; сетевая безопасность.

Keywords: quality of service; machine learning; network security.

С течением времени развитие технологий не останавливается ни на секунду, особенно это касается сетевых технологий. Увеличивается размер сетей, количество устройств, которые постоянно используют каналы передачи данных для обмена информацией друг с другом, что в свою очередь начинает порождать сложности в использовании таких систем.

Постоянное увеличение числа пользователей сети, разнообразия услуг, постепенной популяризацией, внедрением сетей 5G и постоянно меняющийся профиль поведения пользователей создает больше проблем для управления, контроля за сетевым трафиком, своевременным обнаружением аномалий, анализе различных ситуаций в режиме реального времени, безопасной эксплуатации и эффективного использования сетевых ресурсов.

При помощи идентификации терминального приложения можно идентифицировать его тип, который соответствует определенному трафику в сети, благодаря чему можно также понять текущую полосу пропускания трафика. Крупные провайдеры могут своевременно вмешиваться и корректировать сетевой трафик в соответствии с необходимыми теми или иными действиями в различных ситуациях, благодаря чему, обеспечивается нормальная работа и бесперебойность сети, улучаешься качество обслуживания и качество восприятия.

Поскольку традиционное машинное обучение может иметь достаточно хорошую производительность, существует такая предпосылка: обучающие данные и тестовые данные должны быть взяты из одного и того же пространства объектов, эти объекты следуют одному и тому же вероятностному распределению. Когда это предположение неверно, большинство уже обученных статистических моделей необходимо повторно перестроить и переобучить, используя полученные данные для обучения. Соответственно, используется новый набор размеченных данных, и такой новый набор данных используется для переобучения модели. Это очень трудоемкая задача и затраты часто высоки. Конечно, трансферное обучение может значительно сократить время обучения и нагрузку при повторном сборе обучающих данных.

Машинное обучение для сетей

Существуют различные сетевые технологии, например, ATM (асинхронный способ передачи данных), MPLS (многопротокольная коммутация по меткам), GMPLS (обобщенная многопротокольная коммутация по меткам) или SDN (программно-определяемая сеть), которые обеспечивают технологии качества обслуживания (QoS), включают в себя возможность обеспечения параметров передачи [2]. В целом, упомянутые технологии можно классифицировать как централизованные. SDN является примером программируемой сети. Это подход, при котором для направления трафика в сети и взаимодействия с базовой аппаратной инфраструктурой используются контроллеры на базе ПО или API-интерфейсы. Такая сеть отличается от традиционных, в которых для управления сетевым трафиком используются специальные устройства (маршрутизаторы и коммутаторы). SDN можно использовать для создания и администрирования виртуальной сети или для управления обычной аппаратной сетью с помощью ПО.

SDN основан на подходе, который отделяет пересылку данных от логики, которая ими управляет. Существует центральный контроллер, который взаимодействует с физической плоскостью (устройствами), предоставляя им необходимую информацию [3]. Предоставление различным классам трафика разных приоритетов в обслуживании (QoS) реализовано в плоскости управления, которая используется для мониторинга и определения параметров управления.

Рассмотрим основные направления, где машинное обучение может помочь решить возникающие проблемы при организации сетевого взаимодействия и функционирования сетей целиком.

Одним из таких примеров будет использование машинного обучения для балансировки трафика, оценки загруженности канала и перенаправления на более свободный. Отдельно стоит выделить применение машинного обучения для классификации трафика [4].

Инструменты машинного обучения могут помочь в управлении трафиком в реальном времени, а также в планировании и управлении пропускной способностью в рамках долгосрочного планирования. После того, как инструменты определяют, когда трафик увеличивается на одних участках или перестает поступать на других, они могут отправлять автоматические или ручные управляющие сигналы для исправления ошибки.

Анализ маршрутов на основе машинного обучения, может принимать трафик от источников, которые используют другого интернет-провайдера, испытующего в настоящий момент сбои в работе, и передавать данные в соединения, использующим других поставщиков. Инструменты управления при помощи машинного обучения могут перенаправлять половину трафика, направляемого на серверную систему, из одного центра обработки данных в другой в зависимости от условий трафика [5].

Сетевая аналитика

Помимо управляющих возможностей, в настоящее время, инструменты машинного обучения также могут прогнозировать тенденции трафика таким образом, чтобы они помогали принимать решения в будущем, которые могут улучшить качество обслуживания. Сетевым специалистам следует оценить ситуации, в которых может быть полезно использовать алгоритмы машинного обучения для определения потоков трафика, как например, в следующих примерах:

- перемещение трафик в центре обработки данных со стойки на стойку и с сервера на сервер внутри стойки;

- изменение трафика с большого количества потоков небольших пакетов на меньшее количество потоков, но больших пакетов;

Выявление тенденций может помочь специалистам определить, какие типы сетей следует проектировать, такие как leaf-spine сеть, сети на основе коммутатора или сети на основе хоста [6]. Чем к большему количеству данных имеют доступ инструменты с применением машинного обучения во всех сегментах сети, тем более подробным может быть их анализ и полученные рекомендации. Инструменты машинного обучения особенно полезны при анализе и выявлении первопричин возникновения какой-либо ситуации.

Объединение аналитики, основанной на машинном обучении, с другими инструментами искусственного интеллекта, такими как обработка естественного языка, может упростить и ускорить взаимодействие с системами. Сетевые инженеры могут создавать виртуальных помощников, которые помогают сетевым администраторам диагностировать и устранять сетевые неполадки.

Сетевая безопасность

Машинное обучение имеет огромное значение для сетевой безопасности. Инструменты на базе машинного обучения могут анализировать поведение в любом виде сетевого объекта. [7] Его методы значительно улучшают поведенческую аналитику угроз, уменьшая количество ложноположительных сообщений. Становится возможным более легко обнаруживать атаки, охватывающие несколько уровней корпоративной активности, такие как фишинг электронной почты, компрометация учетной записи, атаки на прикладной уровень по модели OSI, например на веб-приложения, и компрометация сети на уровне операционной системы [8].

Также машинное обучение можно использовать для наиболее лучшего анализа предыдущих кибератак и совершенствовать соответствующие меры безопасности. Такой подход позволяет создать автоматизированную систему киберзащиты с небольшим количеством сотрудников с ограниченными возможностями в сетевой безопасности [9]. Алгоритмы машинного обучения могут быть использованы для анализа производительности системы и выявления необычных событий, которые не согласуются с нормальным поведением сети. Дополнительно алгоритмы могут быть обучены на нескольких наборах данных, чтобы они могли отслеживать только начало возможной атаки.

Обнаружение аномалий в поведении сети может помочь группам сетевой безопасности найти все, от скомпрометированного аппаратного узла до сотрудника-мошенника в сети компании. Инструменты на базе машинного обучения также полезны при обнаружении и устранении последствий DDoS-атак.

Контроль перегрузки

Управление перегрузкой имеет основополагающее значение для сетевых операций и отвечает за регулирование количества пакетов, поступающих в сеть. Это обеспечивает стабильность сети, справедливое использование ресурсов и приемлемый коэффициент потери пакетов. Различные сетевые архитектуры используют собственный набор механизмов управления перегрузкой. Наиболее известные механизмы управления перегрузкой реализованы в TCP, поскольку TCP вместе с IP составляют основу современного Интернета [10].

Еще одним хорошо известным механизмом управления перегрузкой является управление очередями, который работает внутри промежуточных узлов сети (например, коммутаторов и маршрутизаторов) в дополнение к TCP. Было внесено несколько улучшений в механизмы управления перегрузкой для Интернета и эволюционных сетевых архитектур, таких как сети, устойчивые к разрывам (DTN) и сети именованных данных (NDN) [11]. Искусственная нейронная сеть позволяет использовать активное управление очередью – упреждающий подход, который смягчает ограничения отбрасывания конца очереди, отбрасывая пакеты (или помечая их для отбрасывания) до того, как очередь заполнится. Это позволяет конечным системам реагировать на перегрузку до того, как очередь переполнится, а промежуточным узлам управлять отбрасыванием пакетов.

Управление ресурсами

Управление ресурсами в сети влечет за собой контроль жизненно важных ресурсов сети, включая ЦП, память, диск, коммутаторы, маршрутизаторы, полосу пропускания, точку доступа, радиоканалы и их частоты. Они используются совместно или независимо для предоставления услуг [12].

Аналитика, основанная на машинном обучении, может определять, когда сетевой компонент находится на начальных стадиях сбоя, и предсказывать, когда эти стадии могут появиться для исправных в данный момент узлов. Поставщики сетевого оборудования все чаще внедряют подобную аналитику в свои инструменты управления, особенно инструменты, построенные на основе предложений так называемого программного обеспечения как услуги (SaaS).

Здесь распределение ресурсов становится бинарной классификацией или проблемой принятия решений, которая должна активно управлять ресурсами, обеспечивая стабильность сети при изменениях ее размера, ширины канала и т.д. Контроль доступа — это косвенный подход к управлению ресурсами, который не требует прогнозирования спроса. Целью управления доступом является оптимизация использования ресурсов путем мониторинга и управления ресурсами в сети [13].

В этом случае управление доступом диктует, следует ли разрешить или отклонить новый входящий запрос, исходя из доступных сетевых ресурсов, требований QoS нового запроса и его последствий для существующих служб, использующих ресурсы в сети. Очевидно, что принятие нового запроса приносит доход поставщику сетевых услуг. Однако это может привести к ухудшению качества обслуживания существующих услуг из-за нехватки ресурсов и, как следствие, к нарушению SLA, что повлечет за собой штрафы и потерю доходов. Таким образом, возникает неизбежный компромисс между приемом новых запросов и поддержанием или соблюдением QoS. Управление доступом решает эту проблему и направлено на максимальное количество запросов, принимаемых и обслуживаемых сетью, без нарушения SLA.

Заключение

За последние два десятилетия машинное обучение успешно применялось в различных областях сетей. Очевидно, что будущие сети должны будут поддерживать взрывной рост объема трафика и подключенных устройств, чтобы обеспечить исключительные возможности для доступа и обмена информацией. Беспрецедентный масштаб и степень неопределенности усложнят задачи управления трафиком, такие как управление перегрузками, прогнозирование трафика, классификация и маршрутизация, а также подверженность сбоям и атакам на безопасность.

В этом обзоре мы обсудили вышеперечисленные возможности применения алгоритмов. Немало важным направлением развития использования машинного обучения в сетях сетей стоит отметить, что такие алгоритмы можно применять и при построении сетей на отечественном оборудовании с их доработкой под такой функционал, так как этот может существенно уменьшить нагрузку на сетевых специалистов и не только.

Список литературы:

Программно-определяемые сети (SDN) – новый подход к построению сетей. Как обеспечить их эффективный мониторинг? [Электронный ресурс]. – Режим доступа: https://networkguru.ru/programmno-opredeliaemye-seti-sdn-monitoring/ (дата обращения: 15.12.22)
Развитие асинхронного метода переноса и многопротокольной коммутации по меткам [Электронный ресурс]. – Режим доступа: https://www.computer-museum.ru/connect/mpls.htm (дата обращения: 15.12.22)
Xie J. et al. A survey of machine learning techniques applied to software defined networking (SDN): Research issues and challenges //IEEE Communications Surveys & Tutorials. – 2018. – Т. 21. – №. 1. – С. 393-430.
Shafiq M. et al. Network traffic classification techniques and comparative analysis using machine learning algorithms //2016 2nd IEEE International Conference on Computer and Communications (ICCC). – IEEE, 2016. – С. 2451-2455.
What is the role of machine learning in networking? [Электронный ресурс]. – Режим доступа: https://www.techtarget.com/searchnetworking/answer/What-is-the-role-of-machine-learning-in-networking (дата обращения: 20.12.22)
Okafor K. C. et al. Leveraging fog computing for scalable IoT datacenter using spine-leaf network topology //Journal of Electrical and Computer Engineering. – 2017. – Т. 2017.
Barradas D. et al. FlowLens: Enabling Efficient Flow Classification for ML-based Network Security Applications //NDSS. – 2021.
Mughaid A. et al. An intelligent cyber security phishing detection system using deep learning techniques //Cluster Computing. – 2022. – С. 1-10.
Gelenbe E. Machine learning for network routing //2020 9th Mediterranean Conference on Embedded Computing (MECO). – IEEE, 2020. – С. 1-1.
Nagle J. Congestion control in IP/TCP internetworks //ACM SIGCOMM Computer Communication Review. – 1984. – Т. 14. – №. 4. – С. 11-17.
Ariefianto W. T., Syambas N. R. Routing in NDN network: A survey and future perspectives //2017 11th International Conference on Telecommunication Systems Services and Applications (TSSA). – IEEE, 2017. – С. 1-6.
Prevost J. J. et al. Prediction of cloud data center networks loads using stochastic and neural models //2011 6th International Conference on System of Systems Engineering. – IEEE, 2011. – С. 276-281.
Braden B. et al. Recommendations on queue management and congestion avoidance in the Internet. – 1998. – №. rfc2309.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов

ИСПОЛЬЗОВАНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В ЗАДАЧАХ ОРГАНИЗАЦИИ ПЕРЕДАЧИ СЕТЕВОГО ТРАФИКА

Оставить комментарий