Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XLVIII Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 05 июля 2018 г.)

Наука: Технические науки

Секция: Технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Рыжиков О.А. ПРИМЕНЕНИЕ МЕОДОВ МАШИННОГО ОБУЧЕНИЯ В СФЕРЕ ДИСПЕТЧЕРИЗАЦИИ ЗАЯВОК ОТРАСЛЕВЫХ СЕРВИСНЫХ КОМПАНИЙ // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. XLVIII междунар. студ. науч.-практ. конф. № 13(48). URL: https://sibac.info/archive/meghdis/13(48).pdf (дата обращения: 28.12.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ПРИМЕНЕНИЕ МЕОДОВ МАШИННОГО ОБУЧЕНИЯ В СФЕРЕ ДИСПЕТЧЕРИЗАЦИИ ЗАЯВОК ОТРАСЛЕВЫХ СЕРВИСНЫХ КОМПАНИЙ

Рыжиков Олег Александрович

студент (магистратура), кафедра  ГИС, УГАТУ,

РФ, г. Уфа

В наш век – век информационных технологий во всех сферах деятельности собирают, хранят и используют огромное количество информации. Существует множество методов ее анализа и в последнее время быстрыми темпами развиваются методы машинного обучения для анализа данных и прогнозирования.

В больших организациях существует отдел технической поддержки пользователей, который работают по заявкам. Практически у каждого сотрудника имеется рабочий компьютер, функционирование которого напрямую влияет на результат труда. Состояние компьютера можно отследить по следующим параметрам:

 температура процессора;

 загрузка процессора;

 температура видеокарты;

 температура жёсткого диска;

 доля свободного места на системном диске;

 число подключенных USB-устройств;

информация о функционировании сети – число потерянных пакетов;

и т.д.

Сбор подобной информации внутри корпоративной сети организации легко осуществить путем внедрения системы мониторинга средствами автоматической установки приложений. Также в подобных организация имеется база обращений.

Таким образом, собрать подобную информацию не представляется сложным. Сама по себе эта информация не будет нести в себе информативности для людей, не осведомленных в компьютерных технологиях. Поэтому необходимо создать систему для анализа этих данных и сопоставить ее с поступившими заявками

Одним из современных подходов к анализу данных является применение методов машинного обучения. Существует множество библиотек для различных языков программирования позволяющих применять машинное обучение с меньшими трудозатратами.

Разработкой библиотек помогающих реализовать машинное занимаются такие компании как NVidia. Intel, Google, Яндекс и другие крупнейшие корпорации всего мира.

Итак, собрав данные о состоянии персональных компьютеров и используя информацию о поступающих заявках пользователей рассмотрим работу методов машинного обучение, ниже на рисунке 1 приведена общая схема работы машинного обучения.

 

Рисунок 1. Общая схема работы методов машинного обучения

 

Первым делом собранные данные нужно подготовить необходимо разделить на две части, одна часть используется для обучения, вторая для тестирования. На основе собранных данных происходит моделирование, эксперты устанавливают граничные условия и к чему приведет подобное поведение, затем используется методы машинного обучения, и последний этап - система прогнозирует выходные данные на новые поступающие входные данные.

Существуют разные методы машинного обучения, в данной статье рассмотрим искусственные нейронные сети.

Нейронная сеть представляет собой последовательность нейронов, соединенных синапсами. Структура нейронной сети вошла в мир программирования непосредственно из биологии. Благодаря этой структуре машина может анализировать и даже запоминать различную информацию. Нейронные сети также могут не только анализировать поступающую информацию, но и воспроизводить ее из своей памяти. Другими словами, сеть нейронов является машинной интерпретацией человеческого мозга, в которой миллионы нейронов передают информацию в виде электрических импульсов

Таким образом, один нейрон такого типа позволяет нам реализовать линейный классификатор или линейную регрессию. При решении практических задач линейность является чрезмерно сильным ограничением.

Нейронные сети используются для решения сложных задач, требующих аналитических вычислений, подобных тем, которые делают мозг человека. Наиболее распространенными приложениями нейронных сетей являются:

Нейронные сети используются для решения сложных задач, требующих аналитических расчетов, подобных тем, которые выполняются человеческим мозгом. Наиболее распространенными приложениями нейронных сетей являются:

Классификация - распределение данных по параметрам. Например, ввод предоставляется множеству людей, и вы должны решить, кто из них может дать кредит, а кто нет. Эта работа может быть выполнена нейронной сетью, анализируя информацию, такую как: возраст, кредитоспособность, кредитная история и т. д.

Прогнозирование — это возможность предсказать следующий шаг. Например, рост или снижение запасов, в зависимости от ситуации на фондовом рынке.

Признание - в настоящее время самое широкое применение нейронных сетей. Используется в Google при поиске фотографии или камеры в телефоне, когда он определяет положение лица и выделяет его и многое другое.

Нейрон — это вычислительная единица, которая получает информацию, выполняет простые вычисления и передает их. Они делятся на три основных типа: вход (синий), скрытый (красный) и выходной (зеленый). Существует также нейрон перемещения и контекстный нейрон, о котором мы поговорим в следующей статье. В случае, когда нейронная сеть состоит из большого числа нейронов, вводится термин «слой». В результате есть входной уровень, который получает информацию, n скрытых слоев (обычно не более 3), которые обрабатывают их, и выходной уровень, который дает результат. Каждый из нейронов имеет 2 основных параметра: входные данные (входные данные) и выходные данные (выходные данные). В случае входного нейрона: input = output. В остальном общая информация всех нейронов предыдущего слоя входит в поле ввода, после чего она нормализуется с использованием функции активации (пока представьте себе f (x)), и входит в поле выхода.

Нейроны работают с числами между [0,1] и [-1,1]. В случае если данные выходят за эти пределы на данный момент самым простым ответом является разделение 1 на это число. Этот процесс называется нормировкой, и он очень часто используется в нейронных сетях.

Синапс — это связь между двумя нейронами. Синапсы имеют параметр - вес. Благодаря этому входная информация изменяется, когда она переносится из одного нейрона в другой. Предположим, что есть 3 нейрона, которые передают информацию в следующую. Тогда у нас есть 3 веса, соответствующие каждому из этих нейронов. На этом нейроне, вес которого будет больше, эта информация будет доминировать в следующем нейроне (пример - смешивание цветов). Фактически, набор весов нейронной сети или весовой матрицы является своего рода мозгом всей системы. Именно посредством этих весов входная информация обрабатывается и преобразуется в результат.

Функция активации — это способ нормализации входных- способ стандартизации входных данных (мы уже говорили об этом ранее). Другими словами, если на входе у вас будет большое число для прохождения через функцию активации, вы получите результат в нужном диапазоне. Активация функций довольно много, если мы рассмотрим самые основные: линейные, сигмовидные (логистические) и гиперболические тангенсы.

Линейная функция активации имеет следующий вид:

Сигмовидная функция активации имеет следующий вид:

Наиболее распространенная функция включена, диапазон значения [0,1]. В большинстве случаев она был представлена в сети, поскольку его иногда называют логистической функцией. Поэтому, если имеются отрицательные значения (например, действия могут идти не только вверх, но и вниз), понадобится функция, которая захватывает и отрицательное направление знака.

Функция активации гиперболический тангенс имеет следующий вид:

Применение этой функции целесообразно, только когда значения могут быть отрицательными и положительными, поскольку область действия функции [-1,1]. Использовать эту функцию только с положительными значениями не подходит, потому что это сильно усугубляет результаты вашего набора.

При начале применения нейронной сети, значение эпохи установлено на 0 и имеет установленный вручную потолок. Чем больше эпоха, тем больше тренируется сеть и, следовательно, ее результат будет лучше. Эпоха увеличивается каждый раз, когда мы проходим через набор обучающих наборов. Важно не путать с итерацией времени и понимать последовательность их увеличения. Во-первых, он увеличивает итерацию, затем время, а не наоборот. Другими словами, вы не можете сначала обучить нейронную сеть одному набору, затем другому, и так далее. Вы должны тренировать каждый набор один раз на время. Таким образом, вы можете избежать ошибок в вычислениях.

Ошибка — это процент, который отражает разницу между ожидаемыми и полученными ответами. Ошибка формируется каждый раз и должна уменьшаться. Если этого не произойдет, значит, вы делаете что-то неправильно. Ошибка может быть рассчитана по-разному, но мы рассмотрим только три основных метода: Mean Square Error, MSE Root и Arctan

MSE - среднеквадратичная ошибка:

Root MSE - среднеквадратичная ошибка:

Arctan – функция ошибки арктангенс:

Ниже на рисунке 2 представлена структура используемой нейронной сети и ее пареметры.

 

Рисунок 2. Структура используемой нейронной сети

 

Проанализировав полученную модель нейронной сети на тестовой выборке значение среднеквадратичной ошибки и точность получились следующими:

RMSE = 0,15846;

Accuracy = 0,96543.

Низкое значение ошибки и высокая точность позволяет сделать вывод о целесообразности применения методов машинного обучения в области диспетчеризации обращений сервисных компаний.

 

Список литературы:

  1. CatBoost Documentation [Электронный ресурс]. — URL: https://tech.yandex.com/catboost/doc/dg/concepts/about-docpage/, (дата обращения 12.02.2018)
  2. Keras Documentation [Электронный ресурс]. — URL: https://keras.io, (дата обращения 12.02.2018)
  3. Уоссермен Ф., Нейрокомпьютерная техника - Мир, 1992. – 15 с
  4. Лагутин М. Б. Наглядная математическая статистика. / М.: П-центр, 2003. — С. 10-56.
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий