Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: CI Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 10 мая 2021 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Щудро И.А. РАНЖИРОВАНИЕ КОМПАНИЙ НА САЙТЕ ПРИ ПОМОЩИ ИНСТРУМЕНТАРИЯ КЛАССИФИКАЦИОННЫХ НЕЙРОННЫХ СЕТЕЙ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. CI междунар. студ. науч.-практ. конф. № 5(100). URL: https://sibac.info/archive/technic/5(100).pdf (дата обращения: 27.04.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

РАНЖИРОВАНИЕ КОМПАНИЙ НА САЙТЕ ПРИ ПОМОЩИ ИНСТРУМЕНТАРИЯ КЛАССИФИКАЦИОННЫХ НЕЙРОННЫХ СЕТЕЙ

Щудро Игорь Анатольевич

магистрант, кафедра программного обеспечения вычислительной техники и автоматизированных систем, Оренбургский государственный университет,

РФ, г. Оренбург

Соловьев Николай Алексеевич

научный руководитель,

д-р техн. наук, проф., зав. кафедрой программного обеспечения вычислительной техники и автоматизированных систем, Оренбургский государственный университет,

РФ, г. Оренбург

RANKING COMPANIES ON THE SITE USING THE CLASSIFICATION NEURAL NETWORK ANALYSIS TOOL

 

Igor Shchudro

Master’s student, Department of Computer Engineering and Automated Systems, Orenburg State University,

Russia, Orenburg

Nikolay Soloviev

scientific adviser, Doctor of Technical Sciences, Professor, Head of the Department of Computer Engineering and Automated Systems, Orenburg State University,

Russia, Orenburg

 

АННОТАЦИЯ

В статье представлены результаты применения нейронных сетей в задачах ранжирования компаний, предоставляющих товары и услуги на информационных сайтах. Обосновано использование многослойной нейронной сети с обучением алгоритмом обратного распространения ошибки, определенa точность построенного бинарного классификатора.

ABSTRACT

The article presents the results of using neural networks in tasks of ranking companies that provide goods and services on informational sites. The use of a multilayer neural network with training by backpropagation learning rule has been substantiated, and the accuracy of the constructed binary classifier has been determined.

 

Ключевые слова: информационный сайт, релевантность запросов, ранжирование компаний, нейронная сеть, бинарная классификация.

Keywords: information site, relevance of queries, ranking of companies, neural network, binary classification.

 

В задачах поиска информации в современных условиях ссылочной избыточности и с целью повышения релевантности запросов, в сети интернет все чаще используют информационные сайты (сайты-агрегаторы), объединяющие клиентов и компании, предоставляющие товары и услуги.

Для повышения эффективности поиска информации на сайте целесообразно построение ранжированного списка компаний по запросу клиента. С этой целью необходимо решение задачи классификации исходя из вектора параметров, который сопровождает каждую компанию [1, с. 389].

Стандартным инструментом статистического решения задачи бинарной классификации долгое время считалась логическая регрессия. Но, как правило, нейронные сети способны решать данную задачу более эффективно, так как фактически генерируют большое число логистических регрессий (в случае, если функция активации f(x) имеет вид, указанный в формуле (1)

f(x)                                                                        (1)

 

x – признаки объектов.

В этом случае, объектами классификации являются компании, а в качестве признаков могут выступать следующие параметры:

  1. 1 – суммарный ранг компании (1÷100);
  2. 2 – конверсия (0÷1);
  3. 3 – средняя оценка (0÷5);
  4. 4 – кэшбэк (0÷15%);
  5. 5 – возраст ресурса (1÷100 дней);
  6. 6 – посещаемость сайта (0÷100 раз в неделю);

Учитывая важность этапа выбора архитектуры нейронной сети, в работе была построена изначально сеть минимального размера и, далее, постепенно увеличивалась до достижения требуемой точности, при этом на каждом шаге требовалась переобучение нейросети. Моделирование в программе Academic Deductor, исходя из точности полученных результатов, позволило определить архитектуру многослойной нейронной сети – [6–4–2–1], т.е. четырехслойный персептрон с шестью входными параметрами, двумя скрытыми слоями и одним выходом, представленной на рисунке 1 [2, с. 158].

 

Рисунок 1. Четырехслойный персептрон

 

Из рисунка видно, что нейросетевой классификатор состоит из тринадцати нейронов: шесть – на входном слое, четыре – на первом скрытом, два – на втором скрытом и один – на выходном слое.

Обучение нейросети целесообразно производить обучающей выборкой, включающей как «хорошие» компании (метка класса «1»), так и «плохие» (метка класса «0»). Все признаки объектов являются количественными, поэтому требуется нормирование данных, которое может быть выполнено методом минимакс, предполагающим определенность пределов изменения значений признаков в выборке: минимальное и максимальное значения [3, с. 96]:

                                                                (2)

 

X – признаки объектов.

Нормированные данные обучающей выборки пропускаются через сеть, методом обратного распространения ошибки и определяются веса всех нейронов. Учитывая вероятностную интерпретацию сигналов выходного нейрона в классификационных сетях, полученный результат означает определенную вероятность отнесения указанной потенциальной компании к классу «хороших».

Диаграмма состояний обучения разработанной нейронной сети представлена на рисунке 2. Из рисунка видно, что в результате обучения формируются весовые коэффициенты исходя из требуемой точности.

 

Рисунок 2. Диаграмма состояний обучения нейронной сети

 

Фрагмент обучающей выборки по шести показателям для десяти компаний, представлен на рисунке 3. Как видно из рисунка, результаты классификации находятся в пределах от 0 до 1.

 

Рисунок 3. Фрагмент обучающей выборки

 

Обучение нейросетевого классификатора происходило с помощью программы Academic Deductor с выборкой из 100 компаний на 10000 эпохах. Результат обучения представлен на рисунке 4, из которого видна динамика снижения максимальной и средней ошибок ниже уровня 1,00E – 04.

 

Рисунок 4. Результаты обучение нейросетевого классификатора

 

На рисунке 5 показана выборка результатов классификации десяти компаний, размещенных в порядке уменьшения рейтинга.

 

Рисунок 5. Квалификационная выборка по десяти компаниям

 

На рисунке 6 представлены результаты классификации отдельной компании по исследуемым параметрам. Параметры классификации прошли процедуру нормализации по выражению (2).

 

Рисунок 6. Результаты классификации отдельной компаний по шести параметрам

 

Аналитические показатели точности классификации позволяют количественно определить величину ошибки. Одним из показателей является относительная ошибка классификации, определяемая по формуле

.                                                         (3)

 

 - относительная ошибка классификации;

Δ* - абсолютная ошибка классификации;

  - фактическое значение признака.

Для проверки корректной работы информационного сайта и точности классификации компаний были взяты данные компаний, чей класс априорно известен. Такой подход позволил оценить точность классификации, произведенной с помощью программы Academic Deductor и информационным сайтом (таблица 1).

Таблица 1

Точность классификации программой Academic Deductor и информационным сайтом

Academic Deductor

Информационный сайт

Класс

Фактический

Относительная ошибка ()

Класс

Фактический

Относительная ошибка ()

0,726

0,727

0,138

0,726

0,727

0

0,672

0,672

0

0,672

0,672

0,148

0,511

0,511

0

0,511

0,511

0,195

0,504

0,505

0,198

0,504

0,505

0

0,500

0,500

0

0,500

0,500

0,2

0,476

0,476

0

0,476

0,476

0

0,408

0,409

0,244

0,408

0,409

0

0,387

0,387

0

0,387

0,387

0

0,383

0,383

0

0,383

0,383

0

0,375

0,375

0

0,375

0,375

0

Оценка точности

0,058

Оценка точности

0,0543

 

Из таблицы видно, что относительная ошибка классификации информационного сайта соизмерима с подобной ошибкой программы Academic Deductor и соответствует требуемой точности ранжирования компаний на сайте.

На рисунке 7 представлены результаты тестирования информационного сайта с использованием нейросетевого классификатора при запросе клиента «Одежда». Компании представлены на выходной форме сайта в виде списка, расположенных в порядке уменьшения результата классификации.

 

Рисунок 7. Фрагмент ранжированного списка компаний на сайте по запросу клиента «Одежда»

 

Таким образом, в работе обоснована возможность решения задачи ранжирования объектов с использованием инструментария классификационных нейронных сетей.

Определена архитектура, выполнено построение бинарного классификатора и представлены результаты моделирования в программе Academic Deductor.

Оценка точности классификации с помощью программы Academic Deductor и информационного сайта показала соизмеримость ошибок этих программ и достижение требуемых значений для качественного ранжирования компаний на сайте.

 

Список литературы:

  1. Щудро, И.А. Интеллектуальные агенты поиска информации в семантической сети: сборник материалов IX Всероссийской конференции с международным участием. Комплексная интеграция производства и ИПИ-технологии / И.А. Щудро. – Оренбург: ОГУ, 2019. – С. 389 – 393. ISBN 978-5-4417-0799-2.
  2. Барсегян, А.А. Методы и модели анализа данных: OLAP и Data Mining.СПб.: БХВ-Петербург,2004.-336с.
  3. Боровиков, В.П. Нейронные сети. Statistica Neural Networks. Методология и технологии современного анализа данных / В.П. Боровиков. – 2-е изд. – М.: Горячая линия – Телеком, 2008. – 392 с.
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.