Статья опубликована в рамках: Научного журнала «Студенческий» № 42(170)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5
РАЗРАБОТКА СИСТЕМЫ АВТОМАТИЗИРОВАННОЙ ОБРАБОТКИ ОБРАЩЕНИЙ ГРАЖДАН
DEVELOPMENT OF A SYSTEM FOR AUTOMATED PROCESSING OF CITIZENS' APPEALS
Vadim Shirobokov
master’s student, Institute of Informatics and Computer Engineering, Kalashnikov Izhevsk State Technical University,
Russia, Izhevsk
АННОТАЦИЯ
Статья посвящена разработке интеллектуальной системы автоматизированной обработки обращений граждан. Целью разработки данной системы является сокращение времени и уменьшение трудозатрат при обработке обращений граждан. В статье представлены результаты обзора существующих на рынке программного обеспечения аналогичных систем. Также описана основная идея системы и принципы ее работы. В результате разработан алгоритм реализации системы и описан каждый его этап. Описана область применения и ожидаемые результаты.
ABSTRACT
The article is devoted to the development of an intelligent system for automated processing of citizens' appeals. The purpose of developing this system is to reduce time and labor costs in processing citizens' appeals. The article presents the results of a review of existing similar systems on the software market. It also describes the basic idea of the system and the principles of its operation. As a result, an algorithm of system implementation was developed and each stage is described. The scope of application and expected results are described.
Ключевые слова: обращения граждан, интеллектуальные системы, машинное обучение, кластеризация, классификация текстов, тематическое моделирование.
Keywords: citizens' appeals, intelligent systems, machine learning, clustering, text classification, thematic modeling.
Одной из актуальных, на данный момент, задач государства является разрешение проблем его граждан. Люди постоянно встречаются с проблемами различного характера, например, социального или бытового.
На сегодняшний день государством были созданы различные инструменты помощи гражданам. Наиболее популярным ее инструментом является прием и обработка обращений граждан [1,2]. До развития интернет-технологий люди писали письма с жалобами на бумаге и шли на почту. Сейчас же все переведено в электронный формат и написать и отправить обращение можно с персонального компьютера или смартфона. Еще большую актуальность данному способу придала эпидемия Covid-19. Но, даже несмотря на введение интернет-технологий в данную область все равно у граждан появляются трудности в обращении к государству. Например, не всегда ясно, куда отправлять обращение, в какое ведомство.
В связи с этим является актуальной тема проектирования такой системы, которая могла бы позволить обрабатывать обращения пользователей, анализировать суть проблемы и самостоятельно распределять обращения по соответствующим ведомствам.
На рынке представлено множество различных решений. Одним из таких является программное обеспечение от компании Directum – RX Directum [3]. Обработкой обращений занимается подсистема «Обращения граждан». На рисунке 1 изображен список заявленных разработчиком функций данной подсистемы.
Рисунок 1. Directum RX «Обращения граждан»
Несмотря на заявленный функционал, продукт имеет ряд недостатков. Решение предусматривает только ручную обработку обращений. Также прием обращений происходит только по почте.
Еще одним решением, представленным на рынке, является Docvision [4]. На рисунке 2 представлены основные возможности данной системы.
Рисунок 2. Docvision «Обращения граждан»
В решении задачи от компании Docvision также существует недостаток: обработка обращений проходит в ручном режиме.
В связи с этим актуальной является разработка интеллектуальной системы для автоматической обработки обращений граждан. Данная система предполагает, что в автоматическом режиме будет выполняться анализ текста обращения и распределение обращений по адресантам. Функциональная составляющая системы изображена на рис. 3.
Рисунок 3. Функциональность системы
Для автоматизации обращений граждан наиболее перспективно применение технологий машинного обучения.
В данном случае конечной задачей, которую необходимо решить системе, будет задача классификации. В данном случае под задачей классификации [5] понимается отнесение текста обращения к определенному классу на основании его содержания.
В результате анализа проблематики был разработан алгоритм реализации системы, изображенный на рис. 4.
Рисунок 4. Алгоритм реализации системы
Для решения данной задачи необходим набор данных, на котором можно было бы обучить модель. В первую очередь этот набор данных необходимо подготовить. Необходимо подготовить структуру данных, которая позволит сохранить записи. Также необходимо сформировать набор необходимых признаков, т.е. выявить наиболее значимые признаки и исключить мультиколлинеарность.
Перед выполнением классификации необходимо:
- провести чистку и обработку данных,
- выполнить поиск ключевых слов,
- векторизация текстов,
- тематическое моделирование,
- кластеризация обращений.
Очистка и обработка данных подразумевает: удаление дубликатов, исправление грамматических ошибок, обработка пустых значений, удаление лишних символов, проведение токенизации и лемматизации, удаление стоп-слов.
В результате работы алгоритма тематического моделирования строится модель коллекции текстовых документов, которая определяет, к каким темам относится каждое обращение [6].
Кластеризация применяется для снижения размерности в исходном наборе данных и увеличения точности решаемой в дальнейшем задачи классификации [7]. Для решения задачи кластеризации используются классические алгоритмы кластеризации: метод k-means [8] (с использованием интеллектуальной надстройкой k-means++) и метод иерархического кластерного анализа [9], которые показали хорошие результаты при апробации на различных практических задачах [10-13].
На этапе разработки модели производится разбиение обработанных данных на обучающую и тестовую выборки, выбор и реализация алгоритма классификации. В результате выполняется обучение модели и ее тестирование, оценка точности работы реализованного алгоритма на тестовой выборке.
На последнем этапе производится реализация графического интерфейса, реализация функциональных требований. Производится оценка работоспособности реализованной системы.
Алгоритм работы системы разделен на несколько шагов. На первом этапе происходит сбор обращений из специализированных информационных источников. На втором этапе система обрабатывает полученные обращения. Обработка происходит в два шага. Изначально происходит форматирование полученного обращения, а затем определяется тематика текста. На последнем этапе обращение обрабатывается специалистом. Специалист, основываясь на полученных из системы данных, может принять обращение, тем самым подтвердив отправку обращения исполнителю, либо отклонить обращение.
Реализуемая система будет выполнять положения ФЗ-59 «О порядке рассмотрения обращений граждан Российской Федерации». Систему можно применять для обработки обращений в государственных учреждениях. Она позволит ускорить процесс обработки обращений, поможет отправлять ответы в срок, разгрузит работу специалистов.
Список литературы:
- Скомская К.Э. Обращения граждан как инструмент реализации взаимодействия общества и органов власти // Вестник Удмуртского университета. Серия «Экономика и право». 2013. №1. URL: https://cyberleninka.ru/article/n/obrascheniya-grazhdan-kak-instrument-povysheniya-effektivnosti-vzaimodeystviya-naseleniya-i-vlasti (дата обращения: 18.10.2021).
- Лапин А.Е., Борисов Н.И. Обращения граждан как инструмент повышения эффективности взаимодействия населения и власти // Юридический факт. 2020. №110. URL: https://elibrary.ru/item.asp?id=44061074 (дата обращения: 20.10.2021).
- Обращения граждан / Directum RX [Электронный ресурс]. URL: https://www.directum.ru/solution/rx_petitions_management (дата обращения: 21.10.2021)
- Обращения граждан / Docvision [Электронный ресурс]. URL: https://docsvision.com/products/dv-catalog/obrascheniya-grazhdan/ (дата обращения: 21.10.2021).
- Батура Т.В. Методы автоматической классификации текстов // Программные продукты и системы. 2017. №1. URL: https://www.researchgate.net/publication/315328102_Metody_avtomaticeskoj_klassifikacii_tekstov (дата обращения: 22.10.2021).
- Коршунов А.В. Тематическое моделирование текстов на естественном языке // Труды Института системного программирования РАН. 2012. №23. URL: https://elibrary.ru/item.asp?id=18361454 (дата обращения: 23.10.2021).
- Шаталова О.М.; Касаткина Е.В. Классификация промышленных регионов РФ в исследовании условий устойчивого развития: адаптированный алгоритм k-means // Системный анализ в проектировании и управлении. Ч. 2: сборник научных трудов XXV Международной научной и учебно-практической конференции, 13–14 октября 2021 г. DOI: 10.18720/SPBPU/2/id21-153.
- KMeans. [Электронный ресурс] — URL: https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html (дата обращения: 25.10.2021).
- Agglomerative Clustering. [Электронный ресурс] — URL: https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html (дата обращения: 25.10.2021).
- Касаткина Е.В. Статистическое исследование дорожно-транспортной обстановки в Удмуртской Республике // Вестник ИжГТУ имени М.Т. Калашникова. 2017. Т. 20. № 1. С. 53-59.
- Кетова К.В., Трушкова Е.В. Решение логистической задачи топливоснабжения распределенной региональной системы теплоснабжения // Компьютерные исследования и моделирование. 2012. Т. 4. № 2. С. 451-470.
- Kasatkina E.V., Ketova K.V., Vavilova D.D. Development of analysis and forecast technologies for road accidents in the region and its application // AIP Conference Proceedings. Proceedings of the III International Conference on Advanced Technologies in Materials Science, Mechanical and Automation Engineering. 2021. С. 070005. DOI: 10.1063/5.0071291.
- Kasatkina E.V., Vavilova D.D. Dependence Assessment of Public Health on the Ecology Based on Cluster Analysis // Conference Proceedings: 2021 3rd International Conference on Control Systems, Mathematical Modeling, Automation and Energy Efficiency (SUMMA), IEEE. DOI: 10.1109/SUMMA53307.2021.9632233
Оставить комментарий