Статья опубликована в рамках: CXXXVII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 13 мая 2024 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
РАЗРАБОТКА ЧАТ-БОТА С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
DEVELOPMENT OF A CHAT BOT USING ARTIFICIAL INTELLIGENCE
Timur Ishniyazov
student, Department of Informatics and Methods of Teaching Informatics, Nizhnevartovsk State University,
Russia, Nizhnevartovsk
Elena Nikonova
scientific supervisor, Ph.D. ped. Sciences, Associate Professor, Nizhnevartovsk State University,
Russia, Nizhnevartovsk
АННОТАЦИЯ
Чат-боты – это компьютерная программа, предназначенная для общения между людьми и машинами. Чат-бот может использоваться на различных платформах, включая приложения для обмена сообщениями и виртуальных помощников. Технология чат-ботов продолжает сталкиваться с целым рядом проблем, таких как понимание контекста, интеграция с системами, персонализация и принятие пользователями в повседневность. Мы рассмотрели весь процесс разработки и различные методы, используемые для создания чат-ботов.
Целью работы является разработка чат-бота с использованием искусственного интеллекта, который может обрабатывать текстовые сообщение пользователей и генерировать на них ответы.
В работе спроектирована и обучена модель чат-бота, а также интегрирован разработанный бот в «telegram» и проверена эффективность разработанного решения на основе проведения тестирования и анализа результатов.
ABSTRACT
Chatbots are a computer program designed to communicate between humans and machines. The chatbot can be used on a variety of platforms, including messaging apps and virtual assistants. Chatbot technology continues to face a number of challenges, such as understanding context, integrating with systems, personalization, and user acceptance into everyday life. We have reviewed the entire development process and the various methods used to create chatbots.
The aim of the work is to develop a chatbot using artificial intelligence that can process users' text messages and generate responses to them.
In the work, a chatbot model was designed and trained, as well as the developed bot was integrated into telegram and the effectiveness of the developed solution was tested based on testing and analysis of the results.
Ключевые слова: чат-бот; искусственный интеллект; нейронные сети;
Keywords: chatbot; artificial intelligence; neural networks;
За прошедшие годы разработка чат-ботов претерпела значительные изменения: от простых систем, основанных на правилах, до продвинутых моделей обработки естественного языка.
Для создания и обучения нейронной сети был выбран язык программирования Python - широко используемый язык программирования в области машинного обучения, в том числе при разработке нейронных сетей. [3] Он имеет огромное сообщество разработчиков и большую экосистему библиотек, таких как TensorFlow, Keras, и другие.
TensorFlow – это мощная открытая программная библиотека для машинного обучения и разработки в области искусственного интеллекта, созданная Google Brain Team* [1, с. 58].
Keras, в свою очередь, является высокоуровневым API нейронной сети, который облегчает и упрощает создание моделей нейронных сетей [1, с. 24].
В качестве тренировочной выборки (датасета) для обучения нейросети был выбран набор данных Toloka Persona Chat Rus.
Каждый диалог представляет собой последовательность сообщений, обмененных между двумя участниками исследования – человеком и чат-ботом. Диалоги были созданы с использованием методов генеративного моделирования и были нацелены на достижение более высоких уровней проникновения в человеческую психологию и поведение, что даёт точную информацию, по мнению, Н.Ю. Матвеевой и А.В. Золотарюк вне зависимости от платформы чат-бот – это программа, которая формирует корректные, логически обоснованные ответы. [2, c. 30]
Для обучения и тестирования нейронной сети был выбран сервис Google Colaboratory*.
Google Colab* – это сервис для разработки и обучения машинных моделей, который предоставляется компанией Google*.
В процессе исследования была выбрана архитектура LSTM, ввиду нескольких аспектов:
• нейронные сети seq2seq и transformer относительно молодые технологии, вследствие чего наблюдается недостаток обучающей литературы по разработке нейронных сетей рассматриваемых архитектур;
• для обучения нейронных сетей типа seq2seq и transformer требуется продолжительное использование значительных вычислительных ресурсов;
По этим причинам структура разрабатываемой нейросети будет выглядеть в соответствии с рис. 1.
Выбранная структура содержит 21.824.768 обучаемых параметров, что является оптимальным количеством для обучения нейронной сети с помощью сервиса Google Colaboratory*. Вместе с тем подобная архитектура позволяет добиться необходимой производительности обученной модели нейронной сети.
Рисунок 1. Структура нейронной сети
Обучение нейронной сети проводилось в два этапа по 20 эпох, с сохранением состояния НС между этапами. Размер пакета составляет 32 диалога длиной 128 токенов, на вход нейронной сети подаётся сообщение и результат обработки сравнивается с ответным сообщением из выборки. Коэффициент отсева (Dropout rate) равен 0,2, размер словаря 32.000.
Для создания и настройки бота в приложении «Telegram» (Телеграм) используется бот под названием «BotFather» – этот бот является официальным сервисом для создания, конфигурации и управления телеграм-ботами, который отвечает за изменение косметических аспектов аккаунтов, привязанных к ним ботов, таких как название, описание и аватар, но не отвечает за специфические функции и команды.
Для взаимодействия с телеграм-ботом будет использована библиотека «Telebot»
Telebot – это библиотека для разработки чат-ботов на языке Python.
После подключения и настройки бота проведена проверка его работоспособности (рис. 2)
Рисунок 2. Проверка работоспособности телеграм-бота
В процессе тестирования полученного чат-бота на разных наборах диалогов были получены следующие результаты:
Рисунок 3. Пример успешного диалога с ботом
Рисунок 4. Пример успешного диалога с ботом
Рисунок 5. Пример неудачного диалога с ботом
Из примеров, показанных на рисунках 6 и 7, можно сделать вывод о том, что полученная модель чат-бота испытывает некоторые трудности с предлогами, пунктуацией и падежами, но, несмотря на это, может строить вполне осмысленные ответы на сообщения.
Однако полученные результаты не всегда получались такими согласованными, иногда разные варианты ответов смешивались в одном, создавая бессмысленную последовательность слов и символов, как в примере на рис. 5.
Скорее всего это связано с высокой сложностью сопряжения слов в русском языке, а также с общей сложностью самого языка, что приводит к подобным аномалиям. Возможно, при обучении модели на языке, с более простым алгоритмом построения предложений, разработанный в рамках работы чат-бот показывал бы более приемлемые результаты.
В результате проведенного исследования был разработан чат-бот с использованием искусственного интеллекта. Анализ результатов тестирования показал, что разработанный чат-бот может генерировать осмысленные ответы на сообщения пользователей, хоть и не всегда точно.
*(По требованию Роскомнадзора информируем, что иностранное лицо, владеющее информационными ресурсами Google является нарушителем законодательства Российской Федерации – прим. ред.)
Список литературы:
- Антонио, Д. Библиотека Keras – инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow [Электронный ресурс] // Лань: электронно-библиотечная система. – URL: https://e.lanbook.com/book/111438 (дата обращения: 08.06.2023). – Режим доступа: для авториз. пользователей.
- Матвеева Н. Ю., Золотарюк А.В. Технологии создания и применения чат-ботов // Научные записки молодых исследователей. – М: Финансовый университет, 2018. – №1. – С.28-30
- Шумилина М.А., Коробко А.В. Разработка чат-бота на языке программирования Python в мессенджере Telegram // Научные известия. – 2022. – С. 47-54.
дипломов
Оставить комментарий