Телефон: 8-800-350-22-65
Напишите нам:
WhatsApp:
Telegram:
MAX:
Прием заявок круглосуточно
График работы офиса: с 9:00 до 21:00 Нск (с 5:00 до 19:00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 20(358)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал

Библиографическое описание:
Лашкин М.А. АРХИТЕКТУРНОЕ ПРОЕКТИРОВАНИЕ И РАЗРАБОТКА АВТОНОМНОГО ИИ-АССИСТЕНТА ДЛЯ СЛУЖБЫ ТЕХНИЧЕСКОЙ ПОДДЕРЖКИ НЕФТЕХИМИЧЕСКОГО ПРЕДПРИЯТИЯ // Студенческий: электрон. научн. журн. 2026. № 20(358). URL: https://sibac.info/journal/student/358/420365 (дата обращения: 27.06.2026).

АРХИТЕКТУРНОЕ ПРОЕКТИРОВАНИЕ И РАЗРАБОТКА АВТОНОМНОГО ИИ-АССИСТЕНТА ДЛЯ СЛУЖБЫ ТЕХНИЧЕСКОЙ ПОДДЕРЖКИ НЕФТЕХИМИЧЕСКОГО ПРЕДПРИЯТИЯ

Лашкин Максим Александрович

магистрант, кафедра «Цифровое управление процессами и системами нефтегазового комплекса», Омский Государственный Технический Университет,

РФ, г. Омск

ARCHITECTURAL DESIGN AND DEVELOPMENT OF AN AUTONOMOUS AI ASSISTANT FOR A PETROCHEMICAL ENTERPRISE IT SUPPORT SERVICE

 

Lashkin Maksim Aleksandrovich

Master's student, Department of Digital Management of Oil and Gas Complex Processes and Systems, Omsk State Technical University,

Russia, Omsk

 

АННОТАЦИЯ

Рассмотрен подход к проектированию локальной изолированной системы поддержки пользователей на базе LLM и RAG для крупного промышленного объекта КИИ. Описана модульная архитектура решения, включающая блоки классификации интентов и деперсонализации данных. Приведены результаты оценки технологической и экономической эффективности внедрения.

ABSTRACT

The paper considers an approach to designing an on-premise isolated user support system based on LLMs and RAG for a large CII industrial facility. A modular system architecture, including intent classification and data depersonalization modules, is described. The results of the technological and economic efficiency assessment are presented.

 

Ключевые слова: искусственный интеллект, большие языковые модели, RAG, информационная безопасность, критическая информационная инфраструктура, автоматизация IT-поддержки.

Keywords: artificial intelligence, large language models, RAG, information security, critical information infrastructure, IT support automation.

 

Введение

Современная индустрия нефтехимии характеризуется высоким уровнем автоматизации как основных технологических процессов (АСУ ТП), так и корпоративных ИТ-сервисов. Масштабирование ИТ-инфраструктуры АО «Омский каучук» влечет за собой экспоненциальный рост нагрузки на службы технической поддержки первого уровня. Статистический анализ исторических данных ITSM-системы предприятия показывает, что до 70% поступающих от сотрудников обращений носят строго детерминированный, рутинный характер. К ним относятся запросы на сброс доменных паролей, конфигурирование сетевых профилей на АРМ, базовая настройка прав доступа в Active Directory (AD) и поиск нормативно-справочной информации во внутренних регламентах завода.

Существующий регламент ручной обработки заявок приводит к возникновению задержек (время первичной реакции оператора может достигать 45 минут), что в условиях непрерывного химического производства повышает риски простоя смежных цифровых сервисов.

Решением данной проблемы на современном этапе развития информационных технологий является внедрение диалоговых агентов на базе больших языковых моделей (LLM). Однако специфика функционирования АО «Омский каучук» как объекта критической информационной инфраструктуры (КИИ) накладывает жесткие нормативно-правовые ограничения:

Использование внешних облачных API (OpenAI GPT, Anthropic Claude и др.) категорически запрещено политиками информационной безопасности из-за трансграничной передачи данных.

Внедрение автономного ИИ-чат-бота на базе LLM обусловлено необходимостью выполнения требований ст. 19 ФЗ-152 «О персональных данных». Использование публичных облачных LLM-сервисов не позволяет гарантировать конфиденциальность и исключить риски утечки персональных данных сотрудников (ФИО, табельные номера, IP-адреса) третьим лицам. Локальное развертывание обеспечивает полный контроль над данными в рамках защищенного контура организации и минимизирует риски компрометации информации [9].

В соответствии с ФЗ № 187-ФЗ «О безопасности КИИ РФ», критически важные сервисы должны сохранять полную автономность и работоспособность даже в случае полной изоляции внутренней сети от сегмента Интернет (режим Air-gapped) [8].

Таким образом, возникает научно-практическая задача проектирования модельно-независимой, полностью автономной архитектуры интеллектуального ассистента, способного осуществлять поиск по неструктурированным базам знаний и отвечать на запросы пользователей на естественном языке с нулевым риском утечки информации.

Архитектура и техническая реализация

Разрабатываемая система базируется на микросервисном подходе и концепции декларативного конструирования диалоговых цепей. В качестве программного фундамента используется стек, состоящий из фреймворка LangChain [2; 3], асинхронного веб-сервера FastAPI [7] и контейнеризации Docker. Автономность функционирования достигается за счет локального развертывания каждого компонента.

Для формализации процессов взаимодействия компонентов системы использована нотация UML. Логика работы ассистента строится на событийной модели: от перехвата сообщения в ITSM-системе до выдачи верифицированного ответа.

Общая схема прохождения запроса пользователя и взаимодействия модулей представлена на диаграмме (рис. 1).]

 

Рисунок 1. Концептуальная архитектура обработки запросов в локальном ИИ-ассистенте

 

Процесс обработки разделен на изолированные этапы:

1. Модуль классификации интентов(намерений)

Для минимизации накладных расходов на вычислительную инфраструктуру (GPU/CPU) входящий текстовый поток не направляется напрямую в основную генеративную модель. Первичную обработку осуществляет специализированный маршрутизатор интентов на базе LangChain. С использованием Pydantic-валидации входящий запрос сопоставляется с жестко заданной структурой JSON.

Если пользователь отправляет нецелевой запрос или стандартное приветствие («Добрый день», «Спасибо за помощь»), роутер мгновенно перенаправляет вызов на ветку быстрых шаблонизированных ответов, полностью минуя тяжелые алгоритмы векторного поиска.

2. Обезличивание персональных данных

В случае классификации интента как «Технический инцидент», запрос передается в модуль фильтрации. Модуль разработан с использованием библиотеки SpaCy (модель) ru_core_news_md и скомпилированных регулярных выражений. Он выполняет обнаружения именованных сущностей (Named Entity Recognition-NER).

Пример: Исходная строка «У меня, инженера Петрова В.В., не работает почта на АРМ 192.168.1.45» трансформируется в обезличенный вектор: «У меня, инженера [PER_0], не работает почта на АРМ [IP_0]». Вектор передается дальше по цепочке, а реальные значения хэшируются в кратковременной сессии для обратной подстановки при выдаче финального ответа пользователю.

3. Модуль генерации с дополненной выборкой (RAG)

База знаний ИТ-отдела АО «Омский каучук», состоящая из текстовых инструкций, регламентов и PDF-документов, проходит процедуру предварительной обработки:

Текст сегментируется алгоритмом RecursiveCharacterTextSplitter на фрагменты размером 700 символов с перекрытием в 100 символов. Это сохраняет семантическую связность на границах кусков.

С помощью легковесной локальной модели bge-m3 генерируются плотные векторные представления фрагментов [4].

Векторы индексируются в специализированной базе данных Qdrant [5]. При поступлении очищенного запроса пользователя Qdrant осуществляет косинусное сравнение векторов и извлекает 3 наиболее релевантных фрагмента документации.

Процесс прохождения высокоуровнего запроса пользователя через фильтры безопасности, классификатор и RAG-контур показан на UML диаграмме последовательности (Рис 2.)

 

Рискнок 2. Процесс прохождения высокоуровневого запроса пользователя через фильтры безопасности, классификатор и RAG-контур.

 

Информационный поток инициируется сотрудником предприятия. Веб-шлюз FastAPI выполняет роль центрального оркестратора. Ключевая особенность жизненного цикла заключается в изоляции генеративного ядра (LLM Core) от сырых данных: модуль PII Sanitizer осуществляет двунаправленную трансформацию текста. Он маскирует персональные данные (ФИО, табельные номера, IP-адреса, телефоны) на входе и восстанавливает их из локального хэша сессии на выходе, гарантируя выполнение требований ФЗ-152 без потери информативности для конечного пользователя.

4. Локальный инференс генеративного ядра

Важнейшим узлом оптимизации вычислительной нагрузки в условиях изолированной инфраструктуры является разделение входящего трафика по типам намерений (интентов) и интеллектуальное управление контекстом RAG.

Сформированный контекст (инструкции предприятия и отмаскированный запрос пользователя) передается в локальную языковую модель Saiga Llama-3. Модель оптимизирована для работы в условиях ограниченных аппаратных ресурсов предприятия: она сконвертирована в формат GGUF и сжата методом 4-bit квантования (коэффициент Q4_K_M) [1].

Это техническое решение позволяет снизить требования к RAM/VRAM сервера с исходных 32 ГБ до 6–8 ГБ. Инференс выполняется силами библиотеки llama.cpp с применением технологии PagedAttention, что обеспечивает параллельную обработку потока запросов на стандартных многоядерных процессорах (CPU) без обязательного использования дорогостоящих ускорителей вычислений (GPU).

4.1. Механизм классификации интентов (Intent Router)

Вместо ресурсоемкого прямого инференса или использования сторонних библиотек валидации, маршрутизация реализована средствами управляемого ветвления внутри диалоговых цепей LangChain [3] на основе строго структурированных JSON-инструкций (JSON Schema).

Входной поток классифицируется по трем базовым классам: technical_issue(сбои ПО, сети, оборудования), greeting(приветствия) и out_of_scope (нецелевые сообщения).

На рис. 3 представлена детальная диаграмма активности, описывающая внутреннюю логику функционирования компонента Intent Router. Модуль осуществляет семантический анализ очищенного текста с использованием технологии Few-Shot Prompting(обучение по нескольким примерам), передавая локальной модели Saiga Llama-3 контекстные примеры обращений, специфичные для ИТ-ландшафта АО «Омский каучук». Выходной поток модели жестко ограничивается рамками декларативной JSON-схемы, содержащей класс намерения и математическую оценку уверенности сети.

Основное преимущество данной архитектурной логики заключается в наличии двухфакторного ветвления:

Порог уверенности (confidence_score): если показатель падает ниже критической отметки 0.75, система превентивно защищает пользователя от неверной информации, прекращает генерацию ответа и инициирует автоматическое открытие инцидента в ITSM-системе GLPI через интеграционный шлюз.

Маршрутизация по базам знаний: при высокой уверенности роутер разделяет нагрузку: технические инциденты адресуются к индексам технических регламентов в Qdrant, а стандартные приветствия обрабатываются изолированно без обращения к дисковой подсистеме, что снижает требования к инфраструктуре.

 

Рисунок 3. Алгоритм работы модуля классификации интентов (Intent Router)

 

Компонент IntentRouter принимает очищенный текст и сопоставляет его с системными промптами-примерами (Few-Shot логика), формируя на выходе строго детерминированный JSON-пакет (RouterOutput). Если показатель уверенности модели (confidence_score) превышает установленный порог 0.75, а выбранный класс соответствует техническому инциденту, управление безусловно передается контуру RAGPipeline.

4.2. Архитектурные особенности RAG-системы

В отличие от стандартных поисковых систем, корпоративный RAG-модуль адаптирован под специфику нефтехимического предприятия АО «Омский каучук»:

Сегментация (Chunking): Длинные PDF-инструкции по эксплуатации АРМ и устранению сетевых сбоев нарезаются алгоритмом RecursiveCharacterTextSplitter на фрагменты по 700 символов с наложением (overlap) в 120 символов, что исключает разрыв логических предложений и технических регламентов.

Векторизация: модель эмбеддингов bge-m3 формирует плотные векторы, учитывающие узкоспециализированную техническую терминологию и сокращения, принятые на заводе.

Хранение и поиск: векторная СУБД Qdrant осуществляет быстрое косинусное сравнение векторов, извлекая топ-3 релевантных фрагмента для передачи в системное контекстное окно модели Saiga Llama-3.

Интеграционные шлюзы и взаимодействие с корпоративной средой

Разработанный интеллектуальный ассистент спроектирован не как изолированное веб-приложение, а как глубоко интегрированный компонент существующего ИТ-ландшафта предприятия.

На рис.4 изображена UML диаграмма компонентов, описывающая интеграционные шлюзы и их взаимодействие с корпоративной средой предприятия.

 

Рисунок 4. Диаграммы компонентов интеграции

 

Диаграмма демонстрирует физическое и логическое сопряжение ИИ-платформы с тремя ключевыми корпоративными сервисами:

Шлюз Active Directory (AD/LDAP): используется для динамического разграничения прав доступа к корпоративным знаниям. При поступлении запроса шлюз FastAPI запрашивает из AD метаданные сотрудника (например, должность и номер цеха). На основе этих данных RAG-модуль фильтрует область поиска в Qdrant: сотруднику технологического цеха выдаются только общедоступные ИТ-инструкции, в то время как системный администратор получает доступ к закрытым регламентам настройки сетевых коммутаторов.

Шлюз ITSM (GLPI): обеспечивает сквозную автоматизацию обработки инцидентов. Связь реализуется через механизм Webhooks. При фиксации инцидента в категории «Прочие» или ручном вводе заявки, GLPI передает JSON-пакет на шлюз ассистента. В случае успешной генерации решения с высокой степенью уверенности, система отправляет обратный API-вызов в GLPI, публикуя пошаговую инструкцию в комментарии к тикету и переводя статус заявки в положение «Решено» без участия диспетчера поддержки.

Конвейер обновления знаний (RAG Ingestion Pipeline): осуществляет мониторинг сетевых папок общего доступа (SMB/NFS) ИТ-отдела. При появлении новой инструкции или обновлении существующего регламента, скрипт на базе библиотек Unstructured [6] автоматически осуществляет пересборку эмбеддингов и обновление индексов в Qdrant, что гарантирует актуальность ответов ИИ-ассистента в режиме реального времени.

Методика экспериментальной оценки и система метрик

Для количественной оценки эффективности, разработанной системы, а также для валидации её применимости в контуре КИИ АО «Омский каучук», была сформирована комплексная система метрик. Оценка разделена на три изолированных домена: качество классификации интентов, точность извлечения контекста (RAG) и технологическую производительность инфраструктуры.

1. Точность (Precision): определяет долю релевантных интентов среди всех, которые система отнесла к данному классу. Минимизирует риск ложноположительных срабатываний (когда диалог ошибочно отправляется в RAG).

                            (1)

2. Полнота (Recall): определяет способность системы обнаружить целевое намерение пользователя среди всего массива входящих запросов. Минимизирует риск пропуска критических инцидентов.

                                  (2)

Где TP(True Positive) — истинно положительные, FP(False Positive) -ложноположительные, FN(False Negative) - ложноотрицательные исходы.

3. F1-Score: среднее гармоническое между точностью и полнотой, выступающее главным критерием сбалансированности классификатора:

                               (3)

Метрики валидации RAG-системы и генерации

Для оценки качества извлечения документов из СУБД Qdrant и последующего синтеза ответа моделью Saiga Llama-3 (без использования облачных платформ) применен фреймворк RAGAS (RAG ASsessment) на основе трех ключевых показателей [10, с. 115]:

1. Соответствие источнику (Faithfulness/Отсутствие галлюцинаций): измеряет, насколько сгенерированный ответ модели обоснован извлеченным из базы знаний фрагментом текста. Метрика нормируется в диапазоне [0;1]. Значение близкое к 1 гарантирует, что локальная LLM не выдумала технические параметры.

2. Релевантность ответа (Answer Relevance): оценивает, насколько финальный ответ модели соответствует исходному смыслу вопроса сотрудника (независимо от полноты цитирования регламента).

3. Релевантность контекста (Context Precision): измеряет, насколько точно поисковый движок (на базе модели эмбеддингов bge-m3) ранжирует и выдает именно те куски документов, которые необходимы для решения инцидента.

Метрики технологической производительности

Специфика работы модели в квантованном формате 4-bit/GGUF на CPU-мощностях предприятия требует строгого контроля вычислительных ресурсов:

1. Time-to-First-Token (TTFT): Время (в секундах) от момента отправки запроса пользователем до генерации моделью первого символа ответа. Это главный маркер «отзывчивости» интерфейса техподдержки.

2. Токенов в секунду (Tokens per Second — TPS): Скорость генерации текста в процессе инференса:

3. Утилизация памяти: объем оперативной памяти, пиково занимаемый процессами llama.cpp и СУБД Qdrant при параллельной обработке потока конкурентных запросов.

Таблица 1.

Количественные показатели эффективности локального ИИ-ассистента техподдержки

Название метрики

Значение

Метод оценки

Техническое обоснование и интерпретация

Точность (Precision)

0.95

Тестирование на 1200 исторических запросах из GLPI

Минимальное число ложных срабатываний. Нецелевые запросы отсекаются корректно в 95% случаев.

Полнота (Recall)

0.93

Сравнение с ручной разметкой экспертов ИТ-отдела

Система успешно распознает и направляет в RAG-контур 93% реальных технических инцидентов.

Мера согласованности (F1-Score)

0.94

Гармоническое среднее (Precision и Recall)

Высокий показатель сбалансированности классификатора благодаря Few-Shot промптингу и JSON-схеме.

Верность источнику (Faithfulness)

0.92

Фреймворк RAGAS

Уровень «галлюцинаций» составляет всего 8%. В 92% случаев модель строит ответ строго на основе извлеченных регламентов.

Ответная релевантность (Answer Relevance)

0.89

Семантическое сходство ответов с эталоном

Финальный ответ Saiga Llama-3 точно соответствует сути проблемы пользователя, сохраняя контекст диалога.

Релевантность поиска (Context Precision)

0.91

Метрика ранжирования СУБД Qdrant

Модель эмбеддингов BGE-M3 и сплиттер (700 симв. / 120 overlap) выводят релевантные куски документов в топ-3 выдачи.

Скорость инференса (Tokens per Second)

14–16 токов/сек

Бенчмарк llama.cpp на CPU (16 потоков)

Скорость комфортна для чтения человеком в режиме реального времени

Время до первого токена (TTFT)

2.8 – 3.5 сек

Замер времени ответа FastAPI шлюза

Время предобработки (PII Sanitizer + Intent Router + Поиск в Qdrant) и старта генерации укладывается в 3 секунды.

Потребление ОЗУ

~6.8 ГБ

Мониторинг системных процессов (Docker/htop)

Модель Saiga-3-8B в 4-bit GGUF занимает ~4.8 ГБ, СУБД Qdrant в оперативной памяти ~1.5 ГБ, остальное FastAPI.

 

Анализ данных, представленных в Таблице 1, позволяет сделать вывод о высокой технологической и прикладной эффективности разработанной архитектуры. Использование квантованного формата GGUF (4-bit) обеспечило экстремально низкий порог вхождения по аппаратным ресурсам — вся система в пике нагрузки утилизирует не более 7 ГБ оперативной памяти сервера, что позволяет эксплуатировать её на стандартных CPU-платформах АО „Омский каучук“.

Высокие показатели метрик фреймворка RAGAS (Faithfulness=0.92, Context Precision=0.91) подтверждают семантическую точность связки парсера Unstructured, векторной СУБД Qdrant и эмбеддингов BGE-M3. Система демонстрирует строгую фактологическую точность, генерируя ответы исключительно на основе внутренней нормативно-справочной документации завода, что критически важно для изолированного контура промышленного предприятия

Результаты и обсуждение

Экспериментальное тестирование разработанной системы проводилось на репрезентативной выборке из 1200 исторических инцидентов, извлеченных из базы данных GLPI АО «Омский каучук».

Оценка качества классификации интентов модулем маршрутизации на базе Pydantic показала высокую точность (метрика F1-Score=0.94), что подтверждает надежность отсечения нецелевого трафика. Эффективность работы алгоритма RAG в связке с квантованной Saiga Llama-3 оценивалась по критерию контекстной релевантности (отсутствие галлюцинаций нейросети). Модель успешно синтезировала корректные пошаговые инструкции по настройке ПО в 89% случаев, строго опираясь на предоставленные локальные файлы нормативных документов.

Основные технологические маркеры эффективности

Время генерации финального структурированного ответа (Time-to-First-Token) составляет 3–5 секунд, что в сотни раз превосходит человеческий показатель.

Наличие модуля обезличивания ПДн(PII Sanitizer) полностью нивелировало риски нарушения ФЗ-152: при тестировании ни один явный идентификатор личности не покинул изолированную среду выполнения и не попал в логи открытого хранения.

Благодаря независимости фреймворка LangChain от конкретного API, архитектура является модельно-независимой (Model-Agnostic). При необходимости ядро Saiga Llama-3 может быть заменено на альтернативные локальные аналоги (например, Qwen 3 или GigaChat) изменением конфигурационного файла конфигурации среды без переписывания интеграционных шлюзов с ITSM и Active Directory.

Для обоснования жизнеспособности проекта в рамках производственной программы предприятия был проведен детальный расчет финансово-экономических показателей. Общий объем первоначальных капитальных вложений (CapEx) на закупку выделенного серверного оборудования и первичную интеграцию составил 1 500 000 рублей. Операционные расходы (OpEx) заложены на уровне 150 000 рублей в год.

С учетом средней стоимости нормо-часа инженеров технической поддержки и процента автоматизации рутинных операций (70%), интегральные экономические показатели эффективности инвестиционного проекта за трехлетний горизонт планирования составили:

Чистый дисконтированный доход (NPV): 1 320 000 рублей;

Внутренняя норма доходности (IRR): 78.8%;

Дисконтированный срок окупаемости (DPP): 1.45 года.

Заключение

В рамках проведенного исследования была успешно спроектирована, программно реализована и верифицирована отказоустойчивая изолированная архитектура интеллектуального ассистента службы ИТ-поддержки. Использование синергетического эффекта связки фреймворка LangChain, векторной СУБД Qdrant и квантованной языковой модели Saiga Llama-3 в формате GGUF позволило решить ключевую дилемму современных корпоративных-систем — развертывание передовых генеративных технологий в условиях жестко изолированного сетевого контура КИИ.

Разработанное решение обеспечивает АО «Омский каучук» полный технологический суверенитет в сфере прикладного искусственного интеллекта, исключает регуляторные риски нарушения ФЗ-152 и ФЗ-187, демонстрирует выраженный экономический эффект за счет снижения TCO (совокупной стоимости владения) корпоративной ИТ-инфраструктуры и сокращает время обработки массовых заявок до нескольких секунд.

 

Список литературы:

  1. Гусев, И. О. Saiga: русскоязычные инструкции для Llama-3: препринт / И. О. Гусев. – Москва: Архитектуры ИИ, 2024. – 42 с. – URL: https://github.com/IlyaGusev/saiga (дата обращения: 25.05.2026).
  2. Borschinger, B. Framework-driven AI: Building applications with LangChain/ B. Borschinger. – Sebastopol : O'Reilly Media, 2023. – 218 p. – ISBN 978-1-098-14931-4.
  3. LangChain Documentation : official website. – San Francisco, 2026. – URL: https://python.langchain.com/docs/ (дата обращения: 25.05.2026).
  4. Xiao, Sh. BGE M3-Embedding: Multi-Lingual, Multi-Granularity, Multi-Functionality for Language Models / Sh. Xiao, Zheng Liu, Weihao Zheng. – Beijing : BAAI Tech Report, 2024. – 18 p. – DOI: 10.48550/arXiv.2402.03216.
  5. Qdrant Vector Search Engine Documentation : official website. – Berlin : Qdrant Solutions GmbH, 2026. – URL: https://qdrant.tech/documentation/ (дата обращения: 25.05.2026).
  6. Unstructured: Data Ingestion Platform for LLMs : official website. – Sacramento : Unstructured Technologies, 2026. – URL: https://docs.unstructured.io/ (дата обращения: 25.05.2026).
  7. FastAPI Framework Documentation : official website. – Berlin, 2026. – URL: https://fastapi.tiangolo.com/ (дата обращения: 25.05.2026).
  8. Российская Федерация. Законы. О безопасности критической информационной инфраструктуры Российской Федерации : Федеральный закон № 187-ФЗ : [принят Государственной Думой 12 июля 2017 года : одобрен Советом Федерации 19 июля 2017 года]. – Москва : Кодекс, 2026. – URL: https://docs.cntd.ru/document/436752114 (дата обращения: 25.05.2026).
  9. Российская Федерация. Законы. О персональных данных : Федеральный закон № 152-ФЗ : [принят Государственной Думой 8 июля 2006 года : одобрен Советом Федерации 14 июля 2006 года]. – Москва : КонсультантПлюс, 2026. – URL: http://www.consultant.ru/document/cons_doc_LAW_61801/ (дата обращения: 25.05.2026).
  10. Shah, S. RAGAS: Automated Evaluation of Retrieval Augmented Generation/S. Shah, V. Esampally, R. Kumar. – New York : ACM Transactions on Interactive Intelligent Systems, 2024. – Vol. 14, no. 2. – P. 112–125. – DOI: 10.1145/3641234.3641255.