Телефон: 8-800-350-22-65
Напишите нам:
WhatsApp:
Telegram:
MAX:
Прием заявок круглосуточно
График работы офиса: с 9:00 до 21:00 Нск (с 5:00 до 19:00 Мск)

Статья опубликована в рамках: CCXXXVI Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 11 мая 2026 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Земцов С.П. ИСПОЛЬЗОВАНИЕ RAG-ПОДХОДА ДЛЯ ПРОВЕРКИ ЮРИДИЧЕСКИХ ДОКУМЕНТОВ НА СООТВЕТСТВИЕ НОРМАТИВНЫМ ТРЕБОВАНИЯМ // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. CCXXXVI междунар. студ. науч.-практ. конф. № 9(235). URL: https://sibac.info/archive/meghdis/9(235).pdf (дата обращения: 30.05.2026)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ИСПОЛЬЗОВАНИЕ RAG-ПОДХОДА ДЛЯ ПРОВЕРКИ ЮРИДИЧЕСКИХ ДОКУМЕНТОВ НА СООТВЕТСТВИЕ НОРМАТИВНЫМ ТРЕБОВАНИЯМ

Земцов Степан Павлович

магистрант, Кафедра информатики и вычислительной техники, Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнёва,

РФ, г. Красноярск

USING THE RAG APPROACH TO VERIFY LEGAL DOCUMENTS FOR COMPLIANCE WITH REGULATORY REQUIREMENTS

 

Zemtsov Stepan Pavlovich

Master's student, Department of Computer Science and Computer Engineering, Reshetnev Siberian State University of Science and Technology,

Russia, Krasnoyarsk

 

АННОТАЦИЯ

В статье рассматривается применение подхода Retrieval-Augmented Generation для проверки юридических документов на соответствие нормативным требованиям. Отмечается, что большие языковые модели способны анализировать естественный язык, но не должны использоваться как самостоятельный источник правовой информации. Для повышения достоверности анализа предлагается использовать RAG-архитектуру, при которой выводы модели формируются на основе найденных фрагментов нормативной базы. Описан общий алгоритм обработки документа, поиска релевантных правовых норм и формирования отчета о выявленных нарушениях.

ABSTRACT

The article discusses the use of Retrieval-Augmented Generation for verifying legal documents for compliance with regulatory requirements. It is noted that large language models can analyze natural language, but should not be used as an independent source of legal information. The proposed RAG architecture allows model conclusions to be based on retrieved fragments of the regulatory knowledge base.

 

Ключевые слова: RAG; юридические документы; нормативные требования; большие языковые модели; семантический поиск; правовой анализ.

Keywords: RAG; legal documents; regulatory requirements; large language models; semantic search; legal analysis.

 

Автоматизированная проверка юридических документов требует не только анализа текста, но и сопоставления его положений с действующими нормативными требованиями. При проверке договора или государственного контракта необходимо учитывать наличие обязательных условий, внутреннюю согласованность формулировок, корректность сроков, порядка оплаты, приемки результата и ответственности сторон.

Большие языковые модели могут быть полезны в такой задаче, так как они способны работать с естественным языком, выделять смысловые связи и формировать понятные пользователю объяснения. Однако их использование в юридической сфере имеет серьезное ограничение: модель может сформировать убедительный, но фактически неверный ответ. Например, она может сослаться на несуществующую статью закона, использовать устаревшую редакцию нормы или сделать вывод без достаточного основания. Поэтому языковая модель не должна рассматриваться как самостоятельный источник юридической истины.

Для снижения данного риска может использоваться подход Retrieval-Augmented Generation, или генерация с дополненной выборкой. Его основная идея заключается в том, что перед формированием ответа система сначала ищет релевантные фрагменты во внешней базе знаний, а затем передает их языковой модели в качестве контекста [1]. За счет этого ответ формируется не только на основе внутренних параметров модели, но и на основе конкретных найденных источников. Для задач, где требуется актуальная и проверяемая информация, данный подход является более надежным, чем обычное использование генеративной модели [2].

В сфере юридического анализа RAG-подход позволяет связать каждый вывод системы с конкретным нормативным основанием. Общий процесс работы может включать несколько этапов. Сначала формируется нормативная база, включающая федеральные и региональные правовые акты. В качестве источников могут использоваться Официальный интернет-портал правовой информации, портал нормативных правовых актов Российской Федерации и иные открытые государственные ресурсы [3; 4]. Для практической апробации также могут применяться открытые государственные и муниципальные контракты из Единой информационной системы в сфере закупок [5].

Далее нормативные документы проходят предварительную обработку: текст очищается, разбивается на фрагменты и снабжается метаданными. К метаданным могут относиться название акта, дата, регион, статья, пункт, источник и ссылка на исходный документ. После этого каждый фрагмент преобразуется в векторное представление с помощью модели эмбеддингов и сохраняется в векторной базе данных. Такой способ хранения позволяет искать не только совпадения по ключевым словам, но и близкие по смыслу нормы.

Когда пользователь загружает юридический документ, система извлекает его текст, определяет тип документа и разбивает его на логические части: предмет, цену, сроки, порядок оплаты, порядок приемки, ответственность, расторжение и реквизиты. Для каждого фрагмента выполняется поиск релевантных правовых норм. Затем найденные нормы и анализируемый пункт документа передаются в языковую модель. При этом модель должна формировать вывод только на основе предоставленного контекста. Если подходящая норма не найдена, система должна указать на невозможность сделать достоверный правовой вывод, а не создавать его самостоятельно.

Результатом работы является отчет, в котором указывается пункт документа, тип выявленной проблемы, краткое объяснение, найденная правовая норма, уровень риска и рекомендация по исправлению. Такой формат позволяет увидеть не только итоговое замечание, но и его основание, на котором оно сделано. При этом окончательное решение должно оставаться за юристом, а интеллектуальная система должна выполнять функцию предварительного анализа.

Важным условием эффективности RAG-подхода является качество поиска. Если релевантная норма не попадет в число найденных фрагментов, языковая модель не сможет сформировать корректный вывод. Поэтому систему необходимо оценивать не только по качеству итоговых ответов, но и по метрикам информационного поиска. В качестве таких метрик могут использоваться Recall@k и MRR. Дополнительно для оценки классификации ошибок могут применяться precision, recall и F1-score.

Таким образом, RAG-подход является рациональным решением для автоматизированной проверки юридических документов на соответствие нормативным требованиям. Он позволяет использовать преимущества больших языковых моделей, снижая риск недостоверных правовых ссылок.

 

Список литературы:

  1. Lewis P., Perez E., Piktus A. et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks // Advances in Neural Information Processing Systems. — 2020. — Vol. 33. — P. 9459–9474.
  2. Gao Y., Xiong Y., Gao X. et al. Retrieval-Augmented Generation for Large Language Models: A Survey [Электронный ресурс]. — 2023. — URL: https://arxiv.org/abs/2312.10997 (дата обращения: 26.04.2026).
  3. Официальный интернет-портал правовой информации. Открытые данные [Электронный ресурс]. — URL: https://publication.pravo.gov.ru/OpenData (дата обращения: 27.04.2026).
  4. Нормативные правовые акты в Российской Федерации [Электронный ресурс]. — URL: https://pravo.minjust.ru/ (дата обращения: 27.04.2026).
  5. Реестр контрактов, заключенных заказчиками // Единая информационная система в сфере закупок [Электронный ресурс]. — URL: https://zakupki.gov.ru/epz/contract/search/results.html (дата обращения: 28.04.2026).
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов