Статья опубликована в рамках: CCXXXVI Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 11 мая 2026 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Земцов С.П. ПРИМЕНЕНИЕ ФЕДЕРАТИВНОГО ОБУЧЕНИЯ ДЛЯ ОБЕСПЕЧЕНИЯ КОНФИДЕНЦИАЛЬНОСТИ ПРИ АНАЛИЗЕ ЮРИДИЧЕСКОЙ ДОКУМЕНТАЦИИ // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. CCXXXVI междунар. студ. науч.-практ. конф. № 9(235). URL: https://sibac.info/archive/meghdis/9(235).pdf (дата обращения: 03.08.2026)

Проголосовать за статью

Конференция завершена

Эта статья набрала 0 голосов

Дипломы участников

У данной статьи нет
дипломов

ПРИМЕНЕНИЕ ФЕДЕРАТИВНОГО ОБУЧЕНИЯ ДЛЯ ОБЕСПЕЧЕНИЯ КОНФИДЕНЦИАЛЬНОСТИ ПРИ АНАЛИЗЕ ЮРИДИЧЕСКОЙ ДОКУМЕНТАЦИИ

Земцов Степан Павлович

магистрант, Кафедра информатики и вычислительной техники, Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнёва,

РФ, г. Красноярск

APPLICATION OF FEDERATED LEARNING TO ENSURE CONFIDENTIALITY IN THE ANALYSIS OF LEGAL DOCUMENTATION

Zemtsov Stepan Pavlovich

Master's student, Department of Computer Science and Computer Engineering, Reshetnev Siberian State University of Science and Technology,

Russia, Krasnoyarsk

АННОТАЦИЯ

В статье рассматривается применение федеративного обучения для анализа юридической документации без передачи исходных документов на центральный сервер. Актуальность темы обусловлена тем, что правовые документы могут содержать персональные данные. Предлагается архитектура, при которой локальные узлы организаций обучают вспомогательные интеллектуальные модели на собственных данных, а центральный сервер получает только агрегируемые параметры модели, что позволяет повысить качество анализа документов и сохранить конфиденциальность юридической информации.

ABSTRACT

The article discusses the application of federated learning for the analysis of legal documentation without transferring the original documents to the central server. The relevance of this topic is due to the fact that legal documents may contain personal data. The proposed architecture involves local nodes of organizations training auxiliary intelligent models on their own data, while the central server receives only aggregated model parameters, which helps to improve the quality of document analysis and maintain the confidentiality of legal information.

Ключевые слова: юридическая документация; федеративное обучение; конфиденциальность; искусственный интеллект; машинное обучение; персональные данные.

Keywords: legal documentation; federated learning; confidentiality; artificial intelligence; machine learning; personal data.

Работа с юридической документацией является одной из наиболее ответственных задач в деятельности организаций. Договоры, государственные и муниципальные контракты, дополнительные соглашения и акты выполненных работ содержат условия, от корректности которых зависят финансовые и правовые последствия для сторон. Ошибка в сроках исполнения, порядке оплаты, ответственности или приемке результата может привести к спорам, штрафам и дополнительным расходам.

Развитие искусственного интеллекта позволяет автоматизировать часть юридического анализа. Большие языковые модели и методы обработки естественного языка могут использоваться для выявления противоречий, поиска рискованных формулировок и проверки структуры документа. Однако в юридической сфере применение таких технологий ограничено вопросом конфиденциальности. Документы часто содержат персональные данные, коммерческую тайну, реквизиты сторон и сведения о стоимости. Их передача во внешние облачные сервисы может противоречить регламентам организации и требованиям законодательства о защите персональных данных [1].

Одним из способов решения данной проблемы является федеративное обучение. Данный подход предполагает, что обучающие данные остаются на локальных устройствах или серверах участников, а на центральный сервер передаются только обновления параметров модели. Первоначально федеративное обучение рассматривалось как метод обучения моделей на распределенных пользовательских данных без их централизованного сбора [2]. В дальнейшем данный подход стал применяться в задачах, где требуется сочетание машинного обучения и повышенных требований к приватности [3].

В системе анализа юридической документации федеративное обучение может быть организовано следующим образом. Центральный сервер содержит базовую модель и отвечает за координацию обучения. Локальные узлы организаций или филиалов получают копию модели и обучают ее на собственных документах, результатах проверок и синтетически сформированных ошибках. После завершения локального обучения на сервер передаются только параметры модели или их изменения. Центральный сервер агрегирует полученные обновления и формирует новую глобальную версию модели. При этом исходные юридические документы не покидают локальный контур организации.

Важно учитывать, что федеративное обучение не должно применяться как механизм обмена нормативными актами. Федеральные и региональные правовые нормы должны храниться в явном виде в соответствующих нормативных базах и использоваться при анализе через отдельный поисковый модуль. Федеративное обучение целесообразно применять для дообучения вспомогательных компонентов системы: классификатора юридических рисков, классификатора типов ошибок, ранжировщика релевантных норм или легкого адаптера к языковой модели. Такой подход является более реалистичным, чем дообучение большой языковой модели целиком.

Особую значимость такая архитектура имеет при работе организаций, имеющих несколько региональных подразделений. Например, локальные узлы в Москве, Санкт-Петербурге и Красноярском крае могут учитывать собственную специфику документов и региональных нормативных требований. При этом общая модель постепенно улучшает качество анализа за счет обобщения опыта всех узлов, не получая доступа к закрытым данным конкретных организаций.

Для усиления защиты информации могут применяться дополнительные меры: отказ от хранения документов на центральном сервере, шифрование каналов связи, журналирование действий пользователей, ограничение состава передаваемых параметров, а также защищенная агрегация. В перспективе возможно применение дифференциальной приватности, которая снижает риск восстановления информации из параметров модели. Однако даже в упрощенном виде федеративная архитектура уже позволяет существенно уменьшить риски, связанные с передачей юридических документов во внешнюю среду.

Для практической реализации подобной системы может использоваться фреймворк Flower, предназначенный для построения и симуляции систем федеративного обучения [4]. В качестве обучаемого компонента может выступать легкий классификатор риска, работающий поверх эмбеддингов пунктов договора. Это позволит продемонстрировать принцип федеративного обучения без необходимости дообучения большой языковой модели.

Таким образом, федеративное обучение является перспективным подходом для интеллектуального анализа юридической документации. Оно позволяет повысить качество моделей за счет распределенного обучения и одновременно сохранить конфиденциальность правовых документов.

Список литературы:

Федеральный закон от 27.07.2006 № 152-ФЗ «О персональных данных» // Собрание законодательства Российской Федерации. — 2006. — № 31. — Ст. 3451.
McMahan H.B., Moore E., Ramage D., Hampson S., Agüera y Arcas B. Communication-Efficient Learning of Deep Networks from Decentralized Data // Proceedings of the 20th International Conference on Artificial Intelligence and Statistics. — 2017. — Vol. 54. — P. 1273–1282.
Kairouz P., McMahan H.B., Avent B. et al. Advances and Open Problems in Federated Learning // Foundations and Trends in Machine Learning. — 2021. — Vol. 14, № 1–2. — P. 1–210.
Flower Framework Documentation [Электронный ресурс]. — URL: https://flower.ai/docs/framework/index.html (дата обращения: 25.04.2026).

Проголосовать за статью

Конференция завершена

Эта статья набрала 0 голосов

Дипломы участников

У данной статьи нет
дипломов