Телефон: 8-800-350-22-65
Напишите нам:
WhatsApp:
Telegram:
MAX:
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XCIV Международной научно-практической конференции «Вопросы технических и физико-математических наук в свете современных исследований» (Россия, г. Новосибирск, 22 декабря 2025 г.)

Наука: Информационные технологии

Секция: Системный анализ, управление и обработка информации

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Лончакова Д.А., Михо Е.А. МЕТОДОЛОГИЯ ВЕРИФИКАЦИИ СИНТЕТИЧЕСКИХ БАНКОВСКИХ ТРАНЗАКЦИЙ ЧЕРЕЗ ЭКОНОМИКО-УПРАВЛЕНЧЕСКУЮ МОДЕЛЬ ПОВЕДЕНЧЕСКИХ ПРОФИЛЕЙ // Вопросы технических и физико-математических наук в свете современных исследований: сб. ст. по матер. XCIV междунар. науч.-практ. конф. № 12(85). – Новосибирск: СибАК, 2025. – С. 24-28.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

МЕТОДОЛОГИЯ ВЕРИФИКАЦИИ СИНТЕТИЧЕСКИХ БАНКОВСКИХ ТРАНЗАКЦИЙ ЧЕРЕЗ ЭКОНОМИКО-УПРАВЛЕНЧЕСКУЮ МОДЕЛЬ ПОВЕДЕНЧЕСКИХ ПРОФИЛЕЙ

Лончакова Дарья Александровна

студент, кафедра безопасности информационных технологий, РГУ нефти и газа им. И.М. Губкина,

РФ, г. Москва

Михо Евгений Аленович

студент, кафедра безопасности информационных технологий, РГУ нефти и газа им. И.М. Губкина,

РФ, г. Москва

METHODOLOGY FOR VERIFICATION OF SYNTHETIC BANKING TRANSACTIONS THROUGH AN ECONOMIC AND MANAGERIAL MODEL OF BEHAVIORAL PROFILES

 

Lonchakova Darya Aleksandrovna

Student, Department of Information Technology Security, Gubkin Russian State University of Oil and Gas,

Russia, Moscow

Mikho Evgeny Alenovich

Student, Department of Information Technology Security, Gubkin Russian State University of Oil and Gas,

Russia, Moscow

 

АННОТАЦИЯ

В статье предлагается методология верификации синтетических банковских транзакций через экономико-управленческую модель поведенческих профилей. Описываются ключевые этапы: сегментация субъектов платежного поведения, таксономия типовых операций, построение поведенческих профилей и генерация синтетического массива данных. Рассматривается система метрик для валидации качества синтетических данных на основе статистических тестов и управленческих индикаторов. Подчеркивается значимость синтетических данных для безопасного тестирования аналитических систем и управленческих экспериментов в условиях цифровизации финансовых услуг.

ABSTRACT

This article proposes a methodology for verifying synthetic banking transactions using an economic and managerial model of behavioral profiles. Key stages are described: segmentation of payment behavior subjects, taxonomy of typical transactions, construction of behavioral profiles, and generation of a synthetic data set. A system of metrics for validating the quality of synthetic data based on statistical tests and management indicators is discussed. The importance of synthetic data for secure testing of analytical systems and management experiments in the context of digitalization of financial services is emphasized.

 

Ключевые слова: синтетические данные, банковские транзакции, верификация данных, поведенческие профили, сегментация клиентов, экономико-управленческая модель, валидация качества, цифровизация финансовых услуг.

Keywords: synthetic data, banking transactions, data verification, behavioral profiles, customer segmentation, economic-managerial model, quality validation, digitalization of financial services.

 

Развитие цифровых финансовых систем приводит к росту объема чувствительных данных о клиентах, которые необходимы для управления рисками, фрод-детекции и разработки новых сервисов. Строгие требования регуляторов (ФЗ-152, GDPR, PCI DSS) существенно ограничивают доступ к реальным банковским данным, что затрудняет проведение исследований и управленческих экспериментов. Синтетические данные позволяют воспроизводить статистические закономерности реальных транзакций без раскрытия информации о конкретных лицах, но возникает проблема объективной оценки их реалистичности. В статье предлагается методология, объединяющая экономико-управленческую модель платежного поведения с инженерией синтетического массива данных, где формализованные поведенческие профили используются как фреймворк для верификации качества синтетических банковских транзакций [1].

Экономико-управленческая модель выступает эталоном для верификации синтетических данных и строится на трех взаимосвязанных уровнях. Первый уровень модели определяет сегменты клиентов — устойчивые группы с предсказуемыми поведенческими характеристиками. Модель использует двумерную сегментацию: по типу субъекта (ФЛ, ИП, ЮЛ) и по профилю поведения.

Физические лица (ФЛ) классифицируются по четырем ортогональным измерениям: социально-экономический статус (уязвимые <30 тыс. руб./мес, средний класс 30-100 тыс., высокий доход >100 тыс.), тип занятости (наемные работники, самозанятые, пенсионеры), структура домохозяйства (одиночки, семьи, многопоколенные), географический фактор (мегаполисы, малые города, сельская местность) [4].

Юридические лица и ИП сегментируются по масштабу (микробизнес <5 сотр., малый 5-50, средний 50-250), отраслям (ритейл, услуги, производство, IT) и налоговому режиму (УСН, ОСНО, НПД). Каждый сегмент характеризуется базовыми метриками: доля в совокупности (15% уязвимые, 60% средний класс, 15% высокий доход, 10% бизнес), месячный доход/оборот, предпочитаемые каналы (мобильный банк 65%, веб 25%, офис 10% для ФЛ), географическое распределение.

Второй уровень модели определяет классы операций и минимальный набор атрибутов (MIN). Для физических лиц выделены входящие операции (зарплатные поступления, пенсии, P2P-переводы, возвраты) и исходящие (POS-покупки, P2P/P2B-переводы, коммунальные платежи, наличные, цифровые подписки, погашение кредитов).

Для ЮЛ и ИП входящие операции включают выручку через эквайринг, B2B-поступления, кредитные линии; исходящие — платежи поставщикам, зарплатные реестры, аренду, налоговые платежи, логистику [3].

Третий уровень модели кодифицирует типичные поведенческие паттерны для каждого сегмента через систему эталонных профилей. Частотные паттерны определяют суточные (покупки в вечерние часы 19:00-22:00), недельные (выплаты в конце недели, пятница-понедельник) и месячные циклы интенсивности операций.

Распределения сумм следуют логнормальному закону для POS-покупок и гамма-распределению для зарплат и выручки. Соотношение каналов существенно зависит от возраста: молодежь 18-35 лет предпочитает мобильный банк (70%), средний возраст 35-55 — веб-интерфейс (50%), пожилые 55+ — офис и ATM (60%) [2].

Таблица 1.

Эталонные профили поведения по основным сегментам

Сегмент

Медиана POS

Пик активности

Канал (%)

Сезонность

Уязвимые

800 руб.

1-5 числа

Офис 60%

Коммун. платежи

 

 

 

 

 

Средний класс

4000 руб.

Равномерно

Мобайл 65%

Декабрь +45%

Высокий доход

10000 руб.

Выходные

Веб 55%

Отпуска, инвест.

ИП/Малый бизнес

50000 руб.

Договорные сроки

Веб 70%

Налоговые периоды

 

Сезонность проявляется в ярких пиках расходов декабря (+35-50% против среднемесячного), июля-августа (отпуска, туризм), начала и конца налоговых периодов. Дефолты и кредитные платежи концентрируются в конце месяца (дни +3-5 после выплаты зарплаты). Эти параметры служат входными данными для четырехэтапного генератора синтетических данных [1].

Синтетический генератор реализован в виде четырехэтапного конвейера, где каждый последующий этап использует результаты предыдущего.

Этап 1 — создание искусственной популяции клиентов на основе сегментного распределения (уязвимые 15%, средний класс 60%, высокий доход 15%, ИП/МСП 10%). Каждому клиенту присваиваются атрибуты согласно профилю сегмента.

Этап 2 — построение временных графиков операций с использованием модулированного Пуассоновского процесса:

;

где λ₀ — базовая интенсивность, A — амплитуда сезонности, T — период цикла.

Этап 3 — генерация атрибутов операции: суммы из соответствующих распределений, MCC-кодов из вероятностного словаря сегмента, каналов согласно профилю, временных меток суточных профилей.

Этап 4 — создание логических связей: дебет-кредитные пары для переводов, цепочки погашения кредитов, регулярные подписки. Результат: при параметрах 10 тыс. клиентов за 12 месяцев генерируется ~5 млн синтетических транзакций за 2-3 минуты [5].

Качество синтетических данных проверяется в три этапа. Первый этап сравнивает распределения значений синтетических и реальных транзакций с помощью статистических тестов Колмогорова-Смирнова и хи-квадрат, которые показывают, насколько похожи данные. Второй этап проверяет связи между разными характеристиками операций, например, как доход клиента соотносится с размером его покупок. Третий этап оценивает бизнес-показатели: соотношение доходов и расходов по группам клиентов, рост трат в декабре и долю подозрительных операций, которая должна соответствовать реальной практике.

Таким образом, предложенная методология интегрирует экономико-управленческое моделирование с инженерией синтетических данных, создавая надежный инструмент для безопасного тестирования банковских систем без риска утечки конфиденциальной информации [3]. Трехуровневая модель сегментации и поведенческих профилей служит эталоном для генерации реалистичных транзакций, а комплексная система верификации обеспечивает соответствие синтетических данных реальным паттернам. Практическая ценность подхода заключается в возможности проведения управленческих экспериментов, разработки и тестирования аналитических систем в условиях жестких регуляторных ограничений. Методология может быть расширена на новые типы операций, включая криптовалютные переводы и трансграничные платежи, что делает ее перспективным направлением развития цифровых финансовых технологий.

 

Список литературы:

  1. Банк России. Годовой отчет о деятельности в сфере развития финансовых технологий за 2024 год. – М.: Банк России, 2024. – 156 с.
  2. Банковские тренды 2024: искусственный интеллект в финансовом секторе [Электронный ресурс] // AllSee Banking Analytics. – 2024. – URL: https://allsee.team/bankaiinsights-2024-shift (дата обращения: 17.12.2025).
  3. Поведенческие индикаторы высокорисковых клиентов в системах финансового мониторинга [Электронный ресурс] // Orion Solutions. – 2024. – URL: https://orion-solutions.ru/tpost/9mc55nooz1-obekti-i-subekti-visokoriskovii-klient-h (дата обращения: 15.12.2025).
  4. Российский рынок цифровизации банков: обзор TAdviser 2024 [Электронный ресурс]. – 2024. – URL: https://www.tadviser.ru (дата обращения: 10.12.2025).
  5. Что такое синтетические данные и как их создавать [Электронный ресурс] // Т-Банк Секреты бизнеса. – 2024. – URL: https://secrets.tbank.ru/blogi-kompanij/sinteticheskie-dannye/ (дата обращения: 10.12.2025).
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий