Телефон: 8-800-350-22-65
Напишите нам:
WhatsApp:
Telegram:
MAX:
Прием заявок круглосуточно
График работы офиса: с 9:00 до 21:00 Нск (с 5:00 до 19:00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 14(352)

Рубрика журнала: Технические науки

Секция: Радиотехника, Электроника

Скачать книгу(-и): скачать журнал

Библиографическое описание:
Балагова Л.А. ПРИМЕНЕНИЕ НЕЙРОСЕТЕВОЙ ТЕХНОЛОГИИ ДЛЯ РАСПОЗНАВАНИЯ НАЗЕМНЫХ ОБЪЕКТОВ НА РАДИОЛОКАЦИОННЫХ ИЗОБРАЖЕНИЯХ // Студенческий: электрон. научн. журн. 2026. № 14(352). URL: https://sibac.info/journal/student/352/410562 (дата обращения: 26.04.2026).

ПРИМЕНЕНИЕ НЕЙРОСЕТЕВОЙ ТЕХНОЛОГИИ ДЛЯ РАСПОЗНАВАНИЯ НАЗЕМНЫХ ОБЪЕКТОВ НА РАДИОЛОКАЦИОННЫХ ИЗОБРАЖЕНИЯХ

Балагова Лина Ахмедовна

студент, Кафедра 410 «Радиолокация, радионавигация и бортовое радиоэлектронное оборудование», Московский авиационный институт (национальный исследовательский университет),

РФ, г. Москва

APPLICATION OF NEURAL NETWORK TECHNOLOGY FOR GROUND OBJECT RECOGNITION IN RADAR IMAGES

 

Balagova Lina Akhmedovna

Student, Department 410 “Radar Systems, Radio Navigation and Avionics”, Moscow Aviation Institute (National Research University),

Russia, Moscow

 

АННОТАЦИЯ

В статье рассматривается задача распознавания наземных объектов на радиолокационных изображениях (РЛИ) с использованием нейросетевых технологий. Основное внимание уделяется формированию семантического представления сцены, позволяющего интерпретировать радиолокационные данные в терминах классов объектов местности. Для решения задачи применяется нейронная сеть архитектуры U-Net, адаптированная к особенностям SAR-изображений.

Показано, что полученное семантическое описание может использоваться не только для интерпретации сцены, но и для решения прикладных задач, в частности уточнения геопозиционирования радиолокационных изображений путём их сопоставления с оптическими и картографическими данными.

ABSTRACT

This paper addresses the problem of ground object recognition in radar images using neural network methods. The main focus is on constructing a semantic representation of the scene, which enables interpretation of radar data in terms of terrain object classes. To solve this problem, a U-Net-based neural network architecture adapted to the specifics of SAR images is employed.

It is shown that the resulting semantic description can be used not only for scene interpretation but also for solving applied tasks, in particular for refining the geolocation of radar images through their alignment with optical and cartographic data.

 

Ключевые слова: радиолокационные изображения, нейронные сети, распознавание объектов, семантическое описание сцены, сопоставление изображений.

Keywords: radar images, neural networks, object recognition, semantic scene representation, image matching.

 

РЛИ, формируемые системами с синтезированной апертурой, обладают рядом уникальных преимуществ, включая независимость от условий освещённости и погодных факторов. Однако интерпретация таких изображений существенно осложнена их физической природой: интенсивность сигнала определяется не только геометрией объектов, но и их электрофизическими свойствами, углом обзора и условиями съёмки [1, 2, 3, 4].

В отличие от оптических изображений, где визуальные признаки объектов хорошо интерпретируемы, радиолокационные данные характеризуются:

  • высокой зашумлённостью;
  • наличием радиотеней;
  • значительной вариативностью текстур внутри одного класса.

Это делает задачу распознавания объектов на РЛИ сложной и требует применения методов, способных учитывать контекст и многомасштабную структуру сцены.

Современные нейросетевые методы, в частности архитектуры семантической сегментации, позволяют перейти от анализа низкоуровневых признаков к формированию структурированного описания сцены.

Целью данной работы является разработка метода семантического описания радиолокационных изображений на основе нейронной сети. Дополнительной задачей является использование полученного семантического представления для уточнения геопозиционирования изображений путём их сопоставления с оптическими данными [5, 6].

В рамках работы рассматриваются РЛИ, для которых отсутствует явная информация о типах объектов, присутствующих на сцене.

Основная задача заключается в построении отображения:

                                                  (1)

где Ω — область изображения, а C — конечное множество семантических классов (вода, лес, поле, дороги, застройка).

Таким образом, задача формулируется как задача семантической сегментации радиолокационного изображения.

Дополнительно рассматривается прикладная задача уточнения геопозиционирования. Для этого вводится исходная оценка положения изображения:

                                                 (2)

где  и  - координаты центра радиолокационного изображения, определённые по данным спутниковой навигации, а  - угол ориентации изображения, задаваемый параметрами радиолокационной съёмки.

которая содержит ошибки, требующие коррекции. Уточнённое положение определяется как:

                                                          (3)

где поправки находятся на основе сопоставления семантических представлений.

РЛИ существенно отличаются от оптических, что напрямую влияет на выбор методов обработки.

Ключевые особенности:

  • отсутствие прямой связи между яркостью и типом объекта;
  • зависимость отображения от угла съёмки;
  • сильная контекстная зависимость интерпретации.

Это означает, что корректная классификация пикселя часто невозможна без учёта окружающей области.

Для решения задачи используется нейронная сеть архитектуры U-Net, модифицированная с учётом специфики SAR-данных.

Сеть включает:

  • энкодер для извлечения признаков;
  • декодер для восстановления пространственной структуры;
  • пропускные соединения для сохранения деталей;
  • многомасштабный блок (ASPP);
  • механизм внимания (CBAM).

 

Рисунок 1. Графики изменения значений метрик по эпохам для предложенной архитектуры

 

Анализ метрик качества показывает устойчивое улучшение результатов сегментации в процессе обучения. Значения mIoU и Dice достигают 0.82 и 0.85 соответственно на валидационной выборке, что свидетельствует о высоком качестве выделения объектов и их границ. Отсутствие значительного расхождения между обучающей и валидационной выборками указывает на хорошую обобщающую способность модели и отсутствие переобучения.

Обработка изображения выполняется по фрагментам размером 512×512 пикселей, что позволяет:

  • снизить вычислительную нагрузку;
  • сохранить локальный контекст;
  • обеспечить устойчивость обучения.

Результатом работы сети является семантическая карта, в которой каждому пикселю сопоставлен класс объекта.

Полученное семантическое описание позволяет перейти от анализа изображений к сопоставлению структуры сцены.

Картографические и оптические данные могут быть представлены в аналогичном семантическом виде:

                                                           (4)

Это делает возможным сравнение радиолокационных и оптических данных на уровне классов объектов, а не пиксельных значений.

Поиск положения выполняется в области неопределённости и включает два этапа.

  1. Грубый этап

Используется интегральное описание сцены в виде распределения классов:

                     (5)

Сравнение выполняется по расстоянию между гистограммами:

                     (6)

Этот этап позволяет быстро сократить число кандидатов.

  1. Точный этап

Для выбранных кандидатов выполняется попиксельное сравнение:

                       (7)

где веса учитывают устойчивость классов.

Оптимальное положение определяется как:

                           (8)

Обучение нейронной сети показало высокое качество сегментации, особенно для природных объектов.

 

Рисунок 2. Гистограмма совпадения семантических масок для анализируемого радиолокационного и спутникового кадра

 

Анализ семантического соответствия показал:

  • высокая точность для классов «вода», «лес», «поле»;
  • сниженная точность для «дорог» и «застройки».

Это связано с особенностями радиолокационных изображений и ограниченной разрешающей способностью для мелких объектов.

Выводы

В работе показано, что нейросетевая семантическая сегментация является эффективным инструментом для распознавания наземных объектов на радиолокационных изображениях.

Полученное семантическое представление:

  • обеспечивает интерпретацию сцены;
  • может использоваться как универсальный формат данных;
  • позволяет решать прикладные задачи, включая геопозиционирование.

Таким образом, задача сегментации является ключевой, а задача уточнения геопозиции выступает как её практическое продолжение.

Перспективы дальнейших исследований связаны с:

  • повышением точности сегментации сложных классов;
  • учётом геометрических искажений;
  • интеграцией дополнительных источников данных.

 

Список литературы:

  1. Curlander J., McDonough R. Synthetic Aperture Radar: Systems and Signal Processing. — New York: John Wiley & Sons, 1991. — 672 с.
  2. Richards M.A. Fundamentals of Radar Signal Processing. — New York: McGraw-Hill, 2005. — 517 с.
  3. Ulaby F.T., Moore R.K., Fung A.K. Microwave Remote Sensing: Active and Passive. Vol. 1–3. — Reading, MA: Addison-Wesley, 1981–1986.
  4. Горшков, С. А., Захаров, А. И., Кобзарь, В. Н. и др. Радиолокационные системы дистанционного зондирования Земли: учебное пособие. — М.: МАИ, 2018.
  5. Кашуба, М. В., Кравченко, А. Н., Титов, А. С. Методы совместного анализа оптических и радиолокационных данных дистанционного зондирования Земли. — М.: ИПУ РАН, 2021.
  6. Кравченко, А. Н., Лупян, Е. А., Прошин, А. А. Информационные технологии в задачах дистанционного зондирования Земли. — М.: ИКИ РАН, 2020.