Статья опубликована в рамках: Научного журнала «Студенческий» № 17(313)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7
СУПЕРПИКСЕЛЬНОЕ ПРЕДСТАВЛЕНИЕ ЦИФРОВОГО ИЗОБРАЖЕНИЯ
SUPERPIXEL REPRESENTATION OF DIGITAL IMAGE
Ivan Kandalov
student, Institute of Informatics and Cybernetics, Samara National Research University named after Academician S.P. Korolev,
Russia, Samara
Sergei Popov
scientific supervisor, Doctor of Technical Sciences, associate professor, Samara National Research University named after Academician S.P. Korolev,
Russia, Samara
АННОТАЦИЯ
Суперпиксели представляют собой компактные, связные области, внутри которых пиксели обладают близкими цветовыми и текстурными характеристиками. В статье рассматриваются принципы получения суперпиксельного представления, сравнительный анализ классических и современных алгоритмов, метрики оценки качества, а также актуальные области применения — от классической сегментации до глубоких трансформеров. Приведены направления дальнейших исследований и пример вычислительной формулы расстояния SLIC.
ABSTRACT
Superpixels are compact and connected regions whose pixels share similar low-level properties. This paper surveys the main principles behind superpixel representation, compares classical and modern algorithms, outlines evaluation metrics, and highlights current applications ranging from traditional segmentation pipelines to transformer-based deep models. Future research directions and a sample SLIC distance formulation are provided.
Ключевые слова: суперпиксель; сегментация; SLIC; SEEDS; трансформер.
Keywords: superpixel; segmentation; SLIC; SEEDS; transformer.
ВВЕДЕНИЕ
Пиксельная сетка обеспечивает максимальную детализацию изображения, однако избыточна для многих задач компьютерного зрения. Суперпиксельное представление, введённое Левинштейном и соавт. [1], решает эту проблему, агрегируя «однородные» пиксели в регулярные области. Это уменьшает размерность данных на порядок без значимой потери информации, повышает устойчивость к шуму и ускоряет последующие этапы обработки.
АЛГОРИТМЫ ФОРМИРОВАНИЯ
Классическое разбиение изображения графовыми разрезами (FH) [2] минимизирует внутрикластерную дисперсию и является основой для целого класса “энергетических” алгоритмов. Главный недостаток — высокий рост вычислительных затрат с увеличением числа пикселей.
SLIC (Simple Linear Iterative Clustering) сформулирован как k-means в пятимерном пространстве (Lab + XY) [3]. Компактность суперпикселей задаётся единственным параметром m.
SEEDS (Superpixels Extracted via Energy-Driven Sampling) [4] оптимизирует гистограмму цвета внутри блоков разной иерархической глубины, достигая реального времени на CPU.
Segmentation-Aware Affinity Loss обучает свёрточную сеть генерировать карты аффинностей, из которых затем извлекаются суперпиксели [5].
Свежее направление — superpixel-informed нейронные представления (S-INR), встраивающие координаты суперпикселей в MLP [6], и SPFormer, где вместо фиксированных патчей трансформер обрабатывает адаптивные регионы [7].
МЕТРИКИ ОЦЕНКИ
Наиболее распространены:
- ASA (Achievable Segmentation Accuracy) — доля пикселей, совпавших с эталонной разметкой после наилучшего сопоставления сегментов;
- BR (Boundary Recall) — процент эталонных границ, пересекаемых границей хотя бы одного суперпикселя;
- UE (Undersegmentation Error) — избыточное покрытие сегментами.
Современные обзоры подчёркивают необходимость учитывать регулярность формы помимо классических метрик [8].
ОБЛАСТИ ПРИМЕНЕНИЯ
- Семантическая сегментация и детектирование объектов. Суперпиксели служат предварительным шагом, уменьшая количество элементов, по которым строится граф или оптимизируется CRF-энергия [3].
- Медицинская визуализация. Коагуляция гомогенных областей упрощает выделение опухолей на МРТ, сокращая число ложных срабатываний.
- Трансформеры высокой чёткости. Superpixel-patch деление снижает quadratic token cost без потери тонких деталей [7].
- Эффективные неявные представления (INR) для денойзинга и супер-разрешения [6].
ЗАКЛЮЧЕНИЕ
Суперпиксельное представление остаётся востребованным более десяти лет благодаря выгодному балансу между компактностью и сохранением границ. Кластеризационные алгоритмы (SLIC, SEEDS) сегодня дополняются обучаемыми архитектурами и гибридными подходами. Коллаборация классических идей с трансформерами и неявными представлениями делает суперпиксели ключевым звеном в современных системах компьютерного зрения.
Список литературы:
- Levinshtein A., Stere A., Kutulakos K. и др. TurboPixels: Fast Superpixels Using Geometric Flows // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2009. — Т. 31, № 12. — С. 2290–2297 (дата обращения: 03.05.2025).
- Felzenszwalb P. F., Huttenlocher D. P. Efficient Graph-Based Image Segmentation // International Journal of Computer Vision. — 2004. — Т. 59, № 2. — С. 167–181 (дата обращения: 03.05.2025).
- Achanta R., Shaji A., Smith K. и др. SLIC Superpixels Compared to State-of-the-Art Superpixel Methods // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2012. — Т. 34, № 11. — С. 2274–2282 (дата обращения: 03.05.2025).
- Van den Bergh M., Boix X., Roig G. и др. SEEDS: Superpixels Extracted via Energy-Driven Sampling // Lecture Notes in Computer Science. Proc. ECCV 2012. — 2012. — С. 13–26 (дата обращения: 03.05.2025).
- Tu W.-C., Liu M.-Y., Jampani V. и др. Learning Superpixels with Segmentation-Aware Affinity Loss // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. — 2018. — С. 568–576 (дата обращения: 03.05.2025).
- Li J., Zhang Q., Wang Y. и др. Superpixel-Informed Implicit Neural Representation for Multi-Dimensional Data Recovery // Proceedings of the European Conference on Computer Vision. — 2024. — 15 с (дата обращения: 03.05.2025).
- Anonymous. Enhancing Vision Transformer with Superpixel Representation (SPFormer): preprint. — 2025. — 18 с (дата обращения: 03.05.2025).
- Pérez-García A., Morales S. и др. A Comprehensive Review and New Taxonomy on Superpixel Segmentation [электронный ресурс]. — arXiv:2409.19179, 2024. — URL: https://arxiv.org/abs/2409.19179 (дата обращения: 03.05.2025).
Оставить комментарий