Статья опубликована в рамках: Научного журнала «Студенческий» № 20(316)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7, скачать журнал часть 8, скачать журнал часть 9, скачать журнал часть 10, скачать журнал часть 11, скачать журнал часть 12, скачать журнал часть 13, скачать журнал часть 14, скачать журнал часть 15, скачать журнал часть 16
СРАВНИТЕЛЬНЫЙ АНАЛИЗ АРХИТЕКТУР CNN ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ РАСТЕНИЙ РАЗЛИЧНЫХ РОДОВ
АННОТАЦИЯ
В статье рассматривается задача автоматического распознавания видов растений по изображениям листьев с использованием сверточных нейронных сетей. Для решения задачи разработана собственная модель PlantCNN и адаптирована предобученная архитектура ResNet18. Проведен сравнительный анализ моделей с применением различных объёмов данных и методов аугментации. Результаты показывают эффективность глубокого обучения для классификации растений различных родов.
Ключевые слова: сверточные нейронные сети, классификация растений, аугментация изображений, ResNet18, глубокое обучение, компьютерное зрение.
Введение
В последние годы задачи компьютерного зрения нашли широкое применение в различных областях, включая сельское хозяйство и экологию. В ботанике автоматическое распознавание растений по изображениям способствует ускорению классификации и мониторинга флоры. Среди методов машинного обучения сверточные нейронные сети (CNN) доказали свою высокую эффективность в классификации изображений.
В данной работе рассматривается разработка и обучение сверточных моделей для распознавания видов растений по изображениям листьев. Используются как собственная архитектура CNN, так и предобученная модель ResNet18, адаптированная под задачу классификации 47 классов растений. Проведён сравнительный анализ моделей с учётом различных объёмов данных и методов аугментации.
Обзор технологий
Распознавание изображений является одной из центральных задач компьютерного зрения и эффективно решается с помощью сверточных нейронных сетей (CNN) [1]. В отличие от классических методов, CNN автоматически извлекают сложные визуальные признаки из изображений без необходимости ручного проектирования.
В ботанике и сельском хозяйстве CNN широко применяются для классификации видов растений, определения стадий роста и выявления заболеваний. Точность таких моделей достигает 90–95% при наличии достаточного количества размеченных данных. В частности, для классификации растений по изображениям листьев анализируются форма, текстура и цветовые особенности.
Основу CNN составляют три типа слоев: свёртки, объединения (pooling) и полносвязные слои. Слои свёртки выделяют локальные признаки, слои объединения снижают размерность и сокращают параметры, а полносвязные слои выполняют финальную классификацию. Совместная работа этих слоев позволяет моделям переходить от простых визуальных элементов к сложным абстракциям, обеспечивая высокую точность распознавания.
Описание моделей
Для решения задачи классификации растений использовался открытый датасет с платформы Kaggle [4], содержащий изображения 47 видов растений. Все изображения были приведены к размеру 256×256, нормализованы и преобразованы в тензоры для обработки в PyTorch. Для повышения устойчивости модели применялась аугментация: случайное горизонтальное отражение и вращение на ±10 градусов.
В работе использовались две архитектуры сверточных нейросетей. Первая — собственная простая модель PlantCNN, состоящая из нескольких сверточных и max-pooling слоёв с функцией активации ReLU и слоем dropout для предотвращения переобучения. Эта архитектура была разработана для контроля над структурой и параметрами модели.
Вторая — предобученная модель ResNet18 [3] с остаточными связями, адаптированная под 47 классов путем замены последнего полносвязного слоя. Использование ResNet18 и подхода transfer learning позволило значительно ускорить обучение и повысить точность за счёт использования знаний, полученных на большом наборе ImageNet [2].
Эксперименты и результаты
Проведено сравнение трёх моделей: PlantCNN без аугментации, PlantCNN с аугментацией и предобученной ResNet18 на полном наборе данных. Результаты точности на валидационном наборе составили:
- PlantCNN без аугментации — 26%;
- PlantCNN с аугментацией — 25%;
- ResNet18 (full dataset) — 94%.
Использование аугментации в PlantCNN немного улучшило устойчивость модели к вариациям изображений, однако точность оставалась низкой из-за ограниченного объёма данных. Предобученная ResNet18 с полной выборкой показала значительное преимущество, обеспечив высокую точность и быструю сходимость.
Основные ошибки возникали в классах с визуально схожими растениями. Механизм ранней остановки помогал избежать переобучения, особенно для PlantCNN на малых данных. ResNet18 продемонстрировала стабильное обучение и высокую общую эффективность благодаря transfer learning и глубокой архитектуре.
Таким образом, эксперименты подтвердили превосходство предобученной модели на полноценном наборе данных для задачи классификации растений.
Заключение
В работе рассмотрена задача автоматического распознавания видов растений по изображениям листьев с использованием сверточных нейронных сетей. Разработанная собственная модель PlantCNN показала ограниченную эффективность из-за малого объёма данных и недостаточной устойчивости к вариациям изображений. В то же время предобученная модель ResNet18 с применением transfer learning продемонстрировала значительно более высокую точность и быструю сходимость, подтверждая эффективность глубоких архитектур при наличии достаточного объёма размеченных данных.
Полученные результаты подчёркивают важность использования предобученных моделей и методов аугментации для повышения качества классификации в задачах компьютерного зрения, связанных с распознаванием видов растений. В дальнейшем целесообразно исследовать расширение датасета и дополнительные техники улучшения обобщающей способности моделей.
Список литературы:
- Гудфеллоу, Я. Глубокое обучение / Я. Гудфеллоу, И. Бенджио, А. Курвилль. — 2-е изд. — Москва : ДМК, 2018. — 652 c. — Текст : непосредственный.
- Deng, J. ImageNet: A large-scale hierarchical image database / J. Deng, W. Dong, R. Socher // 2009 IEEE Conference on Computer Vision and Pattern Recognition. — 2009. — С. 248–255. — Текст : непосредственный.
- He, K. Deep Residual Learning for Image Recognition / K. He, X. Zhang, S. Ren, J. Sun // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). — 2016. — С. 770–778. — Текст : непосредственный.
- House Plant Species. — Текст : электронный // Kaggle : [сайт]. — URL: https://www.kaggle.com/datasets/kacpergregorowicz/house-plant-species (дата обращения: 25.05.2025).
Оставить комментарий