Efficient pipeline for plant disease classification
Ключевые слова: классификация болезней растений , глубокое обучение, similarity learning, Large Margin Cosine Loss, Triplet Loss, ConvNext, MobileNet
Категории: Прикладные исследования , Математические и компьютерные науки , Информационные технологии
Прислана: 11.12.2024; Принята: 23.12.2024; Опубликовано 12.02.2025

Как цитировать

A. Uzhinskiy. "Efficient pipeline for plant disease classification" Natural Sci. Rev. 2 100201 (2025)
https://nsr-jinr.ru/index.php/nsr/article/view/32
A. Uzhinskiy1,a
  • 1Joint Institute for Nuclear Research, Dubna, Russia
  • aauzhinskiy@jinr.ru
Natural Sci. Rev. 2 100201 (2025) 12.02.2025
PDF (Английский)

Точная диагностика заболеваний и выбор корректной стратегии лечения позволяют не только сохранить, но и увеличить урожай. Современные методы глубокого обучения зарекомендовали себя как эффективное решение данной проблемы. Однако ограниченные объемы доступных данных и схожесть симптомов различных заболеваний снижают эффективность традиционных подходов, таких как перенос обучения. В данном исследовании использовался уникальный набор данных проекта DoctorP, включающий 46 классов заболеваний и 2615 изображений. DoctorP — это многофункциональная платформа для диагностики болезней растений, ориентированная как на сельскохозяйственные, так и на декоративные культуры. Платформа предоставляет различные интерфейсы, включая мобильные приложения для iOS и Android, Telegram-бота и API для интеграции с внешними сервисами. Пользователи системы отправляют фотографии больных растений, получая прогноз по заболеванию и рекомендации по лечению. DoctorP поддерживает широкий спектр моделей для классификации болезней растений. Ранее для создания моделей применялись MobileNet_v2 и функция минимизации потерь Triplet Loss. Однако значительное увеличение количества классов заболеваний потребовало проведения новых экспериментов с архитектурами и методами обучения. В текущем исследовании предлагается более эффективное решение, основанное на архитектуре ConvNeXt и функции минимизации потерь Large Margin Cosine Loss, для классификации 46 классов заболеваний растений в условиях ограниченного объема данных. Количество изображений в каждом классе варьируется от 30 до 130. Предложенная архитектура позволяет достигать точности в 88,35% и F1-score 0,9, что значительно превосходит как классические решения на базе переноса обучения, так и предыдущий подход на основе Triplet Loss. Улучшенный алгоритм обучения моделей уже внедрен в платформу DoctorP, значительно повышая точность и надежность диагностики заболеваний растений.