Детекция и классификация типа одежды на изображении.

Разработка интерфейса,
позволяющего по изображению
детектировать (найти положение на
изображении) и классифицировать
категорию одежды.

Description

Недавно Интернет вещей (IoT) и искусственный интеллект (AI), возглавляемые машинным обучением и глубоким обучением, стали ключевыми технологиями Четвертой промышленной революции (4IR). В частности, технология распознавания объектов с использованием глубокого обучения в настоящее время используется в различных областях, и благодаря высокой производительности и потенциалу глубокого обучения многие исследовательские группы и компании, занимающиеся информационными технологиями (ИТ), в настоящее время вкладывают значительные средства в глубокое обучение. В результате искусственный интеллект развивается очень быстрыми темпами и в будущем станет ядром ИТ-индустрии. Компьютерное зрение — это область исследований, которая изучает, как компьютеры обрабатывают изображения для быстрого и эффективного выполнения задач. Изображения, полученные с камер, в основном большие и содержат данные, эквивалентные человеческому зрению. Компьютерное зрение развивалось одновременно с производительностью компьютера и алгоритмами искусственного интеллекта. Технология анализа изображений одежды, которая недавно была применена для рекомендации или поиска конкретной одежды, включает распознавание одежды, которое анализирует информацию об изображениях одежды, и поиск одежды, который может помочь найти желаемую одежду с изображениями. Чтобы применить фреймворк глубокого обучения, большинство исследователей используют сверточные нейронные сети (CNNs), популярную технику глубокого обучения, используемую для анализа визуальных образов. Распознавание одежды направлено на анализ категорий и характеристик одежды, существующих в данном изображении, и сети, такие как FashionNet и внимательная сеть грамматики моды, основанная на сети VGG-16, применяются к сверточным нейронным сетям (CNNS). Многие исследования по распознаванию одежды на основе CNN были сосредоточены на классификации одежды или обнаружении одежды путем обработки видеозаписей с камер наблюдения. Однако идентификация одежды в режиме реального времени по видеозаписям наблюдения остается серьезной проблемой из-за трудностей, связанных с обеспечением надежного обнаружения и представления одежды.

Текстильная промышленность вовлекает много человеческих ресурсов во все процессы, такие как сбор сырья, крашение, обработка и шитье, и потеря ресурсов и энергии, а также увеличение загрязнения окружающей среды вызваны кратковременными отходами одежды, произведенной во время этих процессов. Загрязнение окружающей среды может быть в значительной степени уменьшено за счет использования переработанной одежды. Поэтому в Корее и других странах предпринимается много усилий по переработке и повторному ношению отработанной одежды. В Корее коэффициент использования переработанной одежды растет из-за растущей осведомленности об экологических проблемах и сохранении ресурсов. Количество использованной одежды велико, ежегодное потребление составляет 56,2 миллиарда долларов, но она не используется должным образом из-за системы сбора одежды для ручной переработки, которая имеет ряд проблем, таких как закрытая рабочая среда, здоровье работников, растущие затраты на рабочую силу и низкая скорость обработки, что затрудняет применяйте существующую технологию распознавания одежды, классифицируемую по деформации и наложению форм одежды, при транспортировке переработанной одежды на конвейерную ленту. Однако недавно был изучен метод классификации переработанной одежды с использованием массовых наборов данных и технологии глубокого обучения.

В Корее собранные отходы одежды классифицируются как подлежащие вторичной переработке и невозможные. Многоразовая одежда продается на блошиных рынках, базарах и т.д. Как показано на рисунке 1, одежда, пригодная для вторичной переработки, экспортируется в зарубежные страны.

   Искусственный интеллект обычно подразделяется на два типа: машинное обучение и глубокое обучение. Глубокое обучение определяется как набор алгоритмов машинного обучения, которые пытаются достичь высоких уровней абстракции с помощью комбинации нескольких методов нелинейного преобразования, и представляет собой область машинного обучения, которая объединяет мышление людей с компьютерами. Глубокое обучение — это метод, который решает проблемы путем укладки нейронных сетей и полагается на объем данных. Это создает структуру, которая гибко реагирует на различные шаблоны и случаи вместо того, чтобы иметь мало предположений о проблемах по сравнению с другими методами машинного обучения.

Распознавание объектов и CNN
Распознавание объектов — это технология компьютерного зрения, которая использует компьютеры для идентификации объектов на изображениях. Люди могут легко распознавать персонажей, объекты, сцены и визуальные детали, когда они видят фотографии или видео. Эта способность позволяет компьютеру узнать, что человек может делать с машиной. Для решения этой проблемы широко используются алгоритмы глубокого обучения и машинного обучения, такие как технологии искусственного интеллекта.

Технология распознавания объектов с использованием машинного обучения — это метод классификации с использованием машинного обучения и CNN, а также метод извлечения признаков для распознавания изображений. Этот метод требует большого объема обучающих данных (learning dataset) и требует, чтобы CNN устанавливала слои и веса. CNN, который был предложен с 2012 года, использует все большее количество нейронных слоев, и в этом процессе используются технологии для эффективной вставки нескольких нейронных слоев в один CNN. CNN имеет сверточный слой, объединяющий слой и выпрямленную линейную единицу (ReLU) в качестве своих основных элементов.

AlexNet
AlexNet представляет собой архитектуру сверточной нейронной сети и состоит из восьми обучающих, пяти сверточных и трех полностью связанных слоев [17-20]. Структура AlexNet показана на рисунке 2. Обычно сверточные слои включают в себя этап свертки, этап объединения и функции активации. В частности, этап свертки представляет собой набор обучаемых фильтров, которые отвечают за извлечение объектов из входного изображения. AlexNet включает в себя 60 миллионов параметров и нейронную сеть с 650 000 нейронов, состоящую из пяти сверточных слоев, некоторые из которых состоят из трех полностью связанных слоев с максимальным объединяющим слоем, за которым следует последний 1000-полосный softmax. Чтобы ускорить обучение, были использованы ненасыщенные нейроны и высокоэффективные операции свертки графического процессора (GPU). Чтобы уменьшить переобучение на полностью соединенных слоях, был использован метод нормализации, называемый “отсев”, и был достигнут максимальный уровень ошибок теста в 15,3% по сравнению с уровнем ошибок в 26,2%, достигнутым вариантом этой модели, представленным на конкурсе ILSVRC 2012. AlexNet имеет пять сверточных слоев, три полностью связанных слоя, три слоя с максимальным объединением, два слоя межканальной нормализации, два слоя отсева и семь слоев выпрямленных линейных единиц (ReLU). Первый слой запоминает объекты первого порядка, такие как цвет и края. Второй слой изучает углы. Третий слой изучает небольшие участки или текстуры. Четвертый и пятый уровни изучают особенности входного пространства более высокого порядка. Затем объекты конечного уровня загружаются в контролируемый слой для выполнения задачи, такой как регрессия. AlexNet, обученный передаче, предсказывает изображение с шумом на основе функций, извлеченных из скрытых слоев.

Разработка и внедрение модели
Модель AlexNet использовалась в качестве модели классификации изображений одежды на основе глубокого обучения, модель метастатического обучения была такой же, как таблица, и использовалась MATLAB. Обучение продолжается в направлении уменьшения функции потерь перекрестной энтропии, которая совпадает с определением в следующей формуле:

Здесь ti и si — это основная истина, которая является правильным ответом, и последний выходной вектор модели, который является i-м элементом результирующего значения слоя softmax модели соответственно. Чтобы свести это к минимуму, обучение продолжается с использованием алгоритма SGD. Наконец, вероятность прогнозирования каждой категории вычисляется с помощью слоя softmax с использованием характеристик изображения глобального среднего уровня объединения, и с его помощью изучается классификация.

Для обучения модели результаты классификации были проверены с использованием 2400 данных для обучения и 900 данных для тестирования с соотношением 7: 3 для всех 3300 данных изображений одежды. Модель была обучена на 2310 изображениях в девяти классах и протестирована на 990 тестовых изображениях. Функция потерь, используемая моделью, представляла собой половину среднеквадратичной ошибки. Визуальное знание модели зависит от активации функции, вызванной последним слоем. Модель AlexNet с передачей обучения использовалась в качестве модели классификации изображений одежды на основе глубокого обучения, и результаты классификации данных изображений одежды, полученных с использованием Интернета вещей в качестве входных данных, следующие.

Результаты измерений классификационных экспериментов
Изображения очистки и потерь показаны на рисунке 8. Результаты классификации, полученные с помощью AlexNet, показаны на рисунке 9 и в таблице 4 с набором данных изображений одежды. Этот вывод подтверждает, что точность классификации повышается, когда в AlexNet в качестве входных данных предоставляется много изображений чистой одежды. Костюмы состояли из чистых образов, которые были идеальными образами, и образов потерь, учитывая трансформацию и наложение друг на друга. Данные об изображениях одежды были классифицированы по девяти типам: кардиган, куртка, рубашка, футболка, трикотаж, джинсы, хлопчатобумажные брюки, короткие брюки и юбки. Результаты измерений и классификации показали, что точность классификации всех изображений одежды (чистое (2400) + потеря (900)) при скорости обучения 0,001 и эпохе 10 составила приблизительно 68,28%. Система, которая классифицирует изображения в соответствии с одеждой, была обучена с использованием глубокого обучения, и классификация одежды была продемонстрирована с использованием набора данных изображения одежды, собранного предложенной моделью. Следовательно, изображения чистой одежды были классифицированы с точностью более 74%, а общие изображения (потертые и чистые) были классифицированы с точностью более 68%. Тестовые изображения одежды, сделанные с помощью устройств Интернета вещей (подключение камеры к raspberry pies), были отнесены к двум лучшим из девяти категорий с использованием AlexNet deep learning, и результаты показаны на рисунке 10.

(a)
(a)

Таблица 4

Результаты измерений классификационных экспериментов.

Изображение Набор данных одежды Точность (%)

Чистый 2400 74,20
Потеря 900 53,33
Общий 3300 68,28

Выводы
Искусственный интеллект, которому способствовало машинное обучение и углубленное обучение наряду с новой технологией lead 4IR, был применен к реальному миру посредством различных исследований и разработок. С недавним выпуском нейронных сетей GoogLeNet и LesNet структура CNN, вероятно, продолжит углубляться и усложняться. Модели глубокого обучения не были фиксированными; поэтому их можно было настроить различными способами. Следовательно, если бы были представлены новые проблемы, можно было бы разработать новые модели нейронных сетей.

В этой статье мы предложили интеллектуальную систему классификации переработанной одежды, которая классифицирует ее с помощью Интернета вещей и глубокого обучения AlexNet. Одежда, перенесенная из места сбора переработанной одежды (коробки) на конвейерную ленту, была сфотографирована с помощью камеры, подключенной к Raspberry и устройству интернета вещей, и AlexNet deep learning классифицировала сфотографированные изображения одежды по девяти категориям. Для измерения были использованы 3300 наборов данных изображений одежды.

В результате этого исследования было подтверждено, что типы переработанной одежды с использованием искусственного интеллекта могут быть предсказаны и точная работа по классификации может быть выполнена вместо опыта и ноу-хау работающих на рабочем месте по классификации одежды, которое представляет собой закрытое пространство. Это приведет к инновационному направлению работы по классификации одежды для вторичной переработки, которая была выполнена людьми в существующей рабочей среде. Другими словами, ожидается, что будет достигнута стандартизация необходимых процессов, использование искусственного интеллекта, применение системы автоматизации, различное снижение затрат и повышение эффективности работы.

Если у Вас появилась заинтересованность в данной нейронной сети, и она может помочь Вам в реализации Ваших бизнес и других технических задачах, пожалуйста отправьте заявку на email info@ai2b.ru , или позвоните по телефону 8(495)661-61-09

Reviews

There are no reviews yet.

Be the first to review “Детекция и классификация типа одежды на изображении.”

Ваш адрес email не будет опубликован. Обязательные поля помечены *