Description
Об анализе рентгеновских снимков грудной клетки с помощью алгоритмов машинного обучения легче сказать, чем сделать. Это связано с тем, что, как правило, клинические метки, необходимые для обучения этих алгоритмов, получаются с помощью обработки естественного языка на основе правил или человеческих аннотаций, которые, как правило, вносят несоответствия и ошибки. Кроме того, сложно собрать наборы данных, которые представляют достаточно разнообразный спектр случаев, и установить клинически значимые и последовательные метки, используя только изображения.
Стремясь продвинуться вперед в отношении классификации рентгеновских изображений, исследователи из Google разработали модели искусственного интеллекта для выявления четырех результатов на рентгеновских снимках грудной клетки человека: пневмоторакс (коллапс легких), узлы и массы, переломы и затемнение воздушного пространства ( заполнение легочного дерева материалом). В статье, опубликованной в журнале Nature , команда утверждает, что семейство моделей, которое было оценено с использованием тысяч изображений в наборах данных с высококачественными метками, продемонстрировало эффективность «на уровне рентгенолога» в независимом обзоре, проведенном экспертами-людьми.
Публикация исследования состоялась через несколько месяцев после того, как ученые Google AI и Northwestern Medicine создали модель, способную выявлять рак легких с помощью скрининговых тестов лучше, чем люди-радиологи со средним опытом работы в восемь лет, и примерно через год после того, как Нью-Йоркский университет использовал модель машинного обучения Google Inception v3. для выявления рака легких . ИИ также поддерживает достижения технологического гиганта в диагностике диабетической ретинопатии с помощью сканирования глаз, а также ИИ DeepMind, дочерней компании Alphabet, который может рекомендовать правильную линию лечения 50 заболеваний глаз с точностью 94% .
В этой новой работе использовалось более 600 000 изображений, полученных из двух обезличенных наборов данных, первый из которых был разработан в сотрудничестве с больницами Apollo и состоит из рентгеновских снимков, собранных в течение многих лет из разных мест. Что касается второго корпуса, то это общедоступный набор изображений ChestX-ray14, выпущенный Национальным институтом здравоохранения, который исторически служил ресурсом для усилий ИИ.
Исследователи разработали текстовую систему для извлечения меток с использованием рентгенологических отчетов, связанных с каждым рентгеновским снимком, которые они затем применили для предоставления меток для более чем 560 000 изображений из набора данных больниц Apollo. Чтобы уменьшить ошибки, связанные с извлечением текстовых меток, и предоставить соответствующие метки для ряда изображений ChestX-ray14, они наняли рентгенологов для просмотра примерно 37 000 изображений в двух корпусах.
Следующим шагом было создание высококачественных эталонных меток для целей оценки модели. Был принят панельный процесс, в соответствии с которым три рентгенолога просматривали все окончательные изображения настроек и тестовых наборов и разрешали разногласия посредством онлайн-обсуждения. Это, по словам соавторов исследования, позволило идентифицировать и надлежащим образом задокументировать сложные результаты, которые первоначально были обнаружены только одним рентгенологом.
Google отмечает, что, хотя модели в целом достигли точности на экспертном уровне, производительность варьировалась в зависимости от корпуса. Например, чувствительность обнаружения пневмоторакса среди рентгенологов составляла примерно 79% для снимков грудной клетки14, но только 52% для тех же рентгенологов по другому набору данных.
«Различия в производительности между наборами данных… подчеркивают необходимость стандартизированных наборов оценочных изображений с точными эталонными стандартами, чтобы можно было сравнивать исследования», — написали в своем блоге научный сотрудник Google доктор Дэвид Штайнер и технический руководитель Google Health Шравья Шетти. кто внес свой вклад в газету. «[Модели] часто выявляли результаты, которые рентгенологи постоянно упускали из виду, и наоборот. Таким образом, стратегии, которые сочетают в себе уникальные «навыки» как систем [ИИ], так и экспертов-людей, вероятно, будут наиболее многообещающими для реализации потенциала приложений ИИ в интерпретации медицинских изображений».
Исследовательская группа надеется заложить основу для более совершенных методов с помощью корпуса утвержденных меток для набора данных ChestX-ray14, который они сделали доступным в открытом исходном коде. Он содержит 2412 изображений обучающих и проверочных наборов и 1962 изображения тестовых наборов, или всего 4374 изображения.
В ходе исследования были созданы две CNN модели, а также использованы
несколько обученных моделей для transfer learning: VGG16, VGG19,
ResNet50, ResNet101, Xception и InceptionV3. Проведён анализ полученных
результатов обучения моделей и исследованы варианты увеличения
точности. Показан пример интеграции в production и выявлено возможное
появление ошибок на этапе внедрения в производство.
Если у Вас появилась заинтересованность в данной нейронной сети, и она может помочь Вам в реализации Ваших бизнес и других технических задачах, пожалуйста отправьте заявку на email info@ai2b.ru , или позвоните по телефону 8(495)661-61-09
Reviews
There are no reviews yet.