Крупнейший архив медицинских КТ-изображений сделали доступным для исследователей
Одна из крупнейших баз медицинских изображений, DeepLesion, стала доступной для исследователей и это очень важный шаг в деле создания компьютерных радиологических систем, диагностики и глубокого обучения. Информация об этом опубликована в Journal of Medical Imaging.
Этот архив изображений, полученных методом компьютерной томографии (КТ), который был создан специалистами Клинического центра Национального института здравоохранения (США), содержит 32 000 аннотированных новообразований из 10 000 клинических случаев. Доступность такого большого, аннотированного набора радиологических данных очень важна для разработки алгоритмов машинного обучения, которые предполагается использовать в медицинских целях.
База данных DeepLesion была создана путем обработки исторических медицинских данных, которые содержались в институтской системе PACS*. Эта база данных отличается большинства подобных доступных архивов медицинских изображений, в которых отмечены только новообразования одного типа.
Во время обработки КТ-изображений радиологи Клинического центра измеряли и помечали все клинически значимые находки, используя электронные закладки, которые могут иметь сложную структуру и включать линии, стрелки, диаметры и текст. Эти пометки, связанные с ретроспективными медицинскими данными, точно показывают размер и местоположение опухоли, что позволяет специалистам фиксировать рост новообразования или новую болезнь. И, в отличие от аналогичных наборов данных, DeepLesion содержит разнообразную информацию - все виды важных радиологических находок из разных частей тела, в частности легочные конкреции (узлы), опухоли печени, увеличенные лимфатические узлы и т.п.
Отсутствие в доступности таких наборов данных с поражениями разного вида, по словам представителей Национального института здравоохранения, является одним из главных препятствий для разработки более универсальных систем на базе искусственного интеллекта, способных диагностировать различные типы новообразований.
В процессе работы над DeepLesion разработчики, кроме этого, создали универсальный детектор новообразований, который, учитывая длительность процесса обнаружения поражений радиологами, может стать критически важным инструментом диагностики. По мысли его создателей, этот детектор в будущем может быть использован для проведения скрининга разными радиологами или в рамках вновь создаваемых автоматизированных диагностических систем и компьютерных систем обработки изображений.
Базу данных DeepLesion можно загрузить по адресу https://nihcc.box.com/v/DeepLesion.
* PACS (Picture Archiving and Communication System) — системы передачи и архивации медицинских изображений в формате DICOM, где весьма объемный архив может длительное время существовать в «горячем» виде и быть быстро доступным для поиска и просмотра интересующей информации по DICOM-сети.