AI-система определяет результаты лечения рака с помощью текстовых радиологических отчетов
Ученые из Института рака Дана-Фарбера продемонстрировали, что система на базе искусственного интеллекта (artificial intelligence, AI) может работать так же, как и эксперты-люди, извлекая клиническую информацию об изменениях в опухолях из неструктурированных рентгенологических отчетов для пациентов с раком легких, причем делает это гораздо быстрее.
Система использовалась с целью выявления наличия рака, определения, как рак реагирует на лечебные вмешательства и как ведет себя опухоль - стабильно или с ухудшением. Причем результаты работы AI-системы были сравнимы с показателями опытных врачей-специалистов.
Цель исследования - определить, могут ли инструменты на базе искусственного интеллекта извлечь наиболее ценные результаты о раке из радиологических отчетов, которые являются повсеместно используемыми, но неструктурированными источниками данных.
По словам одного из авторов исследования доктора Кенета Кела,
Электронные медицинские карты в настоящее время собирают огромное количество информации о тысячах пациентов, посещающих такие центры, как Институт рака Дана-Фарбера. Однако, если пациенты не принимают участие в клинических испытаниях, информация об их результатах, например, о уменьшении или росте опухоли в ответ на лечение, регистрируется только в тексте медицинской карты. Исторически сложилось так, что эта неструктурированная информация не поддается вычислительному анализу и поэтому не может быть использована для исследования эффективности лечения.
Благодаря исследованиям, подобным инициативе Profile в Институте рака Дана-Фарбера и Женском онкологическом центре Брайема, в которых анализируются образцы опухолей пациентов и создаются профили, позволяющие выявить геномные варианты, которые могут предсказать реакцию на лечение, исследователи накопили большой объем информации о раке у пациентов. Но применить эту информацию, чтобы понять, какие молекулярные закономерности предсказывают преимущества лечения, без тщательного изучения медицинской документации пациентов, невозможно. "Это критическое препятствие на пути к полной реализации потенциала точной медицины", - сказал доктор Кел.
Для данного исследования Кел и его коллеги получили более 14 000 отчетов радиологов для 1112 пациентов и вручную просмотрели записи, используя систему "PRISSMM". PRISSMM - это стандарт феномных* данных, разработанный в Институте рака Дана-Фарбера, который берет неструктурированные данные из текстовых отчетов в электронных медицинских картах и структурирует их таким образом, чтобы их можно было легко проанализировать. PRISSMM структурирует данные, относящиеся к патологии пациента, радиологии/изображениям, признакам/симптомам, молекулярным маркерам и оценке онколога для создания "портрета" протекания заболевания онкологического больного.
Эти же отчеты использовались для обучения компьютерной модели глубокого обучения, позволяющей распознать результаты на основе текстовых отчетов. "Наша гипотеза состояла в том, что алгоритмы глубокого изучения могут использовать регулярно генерируемые текстовые радиологические отчеты для выявления наличия рака и изменений в его масштабах с течением времени", - пишут авторы исследования.
Исследователи сравнили человеческие и компьютерные измерения таких результатов, как выживаемость без болезней, выживаемость без прогрессии и время на улучшение или реагирование, и пришли к выводу, что алгоритм искусственного интеллекта может воспроизводить человеческую оценку этих результатов.
Затем алгоритмы глубокого изучения были применены, чтобы аннотировать еще 15 000 отчетов для 1294 пациентов, записи которых не были проверены вручную. Авторы обнаружили, что компьютерные оценки результатов для этих пациентов предсказывали выживаемость с той же точностью, что и человеческие оценки для пациентов, прошедших ручной осмотр.
Кураторы-люди смогли аннотировать отчеты примерно для трех пациентов в час, при этом одному специалисту потребовалось бы около шести месяцев, чтобы аннотировать все почти 30 000 радиологических отчетов. Для сравнения, разработанная исследователями модель искусственного интеллекта может аннотировать такие отчеты примерно за 10 минут, говорится в докладе, опубликованном в журнале JAMA Oncology.
* Феном - совокупность фенотипов организма. Подобно геному и протеому, включающим в себя все гены и белки организма, феном представляет сумму его фенотипических черт.