Google представила LLM, помогающий точно диагностировать сложные медицинские случаи

Google представила LLM, помогающий точно диагностировать сложные медицинские случаи

11 Jan 2024
183

Исследование, проведенное Google Research в сотрудничестве с Google DeepMind, показало, что технологический гигант разработал систему искусственного интеллекта (ИИ) на базе технологии LLM с разговорными и интерактивными возможностями, которые могут обеспечить точную дифференциальную диагностику (differential diagnosis, DDx) и помочь врачам улучшить диагностические заключения и точность в диагностике сложных медицинских состояний. 

LLM для DDx создан на основе Med-PaLM 2 - технологии генеративного ИИ компании, которая использует LLM Google для ответов на медицинские вопросы. LLM, ориентированный на DDx, был доработан на данных из медицинской области со значительным улучшением производительности и оснащен интерфейсом, позволяющим использовать его в качестве интерактивного помощника врача.

В ходе исследования 20 врачей оценили 302 сложных реальных медицинских случая, описанных в журнале New England Journal of Medicine.

Каждый случай был прочитан двумя врачами, которым в случайном порядке были предоставлены либо стандартные методы помощи, такие как поисковые системы и традиционные медицинские ресурсы, либо стандартные методы помощи в дополнение к Google LLM for DDx. Все врачи проводили базовую DDx до того, как им были предоставлены вспомогательные инструменты.

По завершении исследования ученые обнаружили, что эффективность LLM для DDx превысила показатели врачей без его помощи: точность составила 59,1 % по сравнению с 33,6 %. Кроме того, врачи, которым помогал LLM, составили более полный список дифференциальных диагнозов с точностью 51,7% по сравнению с врачами, работающих без помощи LLM, — 36,1% и врачами с поиском — 44,4%.

Ученые сообщили об ограничениях исследования. Врачам был предоставлен отредактированный отчет о случае с доступом к презентации случая и соответствующим рисункам и таблицам. LLM был предоставлен доступ только к основному тексту каждого отчета о случае.

Ученые отметили, что несмотря на это ограничение, LLM превосходили врачей. Если бы LLM получили доступ к таблицам и рисункам, неизвестно, насколько увеличился бы разрыв в точности. Кроме того, формат ввода информации в LLM будет отличаться от того, как врач сейчас вносит информацию о случае в LLM.

Например, "хотя отчеты о случаях создаются как "головоломки" с достаточным количеством подсказок, которые должны позволить специалисту прийти к окончательному диагнозу, было бы непросто создать такой краткий, полный и последовательный отчет о случае в начале реальной клинической встречи", — пишут ученые.

Кроме того, случаи были выбраны как сложные для диагностики состояния. Поэтому эксперты отметили, что полученные результаты не дают оснований полагать, что врачи должны использовать LLM для DDx в типичных случаях, встречающихся в повседневной практике.

Также было обнаружено, что LLM делает выводы на основе отдельных симптомов, а не рассматривает весь случай в целом. Один из врачей отметил, что LLM был более полезен для более простых случаев с конкретными ключевыми словами или патогномоничными признаками.