Google использует 46 млрд единиц данных для прогнозирования результатов лечения в больнице

30 Jan 2018
1112
Прослушать

Google опубликовала в Cornell University Library результаты исследования, описывающее решение, которое по словам специалистов компании в сфере искусственного интеллекта, точнее, чем любые аналоги, способно спрогнозировать результаты лечения пациента, находящегося в больнице. Т.е. это программное обеспечение способно сказать, умрет ли пациент в больнице и когда это произойдет, вернется ли он на повторную госпитализацию после выписки и даже обозначить окончательный диагноз.

Для своего исследования Google использовала обезличенные данные 216 221 взрослого человека, содержащие свыше 46 млрд единиц данных. Данные были предоставлены двумя больницами - Медицинским центром Калифорнийского университета в Сан-Франциско и больницей Чикагского университета.

И хотя результаты исследования пока не были проверены независимыми специалистами, разработчики Google утверждают, что они получили существенно более качественные результаты по сравнению с моделями, применяемыми сегодня для прогнозирования результатов лечения. Основным достижением они считают способность предсказать смерть пациента на 24 - 48 часов раньше, чем это делают с помощью существующих методов, что позволяет врачам раньше приступить к необходимы процедурам для спасения жизни.

Как сообщили исследователи, самой большой проблемой при "тренировке" алгоритма по данным медицинских записей была разрозненность данных, их плохая маркировка и большой объем информации, содержащийся в электронных картах пациентов. Кроме этого, серьезные проблемы при обработке доставили и примечания, сделанные врачами, что, впрочем, традиционно для таких проектов - каждый врач и медсестра пишут по-разному и могут использовать разный стиль таких заметок.

Для того, чтобы компенсировать это, подход Google основывался на использовании трех сложных глубоких нейронных сетей, которые "обучались" на этих данных, чтобы понять, какая информация важна для конечного результата. После анализа данных тысяч пациентов система идентифицировала, какие слова и события наиболее сильно связаны с результатом, и научилась обращать меньше внимания на т.н. "посторонние данные".

Обычно ученые должны тщательно проверить, как система на базе искусственного интеллекта, после того, как она создана, интерпретирует данные. Например, проверить, какое количество слоев необходимо для принятия максимально точного решения. В данном случае это было сделано автоматически с помощью предыдущего проекта Google - Vizier.