Распознавание речи как новая возможность в цифровой трансформации здравоохранения

27 Jan 2022
252
Прослушать

В последнее время все большее внимание экспертов в сфере здравоохранения привлекают технологии, основанные на распознавании голоса и речи. Инструменты искусственного интеллекта, основанные на распознавании голоса, могут повысить производительность труда врачей, уменьшить выгорание и улучшить качество обслуживания пациентов. Похожие технологии начинаю применяться и для диагностики определенных заболеваний, при этом разработчики утверждают, что в диагнозе не будут упущены какие-либо критические показатели здоровья.

Общеизвестно, что самым тяжелым бременем для многих медицинских работников является документирование и аннотирование клинических встреч в электронных медицинских картах. И распознавание голоса является одним из многих инструментов, которые сегодня могут облегчить эту проблему и снизить нагрузку на врачей.

Инструменты с поддержкой голоса входят в широкую категорию разговорного искусственного интеллекта, наряду с чат-ботами и другими инструментами повышения производительности и автоматизации. Однако зрелость этих инструментов, особенно в клиническом контексте, далека от перспективности технологии.

Пользователи похожих инструментов признают, что эта технология повышает производительность труда медперсонала. Однако они также отмечают, что соответствующие технологии искусственного интеллекта, которые могут понять смысл разговора и обеспечить поддержку принятия клинических решений в режиме реального времени, еще только зарождается.

Распознавание голоса в клиническом контексте является сложной задачей, а встречи между врачом и пациентом трудно отразить в программах распознавания голоса. Даже у ведущих поставщиков технологий для голосовых инструментов человек пока все равно вынужден интерпретировать разговор и отделять клиническую терминологию от общего разговора.

Крупнейшие технологические компании и распознавание речи в здравоохранении

Как крупные технологические компании, так и стартапы стремятся расширить возможности распознавания голоса, учитывая значительный потенциал инструментов с голосовой поддержкой для повышения производительности и изменения опыта пациентов.

Amazon, Google и Apple инвестировали в разработку голосовых приложений для потребителей. Microsoft, чья платформа Cortana не оказала большого влияния на рынок, пошла дальше и недавно приобрела разработчика программного обеспечения для голосовых технологий Nuance почти за $20 млрд. Этот шаг, по сути, означал, что Microsoft удваивает свои обязательства в области здравоохранения.

Напомним, что обе компании уже сотрудничают в области использования технологий создания удобной рабочей среды в сочетании с искусственным интеллектом, автоматизацией и облачными вычислениями для организации смотровой комнаты, в которой клиническая документация создается в фоновом режиме и "пишет сама себя". Эта технология предназначена для "прослушивания" с согласия пациента его разговоров с врачом во время посещения. Затем система синтезирует беседу, объединяет данные с контекстуальной информацией из электронной медицинской карты и обновляет карту пациента. Технология, уже запущенная в эксплуатацию в 2020 году, также обеспечивает автоматизацию рабочего процесса, задач и знаний.

Компания Nuance Communications разработала платформу Dragon Medical, которая использует распознавание голоса и разговорный искусственный интеллект для помощи врачам в документировании в электронную медицинскую карту. Эту платформу используют сегодня более 500 000 врачей.

Данные исследования, которое провела компания Nuance Communications, свидетельствуют о том, что использование программы голосового распознавания позволяет на 40% быстрее документировать клинические записи, чем при использовании традиционных методов.

Amazon, единственная другая крупная технологическая компания с голосовым предложением для здравоохранения, развернула услуги Alexa в нескольких медицинских организациях. Однако Alexa использует голос в неклиническом (или квази-клиническом, в зависимости от того, как это понимать) контексте. Недавние заявления Amazon указывают на использование голосовых возможностей в сообществах пожилых людей и пациентов в больницах для поддержания связи, информирования и развлечений, так же как потребители используют Alexa сегодня для получения общей информации.

Хотя эти решения не оказывают непосредственной помощи врачам и обслуживающему персоналу в диагностике и лечении, они все же играют важную роль в оказании медицинской помощи. Например, голосовые ассистенты позволяют пациентам решать рутинные немедицинские задачи, такие как напоминание о приеме лекарств, почти, как если бы у них дома был медработник, но вместо него использовался голосовой ассистент.

Впрочем, в конце 2019 года Amazon выпустила Transcribe Medical - автоматизированную службу распознавания речи, которая позволит разработчикам добавлять в свои приложения возможность автоматической подготовки медицинской документации. API-инструмент разработан с учетом медицинских и фармакологических терминов, позволяя врачам, фармацевтам и исследователям просто надиктовывать все свои действия. Он также имеет функцию обработки естественной речи, которая позволяет транскрибировать речь при визите пациента к врачу и записывать ее в соответствующую систему.

Новая функция является дополнением к сервису Amazon Transcribe, который был включен в список услуг Amazon Web Services в ноябре 2018 года.

Теперь к ним присоединяется и компании Oracle, которая стала новым крупным игроком в сфере технологий для здравоохранения после запланированного приобретения компании Cerner, системы электронных медицинских карт которой установлены по всему миру. В прессе неоднократно упоминалось программное обеспечение для распознавания голоса как значительный фактор повышения производительности и снижения нагрузки на врачей в будущем. Интересно при этом, что Cerner в настоящее время сотрудничает с компанией Nuance для расширения возможностей голосовых технологий.

Молодые компании и стартапы на рынке систем распознавания речи

Этот рынок относительно молодой и здесь пока нет явных лидеров, чем и воспользовались молодые компании, пытающиеся реализовать свои идеи и попытаться заработать на этом. Здесь мы упомянет только некоторые из них, а всего их уже более десятка.

Компания Robin Healthcare разработала голосовое устройство на базе искусственного интеллекта, которое предназначен для помощи врачам в заполнении клинических документов. Этот прибор, который с виду напоминает "умные" колонки Amazon Alexa или Google Home, устанавливается во врачебном кабинете и делает заметки во время разговора врача с пациентом.

Просто слушая обычный разговор врача с пациентом, устройство способно создавать вполне конкретные и полезные записи, которые помещаются непосредственно в электронную медицинскую карту больного. Правда, после завершения приема врач все равно должен просмотреть эти записи и при необходимости внести изменения. И хотя, по словам разработчиков, программа позволяет врачу вообще об этом не думать, подход "двойной проверки" необходим в такой важной сфере, как здравоохранение. Впрочем, пока все аналогичные системы также требуют верификации записей врачом, прежде чем они будут занесены в медицинскую карту пациента.

Компания Suki разработала систему, которая представляет собой "виртуального помощника" для врача, использующего возможности искусственного интеллекта и голосовые технологии для помощи в составлении клинической документации. С помощью этого решения врач может говорить о потребностях больного в процессе приема пациента или после его посещения, а Suki затем самостоятельно документирует все, что сказал доктор. Кроме этого, этот продукт может быть интегрирован в систему электронных медицинских карт (интеграция осуществляется уже в три подобные системы).

Suki имеет несколько версий для использования врачами различных специализаций и персонализируется для каждого врача отдельно и становится все более "умной" по мере ее использования в медицинской организации. Причем, в отличие от обычных голосовых "помощников", система понимает медицинский контекст и запоминает предпочтения своего пользователя-врача.

Американская компания Saykara разработала приложение для мобильного телефона, которое регистрирует взаимодействие врача с пациентами, используя искусственный интеллект и машинное обучение, чтобы регистрировать ключевые моменты разговора врача с пациентом и соответствующим образом делать записи в электронной медицинской карте, оставляя врачу возможность сосредоточиться на пациенте. Saykara позволяет пассивно регистрировать данные в кабинете врача, не требуя активации, что еще больше упрощает работу врачам, которым ранее приходилось записывать все вручную.

Целью компании является создание абсолютно бесшовного процесса, при котором сложное программное обеспечение извлекает необходимую информацию из бесед врача с пациентом, не отвлекаясь на слова, не имеющих отношения к делу. В настоящее время программа фокусируется на голосе врачей, в то время как они слушают пациента, рассказывающего о симптомах, и повторяют их за ним.

А компания Notable создала приложение для "умных" часов, которые также используют похожие технологии для записи информации в электронную медицинскую карту во время визита пациента к врачу.

Платформа объединяет в себе возможности искусственного интеллекта и системы распознавания голоса для обработки информации. Она способна фиксировать надиктованную информацию и создавать предписания, кроме того, она может самостоятельно предлагать коды биллинга. После все данные приема пациента автоматически передаются в систему электронных медицинских карт по защищенному каналу.

Эта технология полезна и пациентам, поскольку пациент получает доступ к более подробной информации, которая сохраняется в системе и к которой пациентам может разрешаться доступ. Отметим, что, по словам разработчиков, платформа способна работать с любой автоматизированной системой электронных медицинских карт.

Клинические приложения все еще находятся на ранних стадиях

Прогресс в направлении более интеллектуального использования распознавания голоса для поддержки принятия клинических решений был медленным. Как упоминалось ранее, отделение врачебной терминологии от других аспектов разговора является нетривиальной задачей, что означает, что технология распознавания голоса хорошо подходит для одних специальностей, но не для других.

Независимо от темпов внедрения, большинство поставщиков услуг отмечают снижение уровня выгорания врачей при использовании таких систем. Программное обеспечение для распознавания речи может расшифровывать информацию о встречах с пациентами в три раза быстрее, чем человек набирает текст в системе, что потенциально освобождает пару часов в день для типичного врача, который принимает от двадцати до тридцати пациентов в день.

Мы можем только надеяться, что по мере совершенствования технологии и уменьшения необходимости участия человека в просмотре записи мы будем наблюдать рост числа пользователей. Приход больших технологий в эту сферу приведет к значительным новым инвестициям, которые будут способствовать развитию инструментов искусственного интеллекта и интеллектуальной автоматизации таких аспектов, как кодирование и качественное выделение нужных данных из записей о встречах.

Сегодня важнейшим аспектом автоматизации с помощью голосовых и аналогичных технологий является то, что она может помочь медицинским организациям справиться с недостатком кадров и низким уровнем персонала, с чем сейчас сталкивается здравоохранение.

Предоставление врачам возможности выполнять самую сложную работу с наиболее требовательными и сложными пациентами лично также означает использование технологий для оказания помощи пациентам, не имеющим серьезных потребностей - то, что, как мы видели, очень эффективно работает с телемедициной в первичном здравоохранении и таких специальностях, как поведенческое здоровье. По мере совершенствования технологий будут появляться дополнительные возможности использования голоса.

Остается вопрос о том, как пациенты реагируют на использование голосовых инструментов при оказании медицинской помощи. Первые признаки говорят о том, что большинство пациентов принимают эти технологии, потому что они дают возможность восстановить близкие отношения с врачом, которые были утрачены из-за обременительных требований к документации в электронных медицинских картах.

Однако вопросы, связанные с конфиденциальностью данных и большей информированностью об этом пациентов, говорят о том, что приложениям с голосовой поддержкой придется действовать осторожно.

На широком уровне истинный потенциал технологии распознавания голоса заключается в том, чтобы выйти за рамки документирования и стать интеллектуальным инструментом поддержки принятия решений за счет эффективного прослушивания клинических показателей и проактивной поддержки клинических решений.

Уровень интеграции между новыми технологическими инструментами и основными клиническими платформами, такими как системы электронных медицинских карт, является важным фактором в повышении уровня внедрения. Сегодняшняя фундаментальная проблема распознавания голоса является такой же, как и для приложений на базе искусственного интеллекта в целом в контексте здравоохранения.

Как и все новые технологии, решения с поддержкой голоса будут иметь больше шансов на широкое внедрение, если они будут решать важные и неотложные проблемы в оказании медицинской помощи, что обеспечит поддержку со стороны медицинских организаций.

Новые технологии также предполагают изменение бизнес-процессов в дополнение к интеграции с основными клиническими платформами, такими как системы электронных медицинских карт, и требуют эффективных подходов к управлению изменениями. Для достижения успеха необходимо согласование между поставщиком технологии и внутренними заинтересованными сторонами медицинской организации, а также разработка сквозного подхода к решению проблем.

Часто это означает уделение пристального внимания пониманию заявленных и незаявленных потребностей. Когда все эти элементы объединяются, цифровая трансформация сектора здравоохранения может сделать гигантский скачок вперед.

По материалам Healthcare IT News, Fierce Healthcare, MobiHealth News, Digital Health Age.