Голосовые связки на чипе

21 Mar 2023
107

Для тех, кто потерял голос в результате операции или какого-либо заболевания, жизнь может оказаться очень трудной. В последнее время исследователи ищут технологии для универсального распознавания речи и взаимодействия, которые могут работать с тонкими звуками или шумной средой. Многоканальные акустические датчики могут повысить точность распознавания звука, но приводят к появлению больших устройств, которые невозможно носить. Теперь группа ученых из пекинского университета Цинхуа разработала простое устройство, которое может вернуть речь таким безголосым людям.

Новое устройство имеет форму квадрата со стороной в 1 см и его можно легко прикрепить к горлу, чтобы превратить едва слышные звуки и шепот в речь, слышимую на нормальной громкости. Питание этот миниатюрный прибор получает от батарейки размером с монету. Изобретение названо его разработчиками "носимым искусственным горлом на основе графена".

Руководитель исследовательской группы профессор Рен Тианлинг сообщил, что новинка способна распознавать и переводить элементы речи, такие как фонемы, тоны и слова, с точностью 99%. Это достигается за счет использования системы на основе искусственного интеллекта для интерпретации захваченных звуков и телесных вибраций для генерации вокализации.

Простой процесс изготовления, стабильная работа, устойчивость к шумам и интегрированная вокализация делают искусственные голосовые связки перспективным инструментом для систем распознавания и воспроизведения речи.

Исследование было опубликовано в журнале Nature Machine Intelligence.

Графеновые сенсоры нового чипа идеально подходят для обнаружения крошечных вибраций на поверхности кожи. Устройство, по словам ученых, "может ощущать движения мышц и звуковые вибрации, передаваемые на поверхность кожи и преобразовывать распознаваемую механическую информацию в речь".

Более того, помехи от шумных, агрессивных сред, таких как звуки шоссе, пожары и другие катастрофы, шум самолетов, не влияют на работу устройства. Оно продолжает функционировать на оптимальном уровне независимо от того, в какой среде находится.

Эти обстоятельства не влияют на чип, который обладает уникальным свойством функционировать, несмотря на любые внешние помехи.

При тестировании устройство с помощью модели искусственного интеллекта смогло с точностью более 90% распознать повседневные слова, нечетко произнесенные пациентом с ларингэктомией. Распознанный контент синтезировался в речь и воспроизводился на устройстве.

Сейчас требуются дополнительные исследования для придания большей выразительности вокализации, но ученые считают, что устройство достаточно практично и эффективно, чтобы стать обычным в будущем.

"Наше "умное носимое горло на чипе" обеспечивает новую парадигму для распознавания речи и, как ожидается, проложит путь для применения механических датчиков в интеллектуальных системах домашнего мониторинга здоровья, носимой электронике и даже криптографической безопасности", — сказал Рен Тианлинг.