Слуховой аппарат, определяющий направленность звука
Слуховые аппараты могут быть крайне важны для людей, страдающих потерей слуха, однако эти устройства все еще имеют некоторые недостатки, включая тот факт, что они не обладают достаточной направленностью звука. Чтобы решить эту проблему, исследовательская группа из Тайваня объединила несколько технологий, таких как компьютерное зрение, специализированные алгоритмы и массивы микрофонов, которые позволяют пользователям лучше слышать, откуда исходит звук. Новое устройство, предназначенное в первую очередь для людей с легкой и средней степенью потери слуха, описано в исследовании, опубликованном в журнале IEEE Sensors.
Предлагаемая конструкция включает в себя инновационный двухслойный микрофонный массив, размещаемый на ушах, и носимое устройство в виде ожерелья, в которое встроена камера с компьютерным зрением на базе искусственного интеллекта (ИИ). Алгоритм помогает компоненту компьютерного зрения находить лица в окружении, чтобы предсказать, от какого лица исходит звук. Когда говорящий находится вне зоны действия системы компьютерного зрения, включается алгоритм, предсказывающий происхождение звука на основе угла и времени прибытия.
На последнем этапе алгоритм микширования изменяет звук, который слышат пользователи, чтобы помочь им лучше определить направленность звука, а затем регулирует громкость, чтобы добиться лучшего слухового восприятия.
Направленность звука очень важна для качества жизни и безопасности людей с потерей слуха. Разработчики надеются применить этот модуль в повседневной жизни пожилых пациентов с нарушениями слуха, что позволит еще больше улучшить качество жизни пациентов с легкой и средней степенью потери слуха.
Технология была протестирована на группе из 30 пациентов. Исследователи обнаружили, что участники исследования смогли правильно определить источник звука с помощью компьютерно-визуального компонента слухового аппарата с точностью 94% или выше на расстоянии, на котором люди обычно ведут беседу (160 сантиметров или меньше). Когда звук исходил из области, обнаруживаемой микрофонами, но не компьютерным устройством зрения, пользователи все равно могли определить источник звука с точностью более 90%.
При этом алгоритм микширования эффективно регулирует громкость левого и правого каналов, позволяя пользователям определять местоположение источника звука. В отдельном исследовании, проведенном на пожилых пациентах, комбинированная технология позволила пользователям достичь 100-процентного успеха в клиническом тесте на определение направления.
Диапазон распознавания камеры компьютерного зрения ограничен 75 градусами, и поэтому не может достичь такой же широты распознавания, как человеческий глаз, который расширяется до 120 градусов при бинокулярном зрении. В будущем будет рассмотрена возможность использования широкоугольных линз или двойных камер для достижения такого же угла, как у человеческого глаза, что сделает его более подходящим для повседневного использования.