Как новый алгоритм BOSSA может решить "проблему коктейльной вечеринки" для людей с нарушениями слуха

Новый алгоритм под названием BOSSA (биологически ориентированный алгоритм разделения звуков) может значительно улучшить способность слуховых аппаратов решать так называемую «проблему коктейльной вечеринки». Эта проблема заключается в сложности выделения конкретного голоса среди множества одновременных разговоров, что особенно затруднительно для людей с нарушениями слуха.
Как новый алгоритм BOSSA может решить "проблему коктейльной вечеринки" для людей с нарушениями слуха
Изображение носит иллюстративный характер

Современные слуховые аппараты используют направленные фильтры, которые помогают фокусироваться на звуках, находящихся перед пользователем. Такие фильтры эффективно работают при статическом фоновом шуме, но испытывают трудности в сложных акустических сценариях с несколькими близко расположенными говорящими.

Алгоритм BOSSA, разработанный исследователями, включая Александра Бойда, докторанта по биомедицинской инженерии в Бостонском университете, использует принципиально иной подход. Он преобразует звуковые волны в импульсы входного сигнала, имитируя работу улитки внутреннего уха. Затем алгоритм моделирует клетки среднего мозга, которые реагируют на звуки из определенных направлений, используя разницу во времени и громкости между ушами для определения направления. Этот механизм вдохновлен выдающимися пространственными способностями сипух и применяет подход «восходящего пути внимания».

Исследование, опубликованное 22 апреля в журнале Communications Engineering под руководством Александра Бойда, продемонстрировало перспективность нового алгоритма. В ходе эксперимента участники с нарушениями слуха носили наушники, в которых симулировалась ситуация с пятью людьми, говорящими одновременно из разных углов. Исследователи сравнивали эффективность BOSSA, традиционного алгоритма и необработанного аудио.

Результаты показали, что BOSSA работает лучше, когда целевой говорящий находится в пределах 30 градусов от слушателя. При использовании нового алгоритма участники могли разобрать больше слов при более низких пороговых значениях громкости. Однако традиционный алгоритм показал лучшие результаты при статическом шуме (что было проверено только у 4 из 8 участников).

Майкл Стоун, исследователь в области аудиологии из Манчестерского университета, отметил, что BOSSA не учитывает переключение внимания между разговорами, а исследование не воспроизводило реальные звуковые эхо и реверберации. Тем не менее, он считает, что BOSSA может быть более практичным, чем подходы на основе глубоких нейронных сетей.

Фан-Ган Цзэн, профессор отоларингологии из Калифорнийского университета в Ирвайне, подчеркнул, что BOSSA может быть более прозрачным, чем «черные ящики» глубоких нейронных сетей, хотя алгоритму может потребоваться дальнейшая доработка для реалистичных сценариев.

В будущем исследователи планируют тестировать BOSSA в настоящих слуховых аппаратах, а не только в наушниках. Кроме того, они надеются разработать механизм управления, который поможет пользователям направлять фокус внимания на нужные источники звука, что может стать решающим шагом в преодолении «проблемы коктейльной вечеринки» для миллионов людей с нарушениями слуха.


Новое на сайте

19171Вредоносное по VoidLink: созданная с помощью ИИ угроза для облачных систем и финансового... 19170Палеонтологические поиски и научные убеждения Томаса Джефферсона 19169Спасут ли обновленные протоколы безопасности npm от атак на цепочки поставок? 19168Почему критическая уязвимость BeyondTrust и новые записи в каталоге CISA требуют... 19167Севернокорейская хакерская группировка Lazarus маскирует вредоносный код под тестовые... 19166Государственные хакеры используют Google Gemini для кибершпионажа и клонирования моделей... 19165Можно ли построить мировую сверхдержаву на чашках чая и фунтах сахара? 19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и...
Ссылка