Новый алгоритм под названием BOSSA (биологически ориентированный алгоритм разделения звуков) может значительно улучшить способность слуховых аппаратов решать так называемую «проблему коктейльной вечеринки». Эта проблема заключается в сложности выделения конкретного голоса среди множества одновременных разговоров, что особенно затруднительно для людей с нарушениями слуха.

Современные слуховые аппараты используют направленные фильтры, которые помогают фокусироваться на звуках, находящихся перед пользователем. Такие фильтры эффективно работают при статическом фоновом шуме, но испытывают трудности в сложных акустических сценариях с несколькими близко расположенными говорящими.
Алгоритм BOSSA, разработанный исследователями, включая Александра Бойда, докторанта по биомедицинской инженерии в Бостонском университете, использует принципиально иной подход. Он преобразует звуковые волны в импульсы входного сигнала, имитируя работу улитки внутреннего уха. Затем алгоритм моделирует клетки среднего мозга, которые реагируют на звуки из определенных направлений, используя разницу во времени и громкости между ушами для определения направления. Этот механизм вдохновлен выдающимися пространственными способностями сипух и применяет подход «восходящего пути внимания».
Исследование, опубликованное 22 апреля в журнале Communications Engineering под руководством Александра Бойда, продемонстрировало перспективность нового алгоритма. В ходе эксперимента участники с нарушениями слуха носили наушники, в которых симулировалась ситуация с пятью людьми, говорящими одновременно из разных углов. Исследователи сравнивали эффективность BOSSA, традиционного алгоритма и необработанного аудио.
Результаты показали, что BOSSA работает лучше, когда целевой говорящий находится в пределах 30 градусов от слушателя. При использовании нового алгоритма участники могли разобрать больше слов при более низких пороговых значениях громкости. Однако традиционный алгоритм показал лучшие результаты при статическом шуме (что было проверено только у 4 из 8 участников).
Майкл Стоун, исследователь в области аудиологии из Манчестерского университета, отметил, что BOSSA не учитывает переключение внимания между разговорами, а исследование не воспроизводило реальные звуковые эхо и реверберации. Тем не менее, он считает, что BOSSA может быть более практичным, чем подходы на основе глубоких нейронных сетей.
Фан-Ган Цзэн, профессор отоларингологии из Калифорнийского университета в Ирвайне, подчеркнул, что BOSSA может быть более прозрачным, чем «черные ящики» глубоких нейронных сетей, хотя алгоритму может потребоваться дальнейшая доработка для реалистичных сценариев.
В будущем исследователи планируют тестировать BOSSA в настоящих слуховых аппаратах, а не только в наушниках. Кроме того, они надеются разработать механизм управления, который поможет пользователям направлять фокус внимания на нужные источники звука, что может стать решающим шагом в преодолении «проблемы коктейльной вечеринки» для миллионов людей с нарушениями слуха.

Изображение носит иллюстративный характер
Современные слуховые аппараты используют направленные фильтры, которые помогают фокусироваться на звуках, находящихся перед пользователем. Такие фильтры эффективно работают при статическом фоновом шуме, но испытывают трудности в сложных акустических сценариях с несколькими близко расположенными говорящими.
Алгоритм BOSSA, разработанный исследователями, включая Александра Бойда, докторанта по биомедицинской инженерии в Бостонском университете, использует принципиально иной подход. Он преобразует звуковые волны в импульсы входного сигнала, имитируя работу улитки внутреннего уха. Затем алгоритм моделирует клетки среднего мозга, которые реагируют на звуки из определенных направлений, используя разницу во времени и громкости между ушами для определения направления. Этот механизм вдохновлен выдающимися пространственными способностями сипух и применяет подход «восходящего пути внимания».
Исследование, опубликованное 22 апреля в журнале Communications Engineering под руководством Александра Бойда, продемонстрировало перспективность нового алгоритма. В ходе эксперимента участники с нарушениями слуха носили наушники, в которых симулировалась ситуация с пятью людьми, говорящими одновременно из разных углов. Исследователи сравнивали эффективность BOSSA, традиционного алгоритма и необработанного аудио.
Результаты показали, что BOSSA работает лучше, когда целевой говорящий находится в пределах 30 градусов от слушателя. При использовании нового алгоритма участники могли разобрать больше слов при более низких пороговых значениях громкости. Однако традиционный алгоритм показал лучшие результаты при статическом шуме (что было проверено только у 4 из 8 участников).
Майкл Стоун, исследователь в области аудиологии из Манчестерского университета, отметил, что BOSSA не учитывает переключение внимания между разговорами, а исследование не воспроизводило реальные звуковые эхо и реверберации. Тем не менее, он считает, что BOSSA может быть более практичным, чем подходы на основе глубоких нейронных сетей.
Фан-Ган Цзэн, профессор отоларингологии из Калифорнийского университета в Ирвайне, подчеркнул, что BOSSA может быть более прозрачным, чем «черные ящики» глубоких нейронных сетей, хотя алгоритму может потребоваться дальнейшая доработка для реалистичных сценариев.
В будущем исследователи планируют тестировать BOSSA в настоящих слуховых аппаратах, а не только в наушниках. Кроме того, они надеются разработать механизм управления, который поможет пользователям направлять фокус внимания на нужные источники звука, что может стать решающим шагом в преодолении «проблемы коктейльной вечеринки» для миллионов людей с нарушениями слуха.