Новая технология шумоподавления, основанная на глубоком обучении, позволяет пользователям выбирать, какие звуки они хотят слышать, а какие – нет. Система, получившая название «семантический слух», работает в режиме реального времени, анализируя все окружающие звуки и выделяя из них до 20 различных категорий, таких как сирены, плач младенца, пение птиц и другие. Пользователь может выбрать, какие из этих категорий он хочет слышать, а остальные будут блокироваться.
Разработанная учеными из Вашингтонского университета, система использует алгоритм искусственного интеллекта, который обрабатывает звук, поступающий с наушников, через специальное приложение на смартфоне. Алгоритм не только идентифицирует и разделяет различные звуки, но и сохраняет их пространственное восприятие, позволяя пользователю ориентироваться в окружающем пространстве. При этом задержка обработки звука составляет менее одной сотой секунды.
Для обучения нейросети использовались обширные базы данных звуков, а также записи, собранные в реальных условиях с помощью различных микрофонов. Это позволило создать систему, которая может адаптироваться к различным типам наушников и форме головы пользователя, обеспечивая стабильную и точную работу в любых условиях.
Разработчики планируют коммерциализировать технологию в будущем, создав наушники со встроенным программным обеспечением и аппаратным обеспечением для обработки звука на самом устройстве. В перспективе, «семантический слух» может стать первым шагом к созданию «умных» устройств, расширяющих возможности человеческого слуха.
Изображение носит иллюстративный характер
Разработанная учеными из Вашингтонского университета, система использует алгоритм искусственного интеллекта, который обрабатывает звук, поступающий с наушников, через специальное приложение на смартфоне. Алгоритм не только идентифицирует и разделяет различные звуки, но и сохраняет их пространственное восприятие, позволяя пользователю ориентироваться в окружающем пространстве. При этом задержка обработки звука составляет менее одной сотой секунды.
Для обучения нейросети использовались обширные базы данных звуков, а также записи, собранные в реальных условиях с помощью различных микрофонов. Это позволило создать систему, которая может адаптироваться к различным типам наушников и форме головы пользователя, обеспечивая стабильную и точную работу в любых условиях.
Разработчики планируют коммерциализировать технологию в будущем, создав наушники со встроенным программным обеспечением и аппаратным обеспечением для обработки звука на самом устройстве. В перспективе, «семантический слух» может стать первым шагом к созданию «умных» устройств, расширяющих возможности человеческого слуха.