Алгоритмы и мозг: расшифровка секретов речи

Недавнее исследование, опубликованное 7 марта в журнале Nature Human Behaviour, демонстрирует потенциал искусственного интеллекта в декодировании сложной мозговой активности, возникающей при повседневном общении.
Алгоритмы и мозг: расшифровка секретов речи
Изображение носит иллюстративный характер

Используемая модель Whisper преобразует аудиофайлы в текст посредством статистического сопоставления, не опираясь на заранее заданные языковые структуры, такие как фонемы или части речи. Несмотря на отсутствие явного программного обеспечения языковых признаков, модель самостоятельно выявляет сложные языковые паттерны.

Основной интерес исследования заключался в изучении механизмов человеческого восприятия и производства речи, а также в сопоставлении этих процессов с работой искусственных нейросетей. Ведущий автор исследования, Ариэль Голдштейн, отметил: «Результаты исследования свидетельствуют о том, что когнитивные процессы можно интерпретировать через призму статистических моделей».

Реальные данные для анализа были получены у четырех пациентов с эпилепсией, которым в рамках клинических показаний имплантировали от 104 до 255 электродов для мониторинга мозговой активности. Записи, охватывающие свыше 100 часов живой аудиокорреспонденции во время больничного пребывания, позволили изучить естественные процессы коммуникации вне лабораторных условий.

Анализ показал, что область верхней височной извилины активизируется при восприятии звуковой информации, в то время как нижняя лобная извилина отвечает за интерпретацию смысла. Наблюдалась четкая временная последовательность: сначала активировалась зона слухового восприятия, а затем – область смысловой обработки. Дополнительно отмечено, что некоторые участки мозга задействуются в функциях, не являющихся их основной специализацией, что подтверждает распределенную модель обработки информации.

Использование 80% записанного аудио для обучения модели Whisper позволило предсказывать мозговую активность для оставшихся 20% данных. Полученные результаты значительно превосходили показатели традиционных моделей, основанных на фиксированных языковых структурах, демонстрируя, что алгоритму удалось самостоятельно обнаружить и использовать ключевые языковые признаки.

Эксперты высоко оценили полученные данные. Леонард Шильбах из Мюнхенского центра нейронауки охарактеризовал исследование как прорыв, связывающий вычислительные модели преобразования звука в речь с функциями мозга, а ассоциированный профессор Гашпер Бегуш из Университета Калифорнии в Беркли подчеркнул, что сравнение биологических и искусственных нейронных сетей открывает новые перспективы в разработке экспериментальных методик.

Данное исследование демонстрирует, что современные языковые модели искусственного интеллекта способны не только эффективно обрабатывать речь, но и предоставлять уникальное окно в понимание нейронных механизмов человеческого общения, что может стать основой для усовершенствования технологий распознавания речи и создания вспомогательных коммуникационных устройств.


Новое на сайте

20065[b]СПКЯ стало СПМЯ: почему переименование болезни, затрагивающей миллионы женщин, заняло... 20064[b]Почему великая пирамида Гизы пережила все землетрясения за 4500 лет[/b] 20063[b]Генетика Homo erectus: что зубная эмаль рассказала о наших предках[/b] 20062[b]Кости в бухте эребус: что кости моряков Франклина рассказывают спустя полтора века[/b] 20061[b]Крупнейший плавучий ветрогенератор в мире: Китай испытывает установку у берегов... 20060[b]Карие глаза младенца стали индиго после лечения от COVID-19[/b] 20058[b]Почему серебряная чаша с Афиной пролежала в немецком лесу две тысячи лет?[/b] 20057[b]Дыра в атмосфере солнца: вспышка достигла пика и может зажечь полярное сияние[/b] 20056[b]Динго возрастом 950 лет: кто и зачем кормил могилу животного сотни лет?[/b] 20055[b]Томоэ гозэн: женщина-самурай, которая существовала на самом деле[/b] 20054[b]Что видели астронавты «Аполлона-12» над лунным горизонтом?[/b] 20053[b]Восковой блокнот на латыни и шёлковая туалетная бумага: кто посещал средневековый... 20052[b]Хантавирус на борту: 41 человек под наблюдением после рейса MV Hondius[/b] 20051[b]Зелёные камни в пещере Пиренеев: четыре тысячи лет медной металлургии[/b]
Ссылка