Может ли отсутствие сенсорного опыта лишить ИИ истинного понимания?

Современные текстовые модели, такие как GPT-4 и Gemini, обучаются исключительно на лингвистических данных, что лишает их прямого контакта с физическим миром и образным восприятием. Их «мысль» основана на повторяющихся шаблонах и символических ассоциациях, не подкреплённых реальными сенсорными переживаниями.
Может ли отсутствие сенсорного опыта лишить ИИ истинного понимания?
Изображение носит иллюстративный характер

Человеческое познание укоренено в множестве ощущений, позволяющих связывать слова с непосредственными переживаниями. Тогда как человек воспринимает окружающий мир через зрение, слух, осязание и другие органы чувств, ИИ ограничен лишь текстовыми данными, что ставит под вопрос полноту их смыслового понимания.

История Хелен Келлер иллюстрирует, как даже недостаток сенсорного опыта может стать фундаментом для обретения смысла. Родившись в уважаемой семье штата Алабама, Хелен в 19 месяцев перенесла менингит, вследствие которого утратила зрение и слух, однако начала воспринимать мир через вибрации и тактильные ощущения.

В возрасте шести лет мать Хелен наняла слепую женщину для обучения письму посредством нажатия букв на её руке. Именно в этот момент, получив так называемый «дамаскинский момент», она поняла, что последовательность символов W-A-T-E-R олицетворяет ощущение прохладной воды. Как сказала Хелен: «Живое слово пробудило мою душу, дало ей свет, надежду, освободило её!».

Таким образом, смысл появляется при сопоставлении символов с конкретными ощущениями. Многие термины, такие как «квадратный корень», «абсурд» или «гамма-излучение», не имеют прямых физических аналогов, однако их значение определяется сетью взаимосвязей и абстрактными концепциями, что позволяет человеку воспринимать их глубже.

Два пути обретения значения – через языковые ассоциации («высокий путь») и через прямые сенсорные впечатления («низкий путь») – объединяются в сознании большинства людей. В отличие от них, ИИ опирается исключительно на обработку текста, лишённую осязательных переживаний, таких как прохлада струящейся воды.

Ярким примером отделения языка от рассуждения является афазия – нарушение речевых способностей вследствие инсульта, при котором логическое мышление и творческая активность остаются неизменными. Этот феномен подчеркивает, что смыслопонимание не определяется лишь речевой компетентностью, а базируется на более широком спектре когнитивных представлений.

Развивающиеся технологии ИИ уже демонстрируют способность работать с изображениями и видео, что открывает путь к моделям, использующим мульти модальные данные. Этот прогресс может позволить будущим системам стать ближе к человеческим процессам познания, объединяя символические и сенсорные элементы в единое целое.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка