Механизмы внимания: от непараметрической регрессии к нейросетям

Механизм внимания, являющийся ключевым элементом современных нейросетевых архитектур, уходит корнями в непараметрическую регрессию, в частности, в метод Надарая-Ватсона. Эта связь позволяет понять, как нейросети «концентрируют» внимание на важных частях входных данных, проводя оценку целевой переменной на основе локальных средних взвешенных значений.
Механизмы внимания: от непараметрической регрессии к нейросетям
Изображение носит иллюстративный характер

В методе Надарая-Ватсона, для оценки значения зависимой переменной, используются взвешенные значения уже известных зависимых переменных. Веса определяются на основе близости соответствующих независимых переменных к новой независимой переменной. Ядерная функция определяет эту близость, а ширина окна определяет степень «локальности» оценки, создавая аналог «внимания» к ближайшим соседним точкам.

Ключи, значения и запросы, используемые в механизмах внимания нейросетей, представляют собой аналоги независимых и зависимых переменных в регрессии Надарая-Ватсона. Ключи и значения соответствуют известным данным, а запросы представляют собой новые данные, для которых требуется произвести оценку. Таким образом, механизм внимания, по сути, вычисляет взвешенное среднее значений, где веса определяются схожестью запросов с ключами.

Используя ядерную функцию нормального распределения и нормализацию, можно получить формулу внимания, широко применяемую в нейросетях. Операция softmax, в частности, обеспечивает стабильность и предсказуемость весов внимания, нормализуя их в пределах от 0 до 1. В итоге, механизм внимания можно представить как процесс вычисления взвешенного среднего с использованием непараметрической регрессии и последующей нормализацией.


Новое на сайте

19817В Луксоре нашли стелу с римским императором в образе фараона 19816Экипаж Artemis II о моменте, когда земля исчезла за луной 19815Почему луна выглядит по-разному в разных точках земли? 19814Adobe экстренно закрыла опасную дыру в Acrobat Reader, которую хакеры использовали с... 19813Метеорный поток, рождённый из умирающего астероида 19812Когда робот пишет за тебя прощальную смс 19811Что общего у лунной миссии, толстого попугая, загадочной плащаницы и лекарства от диабета? 19810Какие снимки Artemis II уже стали иконами лунной программы? 19809Кто на самом деле хочет сладкого — вы или ваши бактерии? 19808Как рекламные данные 500 миллионов телефонов оказались в руках спецслужб? 19807Экипаж Artemis II вернулся на землю после десяти дней в космосе 19806Зелёная и коричневая луна: почему геологи Artemis II уже не могут усидеть на месте 19805Эксперты уверены в теплозащитном щите Artemis II, несмотря на проблемы предшественника 19804Выжить внутри торнадо: каково это — когда тебя засасывает в воронку 19803Аляскинские косатки-охотники на млекопитающих замечены у берегов Сиэтла
Ссылка