Архитектура и ключевые компоненты LLM Llama 3

Llama 3 анализирует текст, преобразуя его в последовательность числовых идентификаторов токенов, используя токенизатор Tiktoken. Затем эти идентификаторы преобразуются в векторы в 4096-мерном пространстве с помощью механизма эмбеддинга, что позволяет модели обрабатывать текст как числовые данные.
Архитектура и ключевые компоненты LLM Llama 3
Изображение носит иллюстративный характер

Трансформер, ядро Llama 3, состоит из 32 последовательных блоков TransformerBlock, каждый из которых играет ключевую роль в обработке информации.

Внутри TransformerBlock модуль self-attention вычисляет связи между токенами в тексте, определяя, на какие части текста следует обратить внимание при анализе каждого отдельного токена. Этот процесс включает преобразование исходных векторов в векторы запросов (Query), ключей (Key) и значений (Value), а также использование механизма кэширования (KV-cache) для оптимизации вычислений.

Завершает обработку блок FeedForward, который анализирует каждый токен независимо от других, уточняя его смысл и определяя общий контекст предложения. После прохождения через все блоки трансформера, линейный слой преобразует полученный вектор обратно в слово, выбирая наиболее вероятный токен на основе полученных оценок вероятности.


Новое на сайте

19857Острова как политический побег: от Атлантиды до плавучих государств Питера Тиля 19856Яйца, которые спасли предков млекопитающих от худшего апокалипсиса на Земле? 19855Могут ли омары чувствовать боль, и почему учёные требуют запретить варить их живыми? 19854Премия в $3 млн за первое CRISPR-лечение серповидноклеточной анемии 19853Почему сотрудники игнорируют корпоративное обучение и как это исправить 19852Тинтагель: место силы Артура или красивая легенда? 19851Голоса в голове сказали правду: что происходит, когда галлюцинации ставят диагноз точнее... 19850Куда исчезает информация из чёрных дыр, если они вообще исчезают? 19849Чёрная дыра лебедь Х-1 бросает джеты со скоростью света — но кто ими управляет? 19848Что увидели фотографы над замком Линдисфарн — и почему они закричали? 19847Почему антисептики в больницах могут создавать устойчивых к ним микробов? 19846Правда ли, что курица может жить без головы? 19845Как Оскар Уайльд использовал причёску как оружие против викторианской морали? 19844Назальный спрей против всех вирусов: как далеко зашла наука 19843«Я ещё не осознал, что мы только что сделали»: первая пресс-конференция экипажа Artemis II
Ссылка