Меню

Миниатюрный GPT-2 на C: краткий обзор

Аелфверд

Реализация GPT-2 на C в объеме 3000 байт демонстрирует возможность создания минималистичной, но функциональной версии языковой модели, несмотря на ограничения в ресурсах.
Миниатюрный GPT-2 на C: краткий обзор

Изображение носит иллюстративный характер

Оптимизация производительности достигается за счет KV-кэширования, эффективного перемножения матриц и опционального OMP-параллелизма, позволяя малой модели GPT-2 выдавать ответ за несколько секунд.

Программа включает в себя библиотеку для матричной математики, слои нейронной сети, модель-трансформер и модуль частотного кодирования, а также функциональность для загрузки весов и данных для частотного кодирования.

Архитектура трансформера включает в себя слои нормализации, функцию активации GELU и механизм «причинного внимания», который учитывает только прошлое, но не будущее при генерации текста.

Источник: Sivchenko_translate

← Предыдущее в разделе Следующее в разделе →

Вверх

Новое на сайте

Почему AI-помощникам выгодно лгать, а не признавать незнание?

Зеленая немочь: загадочная болезнь девственниц, исчезнувшая из медицины

Риск удушья во сне: врачи бьют тревогу из-за тренда с заклейкой рта

Как 6000 экзопланет меняют наше представление о вселенной?

Меню

МенюЗакрыть