Ssylka

Как дискретные диффузионные модели преодолевают недостатки авторегрессии в генерации текста?

Авторегрессионные модели, генерируя текст последовательно, страдают от потери глобальной согласованности, поскольку далекие токены слабо связаны. Дискретные диффузионные модели, маскируя слова и восстанавливая их параллельно, предлагают альтернативный путь, потенциально ускоряя генерацию и обеспечивая лучшую согласованность текста.
Как дискретные диффузионные модели преодолевают недостатки авторегрессии в генерации текста?
Изображение носит иллюстративный характер

Метод дискретной диффузии сталкивается с проблемой игнорирования связности между токенами, так как при «зашумлении» предполагается одновременная маскировка всего текста, а восстановление происходит через независимые вероятности для каждого слова. Energy-based diffusion language models (EDLM) решают эту проблему, оценивая локальную согласованность через функцию энергии, минимизация которой обеспечивает лучшее качество текста.

EDLM, на каждом шаге обратной диффузии, генерирует несколько вариантов, оценивает их энергию и выбирает вариант с наименьшей энергией, что соответствует наиболее вероятному и связному тексту. Для оценки энергии EDLM использует предобученные LLM или обучает её с помощью Noise Contrastive Estimation, что позволяет отличать реальные данные от шума.

Результаты тестирования EDLM на Text8 и OpenWebText показали, что модель достигла уровня производительности, сравнимого с авторегрессионными моделями, при этом значительно превзойдя другие дискретные диффузионные подходы. Это указывает на перспективность EDLM как конкурентоспособной альтернативы в области генерации текста.


Новое на сайте

7756Эпоха пиксельной магии: 10 мультсериалов 90-х, покоривших сердца миллионов 7755Нужно ли спешить со Скрамом: какова основа успешного управления проектами? 7754Смогут ли три крошечных тигренка спасти свой вид от вымирания? 7753Почему Oracle JDBC так медленно работает и как это исправить? 7752Как справиться с разрастанием Makefile и монолитом в Go? 7751Какие настольные игры помогут изучить точные науки в 2025? 7750Как сплотить команду и развить организацию? 7749Холодная война, горячая кровь: загадка убийства Джорджа полка в Салониках 7748Как AI-инструменты экономят время и повышают качество работы? 7747Энергетические секреты: какие устройства безопасно оставить в розетке 7746Италия блокирует китайского AI гиганта DeepSeek из-за опасений о конфиденциальности данных 7745Какие альтернативы Swiper для карусели в 2025 году? 7744Какие роботы уже меняют нашу жизнь и чего ожидать в будущем? 7743Может ли «пупок» Юты быть метеоритом или вздутием соли?