Ssylka

Как дискретные диффузионные модели преодолевают недостатки авторегрессии в генерации текста?

Авторегрессионные модели, генерируя текст последовательно, страдают от потери глобальной согласованности, поскольку далекие токены слабо связаны. Дискретные диффузионные модели, маскируя слова и восстанавливая их параллельно, предлагают альтернативный путь, потенциально ускоряя генерацию и обеспечивая лучшую согласованность текста.
Как дискретные диффузионные модели преодолевают недостатки авторегрессии в генерации текста?
Изображение носит иллюстративный характер

Метод дискретной диффузии сталкивается с проблемой игнорирования связности между токенами, так как при «зашумлении» предполагается одновременная маскировка всего текста, а восстановление происходит через независимые вероятности для каждого слова. Energy-based diffusion language models (EDLM) решают эту проблему, оценивая локальную согласованность через функцию энергии, минимизация которой обеспечивает лучшее качество текста.

EDLM, на каждом шаге обратной диффузии, генерирует несколько вариантов, оценивает их энергию и выбирает вариант с наименьшей энергией, что соответствует наиболее вероятному и связному тексту. Для оценки энергии EDLM использует предобученные LLM или обучает её с помощью Noise Contrastive Estimation, что позволяет отличать реальные данные от шума.

Результаты тестирования EDLM на Text8 и OpenWebText показали, что модель достигла уровня производительности, сравнимого с авторегрессионными моделями, при этом значительно превзойдя другие дискретные диффузионные подходы. Это указывает на перспективность EDLM как конкурентоспособной альтернативы в области генерации текста.


Новое на сайте

18861Стратегия долгосрочного мышления в эпоху мгновенных результатов 18860Римские артефакты из канадского секонд-хенда стали объектом научного расследования 18859Критическая уязвимость в устаревших видеорегистраторах Digiever стала целью для ботнетов... 18858Злоумышленники активно эксплуатируют пятилетнюю уязвимость Fortinet для обхода... 18857«Джеймс Уэбб»: путешествие от тропических лесов к краю времени 18856Почему нотаризация Apple не смогла остановить новый шпионский инструмент MacSync? 18855Как обнаружение скелета Люси возрастом 3,2 миллиона лет изменило понимание человеческой... 18854Действительно ли первая рождественская ночь была тихой, или Иисус родился в эпоху... 18853Первая в истории потенциальная суперкилоновая: открытие уникального гибридного взрыва... 18852Откуда взялась необъяснимая планета с атмосферой из сажи и алмазов, которую обнаружил... 18851Станет ли интернет зомби-апокалипсисом и почему доверие превращается в самую дорогую... 18850Оккультная одержимость Уильяма Батлера Йейтса как главный источник его поэтического... 18849Лучшие небесные объекты для зимних наблюдений в бинокль в сезоне 2025–2026 годов 18848Революция в палеогенетике и чтение днк из древних пещерных отложений 18847Анализ крови вместо скальпеля: потенциал и риски мультираковой ранней диагностики