Инновационная разработка южнокорейских ученых позволила создать ИИ-модель, способную генерировать изображения всего за 1-2 секунды, при этом она не требует дорогостоящего оборудования. Секрет кроется в специальной технике «дистилляции знаний», которая позволила сжать размер модели Stable Diffusion XL с 2.56 миллиардов параметров до всего 700 миллионов в новой модели "KOALA".
Это уменьшение размера привело к значительной экономии вычислительных ресурсов, позволяя KOALA работать на недорогих графических процессорах (GPU) и всего с 8 Гб оперативной памяти. В то время как более крупные модели, например, от OpenAI, требуют мощных промышленных GPU.
Тестирование показало, что KOALA способна сгенерировать изображение по текстовому запросу в разы быстрее, чем конкуренты. Например, создание изображения «астронавта, читающего книгу под луной на Марсе» заняло у нее всего 1.6 секунды, тогда как аналогичные операции DALL·E 2 и DALL·E 3 выполняли за 12.3 и 13.7 секунды соответственно.
Разработчики планируют интегрировать новую технологию в различные сервисы и области, включая образовательные платформы и контент-производство. Эта разработка открывает новые возможности для широкого использования генеративных ИИ-моделей, делая их более доступными для обычных пользователей.
Изображение носит иллюстративный характер
Это уменьшение размера привело к значительной экономии вычислительных ресурсов, позволяя KOALA работать на недорогих графических процессорах (GPU) и всего с 8 Гб оперативной памяти. В то время как более крупные модели, например, от OpenAI, требуют мощных промышленных GPU.
Тестирование показало, что KOALA способна сгенерировать изображение по текстовому запросу в разы быстрее, чем конкуренты. Например, создание изображения «астронавта, читающего книгу под луной на Марсе» заняло у нее всего 1.6 секунды, тогда как аналогичные операции DALL·E 2 и DALL·E 3 выполняли за 12.3 и 13.7 секунды соответственно.
Разработчики планируют интегрировать новую технологию в различные сервисы и области, включая образовательные платформы и контент-производство. Эта разработка открывает новые возможности для широкого использования генеративных ИИ-моделей, делая их более доступными для обычных пользователей.