Ssylka

Как быстро запустить DeepSeek LLM локально?

DeepSeek выпустила мощные LLM, включая R1 и ее дистилляты, превосходящие OpenAI по бенчмаркам. Для локального запуска можно использовать дистиллированные версии моделей, например, DeepSeek-R1-Distill-Qwen-32B, которая, как говорят, превосходит O1-mini, или более компактные варианты 7b Qwen и 8b Llama.
Как быстро запустить DeepSeek LLM локально?
Изображение носит иллюстративный характер

Для запуска потребуется Linux, видеокарта NVIDIA, Docker и Python. Модели, представленные в формате GGUF, совместимы с llama.cpp, обеспечивая быстрый и удобный инференс. Веса моделей можно скачать с помощью hf_transfer, выбрав нужные файлы из репозитория.

Готовый Docker-контейнер упрощает запуск: необходимо указать путь к моделям. Llama.cpp также предлагает базовый UI, позволяющий тестировать модели, сохраняя историю общения и настройки. Скорость инференса на 2080 Ti составит примерно 103 токена в секунду для начального промпта и около 8 токенов в секунду при генерации длинного текста для 7B модели.

Также возможно использование LM Studio на Windows для тестирования квантованных моделей, хотя и с меньшей производительностью. Преимущество подхода с llama.cpp заключается в возможности развертывания на сервере для командной работы и последующего использования в продакшене на более мощном железе.


Новое на сайте

18607Золотой распад кометы ATLAS C/2025 K1 18606Секретный бренд древнего Рима на стеклянных шедеврах 18605Смогут ли чипсы без искусственных красителей сохранить свой знаменитый вкус? 18604Является ли рекордная скидка на Garmin Instinct 3 Solar лучшим предложением ноября? 18603Могла ли детская смесь ByHeart вызвать национальную вспышку ботулизма? 18602Готовы ли банки доверить агентскому ИИ управление деньгами клиентов? 18601Как сезонные ветры создают миллионы загадочных полос на Марсе? 18600Как тело человека превращается в почву за 90 дней? 18599Как ваш iPhone может заменить паспорт при внутренних перелетах по США? 18598Мозговой шторм: что происходит, когда мозг отключается от усталости 18597Раскрыта асимметричная форма рождения сверхновой 18596Скидки Ninja: как получить идеальную корочку и сэкономить на доставке 18595Почему работа на нескольких работах становится новой нормой? 18594Записная книжка против нейросети: ценность медленного мышления 18593Растущая брешь в магнитном щите земли