Как быстро запустить DeepSeek LLM локально?

DeepSeek выпустила мощные LLM, включая R1 и ее дистилляты, превосходящие OpenAI по бенчмаркам. Для локального запуска можно использовать дистиллированные версии моделей, например, DeepSeek-R1-Distill-Qwen-32B, которая, как говорят, превосходит O1-mini, или более компактные варианты 7b Qwen и 8b Llama.
Как быстро запустить DeepSeek LLM локально?
Изображение носит иллюстративный характер

Для запуска потребуется Linux, видеокарта NVIDIA, Docker и Python. Модели, представленные в формате GGUF, совместимы с llama.cpp, обеспечивая быстрый и удобный инференс. Веса моделей можно скачать с помощью hf_transfer, выбрав нужные файлы из репозитория.

Готовый Docker-контейнер упрощает запуск: необходимо указать путь к моделям. Llama.cpp также предлагает базовый UI, позволяющий тестировать модели, сохраняя историю общения и настройки. Скорость инференса на 2080 Ti составит примерно 103 токена в секунду для начального промпта и около 8 токенов в секунду при генерации длинного текста для 7B модели.

Также возможно использование LM Studio на Windows для тестирования квантованных моделей, хотя и с меньшей производительностью. Преимущество подхода с llama.cpp заключается в возможности развертывания на сервере для командной работы и последующего использования в продакшене на более мощном железе.


Новое на сайте

19584Загадка письменности индской цивилизации 19583Хайнаньский заяц обнаружен спустя 40 лет — но уже мёртвым 19582Монте-Верде: древнейшая стоянка южной Америки оказалась моложе, чем считалось? 19581Зачем природа 32 раза «переизобретала» аппендикс? 19580Почему кельтских «воинов» похоронили так странно у школы в Дижоне? 19579Могут ли вирусы в кишечнике спасти нас от скачков сахара в крови? 19578Как извилистая река превратилась в самую охраняемую границу Америки? 19577Аномальная жара на западе США и спор вокруг Монте-Верде 19576Может ли одна неделя изменить климат, историю, медицину и физику одновременно? 19575Бактерия из кишечника помогла мышам стать сильнее 19574Третья почка: мужчина пришёл лечить инфекцию, а нашёл лишний орган 19573Все пять «букв» днк нашли на астероиде рюгу — что это говорит о происхождении жизни? 19572Пушечное ядро из-под земли Аламо: что нашли археологи за день до 190-летия легендарной... 19571Может ли ИИ сбежать из лаборатории и начать зарабатывать сам на себя?
Ссылка