Ssylka

DeepSeek: доступный ИИ меняет правила игры

Китайская компания DeepSeek представила две новые модели, V3 и R1, которые демонстрируют конкурентоспособную производительность при относительно низких затратах. V3 создана всего за 5.5 миллионов долларов, что ставит под сомнение необходимость миллиардных инвестиций, которые ранее считались обязательными для разработки продвинутых ИИ.
DeepSeek: доступный ИИ меняет правила игры
Изображение носит иллюстративный характер

DeepSeek применяет ряд подходов для снижения затрат, включая оптимизированную архитектуру Mixture of Experts (MoE) и использование синтетических данных для обучения. Эти стратегии позволяют достичь хороших результатов, не требуя огромных вычислительных мощностей и ресурсов, что делает ИИ более доступным. Кроме того, использование открытых весов (open-weights) позволило DeepSeek опираться на наработки других проектов, включая LLaMa от М⃰, что значительно ускорило процесс разработки.

Модель DeepSeek R1 выделяется прозрачностью своего «мыслительного процесса». В отличие от моделей «черного ящика», R1 демонстрирует каждый шаг своих рассуждений, что ценно для исследований и разработки. Обе модели доступны для дообучения и адаптации, что открывает возможности для создания локальных решений, не требующих огромных вложений.

Несмотря на впечатляющие успехи, DeepSeek сталкивается с трудностями из-за высокой популярности, вызывающей перегрузку серверов. Пользователи, желающие получить доступ к моделям, могут испытывать затруднения. Кроме того, вопросы конфиденциальности данных остаются актуальными, поскольку компания базируется в Китае. Тем не менее, открытость моделей DeepSeek, по примеру LLaMa и Mistral, делает ИИ более доступным и потенциально может привести к снижению цен на ИИ-сервисы.


Новое на сайте

18791Почему на склоне холма в Линкольншире был зарыт уникальный клад англосаксонского золота? 18790Почему «снежная каша» в недрах титана может оказаться лучшим местом для жизни, чем... 18789Почему истинное понимание сложных когнитивных функций мозга требует выхода науки за... 18788Шерстяная одежда жертв Везувия оживила споры о дате гибели Помпей 18787Способна ли контекстная киберразведка превратить работу SOC из реагирования на инциденты... 18786Тысячи пользователей Firefox стали жертвами скрытой вредоносной кампании GhostPoster 18785Древние пчелы использовали кости мертвых грызунов для создания многоуровневых гнезд 18784Как устроен обнаруженный учеными навигационный «тумблер» в мозгу и поможет ли он в... 18783Что скрывали под водой руины солнечного храма фараона ниусера и обнаруженный там... 18782Что рассказала астрономам самая далекая сверхновая GRB 250314A? 18781Как злоумышленники захватывают облака AWS для майнинга всего за 10 минут? 18780Космическая бабочка региона Idaeus Fossae как доказательство водного прошлого Марса 18779Феноменальный взлет стартапа Mercor до оценки в 10 миллиардов долларов за счет... 18778Внедрение защиты данных и конфиденциальности непосредственно в процесс написания... 18777Критический обход аутентификации SAML SSO в устройствах Fortinet FortiGate под активной...