Ssylka

DeepSeek: доступный ИИ меняет правила игры

Китайская компания DeepSeek представила две новые модели, V3 и R1, которые демонстрируют конкурентоспособную производительность при относительно низких затратах. V3 создана всего за 5.5 миллионов долларов, что ставит под сомнение необходимость миллиардных инвестиций, которые ранее считались обязательными для разработки продвинутых ИИ.
DeepSeek: доступный ИИ меняет правила игры
Изображение носит иллюстративный характер

DeepSeek применяет ряд подходов для снижения затрат, включая оптимизированную архитектуру Mixture of Experts (MoE) и использование синтетических данных для обучения. Эти стратегии позволяют достичь хороших результатов, не требуя огромных вычислительных мощностей и ресурсов, что делает ИИ более доступным. Кроме того, использование открытых весов (open-weights) позволило DeepSeek опираться на наработки других проектов, включая LLaMa от М⃰, что значительно ускорило процесс разработки.

Модель DeepSeek R1 выделяется прозрачностью своего «мыслительного процесса». В отличие от моделей «черного ящика», R1 демонстрирует каждый шаг своих рассуждений, что ценно для исследований и разработки. Обе модели доступны для дообучения и адаптации, что открывает возможности для создания локальных решений, не требующих огромных вложений.

Несмотря на впечатляющие успехи, DeepSeek сталкивается с трудностями из-за высокой популярности, вызывающей перегрузку серверов. Пользователи, желающие получить доступ к моделям, могут испытывать затруднения. Кроме того, вопросы конфиденциальности данных остаются актуальными, поскольку компания базируется в Китае. Тем не менее, открытость моделей DeepSeek, по примеру LLaMa и Mistral, делает ИИ более доступным и потенциально может привести к снижению цен на ИИ-сервисы.


Новое на сайте

18302Можно ли предсказать извержение вулкана по его сейсмическому шёпоту? 18301Как случайное открытие позволило уместить радугу на чипе и решить проблему... 18300Визуальная летопись мира: триумфаторы 1839 Photography Awards 18299Загадка шагающих истуканов Рапа-Нуи 18298Двойное кометное зрелище украшает осеннее небо 18297Двигатель звездного роста: раскрыта тайна запуска протозвездных джетов 18296Нейробиология пробуждения: как мозг переходит от сна к бодрствованию 18295Как сервис для получения SMS-кодов стал оружием для мошенников по всему миру? 18294Сообщения в iOS 26: от ИИ-фонов до групповых опросов 18293Почему для исправления «техношеи» нужно укреплять мышцы, а не растягивать их? 18292Как новорожденная звезда подала сигнал из эпицентра мощнейшего взрыва? 18291Нотный рецепт: как наука превращает музыку в обезболивающее 18290Что превращает кофейное зерно в идеальный напиток? 18289Как пробуждение древних микробов и тайны черных дыр меняют наше будущее? 18288Как 3500-летняя крепость в Синае раскрывает секреты египетской военной мощи?