Меню

Может ли экономичный ИИ конкурировать с гигантами?

Максимус

Китайская компания DeepSeek произвела фурор в индустрии искусственного интеллекта, разработав модели, которые по производительности не уступают GPT-4 и Claude, но требуют гораздо меньше вычислительных ресурсов и затрат. Их подход заключается в переосмыслении основных принципов: вместо использования 32-битных чисел они применяют 8-битные, что снижает потребление памяти на 75%. Кроме того, их архитектура Multi-token Prediction позволяет обрабатывать фразы целиком, а не по словам, что вдвое ускоряет процесс.
Может ли экономичный ИИ конкурировать с гигантами?

Может ли экономичный ИИ конкурировать с гигантами?

Изображение носит иллюстративный характер

DeepSeek использует «мультиэкспертный подход», применяя специализированные ИИ-сети, которые активируются только при необходимости, в отличие от традиционных моделей, где все параметры активны постоянно. Затраты на обучение их моделей составляют всего $5 млн по сравнению со $100 млн у конкурентов, а количество необходимых GPU сократилось с 100 000 до 2 000. При этом для работы подходят даже игровые GPU, а стоимость API снижена на 95%.

Этот прорыв ставит под угрозу бизнес-модель компаний, которые полагаются на продажу дорогостоящих графических процессоров. Теперь разработчикам больше не нужны огромные дата-центры, что открывает доступ к созданию ИИ для более широкого круга людей. DeepSeek предлагает бесплатные приложения и чат-бот, который свободно общается на русском языке.

В итоге разработка ИИ становится доступнее, конкуренция усиливается, требования к «железу» снижаются, а затраты сокращаются. Модели DeepSeek, как показывают тесты, дают более полные ответы, чем аналоги, и доступны для пользователей из стран, где другие аналоги ограничены.

Источник: Полина Лааксо

← Предыдущее в разделе Следующее в разделе →

Вверх

Новое на сайте

Почему Anthropic не может закрыть дыру в Claude for Chrome уже восемь версий подряд?

Как школьный обход блокировок превратился в оружие против нищего сервера медицинского...

Joomla получила две дыры с максимальным баллом опасности — и обе уже эксплуатировались до...

Grok Build тайно копировал целые репозитории разработчиков — история коммитов, секреты и...

Почему центру кибербезопасности нужны два разных мозга?

Кошельки для криптовалют выдают своих владельцев, даже не будучи взломанными

Как за год взломали Salesforce, ни разу не тронув саму платформу?

Почему подпись Microsoft десятилетней давности всё ещё открывает двери в чужую систему?

CrashStealer: как вредонос для macOS прошёл проверку Apple, спрятавшись за легальной...

Расширение с 1,6 миллиона установок хранило в себе спящий сборщик истории браузера

Меню

МенюЗакрыть