Ssylka

Может ли экономичный ИИ конкурировать с гигантами?

Китайская компания DeepSeek произвела фурор в индустрии искусственного интеллекта, разработав модели, которые по производительности не уступают GPT-4 и Claude, но требуют гораздо меньше вычислительных ресурсов и затрат. Их подход заключается в переосмыслении основных принципов: вместо использования 32-битных чисел они применяют 8-битные, что снижает потребление памяти на 75%. Кроме того, их архитектура Multi-token Prediction позволяет обрабатывать фразы целиком, а не по словам, что вдвое ускоряет процесс.
Может ли экономичный ИИ конкурировать с гигантами?
Изображение носит иллюстративный характер

DeepSeek использует «мультиэкспертный подход», применяя специализированные ИИ-сети, которые активируются только при необходимости, в отличие от традиционных моделей, где все параметры активны постоянно. Затраты на обучение их моделей составляют всего $5 млн по сравнению со $100 млн у конкурентов, а количество необходимых GPU сократилось с 100 000 до 2 000. При этом для работы подходят даже игровые GPU, а стоимость API снижена на 95%.

Этот прорыв ставит под угрозу бизнес-модель компаний, которые полагаются на продажу дорогостоящих графических процессоров. Теперь разработчикам больше не нужны огромные дата-центры, что открывает доступ к созданию ИИ для более широкого круга людей. DeepSeek предлагает бесплатные приложения и чат-бот, который свободно общается на русском языке.

В итоге разработка ИИ становится доступнее, конкуренция усиливается, требования к «железу» снижаются, а затраты сокращаются. Модели DeepSeek, как показывают тесты, дают более полные ответы, чем аналоги, и доступны для пользователей из стран, где другие аналоги ограничены.


Новое на сайте

18785Древние пчелы использовали кости мертвых грызунов для создания многоуровневых гнезд 18784Как устроен обнаруженный учеными навигационный «тумблер» в мозгу и поможет ли он в... 18783Что скрывали под водой руины солнечного храма фараона ниусера и обнаруженный там... 18782Что рассказала астрономам самая далекая сверхновая GRB 250314A? 18781Как злоумышленники захватывают облака AWS для майнинга всего за 10 минут? 18780Космическая бабочка региона Idaeus Fossae как доказательство водного прошлого Марса 18779Феноменальный взлет стартапа Mercor до оценки в 10 миллиардов долларов за счет... 18778Внедрение защиты данных и конфиденциальности непосредственно в процесс написания... 18777Критический обход аутентификации SAML SSO в устройствах Fortinet FortiGate под активной... 18776Критическая уязвимость React2Shell открывает глобальный доступ к Linux-серверам 18775Анализ старейшей лодки Скандинавии выявил отпечаток пальца и происхождение захватчиков 18774Наследие Атакамского космологического телескопа и подтверждение главного кризиса... 18773Популярное расширение Urban VPN тайно похищает переписки миллионов пользователей с ИИ 18772Зачем древние жители Швеции утопили собаку с костяным кинжалом в ходе загадочного ритуала... 18771Почему концепция «троянского коня» является ключом к успешному захвату внимания в...