Ssylka

Может ли экономичный ИИ конкурировать с гигантами?

Китайская компания DeepSeek произвела фурор в индустрии искусственного интеллекта, разработав модели, которые по производительности не уступают GPT-4 и Claude, но требуют гораздо меньше вычислительных ресурсов и затрат. Их подход заключается в переосмыслении основных принципов: вместо использования 32-битных чисел они применяют 8-битные, что снижает потребление памяти на 75%. Кроме того, их архитектура Multi-token Prediction позволяет обрабатывать фразы целиком, а не по словам, что вдвое ускоряет процесс.
Может ли экономичный ИИ конкурировать с гигантами?
Изображение носит иллюстративный характер

DeepSeek использует «мультиэкспертный подход», применяя специализированные ИИ-сети, которые активируются только при необходимости, в отличие от традиционных моделей, где все параметры активны постоянно. Затраты на обучение их моделей составляют всего $5 млн по сравнению со $100 млн у конкурентов, а количество необходимых GPU сократилось с 100 000 до 2 000. При этом для работы подходят даже игровые GPU, а стоимость API снижена на 95%.

Этот прорыв ставит под угрозу бизнес-модель компаний, которые полагаются на продажу дорогостоящих графических процессоров. Теперь разработчикам больше не нужны огромные дата-центры, что открывает доступ к созданию ИИ для более широкого круга людей. DeepSeek предлагает бесплатные приложения и чат-бот, который свободно общается на русском языке.

В итоге разработка ИИ становится доступнее, конкуренция усиливается, требования к «железу» снижаются, а затраты сокращаются. Модели DeepSeek, как показывают тесты, дают более полные ответы, чем аналоги, и доступны для пользователей из стран, где другие аналоги ограничены.


Новое на сайте

19098Тихая пандемия: четыре ключевых тренда в борьбе с устойчивостью к антибиотикам 19097Где можно будет наблюдать «затмение века» и ближайшие полные солнечные затмения? 19096Может ли высыхание озер ускорить раскол африканской тектонической плиты? 19095Возрождение Google Glass и новая эра AI Glasses: стратегия 2026 года и уроки прошлого 19094Телескоп Джеймс Уэбб раскрыл тайны происхождения жизни в туманности улитка 19093Загадка лунной иллюзии и нейробиологические причины искажения восприятия размера 19092Древние фракийцы почитали собачье мясо как ритуальный деликатес 19091О чем расскажет уникальный инструмент из кости слона возрастом 480 000 лет? 19090Спонтанное формирование личности искусственного интеллекта на основе потребностей и... 19089Почему появление миллиона гуманоидных роботов Optimus угрожает нашей способности понимать... 19088Почему наш мозг намеренно скрывает от нас собственный нос? 19087Почему CISA экстренно внесла критическую уязвимость VMware vCenter Server в каталог... 19086Почему наука окончательно отвергла ледниковую теорию перемещения камней Стоунхенджа? 19085Превращение легального IT-инструментария в бэкдор через фишинговую кампанию Greenvelope 19084CISA обновляет каталог KEV четырьмя критическими уязвимостями с директивой по устранению...