Сможет ли DeepSeek обогнать Запад в гонке ИИ?

Успехи китайской компании DeepSeek в разработке эффективных ИИ-моделей вызывают интерес, однако за кулисами скрываются важные факторы. Несмотря на меньшие затраты вычислительных ресурсов при обучении, DeepSeek, возможно, достигла этого за счет значительных начальных инвестиций в вычислительную инфраструктуру. Доступ к большим кластерам ускорителей Nvidia в прошлом, вероятно, позволил компании эффективно экспериментировать и оптимизировать свои модели, однако экспортные ограничения на чипы со стороны США потенциально замедляют прогресс китайской ИИ-индустрии, ограничивая доступ к новейшим технологиям и, таким образом, препятствуя разработке крупномасштабных ИИ-систем.
Сможет ли DeepSeek обогнать Запад в гонке ИИ?
Изображение носит иллюстративный характер

Экспортные ограничения на передовые чипы, введенные США, хотя и имеют задержку во времени, в перспективе могут оказать существенное влияние на китайскую ИИ-экосистему. Эти ограничения не так сильно влияют на отдельные сеансы обучения, как на всю экосистему, включая развертывание ИИ-систем, производство обучающих данных, дистилляцию моделей и масштабирование. Проблема в том, что большая часть вычислительных ресурсов требуется именно на этапе развертывания и отладке, а не только на этапе обучения. В долгосрочной перспективе, китайским компаниям, возможно, будет сложно обновлять и расширять свои вычислительные мощности.

Ключевым фактором является не только доступ к чипам, но и объем доступной высокоскоростной памяти, необходимой для работы ИИ-моделей на этапе развертывания. Несмотря на ограничения на экспорт чипов, США все еще экспортируют чипы памяти H20, которые, хотя и имеют ограничения в обучении, отлично подходят для развертывания и обработки больших объемов данных. Этот аспект часто недооценивают, хотя он напрямую влияет на способность ИИ-систем функционировать в реальных условиях.

Важно также помнить, что эффективность алгоритмов машинного обучения со временем повышается, что позволяет небольшим игрокам, вроде DeepSeek, использовать меньше ресурсов для достижения сравнимых результатов. Однако, это также может означать, что компании с доступом к более мощным вычислительным кластерам смогут добиться более серьезных прорывов, что создаст еще большую разницу между китайскими и западными разработками в долгосрочной перспективе.


Новое на сайте

19188Критическая уязвимость в решениях BeyondTrust спровоцировала глобальную волну кражи... 19187Эволюция угроз: атака на цепочку поставок ИИ-ассистента Cline CLI через уязвимость... 19186Как фальшивая проверка Cloudflare в кампании ClickFix скрыто внедряет новый троян... 19185Почему гендерно-нейтральные корпоративные политики становятся главным инструментом... 19184Как искусственный интеллект уничтожил временной зазор между обнаружением уязвимости и... 19183Банковский троян Massiv маскируется под IPTV для захвата контроля над Android 19182Как шпионская кампания CRESCENTHARVEST использует социальную инженерию для кражи данных... 19181Как критическая уязвимость в телефонах Grandstream открывает хакерам доступ к... 19180Почему операционная непрерывность становится единственным ответом на перманентную... 19179Критические уязвимости в популярных расширениях VS Code угрожают миллионам разработчиков 19178Как внедрить интеллектуальные рабочие процессы и почему 88% проектов ИИ терпят неудачу? 19177Критическая уязвимость нулевого дня в Dell RecoverPoint открывает злоумышленникам полный... 19176Notepad++ внедряет механизм двойной блокировки для защиты от атак группировки Lotus Panda 19175Новые угрозы в каталоге CISA: от критических дыр в Chrome и Zimbra до возвращения червя... 19174Использование чат-ботов Copilot и Grok в качестве скрытых прокси-серверов для управления...
Ссылка