Сможет ли DeepSeek обогнать Запад в гонке ИИ?

Успехи китайской компании DeepSeek в разработке эффективных ИИ-моделей вызывают интерес, однако за кулисами скрываются важные факторы. Несмотря на меньшие затраты вычислительных ресурсов при обучении, DeepSeek, возможно, достигла этого за счет значительных начальных инвестиций в вычислительную инфраструктуру. Доступ к большим кластерам ускорителей Nvidia в прошлом, вероятно, позволил компании эффективно экспериментировать и оптимизировать свои модели, однако экспортные ограничения на чипы со стороны США потенциально замедляют прогресс китайской ИИ-индустрии, ограничивая доступ к новейшим технологиям и, таким образом, препятствуя разработке крупномасштабных ИИ-систем.
Сможет ли DeepSeek обогнать Запад в гонке ИИ?
Изображение носит иллюстративный характер

Экспортные ограничения на передовые чипы, введенные США, хотя и имеют задержку во времени, в перспективе могут оказать существенное влияние на китайскую ИИ-экосистему. Эти ограничения не так сильно влияют на отдельные сеансы обучения, как на всю экосистему, включая развертывание ИИ-систем, производство обучающих данных, дистилляцию моделей и масштабирование. Проблема в том, что большая часть вычислительных ресурсов требуется именно на этапе развертывания и отладке, а не только на этапе обучения. В долгосрочной перспективе, китайским компаниям, возможно, будет сложно обновлять и расширять свои вычислительные мощности.

Ключевым фактором является не только доступ к чипам, но и объем доступной высокоскоростной памяти, необходимой для работы ИИ-моделей на этапе развертывания. Несмотря на ограничения на экспорт чипов, США все еще экспортируют чипы памяти H20, которые, хотя и имеют ограничения в обучении, отлично подходят для развертывания и обработки больших объемов данных. Этот аспект часто недооценивают, хотя он напрямую влияет на способность ИИ-систем функционировать в реальных условиях.

Важно также помнить, что эффективность алгоритмов машинного обучения со временем повышается, что позволяет небольшим игрокам, вроде DeepSeek, использовать меньше ресурсов для достижения сравнимых результатов. Однако, это также может означать, что компании с доступом к более мощным вычислительным кластерам смогут добиться более серьезных прорывов, что создаст еще большую разницу между китайскими и западными разработками в долгосрочной перспективе.


Новое на сайте

19209Как беспрецедентный бунт чернокожих женщин в суде Бостона разрушил планы рабовладельцев? 19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран... 19200Как простое открытие репозитория в Claude Code позволяет хакерам получить полный контроль... 19199Зачем киберсиндикат SLH платит женщинам до 1000 долларов за один телефонный звонок в... 19198Устранение слепых зон SOC: переход к доказательной сортировке угроз для защиты бизнеса 19197Скрытые бэкдоры в цепочках поставок по: атаки через вредоносные пакеты NuGet и npm 19196Как абсолютная самоотдача, отказ от эго и физиологическое переосмысление тревоги помогают... 19195Отказ от стратегии гладиаторов как главный драйвер экспоненциального роста корпораций
Ссылка