Ssylka

Сможет ли DeepSeek обогнать Запад в гонке ИИ?

Успехи китайской компании DeepSeek в разработке эффективных ИИ-моделей вызывают интерес, однако за кулисами скрываются важные факторы. Несмотря на меньшие затраты вычислительных ресурсов при обучении, DeepSeek, возможно, достигла этого за счет значительных начальных инвестиций в вычислительную инфраструктуру. Доступ к большим кластерам ускорителей Nvidia в прошлом, вероятно, позволил компании эффективно экспериментировать и оптимизировать свои модели, однако экспортные ограничения на чипы со стороны США потенциально замедляют прогресс китайской ИИ-индустрии, ограничивая доступ к новейшим технологиям и, таким образом, препятствуя разработке крупномасштабных ИИ-систем.
Сможет ли DeepSeek обогнать Запад в гонке ИИ?
Изображение носит иллюстративный характер

Экспортные ограничения на передовые чипы, введенные США, хотя и имеют задержку во времени, в перспективе могут оказать существенное влияние на китайскую ИИ-экосистему. Эти ограничения не так сильно влияют на отдельные сеансы обучения, как на всю экосистему, включая развертывание ИИ-систем, производство обучающих данных, дистилляцию моделей и масштабирование. Проблема в том, что большая часть вычислительных ресурсов требуется именно на этапе развертывания и отладке, а не только на этапе обучения. В долгосрочной перспективе, китайским компаниям, возможно, будет сложно обновлять и расширять свои вычислительные мощности.

Ключевым фактором является не только доступ к чипам, но и объем доступной высокоскоростной памяти, необходимой для работы ИИ-моделей на этапе развертывания. Несмотря на ограничения на экспорт чипов, США все еще экспортируют чипы памяти H20, которые, хотя и имеют ограничения в обучении, отлично подходят для развертывания и обработки больших объемов данных. Этот аспект часто недооценивают, хотя он напрямую влияет на способность ИИ-систем функционировать в реальных условиях.

Важно также помнить, что эффективность алгоритмов машинного обучения со временем повышается, что позволяет небольшим игрокам, вроде DeepSeek, использовать меньше ресурсов для достижения сравнимых результатов. Однако, это также может означать, что компании с доступом к более мощным вычислительным кластерам смогут добиться более серьезных прорывов, что создаст еще большую разницу между китайскими и западными разработками в долгосрочной перспективе.


Новое на сайте

19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа 19149Как новая волна голосового фишинга в стиле ShinyHunters обходит многофакторную... 19148Почему баски стали главными пастухами Америки: врожденный дар или расовый миф? 19147Бывший инженер Google осужден за экономический шпионаж и передачу секретов искусственного... 19146Насколько критичны новые уязвимости SmarterMail и почему их немедленное исправление... 19145Истинный контроль и природа человеческого мастерства: от учения эпиктета до современной...