Китайский прорыв в ИИ: DeepSeek бросает вызов Кремниевой долине

Китайская компания DeepSeek, используя менее мощные чипы, смогла создать модели искусственного интеллекта, сравнимые по производительности с разработками американских лидеров, таких как OpenAI и Google. Это достижение ставит под сомнение целесообразность огромных инвестиций западных IT-гигантов в передовые полупроводники.
Китайский прорыв в ИИ: DeepSeek бросает вызов Кремниевой долине
Изображение носит иллюстративный характер

Модели DeepSeek демонстрируют впечатляющую производительность, войдя в первую десятку мирового рейтинга чат-ботов. Примечательно, что обучение одной из новейших моделей DeepSeek обошлось в 5,6 миллиона долларов, в то время как аналогичные разработки могут стоить от 100 миллионов до 1 миллиарда долларов. Компания также делает свой код открытым и доступным, что позволяет другим разработчикам его модифицировать.

DeepSeek применяет уникальный подход к обучению, отказываясь от предварительной «донастройки» экспертными знаниями и делая акцент на обучении с подкреплением. Это позволило ей достичь значительных успехов в решении сложных математических и логических задач, сравнимых с моделями, использующими более традиционные методы.

Несмотря на успехи, у DeepSeek есть и слабые стороны. В частности, её модели подвержены цензуре, связанной с китайской политической повесткой, и уступают конкурентам в способности поддерживать долгий контекст беседы. Тем не менее, DeepSeek представляет собой серьезного игрока на рынке ИИ, который демонстрирует, что прорывные технологии могут развиваться и без огромных затрат и передовых чипов.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка