Китайская компания DeepSeek, используя менее мощные чипы, смогла создать модели искусственного интеллекта, сравнимые по производительности с разработками американских лидеров, таких как OpenAI и Google. Это достижение ставит под сомнение целесообразность огромных инвестиций западных IT-гигантов в передовые полупроводники.
Модели DeepSeek демонстрируют впечатляющую производительность, войдя в первую десятку мирового рейтинга чат-ботов. Примечательно, что обучение одной из новейших моделей DeepSeek обошлось в 5,6 миллиона долларов, в то время как аналогичные разработки могут стоить от 100 миллионов до 1 миллиарда долларов. Компания также делает свой код открытым и доступным, что позволяет другим разработчикам его модифицировать.
DeepSeek применяет уникальный подход к обучению, отказываясь от предварительной «донастройки» экспертными знаниями и делая акцент на обучении с подкреплением. Это позволило ей достичь значительных успехов в решении сложных математических и логических задач, сравнимых с моделями, использующими более традиционные методы.
Несмотря на успехи, у DeepSeek есть и слабые стороны. В частности, её модели подвержены цензуре, связанной с китайской политической повесткой, и уступают конкурентам в способности поддерживать долгий контекст беседы. Тем не менее, DeepSeek представляет собой серьезного игрока на рынке ИИ, который демонстрирует, что прорывные технологии могут развиваться и без огромных затрат и передовых чипов.
Изображение носит иллюстративный характер
Модели DeepSeek демонстрируют впечатляющую производительность, войдя в первую десятку мирового рейтинга чат-ботов. Примечательно, что обучение одной из новейших моделей DeepSeek обошлось в 5,6 миллиона долларов, в то время как аналогичные разработки могут стоить от 100 миллионов до 1 миллиарда долларов. Компания также делает свой код открытым и доступным, что позволяет другим разработчикам его модифицировать.
DeepSeek применяет уникальный подход к обучению, отказываясь от предварительной «донастройки» экспертными знаниями и делая акцент на обучении с подкреплением. Это позволило ей достичь значительных успехов в решении сложных математических и логических задач, сравнимых с моделями, использующими более традиционные методы.
Несмотря на успехи, у DeepSeek есть и слабые стороны. В частности, её модели подвержены цензуре, связанной с китайской политической повесткой, и уступают конкурентам в способности поддерживать долгий контекст беседы. Тем не менее, DeepSeek представляет собой серьезного игрока на рынке ИИ, который демонстрирует, что прорывные технологии могут развиваться и без огромных затрат и передовых чипов.