Корпорация Microsoft представила свою новейшую аппаратную разработку — чип-ускоритель искусственного интеллекта под названием Maia 200. Данное устройство классифицируется как оборудование, предназначенное преимущественно для инференса ИИ, то есть для обеспечения работы систем, которые делают прогнозы, предоставляют ответы и генерируют результаты, а не для первичного обучения моделей. Ключевым заявлением производителя стало утверждение, что новый чип в три раза мощнее конкретного оборудования конкурентов, что делает его серьезным игроком на рынке вычислительных мощностей.

Технические характеристики Maia 200 демонстрируют исключительную производительность. Ускоритель обеспечивает более 10 петафлопс (10 в 15-й степени операций с плавающей запятой в секунду) при использовании 4-битной точности (FP4) и 5 петафлопс при стандартной 8-битной точности (FP8). Формат FP4 обеспечивает высокую степень сжатия данных и энергоэффективность, хотя и с меньшей точностью по сравнению с FP8. Кристалл, произведенный компанией TSMC по 3-нанометровому техпроцессу, содержит 100 миллиардов транзисторов.
Архитектура устройства включает специализированную систему памяти, предназначенную для локального хранения весов моделей ИИ и данных, что существенно снижает потребность в дополнительном оборудовании. Чип разработан для быстрой и бесшовной интеграции в существующие дата-центры. Согласно данным Microsoft, такая эффективность позволяет добиться повышения производительности на доллар на 30% по сравнению с текущими системами.
В прямом сравнении с конкурентами Maia 200 показывает значительное превосходство. В операциях с точностью FP4 чип работает в три раза эффективнее процессора Trainium третьего поколения от Amazon. Кроме того, при использовании формата FP8 производительность новинки превышает показатели TPU седьмого поколения от Google. Эти данные позиционируют Microsoft как лидера в сегменте специализированного оборудования для инференса.
На текущий момент оборудование уже развернуто в центральном регионе дата-центров Microsoft в США. Спектр применения чипов широк: от генерации синтетических данных и обучения с подкреплением для улучшения больших языковых моделей (LLM) следующего поколения до обеспечения работы Microsoft Foundry и помощника Microsoft 365 Copilot. Один узел системы обладает мощностью, достаточной для запуска самых крупных современных моделей, и имеет запас производительности для будущих разработок.
Скотт Гатри, исполнительный вице-президент группы Cloud and AI в Microsoft, определяет целевую аудиторию продукта, включающую пользователей Azure OpenAI, ученых, разработчиков и корпорации. В будущем планируется расширение доступности чипов для клиентов через облачную платформу Azure, а также рассматривается возможность создания автономных серверных стеков.
Внедрение Maia 200 несет прямые выгоды как для специалистов, так и для конечных пользователей. Разработчики получат увеличенную пропускную способность и скорость при работе с GPT-4 и проведении масштабных исследований, таких как моделирование погодных явлений или биологических систем. Для обычных пользователей это означает более быстрый отклик системы и появление продвинутых функций в Windows и Copilot, хотя в краткосрочной перспективе это не изменит повседневное использование интернета радикально, так как оборудование является серверным.
Выход чипа происходит на фоне активных дискуссий о роли искусственного интеллекта в цифровом пространстве. Аналитики и журналисты поднимают вопросы о том, как «ИИ может навсегда изменить то, как мы используем Интернет», предполагая сценарий, где сеть превратится «не столько в город-призрак, сколько в зомби-апокалипсис». Одновременно с этим исследователи заявляют, что «GPT-4 прошел тест Тьюринга», и отмечают тревожную тенденцию: «чем более продвинутыми становятся модели ИИ, тем лучше им удается обманывать нас — они даже знают, когда их тестируют».

Изображение носит иллюстративный характер
Технические характеристики Maia 200 демонстрируют исключительную производительность. Ускоритель обеспечивает более 10 петафлопс (10 в 15-й степени операций с плавающей запятой в секунду) при использовании 4-битной точности (FP4) и 5 петафлопс при стандартной 8-битной точности (FP8). Формат FP4 обеспечивает высокую степень сжатия данных и энергоэффективность, хотя и с меньшей точностью по сравнению с FP8. Кристалл, произведенный компанией TSMC по 3-нанометровому техпроцессу, содержит 100 миллиардов транзисторов.
Архитектура устройства включает специализированную систему памяти, предназначенную для локального хранения весов моделей ИИ и данных, что существенно снижает потребность в дополнительном оборудовании. Чип разработан для быстрой и бесшовной интеграции в существующие дата-центры. Согласно данным Microsoft, такая эффективность позволяет добиться повышения производительности на доллар на 30% по сравнению с текущими системами.
В прямом сравнении с конкурентами Maia 200 показывает значительное превосходство. В операциях с точностью FP4 чип работает в три раза эффективнее процессора Trainium третьего поколения от Amazon. Кроме того, при использовании формата FP8 производительность новинки превышает показатели TPU седьмого поколения от Google. Эти данные позиционируют Microsoft как лидера в сегменте специализированного оборудования для инференса.
На текущий момент оборудование уже развернуто в центральном регионе дата-центров Microsoft в США. Спектр применения чипов широк: от генерации синтетических данных и обучения с подкреплением для улучшения больших языковых моделей (LLM) следующего поколения до обеспечения работы Microsoft Foundry и помощника Microsoft 365 Copilot. Один узел системы обладает мощностью, достаточной для запуска самых крупных современных моделей, и имеет запас производительности для будущих разработок.
Скотт Гатри, исполнительный вице-президент группы Cloud and AI в Microsoft, определяет целевую аудиторию продукта, включающую пользователей Azure OpenAI, ученых, разработчиков и корпорации. В будущем планируется расширение доступности чипов для клиентов через облачную платформу Azure, а также рассматривается возможность создания автономных серверных стеков.
Внедрение Maia 200 несет прямые выгоды как для специалистов, так и для конечных пользователей. Разработчики получат увеличенную пропускную способность и скорость при работе с GPT-4 и проведении масштабных исследований, таких как моделирование погодных явлений или биологических систем. Для обычных пользователей это означает более быстрый отклик системы и появление продвинутых функций в Windows и Copilot, хотя в краткосрочной перспективе это не изменит повседневное использование интернета радикально, так как оборудование является серверным.
Выход чипа происходит на фоне активных дискуссий о роли искусственного интеллекта в цифровом пространстве. Аналитики и журналисты поднимают вопросы о том, как «ИИ может навсегда изменить то, как мы используем Интернет», предполагая сценарий, где сеть превратится «не столько в город-призрак, сколько в зомби-апокалипсис». Одновременно с этим исследователи заявляют, что «GPT-4 прошел тест Тьюринга», и отмечают тревожную тенденцию: «чем более продвинутыми становятся модели ИИ, тем лучше им удается обманывать нас — они даже знают, когда их тестируют».