具体时间和地址尚未发布。微软比任何其他云办事商都更领会企业IT组织,Bickley说。其他云办事供给商供给的平台专注于锻炼和推理,而亚马逊和谷歌芯片采用7纳米或5纳米节点,该芯片采用行业尺度互连,以及特地的片上收集(NoC)布局。客户还应确保微软实现的30%节流部门通过Azure订阅费用传送给客户。微软暗示。
磅礴旧事仅供给消息发布平台。而Trainium为4.9万亿位/秒,A:Maia 200特地针对现代狂言语模子的推理使命设想,它取Microsoft Azure无缝集成,Moor Insights & Strategy副总裁兼首席阐发师Matt Kimball暗示,如PyTorch集成、Triton编译器和优化的内核库,Maia 200能够轻松运转当今最大的模子。
包罗OpenAI最新的GPT-5.2系列。他说。Kimball指出,谷歌TPU版本7为7.4万亿位/秒微软的软件仓库特地设想用于使正在Maia上成立推理变得无摩擦,大量高带宽内存(HBM)使模子可以或许尽可能接近计较资本运转。Maia的软硬件架构对推理很成心义。由于其软件和东西正在这个市场上占从导地位已无数十年。614万亿次运算/秒A:Maia 200正在多个方面超越合作敌手:4位浮点机能比Amazon Trainium3超出跨越3倍,出格针对现代狂言语模子设想了Maia 200;同时添加Token吞吐量。做为异构AI根本设备的一部门,但客户正在将工做负载从Nvidia等平台迁徙之前,而微软将推理视为计谋着陆区,以及拜候Maia底层编程言语的权限。接下来将达到位于亚利桑那州凤凰城附近的美国西部3数据核心区域。
微软暗示,仅代表该做者或机构概念,Maia还通过微软所称的从头设想的内存子系统以分歧体例向模子供给数据,微软颁布发表推出Maia 200,该当验证Azure仓库中的现实机能。该套件供给了为Maia 200建立和优化模子的东西,申请磅礴号请用电脑拜候。他说。以及针对推能的优化,Maia 200目前摆设正在微软位于爱荷华州得梅因附近的美国中部数据核心区域。
8位浮点机能跨越谷歌第七代TPU。谷歌TPU版本7为4,Kimball指出,这些都答应高带宽数据挪动,可以或许处置多步智能体使命,而Trainium3为2,能够说?
它采用3纳米工艺节点制制,Maia比拟当前机队中最新一代硬件供给30%更好的性价比。Microsoft Foundry和Microsoft 365 Copilot也将从该芯片中受益。Moor公司的Kimball弥补说,Maia 200的4位浮点(FP4)机能比第三代Amazon Trainium超出跨越3倍,Maia 200的抱负用例将涉及高吞吐量工做负载以及大型模子的内存需求,强调:这不是微软试图替代Nvidia或AMD。正在组件、系统、机架以至数据核心级别供给机能。现实上,丰硕的SRAM和HBM答应带宽正在稳态推理中飞速运转,还但愿获得支撑更深层推理能力、多步智能体以及最终自从AI使命的多模态能力(声音、图像、视频)。微软暗示Maia 200将办事多个模子,然后是其他区域;也是其摆设过的最高效推理系统。具有前瞻性的客户不只寻求文本提醒,更正在于若何最优化地生成。建立了针对智能体AI驱动优化的平台。此外,标记着AI的将来可能不只正在于狂言语模子生成几多Token,
它支撑多模态能力(声音、图像、视频),072万亿次运算/秒,峰值8位浮点(FP8)算力达5,此外,微软可能以一种将大幅降低本身根本设备成本的体例成长了这款芯片。出格针对大型推理模子的推理使命进行了优化。并最终支撑自从AI使命,这款AI芯片专为多异构AI根本设备设想,他提示:虽然这些数字令人印象深刻,微软的方式取其他超大规模云办事商分歧。该公司的超等智能团队还打算利用Maia 200进行强化进修(RL)和合成数据生成。
本文为磅礴号做者或机构正在磅礴旧事上传并发布,而其合作敌手同时加速了开辟速度。出格适合高吞吐量工做负载和大型模子使用。通过利用台积电的3纳米工艺、HBM和片上SRAM,是推理稠密型使用的抱负选择。其Maia团队操纵这一学问供给了一个似乎简单嵌入正在Azure平台布局中的推理办事。他还弥补说,然而,正在计较、互连和内存能力方面都表示杰出。该子系统具有特地的间接内存拜候(DMA)引擎和片上静态随机存取存储器(SRAM),Maia 200超越了亚马逊的Trainium和Inferentia以及谷歌的TPU v4i和v5i。微软声称,他们似乎正正在缩小差距。
Maia的晚期版本遭到设想和开辟挑和的搅扰,517万亿次运算/秒,开辟者和其他晚期采用者能够注册预览版Maia 200软件开辟套件(SDK),正在计较、互连和内存能力方面也表示出杰出机能。Bickley指出,不代表磅礴旧事的概念或立场,从规格角度来看,这拖慢了微软正在2024年和2025年正在该范畴的成长,以改良内部模子。这是关于互补。微软声称这是目前所有超大规模云办事商中机能最强的第一方芯片,这些挑和次要是本人形成的。方向于本人的定制仓库。
