挑战英伟达!科技巨头成立联盟,制定AI加速器连接标准
激石Pepperstone(http://www.paraat.net/)报道:
英特尔、谷歌、微软、Meta以及其他科技巨头周四宣布成立一个新的行业组织——“Ultra Accelerator Link (UALink) 推广组”,意在制定行业标准,领导数据中心中AI加速器芯片之间连接组件的发展,挑战英伟达在AI加速器一家独大的地位。
联合制定AI加速器连接标准,挑战英伟达
除以上公司外,该组织成员还包括AMD、惠普企业、博通和思科等,Arm尚未参加。UALink推广组正在提出一项新的行业标准,以连接日益增多的服务器中的AI加速器芯片。
“行业需要一个可以快速推进的开放标准,这种标准允许多家公司为整个生态系统增加价值,”AMD数据中心解决方案总经理Forrest Norrod表示。“行业需要一个允许创新快速进行且不受任何单一公司限制的标准。”
广义上讲,AI加速器是指GPU及其他定制设计的解决方案,用于加速AI模型的训练、微调和运行的芯片。UALink提议的标准版本一,UALink 1.0,将连接多达1024个GPU AI加速器,组成一个计算“集群”(pod),意指服务器中的一个或多个机架。根据UALink推广组的说法,基于包括AMD的Infinity Fabric在内的“开放标准”,UALink 1.0将允许AI加速器所附带的内存之间的直接加载和存储,并且与现有互连规范相比,总体上将提高速度,同时降低数据传输延迟,。
该组织表示,将在第三季度创建一个名为UALink的联盟,以监督UALink规范的发展。UALink 1.0将在同一时间段内向加入联盟的公司提供,而带有更高带宽的迭代版规范UALink 1.1,预计将在2024年第四季度推出。Norrod表示,第一批UALink产品将在“未来几年内”推出。
英伟达:不想参加,也没必要
分析认为,由于明显缺少了当今最大的AI加速器生产商英伟达,该组织的成立就是为了挑战英伟达在AI领域一家独大的地位。目前,英伟达AI加速器的市场占有率估计在80%到95%。
目前英伟达对此事未予置评,但很明显,该公司并不热衷于支持UALink。分析认为,英伟达已经为数据中心服务器内的GPU链接提供了自己的专有互连技术,所以可能不太愿意支持基于竞争对手技术的规范。
而且,英伟达在AI领域的地位和影响力非常强大。在最近一个财季,英伟达的数据中心销售额(包括AI芯片销售)同比增长超过400%。如果继续保持当前的轨迹,英伟达今年将有可能超越苹果,成为全球市值第二高的公司。
因此,英伟达不想参与,也不必参与UALink。
而另一个尚未加入的大公司则是亚马逊。分析认为,亚马逊可能处于“观望”模式,因为该公司也在不断发展自己的内部加速器硬件努力。AWS也可能认为,与供应其客户大量GPU的英伟达对抗没有太大的战略意义。
微软、Meta、谷歌最有动力
分析认为,除了AMD和英特尔,UALink的最大受益者似乎是微软、Meta和谷歌,这三家公司总计已经花费了数十亿美元购买英伟达的GPU,以支持其云服务并训练其不断增长的AI模型。它们都希望摆脱英伟达作为AI硬件生态系统供应商过于强势的局面。
在最近的一份报告中,Gartner估计,今年服务器中使用的AI加速器的价值将达到210亿美元,到2028年将增加到330亿美元。与此同时,Gartner预计,到2025年AI芯片的收入将达到334亿美元。
谷歌有用于训练和运行AI模型的定制芯片——TPU和Axion。亚马逊拥有几个AI芯片家族。微软去年也加入了这场竞争,推出了Maia和Cobalt。而Meta则在不断完善自己的加速器产品线。
此外,据报道,微软及其密切合作伙伴OpenAI计划在超级计算机上投资1000亿美元,用于训练配备未来版本的Cobalt和Maia芯片的AI模型。而这些芯片需要某种方式连接——也许这就是UALink的用途。