英伟达CUDA护城河,到底有多深?
激石Pepperstone(http://www.paraat.net/)报道:
从明天开始,Nvidia 将举办 GTC 开发者大会。这个盛会如今已成为业界关注的焦点。随着英伟达的崛起,许多人一直在问英伟达的软件在多大程度上为其硬件提供了持久的竞争护城河。由于我们收到了很多相关问题,因此我们想在此阐述我们的想法。
除了下一代B100 GPU的潜在发布之外,GTC 并不是真正的芯片盛会,GTC 是为开发者举办的展会。这是 Nvidia 围绕 CUDA 及其软件堆栈其他部分构建软件生态系统的旗舰活动。
值得注意的是,在谈论 Nvidia 时,包括我们自己在内的许多人倾向于使用“CUDA”作为 Nvidia 提供的所有软件的简写。这是一种误导,因为 Nvidia 的软件护城河不仅仅是 CUDA 开发层,这对于 Nvidia 捍卫其地位至关重要。
在去年的 GTC 上,该公司发布了 37 份新闻稿,其中涉及一系列令人眼花缭乱的合作伙伴、软件库和模型。随着英伟达加强防御,我们预计下周会出现更多这样的情况。
这些合作伙伴非常重要,因为现在有数百家公司和数百万开发人员在 Nvidia 的产品之上构建工具。一旦建成,这些人不太可能重建他们的模型和应用程序以在其他公司的芯片上运行,至少在短期内是这样。值得注意的是,英伟达的合作伙伴和客户遍布数十个垂直行业,虽然并非所有这些都全力支持英伟达,但它仍然表现出对英伟达有利的巨大势头。
简而言之,英伟达目前地位的防御能力取决于软件生态系统的固有惯性。公司投资于软件——编写代码、测试它、优化它、对员工进行软件使用教育等等——一旦进行了投资,他们将非常不愿意更换。
我们从过去十年来 Arm 生态系统进军数据中心的尝试中看到了这一点。即使基于 Arm 的芯片开始展现出相对于 x86 的真正功耗和性能优势,软件公司及其客户仍然需要数年时间才能采取行动,这一转变仍在进行中。英伟达似乎正处于建立这种软件优势的早期阶段。如果他们能够在广泛的企业中实现这一目标,他们很可能会坚持很多年。这最重要的是英伟达在未来的发展中处于最佳位置。
英伟达在其软件领域面临着巨大的进入壁垒。CUDA 是其中的重要组成部分,但即使 CUDA 的替代品出现,Nvidia 提供软件和库的方式也有利于他们构建一个非常可靠的生态系统。
我们指出这一切是因为我们开始看到 CUDA 的替代方案出现。AMD 在对 CUDA、ROCm 的回答上取得了很大进展。然而,当我们说进步时,我们的意思是他们现在拥有了一个良好的、可行的平台,但需要数年时间才能获得 CUDA 采用的份额。目前,ROCm 仅适用于少数 AMD 产品,而 CUDA 多年来一直适用于所有 Nvidia GPU。
其他替代方案,如 UXL 或 PyTorch 和 Triton 的不同组合,也同样有趣,但还处于早期阶段。UXL 看起来尤其有前途,因为它得到了一些业内知名人士的支持。当然,这也是其最大的弱点,因为这些成员的利益差异很大。
我们认为,如果英伟达能够站稳脚跟,那么这些都无关紧要。这就是我们需要区分 CUDA 和 Nvidia 软件生态系统的地方。业界将提出 CUDA 的替代方案,但这并不意味着他们可以完全消除 Nvidia 的软件进入壁垒。
话虽如此,英伟达软件护城河面临的最大威胁是其最大的客户。超大规模企业没有兴趣以任何方式锁定英伟达,而且他们有资源来构建替代方案。公平地说,他们也不能幸免于与 Nvidia 保持密切联系,它仍然是默认解决方案,并且仍然具有许多优势,但如果有人削弱 Nvidia 的软件雄心,那么很可能来自这个角落。
当然,这引发了一个问题:英伟达的软件野心到底是什么。
在过去的几年里,随着 Nvidia 推出其软件产品,包括其云服务 Omniverse,他们传达了一种感觉,即他们有雄心勃勃地创造其收入流的新组成部分。在最新的财报电话会议上,他们指出他们已经创造了 10 亿美元的软件收入。然而,最近,我们感觉到他们可能正在重新定位或稍微缩减这些雄心,软件现在被定位为他们向芯片客户提供的服务,而不是其本身的成熟收入部门。
毕竟,销售软件可能会让英伟达与其所有最大的客户直接竞争。
18年坚守,换来大爆发
根据《BBC》报导,英伟达的迅猛崛起就是大胆赌上自己的技术加上有良好的时机。
英伟达创立于1993年,现任英伟达CEO黄仁勋就是创办人之一,当时英伟达还是一家专注为电玩游戏和应用程式制作图像的公司。
1999年,英伟达研发出首款绘图芯片(GPU)GeForce256,来加强电脑的图像显示效果,当时以每股12美元的价格公开上市。
2006年,斯坦福大学的研究人员发现GPU有另一个用途:它可以加快数学运算,这是一般芯片无法做到的。同年,黄仁勋做出了AI发展上重要的决定:他投入英伟达的资源来建立一个让GPU可以编程的工具,让GPU不只是制作图像的工具,也就是CUDA(Compute Unified Device Architecture,统一计算架构)。
什么叫做CUDA?这是一套英伟达提供给开发人员的编程工具,让工程师能运用CUDA,省下大量撰写低阶语法的时间,进而直接使用高阶语法诸如C++或Java等来编写应用于通用GPU上的演算法,解决平行运算中复杂的问题。
对研究人员来说,这是一种在消费类硬件中进行高性能计算的新方法。
当18年前黄仁勋投资CUDA时,受到不少投资人看衰,现在2024年结果证明,这个选择造就了日后的两万亿美元市值。
根据《福布斯》指出,大多数的AI新创都奠基于英伟达的CUDA平台,英伟达的策略就是让平台衍生出庞大的软件生态,让后者难以突破。
2012年,一种可以将图像进行分类的人工智能Alexnet崭露头角,它使用了辉达其中两个可编程的GPU进行训练。
科学家们同时发现,GPU可以大幅加速神经网络的处理速度,并开始用在工作上。
英伟达透过投资更适合AI的GPU,以及让这项技术更容易使用的软件,来发挥自身优势。
然而,目前英伟达的主导地位看似稳固,但长远来说更难预测。
顾问公司TIRIAS Research的分析师克鲁威拉(Kevin Krewell)指出,英伟达背后有很多对手正急起直追。
举例来说,超微(AMD)和英特尔(Intel)都以制造中央处理器(CPU)闻名,但他们近期也投入制作AI专用的GPU,Google则开发出拥有AI运算能力的张量处理器( TPU),不仅可用于搜寻引擎,还可用在一些机器学习的工作上,微软和Meta也正着手开发中。
英伟达在加密货币的挖矿上也取得了成功,根据《华尔街日报》报导,随着加密货币价格上涨,英伟达在2020年的市值超越了芯片巨头英特尔,并在2021年底达到每股近330美元的纪录。
虽然近期加密货币寒冬降临, 分析师指出,AI的兴起将为英伟达带来比加密货币更繁荣的前景,瑞银分析师估计,光ChatGPT就需要约1万个英伟达的GPU。
英伟达设计但不制造自己的芯片,他们将生产的工作外包给芯片制造商,其中包括「护岛神山」台积电。
黄仁勋在2010年接受《纽约时报》的专访时指出,英伟达的核心价值包含两项要素,首先是「承担风险的容忍度」和「从失败中学习的能力」。他提到,在这个瞬息万变的世界中,「庆祝失败」是所有公司的重要元素,而第二个则是「知识的诚实」,能够直言不讳地指出公司或个人犯下的错误,并从中汲取教训,迅速调整。
黄仁勋说,英伟达的企业性格就是,你有好点子,以前也没有人做过,那就放手去尝试,如果失败了,就从中去学习和调整,每一次的失败都是一点点的进步。
黄仁勋就读高中时,也在玩电动的过程中学到不少。「当你尝试某些破关方式,却没有得到想要的结果时,你就重新再试一次,不知不觉就破关了!」
黄仁勋认为,就是因为玩电动,培养了尝试的能力,这也是日后创新和尝试新事物的养分之一。
黄仁勋也在专访中透露加入英伟达所需具备的特质,第一个是「要能爱上某样你感兴趣的东西」,他强调爱上某样东西的能力对成功人士来说非常重要。
第二个则是「冒险和犯错」的能力,不断去尝试,犯错了就从中学习,做出调整迎接下次挑战。
第三个则是「像孩子般去看待世界」,「如果我们做到会怎么样?」「该如何去做?」所有伟大的想法都肇基于此。