AI的“安卓时刻”:开源大模型正在追上谷歌和ChatGPT
激石Pepperstone(http://www.paraat.net/)报道:
今年2月,Meta发布开源大语言模型LLaMA,开启AI“安卓时刻”。
几周之内,学术界的一些学者就将这些模型转化为开源软件,为ChatGPT和其他专有人工智能软件的免费替代品提供动力。
据The Information周一报道,加州大学伯克利分校计算机科学教授Ion Stoica表示,免费的AI模型现在在性能上“相当接近”谷歌和ChatGPT开发商OpenAI的专有模型,大多数软件开发人员最终将选择使用免费的模型。据悉,Stoica利用Meta的技术帮助开发了一个关键的AI开源模型。
这让人想起不久前谷歌的一份泄密文件,谷歌研究员在这份泄密文件中坦言,谷歌没有护城河,OpenAI也是如此,与开源AI竞争将难以占据优势。
文件中提到:
“虽然我们的模型在质量上仍有一点优势,但差距正在以令人惊讶的速度迅速缩小。开源模型训练速度更快,可定制性更强,更私密,而且比同类产品能力更出色。他们正在用100美元和130亿的参数做一些谷歌1000万美元和540亿的参数难以企及的事情,而且在短短几周内就能做到,而不是几个月。”
这也就是说,如果以上都为真,开源人工智能可能会颠覆谷歌、OpenAI、微软和其他出售专有模型使用权的公司的商业模式。
分析称,开源人工智能可以让任何人以低廉的成本获得强大的人工智能工具,Meta也可从中获得回报。
专注于专有模型可能会落后
Stoica是使用Meta的研究开发Vicuna的学者之一,Vicuna是一种开源语言理解模型,于今年3月发布。Vicuna的质量和开源AI的快速发展促使谷歌高级工程师Luke Sernau在泄密文件中警告同事,他们的公司在追赶OpenAI的过程中专注于专有模型可能会落后。
他说,对于用户而言,如果有一个没有使用限制、免费、高质量的替代品,谁还会为谷歌的产品付费呢?他还说,开源AI的开发正在“掠夺我们”,并补充说“谷歌应该让自己成为开源社区的领导者”,并“放弃对我们模型的一些控制权”。
这份泄密文件引起了整个行业的共鸣,包括一些谷歌员工,尽管该文件的论点可能夸大了开源人工智能的能力,低估了它的成本和其他风险,但大多数AI从业者都同意泄密文件的结论之一,即Meta将从发布其模型中获益。Meta在内部使用AI模型进行内容推荐和广告定位,随着开发人员改进Meta发布的模型,Meta将能够将这些改进整合到其内部AI中。
谷歌并没有对AI软件采取完全专有的方法。早在ChatGPT出现之前的2020年,它就发布了一个开源语言模型T5,使开发人员能够构建可以完成翻译和摘要等任务的软件。谷歌随后还发布了一个更高级的版本,Flan-T5。但据Stoica和其他从业人员说,Meta发布的软件使谷歌的模型得到了重大改进,这使得工程师们更有可能选择基于Meta软件的模型。
报道:OpenAI的开源语言模型也要来
据一位知情人士透露,不止是Meta,谷歌的主要AI竞争对手OpenAI也正准备向公众发布一种新的开源语言模型,该计划此前从未被报道过。
目前尚不清楚OpenAI即将推出的开源软件,是否会抢走使用Meta模型开发的软件的风头。但分析称,它不太可能发布一款能与它正在销售的专有模型GPT竞争的模型。OpenAI 270亿美元的私人估值取决于未来,尽管GPT的前两个版本是开源的,但GPT4不是开源的。
像Vicuna这样的开源模型训练成本低至几百美元,让用户可以选择避免向软件提供商支付昂贵的费用。结果是,最近几周,开源替代品激增。
除了基于Meta软件的Vicuna等模型外,工程师还可以从德国非营利组织LAION以及Databricks和Stability AI等初创公司中选择其他模型。Stoica创建了一个网站,试图评估那些开源模型与专有模型(如OpenAI的GPT-4)的质量。
Stoica说,与开源软件相比,谷歌仍然有两个优势。1、如果谷歌利用其大量的用户数据,它的模型可以更好地用于某些特殊目的,例如内容推荐。2、谷歌在管理大型计算机基础设施方面的专业知识意味着它将能够以更低的成本运行AI软件模型,包括用于其云客户。
与此同时,OpenAI在从数百万人与ChatGPT交互的方式中收集数据方面取得了领先,这无疑有助于它改进AI软件,而且OpenAI与微软达成了一项私下协议,可以使用微软的计算基础设施。
但开源AI模型将允许更多公司使用专有数据自行解决问题。Stoica说,例如,一家航空公司可以使用其数百万客户服务电话的数据来创建自动响应。彭博社在3月份宣布,该媒体使用其数据来训练一种更善于理解金融信息的机器学习模型。