当前位置:首页 > 外汇资讯 > 正文内容

GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5

激石外汇2024-06-21 12:03:17外汇资讯178

激石Pepperstone(http://www.paraat.net/)报道:

6月20日周四,OpenAI竞争对手Anthropic发布了公司迄今为止性能最强大的AI模型Claude 3.5 Sonnet。

在覆盖阅读、编程、数学和视觉等领域的多项性能测试中,Claude 3.5 Sonnet的性能略胜一筹,吊打GPT-4o等一众竞争对手的AI模型,且优于自家旗舰模型Claude 3 Opus。当然,也有些测试不能完全反映AI在现实运用的情况,偏小众和个例。

Anthropic的产品负责人Michael Gerstenhaber自信表示道:“对企业来说,重要的是AI是否能帮助他们满足业务需求,而不是AI在性能测试中是否具有竞争力,从这个角度来看,我相信Claude 3.5 Sonnet将领先于我们现有的任何其他产品,也领先于行业中的任何其他产品。”

定价方面,新模型定价与前代3 Sonnet模型相同,即每输入百万token为3美元,每生成百万token为15美元,并具有20万个token的上下文窗口,约合15万个单词。Token是数据的细分单元,例如单词“fantastic”中的“fan”、“tas”和“tic”。

现在,用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型,而订阅了Claude Pro和Claude Team的用户将享受5倍的速率限制。此外,新模型也在Anthropic的API以及亚马逊Bedrock和谷歌云的Vertex AI等托管平台上上线。

今年晚些时候,公司还将推出更大更好的模型,如Claude 3.5 Haiku和Claude 3.5 Opus。后者配备有网络搜索和偏好记忆等功能。

最强视觉模型、速度提升两倍、幽默感增加、内容迭代功能

和前一代模型Claude 3 Opus相比,新模型在多个方面实现了性能上的提升。Anthropic在一篇博客中写道:“它在把握细微差别、幽默和复杂指示方面有显著进步,在以自然、合理的语气撰写高质量内容方面也十分出色。此外,它还可以编写、编辑和执行代码。”

例如,与3 Opus相比,Claude 3.5 Sonnet在理解复杂指令和细微差别方面更为出色,甚至能够更好地把握幽默概念,尽管AI在幽默感方面通常表现不佳。

对于需要快速响应的应用程序,如客户服务聊天机器人,3.5 Sonnet的处理速度是Claude 3 Opus的两倍,成本只有其五分之一。

视觉分析方面,3.5 Sonnet能够更准确地解读图表和图形,并能从存在失真和视觉伪影的“不完美”图像中转录文本。

除了新模型的推出,Anthropic还推出了新功能“Artifacts预览版”,这是一个工作空间,允许用户能够编辑和迭代AI模型生成的内容。

想象一下,你在使用一个AI助手来帮你写代码。当你向AI提出你的要求后,AI会生成一段代码。在Artifacts功能中,这段代码不仅仅是显示给你,而是会以一种可以操作和修改的形式出现在你的界面上,就像是一个“工件”或是一个“草稿”。

接下来,你可以对这段代码进行迭代——也就是说,你可以修改它,增加新的功能,或者和 AI 助手“Claude”交流,告诉它你的修改意见或新的需求。AI 会根据你的反馈再次生成代码,你则可以继续这个过程,直到代码达到你的期望,可以被实际运行。

这个过程就像是你和AI一起合作,不断地打磨和完善最终的产品。Artifacts提供了一个平台,让你能够更容易地与AI模型互动,并且对生成的内容进行有效的管理和优化。

目前Artifacts处于预览阶段,Anthropic计划在未来为其增加新功能,比如支持与大型团队协作和知识库存储。

此外,媒体称,Claude 3.5 Sonnet虽然是一个先进的AI模型,但它并不完美,仍然可能会犯错。尽管如此,它的能力可能足以吸引开发者和企业转向Anthropic的平台。毕竟,这才是对Anthropic最重要的。

模型改进部分归功于训练数据,但来源不明

Anthropic的产品负责人Michael Gerstenhaber表示,这些改进归功于模型架构的调整和新的训练数据(包括AI生成的数据)至于具体是哪些数据带来了这些增强?Gerstenhaber没有透露详细信息。

出于保护商业机密和避免法律挑战的考虑,训练数据的具体细节尚未公开,但Claude 3.5 Sonnet和公司以往AI模型一样,经过了大量文本和图像的训练,并通过人类测试人员的反馈,试图让模型与用户的意图“保持一致”,希望以此防止模型生成有害或有问题的文本。

目前法院尚未做出裁决,即Anthropic等供应商及其竞争对手(如 OpenAI、谷歌、亚马逊等)是否有权使用公共数据(包括受版权保护的数据)进行训练,而无需向这些数据的创作者提供补偿。

网友怎么看?

网友们社交媒体X上发帖表示:

“Claude 3.5 Sonnet是最新推出的最佳LLM模型!刚刚为ChatGPT Plus支付了20美元,现在我必须为Claude支付20美元,我的聊天记录怎么办?这些LLM战争才刚刚开始。”

“来自Anthropic的竞争很激烈,但我希望ChatGPT能够与之匹敌甚至更好,因为迁移到新服务需要成本。”

“Anthropic刚刚发布了Claude 3.5 Sonnet,据介绍性能可以说相当于Anthropic最高级型号大模型Claude 3 Opus,而API收费价格与Claude 3 Sonnet相同,作为默认的免费体验AI已经替换了Claude 3 Sonnet。也就是,现在就可以免费用上这个最好性能的AI了。”

新模型对Anthropic和AI生态系统有何意义?

今年3月,Anthropic推出了Claude 3系列模型。随后,OpenAI在5月份推出了GPT-4o。6月20日Anthropic又推出了Claude 3.5家族的第一款模型“Claude 3.5 Sonnet”。

媒体指出,在AI技术的不断演进中,Anthropic公司的Claude 3.5 Sonnet模型虽未带来翻天覆地的变化,却代表了AI模型发展的现阶段现实:在期待重大科研突破的同时,实现逐步的性能提升,即在等待重大研究突破的同时,持续进行小步快跑。

近几个月,包括谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o在内的旗舰产品,仅在基准测试和性能上实现了小幅提升。由于现有模型架构的局限性和训练所需的巨大计算资源,业界尚未再次见证类似从GPT-3到GPT-4的巨大飞跃。

随着生成性AI供应商将重点转向数据整理和许可,投资者对于生成性AI投资回报的预期变得更加审慎。Anthropic得益于亚马逊(以及谷歌的较小程度支持)的有利位置,相对免受这种压力的影响。然而,Anthropic预计到2024年底的营收仅略低于10亿美元,与OpenAI相比仍有较大差距。

Anthropic拥有包括Bridgewater、Brave、Slack和DuckDuckGo等知名品牌在内的不断增长的客户群,但在企业信誉方面仍有提升空间。值得注意的是,普华永道最近选择与OpenAI合作,而非Anthropic,以向企业转售生成性AI产品。

Anthropic意识到,随着模型之间能力差距的缩小,建立一个围绕模型构建生态系统(而不是孤立的模型)是留住客户的关键。

一方面,为了留住客户,Anthropic在加强工具开发。比如允许开发人员深入控制AI模型的内部功能,以及让AI模型能够在应用程序中执行特定的操作。这些工具包括前面提到的Artifacts。

另一方面,公司在扩展团队和市场。Anthropic聘请了Instagram的联合创始人作为产品负责人,这表明公司在产品开发方面的重视。此外,公司在伦敦和都柏林设立了办公室,这有助于扩大其产品的市场覆盖。

当然,成本也很重要。Anthropic产品负责人Michael Gerstenhaber表示:“当你在构建应用程序时,最终用户不需要关心背后使用的模型或优化细节,而工程师则可以利用工具来优化体验,其中成本是一个重要因素。”         

扫描二维码推送至手机访问。

版权声明:本文由激石Pepperstone发布,如需转载请注明出处。

本文链接:http://www.paraat.net/news/3212.html

分享给朋友:

“GPT-4o不香了?OpenAI竞争对手Anthropic发布最强大AI模型Claude 3.5” 的相关文章

全部通过压力测试,美国银行业又要“撒钱”了

激石Pepperstone(http://www.paraat.net/)报道:美国银行业又要“撒钱”了! 6月23日周四,美联储公布的美国银行业“年度健康检查”结果显示,其审核的所有银行均通过2022年压力测试。这意味着所有银行均满足最低资本要求,可以继续进行回购和派息。 美联储报告指出: 在压...

美最高法院推翻“罗诉韦德案”裁决,约半数州或宣布堕胎非法或严格限制,拜登称“悲剧性错误”

激石Pepperstone(http://www.paraat.net/)报道:美国最高法院推翻“罗诉韦德案”裁决 当地时间6月24日,美国最高法院推翻了“罗诉韦德案”裁决。这项裁决曾在1973年实现了美国堕胎合法化。 最高法院的这项最新裁决将赋予各州制定堕胎法的权力,预计几乎一半的州将宣布堕胎为非...

疫苗行业进入地狱模式

疫苗行业进入地狱模式

激石Pepperstone(http://www.paraat.net/)报道:从前,疫苗赛道是环形的,周围被城堡所护卫。 有前置壁垒,竞争不充分,以致技术长期停留在me-worse阶段,发展阶段滞后于创新药。 忽然,护城河消失,遍地都是玩家,几乎找不到不拥挤的地方。创新药经历的同质化痛苦,疫苗...

经济日报评论:新能源不是20年前的房地产

激石Pepperstone(http://www.paraat.net/)报道: 在近日举行的2022年新能源汽车产业链投资年会上,有经济学家表示,当下新能源相关的产业是未来最有希望、最具爆发力的领域。从长远看,当下不投新能源,就像20年前没买房。这种观点似乎点燃了投资者的热情,本处于反弹阶段的A...

危险信号:美国消费支出降温 衰退担忧越来越大

危险信号:美国消费支出降温 衰退担忧越来越大

激石Pepperstone(http://www.paraat.net/)报道:通胀和利率走高正在侵蚀美国人的消费能力,一场美联储极力想要避免的衰退正变得迫在眉睫。 美国商务部周四公布的数据显示,该国5月份消费者支出环比增幅降至0.2%,这是今年最小的月度涨幅,低于预期值0.4%,也低于4月份修正后...

A股冲高回落!锂电股上冲 电力、稀土震荡走强 食品饮料、猪肉股疲软

A股冲高回落!锂电股上冲 电力、稀土震荡走强 食品饮料、猪肉股疲软

激石Pepperstone(http://www.paraat.net/)报道:7月5日周二,三大指数高开后冲高回落。其中创业板指一度涨逾1%,随后下行翻绿。 截至发稿,沪指涨0.10%,深成指跌0.45%,创业板指跌0.55%。 盘面上,锂电板块活跃,电力、稀土震荡走强,煤炭板块走高,旅游酒店、...