当前位置:首页 > 外汇资讯 > 正文内容

可商业化,最强开源文本生成代码模型!Code Llama重磅发布

激石外汇2023-08-25 12:04:26外汇资讯291

激石Pepperstone(http://www.paraat.net/)报道:

8月25日凌晨,全球社交、科技巨头Meta(Facebook、Instagram等母公司)在官网正式开源了,文本生成代码模型Code Llama。

据悉,Code Llama是基于Meta前不久发布的,最强开源大语言模型Llama 2之上开发而成,提供基础代码、专门针对Python开发和基于自然语言指令微调的,70亿、130亿、340亿三种参数模型。允许企业、个人开发者使用此模型,进行商业化。

Meta表示,Code Llama在代码任务上的表现,优于目前所有开源代码模型。Code Llama支持 Python、C++、Java、PHP、Typescript (Javascript)、C#和Bash等主流编程语言,可根据自然文本或代码直接生成代码,例如,给我写一个斐波那契序列函数的代码。

Code Llama简单介绍

Code Llama是基于Llama 2大语言模型,再通过特定代码数据预训练、微调而成。除了支持文本或代码生成代码之外,还可用于代码的调试并支持目前所有主流开发语言。

Code Llama提供70亿、130亿和340亿三种参数模型,每个模型都使用了5000亿tokens代码数据训练而成。基础模型和指令模型经过了中间填充文本 (FIM) 功能的训练,允许将代码插入到现有代码中,这意味着它们可以支持开箱即用的代码完成任务。

Code Llama 模型提供了高达100,000 个上下文标记的稳定生成。所有模型均在 16,000 个标记的序列上进行训练,并在最多100,000 个标记的输入上显示出改进。

这意味着,开发人员在进行大型代码模型测试、调优时,可以将其全部输入到Code Llama中进行测试。

Code Llama还针对Python编程推出了Code Llama Python模型。是在 Python 代码的 1000亿标记上进行微调。

Python是代码生成方面最具基准测试的语言,并且Python 和 PyTorch 在AI 社区中发挥着重要作用,所以,推出了针对Python的代码模型。

Code LlamaInstruct 是 Code Llama 针对自然文本指令微调的模型,该模型支持自然文本输入和输出。

如果你想使用文本生成代码,Meta建议你使用该模型,因为Code LlamaInstruct已经过数据微调理解自然文本更好并且生成的代码更符合开发人员要求。

资源消耗方面,70亿参数模型可在单个GPU上运行。340亿参数模型可返回最佳结果并提供更好的编程辅助,但资源消耗更大。

所以,对于个人开发者、中小型企业来说,70亿、130亿参数的模型效率更高、资源消耗更少,适合低延迟的任务,例如,进行实时代码开发。

Code Llama性能评测

为了针对现有解决方案测试 Code Llama 的性能,Meta使用了两个流行的编码基准:HumanEval 和 Mostly Basic Python 编程 (MBPP)。

HumanEval 测试模型根据文档字符串完成代码的能力,MBPP测试模型根据描述编写代码的能力。

测试结果显示,Code Llama的表现优于开源、特定代码的Llama,并且优于 Llama 2。例如,Code Llama 340亿参数模型在 HumanEval上得分为 53.7%,在 MBPP 上得分为 56.2%,与ChatGPT性能相当。         

扫描二维码推送至手机访问。

版权声明:本文由激石Pepperstone发布,如需转载请注明出处。

本文链接:http://www.paraat.net/news/2089.html

分享给朋友:

“可商业化,最强开源文本生成代码模型!Code Llama重磅发布” 的相关文章

痛骂原油巨头“赚的比上帝多”,拜登再发声:他们这么敏感吗?这么容易受伤害?

激石Pepperstone(http://www.paraat.net/)报道:美国汽油价格不断飙升之际,美国总统拜登正想尽各种办法控制国内汽油价格,最近他“热衷”于批评国内能源企业贪得无厌,除了直接给7家炼油公司的高管写信,拜登还不断想新招比如强制生产配额、暴利税、设定价格上限等措施,拜登还称本周...

数据公布前,美元指数在104.00低位震荡

  美元指数回吐周四部分涨幅,交易于104.20附近。  美国国债收益率周五早盘反弹乏力。  稍后公布新屋销售和密歇根大学消费者信心指数终值。  衡量美元兑一篮子主要货币走势的美元指数(DXY)在本周结束前重回下跌区域约104.20附近。  受风险偏好影响,美元指数表现疲弱,重点关注数据  美元指数...

华尔街见闻早餐FM-Radio|2022年6月25日

华尔街见闻早餐FM-Radio|2022年6月25日

激石Pepperstone(http://www.paraat.net/)报道: 北欧豪华进口七座SUV沃尔沃XC90邀您一起收听见闻早餐。  市场概述 欢呼加息预期退烧,标普创两年最大涨幅,标普纳指涨超3%,道指涨超800点,扭转三周连跌。Meta涨超7%、所在板块涨近4%,特斯拉一周涨13...

激石Pepperstone:对于海外股市,“坏经济”是“利好”了?

激石Pepperstone(http://www.paraat.net/)报道:“(经济)坏消息就是(股市)好消息,”金融危机后的几年里流行的这一说法再度盛行起来。 过去一个月的大部分时间里,分析师们一直在重复这句话: 咨询公司Evelyn Partners分析师Ben Seager Scott:...

本周的OPEC+会议毫无悬念,但问题是“增产到底做不做得到”

激石Pepperstone(http://www.paraat.net/)报道:本周原油市场的焦点无疑是OPEC大会——第184届OPEC大会举行将于29日(周三)举行,而第30届OPEC和非OPEC产油国部长级会议将按原定日程30日(周四)举行,以商讨下一阶段增产计划。 在即将召开的会议上,市场普...

连DUV都要禁?!

激石Pepperstone(http://www.paraat.net/)报道:为全力遏制正在崛起的中国半导体行业,美国已向荷兰政府施压,要求全球最大的光刻机企业阿斯麦公司(ASML)扩大对中国的禁售范围。彭博社在6日的报道中称,如果美国胁迫成功,中芯国际和华虹半导体等中国芯片制造商可能会因此受到沉...