当前位置:首页 > 外汇资讯 > 正文内容

重磅!GPT-3.5 Turbo推出微调功能,可以打造专属ChatGPT啦!

激石外汇2023-08-23 12:01:20外汇资讯262

激石Pepperstone(http://www.paraat.net/)报道:

8月23日凌晨,OpenAI在官网宣布,推出GPT-3.5 Turbo微调功能并更新API,使企业、开发人员可以使用自己的数据,结合业务用例构建专属ChatGPT。GPT-4的微调功能将于今年秋天推出。

OpenAI表示,从早期测试数据来看,GPT-3.5 Turbo 的微调版本在某些特定任务上,其性能可以匹配甚至超越GPT-4 的基本功能。(详细说明文档:https://platform.openai.com/docs/guides/fine-tuning)

微调功能是目前企业应用大语言模型的主要方法,例如,法律领域的Spellbook、律商联讯、Litera、Casetext等,他们通过自己积累的海量法律数据在GPT-4模型上进行微调、预训练构建法律领域的专属ChatGPT,使其回答的内容更加聚焦、安全、准确。

自GPT-3.5 Turbo发布以来,开发人员和企业希望能够开发自定义大模型,为用户创造独特、差异化的产品体验。现在,OpenAI终于开放了此功能,使得人人都能打造独一无二的专属ChatGPT。

什么是微调

大语言模型的微调(Fine-tuning)是一种在预训练模型的基础上,对特定任务进行深度训练的方法。

微调的基本思想是,先在大规模文本数据上预训练一个大型的语言模型,例如,GPT-3.5,然后,使用特定任务的数据集(如法律、医疗),进一步对模型进行训练,以适应特定的任务。在这个过程中,模型的参数会进行微小的调整,使其在特定业务场景上的性能更好。

例如,如果我们有一个预训练的GPT3.5模型,想让它在法律业务上的表现更好、更专业,可以用海量法律数据集对模型进行微调。

经过微调,模型学习到如何更好地解读、生成和预测法律问题。

微调用例

根据OpenAI的官方微调说明文档,列出了以下常见用例:

  • 设置风格、基调、格式等;
  • 提高输出的可靠性;
  • 纠正未能遵循复杂提示的问题;
  • 以特定方式处理多个边缘内容;
  • 改进可操纵性;
  • 执行难以在提示中阐明的新技能或任务。

例如,改进可操纵性,微调功能允许企业使模型更好地遵循指令,使输出简洁或始终以特定语言进行响应。例如,开发人员可以使用微调来确保模型,在提示使用德语时始终以德语进行响应

除了提高性能之外,微调使企业能够缩短提示时间同时保证性能。GPT-3.5-Turbo微调还可以处理4k tokens,是OpenAI之前微调模型的两倍。

早期测试人员通过对模型本身的指令进行微调,将提示大小减少了高达 90%,从而加快了每个API调用的速度并降低了成本。

如何进行微调

1,准备数据,创建一组多样化的演示对话,类似于要求模型在实际输出中的对话。数据集中的每个示例都应该与OpenAI的聊天完成 API 格式相同的对话,特别是消息列表,其中每条消息都有角色、内容和可选名称。

2,上传文件

3,创建微调作业,使用 OpenAI SDK开始进行大规模数据训练、微调。训练模型可能需要几分钟或几小时,具体取决于模型和数据集大小。模型训练完成后,创建微调作业的用户将收到一封确认电子邮件。

除了创建微调作业外,开发者还可以列出现有作业、检索作业状态或取消作业。

4,使用微调模型,微调作业完成后模型可以投入使用了。

在某些情况下,用户的微调模型可能需要几分钟才能准备好处理请求。如果对模型的请求超时或找不到模型名称,可能是因为模型仍在加载中,可在几分钟后重试。

微调定价

微调分为初始训练成本和使用成本两大部分。

训练:0.008 美元/1K tokens。

使用输入:0.012 美元/1K tokens。

使用输出:0.016 美元/1K tokens。

例如,一个GPT-3.5 Turbo包含 100,000 个okens的训练文件并训练3个epoch的微调作业的预期成本为2.40美元。

 

本文来源:AIGC开放社区,原文标题:《重磅!GPT-3.5 Turbo推出微调功能,可以打造专属ChatGPT啦!》

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

扫描二维码推送至手机访问。

版权声明:本文由激石Pepperstone发布,如需转载请注明出处。

本文链接:http://www.paraat.net/news/2072.html

分享给朋友:

“重磅!GPT-3.5 Turbo推出微调功能,可以打造专属ChatGPT啦!” 的相关文章

年内就停止加息?疫情战神Ackman称市场又误会了鲍威尔

年内就停止加息?疫情战神Ackman称市场又误会了鲍威尔

激石Pepperstone(http://www.paraat.net/)报道:美东时间6月23日周四纽约尾盘,10年期美债收益率下探3%整数位心理关口,下跌6.91个基点,报3.0870%;在美联储主席鲍威尔众议院听证会开始后跌至日低3.0016%。 同日,亿万富翁对冲基金经理、潘兴广场资本管理创...

华为造车的三条路

华为造车的三条路

激石Pepperstone(http://www.paraat.net/)报道:2022年7月4日,问界M7发布 揭示了华为造车的三条路: 1、零部件供应模式,本质是Tier 1; 2、解决方案集成HI模式,本质是Tier 0.5; 3、智选车模式,本质是Tier 0。 为了研究智能电车时...

AI能run出first in class新药吗?

AI能run出first in class新药吗?

激石Pepperstone(http://www.paraat.net/)报道:2020年11月30日,人工智能程序AlphaFold2在蛋白质结构预测大赛CASP 14中,取得了与冷冻电镜解析结果几乎难以辨别的超高原子水平的精确度,引起药物研发领域的广泛关注,创业融资潮此起彼伏。全球也已经有数十款...

住房市场降温!美国房租高增长戛然而止

激石Pepperstone(http://www.paraat.net/)报道:夏季往往是美国租金高峰,但随着飙升的通胀和经济衰退前景不断“侵蚀”美国人的支出能力,美国租赁市场出现显著降温。 美国长租平台Zumper提供的数据显示,美国6月份全国一居室公寓的租金中值同比飙升11.4%,但环比增幅仅为...

央行连续五天逆回购30亿元

央行连续五天逆回购30亿元

激石Pepperstone(http://www.paraat.net/)报道:今日,中国央行进行30亿元7天期逆回购操作,中标利率为2.10%,与此前持平。今日100亿元逆回购到期。 本周中国央行进行150亿元逆回购操作,因本周有4000亿元逆回购到期,本周实现净回笼3850亿元。 制表:华尔街...

特斯拉跌落王座

特斯拉跌落王座

激石Pepperstone(http://www.paraat.net/)报道: 作者 | 周智宇 编辑 | 张晓玲 3月,特斯拉柏林工厂,马斯克潇洒地跳起了他的魔性舞步。然而没过多久,他就开始懊恼:它们就是在烧钱! 炙手可热的马斯克和他的特斯拉,在2022年的这个夏天,遭遇了供应链中断、产能滑坡,...