重磅!GPT-3.5 Turbo推出微调功能,可以打造专属ChatGPT啦!
8月23日凌晨,OpenAI在官网宣布,推出GPT-3.5Turbo微调功能并更新API,使企业、开发人员可以使用自己的数据,结合业务用例构建专属ChatGPT。GPT-4的微调功能将于今年秋天推出。
OpenAI表示,从早期测试数据来看,GPT-3.5Turbo 的微调版本在某些特定任务上,其性能可以匹配甚至超越GPT-4的基本功能。(详细说明文档:https://platform.openai.com/docs/guides/fine-tuning)
微调功能是目前企业应用大语言模型的主要方法,例如,法律领域的Spellbook、律商联讯、Litera、Casetext等,他们通过自己积累的海量法律数据在GPT-4模型上进行微调、预训练构建法律领域的专属ChatGPT,使其回答的内容更加聚焦、安全、准确。
自GPT-3.5Turbo发布以来,开发人员和企业希望能够开发自定义大模型,为用户创造独特、差异化的产品体验。现在,OpenAI终于开放了此功能,使得人人都能打造独一无二的专属ChatGPT。
什么是微调
大语言模型的微调(Fine-tuning)是一种在预训练模型的基础上,对特定任务进行深度训练的方法。
微调的基本思想是,先在大规模文本数据上预训练一个大型的语言模型,例如,GPT-3.5,然后,使用特定任务的数据集(如法律、医疗),进一步对模型进行训练,以适应特定的任务。在这个过程中,模型的参数会进行微小的调整,使其在特定业务场景上的性能更好。
例如,如果我们有一个预训练的GPT3.5模型,想让它在法律业务上的表现更好、更专业,可以用海量法律数据集对模型进行微调。
经过微调,模型学习到如何更好地解读、生成和预测法律问题。
微调用例
根据OpenAI的官方微调说明文档,列出了以下常见用例:
设置风格、基调、格式等;
提高输出的可靠性;
纠正未能遵循复杂提示的问题;
以特定方式处理多个边缘内容;
改进可操纵性;
执行难以在提示中阐明的新技能或任务。
例如,改进可操纵性,微调功能允许企业使模型更好地遵循指令,使输出简洁或始终以特定语言进行响应。例如,开发人员可以使用微调来确保模型,在提示使用德语时始终以德语进行响应。
除了提高性能之外,微调使企业能够缩短提示时间同时保证性能。GPT-3.5-Turbo微调还可以处理4ktokens,是OpenAI之前微调模型的两倍。
早期测试人员通过对模型本身的指令进行微调,将提示大小减少了高达90%,从而加快了每个API调用的速度并降低了成本。
如何进行微调
1,准备数据,创建一组多样化的演示对话,类似于要求模型在实际输出中的对话。数据集中的每个示例都应该与OpenAI的聊天完成 API 格式相同的对话,特别是消息列表,其中每条消息都有角色、内容和可选名称。
2,上传文件
3,创建微调作业,使用 OpenAI SDK开始进行大规模数据训练、微调。训练模型可能需要几分钟或几小时,具体取决于模型和数据集大小。模型训练完成后,创建微调作业的用户将收到一封确认电子邮件。
除了创建微调作业外,开发者还可以列出现有作业、检索作业状态或取消作业。
4,使用微调模型,微调作业完成后模型可以投入使用了。
在某些情况下,用户的微调模型可能需要几分钟才能准备好处理请求。如果对模型的请求超时或找不到模型名称,可能是因为模型仍在加载中,可在几分钟后重试。
微调定价
微调分为初始训练成本和使用成本两大部分。
训练:0.008美元/1K tokens。
使用输入:0.012美元/1K tokens。
使用输出:0.016美元/1K tokens。
例如,一个GPT-3.5Turbo包含100,000个okens的训练文件并训练3个epoch的微调作业的预期成本为2.40美元。
百度聊天机器人文心一言 App 上架苹果 App Store 应用商店
文心一言是由百度公司开发的聊天机器人,能够与人交互、回答问题及协作创作。文心一言被称为著名聊天机器人ChatGPT的中国版及其竞争对手。现在文心一言App已经上架苹果AppStore应用商店。文心一言此前已开放用户申请加入体验,但现仅支持百度帐号绑定电话号码的企业级用户和个人用户。2023年3月20日,百度于官方微信公布,文心一言云服务将于3月27日上线。站长网2023-07-03 16:48:020001阿里巴巴智能信息事业群发布夸克大模型 夸克App将升级为AI助手
据证券时报消息,11月14日,阿里巴巴智能信息事业群发布了全栈自研、千亿级参数的夸克大模型。这个大模型将应用于通用搜索、医疗健康、教育学习、职场办公等场景。夸克App也将借助自研大模型全面升级,加速迈向年轻人工作、学习、生活的AI助手。阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的AIGC技术将会给搜索产品带来全新变化,加速迈向下一代搜索。站长网2023-11-14 15:02:300000日本凸版公司着眼于人工智能, 4亿美元投资芯片和电子产品
日本印刷和材料集团凸版控股(ToppanHoldings)计划在三年内向其电子领域投资约600亿日元(4亿美元),以寻求从人工智能驱动的半导体行业增长中获利。总裁兼首席执行官HideharuMaro表示,这一数字比前三年增加了100亿日元,占凸版2023-25财年计划增长投资的30%。凸版的目标是,与2022财年的水平相比,将用于芯片封装的FC-BGA基板的产能提高一倍。站长网2023-11-25 14:10:050004硅谷人工智能芯片初创公司 SiMa.ai 获台积电投资 致力于 AI 芯片技术
总部位于硅谷的人工智能芯片初创公司SiMa.ai于周二宣布,从投资者那里额外筹集了1300万美元,其中包括台积电子公司VentureTechAlliance。站长网2023-06-15 07:10:230001三星Q2利润恐暴跌96% 主要原因是芯片过剩
三星电子预计2023年6月季度的利润将大幅下滑。分析师预测,该公司的营业利润将同比下降96%,至5550亿韩元(4.27亿美元)。如果这一估计成真,那么根据路透社的报道,这将是三星14年来最低的利润,自2008年第四季度该公司报告了约7400亿韩元的合并经营亏损以来。相比之下,去年同期,三星的营业利润为14.1万亿韩元。站长网2023-07-08 02:52:420001