利用合成数据微调ChatGPT超越GPT-4摘要性能 降低63%成本和提升11倍速度
文章概要:
- 利用链式密度提示微调ChatGPT在新闻摘要任务上超过GPT-4零样本表现,接近GPT-4链式提示。
- 通过ScoreStringEvalChain和改进的PairwiseStringEvalChain等自动评估链实现人类水平的量化评估。
- 微调ChatGPT比GPT-4零样本快11倍且便宜63%,比GPT-4链式提示快33倍且便宜84%。
近日,Elicit公司机器学习工程师Charlie George在LangChain博客上发表文章介绍了他们使用合成数据微调ChatGPT在新闻摘要任务上超越GPT-4的研究成果。
文章提到,尽管GPT-4被公认为世界上最强大的语言模型,但其调用限制、高成本和高延迟也限制了其实际应用。为解决这一问题,一些开发者转而使用ChatGPT等小模型,但小模型的表现通常不如GPT-4。文章介绍了微调的思路,即调整模型参数以更好地适应具体任务,但收集人类标注数据昂贵且耗时,而传统评估指标如困惑度也无法准确反映用户体验。
为解决数据问题,采用了一种合成数据生成方法,即使用GPT-4通过链式密度(CoD)提示逐步改进其生成的摘要。然后,使用LangSmith平台收集这些改进后的摘要作为训练数据,微调ChatGPT。
在评估方面,文章认为传统的BLEU和ROUGE指标往往不能准确捕捉现代语言模型的细微差异。相比之下,人工评估虽可靠但耗时耗力。最佳方案是开发自动化评估系统,但也需要人工验证其有效性。研究者已经开发了与真人高度一致的自动化评估链ScoreStringEvalChain和PairwiseStringEvalChain。
说明:经过微调的 ChatGPT 超越了 GPT-4零样本,并接近带有 CoD 的 GPT-4
说明:经过微调的 ChatGPT 比 GPT-4零样本快11倍以上,比带 CoD 的 GPT-4快33倍
经过微调的 ChatGPT 比 GPT-4零样本便宜63%,比带 CoD 的 GPT-4便宜84%
结果显示,相比GPT-4零样本,微调后的ChatGPT在新闻摘要任务上的表现优于前者,几乎达到GPT-4链式提示的水平,但其速度提高11倍,成本降低63%。与零样本GPT-4相比,微调ChatGPT在双样本评估中获胜率达96%。
分析称,合成数据微调展现了增强语言模型能力的巨大潜力。LangChain提供了创建复杂链条和迁移到小模型的完美工具。自动化评估为快速可靠地评估实际表现提供了有效手段。这为新一代AI应用大规模部署提供了路径。
苹果 Siri 和人工智能技术发展遭遇内部斗争和隐私问题阻碍
据三十多名前苹果员工向TheInformation的WayneMa透露,Siri和苹果对人工智能的使用因谨慎和组织功能失调而受到严重阻碍。这份付费报告解释了为什么在该公司人工智能和机器学习小组工作的前苹果员工认为,缺乏雄心和组织功能失调阻碍了Siri和该公司的人工智能技术。苹果的虚拟助手在公司内部显然因其功能不足和长期缺乏改进而「备受嘲笑」。站长网2023-05-12 20:27:050000今日AI:阿里欲推AI电商产品“绘蛙”;北大团队发起复现Sora计划;ComfyUI LayerDiffusion正式上线;AI工具DUSt3R GitHub爆火
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用阿里正在打造一款AI电商产品“绘蛙”【AiBase提要:】⭐该产品主要针对商家和达人,主要功能有AI文案生成和AI生图站长网2024-03-04 21:38:080000Nvidia表示,新框架使Pandas在GPU上的运行速度快了150倍
划重点:-Nvidia的RAPIDScuDF框架的新版本可使Pandas在GPU上运行时性能提升150倍。-Pandas是一种广泛使用的Python数据框架,用于数据处理和分析,现在可在GPU上获得显著的性能提升。-新的Pandas加速模式允许未更改的Pandas代码在统一的CPU/GPU环境中运行,从而为数据科学家提供更快速的数据处理能力。站长网2023-11-09 10:01:090000Runway最强竞争对手来了,一键生成短视频,限时免费开放使用
最近一段时间,AI作画的水平正在突飞猛进。在Midjourney、AdobeFirefly不断布局、落地图片生成技术的同时,有创业公司已经把眼光放到了视频生成上。本周,推特上出现了不少新AI工具生成的短视频,引发了人们关注。这其中既有AI生成的「赛博朋克电影预告片」。也有自然风格的动植物景象:「日本的旅游风光」。站长网2023-08-27 13:43:070000内部人士透露:OpenAI 很可能将 GPT-3.5 开源
OpenAI很可能在未来几个月内发布其模型的权重。OpenAI的AndrejKarpathy最近表示,所有这些对于转换器语言模型来说都是非常通用的。“如果/当OpenAI发布模型权重(我既不能确认也不能否认!),那么这里的大部分代码将非常相关。”站长网2023-07-26 09:59:200000