利用合成数据微调ChatGPT超越GPT-4摘要性能 降低63%成本和提升11倍速度
文章概要:
- 利用链式密度提示微调ChatGPT在新闻摘要任务上超过GPT-4零样本表现,接近GPT-4链式提示。
- 通过ScoreStringEvalChain和改进的PairwiseStringEvalChain等自动评估链实现人类水平的量化评估。
- 微调ChatGPT比GPT-4零样本快11倍且便宜63%,比GPT-4链式提示快33倍且便宜84%。
近日,Elicit公司机器学习工程师Charlie George在LangChain博客上发表文章介绍了他们使用合成数据微调ChatGPT在新闻摘要任务上超越GPT-4的研究成果。
文章提到,尽管GPT-4被公认为世界上最强大的语言模型,但其调用限制、高成本和高延迟也限制了其实际应用。为解决这一问题,一些开发者转而使用ChatGPT等小模型,但小模型的表现通常不如GPT-4。文章介绍了微调的思路,即调整模型参数以更好地适应具体任务,但收集人类标注数据昂贵且耗时,而传统评估指标如困惑度也无法准确反映用户体验。
为解决数据问题,采用了一种合成数据生成方法,即使用GPT-4通过链式密度(CoD)提示逐步改进其生成的摘要。然后,使用LangSmith平台收集这些改进后的摘要作为训练数据,微调ChatGPT。
在评估方面,文章认为传统的BLEU和ROUGE指标往往不能准确捕捉现代语言模型的细微差异。相比之下,人工评估虽可靠但耗时耗力。最佳方案是开发自动化评估系统,但也需要人工验证其有效性。研究者已经开发了与真人高度一致的自动化评估链ScoreStringEvalChain和PairwiseStringEvalChain。
说明:经过微调的 ChatGPT 超越了 GPT-4零样本,并接近带有 CoD 的 GPT-4
说明:经过微调的 ChatGPT 比 GPT-4零样本快11倍以上,比带 CoD 的 GPT-4快33倍
经过微调的 ChatGPT 比 GPT-4零样本便宜63%,比带 CoD 的 GPT-4便宜84%
结果显示,相比GPT-4零样本,微调后的ChatGPT在新闻摘要任务上的表现优于前者,几乎达到GPT-4链式提示的水平,但其速度提高11倍,成本降低63%。与零样本GPT-4相比,微调ChatGPT在双样本评估中获胜率达96%。
分析称,合成数据微调展现了增强语言模型能力的巨大潜力。LangChain提供了创建复杂链条和迁移到小模型的完美工具。自动化评估为快速可靠地评估实际表现提供了有效手段。这为新一代AI应用大规模部署提供了路径。
AI视野:百度发布首个量子领域大模型;Runway推出镜头控制功能;Colossal把大模型门槛打下来了
🤖📈💻💡大模型动态百度发布首个量子领域大模型百度发布首个量子领域大模型,以及百度量子助手和量子写作助手两大AI原生应用,旨在全面推动量子技术与大模型深度融合,释放潜力。AiBase提要:👉百度发布首个量子领域大模型,深度融合量子技术与大模型。👉百度量子助手降低百度量子平台门槛,提高使用效率。👉量子写作助手高效创作量子领域文档,促进知识产权沉淀。站长网2023-09-25 15:28:400001美图自研AI视觉大模型MiracleVision奇想智能3.0版发布
美图公司在其15周年生日会上发布了自研AI视觉大模型MiracleVision(奇想智能)3.0版本,并将全面应用于旗下的影像与设计产品。这一大模型将助力电商、广告、游戏、动漫、影视五大行业,提高工作流效率。站长网2023-10-09 14:57:130000小红书日引流1000+顾客,该怎么做?
│前言│小红书上的引流变现的逻辑是:选题—封面标题—内容评论—钩子—私域—成交—裂变;如果你想要在小红书上做正确、安全引流,一定是小心翼翼的,不要被引流的幌子做迷惑,而是要理解它的底层逻辑。作为公司的一把手可能没有深刻的体验,小红书运营应该很有共鸣,会由于后台三个板块的99,用户私信太多,加好友太频繁而兴奋,也会因为站外引流频繁,官方监测到3次就直接封号的悲痛心理。站长网2023-06-29 19:26:280001微软推出微型AI自动编码模型phi-1,击败 GPT-3.5
微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型phi-1,并且其性能优于ChatGPT背后的大型语言模型GPT-3.5。据了解,这个基于Transformer的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。站长网2023-06-27 16:03:570000Stability AI发布AI音乐生成工具Stable Audio
要点:位于伦敦的初创公司StabilityAI推出了StableAudio,这是一个使用人工智能从简单的文本输入生成自定义音乐曲目和音效的工具,具备在较长时间内生成专业音频的能力。StableAudio的优势在于其能够以多种流派生成音乐作品,提供用户友好的基于浏览器的界面,面向需要快速背景音乐的创意专业人士。站长网2023-09-14 19:43:060000