Prompt2Model:可自动生成专用NLP模型
站长网2023-09-05 10:06:560阅
文章概要:
1. Prompt2Model可以根据提示自动生成专用NLP模型,在某些情况下性能超过GPT-3.5Turbo。
2. Prompt2Model使用OpenAI的GPT-3.5Turbo生成合成训练数据,再利用预训练的Hugging Face模型进行微调。
3. Prompt2Model依赖OpenAI的GPT-3.5Turbo是商业应用的局限,正在探索使用开源语言模型。
卡内基梅隆大学和清华大学的研究人员开发了Prompt2Model系统,可以根据提示自动生成专用NLP模型。
当然,Prompt2Model 并不是GPT-4的替代品,而是用于特殊用途 NLP 模型的自动化管道,这些模型可以很好地执行特定任务,比大型模型小得多,因此可以在低端的的硬件上本地运行。

Prompt2Model系统首先将提示分解为结构化语句,然后查找可能对当前任务有用的数据集。之后利用OpenAI的GPT-3.5Turbo生成针对该任务的合成训练数据。接着识别合适的预训练模型进行微调。
研究人员在三项基准测试中评估了Prompt2Model的结果。在两项任务中,结果的Flan-T5模型表现优于GPT-3.5Turbo。但在第三项基准测试中,Prompt2Model明显落后于OpenAI模型。
Prompt2Model目前主要局限在仅支持英语的任务上。团队表示,GPT-3.5Turbo本身的语言支持有限是其原因。而Prompt2Model依赖OpenAI模型生成数据也限制了其商业应用,OpenAI禁止利用自己的模型训练可能与其竞争的模型。
不过,团队正在探索集成大规模开源语言模型来减少对专有API的依赖。
项目网址:https://github.com/neulab/prompt2model
0000
评论列表
共(0)条相关推荐
亏本卖掉银泰,阿里告别“新零售”?
聚焦核心业务一年后,阿里还是把银泰卖了。12月17日,阿里巴巴集团在港交所发布公告,同意将所持全部银泰股权以约74亿元人民币向雅戈尔集团和银泰管理团队成员组成的买方财团出售(约占银泰股权的99%),预计因出售银泰而录得的亏损约为人民币93亿元。图源阿里巴巴港交所公告雅戈尔集团表示,“本次集团与银泰管理层共同投资银泰,旨在‘强链补链’,完善时尚生态圈。”0000智谱AI宣布开源 GLM 第四代模型 GLM-4-9B
GLM技术团队于2023年3月14日开源了ChatGLM-6B,引起了广泛的关注和认可。随后又开源了ChatGLM3-6B,开发者对GLM第四代模型的开源充满期待。经过近半年的探索工作,GLM技术团队推出了第四代GLM系列开源模型:GLM-4-9B。站长网2024-06-05 16:54:030000腾讯阿里,有点像抖音拼多多了
AT两巨头在同日发布了今年一季度财报。相同的是,腾讯和阿里的营收都是个位数增长,腾讯营收同比增长6%至1595.01亿元,阿里营收同比增长7%至2218.74亿元。不同的是,非国际财务报告准则下,腾讯净利润为503亿元,同比增长54%,阿里净利润为244.18亿元,同比下滑11%。站长网2024-05-15 17:12:360000三星和百度宣布合作 Galaxy S24系列集成文心大模型
三星电子和百度智能云宣布合作,将百度的文心大模型集成到三星全新的AI手机GalaxyS24系列中。GalaxyS24系列搭载了百度文心大模型的多项能力,包括通话、翻译、智能摘要、排版等功能。其中最引人注目的是“即圈即搜”功能,用户可以通过简单的手势操作在文字、图片或视频上进行圈画或划线,即可立即获得精准的搜索结果。站长网2024-01-26 08:52:120000Inflection AI 打造的超级计算机配备数量惊人的 2.2 万块英伟达 H100 GPU
人工智能初创公司InflectionAI打造了一台先进的超级计算机,配备了22,000块英伟达H100GPU,这一数量惊人,带来了巨大的计算性能。InflectionAI的超级计算机预计将成为行业中规模最大的之一,仅次于AMD的Frontier。对于不熟悉InflectionAI的人来说,它是一家致力于创建「人人都能用的个人AI」的企业。站长网2023-07-05 19:41:450004