Prompt2Model:可自动生成专用NLP模型
站长网2023-09-05 10:06:560阅
文章概要:
1. Prompt2Model可以根据提示自动生成专用NLP模型,在某些情况下性能超过GPT-3.5Turbo。
2. Prompt2Model使用OpenAI的GPT-3.5Turbo生成合成训练数据,再利用预训练的Hugging Face模型进行微调。
3. Prompt2Model依赖OpenAI的GPT-3.5Turbo是商业应用的局限,正在探索使用开源语言模型。
卡内基梅隆大学和清华大学的研究人员开发了Prompt2Model系统,可以根据提示自动生成专用NLP模型。
当然,Prompt2Model 并不是GPT-4的替代品,而是用于特殊用途 NLP 模型的自动化管道,这些模型可以很好地执行特定任务,比大型模型小得多,因此可以在低端的的硬件上本地运行。

Prompt2Model系统首先将提示分解为结构化语句,然后查找可能对当前任务有用的数据集。之后利用OpenAI的GPT-3.5Turbo生成针对该任务的合成训练数据。接着识别合适的预训练模型进行微调。
研究人员在三项基准测试中评估了Prompt2Model的结果。在两项任务中,结果的Flan-T5模型表现优于GPT-3.5Turbo。但在第三项基准测试中,Prompt2Model明显落后于OpenAI模型。
Prompt2Model目前主要局限在仅支持英语的任务上。团队表示,GPT-3.5Turbo本身的语言支持有限是其原因。而Prompt2Model依赖OpenAI模型生成数据也限制了其商业应用,OpenAI禁止利用自己的模型训练可能与其竞争的模型。
不过,团队正在探索集成大规模开源语言模型来减少对专有API的依赖。
项目网址:https://github.com/neulab/prompt2model
0000
评论列表
共(0)条相关推荐
英特尔正打造价值数十亿美元的人工智能加速器业务
**划重点:**1.💸在2023年中旬达到10亿美元后,英特尔的人工智能加速器业务已突破20亿美元。2.🧠今年即将推出的Gaudi3芯片将使性能增加四倍,为英特尔在人工智能加速器市场上提供强大的竞争力。3.📈随着对人工智能芯片需求的激增,英特尔预计这一新兴业务将在未来几年内实现数十亿美元的年收入。站长网2024-02-04 16:11:440002FeedHive:一键帮你搞定社交媒体的写作、发布
FeedHive是一个基于人工智能的平台,帮助用户高效地创建、发布和管理社交媒体内容。它提供了一站式解决方案,让用户能够建立忠实的粉丝群体,培养受众,生成潜在客户,并推动业务增长。官网地址:https://www.feedhive.com/用户可以通过一次点击,在所有社交媒体渠道上发布内容,并根据不同平台进行调整,确保每个帖子都以适当的格式呈现。FeedHive的核心功能包括:站长网2023-07-31 14:45:460000荣耀赵明:将把AI大模型引入终端 Magic V2将于 7 月 12 日发布
在今日的MWC2023上,荣耀CEO赵明表示,荣耀新折叠屏手机MagicV2将在7月12日发布,号称将“带来革命性的折叠屏体验”。赵明表示,消费电子行业的最大影响因素,不是经济周期,而是创新周期。AI和5G等技术开启了新一轮创新周期,为智能手机的发展打开全新的机会大门。赵明称,在AI方面,荣耀将把AI大模型引入终端,在通信方面,将给消费者带来随时随地的畅快连接体验。站长网2023-06-29 19:07:310001拉勾招聘上线AI智能招聘助手产品“HRMind”
7月20日,拉勾招聘宣布上线AI智能招聘助手产品“HRMind”,这是在招聘行业内,首个基于预训练大模型实现广泛应用的招聘场景产品。站长网2023-07-21 12:09:260002华为徐直军:华为全球所有智能终端都在使用讯飞语音技术
在今日的2023科大讯飞全球1024开发者节上,华为轮值董事长徐直军与科大讯飞共同发布基于昇腾生态的飞星一号。徐直军表示,科大讯飞是人工智能的开拓者,把智能语音识别技术做到全球领先。据他介绍,目前华为公司在全球所有使用的智能终端的语音技术,都是来自于科大讯飞,而且不仅仅是中文。因此,科大讯飞和华为的合作将为智能语音技术的发展带来更多的机遇和挑战。站长网2023-10-24 22:07:320000