研究表明,开源语言模型无法与 GPT-4 相提并论
站长网2023-05-29 10:10:080阅
开源语言模型的进步是无可争议的。但它们真的能与来自 OpenAI、谷歌和其他公司的训练有素的语言模型竞争吗?
诸如之前所报道的,使用Alpaca Formula训练的开源语言模型几乎不需要怎么训练以及很低的成本就能达到了类似于ChatGPT的水平。
Alpaca Formula指的是开发人员使用 ChatGPT 生成的训练数据来微调Meta语言模型 LLaMA 。使用这些数据,LLaMA 模型可以在很短的时间内学习生成类似于 ChatGPT 的输出,并且只需要很少的计算量。
但伯克利大学的研究人员在最近的一项研究中得出了不同的结论:他们将Alpaca Formula应用于LLaMA和 GPT-2的一些基础模型,然后让这些结果由人工评估并由GPT-4自动评估。
最初,他们得出了与之前的开发人员相同的结论:使用指令改进的模型(研究人员称之为“模仿模型”)的性能远远超过基础模型,与 ChatGPT 相当。
然而,“更有针对性的自动评估”表明,模仿模型实际上只在他们看到模仿数据的任务中表现良好。在所有其他领域,GPT-4仍然存在明显的性能差距。因为这些基础模型在广泛的预训练过程中获得了大部分功能,而不是在微调过程中获取的。
研究人员表示,这些所谓的评价的工作者经常在没有专业知识的情况下在短时间内评估人工智能内容,很容易被忽悠。
OpenAI 研究员约翰舒尔曼最近也批评使用 ChatGPT数据微调开源基础语言模型,称如果微调数据集包含原始模型中不存在的知识,它们可能会产生更多不正确的内容。
0000
评论列表
共(0)条相关推荐
通过开发AI工具帮助企业撰写提案 AutogenAI获得了2230万美元投资
伦敦初创公司AutogenAI开发了一款基于生成AI的工具,可以帮助企业撰写更强的提案,提高中标率。该公司最近获得了来自BlossomCapital的2230万美元投资,用于招聘更多人才、扩大平台并增加客户群。官网地址:https://autogenai.com/站长网2023-07-27 10:50:350000苹果梦幻旗舰!曝iPhone 16 Pro系列拥有行业最窄边框
快科技6月4日消息,据博主爆料,iPhone16Pro系列的边框打破历史纪录,做到了行业最窄。具体而言,iPhone16Pro的黑边只有1.2mm,iPhone16ProMax黑边只有1.15mm,做到了全球最窄。据悉,iPhone16Pro系列采用苹果全新的BRS窄边框技术,BRS全称是BorderReductionStructure。站长网2024-06-04 10:50:500000全球最大规模、最全场景、最全产业!中国移动完成5G RedCap现网规模试验
快科技2月19日消息,今天,中国移动官方宣布,携手10余家合作伙伴率先完成全球最大规模、最全场景、最全产业的RedCap(5G轻量化)现网规模试验。同时中国移动还推动首批芯片、终端具备商用条件,RedCap端到端产业已全面达到商用水平。0000高通与现代汽车打造车载信息娱乐系统 支持AI引擎和机器学习功能
8月2日,高通技术公司宣布与现代汽车集团(HMG)在个性化定制车型(Purpose-builtvehicles,PBV)上开展技术合作。基于高通技术公司开发行业领先的汽车解决方案的成功经验,最新一代骁龙座舱平台旨在提供顶级图形图像和沉浸式多媒体及音频体验,同时实现优化的能效。站长网2023-08-04 08:43:310000蚂蚁集团完成整改后启动股份回购 对应估值约5671亿元
7月8日消息,据多家媒体报道,在相关整改落地后的第二天,蚂蚁集团宣布将启动股份回购。今日上午,蚂蚁集团宣布为补充员工激励池以持续吸引人才,同时为进一步满足股东对流动性的需求,将以自有资金回购现有股东的部分股份,回购比例不超过总股本的7.6%。相关事项已获得蚂蚁集团董事会批准,并提交股东大会审议。站长网2023-07-10 00:07:310000