研究表明,开源语言模型无法与 GPT-4 相提并论
站长网2023-05-29 10:10:080阅
开源语言模型的进步是无可争议的。但它们真的能与来自 OpenAI、谷歌和其他公司的训练有素的语言模型竞争吗?
诸如之前所报道的,使用Alpaca Formula训练的开源语言模型几乎不需要怎么训练以及很低的成本就能达到了类似于ChatGPT的水平。
Alpaca Formula指的是开发人员使用 ChatGPT 生成的训练数据来微调Meta语言模型 LLaMA 。使用这些数据,LLaMA 模型可以在很短的时间内学习生成类似于 ChatGPT 的输出,并且只需要很少的计算量。
但伯克利大学的研究人员在最近的一项研究中得出了不同的结论:他们将Alpaca Formula应用于LLaMA和 GPT-2的一些基础模型,然后让这些结果由人工评估并由GPT-4自动评估。
最初,他们得出了与之前的开发人员相同的结论:使用指令改进的模型(研究人员称之为“模仿模型”)的性能远远超过基础模型,与 ChatGPT 相当。
然而,“更有针对性的自动评估”表明,模仿模型实际上只在他们看到模仿数据的任务中表现良好。在所有其他领域,GPT-4仍然存在明显的性能差距。因为这些基础模型在广泛的预训练过程中获得了大部分功能,而不是在微调过程中获取的。
研究人员表示,这些所谓的评价的工作者经常在没有专业知识的情况下在短时间内评估人工智能内容,很容易被忽悠。
OpenAI 研究员约翰舒尔曼最近也批评使用 ChatGPT数据微调开源基础语言模型,称如果微调数据集包含原始模型中不存在的知识,它们可能会产生更多不正确的内容。
0000
评论列表
共(0)条相关推荐
vivo Y100外观公布:vivo史上最轻薄5000mAh手机
快科技10月24日消息,vivoY100已定档10月27日14:30发布,号称越级新标杆”。vivo今日公布了新机vivoY100的外观设计,新机外观看起来十分轻薄,机身薄至7.49mm,这是vivo史上最轻薄5000mAh手机。设计方面,vivoY100采用东方美学理念,运用3D曲面玻璃配合琉璃质感工艺打造出极具美感的机身后盖。站长网2023-10-24 23:42:480003上热搜了!iPhone 16 Pro Max发货延至10月:苹果万元旗舰供不应求
快科技9月13日消息,今日晚间,话题iPhone16抢购”冲上了微博热搜榜第二名,引发关注。今晚8点,iPhone16系列开启预购,苹果官网再次出现宕机情况,京东、天猫平台的iPhone16ProMax闪电售罄。截至目前,9999元起售的iPhone16ProMax发货时间延至10月份,市场供不应求。站长网2024-09-14 15:21:290000调查显示:人工智能让加州律师、艺术家等职业最为焦虑
划重点:-🤖加利福尼亚州的律师在面对人工智能(AI)发展时表现出最大的担忧,位居榜首。-🎨艺术家、会计师、医生和数据分析师依次排名担忧AI的前五名。-🌐研究指出,未来AI可能更多地与这些领域的人类一起工作,而不是完全取代他们。关于人工智能(AI)将如何影响未来劳动力的问题一直是人们讨论的热点。AI指的是“数字计算机或计算机控制的机器执行通常与智能生物相关的任务的能力”。0000六部门:推动算力结构多元配置 到 2025 年算力规模超过 300 EFLOPS
工信部等六部门近日联合印发《算力基础设施高质量发展行动计划》,提出到2025年,计算力方面,算力规模超过300EFLOPS,智能算力占比达到35%,东西部算力平衡协调发展。《行动计划》其中提出,推动算力结构多元配置。结合人工智能产业发展和业务需求,重点在西部算力枢纽及人工智能发展基础较好地区集约化开展智算中心建设,逐步合理提升智能算力占比。站长网2023-10-09 15:18:400001谷歌推3D生成模型CAT3D 1分钟完成3D场景创建
谷歌推出的CAT3D模型在3D重建领域取得了显著的进展,它通过使用多视角扩散模型来创建3D场景,提供了一种快速且高效的方法来生成3D内容。主要特点:快速生成:CAT3D能够在最短的时间内,即一分钟内完成整个3D场景的创建,这比现有的单图像和少视图3D场景创建方法要快得多。多视图支持:该模型不仅支持单图像输入,还能够处理多图像输入,从而生成更加丰富和详细的3D场景。站长网2024-05-20 13:50:330003