Meta华人提出语言模型Shepherd 用于评估模型生成
站长网2023-08-15 14:14:080阅
最近,Meta AI 提出了一种新的语言模型叫做 "牧羊人"(Shepherd),用于评估其他模型生成的文本,并给出改进建议。这个模型使用了约70亿个参数,并通过社区反馈和人工标注的数据集来进行训练。
"牧羊人" 模型的评估结果显示,在与其他竞争模型进行比较时,它的平均胜率为53-87%,远高于其他模型。此外,在人工评估中,"牧羊人" 模型的表现也优于其他模型,与 ChatGPT 相当。
该模型的特点之一是能够生成自然语言的反馈,包括总体判断、一般建议以及领域知识等。它可以识别文本中的问题,如事实性、逻辑错误、连贯性和一致性,并提出改进建议。
论文地址:https://arxiv.org/pdf/2308.04592.pdf
为了微调和评估 "牧羊人" 模型,研究人员创建了一个高质量的反馈数据集,包括社区反馈和人工标注的反馈。通过使用 GPT-4作为评估工具,并选择了6个涵盖广泛主题和推理技能的数据集进行评估。
研究人员发现,"牧羊人" 模型在批判模型生成方面的能力优于其他模型,尤其是在提供正确判断的反馈方面。同时,社区反馈和人工标注的反馈数据对模型的性能有不同的影响,社区反馈更多样化但非正式,而人工标注的数据信息量更大。
总的来说,"牧羊人" 模型展示出了令人印象深刻的结果,在多个下游任务中表现优于其他模型。这一研究对于改进语言模型生成的可靠性非常有益。
语言模型的特点包括:
能够生成连贯、有语境和语义的文本。
能够识别问题,并提供改进建议。
可以涉及领域知识,给出相关的建议。
可以通过社区反馈和人工标注的数据进行微调和评估。
在批判模型生成方面表现优于其他模型。
在多个下游任务中的表现优于其他模型。
对不同类型的任务都能提供反馈。
0000
评论列表
共(0)条相关推荐
小红书带货二姐|GMV500万+的背后是什么
你敢信吗,从3月31日到5月22日,短短2个月时间不到,小红书已经培育了2位直播大佬,董洁和章小蕙分别登场小红书直播带货,吸引了大批用户的疯狂购买,同时也带动了小众品牌以及高单价产品在小红书销量增长。章小蕙的直播首秀让平台带货热度达到了6亿,冲向销量榜一,而董洁则在连续8小时的高强度直播中傲视榜单,两位女性分别交出了令人瞩目的带货成绩,为小红书直播电商创造了迄今为止最好的成绩。—1—站长网2023-05-29 13:51:140000一家AI声音克隆公司,借三只羊录音门玩起了“自杀式营销”?
只羊事件闹得沸沸扬扬,没想到受害者竟然是AI。昨晚,合肥警方就“三只羊集团创始人卢文庆录音事件”发布通报,称这条广为流传的音频为AI生成,犯罪嫌疑人已经被依法采取刑事强制措施。一锤定音,这条通报不仅给出了官方表态,也扇了前几天那位网传“国内AI第一人”一记耳光,毕竟,当时“国内AI第一人”给出的判断是“AI声音克隆技术目前还做不到那么丝滑”。站长网2024-09-30 21:00:260000AI与学术界的较量!学术界有人使用ChatGPT撰写论文
文章概要:1.计算机科学家GuillaumeCabanac发现论文中不慎复制了ChatGPT查询短语,揭露了使用ChatGPT来写作的骗局。2.论文作者坦白承认使用聊天机器人起草文章,引发学术界对生成式AI对学术界的担忧。3.论文因未声明使用ChatGPT而被撤销,引发关于学术伦理和未来的争论。站长网2023-09-11 11:01:200001研究表明,AI图像生成器正在接受儿童露骨照片进行训练
划重点:-🚩报告指出,人工智能图像生成器的基础中隐藏着数千张儿童淫秽照片。-🚩这些图片使得AI系统更容易生成逼真的虚假儿童图片,并将社交媒体上全副武装的真实青少年照片转化为裸体照片。-🚩这个问题没有简单的解决办法,需要公司采取行动来解决技术中的漏洞。根据一份新报告,人工智能图像生成器的基础中隐藏着数千张儿童淫秽照片,该报告敦促公司采取行动解决技术中的缺陷。0001OpenAI招募专家加入“红队”网络,加强AI模型安全性
文章概要:1.OpenAI宣布了一项公开招募专家的计划,旨在邀请跨领域的专家加入OpenAI“红队”网络,以提高其人工智能模型的安全性。2.“红队”网络是OpenAI的迭代开发过程的一部分,包括内部和外部对抗性测试,旨在加深与外部专家的合作,确保模型安全。站长网2023-09-20 09:48:090000