Meta华人提出语言模型Shepherd 用于评估模型生成
站长网2023-08-15 14:14:080阅
最近,Meta AI 提出了一种新的语言模型叫做 "牧羊人"(Shepherd),用于评估其他模型生成的文本,并给出改进建议。这个模型使用了约70亿个参数,并通过社区反馈和人工标注的数据集来进行训练。
"牧羊人" 模型的评估结果显示,在与其他竞争模型进行比较时,它的平均胜率为53-87%,远高于其他模型。此外,在人工评估中,"牧羊人" 模型的表现也优于其他模型,与 ChatGPT 相当。
该模型的特点之一是能够生成自然语言的反馈,包括总体判断、一般建议以及领域知识等。它可以识别文本中的问题,如事实性、逻辑错误、连贯性和一致性,并提出改进建议。

论文地址:https://arxiv.org/pdf/2308.04592.pdf
为了微调和评估 "牧羊人" 模型,研究人员创建了一个高质量的反馈数据集,包括社区反馈和人工标注的反馈。通过使用 GPT-4作为评估工具,并选择了6个涵盖广泛主题和推理技能的数据集进行评估。
研究人员发现,"牧羊人" 模型在批判模型生成方面的能力优于其他模型,尤其是在提供正确判断的反馈方面。同时,社区反馈和人工标注的反馈数据对模型的性能有不同的影响,社区反馈更多样化但非正式,而人工标注的数据信息量更大。

总的来说,"牧羊人" 模型展示出了令人印象深刻的结果,在多个下游任务中表现优于其他模型。这一研究对于改进语言模型生成的可靠性非常有益。
语言模型的特点包括:
能够生成连贯、有语境和语义的文本。
能够识别问题,并提供改进建议。
可以涉及领域知识,给出相关的建议。
可以通过社区反馈和人工标注的数据进行微调和评估。
在批判模型生成方面表现优于其他模型。
在多个下游任务中的表现优于其他模型。
对不同类型的任务都能提供反馈。
0000
评论列表
共(0)条相关推荐
图库巨头Getty Images拥抱AI技术 推出生成式AI服务
划重点:-GettyImages采取双管齐下的策略,一方面起诉涉及侵权的AI图像生成公司,另一方面推出新的AI图像生成服务。-新的GenerativeAI服务由GettyImages与Nvidia合作开发,旨在为商业客户提供商业可行的AI图像生成,避免知识产权风险。站长网2023-10-30 11:25:480000炼丹家AI:一个集成“AI对话“和“AI绘画”的垂直细分功能网站
要点:炼丹家集成了AI对话和AI绘画等功能。AI对话可用于文本生成、问答、翻译、对话等场景。AI绘画可用于生成图像、二维码等创意作品。炼丹家AI是一个集成AI对话和AI绘画功能的人工智能平台。炼丹家通过AI技术,可以高效生成各类文本创作,也可以绘制出惊艳的图片作品。在AI对话方面,平台支持文本生成、问答、机器翻译、对话系统、客服机器人等功能,可以自动产生自然语言内容,与用户进行流畅交互。站长网2023-08-28 14:13:070001vivo X100入网 首发天玑9300或搭载卫星通信功能
根据3C认证信息的最新显示,vivoX100系列已经通过认证并具备120W有线快充功能。这款新机系列将首发天玑9300处理器。此外,vivoX100系列还将标配国产1.5k曲面屏,预计采用最新的京东方Q9基材,局部峰值亮度将突破1600nit。站长网2023-10-19 15:13:400000官方回应“理想L9误将广告识别成真车致追尾”:后续会改进
快科技5月11日消息,近日网络上热议一起由理想L9误认广告牌为真车导致追尾”的事故。据报道,在湖北襄阳,一位驾驶理想L9的车主表示,在使用车辆的辅助驾驶系统时,车辆错误地将高速公路边的广告牌上的小货车图片识别为真实车辆,并采取了紧急制动措施,结果导致了追尾事故。对于这起事件,理想汽车的相关责任人回应,确认是车载系统错误地将广告图片视作实体车辆所致,并指出公司会针对软件系统进行改进。0000三星新款人工智能冰箱配备 AI Family Hub+:可根据您的饮食需求设计食谱
三星公司宣布,将在新的一年推出一款具有引人注目的人工智能功能的智能冰箱。该公司计划在明年的消费电子展(CES)上展示这款名为2024Bespoke4-DoorFlexRefrigerator的产品,它配备了AIFamilyHub。图片来自Samsung站长网2023-12-28 10:19:510000