英伟达发布HelpSteer：一个用于构建有用LLM的开源数据集

站长网2023-11-28 16:05:010阅

英伟达最近宣布了NVIDIA NeMo SteerLM技术作为英伟达 NeMo框架的一部分。这项技术使用户能够在推断过程中控制大型语言模型（LLM）的响应。

英伟达 NeMo团队现在正在开源一个名为HelpSteer的多属性数据集。这个新资源使开发人员能够快速开始使用SteerLM技术并构建最先进的自定义模型。HelpSteer是我们团队与Scale AI合作的成果。结合SteerLM技术，它提高了响应的事实性和连贯性。开发人员现在可以在复杂性和冗长度等其他属性上引导LLM的响应，增强响应对最终用户的整体可控性。

项目地址:https://huggingface.co/datasets/nvidia/HelpSteer

通过使用这个新的数据集和SteerLM技术，英伟达训练了一个名为Llama270B的基础模型，其表现优于Llama2-70B聊天模型。

为了构建这个数据集，NeMo团队收集了约10，000个高质量提示，并使用内部LLM为每个提示生成了四个响应。然后，团队请人工专家根据0-4的评分来评估每个响应。Scale的生成式AI数据引擎将自动化和人工智能相结合，快速生成与特定AI目标和数据需求相适应的训练数据。

数据集中的所有响应都以五个属性进行了注释，包括:响应在整体上满足了提示的要求程度、响应是否包含事实准确、相关的信息而没有幻觉或虚假信息、响应的清晰度、逻辑性和自洽性以及响应的词汇和句子结构的复杂程度（从基础到专家级）、响应相对于提示所要求的是简洁还是冗长。

通过这个数据集和SteerLM技术的应用，英伟达取得了令人满意的结果，为构建自定义的LLM提供了更大的灵活性和可控性。这个新的开源数据集为开发人员提供了一个有用的工具，帮助他们更好地理解和应用NVIDIA NeMo框架中的SteerLM技术。

英伟达发布HelpSteer一个用于构建有用LLM的开源数据集

0000

评论列表

共(0)条

相关推荐

站长资讯
AI在劳动节淘汰7800打工人，永久的
“这不是演习，AI让人失业来真的了!”就在这个劳动节假期，科技巨头IBM宣布:暂缓可以被AI取代的岗位的招聘，约7800人将被永久淘汰。尽管“我们要被AI取代”的唬人消息不是第一次出现了，但正如外媒ArsTechnica所说:IBM直接将这个问题“摆到了台面上”。换而言之，IBM打响了科技巨头用AI取代人类岗位的第一枪。
站长网2023-05-04 09:01:11
0000
由OpenAI支持的机器人公司1X获得1亿美元投资计划推家庭服务机器人
**划重点:**1.🌐OpenAI支持的1X科技宣布完成B轮融资，共计1亿美元，投资方包括三星等大公司。2.🚀公司计划利用资金支持企业客户，并推出新型双足机器人“NEO”，旨在解决社会对劳动力需求不断增长的问题。3.🤖1X科技通过与OpenAI合作，采用语言和具象学习模型，使其机器人能够理解用户的自然语言指令，并执行相应任务，为企业和家庭提供智能服务。
站长网站长资讯2024-01-12 10:37:29
0000
站长资讯
百度与兴业银行签约推进人机对话AI技术在金融场景应用
近日，兴业银行与百度举行战略合作签约仪式，双方计划在大模型应用、绿色基础设施建设、智慧营销和品牌联合运营等领域展开深入合作。未来，百度与兴业银行计划基于文心千帆大模型平台，共同推进前沿人机对话AI技术在金融场景的应用，大模型能力将在智能搜索、智能风控、智能投顾、智能投研、智能客服等业务场景中落地。双方将探索共建联合创新实验室，作为大模型等前沿技术应用探索的测试基地和产业化基地。
站长网2023-06-09 20:57:09
0000
站长资讯
最强开源多模态生成模型MM-Interleaved 支持任意穿插的图文输入和输出
要点:1、多模态生成大模型的新突破;2、独创特征同步器，刷新多项任务SOTA;3、可应用于多种图文生成及图像生成任务。近期，一项开源项目MM-Interleaved引起了学者的广泛关注，该模型在多模态生成大模型方面取得了新的突破。项目引入了独创的特征同步器，刷新多项任务SOTA，拓展了多种图文生成及图像生成任务的应用领域，为多模态大模型的发展提供了新的活力。
站长网2024-02-01 14:56:07
0000
站长资讯
腾讯文库正式发布：汇集亿级专业文档一键转文档编辑
快科技8月30日消息，腾讯今晚突然正式发布了一款重磅新品腾讯文库。腾讯号称为专业权威的内容消费与发布平台”，汇集海量优质内容，覆盖众多专业领域，无论是考试真题、法律合同还是求职简历都能快速找到。同时还搭载AI智能助手助力，支持一键总结、生成思维导图，快速掌握内容大纲。针对内容创作方面，腾讯文库还支持AI辅写。腾讯文库还可以无缝融合腾讯文档，随时随地点击即用。
站长网2024-08-31 16:53:30
0000