NVIDIA发布SteerLM:个性化定制大型语言模型响应的新AI方法
划重点:
NVIDIA发布了一项名为SteerLM的新技术,旨在解决大型语言模型的问题,使用户能够自定义模型的响应。
SteerLM通过四个步骤的监督微调过程,允许用户定义关键属性,如帮助性、幽默和创造力,来引导模型的行为。
这项技术的一个亮点是其实时可调性,用户可以在推断过程中微调属性,从而为各种应用提供个性化的能力。 NVIDIA将SteerLM作为开源软件发布,为开发者提供了机会。性能上表现出色,还具有实时可调整性,可应用于多个领域,从游戏到教育再到无障碍领域。
在人工智能领域,开发人员和用户一直面临一个挑战,那就是需要更加定制和细致的大型语言模型响应。虽然这些模型,比如Llama2,可以生成类似人类的文本,但它们通常需要提供真正针对个体用户独特需求的答案。然而,现有的方法,如监督微调(SFT)和从人类反馈中强化学习(RLHF),存在一些局限,导致生成的响应可能显得机械和复杂。

图源备注:图片由AI生成,图片授权服务商Midjourney
NVIDIA研究部门推出了SteerLM,这是一项突破性技术,旨在解决这些挑战。SteerLM提供了一种新颖的以用户为中心的方法,用于定制大型语言模型的响应,允许用户定义引导模型行为的关键属性。SteerLM通过一个四步骤的监督微调过程来运作,简化了大型语言模型的定制过程。
首先,它使用人工标注的数据集训练属性预测模型,以评估诸如帮助性、幽默和创造性等特性。接下来,它利用这个模型来标注各种不同的数据集,丰富了语言模型可访问的数据的多样性。然后,SteerLM采用属性条件的监督微调,训练模型生成基于指定属性的响应,如感知质量。最后,它通过引导训练来精炼模型,生成各种不同的响应,以实现最佳的微调。
SteerLM的一个显著特点是其实时可调整性,允许用户在推断过程中微调属性,以满足他们的具体需求。这种灵活性为各种潜在应用敞开了大门,从游戏和教育到无障碍领域。有了SteerLM,公司可以为多个团队提供个性化能力,而无需为每个不同的应用重新构建模型。
SteerLM的简单和用户友好性在其指标和性能中表现出色。在实验中,SteerLM43B在Vicuna基准上表现优于现有的RLHF模型,如ChatGPT-3.5和Llama30B RLHF。通过提供一个简单的微调过程,几乎不需要对基础架构和代码进行大幅度更改,SteerLM可以以更少的麻烦交付出色的结果,使其成为AI定制领域的一项重大进展。
NVIDIA正在通过在其NVIDIA NeMo框架中发布SteerLM的开源软件来推动先进的定制。开发人员现在有机会访问代码,并使用Hugging Face等平台上提供的自定义的13B Llama2模型来尝试这一技术。
官方博客说明:https://blogs.nvidia.com/blog/2023/10/11/customize-ai-models-steerlm/?ref=maginative.com
可以攒钱了!任天堂Switch 2最快年底发布
快科技4月14日讯,一位参与《沙丘:觉醒》游戏的视效开发师在简历中,似乎曝光了任天堂下一代主机可能的推出时间。粉丝认为,和PC/PS5/XboxSeries并列的TBA主机大概率是Switch2,最早2023年底或者2024年初发布。当然,也有细心的玩家表示,这款未命名的设备不排除是腾讯游戏机,因为开发《沙丘:觉醒》的Funcom是腾讯全资子公司。站长网2023-04-15 09:37:370000诺基亚将在中东和非洲新开放创新实验室,推动人工智能技术创新
文章概要:-诺基亚计划在迪拜设立新的开放创新实验室,旨在加速中东非地区的人工智能和机器学习技术的采用,以推动网络自动化和优化。-该实验室将重点关注云RAN领域的创新,与戴尔技术和惠普企业等战略合作伙伴合作,推动开放网络架构的采用,提高网络效率和性能。-此外,诺基亚还将展示工业无线网络和工业边缘应用,以及人工智能和机器学习解决方案的应用,以加速网络自动化和优化。站长网2023-09-25 17:39:220000央视评快递新规施行:需要不断完善和优化
从3月1日开始,新修订的《快递市场管理办法》正式落地执行。其中最引人关注的规定是,任何快递企业未经用户许可,不得擅自使用智能快递箱或快递服务站进行投递,更不能擅自代替用户确认签收。若有违反,最高将面临3万元的罚款。站长网2024-03-04 15:34:430000Gartner发布2024年十大战略技术趋势:包括全民化的生成式AI
日前,Gartner公布了2024年需要探索的10大战略技术趋势列表。Gartner杰出研究副总裁兼研究团队负责人ChrisHoward表示:“IT领导者和其他高管必须评估战略技术趋势的影响与益处,但由于技术创新的速度日益加快,这并非易事。例如生成式AI和其他类型的AI虽然带来了新的机遇并推动了若干趋势的发展,但要想通过长期使用AI获得业务价值,还需要采取严谨的方法广泛采用AI并注意风险。”站长网2023-10-18 23:03:080000美国监管机构:现行法律没有“人工智能豁免”
日前,美国联邦贸易委员会FTC主席LinaKhan警告称,美国政府将毫不犹豫的制止涉及偏见或欺骗性人工智能工具的非法行为,包括人工智能工具中的机器偏见和欺骗性内容。Khan警告说,自动化工具不仅会导致偏见,还有很多先进的人工智能工具可产生类似于人的内容。她对诈骗者可能使用的人工智能工具表示担忧,比如会更广泛地部署虚假或令人信服的内容,更精准地针对特定群体。站长网2023-04-27 14:44:250000