AgentTuning:通过多智能体任务调整语言模型
最近,研究人员在 GitHub 上开源了一个名为 AgentTuning 的项目。该项目提供了一种新的方法来调整语言模型,通过多个智能体任务中的交互轨迹来训练和调整语言模型,以更好地适应不同的任务和场景。
这种方法可以提高语言模型的效果和泛化能力,同时减少手动调整的工作量。AgentTuning 已经在对话生成、问答系统、摘要生成等多个自然语言处理任务中得到了验证。需要注意的是,这种方法不仅适用于语言模型,也适用于其他类型的模型。
项目地址:https://github.com/THUDM/AgentTuning
主要功能:
AgentInstruct数据集:AgentInstruct是一个经过精心筛选的数据集,包括1,866个高质量互动场景,旨在提升AI代理在6个不同的现实世界任务中的性能。这些场景覆盖了从日常家庭事务到数据库操作的6个不同领域,具有5到35个平均回合数,确保了多样性和复杂性。
AgentLM模型:AgentLM模型是通过对AgentInstruct数据集和Llama2-chat系列的ShareGPT数据集进行混合训练而创建的。这些模型遵循Llama-2-chat的对话格式,其中系统提示已固定为“您是一个有帮助、尊重和诚实的助手”。AgentLM提供了7B、13B和70B模型,可以在Huggingface模型库上获取。
快速部署:AgentTuning使用文本生成推理技术加速评估过程,用户可以轻松地启动AgentLM-70B实例,并在端口30070上访问客户端。这使得用户能够快速生成文本响应。
全面的评估:AgentTuning提供了6个“持有”任务和6个“持有外”任务的详细评估信息,以验证AgentLM的性能。这些任务来自不同的框架,包括SciWorld、MiniWoB 、HotpotQA、ReWOO、WebArena和数字卡牌游戏,涵盖了各种任务类型。
引用支持:如果用户发现AgentTuning的工作对他们有用,他们可以引用相关论文,为团队的努力提供支持。
总的来说,AgentTuning是一个具有巨大潜力的项目,为改善LLMs的通用智能能力提供了重要的工具和资源。通过AgentInstruct数据集和AgentLM模型,用户可以在各种现实世界任务中获得更强大的AI代理,同时保持良好的通用语言能力。
由 OpenAI、微软、Alphabet 和 Anthropic 领导的人工智能安全前沿模型论坛任命首位主任,并计划短期内成立咨询委员会
站长之家(ChinaZ.com)10月26日消息:由OpenAI、微软和谷歌等公司发起的人工智能安全论坛——前沿模型论坛(FrontierModelForum)于周三任命了其首位主任,并宣布将在未来几个月内成立一个咨询委员会,以帮助指导其战略方向。前沿模型论坛还表示,它已经创建了一个基金,以支持相关技术的研究,初始资金承诺来自其支持者和合作伙伴,超过1000万美元。站长网2023-10-26 10:14:380000图灵奖得主Hinton入局机器人创业 新公司获得9000万美元投资
要点:图灵奖得主GeoffreyHinton将担任初创公司VayuRobotics的顾问,这标志着他重返机器人领域。VayuRobotics是一家强调AI应用的初创公司,拥有强大的团队和创新技术,获得了9000万美元的投资。Hinton之所以加入VayuRobotics,是因为他认为该公司的技术路线具有较低的AI道德风险。站长网2023-10-12 14:32:180002多款产品月流水破亿,这家广州垂类大厂为何能全球通吃?
似乎《原神》之后,国产游戏的出海节奏更快了。一方面腾讯、米哈游、莉莉丝等出海厂商在海外设点,上线新品,推出全球发行品牌;另一方面诸如巨人网络、恺英网络、4399等国内老厂也先后布局海外,且取得了不错的成绩。全球游戏环境的开放,海外用户认知和接受度的变高,加上层出不穷的成功案例,给了不少游戏厂商「我上我也行」的错觉。美日韩依旧是重点出海区域2023H1游戏产业报告站长网2023-08-13 09:55:340000百度推出AIGC营销新创意平台“擎舵” AI数字人平台限时免费
百度宣布推出AIGC营销新创意平台—擎舵,通过多模态内容生成,突破创意生产力瓶颈,可轻松实现文案生成、图片生成和数字人视频制作三大创意生产能力。基于擎舵平台,百度营销正在打造营销场景下的专属创意生成工具,高质高效输出创意内容,推动客户服务经营路径的变化,AI数字人平台是重要代表。站长网2023-06-21 16:57:550000迟到4年的升级!树莓派发布Raspberry Pi 5:4核A76性能翻倍
树莓派自问世以来,受到了众多计算机发烧友和创客的追捧。不过让人没想到的是,在2019年6月发布RaspberryPi4之后的4年时间里,树莓派竟然一直没有再推出过新品。9月28日,树莓派正式发布新一代RaspberryPi5,搭载博通BCM2712处理器,包含四个ArmCortex-A76核心,频率高达2.4GHz,性能是前代2~3倍。0000