AgentTuning:通过多智能体任务调整语言模型
最近,研究人员在 GitHub 上开源了一个名为 AgentTuning 的项目。该项目提供了一种新的方法来调整语言模型,通过多个智能体任务中的交互轨迹来训练和调整语言模型,以更好地适应不同的任务和场景。
这种方法可以提高语言模型的效果和泛化能力,同时减少手动调整的工作量。AgentTuning 已经在对话生成、问答系统、摘要生成等多个自然语言处理任务中得到了验证。需要注意的是,这种方法不仅适用于语言模型,也适用于其他类型的模型。
项目地址:https://github.com/THUDM/AgentTuning
主要功能:
AgentInstruct数据集:AgentInstruct是一个经过精心筛选的数据集,包括1,866个高质量互动场景,旨在提升AI代理在6个不同的现实世界任务中的性能。这些场景覆盖了从日常家庭事务到数据库操作的6个不同领域,具有5到35个平均回合数,确保了多样性和复杂性。
AgentLM模型:AgentLM模型是通过对AgentInstruct数据集和Llama2-chat系列的ShareGPT数据集进行混合训练而创建的。这些模型遵循Llama-2-chat的对话格式,其中系统提示已固定为“您是一个有帮助、尊重和诚实的助手”。AgentLM提供了7B、13B和70B模型,可以在Huggingface模型库上获取。
快速部署:AgentTuning使用文本生成推理技术加速评估过程,用户可以轻松地启动AgentLM-70B实例,并在端口30070上访问客户端。这使得用户能够快速生成文本响应。
全面的评估:AgentTuning提供了6个“持有”任务和6个“持有外”任务的详细评估信息,以验证AgentLM的性能。这些任务来自不同的框架,包括SciWorld、MiniWoB 、HotpotQA、ReWOO、WebArena和数字卡牌游戏,涵盖了各种任务类型。
引用支持:如果用户发现AgentTuning的工作对他们有用,他们可以引用相关论文,为团队的努力提供支持。
总的来说,AgentTuning是一个具有巨大潜力的项目,为改善LLMs的通用智能能力提供了重要的工具和资源。通过AgentInstruct数据集和AgentLM模型,用户可以在各种现实世界任务中获得更强大的AI代理,同时保持良好的通用语言能力。
支付宝全新Logo发布 以“开放、科技、温暖”为理念焕然一新
站长之家(ChinaZ.com)1月19日消息:今日,支付宝在其官方微博上正式宣布进行Logo全新升级。围绕“开放、科技、温暖”三大核心理念,新Logo以更开放、流畅和现代的设计风格展现,引入自然光立体效果,传递信任与温暖的感受。*站长网2024-01-19 14:35:180000思科宣布推出用于 AI 超级计算机的 SiliconOne 系列网络芯片
站长之家(ChinaZ.com)6月21日消息:思科于周二推出了用于人工智能超级计算机的网络芯片,这将与博通(Broadcom)和Marvell的产品竞争。站长网2023-06-21 16:57:530003这项AI研究引入 Atom:一种低位量化技术,可实现高效、准确LLM)服务
划重点:-📌Atom是一种低比特量化技术,旨在提高大型语言模型(LLM)的服务吞吐量,同时保持准确性。-📌Atom采用了细粒度和混合精度量化的特殊组合,以保持卓越的准确性。-📌Atom通过将服务吞吐量提高多达7.73倍,相比于典型的16位浮点(FP16)和8位整数(INT8)量化方法,从而满足了对LLM服务需求的不断增长。站长网2023-11-24 10:06:220002iPhone 15 换 USB-C 或藏“心机”,爆料者:只有 Pro 版提速,其他限速 USB 2.0
据彭博社MarkGurman最新时事通讯透露,2023年苹果秋季发布会将于9月12日或9月13日正式举行。在今年这场科技小春晚召开前夕,各路大神纷纷开启了新一轮软硬件产品的爆料,而其中讨论度最高的莫过于即将到来的iPhone15。站长网2023-08-26 17:25:440000OpenAI宣布ChatGPT新增存档聊天记录功能
站长之家(ChinaZ.com)12月21日消息:12月21日,OpenAI在社交平台上发布消息,宣布旗下人工智能对话产品ChatGPT新增存档聊天记录功能。用户可以在“设置”中看到存档的聊天记录。无需删除对话,即可将聊天记录保存起来。目前,这一新功能已在Web和iOS平台上推出,而安卓版本也即将上线该功能。站长网2023-12-21 08:26:090000