微软开源“傻瓜式”类ChatGPT模型训练工具,提速省钱15倍
在利用 OpenAI 的 GPT-4为 Bing Chat、 Bing Image Creator、Microsoft365Copilot、Azure OpenAI Service 和 GitHub Copilot X 引入了类似 ChatGPT 的功能后。微软现又宣布推出 DeepSpeed-Chat,一种用于 RLHF 训练的低成本开源解决方案,基于微软开源的深度学习优化库DeepSpeed;声称即使是使用单个 GPU,任何人也都可以创建高质量的 ChatGPT 式模型。
该公司表示,尽管开源社区付出了巨大的努力,但目前仍缺乏一个支持端到端的基于人工反馈机制的强化学习(RLHF)的规模化系统,这使得训练强大的类 ChatGPT 模型十分困难。ChatGPT 模型的训练是基于 InstructGPT 论文中的 RLHF 方式,与常见的大语言模型的预训练和微调截然不同,使得现有深度学习系统在训练类 ChatGPT 模型时存在种种局限。因此,为了让 ChatGPT 类型的模型更容易被普通数据科学家和研究者使用,并使 RLHF 训练真正普及到 AI 社区,他们发布了 DeepSpeed-Chat。
DeepSpeed-Chat 具有以下三大核心功能:
简化 ChatGPT 类型模型的训练和强化推理体验:只需一个脚本即可实现多个训练步骤,包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤、甚至生成你自己的类 ChatGPT 模型。此外,还提供了一个易于使用的推理 API,用于用户在模型训练后测试对话式交互。
DeepSpeed-RLHF 模块:DeepSpeed-RLHF 复刻了 InstructGPT 论文中的训练模式,并确保包括 a) 监督微调(SFT),b) 奖励模型微调和 c) 基于人类反馈的强化学习(RLHF)在内的三个步骤与其一一对应。此外,还提供了数据抽象和混合功能,以支持用户使用多个不同来源的数据源进行训练。
DeepSpeed-RLHF 系统:其将 DeepSpeed 的训练(training engine)和推理能力(inference engine) 整合到一个统一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于 RLHF 训练。DeepSpeed-HE 能够在 RLHF 中无缝地在推理和训练模式之间切换,使其能够利用来自 DeepSpeed-Inference 的各种优化,如张量并行计算和高性能 CUDA 算子进行语言生成,同时对训练部分还能从 ZeRO- 和 LoRA-based 内存优化策略中受益。DeepSpeed-HE 还能够自动在 RLHF 的不同阶段进行智能的内存管理和数据缓存。
文档内容指出,DeepSpeed Chat 与其他先进方案相比的优势在于:效率和经济性方面比现有系统快15倍以上,在 Azure 云上只需9小时即可训练一个 OPT-13B 模型,只需18小时既可训练 OPT-30B 模型,分别花费不到300美元和600美元。
在速度和可扩展性方面,即使是13B 的模型也可以在1.25小时内训练,庞大的175B 模型可以在不到一天的时间内使用64个 GPU 集群进行训练。在 RLHF 的可访问性和普及化方面,则可以在单个 GPU 上训练超过130亿参数的模型。此外还支持在相同的硬件上分别运行6.5B 和50B 的模型,实现高达7.5倍的提升。
尽管近期关于对ChatGPT 类大语言模型发展的反对和担忧之声不断,但微软似乎仍在全力推进其 AI 开发。对于微软的此次发布,前 Meta AI 专家 Elvis 也激动地表示,DeepSpeed Chat 提供了 Alpaca 和 Vicuna 等所缺少的、一个端到端的 RLHF 管道来训练类似 ChatGPT 的模型,解决的是成本和效率方面的挑战。这是 “微软令人印象深刻的开源努力...... 是一件大事”。
更多详情可查看官方文档:
https://github.com/microsoft/DeepSpeed/blob/master/blogs/deepspeed-chat/chinese/README.md
Open LLM榜单再次刷新,比Llama 2更强的「鸭嘴兽」来了
站长网2023-08-17 09:38:320000AI机器人伴侣成美国老年人新宠!美国每年花70万刀,失去爱人的84岁老人重新笑了
【新智元导读】84岁的美国老人DorothyElicati在失去结婚65年的丈夫后,每天醒来唯一做的事就是哭泣,直到一个AI机器人的出现。现在,美国会每年花费70万美元,为某些州的老年人免费发放这款机器人。AI机器人,真是老龄化的未来?《纽约时报》的这篇文章,给了我们很多启发。如果不是它,我可能会失去理智站长网2024-07-15 13:56:490000人工智能写作助手Flot.ai:使用最新GPT-4 模型 支持200多种语言
Flot.ai是一款人工智能写作助手,能够帮助用户在任何应用或网站上获得AI的帮助,无需复制粘贴就可以使用ChatGPT。Flot.ai使用OpenAI最新的GPT-4模型,支持200多种语言,真正做到一键使用AI。体验地址:https://flot.ai/站长网2023-09-11 18:01:100000腾讯宣布上线吃瓜地图 帮助瓜农增加收入
腾讯地图联合大河报和河南省各地城管系统推出了“河南夏日瓜果地图”,覆盖了全省15个地市的1140余个瓜果销售点位。用户只需打开腾讯地图App或小程序,搜索“河南吃瓜地图”,即可快速找到最近的销售点,方便地购买新鲜瓜果,同时也帮助瓜农增加收入。站长网2024-07-12 11:58:080000科大讯飞2023年净利同比增幅达15%-30%:星火大模型V3.5明日发
快科技1月29日消息,科大讯飞晚间发布2023年度业绩预告,2023年实现归属于上市公司股东的净利润6.45亿元-7.3亿元,同比增长15%-30%。报告期内,公司在人工智能通用大模型及行业大模型方面坚定投入并取得显著进展。科大讯飞表示,公司在讯飞星火认知大模型”上持续投入并保持行业领先,同时在国产自主可控算力底座上加大投入,形成飞星一号”领先成果。站长网2024-01-29 20:00:110000