微软开源“傻瓜式”类ChatGPT模型训练工具,提速省钱15倍
在利用 OpenAI 的 GPT-4为 Bing Chat、 Bing Image Creator、Microsoft365Copilot、Azure OpenAI Service 和 GitHub Copilot X 引入了类似 ChatGPT 的功能后。微软现又宣布推出 DeepSpeed-Chat,一种用于 RLHF 训练的低成本开源解决方案,基于微软开源的深度学习优化库DeepSpeed;声称即使是使用单个 GPU,任何人也都可以创建高质量的 ChatGPT 式模型。
该公司表示,尽管开源社区付出了巨大的努力,但目前仍缺乏一个支持端到端的基于人工反馈机制的强化学习(RLHF)的规模化系统,这使得训练强大的类 ChatGPT 模型十分困难。ChatGPT 模型的训练是基于 InstructGPT 论文中的 RLHF 方式,与常见的大语言模型的预训练和微调截然不同,使得现有深度学习系统在训练类 ChatGPT 模型时存在种种局限。因此,为了让 ChatGPT 类型的模型更容易被普通数据科学家和研究者使用,并使 RLHF 训练真正普及到 AI 社区,他们发布了 DeepSpeed-Chat。

DeepSpeed-Chat 具有以下三大核心功能:
简化 ChatGPT 类型模型的训练和强化推理体验:只需一个脚本即可实现多个训练步骤,包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤、甚至生成你自己的类 ChatGPT 模型。此外,还提供了一个易于使用的推理 API,用于用户在模型训练后测试对话式交互。
DeepSpeed-RLHF 模块:DeepSpeed-RLHF 复刻了 InstructGPT 论文中的训练模式,并确保包括 a) 监督微调(SFT),b) 奖励模型微调和 c) 基于人类反馈的强化学习(RLHF)在内的三个步骤与其一一对应。此外,还提供了数据抽象和混合功能,以支持用户使用多个不同来源的数据源进行训练。
DeepSpeed-RLHF 系统:其将 DeepSpeed 的训练(training engine)和推理能力(inference engine) 整合到一个统一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于 RLHF 训练。DeepSpeed-HE 能够在 RLHF 中无缝地在推理和训练模式之间切换,使其能够利用来自 DeepSpeed-Inference 的各种优化,如张量并行计算和高性能 CUDA 算子进行语言生成,同时对训练部分还能从 ZeRO- 和 LoRA-based 内存优化策略中受益。DeepSpeed-HE 还能够自动在 RLHF 的不同阶段进行智能的内存管理和数据缓存。
文档内容指出,DeepSpeed Chat 与其他先进方案相比的优势在于:效率和经济性方面比现有系统快15倍以上,在 Azure 云上只需9小时即可训练一个 OPT-13B 模型,只需18小时既可训练 OPT-30B 模型,分别花费不到300美元和600美元。
在速度和可扩展性方面,即使是13B 的模型也可以在1.25小时内训练,庞大的175B 模型可以在不到一天的时间内使用64个 GPU 集群进行训练。在 RLHF 的可访问性和普及化方面,则可以在单个 GPU 上训练超过130亿参数的模型。此外还支持在相同的硬件上分别运行6.5B 和50B 的模型,实现高达7.5倍的提升。



尽管近期关于对ChatGPT 类大语言模型发展的反对和担忧之声不断,但微软似乎仍在全力推进其 AI 开发。对于微软的此次发布,前 Meta AI 专家 Elvis 也激动地表示,DeepSpeed Chat 提供了 Alpaca 和 Vicuna 等所缺少的、一个端到端的 RLHF 管道来训练类似 ChatGPT 的模型,解决的是成本和效率方面的挑战。这是 “微软令人印象深刻的开源努力...... 是一件大事”。
更多详情可查看官方文档:
https://github.com/microsoft/DeepSpeed/blob/master/blogs/deepspeed-chat/chinese/README.md
时代的眼泪!Netflix今日关闭DVD邮寄业务:25年寄出52亿张光盘
快科技9月29日消息,按照Netflix的官方公告,今日起,曾经的标志性DVD邮寄服务终于要落下帷幕。据悉,25年前两位硅谷企业家提出了这一概念,不但摧毁了Blockbuster(百视达)的视频商店,也为进军流媒体市场提供了跳板,并最终改变了娱乐业。当地时间周五,在加州、德州、佐治亚州和新泽西州的五个剩余的发行中心发出了最后一批光盘后,早已萎缩的NetflixDVD邮寄服务将正式画上句号。0000IBM和NASA宣布在Hugging Face上线watsonx.ai地理空间基础模型
文章概要:1.IBM和NASA联合宣布将watsonx.ai地理空间基础模型添加到HuggingFace平台上,该模型旨在利用卫星图像数据来推进气候科学和改善地球生活。2.该基础模型在NASA的HarmonizedLandsatSentinel-2卫星数据的基础上进行了训练,并使用了标记数据对多个特定用例进行了微调。站长网2023-08-03 16:44:480000老板做网红是不务正业吗?周鸿祎带头“吵”起来了
最近,“雷军研究会会长”又开课了。5月17日晚,360创始人周鸿祎开了一场3小时的直播,聊了聊“企业家要不要做IP”这件事。直播中他坚定表示:“企业家做IP是一把手工程,也是必修课。”那么,企业家为什么要做IP?企业家要如何做IP?看完全场直播后,我精选了周鸿祎的一些核心观点:如今已经是头脑被短视频格式化的时代,用户改变了,企业传播方式也需要跟着变化。用户在哪里,企业家就应该去哪里。0000马斯克:明年AI将比任何人都聪明 2029年或将实现AGI
在X社交媒体平台上,马斯克再次大胆发声,于3月13日发表了一系列令人震惊的预测。他明确指出,人工智能可能在明年就超越任何一个单独的人类个体在智力上的表现,而到了2029年,这种超越可能将扩大到整个人类种群。站长网2024-03-14 08:51:070000AI视野:百度发布超级助理插件;AI入侵B站鬼畜区;字节跳动开源视频模型MagicAnimate;给ChatGPT“小费”可改善回答质量
🤖📱💼AI应用百度发布超级助理插件百度智能云发布基于文心一言的AI浏览器插件“超级助理”,以WebCopilot形式提供智能助理服务,涵盖复杂问题解析、文案创作辅助、智能文档处理等场景,支持个性化行业版,助力专业人士提升工作效率。【AiBase提要】🚀WebCopilot服务:百度超级助理以浏览器插件形式出现,随时感知用户需求,在多个场景中提供智能助理服务。站长网2023-12-05 15:37:210002