微软宣布开源 DeepSpeedChat:人人都能拥有自己的 ChatGPT
微软日前宣布开源 Deep Speed Chat,(https://github.com/microsoft/DeepSpeed)可帮助用户轻松训练类 ChatGPT 等大语言模型。

据介绍,Deep Speed Chat 基于微软 Deep Speed 深度学习优化库开发,具备训练、强化推理等功能,使用 RLHF(人工反馈机制的强化学习)技术,可将训练速度提升 15 倍以上,并大幅降低成本。例如,一个 130 亿参数的类 ChatGPT 模型,只需 1.25 小时就能完成训练。
Deep Speed Chat 是一款能够解决训练类 ChatGPT 模型的资源和算法难题的技术,它能够轻松、高效的训练数千亿参数的最先进的类 ChatGPT 模型。使用 Deep Speed Chat,用户只需一个脚本即可实现多个训练步骤,包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤,生成属于自己的类 ChatGPT 模型。
此外,Deep Speed Chat 还提供了一个易于使用的推理 API,用于在模型训练后测试对话性能。Deep Speed Chat 具有强化推理、RLHF 模块、RLHF 系统三大核心功能,能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。
Deep Speed Chat 在成本、效率、扩展性等方面非常优秀,在 Azure 云上只需花费不到 300 美元和 600 美元即可完成对 OPT-13B 模型和 OPT-30B 模型的训练。
微软此次开源 Deep Speed Chat 对整个 ChatGPT 生态发展起到了至关重要的推动作用,简单来说,用户通过 Deep Speed Chat 能以最短的时间、最高效的成本训练类 ChatGPT 大语言模型,这标志着一个人手一个 ChatGPT 的时代要来了。
苹果手表与头显手势冲突 watchOS10.4测试版解决该问题
AppleWatch可以在使用VisionPro时忽略双击手势。在watchOS10.4和iOS17.4的测试版为AppleWatchSeries9和AppleWatchUltra2增加了一个新的开关。这个新的设置是为了避免AppleWatch和AppleVisionPro在使用手势时发生冲突。站长网2024-01-31 08:57:460000抖音、瑞幸宣布启动鸿蒙相关岗位招聘
站长之家(ChinaZ.com)11月27日消息:近日,抖音与瑞幸咖啡宣布已经启动鸿蒙相关职位的招聘,为推动技术创新和发展迎来新一波高端人才。站长网2023-11-27 10:48:320002零跑国际合资公司正式成立 9月起于欧洲9国开始电动汽车销售
StellantisN.V.和浙江零跑科技股份有限公司今日宣布:两家公司已通过关于成立“LeapmotorInternationalB.V.”的所有必要性审批,由Stellantis集团主导的零跑国际正式组建完成,该合资公司由Stellantis集团和零跑汽车分别持股51%和49%。站长网2024-05-14 17:52:030000巨量引擎为抖音商家推出智能成片、AI一键混剪工具
巨量引擎近日推出了一款名为“智能成片”的AIGC产品,这是一款AI智能混剪工具,旨在帮助抖音商家快速生成符合抖音爆款标准的带货短视频。商家只需输入营销目标、填写商品卖点信息并上传至少3条商品空镜视频,智能成片即可在5分钟内生成10条带货短视频,极大地提高了内容创作的效率和质量。该工具的使用非常便捷,有两个入口可以快速登录:巨量千川PC首页-工具-三方工具-智能成片以及星图即合-智能成片。站长网2023-08-22 21:43:0000019Minimax的AI对话机器人问答产品海螺问问上线
最新推出的MinimaxAI对话机器人问答产品海螺问问已经上线。这款产品在语音对话能力、模型能力和用户体验方面都表现出色。海螺问问拥有非常自然的语音模型接入,能够支持语音回答问题。此外,它还支持实时的AI语音对话,但不会带有外国口音。用户还可以在海螺问问中训练自己的语音模型,操作简单,只需阅读屏幕上显示的一段话。站长网2024-01-30 09:59:080000