微软宣布开源 DeepSpeedChat:人人都能拥有自己的 ChatGPT
微软日前宣布开源 Deep Speed Chat,(https://github.com/microsoft/DeepSpeed)可帮助用户轻松训练类 ChatGPT 等大语言模型。
据介绍,Deep Speed Chat 基于微软 Deep Speed 深度学习优化库开发,具备训练、强化推理等功能,使用 RLHF(人工反馈机制的强化学习)技术,可将训练速度提升 15 倍以上,并大幅降低成本。例如,一个 130 亿参数的类 ChatGPT 模型,只需 1.25 小时就能完成训练。
Deep Speed Chat 是一款能够解决训练类 ChatGPT 模型的资源和算法难题的技术,它能够轻松、高效的训练数千亿参数的最先进的类 ChatGPT 模型。使用 Deep Speed Chat,用户只需一个脚本即可实现多个训练步骤,包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤,生成属于自己的类 ChatGPT 模型。
此外,Deep Speed Chat 还提供了一个易于使用的推理 API,用于在模型训练后测试对话性能。Deep Speed Chat 具有强化推理、RLHF 模块、RLHF 系统三大核心功能,能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。
Deep Speed Chat 在成本、效率、扩展性等方面非常优秀,在 Azure 云上只需花费不到 300 美元和 600 美元即可完成对 OPT-13B 模型和 OPT-30B 模型的训练。
微软此次开源 Deep Speed Chat 对整个 ChatGPT 生态发展起到了至关重要的推动作用,简单来说,用户通过 Deep Speed Chat 能以最短的时间、最高效的成本训练类 ChatGPT 大语言模型,这标志着一个人手一个 ChatGPT 的时代要来了。
被偏爱的,被围猎的,实地探访狗头萝莉煎饼摊
站长网2023-07-22 07:07:190000视频号:深度合成技术生成音视频内容需进行显著标识
日前,视频号发布了关于创作者规范使用深度合成技术生成内容的建议,要求创作者应对使用虚拟现实、深度合成技术等生成或合成的非真实的音视频内容进行显著标识。站长网2023-06-20 11:54:220000苹果发布 iOS 15.7.5.、macOS 11.7.6 和 macOS 12.6.5 安全更新
苹果公司今天推送了新的iOS15.7.5.macOSBIGSur11.7.6和macOSMonterey12.6.5更新,新软件为那些运行旧版Mac、iPad和iPhone的用户引入了安全改进,这些软件无法更新到iOS16.iPadOS16和macOSVentura。站长网2023-04-12 12:38:410000梁建章喊话携程员工来领育儿补贴:每生一个孩子发5万元奖励
在2024年ESG全球领导者峰会上,携程集团董事局主席梁建章宣布了一项重大的员工福利政策:为每位员工生育的子女提供5万元人民币的奖励。为此,携程已经预备了高达10亿元人民币的资金。梁建章表示,他期望这一措施能够吸引政府的关注,并促进政府推出更多鼓励生育的政策。梁建章还提出了推广居家办公的建议,认为这样做可以实现社会、员工和公司三方的共赢局面。0000谷歌面临集体诉讼:Chrome 浏览器涉嫌未经用户同意收集数据
最近,谷歌又陷入了一场法律纠纷,面临着一项针对其Chrome浏览器的数据收集行为的集体诉讼。这起诉讼最早是在2020年提出的,指控谷歌在用户未同意的情况下,通过Chrome收集了大量的用户数据。就在不久前,联邦诉法院推翻了2022年12月的裁决,决定此案应当重新审理。站长网2024-08-21 09:32:260000