微软宣布开源 DeepSpeedChat:人人都能拥有自己的 ChatGPT
微软日前宣布开源 Deep Speed Chat,(https://github.com/microsoft/DeepSpeed)可帮助用户轻松训练类 ChatGPT 等大语言模型。
据介绍,Deep Speed Chat 基于微软 Deep Speed 深度学习优化库开发,具备训练、强化推理等功能,使用 RLHF(人工反馈机制的强化学习)技术,可将训练速度提升 15 倍以上,并大幅降低成本。例如,一个 130 亿参数的类 ChatGPT 模型,只需 1.25 小时就能完成训练。
Deep Speed Chat 是一款能够解决训练类 ChatGPT 模型的资源和算法难题的技术,它能够轻松、高效的训练数千亿参数的最先进的类 ChatGPT 模型。使用 Deep Speed Chat,用户只需一个脚本即可实现多个训练步骤,包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤,生成属于自己的类 ChatGPT 模型。
此外,Deep Speed Chat 还提供了一个易于使用的推理 API,用于在模型训练后测试对话性能。Deep Speed Chat 具有强化推理、RLHF 模块、RLHF 系统三大核心功能,能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。
Deep Speed Chat 在成本、效率、扩展性等方面非常优秀,在 Azure 云上只需花费不到 300 美元和 600 美元即可完成对 OPT-13B 模型和 OPT-30B 模型的训练。
微软此次开源 Deep Speed Chat 对整个 ChatGPT 生态发展起到了至关重要的推动作用,简单来说,用户通过 Deep Speed Chat 能以最短的时间、最高效的成本训练类 ChatGPT 大语言模型,这标志着一个人手一个 ChatGPT 的时代要来了。
「人工智能教母」李飞飞谈技术发展:「力量在于人」
斯坦福大学人工智能实验室主任、被誉为「人工智能教母」的李飞飞教授,在人工智能领域贡献了20余年,不仅开发了开创性技术,还积极倡导其在伦理方面的应用。目前,李飞飞领导斯坦福大学的人工智能实验室,带领研究生团队教导机器人模仿人类行为。她还发起了一项倡议,主张所有人工智能都应由人推动,并将这一信息带到了国会。站长网2023-11-09 15:59:450000苹果Vision Pro国行版来了!已开始在中国招聘销售
快科技3月21日消息,苹果公司今日更新了官方招聘信息,新增了位于北京的BriefingExperienceSpecialist(简报体验专员)”职位,主要负责VisionPro头显的销售和业务发展。据工作描述,该职位的主要职责包括向客户进行AppleVisionPro产品和解决方案的演示,并负责管理相关产品的展示体验。同时,通过与客户的直接交流,为苹果产品团队提供关键的反馈和意见。站长网2024-03-22 02:31:590000AI撕裂游戏圈:有人失业,有人狂欢
是的,AI取代打工人的浪潮,已经来了,它最先发生在善于拥抱变化的游戏圈。林语之前是一家游戏公司的UI(用户界面)设计师,去年年底被裁,今年找了三个月工作,发现一些游戏公司已经引入AI来做原画和UI了,招的人变少,于是她选择转行做了销售,因为她自认为,“我是比不过AI的”。站长网2023-04-12 13:53:170002霸王茶姬回应小程序拥堵:用户仍有免单机会
霸王茶姬在今日下午针对其小程序出现拥堵、无法访问等问题作出回应。由于同时在线人数超过了服务器的最大承载量,导致系统出现拥堵现象,给用户带来不便,霸王茶姬对此表示歉意。为了弥补用户的不便,霸王茶姬表示,只要在今天下午13:07后正常提交订单并支付成功的前60000份订单,均可获得免单机会(每位ID限一单)。用户下单ID绑定的手机号将在2小时内收到相关短信信息。站长网2023-11-23 15:42:030000尴尬!谷歌搜索展示AI生成图片替代了真实照片
##**划重点:**🔍Google搜索结果显示以色列·卡玛卡维沃·奥莱的照片实际上是由AI生成的,替代了真实照片。🤖Google表示正在努力改进KnowledgePanels的可靠性和代表性图像,但未解决问题。🌐网页指责Google对于AI生成的虚假信息未能做出充分回应,呼吁公司更好地解决这一问题。站长网2023-11-29 11:48:490000