开源工具xTuring厉害了,三行代码就能创建自己的大语言模型
xTuring 是一个开源工具,可以让用户只用三行代码就能创建自己的大语言模型 (LLMs)。
据了解,xTuring由 Stochastic 团队开发,旨在优化和加速人工智能大语言模型。Stochastic 拥有一支由聪明的机器学习工程师、博士后和哈佛大学研究生组成的团队,专注于优化和加速法学硕士的人工智能。
自动文本传输、聊天机器人、语言翻译和内容制作等应用程序是人们努力利用这些概念开发和创建新应用程序的领域。训练和微调这些模型可能既耗时又昂贵。无论是使用 LLaMA、GPT-J、GPT-2还是其他方法,xTuring 都可以轻松快速地进行模型优化。
xTuring 可以适应不同的硬件配置,通过内存高效的微调技术 LoRA,加快学习过程,降低硬件成本。据称,xTuring 使用 LoRA 等内存高效微调技术来加速学习过程,并将硬件支出减少多达90%。通过减少微调所需的内存量,LoRA 有助于更快速、更有效的模型训练。
与其他微调技术相比,xTuring 在 LLaMA7B 模型的微调能力上取得了出色的结果。LLaMA7B 模型被用作 xTuring 微调能力的基准,团队将 xTuring 与其他微调技术进行了比较。数据集由52K token组成,测试中使用了335GB CPU 内存和4xA100GPU。
结果表明,使用 DeepSpeed CPU 卸载对 LLaMA7B 模型进行每个 epoch21小时的训练消耗了33.5GB GPU 和190GB CPU。在使用 LoRA DeepSpeed 或 LoRA DeepSpeed CPU 卸载进行微调时,GPU 上的内存使用量分别急剧下降至23.7GB 和21.9GB。CPU 使用的 RAM 量从14.9GB 下降到10.2GB。此外,使用 LoRA DeepSpeed 或 LoRA DeepSpeed CPU 卸载时,训练时间从每个 epoch40分钟减少到20分钟。
操作方面,用户可以通过简单的鼠标点击来微调模型,并且 xTuring 的用户界面非常简单易用。该团队表示,xTuring 是调整大型语言模型的不错选择,因为它支持单个和多个 GPU 训练,使用内存高效的方法,并具有直观的界面。
项目网址:https://github.com/stochasticai/xTuring
https://xturing.stochastic.ai/
AI率先解放了情感咨询的生产力
“怀孕六个月,我老公跟前妻一起带他们的孩子出去玩,三个人只开了一个标间。我老公说什么都没发生,但我还是觉得很崩溃,跟他大吵了一架,在家里抱怨了一通,把我婆婆气到住院了。我老公骂了我一顿,把我拉黑,半个多月没回家,生活费也不打,要怎么办?”这是硬糖君在某社交媒体刷到的真实热帖。将其抛给情感领域的从业者,我得到三个答案。站长网2024-03-04 19:15:250000抖音这俩大叔:听人劝,赚大钱!
各位村民好,我是村长。在抖音有两个商家,属于典型的听人劝、吃饱饭那种。一个是卖雨伞的大叔飞恋雨伞,一个是卖绒布玩偶的大叔优趣优品。01听人劝筛选客户需求我们在许多带货的直播间,经常可以看到一些商家或博主,比较直接的说,不喜欢你可以不买,可以离开直播间去别家看看。或者有些用户会在直播间讨论某个产品设计不好,不是他想要的,就可能会被管理员拉黑。站长网2023-10-31 14:01:070000周鸿祎回应程前道歉:未来属于不断进步和反思的年轻人
在近期结束的“2023年风马牛年终秀”活动中,一场意外的事件成为了网友们热议的焦点。在圆桌论坛环节中,主理人程前与冯仑、王石、周鸿祎三位嘉宾的对话出现了火药味,引发了广泛的关注和讨论。站长网2024-01-11 09:05:060000决策类AI公司第四范式在港交所上市
今日,决策类人工智能公司第四范式在香港联合交易所主板挂牌上市,发行价格为每股55.60港元,股份代号为6682.HK。开盘价为63.1港元,较发行价上涨13.49%。站长网2023-09-28 10:55:530000汤姆猫:类似Sora的AI工具将有助公司低成本打造AI应用产品
划重点:🌐汤姆猫与OpenAI、Google、StabilityAI等公司合作,利用人工智能模型进行内容创作,涉及营销素材、动画素材、产品创意素材等。🔄Sora体现AI技术不断升级,类似Sora的一系列AI工具将帮助公司更高效、低成本地打造功能丰富、体验强大的AI应用产品与服务。💡海外子公司通过机构调研表示,此举旨在提升内容生产效率,进一步拓展公司在AI领域的应用范围。0000