OpenAI新模型研发遇挫,稀疏性是大模型降本的钥匙吗?
大模型的训练与运行成本极其高昂,OpenAI 也尝试过降低成本,只可惜失败了。
去年年底,当 ChatGPT 引起全球轰动时,OpenAI 的工程师开始研究一种新的人工智能模型,代号为 Arrakis。Arrakis 旨在让 OpenAI 能够以更低的成本运行聊天机器人。
但据知情人士透露:2023年年中,OpenAI 已经取消了 Arrakis 的发布,因为该模型的运行效率没有公司预期的那么高。
图源备注:图片由AI生成,图片授权服务商Midjourney
这次失败意味着 OpenAI 失去了宝贵的时间,并需要将资源转移到开发不同的模型上。
对合作投资来说,Arrakis 的研发计划对于两家公司完成100亿美元投资和产品交易的谈判非常有价值。据一位知情的微软员工透露,Arrakis 的失败让微软的一些高管感到失望。
更重要的是,Arrakis 的失败预示着人工智能的未来发展可能会充满难以预测的陷阱。
Arrakis 是个什么样的模型?
知情人士称,OpenAI 希望 Arrakis 是一个与 GPT-4性能相当,且运行效率更高的模型。Arrakis 模型用到的关键方法是利用稀疏性。
稀疏性是谷歌等其他人工智能开发商也公开讨论并使用的机器学习概念。谷歌高管 Jeff Dean 曾表示:「稀疏计算将成为未来的一个重要趋势。」
OpenAI 很早就开始了关于稀疏性的研究,早在2017年他们就推出了稀疏计算内核。Arrakis 本来可以让 OpenAI 更广泛地推广其技术,因为该公司可以使用数量有限的专用服务器芯片来为其软件提供支持。
当前,增加稀疏性的一种常见方法是借助「混合专家系统(MoE)」技术。然而,加州大学伯克利分校计算机科学教授 Ion Stoica 曾表示:「一般来说,专家模型的数量越多,模型就越稀疏,效率也越高,但可能会导致模型生成的结果不太准确。」
大约在今年春天,OpenAI 的研究人员开始训练 Arrakis 模型,其中涉及使用先进的计算硬件来帮助模型处理大量数据。知情人士称,该公司预计训练 Arrakis 比训练 GPT-4要便宜得多。然而,研究团队很快就意识到该模型的表现不够好,无法获得预期的增益。研究团队花了大约一个月的时间试图解决问题后,OpenAI 的高层领导决定停止训练该模型。
值得欣慰的是,OpenAI 可以将其在 Arrakis 上的工作整合到其他模型中,例如即将推出的多模态大模型 Gobi。
两位知情人士表示,Arrakis 的表现之所以低于 OpenAI 的预期,是因为该公司试图提高模型的稀疏性,这意味着将只使用模型的一部分来生成响应,从而降低运行成本。该模型在早期测试中有效但后来表现不佳的原因尚不清楚。
值得一提的是,有知情人士称 OpenAI 曾为 Arrakis 考虑的公开名称是 GPT-4Turbo。
降低成本有多重要?
对于 OpenAI 来说,随着人们对技术成本的担忧日益增加以及开源替代方案的激增,使其模型更便宜、更高效是首要任务。
据知情人士称,微软使用 OpenAI 的 GPT 模型为 Office365应用程序和其他服务中的人工智能功能提供支持,并且微软原本预计 Arrakis 能够提高这些功能的性能并降低成本。
与此同时,微软开始研发自己的 LLM,并且其 LLM 的运行成本可能比 OpenAI 的模型更低。
尽管这场挫折并没有减缓 OpenAI 今年的业务发展,但随着 LLM 领域的竞争日益加剧,特别是谷歌、微软等科技巨头的加速研发,OpenAI 也有可能在这条赛道上式微。
ElevenLabs推出创新AI音频模型 可生成各种音效
ElevenLabs最近推出了一款创新的AI音频模型,这一技术允许用户仅通过文本提示就能生成各种音效、短乐器曲目、音景和各种角色声音。这项技术的应用范围非常广泛,尤其对以下领域的专业人士来说是一个巨大的福音:内容创作者:无论是制作YouTube视频、播客还是其他任何形式的音频内容,ElevenLabs的AI音频模型能够帮助创作者快速生成所需的背景音乐和音效,提升作品的整体质感。站长网2024-06-03 17:07:540001Midjourney团队公布进展:视频模型进展较慢 3D模型和实时生成效果显著
Midjourney团队在最近的工作时间透露了他们在视频模型、3D模型、实时生成效果以及网站和模型开发方面的最新进展。以下是他们透露的关键信息:图源备注:图片由AI生成,图片授权服务商Midjourney视频模型进展视频模型的开发进度并不如预期那样迅速。尽管3D模型和实时生成的效果令人满意,但团队表示,即便是Sora级别的模型,也未能达到他们心目中的理想效果。产品理念站长网2024-05-16 15:35:460000分析师警告,AI 热潮将导致高端内存芯片供应紧张
划重点:-高性能内存芯片供应将在今年保持紧张,因为爆炸性的人工智能需求推动了这些芯片的短缺。-世界上两家最大的内存芯片供应商SKHynix和Micron表示,他们的高带宽内存芯片已经售罄,2025年的库存也几乎售罄。-AI芯片需求的增长推动了高端内存芯片市场的增长,对三星电子和SKHynix等顶级内存芯片制造商带来了巨大利益。站长网2024-05-14 11:44:090000OpenAI拟研发AI手机 软银将投资10亿美元
AI与手机结合会是什么样子呢!快科技9月29日消息,OpenAI正与被誉为iPhone之父”的前苹果首席设计师艾维(JonyIve)以及软银的孙正义进行深入谈判,拟成立一家合资企业,目的是打造一款AI时代的iPhone。据知情人士透露,孙正义、Altman和艾维已讨论创建一家公司,从三家公司中吸收人才和技术,软银计划向这家合资企业投资逾10亿美元。0000谷歌发布人工智能笔记应用「Project Tailwind」:你的私人文档专属 AI
Google在今年的I/O大会上宣布了许多人工智能项目,其中别一些人最兴奋可能是一个笔记项目:ProjectTailwind。图片截自ProjectTailwind从本质上讲,它实际上是一个基于你的文档训练的人工智能笔记本,你可以用它来查询,就像一个个性化的导师或写作伴侣。Google将它作为一种学生工具,但它对任何需要处理大量文本的人都有更大的潜力。站长网2023-05-11 09:07:030000