「豆包」拉低价格线 全球大模型开卷性价比
大模型也开始打起价格战。
5月15日,字节跳动旗下火山引擎发布豆包大模型,除了针对C端用户的豆包APP可免费使用该模型的应用外,豆包大模型将B端用价拉至行业最低。
按照火山引擎总裁谭待的说法,豆包主力模型(≤32K)在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。
豆包以高性价比亮相之前,通义千问、智普AI、DeepSeek等国内很多大模型都开始“卷”起价格,百模大战也随着集体降价进入了新阶段。正如谭待所说,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。
「豆包」将B端用价拉至行业新低
豆包大模型的前身是云雀大模型,也是2023年8月字节跳动旗下发布的首个基于Transformer架构的大模型。半年后,豆包大模型不仅出了全家桶,还将针对行业B端用户降价。
豆包主力模型在企业市场的定价只有0.0008元/千Tokens,0.8厘就能处理1500多个汉字,比行业便宜99.3%。据此计算,1块钱就能买到豆包主力模型的125万Tokens的用量,大约为200万个汉字,相当于三本《三国演义》。而128K的豆包通用模型也只需要0.005元/千Tokens,比行业价格低95.8%。
要知道GPT-4Turbo输入1000Tokens为0.01美元,输出1000Tokens价格为0.21元。相比之下,字节跳动直接把价格“打骨折”,堪称AI界的拼多多。
不止“豆包”,国内不少大模型都在降价。
不久前,百度发布了文心大模型轻量版,其中ERNIE Tiny版本的价格降到了0.001元每千Tokens,相当于1元100万Tokens。
今年5月,智谱AI的大模型商用价格也大幅降价。入门级产品GLM-3Turbo模型调用价格下调80%,从5元/百万Tokens降至1元/百万Tokens,足以让更多企业和个人都能用上这款入门级产品。
智谱AI的大模型的价格
5月6日,国内知名私募巨头幻方量化旗下的AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2,DeepSeek-V2API定价为每百万Tokens输入1元、输出2元(32K上下文)。
5月9日,阿里云正式发布通义千问2.5,根据OpenCompass的测评结果,通义千问2.5得分追平GPT-4Turbo,与此同时,个人用户可从App、官网和小程序免费使用。
5月14日,腾讯的混元文生图大模型直接开源,免费商用。
在海外,OpenAI刚刚发布的GPT-4o也大幅度降价,不仅供所有用户免费使用,在API调用方面也比去年11月发布的GPT-4-turbo降价一半,但速度提升两倍。这是OpenAI大模型产品的第三次降价。
法国人工智能企业Mistral AI大模型Mistral Large的输入、输出价格目前也比GPT-4Turbo便宜约20%,一度引起广泛关注。
无论国内还是海外,大模型正在集体降价。
大模型降本 应用落地增效
各个厂商“价格战”已经开打,而在大半年前,人们获知的常识是大模型训练很烧钱,为何仅仅半年时间,厂商们就能将价格“打下来”、纷纷卷了起来?
火山引擎总裁谭待认为,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。对于中小型企业客户而言,调用大模型的一个重要考虑就是成本。谭待透露,字节跳动在模型结构、训练、生产等各种技术层面有很多优化手段能够实现降价。
OpenAI CEO Sam Altman也为人们不用在ChatGPT上看广告就能使用它而感到骄傲,“我们的一个关键使命就是将AI产品免费提供给人们。”
的确,低价正在帮助大模型研发企业抓住市场机会,以占据一席之地。而用户体量的增加也能反过来帮助研发训练出更好模型。那么,大模型的训练成本真的降低了吗?
去年GPT-4发布时,Sam Altman曾透露,OpenAI最大模型的训练成本“远远超过了5000万美元”。据斯坦福大学发布的《2024年人工智能指数报告》估算,OpenAI的GPT-4训练成本为7800万美元。
高昂的大模型训练成本也直接推高的使用费用,直接将很多企业用户阻拦在外。
不过,研究人员们正在寻找更低成本的训练方法。去年,新加坡国立大学和清华大学的研究者提出了一个名为VPGTrans框架,以极低成本训练高性能多模态大模型,相比于从头训练视觉模块,VPGTrans框架可以将BLIP-2FlanT5-XXL的训练开销从19000 人民币缩减到不到1000元。
国产大模型中,研发人员也各个方面找到降本增效的办法。DeepSeek-V2提升数据集质量、优化架构后,AI异构计算平台“百舸”将训练和推理场景的吞吐量最高提升30%和60%。
除了训练过程外,一些大模型训练的基础设施——芯片也在降价,比如英伟达AI芯片Nvidia A100的降价直接将大模型训练成本降低了约60%。
大模型价格战最直接的影响就是应用落地开始提速。豆包平台上,已经有超过800万个智能体被创建。GPT Store已有超过300万个依托GPT模型的APP被创建。
仅半年时间,砸钱拼大模型性能的时代似乎已经是过去式。现如今,市场用户也随着各家大模型的降价更看重谁家大模型又实惠又好用。这将推动大模型应用更快在场景和商业上实现落地。
QQ启动暑期未成年人网络环境整治 加强短视频、直播场景治理
QQ安全中心宣布启动2024年暑期未成年人网络环境整治专项行动,重点聚焦以下几个方面问题,进一步整治各类有害未成年人的违规行为、清理网络有害信息:1、加强短视频、直播场景有害及不良信息治理工作:严厉打击经典动画、儿歌不良“二次包装”,摆拍校园霸凌,利用“网红儿童”牟利,变相诱导胁迫未成年人参与直播等行为;站长网2024-07-15 08:44:080000狂卷“半托管”,出海四小龙都坐不住了
“还不开放半托管吗?市面上割韭菜的培训机构都已经挥起镰刀了”,5月中旬,一位跨境电商卖家在SHEIN半托管的一个招商群里说道。彼时,SHEIN半托管的入驻通道还在搭建之中,尚未对外招商。以至于,群内一度有其他跨境电商平台的半托管招商人员发布信息,“偷袭”争抢商家。在半托管业务上,SHEIN入局时间并不算早。今年1月初,速卖通“半托管”模式全面上线以来,半托管开始成为跨境电商圈的热门话题。0000马斯克再谈AI:中美差距12个月 但中国有更好的资源去规模化
5月23日,马斯克在《华尔街日报》CEO理事会伦敦峰会上谈到了他对人工智能的看法和未来计划。虽然之前他在CNBC节目上谈及他与OpenAI的起源往事却很少深入探讨AI的观点。而这次他更多地聊到了市场的格局和他即将做的事:借助特斯拉和Twitter生态与Google和微软合作,演一出AI三国志。站长网2023-05-25 10:11:550000王小川:用电脑工作时间越长越会被ChatGPT取代
据奇点财经报道,王小川在中国企业未来之星年会上指出,大语言模型如ChatGPT已经实现了“读万卷书”,但缺乏来自线下的经验,即“行万里路”。他补充说,简单来说,那些长时间坐在电脑面前的工作如平面设计、程序员等,都可能被AI取代,因为现在几行指令就能够完成相应工作。与此同时,如果工作需要完成采风、采点、跟别人交流,被AI取代的风险就会降低。站长网2023-08-13 15:07:290000手机网盘工具玩客云APP宣布将于2月29日停止运营
手机网盘工具玩客云APP宣布,将于2024年2月29日停止运营。用户需在该日期前备份和存储玩客云设备中的文件。停止运营后,玩客云APP将无法登录并不再提供服务。建议用户寻找远程下载的替代方案,比如安装NAS迅雷或下载PC迅雷来进行远程下载任务。用户如有疑问可以联系玩客云官方客服。以下为公告全文:亲爱的玩客云用户:站长网2024-01-02 16:20:090000