微软密谋小尺寸AI模型,撇开OpenAI搞起了“B计划”
AI大模型无疑是2023年的关键词,更是各大科技厂商竞逐的热门赛道。然而象征着未来的AI大模型实在太费钱,以至于财大气粗如微软都开始考虑“Plan B”了。近日有爆料信息显示,在微软内部由Peter Lee领导的1500人研究团队中,有一部分人转向研发全新的LLM,它的体积更小、运营成本也低得多。
关于微软的小尺寸AI模型,实际上在3个月前就已经初见端倪。此前在今年6月,微软方面发布了一篇题为《Textbooks Are All You Need》的论文,用规模仅为70亿token的“教科书级别”数据训练了一个13亿参数的模型phi-1,证明高质量的小规模数据一样能够让模型具备良好的性能。并且在phi-1的基础上,此前微软研究院还发布了名为phi-1.5的全新预训练语言模型,可适用于QA问答、聊天格式和代码等场景。
根据微软方面的说法,在测试常识、语言理解和逻辑推理的基准下,phi-1.5的表现超出了相当一部分大模型。phi-1.5在带LM-Eval Harness的GPT4AL跑分套件中,可以媲美Meta旗下拥有70亿参数的开源大模型llama-2,在AGIEval得分上甚至超过了llama-2。
为什么微软要突然做小尺寸的AI模型呢?首要因素被外界认为可能是与OpenAI之间的纠葛。作为OpenAI的“金主”,微软能够在旗下产品中永久使用OpenAI现有知识产权的独家权利,但这也并不代表他们就能控制OpenAI。所以对于微软这样的巨头而言,无论是出于自身战略安全的考量,还是为了在后续与OpenAI的合作关系中占据更有利的地位,开发高质量的LLM都是一个必选项。
当然,目前AI大模型实在太耗能也是关键因素之一。在今年年初的设计自动化大会上,AMD首席技术官Mark Papermaster就展示了一张幻灯片,显示机器学习系统的能耗与全球发电情况的对比。根据国际能源署估计,训练大模型的数据中心变得越来越耗电,其用电量占全球电力消耗的1.5%至2%,大致相当于整个英国的用电量,预计2030年这个比例将上升到4%。
根据Digital Information World发布的相关报告显示,数据中心为训练AI模型产生的能耗将为常规云服务的三倍,到2028年数据中心功耗将接近4250兆瓦、比2023年增加212倍。而OpenAI训练GPT-3的耗电量为1.287吉瓦时,大约相当于120个美国家庭1年的用电量。但这还仅仅只是训练AI模型的前期电耗,仅占模型实际使用时所消耗电力的40%。
事实上,训练AI大模型不仅耗能、还费水。在谷歌方面发布的2023年环境报告中就显示,他们2022年消耗了56亿加仑(约212亿升)的水,相当于37个高尔夫球场,其中52亿加仑用于该公司的数据中心、比2021年增加了20%。
但AI大模型的高能耗是非常正常的,用ARM高级技术总监Ian Bratt的话来说,就是“AI计算需求是没法满足的。网络规模越大、结果就越好,可以解决的问题也越多,电力使用与网络规模成正比。”
有AI从业者表示,在此次疫情前,训练一个Transformer模型所需的能耗在27千瓦时的范围内,但现在Transformer模型的参数从5000万增加到了2亿,能耗也已经超过了50万千瓦时。也就是说,参数的数量增加了四倍,可能耗却增加了超过18000倍。从某种意义上来说,AI大模型带来的种种创新功能,其实都是以处理性能和功耗方面的高昂成本为代价。
更多的电力驱动更多的GPU进行AI训练,又要大量消耗水资源来冷却GPU,这就是问题所在。以至于微软被曝光正在制定一个路线图,希望用小型核反应堆产生的电能来运营数据中心。更何况即便不提ESG(“环境、社会及管治”),单纯从成本层面出发,研究小尺寸模型也是有价值的。
众所周知,搭建了CUDA生态的英伟达是这一轮AI热潮中的最大受益者,更是已经占据了AI芯片市场的70%,如今H100、A100等计算卡更可谓是一卡难求。可现在的情况,是向英伟达购买算力已经成为了一个推高AI厂商成本的重要因素。所以小尺寸模型也就意味着需要的算力资源更少,只需购买更少的GPU就能解决问题。
虽然功能更强的大模型确实很好,但现在大模型的商业化还处于蒙昧状态,唯一赚得盆满钵满的是“买铲子”的英伟达。所以在这样的情况下,微软自然也就有意来改变现状了。
李彦宏:百度文心一言4.0中文已超过ChatGPT 4.0
快科技3月10日消息,日前,百度创始人李彦宏在央视2024《对话开年说》节目中谈到了百度文心一言。李彦宏表示,文心一言4.0在中文上已经超过ChatGPT4.0。比如写藏头诗,现在很多大模型都能写,但如果要求它写一个《沁园春》词牌的词,ChatGPT4.0就完全搞不懂,它不知道第一句话应该是四个字还是五个字。0000腾讯诉代练公司案二审维持原判 后者被判赔60万元
4月21日上午,江苏省高级人民法院二审公开开庭并当庭宣判,腾讯诉《王者荣耀》代练公司不正当竞争案,维持原判。江苏某网络科技有限公司是一家代练公司,旗下有两款主要业务为代练著名手游《王者荣耀》的APP,注册用户数量达到了三四十万。腾讯公司作为游戏著作权人,认为该公司规模化的代练经营行为影响了游戏平衡,同时,部分未成年人通过代练登录游戏,导致游戏实名制和未成年人防沉迷保护机制失效。站长网2023-04-21 15:29:140000OpenAI谷歌苹果再燃AI争霸战,谁将担纲“Her”时代王者?
从下周开始,硅谷科技巨头将开启新一轮的AI大战。OpenAI、谷歌、苹果都将押注AI助手,并发布一系列重磅更新,你准备好了?新一轮AI大战,即将拉开序幕!下周一,OpenAI将开启线上直播,官宣GPT-4升级,甚至还有一个超级「AI助手」等着我们。OpenAI「音频AGI研究负责人」AlexisConneau已更换主页背景,并与奥特曼同频——下周我们将会见证Magic。站长网2024-05-13 10:01:110000专为中国用户打造!特斯拉推送龙年OTA升级:新增龙年灯光秀等
快科技1月31日消息,近日,特斯拉正式推送了龙年特殊OTA版本升级,本次升级版本号为2023.44.32.1,为用户带来龙年灯光秀”等10项升级。特斯拉官方表示,此次OTA升级是专为中国用户打造。据了解,新的春节特色灯光秀”适用车型为:Model3/Y、新款ModelS/X,用户可通过玩具箱”灯光秀”开启使用,并且支持立即开启或10分钟后开启。站长网2024-01-31 16:48:090000视频编辑器Type Studio:可自动将视频转录成文字
TypeStudio是一个基于文本的视频编辑器。它允许您通过编辑自动生成的文字转录来编辑视频,而不是在经典的视频时间线上进行编辑。体验地址:https://streamlabs.com/zh-cn/podcast-editor主要功能:使用AI技术自动转录视频可以直接在文本上进行编辑,轻松删除填词或重复内容可以添加图片、表情符号、视频片段等视觉元素支持多语言字幕和翻译站长网2023-09-01 11:17:250001