AI圈巨震!微软论文曝光GPT-3.5参数量仅有200亿
要点:
微软论文爆料GPT-3.5的参数量仅为20B,远小于之前官方宣布的1750亿,引发广泛关注和争议。
微软的论文介绍了一个小规模扩散模型CodeFusion,性能出色,只有7500万参数,与大型模型相媲美。
论文讨论了CodeFusion模型的架构和性能表现,对GPT-3.5的真实参数量提出了质疑,但仍需等待官方开源数据揭晓。
最近,微软的一篇论文引发了广泛讨论,揭示了GPT-3.5的真实参数量可能只有20B,远远小于之前官方宣布的1750亿。这一曝料在AI圈内引起了巨大的震动,让人们开始重新评估这一庞大模型的性能和潜力。此论文还介绍了一个小型扩散模型CodeFusion,它只有7500万参数,但在性能方面与大型模型相媲美,引发了人们对模型规模与性能之间的关系的思考。
CodeFusion是一个用于代码生成的模型,经过两个阶段的训练,使用无监督预训练和有监督微调的方法,不断提升其性能。在性能评估中,CodeFusion在top-1准确率方面表现出色,尤其在Python任务中,几乎与GPT-3(175B参数)相媲美。而在top-3和top-5设置下,CodeFusion明显优于其他基线模型。
论文地址:https://arxiv.org/pdf/2310.17680.pdf
然而,最引人关注的是GPT-3.5的参数量。以前人们普遍认为它有1750亿参数,但这篇论文声称它只有20B。这个巨大的参数量差异引发了广泛的猜测和讨论。一些人认为这可能是作者的手误,但也有人认为这一参数估计是准确的,因为一些小型模型在性能上与GPT-3.5相媲美。此外,还有人提出了对GPT-3.5的性能和参数量进行更深入研究的问题,以更好地理解这一庞大模型。
尽管这一论文引发了许多争议,但我们仍需等待官方的数据披露以确定GPT-3.5的真实参数量。这个问题引发了关于模型规模与性能之间关系的深刻思考,以及对GPT-3.5是一个小专家模型的集成还是通才模型的质疑。这一争议仍在继续,只有等待更多信息的揭晓才能解开谜团。
30天涨粉685万!主播“户外发”爆火,户外直播有什么魔力?
本文转载自运营公举小磊磊(公众号ID:gongjulei),免费阅读200万字新媒体运营知识,提升新媒体运营能力。最近一段时间,户外主播“户外发(东方阿保)”爆火!根据新榜的数据显示,仅仅在30天内,其粉丝数量飙升了685万。短短几个月时间就在抖音上积累了1145万粉丝,全平台粉丝数更是超过了2000万,成为今年最引人注目的网红之一。站长网2023-12-14 17:17:5100025微信回应校园支付费率问题:依然保持零费率优惠政策
昨日晚间,针对“校园支付费率”相关问题,微信支付回应称,外面都在传费率要调到千分之六是假消息。微信解释称,校园学杂费自始至终保持零费率优惠政策,相关变动从不涉及此类场景。自2015年以来,微信支付自始至终在校园非盈利场景采取零费率优惠政策,相关变动从不涉及此类场景,微信支付将继续对因此产生的通道及运营成本进行补贴。站长网2023-06-30 19:48:450000谷歌优化Live Captions功能:安卓手机这项实用功能终于要改进了!
据最新消息,谷歌计划优化安卓系统的LiveCaptions功能。这项辅助功能能够自动将手机中播放音频实时转录为字幕,对听力障碍者以及在某些场景下难以听清内容的用户来说非常实用。然而,LiveCaptions目前存在一个不足之处:生成的字幕显示在一个浮动框中,无法调整大小。谷歌曾在I/O大会上表示将改进这项体验,并在5月推出新版本,但至今尚未上线。0000ChatGPT面临销毁?GPT-4被曝逐字照抄原文,OpenAI或将赔偿数十亿美元
【新智元导读】今天,纽约时报对OpenAI和微软正式提起诉讼,指控其未经授权就使用纽约时报内容训练人工智能模型。此案可能是人工智能使用知识版权纠纷的分水岭。今天,OpenAI和微软正式被《纽约时报》起诉!索赔金额,达到了数十亿美元。指控内容是,OpenAI和微软未经许可,就使用纽约时报的数百万篇文章来训练GPT模型,创建包括ChatGPT之类的AI产品。0000iPad Pro/Air双剑齐发!苹果发布会仅35分钟
快科技5月6日消息,据爆料人MarkGurman透露,苹果将于5月7日举行的发布会预计仅持续35分钟,届时将推出4款新品:iPadPro、iPadAir、ApplePencil和妙控键盘。其中新款iPadPro将提供11英寸和12.9英寸两种尺寸,首次采用OLED屏幕,支持LTPO技术和120HzProMotion显示,采用双串联结构,具有高亮度、长寿命和更好的电池续航表现。站长网2024-05-06 10:54:540000