SOLAR10.7B大模型屠榜HuggingFace 创新性拼接两个羊驼,高效集成
站长网2023-12-29 14:31:250阅
深度学习领域的新技术近日在HuggingFace的大模型排行榜中崭露头角,由Upstage AI提出的深度扩展方法(DUS)在SOLAR10.7B大模型上取得了令人瞩目的成绩。该技术通过创新性地拼接两个7B羊驼,并采用DUS方法删除中间层次,使得新模型不仅超越了传统扩展方法如MoE,还能与基础大模型相同的基础设施高效集成。

论文地址:https://arxiv.org/pdf/2312.15166.pdf
在技术实现方面,DUS技术通过巧妙选择Mistral7B作为底材,实现了对原版和MoE版的超越。团队深入权衡性能与模型尺寸,在拼接方式上选择性删除层次,经过继续预训练,模型性能得以迅速恢复。对齐的Instruct版本也在技术实践中取得了显著的进展。
为保障数据安全,团队回应了网友对测试数据泄露的质疑,提供了数据污染测试结果,并显示出低水平的可能性。而SOLAR10.7B基础模型和微调模型以Apache2.0协议开源,得到了科研社区的广泛关注。
在用户反馈方面,试用者对该技术在从JSON格式数据中提取数据的表现表示满意。这一实际应用的反馈证明了该技术在处理实际数据时的优越性。
0000
评论列表
共(0)条相关推荐
京东外卖,“烧”上牌桌
京东做外卖,在秒送内部有一个传闻。最初秒送并没有规划外卖,是刘强东拍板才最终入局的。刘强东认为京东APP仍然没有满足日常需求,例如餐食。无论传闻真假,这都折射出京东APP正在从电商应用转为生活应用。继2月11日公开宣布入局外卖以来,过去半个月,京东外卖靠着赚足了吆喝。0000Redmi显示器G27Q多功能支架版2025发布:升级2K 180Hz高刷 首发949元
快科技10月20日消息,今日,Redmi显示器G27Q多功能支架版2025款发布,目前已在小米商城开启预售,售价1399元,参与预售可享100元订金抵550元活动,首发到手价949元,将于10月25日开售。站长网2024-10-20 14:11:570000Valve 解释关于 AI 的审核政策:不会允许侵犯版权的 AI 艺术作品 Steam 游戏上架
各个媒体在上周报道了一条来自Reddit用户potterharry97的六月发布帖子,声称Steam将不再发布由人工智能生成内容的游戏。同月稍后,另一位游戏开发者也发表了类似的帖子。然而,Valve表示情况并非如此。站长网2023-07-03 18:21:310004微信广告推出小程序广告免开发智能接入模式
微信广告创新推出了小程序广告免开发智能接入模式,同时下调了小程序流量主的开通门槛,为更多中小开发者提供变现收益的机会。在智能接入模式下,开发者无需编写任何代码,只需进行三个简单的步骤,约五分钟即可完成广告的上线,大大提高了变现效率。这一模式的亮点有三个:站长网2024-01-26 10:35:190001Galaxy S24系列AI编辑功能引发争议 三星回应:正与监管机构合作
近日,三星正面临的挑战不仅仅局限于智能手机的新功能开发,而是涉及到生成式人工智能的监管问题。三星客户体验主管帕特里克·乔梅特表示,政府对生成式人工智能能力的担忧是正当的,需要加强监管。在今年的首届Unpacked活动上,三星展示了一系列以人工智能驱动的软件功能,统称为GalaxyAI,并将其整合到新款GalaxyS24系列手机中。站长网2024-02-04 14:33:190000