SOLAR10.7B大模型屠榜HuggingFace 创新性拼接两个羊驼,高效集成
站长网2023-12-29 14:31:250阅
深度学习领域的新技术近日在HuggingFace的大模型排行榜中崭露头角,由Upstage AI提出的深度扩展方法(DUS)在SOLAR10.7B大模型上取得了令人瞩目的成绩。该技术通过创新性地拼接两个7B羊驼,并采用DUS方法删除中间层次,使得新模型不仅超越了传统扩展方法如MoE,还能与基础大模型相同的基础设施高效集成。

论文地址:https://arxiv.org/pdf/2312.15166.pdf
在技术实现方面,DUS技术通过巧妙选择Mistral7B作为底材,实现了对原版和MoE版的超越。团队深入权衡性能与模型尺寸,在拼接方式上选择性删除层次,经过继续预训练,模型性能得以迅速恢复。对齐的Instruct版本也在技术实践中取得了显著的进展。
为保障数据安全,团队回应了网友对测试数据泄露的质疑,提供了数据污染测试结果,并显示出低水平的可能性。而SOLAR10.7B基础模型和微调模型以Apache2.0协议开源,得到了科研社区的广泛关注。
在用户反馈方面,试用者对该技术在从JSON格式数据中提取数据的表现表示满意。这一实际应用的反馈证明了该技术在处理实际数据时的优越性。
0000
评论列表
共(0)条相关推荐
谷歌计划在马来西亚投资 20 亿美元,建设数据中心和云基础设施
划重点:⭐谷歌将在马来西亚投资20亿美元,建设首个亚洲市场数据中心⭐谷歌将提供人工智能培训,助力当地学校AI技能发展⭐新数据中心将支持谷歌数字服务和推动当地人工智能能力站长网2024-05-31 19:13:070000AI日报:谷歌推Gemini 1.5 Pro实验版本0801;图像生成开源模型FLUX1横空出世;极速3D图像生成模型Stable Fast 3D发布;阿里语音合成模型CosyVoice更新
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌推超强多模态模型实验版Gemini1.5Pro,排名领先GPT-4o、Claude-3.5Sonnet站长网2024-08-02 15:47:570000潮汕女生要去IPO敲钟了
把自己的爱好做成一家上市公司,朱嘉盈快要实现这个梦想了。投资界-天天IPO获悉,近日,日日煮食品集团DayDayCook(简称“日日煮”)向美国证券交易委员会(SEC)递交F1文件,拟在美国纽约证券交易所(NYSE)上市。据悉,日日煮这次计划通过上市融资筹集最少4000万美元。站长网2023-06-24 14:17:050000智源开源中英文语义向量模型训练数据集MTP
近日,智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP(massivetextpairs)。这是全球最大的中、英文文本对训练数据集,数据规模达3亿对,希望推动解决中文模型训练数据集缺乏问题。站长网2023-09-18 09:26:030000YouTube称只是减缓广告拦截器的使用 Firefox加载速度不受影响
据TheVerge报道,YouTube表示其不会减缓Firefox的速度,只是会减缓广告拦截器的使用。一些用户抱怨在Firefox上加载YouTube视频需要更长的时间,YouTube表示这是为了保持广告流畅而采取的措施。站长网2023-11-22 09:59:110000