南方科技大学联合IDEA研究院发布 SUS-Chat-34B 双语模型
站长网2023-12-11 09:02:331阅
南方科技大学联合 IDEA 研究院 CCNL 中心发布了 SUS-Chat-34B,这是一个参数规模为340亿的双语模型。该模型在众多中英文任务上表现出色,超越了其他同参数规模的模型。
SUS-Chat-34B基于01-ai/Yi-34B 预训练模型通过数百万高质量、多语言的指令数据进行了微调。
模型具有以下亮点:
大规模复杂指令跟随数据:使用1.4B token的高质量复杂指令数据进行训练,涵盖中英文、多轮对话、数学、推理等多种指令数据;
强大的通用任务性能:SUS-Chat-34B模型在众多主流的中英文任务上表现出色,其效果超越了相同参数规模的其他开源的指令微调模型。即使与更大参数规模的模型相比,SUS-Chat-34B模型也具有不错的竞争力
更长的上下文窗口与出色的多轮对话能力:SUS-Chat-34B原生支持8K的上下文窗口,在大量多轮指令以及单多轮混合数据中进行训练,具有出色的长文本对话信息关注与指令跟随能力。
开源地址:
https://modelscope.cn/models/SUSTC/SUS-Chat-34B/summary
0001
评论列表
共(0)条相关推荐
百度百家号升级MCN机构合作政策 不达标机构或被清退处置
百度百家号发布关于《百家号MCN机构合作政策》升级的公告称,为了维护百家号平台健康、有序的内容生态,为更多原创作者提供良好的创作环境,自2024年1月8日起,《百家号MCN机构合作政策》(以下简称为“合作政策”)正式升级生效施行。百家号MCN机构准入、入驻后日常运营等各环节考察要求全面升级。0003Groq大模型推理芯片每秒500tokens超越GPU,喊话三年超过英伟达
划重点:1.Groq公司推出的大模型推理芯片,每秒500tokens的惊人速度超越了传统GPU,挑战谷歌TPU。2.该芯片由初创公司Groq研发,由谷歌TPU团队原班人马打造,推理速度提高10倍,成本降低十分之一,支持多种大模型。3.Groq的目标是在三年内超越英伟达,采用自创的LPU方案,克服计算密度和内存带宽瓶颈,实现18倍于云平台速度的推理性能。站长网2024-02-20 14:23:500000浙大研究团队推新AI框架Human101:单视角视频构就能重建3D数字人
划重点:🚀创新技术:Human101采用3D高斯散点技术,在仅一视角视频中以100秒训练时间生成动态、高保真的3D数字人体模型。🎮实时渲染:以100FPS的速度进行渲染,相较于先前方法实现更快速的渲染速度,提供可比较或更优渲染质量。💻开源项目:Human101将代码和演示发布于GitHub,为实时交互应用和沉浸式虚拟现实体验提供了可行性。站长网2023-12-29 17:03:450000没人想错过小红书的“红利”
一个月前,一位粉丝量接近2万的小红书母婴博主晒出了她2023年做博主的成果:单篇笔记报价3000元,一年到手总收入17.5万元。而她,只是千万个涌向小红书掘金的普通人之一。嗅觉灵敏的商家们,比普通人更早一步抵达小红书。曾上过小红书美护买手章小蕙直播间的护肤品牌东边野兽品牌创始人何一说,今年,小红书已经是他们营销预算投入最大的平台,包括在内容种草、商销、达播和自播方面的投入。站长网2023-12-22 17:17:050001Visa巧用AI防御系统对抗假日购物季欺诈
**划重点:**1.🎄Visa作为支付领导者,在假日购物季节面临巨大销售激增的同时,也迎来了网络犯罪分子的无情攻击,利用类似ChatGPT的人工智能工具进行欺诈。2.🤖Visa投入超过30亿美元用于人工智能和数据基础设施,构建强大的反欺诈系统。针对最新的威胁,Visa采用AI分析实时交易,以300毫秒内评估500个独特风险因素,准确定位犯罪活动。站长网2023-11-14 11:32:200001