南方科技大学联合IDEA研究院发布 SUS-Chat-34B 双语模型
站长网2023-12-11 09:02:331阅
南方科技大学联合 IDEA 研究院 CCNL 中心发布了 SUS-Chat-34B,这是一个参数规模为340亿的双语模型。该模型在众多中英文任务上表现出色,超越了其他同参数规模的模型。
SUS-Chat-34B基于01-ai/Yi-34B 预训练模型通过数百万高质量、多语言的指令数据进行了微调。
模型具有以下亮点:
大规模复杂指令跟随数据:使用1.4B token的高质量复杂指令数据进行训练,涵盖中英文、多轮对话、数学、推理等多种指令数据;
强大的通用任务性能:SUS-Chat-34B模型在众多主流的中英文任务上表现出色,其效果超越了相同参数规模的其他开源的指令微调模型。即使与更大参数规模的模型相比,SUS-Chat-34B模型也具有不错的竞争力
更长的上下文窗口与出色的多轮对话能力:SUS-Chat-34B原生支持8K的上下文窗口,在大量多轮指令以及单多轮混合数据中进行训练,具有出色的长文本对话信息关注与指令跟随能力。
开源地址:
https://modelscope.cn/models/SUSTC/SUS-Chat-34B/summary
0001
评论列表
共(0)条相关推荐
小米Civi 3正式发布 售价2499元起
今日,小米Civi3手机正式发布,该手机拥有6.55英寸120Hz曲面屏幕,1920Hz高频调光,峰值亮度1500nit,71.5mm宽度,7.56mm宽度,重量为173.5g。除此之外,该手机还配备了4500毫安时电池和67W快充技术,搭载联发科天玑8200-Ultra处理器,4000平方毫米VC液冷散热面积,以及小米影像大脑技术。站长网2023-05-25 14:55:370002淘宝修改销量显示规则 由30天月销变为近365天已售件数
淘宝最近修改了销量显示规则,将原来的30天月销改为显示近365天累计已销售件数,并排除了不诚信经营和售中退款等销量。这一改变对于用户、商家和平台都是利好。首先,这个规则鼓励商家在平台上实现长久稳健经营,打造长远品牌。其次,对于新品和新商家,淘宝提供了更多机会,促进创新和原创保护。最后,这一规则激发了中小商家的活力,帮助他们获得持续激励。站长网2023-08-19 15:33:110000GitHub发布嵌入式数据库txtai:集成语义搜索、LLM编排和工作流
GitHub最近发布了一款名为txtai的全新工具,这是一款嵌入式数据库,它具有语义搜索、LLM编排和语言模型工作流的综合功能。这个工具可以将多种功能和应用程序集成在一起,为开发人员提供一个全新的、一体化的解决方案。通过txtai,开发者可以更方便地进行复杂的语义搜索,进行高效的语言模型工作流设计和管理。项目地址:https://github.com/neuml/txtai站长网2023-08-22 14:14:320000ChatGPT、Claude等聚合平台Poe,获7500万美元融资
1月11日,生成式AI聊天助手聚合平台Poe,获得7500万美元(约5.3亿美元),估值5亿美元(约35.8亿元)。本次由AndreessenHorowitz、a16z等投资。0000AIwechat-Vercel:无需服务器即可将AI功能集成到公众号中
AIwechat-Vercel是一款创新的微信公众号插件,它利用Vercel的ServerlessFunctions提供后端服务,使得用户无需自己管理服务器,只需一个可以绑定到Vercel的域名(无需备案),即可实现将AI功能集成到微信公众号中。项目地址:https://github.com/pwh-pwh/aiwechat-vercel站长网2024-03-11 12:03:270000