元象XVERSE开源650亿参数通用大模型XVERSE-65B
站长网2023-11-06 10:41:070阅
元象XVERSE宣布 开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。
XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构,参数规模达到了650亿。
模型通过训练了2.6万亿个令牌的高质量多样化数据,包含了40多种语言。XVERSE-65B 具有16K 的上下文长度,适用于多轮对话、知识问答和摘要等任务。模型已在多个标准数据集上进行了测试,并取得了良好的性能。
主要特点如下:
模型结构:XVERSE-65B 使用主流 Decoder-only 的标准 Transformer 网络结构,支持16K 的上下文长度(Context Length),能满足更长的多轮对话、知识问答与摘要等需求,模型应用场景更广泛。
训练数据:构建了2.6万亿 token 的高质量、多样化的数据对模型进行充分训练,包含中、英、俄、西等40多种语言,通过精细化设置不同类型数据的采样比例,使得中英两种语言表现优异,也能兼顾其他语言效果。
分词:基于 BPE(Byte-Pair Encoding)算法,使用上百 GB 语料训练了一个词表大小为100,534的分词器,能够同时支持多语言,而无需额外扩展词表。
训练框架:自主研发多项关键技术,包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等,让训练效率更高,模型稳定性强,在千卡集群上的峰值算力利用率位居业界前列。
项目地址:https://github.com/xverse-ai/XVERSE-65B
0000
评论列表
共(0)条相关推荐
微信回应校园支付费率问题:依然保持零费率优惠政策
昨日晚间,针对“校园支付费率”相关问题,微信支付回应称,外面都在传费率要调到千分之六是假消息。微信解释称,校园学杂费自始至终保持零费率优惠政策,相关变动从不涉及此类场景。自2015年以来,微信支付自始至终在校园非盈利场景采取零费率优惠政策,相关变动从不涉及此类场景,微信支付将继续对因此产生的通道及运营成本进行补贴。站长网2023-06-30 19:48:450000《洛基》第二季宣传海报遭争议 涉嫌使用生成式AI
文章概要:-Disney的《洛基》第二季宣传海报因涉嫌部分使用生成AI而引发专业设计师的争议。-设计师指出,海报背景中的螺旋时钟图案显示出生成AI的迹象,引发了关于AI图像生成对创意社区的担忧。-Shutterstock规则禁止未使用其AI工具创建的生成AI内容在平台上获得许可,这引发了对该平台是否有效执行规则的疑虑。站长网2023-10-10 11:58:4100002023胡润百富榜发布:钟睒睒第一 马化腾第二
2023年10月24日,胡润研究院发布了最新的胡润百富榜。今年的榜单上,共有1241位个人财富超过50亿元人民币的企业家上榜,较去年减少了5%(64人)。上榜企业家的总财富也比去年下降了4%(1万亿),至23.5万亿元。此外,千亿级企业家减少至30人,十亿美金级企业家减少至895人。站长网2023-10-25 00:32:370000苹果iPhone16正式发售 订单状态变更为“已发货”
站长之家(ChinaZ.com)9月20日消息:今日上午8点,苹果公司最新智能手机iPhone16系列正式在各大线上平台和线下门店开售。据苹果中国官网的信息,目前购买iPhone16的用户可在9月24日收到新机,而iPhone16Plus的预计收货日期为10月10日。对于iPhone16Pro和iPhone16ProMax两款高端机型,官网显示的预计收货日期均为10月12日。站长网2024-09-20 23:40:400000大数据算法下的傻子共振!真想知道和我同温层的男人都是什么货色
原本以为互联网有一个很大的作用,就是能够让人们在网上开拓视野。学习和认识到平常在自己所接触到范围,不曾遇到的,一些知识和眼界!然而现实情况所得出的结论却是恰恰相反的!现在网络上有一个非常流行的词,就是傻子共振。傻子共振是在说什么呢?网络上的解释是个人认知和互联网的发展并不是正相关关系。在某种意义上来说是负相关关系。站长网2023-05-23 11:58:470000