元象XVERSE开源650亿参数通用大模型XVERSE-65B
站长网2023-11-06 10:41:070阅
元象XVERSE宣布 开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。
XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构,参数规模达到了650亿。
模型通过训练了2.6万亿个令牌的高质量多样化数据,包含了40多种语言。XVERSE-65B 具有16K 的上下文长度,适用于多轮对话、知识问答和摘要等任务。模型已在多个标准数据集上进行了测试,并取得了良好的性能。

主要特点如下:
模型结构:XVERSE-65B 使用主流 Decoder-only 的标准 Transformer 网络结构,支持16K 的上下文长度(Context Length),能满足更长的多轮对话、知识问答与摘要等需求,模型应用场景更广泛。
训练数据:构建了2.6万亿 token 的高质量、多样化的数据对模型进行充分训练,包含中、英、俄、西等40多种语言,通过精细化设置不同类型数据的采样比例,使得中英两种语言表现优异,也能兼顾其他语言效果。
分词:基于 BPE(Byte-Pair Encoding)算法,使用上百 GB 语料训练了一个词表大小为100,534的分词器,能够同时支持多语言,而无需额外扩展词表。
训练框架:自主研发多项关键技术,包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等,让训练效率更高,模型稳定性强,在千卡集群上的峰值算力利用率位居业界前列。
项目地址:https://github.com/xverse-ai/XVERSE-65B
0000
评论列表
共(0)条相关推荐
编剧、导演福音!StoriaBoard:由AI驱动的故事可视化工具
StoriaBoard是一款由先进的生成式人工智能技术驱动的下一代故事板工具,旨在帮助创作者和制片人将他们的创意变成大银幕上的杰作。无论您是一名编剧、导演还是制片人,StoriaBoard都为您提供了强大的工具,以更轻松、更高效地规划和可视化您的故事。体验地址:https://app.storia.ai/核心功能:站长网2023-09-28 16:01:580001从9块9到1149,谁在为AIGC买单?
“在AIGC时代,如果不能在第一天就向用户收费,那么就永远都不可能收到用户的钱。”妙鸭相机产品负责人张月光的一席话不仅点明了妙鸭相机背后的商业思考,同时也揭露了AIGC产品进退不得的商业化困局。AIGC技术尚未进化至完成态,技术的局限与算力成本的重压令AIGC产品“进不得”。站长网2023-08-12 09:50:210000报道称爆火的AI大模型 Kimi 每天获客成本或超20万元
划重点:-💥Kimi投放广告的每个用户获客成本约在10元,考虑到用户问答互动产生的算力成本,每个用户的获客成本达到12-13元。-💰近一个月来,Kimi在苹果端和安卓端的日均下载量为17805,每天的获客成本将烧掉至少20万元。-📈Kimi大模型在AI行业引起轰动,成为引领长文本处理新浪潮的领军者。站长网2024-03-25 19:11:200000iPhone电池门赔偿金开始发放 网友不买账
近日,iPhone电池门的赔偿金已经开始发放,引起了不少网友的关注。据了解,这起事件始于2017年美国用户对苹果起诉,涉及了iPhone6系列、iPhone7系列等机型。0000继苹果DMA变更后,Opera 将在欧洲推出适用于 iOS 的全新 AI 浏览器
站长之家(ChinaZ.com)1月29日消息:挪威浏览器开发商Opera今天宣布,他们计划在欧洲推出一款全新的人工智能浏览器,该浏览器将基于Opera自家的iOS引擎构建。这一宣布是在苹果公司表示将允许替代浏览器引擎在iOS上运行之后的消息,这一变化是应欧洲数字市场法案(DMA)的要求。站长网2024-01-29 09:33:590001