元象开源多语言大模型XVERSE-13B 可免费商用
站长网2023-08-07 09:37:450阅
元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。
据介绍,XVERSE-13B 是由深圳元象科技自主研发的支持多语言的大语言模型(Large Language Model),基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。
主要特点如下:
模型结构:XVERSE-13B 使用主流 Decoder-only 的标准 Transformer 网络结构,支持8K 的上下文长度(Context Length),为同尺寸模型中最长,能满足更长的多轮对话、知识问答与摘要等需求,模型应用场景更广泛。
训练数据:构建了1.4万亿 token 的高质量、多样化的数据对模型进行充分训练,包含中、英、俄、西等40多种语言,通过精细化设置不同类型数据的采样比例,使得中英两种语言表现优异,也能兼顾其他语言效果。
分词:基于 BPE(Byte-Pair Encoding)算法,使用上百 GB 语料训练了一个词表大小为100,278的分词器,能够同时支持多语言,而无需额外扩展词表。
训练框架:经过对算子、通信、并行策略及调度等的优化,千卡集群上的峰值算力利用率达到58.5%,达到业界前列。
项目地址:https://github.com/xverse-ai/XVERSE-13B
0000
评论列表
共(0)条相关推荐
抖音:开展“同质化网络水军”专项治理
抖音官方发文称,近日,在平台巡检时发现,有部分用户在平台上利用低质雷同素材批量制作视频,博取流量后通过各类营销方式变现。站长网2024-05-10 11:29:400000对标奔驰S级、宝马7系 华为享界S9开启预售:45-55万元
快科技5月31日消息,刚刚,华为车BU董事长余承东官宣,鸿蒙智行全新品牌车型享界S9开启预售,售价45-55万元。该车由华为和北汽合作打造,定位于高端市场,长宽高为5160*1987*1486mm,轴距达到了3050mm,设计层面遵循了鸿蒙智行极致,纯净,简约”的美学原则,采用全新家族化设计语言。站长网2024-06-01 21:16:090001B站京东再度深度合作京火计划双11期间正式上线
据报道,B站与京东在双11期间达成深度合作,共同推出了名为“京火计划”的数据生态共建项目。这也是继去年B站与淘宝推出“星火计划”后,B站与电商平台的数据合作再次升级。站长网2023-10-30 14:24:190000仿劲舞团直播32.1万人在线 团播会是下一个风口?
几个月前,直观曾给大家分享过“非主流”席卷午夜娱播的案例。本来以为这股怀旧风只限于唱歌的直播间,没想到现在团播也被席卷。最近在抖音的团播中,很多团队主播开始以一身“非主流”的妆造出现在屏幕前,并以80/90曾经最流行的音游作为背景,将整场直播打造成一个怀旧的游戏场景。站长网2023-11-20 20:37:380000OpenAI开发全新AI人机对话技术 支持识别物体和图像
据TheInformation消息,OpenAI正筹备展示一种革命性的人机对话技术。据可靠消息,这一技术将结合声音和文本,不仅能与用户进行流畅的交流,还具备识别物体和图像的能力,为用户带来前所未有的交互体验。ChatGPT的开发团队已经向部分客户展示了这一技术的部分功能,其中包括一项引人注目的特点:其逻辑推理能力远超现有产品。这一进步预示着AI在理解和处理复杂信息方面的能力将得到显著提升。站长网2024-05-11 11:37:520000