元象开源多语言大模型XVERSE-13B 可免费商用
站长网2023-08-07 09:37:450阅
元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。
据介绍,XVERSE-13B 是由深圳元象科技自主研发的支持多语言的大语言模型(Large Language Model),基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。

主要特点如下:
模型结构:XVERSE-13B 使用主流 Decoder-only 的标准 Transformer 网络结构,支持8K 的上下文长度(Context Length),为同尺寸模型中最长,能满足更长的多轮对话、知识问答与摘要等需求,模型应用场景更广泛。
训练数据:构建了1.4万亿 token 的高质量、多样化的数据对模型进行充分训练,包含中、英、俄、西等40多种语言,通过精细化设置不同类型数据的采样比例,使得中英两种语言表现优异,也能兼顾其他语言效果。
分词:基于 BPE(Byte-Pair Encoding)算法,使用上百 GB 语料训练了一个词表大小为100,278的分词器,能够同时支持多语言,而无需额外扩展词表。
训练框架:经过对算子、通信、并行策略及调度等的优化,千卡集群上的峰值算力利用率达到58.5%,达到业界前列。
项目地址:https://github.com/xverse-ai/XVERSE-13B
0000
评论列表
共(0)条相关推荐
隐私浏览器Brave发布“匿名且安全”AI聊天机器人Leo 承诺不用户数据训练AI
划重点:-Brave推出Leo,声称提供无比安全的聊天机器人服务。-Leo可免费用于Brave桌面用户,计划未来几个月内在Android和iOS上推出。-Brave强调Leo的隐私保护,与其他聊天机器人相比,对话不被记录或用于训练AI模型,无需登录信息。隐私导向的浏览器Brave最近推出了名为Leo的本地AI助手,该公司声称相比其他AI聊天机器人服务,Leo提供了“无与伦比的隐私”。站长网2023-11-03 10:32:230000店群再见!小红书清退无货源电商
今天标题中提到了“店群”和“无货源”两个新词,对于博主们来说可能稍微有点陌生,但对于一些做电商的朋友,那是熟到家了。“无货源”你可能没听过,但是一件代发,可能就不陌生了,举个简单的例子更容易理解,你在小红书上开个店,自己没货还不想囤货咋办呢?站长网2023-08-31 09:12:420000GitHub Copilot主创离职创业,抱怨项目奖金仅2万刀,自立门户打造日常生活AI助手
官网已开启排队申请GitHubCopilot彻底改变了编程,背后的最大功臣获得了多少报酬呢?从开始到最终正式发布,只有2万美元奖金和一个头衔提升。他是AlexGraveley,Copilot团队的首席工程师和主架构师。更离谱的是,他不光没有得到应得的报酬,上头的副总裁后来还对他说“你不配得到晋升”。钱没给到位,委屈也受了。Alex老哥干脆离职,自己创业。站长网2023-07-15 16:26:330001微软发布AI工具 Recall,帮助你找到那些找不到的文件
划重点:🔍Microsoft推出RecallAI,为你的电脑提供了“照片记忆”功能。🔍只有CopilotPC系列才能使用这一功能,目前限定在特定型号电脑上。🔍RecallAI允许用户使用语音查询文件、网站或电子邮件,并通过AI进行索引和搜索。站长网2024-05-22 01:00:490000全面开放UGC入口,支付宝内容化想好了吗?
支付宝在内容化这条路上又向前一步。在众多“超级APP”如美团、微信等纷纷引入短视频和直播带货,投向内容化的当下,作为支付工具的支付宝也没有落下。11月7日,支付宝生活号宣布开放UGC入口,现在支持个人用户发布内容和参与话题。站长网2023-11-22 17:50:530000