元象开源多语言大模型XVERSE-13B 可免费商用
站长网2023-08-07 09:37:450阅
元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。
据介绍,XVERSE-13B 是由深圳元象科技自主研发的支持多语言的大语言模型(Large Language Model),基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。
主要特点如下:
模型结构:XVERSE-13B 使用主流 Decoder-only 的标准 Transformer 网络结构,支持8K 的上下文长度(Context Length),为同尺寸模型中最长,能满足更长的多轮对话、知识问答与摘要等需求,模型应用场景更广泛。
训练数据:构建了1.4万亿 token 的高质量、多样化的数据对模型进行充分训练,包含中、英、俄、西等40多种语言,通过精细化设置不同类型数据的采样比例,使得中英两种语言表现优异,也能兼顾其他语言效果。
分词:基于 BPE(Byte-Pair Encoding)算法,使用上百 GB 语料训练了一个词表大小为100,278的分词器,能够同时支持多语言,而无需额外扩展词表。
训练框架:经过对算子、通信、并行策略及调度等的优化,千卡集群上的峰值算力利用率达到58.5%,达到业界前列。
项目地址:https://github.com/xverse-ai/XVERSE-13B
0000
评论列表
共(0)条相关推荐
三大征兆已经出现,要过苦日子了?你有没有察觉
劳动力调查显示,目前职工总数4亿人左右,而快递员、网约配送员、网约车司机、货车司机等新就业形态劳动者8400万人,占据将近21%,另农民工2.9亿人;职工平均年龄38岁、平均受教育年限近14年(介于高中和大学之间)。电子商务、餐饮外卖和生鲜电商的兴起,推动了快递员、网约配送员这一职业的发展。网约车行业的兴起则是因为消费者对出行方式的需求变化,以及网约车平台的兴起和普及。站长网2023-04-17 18:04:320000对话吴欣鸿:美图AI首先追求帮用户赚到钱,应用窗口期就2年
在生成式AI浪潮中,场景玩家是易于忽视的群体,但往往又是低调中率先吃到红利的那一个。在海外,不论微软还是Adobe都是如此;在国内,美图(HK.1357)也在展现这样的趋势。作为一家曾经爆款产品频出、“美图”被名词作动词使用的公司,美图在AI浪潮里正在展现全新的气象。有模型,国内首批交出视频大模型,Sora横空出世后又率先拿出DiT架构升级更新;站长网2024-08-06 14:08:060000POCO:用于3D人体姿势和形状估计的新型人工智能框架
要点:通过2D图像估计3D人体姿态和形状是一个具有挑战性的任务,因为存在深度模糊、遮挡和不寻常的服装等问题。传统方法在估计不确定性时存在一些限制,而POCO框架提供了一种改进方法,可以在单个前向传递中同时推断姿态参数和不确定性。POCO框架引入了条件向量和图像特征来提高基本密度函数的建模,同时通过SMPL姿势来调整网络,从而提高了姿态重建和不确定性估计的准确性。站长网2023-10-16 10:31:370000科学期刊将引入AI工具Proofig检测图片欺诈
划重点:-科学期刊宣布采用商业软件Proofig,通过AI检测操控图像,防范研究欺诈。-尽管软件能够捕捉到一些最严重的图像篡改案例,但对于了解软件操作方式的欺诈者来说,仍有规避的可能。-图像篡改在科学研究中是一种常见欺诈手段,特别是在实验数据处理中。日前,科学期刊Science宣布其所有期刊将开始使用商业软件,自动检测不当篡改的图像。0000OpenAI与亚利桑那州立大学合作,AI进入高等教育领域
划重点:🔹亚利桑那州立大学与OpenAI合作,将AI技术应用于教育领域。🔹合作的重点包括提升学生的学术成功、开展创新研究和优化组织流程。🔹亚利桑那州立大学计划在2024年开始向学校全体师生提供ChatGPT企业版的完整使用权限。站长网2024-01-19 14:10:050000