首页站长资讯元象开源高性能大模型XVERSE-65B-2底座版提升代码和数学能力

元象开源高性能大模型XVERSE-65B-2底座版提升代码和数学能力

站长网2023-12-19 08:49:120阅

元象宣布开源高性能大模型 XVERSE-65B-2底座版，专项提升其代码和数学能力，并保持了上一代强大的生成创作、角色扮演与工具使用等能力，为生态献上了一个 “文理兼修、大有可为” 的大模型。

XVERSE-65B-2在上一代基础上通过综合优化器状态、学习率调节策略和采样比进行了 Continual Pre-Training，训练 token 总量达3.2万亿;模型支持中、英、俄、法等40多种语言，上下文窗口为16K。

元象大模型系列坚持 “高性能” 定位，在研究人员参考一系列权威学术测评制定的六个维度、11项主流测评标准中，XVERSE-65B-2在八成测评中超越了 GPT3.5，并全面超越开源标杆 Llama2-70B 和 Falcon-180B;与 GPT4仍有差距。

最新发布的 SuperCLUE 中文通用大模型综合测评，在1052道多轮简答题和3213道客观选择题测试中，XVERSE-65B 在国内开源模型中总分第一，展现了出众实力。

与7B、13B 相比，65B 显著提升大模型的理解、生成、逻辑和记忆等能力，可处理更多样、更困难的任务，如构建智能体（AI Agent），也通过高质量数据与搜索增强，极大降低了模型幻觉问题。

至此，元象共开源70亿、130亿、650亿参数的3款大模型，其中 XVERSE-65B 为国内最早开源、最大参数的免费商用模型。

项目地址：

Github:https://github.com/xverse-ai/XVERSE-65B

Hugging Face:https://huggingface.co/xverse/XVERSE-65B-2

ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-65B-2

元象开源高性能大模型XVERSE65B2底座版提升代码和数学能力

0000

评论列表

共(0)条

相关推荐

站长资讯
谷歌将使用类似Bard的AI技术升级 Assistant 助手功能
谷歌计划通过AI技术的升级来更新Assistant助手。这意味着Assistant将变得更加强大和智能，可能会具备类似于ChatGPT和Bard的功能。
站长网2023-08-01 10:02:18
0000
站长资讯
OpenAI最新功能：多GPTs协同工作 @谁，谁出来干活
要点:1、OpenAI的新功能允许用户在对话中@不同的GPT，实现多个GPT协同配合完成任务。2、该功能使得使用GPT的方式更加中心化，可以实现多个GPT的联动协作。3、用户可以通过@不同的GPT完成复杂任务，如论文代码提取、PPT制作等。
站长网2024-01-29 10:01:06
0003
站长资讯
vivo Y200 GT发布：1499元配备6000mAh电池
站长之家（ChinaZ.com）5月20日消息:今日下午，vivo正式推出了其最新款手机——Y200GT。在售价方面，vivoY200GT提供了多种存储容量的选择，满足了不同用户的需求。其中，8GB128GB的版本售价为1499元，8GB256GB的版本售价为1599元，而12GB256GB的版本售价为1799元，顶配版的12GB512GB售价更是达到了2099元。
站长网2024-05-20 22:11:00
0000
站长资讯
小米14系列、小米13系列等正式升级WiFi 7
小米手机宣布，小米14全系列、小米13全系列、XiaomiMIXFold3正式升级WiFi7。上述机型WiFi7功能将于近期陆续推送。据了解，WiFi7功能需要手机、路由器均支持才可正常使用。第七代WiFi无线网络，速度可高达30Gbps，是WiFi6最高9.6Gbps速率的三倍之多。除传统的2.4GHz和5GHz两个频段，还将新增支持6GHz频段，更快网速、更低延迟、更抗干扰。
站长网2023-12-05 10:32:24
0000
Gemini背后，谷歌真正可怕之处并不在模型本身
谷歌的大语言模型Gemini1.0，一经问世就技惊四座。首先在性能方面，无论是从对文本、图像、音频的理解，还是对57种领域文本以及数学问题的推理，几乎都超过了自然语言界的霸主GPT-4。而且在谷歌Gemini的官网上还有这一段话，内容是“Gemini是第一个在MMLU（海量多任务语言理解）上超过人类专家的模型”。
站长网站长资讯2023-12-11 14:14:00
0000