元象开源高性能大模型XVERSE-65B-2底座版 提升代码和数学能力
元象宣布开源高性能大模型 XVERSE-65B-2底座版,专项提升其代码和数学能力,并保持了上一代强大的生成创作、角色扮演与工具使用等能力,为生态献上了一个 “文理兼修、大有可为” 的大模型。
XVERSE-65B-2在上一代基础上通过综合优化器状态、学习率调节策略和采样比进行了 Continual Pre-Training,训练 token 总量达3.2万亿;模型支持中、英、俄、法等40多种语言,上下文窗口为16K。
元象大模型系列坚持 “高性能” 定位,在研究人员参考一系列权威学术测评制定的六个维度、11项主流测评标准中,XVERSE-65B-2在八成测评中超越了 GPT3.5,并全面超越开源标杆 Llama2-70B 和 Falcon-180B;与 GPT4仍有差距。
最新发布的 SuperCLUE 中文通用大模型综合测评,在1052道多轮简答题和3213道客观选择题测试中,XVERSE-65B 在国内开源模型中总分第一,展现了出众实力。
与7B、13B 相比,65B 显著提升大模型的理解、生成、逻辑和记忆等能力,可处理更多样、更困难的任务,如构建智能体(AI Agent),也通过高质量数据与搜索增强,极大降低了模型幻觉问题。
至此,元象共开源70亿、130亿、650亿参数的3款大模型,其中 XVERSE-65B 为国内最早开源、最大参数的免费商用模型。
项目地址:
Github:https://github.com/xverse-ai/XVERSE-65B
Hugging Face:https://huggingface.co/xverse/XVERSE-65B-2
ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-65B-2
微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2
要点:1、微软研究人员推出了一个仅有13亿参数的LLM模型Phi-1.5。2、Phi-1.5在常识推理任务上表现优异,优于多个参数量十倍以上的模型。3、研究表明,模型参数规模不是决定性因素,高质量数据更为重要。微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5,该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现,因为这是对语言模型能力的重要考验。站长网2023-09-18 10:01:440000折叠屏标杆三星Galaxy Z Fold4体验如何?2023年三星手机选购指南
三星手机曾经一度是国内手机市场的王者,后来因为各种因素导致国内市场份额不高。不过三星电子是全球唯一一家在芯片、屏幕、镜头、存储等几乎所有智能手机关键零部件领域拥有全产业链优势的手机厂商,其旗舰产品的发布依然是每年手机行业的“大事件”,旗下的GalaxyS系列是每年“安卓机皇”的强有力竞争者。站长网2023-05-24 06:08:550000HeyGen 发布5.0版本 上线实时数字人聊天和视频翻译功能
近日,HeyGen发布了其全新的5.0版本,这一版本整合了所有功能,为用户带来了更加便捷的体验。新版本在用户界面、视频编辑、实时聊天等方面都进行了全面的升级,以满足用户对于高效、智能的需求。产品入口:https://top.aibase.com/tool/heygen-5-0站长网2024-03-23 17:11:560000新加坡投资5200万美元计划发展东南亚大语言模型
**划重点:**1.🌐**国家级计划启动:**新加坡投资5200万美元美元,启动了国家多模态大语言模型计划,旨在发展东南亚语言模型,填补当前以西方为主的语言模型的关键空白。站长网2023-12-05 15:32:260003郭明錤:技术问题导致苹果 iPhone 15 Pro 机型将不再采用固态按钮
根据苹果分析师郭明錤分享的最新信息,下一代iPhone15Pro和iPhone15ProMax将不再采用固态按钮,原因是「在大规模生产前尚未解决技术问题」。站长网2023-04-12 14:08:130001