阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo
站长网2024-05-09 19:41:540阅
阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩,超越了Meta的Llama-3-70B模型,成为开源领域的新星。
与通义千问2.1版本相比,2.5版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言,理解能力提升了9%,逻辑推理能力提升了16%,指令遵循能力提升了19%,而代码能力则提升了10%。这一飞跃性的进步使得通义千问2.5在权威基准OpenCompass上的得分与GPT-4Turbo持平,证明了其在自然语言处理领域的领先地位。
除了通义千问2.5的发布,通义还推出了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在MMLU、TheoremQA、GPQA等基准测评中均表现出色,成功超越了Meta的Llama-3-70B模型。在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B更是荣登榜首,进一步巩固了通义开源系列在业界的领先地位。
通义的多模态模型和专有能力模型同样令人瞩目。其中,通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V,其强大的视觉理解能力已经在实际应用中得到了广泛验证。而通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,展现了其在代码生成和代码理解方面的卓越能力。
这一模型的推出不仅满足了开发者对于高效代码生成的需求,也为企业客户提供了更为智能的代码管理和优化解决方案。
0000
评论列表
共(0)条相关推荐
马斯克星舰今晚第三次试飞 将首次尝试新技术
今日,马斯克旗下美国太空探索巨头SpaceX在备受瞩目的声明中公布,计划于3月14日进行星舰(Starship)的第三次试飞。此次发射的关键时间窗口设定在北京时间今晚20:00起的110分钟内,备受全球航天爱好者的关注。据悉,这次试飞任务将带来一个重大的技术突破:SpaceX将首次在太空中对猛禽发动机进行重新点火测试。这一技术的成功应用,将极大地提升星舰在未来太空探索任务中的灵活性和可靠性。站长网2024-03-14 10:28:220000华为P60、Mate 50等35款设备升级HarmonyOS 4.2正式版
华为今日宣布,包括P60、Mate50、MateX3系列在内的35款设备将正式升级至HarmonyOS4.2系统。此次升级不仅限于智能手机,还涵盖了耳机、手表、智慧屏和家庭存储等多款智能设备,标志着华为在构建全场景智慧生态方面迈出了重要一步。站长网2024-05-21 10:53:200000元象开源70亿参数通用大模型 XVERSE-7B 免费可商用
元象宣布开源70亿参数通用大模型XVERSE-7B底座与对话版,这是一款全开源、免费可商用的模型。相比之前的XVERSE-13B,7B版本更小巧,可以在单张消费级显卡上运行,并且推理量化后最低只需6GB显存,大大降低了开发门槛和推理成本。该模型在多项权威测试中表现出色,并具有强大的认知、规划、推理和记忆能力,支持40多种语言。站长网2023-09-27 08:52:580000iPhone史诗级变革!iOS 17.2代码深挖:可从App Store外安装应用
快科技11月12日消息,苹果近日推送了iOS17.2Beta2开发者测试版,有国外媒体对其代码进行了深挖,发现了用户可以从AppStore外侧载应用的相关证据。该网站表示,代码显示iOS17.2中引入了名为ManagedAppDistribution”的通用框架,其中关联的API具有从外部下载、安装甚至更新应用的基础控件。站长网2023-11-12 10:25:0400068