阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo
站长网2024-05-09 19:41:540阅
阿里云今日正式发布通义千问2.5版本,该版本在模型性能上全面赶超了GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩,超越了Meta的Llama-3-70B模型,成为开源领域的新星。
与通义千问2.1版本相比,2.5版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言,理解能力提升了9%,逻辑推理能力提升了16%,指令遵循能力提升了19%,而代码能力则提升了10%。这一飞跃性的进步使得通义千问2.5在权威基准OpenCompass上的得分与GPT-4Turbo持平,证明了其在自然语言处理领域的领先地位。

除了通义千问2.5的发布,通义还推出了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在MMLU、TheoremQA、GPQA等基准测评中均表现出色,成功超越了Meta的Llama-3-70B模型。在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B更是荣登榜首,进一步巩固了通义开源系列在业界的领先地位。
通义的多模态模型和专有能力模型同样令人瞩目。其中,通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V,其强大的视觉理解能力已经在实际应用中得到了广泛验证。而通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,展现了其在代码生成和代码理解方面的卓越能力。
这一模型的推出不仅满足了开发者对于高效代码生成的需求,也为企业客户提供了更为智能的代码管理和优化解决方案。
0000
评论列表
共(0)条相关推荐
苹果新一代AirPods和AirPods Max有望年底推出 支持USB-C接口
根据最新外媒报道,长期追踪苹果动态的资深记者近日透露,苹果公司正计划于今年年底推出新一代AirPods和AirPodsMax,并给出了更具体的预期。站长网2024-02-21 14:08:260000播放超2亿、涨粉300万,传统文化成短视频流量宠儿?
一个短视频,单平台播放量2亿,带动账号全网涨粉近300万,究竟有何“魔力”?近日,因为一个雕冰龙视频,曾被称为“下一个李子柒”、传统文化短视频达人江寻千火了。而这并不是她首次走红。从“打铁花”到“雕冰龙”,可以看到传统文化短视频内容的热度持续走高。从去年至今,更有众多凭借传统文化内容涨粉百万、爆火出圈的短视频达人。背后原因是为何?这些达人在打造爆款、吸引流量之后,变现情况又如何?站长网2024-03-01 09:37:250000GitHub Accelerator 2024扶持11个开源 AI 项目 推动技术创新
GitHub最新宣布了其2024年加速器计划,将支持11个前沿的开源人工智能项目。这些入选项目涵盖了机器学习框架、生物医学研究、AI模型测试平台等多个领域,旨在推动AI技术的创新和应用。根据计划,每个入选项目将获得高达40,000美元的赞助资金,以及多达350,000美元的技术支持。这些资源来自GitHub及其合作伙伴,包括MicrosoftAzure。站长网2024-05-24 11:42:080000英伟达市值逼近全球第一苹果:达3.5万亿美元破纪录
在人工智能技术的推动下,英伟达公司,这家专注于AI芯片生产的企业,其市值实现了飞跃式的增长。截至美国时间21日,英伟达的市值达到了3.525万亿美元,首次突破了3.5万亿美元的大关,刷新了公司的历史纪录。目前,英伟达的市值正在接近全球科技巨头苹果公司,后者的市值约为3.596万亿美元。分析认为,英伟达有潜力在不久的将来超越苹果,成为全球科技企业中市值最高的公司。站长网2024-10-22 12:07:350000微信正式推出视频号青少年内容分级 可定向获取内容推荐
站长之家(ChinaZ.com)5月28日消息:微信官方近日宣布,为更好地满足青少年用户的需求,特别推出了四个量身定制的微信功能。这些功能不仅让青少年用户能够在网络世界中保持自律,也为中年用户提供了全新的管理视角。家有青少年的家长们,更是不能错过这一重要更新。站长网2024-05-28 19:35:410000