阿里云通义千问开源Qwen2系列模型：性能显著提升包含5个尺寸

站长网2024-06-07 09:41:290阅

阿里巴巴悄悄发布了 Qwen2系列模型，这是 Qwen1.5升级后的重大更新。

Qwen2系列包含了5个不同规模的预训练和指令微调模型，分别是 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。这些模型在处理长文本时支持不同的上下文长度，最大可达128K tokens。

Qwen2系列在多语言方面做了优化，增加了27种语言的高质量数据，并针对常见的语言转换问题进行了优化。模型在多项评测中表现优异，包括自然语言理解、知识、代码、数学和多语言理解等能力，显著超越之前的 Qwen1.5和其他开源模型。

在代码和数学能力方面，Qwen2系列持续提升，特别是在多种编程语言上的表现和数学解题能力方面有显著提升。模型还能处理长文本任务，其中 Qwen2-72B-Instruct 能完美处理128k 上下文长度内的信息抽取任务。

在安全性方面，Qwen2-72B-Instruct 模型与 GPT-4表现相当，显著优于 Mistral-8x22B 模型。所有模型均已开源在 Hugging Face 和 ModelScope 上，可在各种应用场景中使用。未来，Qwen 团队还将继续训练更大的模型，探索模型及数据的 Scaling Law，并将 Qwen2扩展成多模态模型。

项目地址:https://github.com/QwenLM/Qwen2

阿里云通义千问开源Qwen2系列模型性能显著提升包含5个尺寸

0000

评论列表

共(0)条

相关推荐

站长资讯
华为汪涛：2023年华为销售收入超7000亿元经营基本回归常态
快科技3月14日消息，今日，华为在深圳举办华为2024年合作伙伴大会”主题为因聚而生数智有为”。据媒体报道，华为常务董事、ICT基础设施业务管理委员会主任汪涛在主题演讲中表示，经过多年的艰苦努力，华为经受住了严峻的考验。2023年，华为公司经营基本回归常态，整体经营稳健，全球的销售收入超过7000亿元人民币，实现了超过9%的增长。其中华为中国区的企业业务收入取得了超过25%的快速增长。
站长网2024-03-14 14:00:18
0002
站长资讯
OpenAI宫斗参与者融了5.3亿，立刻给开发者分钱一起对抗GPT Store
如果你的产品新年开门红，拿到八位数美元融资，你会怎么花?美国在线知识问答社区鼻祖Quora的决定是:果断发钱!近日，Quora联合创始人兼首席执行官AdamD'Angelo发文宣布，已从硅谷风投巨擘AndreessenHorowitz处筹集7500万美元。这笔资金将用于加速公司AI聊天平台Poe的发展，其中大部分会投入支持AI开发者的创作货币化。
站长网2024-01-30 17:24:33
0000
微信公众号不服老，想要用社交赋能内容传播
凭借对图文内容的降维打击，短视频可谓是大杀四方，已然成为了占据最多用户时长的内容形式。由此也使得曾经在图文时代一呼百应的微信公众号，如今也风光不再。相关数据显示，2017年微信公众号文章的平均打开率曾高达10%，但到了2020年便已降至1-2%。此外新榜方面发布的数据显示，2024年微信公众号累计产出超过4.44亿篇文章，其中有30.78万篇阅读量达到10万、占比不足0.07%。
站长网站长资讯2025-04-07 09:38:00
0000
站长资讯
打完《黑神话：悟空》第一关，纠结半天，我准备说点儿真话
上周三（6月12日），葡萄君受游戏科学邀请，参加了《黑神话:悟空》最新的一次线下闭门试玩。怎么说呢，评价《黑神话:悟空》向来不是件容易的事情，因为它太特殊了，会让人觉得这产品珍贵且易碎。从媒体角度来说，说好话当然最没风险，但这容易给产品制造出危险的市场预期;说得谨慎了，又会让人误以为我们在唱衰产品，对国产过于苛刻。
站长网2024-06-17 11:41:45
0000
贾跃亭：早日回国是我最大梦想还债之日就是回国之时
快科技4月25日消息，今天下午贾跃亭发布最新视频称：早日还债回国是自己的最大梦想，已偿还100多亿美金债务。造车成功并还债之日就是自己回国之时。以下是贾跃亭视频文字版：
站长网站长资讯2024-04-26 00:47:31
0000