阿里云通义千问开源Qwen2系列模型:性能显著提升 包含5个尺寸
站长网2024-06-07 09:41:290阅
阿里巴巴悄悄发布了 Qwen2系列模型,这是 Qwen1.5升级后的重大更新。
Qwen2系列包含了5个不同规模的预训练和指令微调模型,分别是 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。这些模型在处理长文本时支持不同的上下文长度,最大可达128K tokens。

Qwen2系列在多语言方面做了优化,增加了27种语言的高质量数据,并针对常见的语言转换问题进行了优化。模型在多项评测中表现优异,包括自然语言理解、知识、代码、数学和多语言理解等能力,显著超越之前的 Qwen1.5和其他开源模型。
在代码和数学能力方面,Qwen2系列持续提升,特别是在多种编程语言上的表现和数学解题能力方面有显著提升。模型还能处理长文本任务,其中 Qwen2-72B-Instruct 能完美处理128k 上下文长度内的信息抽取任务。
在安全性方面,Qwen2-72B-Instruct 模型与 GPT-4表现相当,显著优于 Mistral-8x22B 模型。所有模型均已开源在 Hugging Face 和 ModelScope 上,可在各种应用场景中使用。未来,Qwen 团队还将继续训练更大的模型,探索模型及数据的 Scaling Law,并将 Qwen2扩展成多模态模型。
项目地址:https://github.com/QwenLM/Qwen2
0000
评论列表
共(0)条相关推荐
华为汪涛:2023年华为销售收入超7000亿元 经营基本回归常态
快科技3月14日消息,今日,华为在深圳举办华为2024年合作伙伴大会”主题为因聚而生数智有为”。据媒体报道,华为常务董事、ICT基础设施业务管理委员会主任汪涛在主题演讲中表示,经过多年的艰苦努力,华为经受住了严峻的考验。2023年,华为公司经营基本回归常态,整体经营稳健,全球的销售收入超过7000亿元人民币,实现了超过9%的增长。其中华为中国区的企业业务收入取得了超过25%的快速增长。站长网2024-03-14 14:00:180002OpenAI宫斗参与者融了5.3亿,立刻给开发者分钱一起对抗GPT Store
如果你的产品新年开门红,拿到八位数美元融资,你会怎么花?美国在线知识问答社区鼻祖Quora的决定是:果断发钱!近日,Quora联合创始人兼首席执行官AdamD'Angelo发文宣布,已从硅谷风投巨擘AndreessenHorowitz处筹集7500万美元。这笔资金将用于加速公司AI聊天平台Poe的发展,其中大部分会投入支持AI开发者的创作货币化。站长网2024-01-30 17:24:330000微信公众号不服老,想要用社交赋能内容传播
凭借对图文内容的降维打击,短视频可谓是大杀四方,已然成为了占据最多用户时长的内容形式。由此也使得曾经在图文时代一呼百应的微信公众号,如今也风光不再。相关数据显示,2017年微信公众号文章的平均打开率曾高达10%,但到了2020年便已降至1-2%。此外新榜方面发布的数据显示,2024年微信公众号累计产出超过4.44亿篇文章,其中有30.78万篇阅读量达到10万、占比不足0.07%。0000打完《黑神话:悟空》第一关,纠结半天,我准备说点儿真话
上周三(6月12日),葡萄君受游戏科学邀请,参加了《黑神话:悟空》最新的一次线下闭门试玩。怎么说呢,评价《黑神话:悟空》向来不是件容易的事情,因为它太特殊了,会让人觉得这产品珍贵且易碎。从媒体角度来说,说好话当然最没风险,但这容易给产品制造出危险的市场预期;说得谨慎了,又会让人误以为我们在唱衰产品,对国产过于苛刻。站长网2024-06-17 11:41:450000贾跃亭:早日回国是我最大梦想 还债之日就是回国之时
快科技4月25日消息,今天下午贾跃亭发布最新视频称:早日还债回国是自己的最大梦想,已偿还100多亿美金债务。造车成功并还债之日就是自己回国之时。以下是贾跃亭视频文字版:0000