阿里云通义千问开源Qwen2系列模型:性能显著提升 包含5个尺寸
站长网2024-06-07 09:41:290阅
阿里巴巴悄悄发布了 Qwen2系列模型,这是 Qwen1.5升级后的重大更新。
Qwen2系列包含了5个不同规模的预训练和指令微调模型,分别是 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。这些模型在处理长文本时支持不同的上下文长度,最大可达128K tokens。
Qwen2系列在多语言方面做了优化,增加了27种语言的高质量数据,并针对常见的语言转换问题进行了优化。模型在多项评测中表现优异,包括自然语言理解、知识、代码、数学和多语言理解等能力,显著超越之前的 Qwen1.5和其他开源模型。
在代码和数学能力方面,Qwen2系列持续提升,特别是在多种编程语言上的表现和数学解题能力方面有显著提升。模型还能处理长文本任务,其中 Qwen2-72B-Instruct 能完美处理128k 上下文长度内的信息抽取任务。
在安全性方面,Qwen2-72B-Instruct 模型与 GPT-4表现相当,显著优于 Mistral-8x22B 模型。所有模型均已开源在 Hugging Face 和 ModelScope 上,可在各种应用场景中使用。未来,Qwen 团队还将继续训练更大的模型,探索模型及数据的 Scaling Law,并将 Qwen2扩展成多模态模型。
项目地址:https://github.com/QwenLM/Qwen2
0000
评论列表
共(0)条相关推荐
又能听相声了!罗永浩官宣重回脱口秀:腾讯视频、爱奇艺两档节目
快科技8月15日消息,今日,罗永浩的辟谣号”宣布自己将加入爱奇艺《喜剧之王单口季》与腾讯视频的《脱口秀和Ta的朋友们》两档节目。罗永浩转发微博,称不管是做喜剧之王单口季,还是做脱口秀和Ta的朋友们,总之,有大局观很重要。有网友表示,又可以听相声了”哈哈哈哈哈哈!我就知道!!!还是脱口秀是你的天下!!!”。站长网2024-08-16 08:42:250000报告:第三季度全球生成式AI应用支出突破1.25亿美元 创新高
据data.ai公布数据显示,生成式人工智能(AIGC)APP第三季度全球用户支出已突破1.25亿美元(不包括第三方Android商店)。data.ai表示,尽管用户支出创下纪录,并实现9%季度环比增长,但AIGC类别涨幅最大的阶段其实发生在2023年的第2季度。站长网2023-11-03 10:27:500000韩国KT将在首尔建设人工智能医疗研发创新区
文章概要:1.韩国无线运营商KT公司计划在首尔东大门地区建设人工智能医疗研发创新区。2.该项目是与Sahmyook医疗中心和医疗大数据公司Humanitas签署的协议的一部分,旨在创建高科技的AI医疗研发创新区。3.目标是在医院的闲置用地上建立紧急医疗系统,支持医疗数据的研发活动,计划于2028年完成。站长网2023-09-18 11:38:070000土味神曲,占领抖音?
“鲁A济南车”,“鲁B青岛的”,“鲁C淄博鲁D枣庄东营是鲁E……”眼下,这是一曲在抖音颇为火爆甚至可以说是最为火爆的BGM,如果你对山东车牌有基本的了解,那么接下来的歌词将会在相似的旋律里不断循环,直至“莱芜挂着鲁S,潍坊还拉了个”。站长网2024-07-11 20:34:490002李沐大模型公司细节曝光,项目GitHub空仓标星超500
AI大神李沐大模型创业方向,终于“水落石出”:利用大模型能力,做游戏引擎,且是面向4A游戏。关于4A游戏这个概念,目前业内没有统一的“名词解释”,但通常理解为比3A游戏更强大一点的游戏(doge)。被曝从亚马逊首席科学家的职务上离职后,李沐联手其导师、另一位亚马逊出身AI大牛AlexSmola的创业公司Boson.ai既没有高调露面,也没有什么隐秘爆料跟上。站长网2023-11-26 20:57:520001