阿里云通义千问开源Qwen2系列模型:性能显著提升 包含5个尺寸
站长网2024-06-07 09:41:290阅
阿里巴巴悄悄发布了 Qwen2系列模型,这是 Qwen1.5升级后的重大更新。
Qwen2系列包含了5个不同规模的预训练和指令微调模型,分别是 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。这些模型在处理长文本时支持不同的上下文长度,最大可达128K tokens。
Qwen2系列在多语言方面做了优化,增加了27种语言的高质量数据,并针对常见的语言转换问题进行了优化。模型在多项评测中表现优异,包括自然语言理解、知识、代码、数学和多语言理解等能力,显著超越之前的 Qwen1.5和其他开源模型。
在代码和数学能力方面,Qwen2系列持续提升,特别是在多种编程语言上的表现和数学解题能力方面有显著提升。模型还能处理长文本任务,其中 Qwen2-72B-Instruct 能完美处理128k 上下文长度内的信息抽取任务。
在安全性方面,Qwen2-72B-Instruct 模型与 GPT-4表现相当,显著优于 Mistral-8x22B 模型。所有模型均已开源在 Hugging Face 和 ModelScope 上,可在各种应用场景中使用。未来,Qwen 团队还将继续训练更大的模型,探索模型及数据的 Scaling Law,并将 Qwen2扩展成多模态模型。
项目地址:https://github.com/QwenLM/Qwen2
0000
评论列表
共(0)条相关推荐
京东APP上线AI智能导购助手「京东京言」 提供购物相关建议
近日,京东APP上线了AI智能导购助手「京东京言」,用户在京东APP搜索「京东京言」即可进入相关页面。点击前往京东京言体验入口京东京言能提供以下服务:(1)专业品类咨询:想了解专业品类知识,更好地了解不熟悉的商品,可以这样咨询:智能马桶怎么挑、乳胶床垫怎么选、智能门锁选哪种。站长网2023-11-15 18:06:430001科大讯飞将于5月6日发布讯飞星火大模型
昨日晚间,科大讯飞发布第一季度报告称,2023年一季度实现营业收入28.88亿元,同比下降17.64%;归母净亏损5789.5万元,上年同期净利润1.1亿元。2022年实现营业收入188.2亿元,同比增长2.77%,归母净利润为5.61亿元。站长网2023-04-21 08:43:580000苹果Vision Pro国行版今日正式开启预售 售价 29999 元起
站长之家(ChinaZ.com)6月14日消息:今日,苹果VisionPro国行版正式开启预售,这款被苹果CEO库克预言将在未来10年取代iPhone地位的革新产品,起始售价为29999元。用户可在三种内存版本中自由选择,包括256GB、512GB和1TB,每位消费者限购两台。站长网2024-06-14 23:51:040000Hugging Face、GitHub 等联合呼吁欧盟在AI法规中保护开源创新
HuggingFace、GitHub、EleutherAI、CreativeCommons、LAION和OpenFuture等开源AI利益相关者组成的联盟呼吁欧盟政策制定者在制定《欧盟AI法案》时保护开源创新。站长网2023-07-26 16:37:420000Temu诉Shein:扣留没收商家手机,获取temu账户
12月14日,Temu向美国哥伦比亚特区法院提交了长达100多页的诉讼文件,再诉全球最大的快时尚巨头Shein。具体指控包括,Shein采用“黑手党式”的手段非法留置供应商,盗取平台商业信息,威胁中小商家二选一,向版权机构发起数以万计的虚假恶意投诉,以及滥用美国法律体系扰乱市场等。0000