通义千问团队发布Qwen1.5 聊天模型性能大幅提升
站长网2024-02-07 10:23:480阅
站长之家(ChinaZ.com)2月7日 消息:在近期几个月的深入探索之后,通义千问团队终于迎来了其开源系列Qwen的下一个重要版本——Qwen1.5。
Qwen1.5的亮点之一是其丰富的模型系列,涵盖了从0.5B到72B的六种不同大小的基础和聊天模型。此外,团队还开源了包括Int4和Int8的GPTQ模型、AWQ模型以及GGUF量化模型在内的多种量化版本,以满足不同开发者的需求。
为了提高开发者的使用体验,Qwen1.5的代码已经与Hugging Face Transformers进行了合并。这意味着开发者可以直接使用transformers>=4.37.0版本,而无需信任远程代码。此外,Qwen1.5还得到了如vLLM、SGLang、AutoGPTQ等主流框架的支持,进一步丰富了其生态系统。
相较于之前的版本,Qwen1.5在聊天模型与人类偏好一致性方面取得了显著进步。同时,其多语言能力也得到了全面改善。更令人振奋的是,所有模型现在都支持统一的上下文长度,高达32K。这些改进不仅增强了模型的基础语言质量,还为其在多语言评测中的表现奠定了坚实基础。
总结亮点
模型多样性:提供6个不同规模的模型以及多种量化版本,满足各种需求。
生态系统融入:与Hugging Face Transformers等主流框架的紧密结合,简化了开发过程。
卓越性能:聊天模型性能的大幅提升,以及在MT-Bench等基准测试中的优秀表现。
统一功能:全系列模型支持32K上下文长度、增强的多语言能力和统一的system prompt等特性。
体验地址:
https://modelscope.cn/studios/qwen/Qwen1.5-72B-Chat-Demo/summary
0000
评论列表
共(0)条相关推荐
开源涂鸦AI绘画工具Scribble Diffusion 草图一键变精致
ScribbleDiffusion是一款利用人工智能将草图转化为精细图像的工具。它通过Replicate平台驱动,使用开源机器学习模型ControlNet生成图像,并通过Next.js和TailwindCSS构建了用户友好的界面。用户可以在ScribbleDiffusion网站上使用该工具,将草图快速转化为更精细的图像。站长网2023-08-04 14:26:570001【话媒堂】首播GMV破百万,@大小姐 TRACYCHU 如何在直播电商乘风破浪?
“服装是一种语言,穿对是一种能力”这是@大小姐TRACYCHU抖音账号主页的一句话,作为中国高端女装TRACYCHU品牌主理人,@大小姐TRACYCHU有着12年从业经验,凭借对行业趋势的敏锐洞察,她的品牌顺利从线下转至线上,在直播带货领域成功突围。本期,克劳锐邀请@大小姐TRACYCHU来到了大咖专访精品栏目——《话媒堂》,一起来聊聊品牌故事以及未来发展规划。站长网2023-11-30 09:37:460000DistilBERT:更小、更快、更便宜的大型语言模型压缩方法
要点:1.近年来,大型语言模型的发展迅猛,BERT成为其中最受欢迎和高效的模型,但其复杂性和可扩展性成为问题。2.为了解决这个问题,采用了知识蒸馏、量化和修剪等压缩算法,其中知识蒸馏是主要的方法,通过让较小的模型模仿较大模型的行为来实现模型压缩。站长网2023-10-08 09:56:450000当Kimi悄悄的进军浏览器,他们好像在下一盘很大的棋。
今天在照常用Kimi的时候,意外的在他们首页,发现了一个不一样的新功能。因为我非常清晰的记得,之前头像下面就是APP下载的入口。而现在多了一个小东西。下载Kimi浏览器助手。看到这个,我第一反应是,Kimi要给浏览器插件导流了?因为Kimi之前太火了,很多人都想在浏览器插件上用,所以有些独立开发者,就给Kimi做了浏览器插件,最著名的就是那个KimiCopilot。站长网2024-07-08 17:46:290000思科280亿美元收购Splunk,加强企业在AI时代安全保障
文章概要:1.思科计划以280亿美元收购Splunk,将成为全球最大的软件供应商之一,致力于帮助企业在人工智能普及的时代更好地保障自身安全。2.这一收购将加强思科的安全能力,推动企业从威胁检测和响应转向威胁预测和预防,以适应不断演变的数字化业务和人工智能加速采用的IT景观。3.思科和Splunk将合作帮助企业客户充分利用人工智能机会,提高对其数据的可视化和洞察力。站长网2023-09-22 11:19:320000