通义千问团队发布Qwen1.5 聊天模型性能大幅提升

站长网2024-02-07 10:23:480阅

站长之家（ChinaZ.com）2月7日消息:在近期几个月的深入探索之后，通义千问团队终于迎来了其开源系列Qwen的下一个重要版本——Qwen1.5。

Qwen1.5的亮点之一是其丰富的模型系列，涵盖了从0.5B到72B的六种不同大小的基础和聊天模型。此外，团队还开源了包括Int4和Int8的GPTQ模型、AWQ模型以及GGUF量化模型在内的多种量化版本，以满足不同开发者的需求。

为了提高开发者的使用体验，Qwen1.5的代码已经与Hugging Face Transformers进行了合并。这意味着开发者可以直接使用transformers>=4.37.0版本，而无需信任远程代码。此外，Qwen1.5还得到了如vLLM、SGLang、AutoGPTQ等主流框架的支持，进一步丰富了其生态系统。

相较于之前的版本，Qwen1.5在聊天模型与人类偏好一致性方面取得了显著进步。同时，其多语言能力也得到了全面改善。更令人振奋的是，所有模型现在都支持统一的上下文长度，高达32K。这些改进不仅增强了模型的基础语言质量，还为其在多语言评测中的表现奠定了坚实基础。

总结亮点

模型多样性:提供6个不同规模的模型以及多种量化版本，满足各种需求。

生态系统融入:与Hugging Face Transformers等主流框架的紧密结合，简化了开发过程。

卓越性能:聊天模型性能的大幅提升，以及在MT-Bench等基准测试中的优秀表现。

统一功能:全系列模型支持32K上下文长度、增强的多语言能力和统一的system prompt等特性。

体验地址:

https://modelscope.cn/studios/qwen/Qwen1.5-72B-Chat-Demo/summary

通义千问团队发布Qwen15 聊天模型性能大幅提升

0000

评论列表

共(0)条

相关推荐

站长资讯
字节的AI要跳动向何方
进入2024年，字节跳动才开始围绕大模型全面摆开阵型，呈现出咄咄逼人的进攻态势。一方面，在2023年8月上线的豆包之外，字节跳动进入2024年后开始持续爆兵，推出了AI应用开发平台扣子、AI学习伙伴河马爱学、AI剧情互动产品猫箱、AI生图产品PicPci等面向国内、海外不同市场的众多AI产品。
站长网2024-06-06 21:07:47
0000
站长资讯
工信部最新通报22款违规APP：快检查你的手机
工业和信息化部今天发布通告，公布了侵害用户权益行为的APP（SDK），这是今年的第8批，也是总计的第34批。工信部高度重视用户权益保护工作，持续开展APP侵害用户权益专项整治行动。近期，工信部再次组织第三方检测机构对群众关注的实用工具、网络游戏等移动互联网应用程序（APP）及第三方软件开发工具包（SDK）进行检查，发现22款APP、SDK存在侵害用户权益行为。
站长网2023-11-30 20:54:29
0000
站长资讯
高通骁龙8 Gen4处理器即将发布高通骁龙峰会定档
站长之家(ChinaZ.com)6月13日消息:骁龙峰会宣布将于今年10月21日至23日在风景如画的夏威夷毛伊岛隆重举行。此次峰会的一大亮点，无疑是即将正式亮相的高通最新移动平台——骁龙8Gen4。
站长网2024-06-14 00:28:44
0000
站长资讯
研究人员推自动测试平台CodeIPPrompt 可分析AI代码生成是否侵权
最近，人工智能工具如ChatGPT和Copilot在程序员中爆发式增长，为他们提供了更多帮助。然而，这些人工智能助手可能会删除代码中的注释（这些注释本来用于明确版权和归属指南），从而使人类程序员对知识产权侵权一无所知，但仍会在法律上承担责任。
站长网2023-08-01 15:11:31
0001
站长资讯
GPT-4 可以以 0.45% 的成本完成高级数据分析师所做的工作
南洋理工大学与阿里巴巴达摩院进行的研究显示，OpenAI的ChatGPT还可以轻松完成另一项工作。研究显示，AI机器人ChatGPT-4的成本仅为雇用一名高级数据分析师所需成本的0.45%，后者可能获得约9万美元（约合730万卢比）的薪水，或是一名初级员工的0.71%。这是在IANS的一份报告中列出的结果。
站长网2023-05-31 08:53:03
0000