通义千问团队发布Qwen1.5 聊天模型性能大幅提升
站长网2024-02-07 10:23:480阅
站长之家(ChinaZ.com)2月7日 消息:在近期几个月的深入探索之后,通义千问团队终于迎来了其开源系列Qwen的下一个重要版本——Qwen1.5。
Qwen1.5的亮点之一是其丰富的模型系列,涵盖了从0.5B到72B的六种不同大小的基础和聊天模型。此外,团队还开源了包括Int4和Int8的GPTQ模型、AWQ模型以及GGUF量化模型在内的多种量化版本,以满足不同开发者的需求。
为了提高开发者的使用体验,Qwen1.5的代码已经与Hugging Face Transformers进行了合并。这意味着开发者可以直接使用transformers>=4.37.0版本,而无需信任远程代码。此外,Qwen1.5还得到了如vLLM、SGLang、AutoGPTQ等主流框架的支持,进一步丰富了其生态系统。
相较于之前的版本,Qwen1.5在聊天模型与人类偏好一致性方面取得了显著进步。同时,其多语言能力也得到了全面改善。更令人振奋的是,所有模型现在都支持统一的上下文长度,高达32K。这些改进不仅增强了模型的基础语言质量,还为其在多语言评测中的表现奠定了坚实基础。

总结亮点
模型多样性:提供6个不同规模的模型以及多种量化版本,满足各种需求。
生态系统融入:与Hugging Face Transformers等主流框架的紧密结合,简化了开发过程。
卓越性能:聊天模型性能的大幅提升,以及在MT-Bench等基准测试中的优秀表现。
统一功能:全系列模型支持32K上下文长度、增强的多语言能力和统一的system prompt等特性。
体验地址:
https://modelscope.cn/studios/qwen/Qwen1.5-72B-Chat-Demo/summary
0000
评论列表
共(0)条相关推荐
超过 75% 的投资者因人工智能而热捧科技股 但只有不到一半的投资者愿意为个人或企业使用 AI 工具付费
站长之家(ChinaZ.com)8月2日消息:华尔街及其他地区的投资者押注2023年科技股的大涨具有持久力,尽管他们似乎对人工智能时代是否会如宣传的那样持怀疑态度。站长网2023-08-02 10:44:320000GitHub:AI工具Copilot Chat将于12月全面推出
近日,GitHub宣布,作为当前GitHubCopilot订阅的一部分,GitHubCopilotChat将于12月全面推出,企业和个人用户均可使用,且这项服务将免费提供给教育用户和流行开源项目的维护者,并默认集成至GitHub网站和移动App中。站长网2023-11-09 09:44:070000阿里魔搭社区开源推理引擎 DashInfer
ModelScope推出了预训练大语言模型(LLM)推理引擎DashInfer,支持C和Python语言接口,可在多种CPU架构上高效推理大模型。站长网2024-05-24 11:42:070000ComfyUI实用插件Plush-for-ComfyUI 可在ComfyUI中调用GPT-4和DALL-E3
Plush-for-ComfyUI插件是一个非常有趣的工具,它可以在ComfyUI平台中调用GPT-4和DALL-E3,实现从图片提取提示词并使用DALL-E3在ComfyUI中生成图片。项目地址:https://top.aibase.com/tool/plush-for-comfyui站长网2024-01-02 11:35:1800012Stable Diffusion「偷」代码建起10亿美元帝国?Stability AI创始人骗局被扒皮
【新智元导读】「借用」他人代码,建起10亿美元帝国?StablityAI创始人EmadMostaque,最近被福布斯「扒皮」了!福布斯在一篇长文中爆料,让StabiliytAI名声鹊起的StableDiffusion,源代码其实是另一组研究人员写的。站长网2023-06-08 06:55:140000