阿里云开源通义千问140亿参数模型Qwen-14B、Qwen-14B-Chat
站长网2023-09-25 14:48:170阅
9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。
据悉,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。
Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。
Qwen-14B-Chat 是在基座模型上经过精细SFT得到的对话模型。借助基座模型强大性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。
目前,用户可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。
Qwen-14B-Chat
模型链接:https://modelscope.cn/models/qwen/Qwen-14B-Chat
Qwen-14B
模型链接:https://modelscope.cn/models/qwen/Qwen-14B
Qwen-14B-Chat-Int4
模型链接:https://www.modelscope.cn/models/qwen/Qwen-14B-Chat-Int4
0000
评论列表
共(0)条相关推荐
美食账号月销万单,7大类型揭晓
各位村民好,我是村长。美食是抖音最容易做的账号,也是最难做的账号。很多人都想去做美食账号,毕竟民以食为天,食品的受众如此之广,消费如此高频。今天村长就来和大家聊一聊,关于食品大类,有哪些方向可以切入的。备注:这里先解释一下,我这里的美食包含了线上线下,也包含了餐饮、零食等产品。01食谱教学号这是做美食账号的同学,最先容易想到的。站长网2023-05-09 09:03:26000011/13英寸可选 苹果全新iPad Air 6今日开售:4799元起
快科技5月15日消息,据苹果官方消息,全新一代主打{tag_keyurl_6}的iPadAir6今天正式发售,价格是4799元起。值得注意的是,这代产品是Air系列首次推出双尺寸,分别提供了11英寸、13英寸可选。更大的尺寸可以在办公、学习时提供更方便的操作,影音娱乐也更加沉浸。站长网2024-05-15 08:04:150000元宇宙平台Decentraland与Inworld合作 引入人工智能NPC
Decentraland是一个知名的元宇宙平台,他们与人工智能公司Inworld合作,利用人工智能技术为其虚拟世界注入更多生命力。站长网2023-08-11 16:10:530000华为轮值董事长胡厚崑:盘古大模型3.0即将发布
华为轮值董事长胡厚崑参加了2023世界人工智能大会,并发表了演讲。他提到,去年年底ChatGPT的出现,把人工智能推向了新的风口。人工智能将帮助我们改写身边的一切。站长网2023-07-06 18:22:260002AI2发布开放语言模型OLMo 号称多项性能媲美Llama2
**划重点:**1.🚀AI2发布了开放语言模型(OLMo),该框架旨在促进大规模语言模型的研究和实验,通过在HuggingFace和GitHub上提供训练代码、模型和评估代码来实现。2.🛠OLMo的首批模型包括7B规模的四个变体和1B规模的一个模型,涵盖不同的架构、优化器和训练硬件,旨在满足多样化的研究需求。站长网2024-02-02 14:53:420000