首页站长资讯阿里开源千亿参数模型 Qwen1.5-110B，性能超越 Meta-Llama3-70B

阿里开源千亿参数模型 Qwen1.5-110B，性能超越 Meta-Llama3-70B

站长网2024-04-28 17:54:540阅

近日，阿里巴巴宣布开源其最新的 Qwen1.5系列语言模型 - Qwen1.5-110B。这是 Qwen1.5系列中规模最大的模型，也是该系列中首个拥有超过1000亿参数的模型。

据悉，Qwen1.5-110B采用了与其他Qwen1.5模型相同的Transformer解码器架构，并引入了分组查询注意力（GQA）机制，在模型推理时更加高效。该模型支持32K tokens的上下文长度，同时仍然是多语言的，支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

与最近发布的SOTA语言模型Meta-Llama3-70B和Mixtral-8x22B进行对比，结果显示Qwen1.5-110B在基础能力方面至少与Llama-3-70B相媲美。

阿里巴巴表示，与之前发布的72B模型相比，在两个聊天模型的基准评估中，110B模型表现显著更好，这表明即使在没有大幅改变后训练方法的情况下，更强大、更大规模的基础语言模型也可以带来更好的聊天模型性能。

Qwen1.5-110B是Qwen1.5系列中规模最大的模型，也是该系列中首个拥有超过1000亿参数的模型。它在与最近发布的SOTA模型Llama-3-70B的性能上表现出色，并且明显优于72B模型。

阿里开源千亿参数模型Qwen15 110B性能超越MetaLlama370B

0000

评论列表

共(0)条

相关推荐

Temu诉Shein：扣留没收商家手机，获取temu账户
12月14日，Temu向美国哥伦比亚特区法院提交了长达100多页的诉讼文件，再诉全球最大的快时尚巨头Shein。具体指控包括，Shein采用“黑手党式”的手段非法留置供应商，盗取平台商业信息，威胁中小商家二选一，向版权机构发起数以万计的虚假恶意投诉，以及滥用美国法律体系扰乱市场等。
站长网站长资讯2023-12-17 10:13:47
0000
站长资讯
AI女友，很黄很暴利
有人租个女友回家过年，也有人在网上为AI女友付费。AI女友是大模型的产物，她是一个聊天机器人，24小时陪聊，随叫随到，能文字能语音，还能发美照。她可以是对现实或小说中某个人物的角色扮演，也可以是凭空创造出来的一个女性形象，总之不是真人。但因为接入了大语言模型，AI女友能做到语气和表达跟真人一样，还有自己的个性。由于技术日渐成熟，AI女友开始在社交平台泛滥，擦边的黄色生意应运而生。
站长网2024-02-20 09:10:45
0000
1000万内最好的SUV！华为问界M9大定单量超2万台
华为AITO问界M9旗舰SUV在发布后短短时间内，累计大定订单量已突破2万台。作为AITO汽车的旗舰车型，问界M9定位于大型SUV，其长宽高分别为5230/1999/1800毫米，轴距为3110毫米，提供5款颜色选择，其中两款为纯色，三款为双拼配色。
站长网站长资讯2023-12-28 17:57:49
0000
站长资讯
AudioSep：可以从音频剪辑中仅分离出特定的声音
AudioSep是一种AI模型，可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发，使用户能够通过简单的语言描述来分离各种声音源。
站长网2023-10-27 10:48:25
0000
站长资讯
黄仁勋有望超越马斯克成全球首富英伟达股价破千美元大关
站长之家（ChinaZ.com）5月28日消息:英伟达近日发布的最新财报成绩斐然，全面超越市场预期，公司市值和创始人黄仁勋的个人财富也随之飙升。财报公布后，英伟达股价首次突破1000美元关口，市值逼近2.6万亿美元，而黄仁勋的身价也高达910亿美元，成为全球第17位富豪。
站长网2024-05-28 17:05:08
0000