阿里云通义千问开源Qwen2系列模型:性能显著提升 包含5个尺寸
站长网2024-06-07 09:41:290阅
阿里巴巴悄悄发布了 Qwen2系列模型,这是 Qwen1.5升级后的重大更新。
Qwen2系列包含了5个不同规模的预训练和指令微调模型,分别是 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。这些模型在处理长文本时支持不同的上下文长度,最大可达128K tokens。

Qwen2系列在多语言方面做了优化,增加了27种语言的高质量数据,并针对常见的语言转换问题进行了优化。模型在多项评测中表现优异,包括自然语言理解、知识、代码、数学和多语言理解等能力,显著超越之前的 Qwen1.5和其他开源模型。
在代码和数学能力方面,Qwen2系列持续提升,特别是在多种编程语言上的表现和数学解题能力方面有显著提升。模型还能处理长文本任务,其中 Qwen2-72B-Instruct 能完美处理128k 上下文长度内的信息抽取任务。
在安全性方面,Qwen2-72B-Instruct 模型与 GPT-4表现相当,显著优于 Mistral-8x22B 模型。所有模型均已开源在 Hugging Face 和 ModelScope 上,可在各种应用场景中使用。未来,Qwen 团队还将继续训练更大的模型,探索模型及数据的 Scaling Law,并将 Qwen2扩展成多模态模型。
项目地址:https://github.com/QwenLM/Qwen2
0000
评论列表
共(0)条相关推荐
Neuroid:输入文本提示就能快速创建复杂的AI 3D动画
划重点:1.🌐创新应用生成式人工智能技术,NationA推出的AI工具Neuroid有望彻底改变3D动画制作流程。2.🤖Neuroid不仅能按需生成动画,还能自动完成复杂的角色绑定过程,大大提高生产效率。3.🔄支持多种3D软件包,包括UnrealEngine、3DSMax、Maya等,为广泛的创作者提供更多可能性。站长网2024-01-08 11:07:140000OpenAI 正在为 DALL-E3生成的图片上增加新水印
划重点:💧OpenAI在DALL-E3图像生成器中添加了水印,以支持C2PA标准-💻水印将出现在ChatGPT网站和DALL-E3模型API生成的图像中-🛠️用户可以通过ContentCredentialsVerify等网站检查图像生成的来源站长网2024-02-07 09:51:060000谷歌Gemini翻车内幕被曝光:内部管理混乱,生图机制过分 “多元化”
划重点:⭐️谷歌Gemini生图机制内幕曝光⭐️内部“多元化”政策影响图片生成流程⭐️员工爆料谷歌内部管理混乱近日,谷歌Gemini生图机制内幕曝光,显示其内部管理混乱,生图机制过分“多元化”。站长网2024-03-07 16:42:500000国产Sora来了!清华发布视频生成大模型“视界一粟YiSu”
快科技6月12日消息,据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型视界一粟YiSu”。该大模型拥有模型原生的16秒超长时长,并可生成至1分钟以上视频。据介绍,YiSu模型成本更低、速度更快、端侧可用。年初Sora的爆火,让DiT架构受到了业内极大的关注,很多公司和项目也开始复现DiT路线。0001谷歌AI搜索功能在地理知识方面表现糟糕
本文概要:1.谷歌的人工智能搜索在地理知识方面存在严重问题。2.谷歌的人工智能搜索无法正确回答关于以字母开头的国家的问题。3.谷歌承认人工智能搜索仍处于实验阶段,并表示将继续改进和优化。谷歌的人工智能搜索功能(“SGE”搜索)在地理知识方面存在着严重问题。有用户发现谷歌的搜索人工智能无法正确回答关于以字母开头的国家的问题,甚至给出了错误的答案。站长网2023-08-17 10:59:140003