零一万物开源Yi-1.5模型 在编码、数学、推理方便表现良好
站长网2024-05-13 12:13:320阅
零一万物(01-AI)近日发布了其模型家族的新成员——Yi-1.5(6B、9B、34B),并宣布这些模型均采用 Apache2.0许可开源。Yi-1.5是 Yi 模型的升级版,它在编码、数学、推理和指令遵循能力方面展现出更强的性能,同时保持了在语言理解、常识推理和阅读理解方面的卓越能力。
主要特点:
多种规模的模型:提供6B、9B 和34B 三种不同规模的模型,包括基础版和聊天版。
预训练和微调:基础版在500B tokens 上进行持续预训练,而 chat 版则在300万个样本上进行了微调。
性能卓越:Yi-1.534B 在基准测试中几乎与 Meta 的 Llama370B 相匹配,且整体效果超过 Qwen1.5-72B。
评分突出:在 MMLU、HumanEval 和 AGIEval 等基准测试中,34B 模型分别获得了77.1、46.3和71.1的高分。
9B 模型表现:在类似大小的开源模型中,Yi-1.59B 的表现最佳,与 Mixtral8x7B 相匹配。
开源可访问:所有模型根据 Apache2.0许可发布,并在 Hugging Face 平台上开源。
上下文长度:支持长达4K 个标记的上下文长度。
模型性能:Yi-1.5在多个基准测试中展现了其强大的性能,特别是在处理复杂任务时。
模型下载地址:https://top.aibase.com/tool/yi-1-5
0000
评论列表
共(0)条相关推荐
Cohere 推出适用于企业LLM应用的Embed V3
要点:Cohere推出EmbedV3,这是其嵌入模型的最新版本,旨在帮助企业构建大型语言模型(LLM)应用程序,具有增强的数据压缩功能。EmbedV3在语义搜索和利用大型语言模型(LLMs)的应用程序方面与OpenAI的Ada和各种开源选项竞争,承诺卓越的性能和增强的数据压缩。站长网2023-11-03 10:37:250001阿里云大模型“通义千问”将于4月11日发布
今日,阿里云官方宣布将在4月11日召开的2023阿里云峰会上,带来“通义千问”相关的重磅消息。根据官方公布的预热海报显示,"通义千问"大模型与其他工具的组合将会使得这一大模型具备更进一步的应用价值。据悉,通义千问是阿里达摩院自主研发的预训练语言大模型,它能够回答问题、创作文字,也能够表达观点、撰写代码。站长网2023-04-12 12:34:210001为什么研究章鱼、乌贼
光明图片/视觉中国光明图片/视觉中国光明图片/视觉中国光明图片/视觉中国对生物学家来说,章鱼和乌贼不仅仅是种动物,更是研究神经系统复杂性和演化的绝佳对象。它们曾经为神经科学的崛起立下过汗马功劳,但在过去的数十年间,因为和人类差别过大、研究手段限制等原因,逐渐沉寂。近年来,随着人工智能、基因编辑技术等新研究手段的发展,它们重新受到研究者的关注。在这方面,中国科学家已经走在前列。站长网2023-05-24 11:25:2900021000+AI智能体复活,OpenAI版元宇宙上线? ChatGPT+VR百分百还原「西部世界」
游戏版的「西部世界」已然成为现实。YouTube博主ArtfromtheMachine正式发布Mantella,能够让「上古卷轴5」中的NPC们复活的全新AIMod。项目一经发布,在Reddit上掀起轩然大波。通过ChatGPT、以及文本转语音工具xVASynth、语音识别模型Whisper直接让游戏中AI智能体拥有意识,进行自然对话。站长网2023-08-21 09:23:250002亚马逊扩大与 Salesforce 就 AWS 合作达成的协议,重点是人工智能
在网络星期一期间,预期在线购物将创下新高,亚马逊股价上涨了0.7%。据《华尔街日报》报道,亚马逊已超越联邦快递(FDX)和联合包裹服务公司(UPS),成为美国最大的包裹递送公司。站长网2023-11-28 16:04:020000