百川开源中英文百亿参数模型!中文领域超越 LLaMA
站长网2023-07-12 14:30:181阅
2023年7月11日,百川智能正式发布了参数量130亿的通用大语言模型 Baichuan-13B、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本,成为中国开源大模型领域的重要里程碑。
与美国的闭源大模型相比,开源模型具有灵活的定制性和私有化部署的优势,推动了中国大模型产业的发展和技术进步。
Baichuan-13B 采用相对平衡的中英文语料配比和多语言对齐语料,表现优异。在中文领域,Baichuan-13B 在自然科学、医学、艺术、数学等领域领先 LLaMA-13B、Vicuna-13B,并超越了 ChatGPT。在英文领域,Baichuan-13B 超过了所有同尺寸开源模型,并具有显著优势。
百川智能创始人王小川表示,Baichuan-13B 是对国内开源社区的贡献,期待促进大模型行业和垂直领域的创新生态发展。Baichuan-13B 的开源不仅有利于研究人员深入探索和研究模型原理,还有利于建立公众对大模型的信任。百川智能希望与企业和开发者共同推动中国人工智能应用的创新生态发展。
0001
评论列表
共(0)条相关推荐
阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效
图源备注:图片由AI生成,图片授权服务商Midjourney文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720分辨率没有压力,而且生成效果非常连贯。0000Meta发布Llama 2-Long模型 处理长文本计算量需求减少40%
要点:1.Meta发布Llama2-Long模型,能在处理长文本时不增加计算需求,仍保持卓越性能。2.模型的性能提升得益于持续预训练、位置编码改进和数据混合,而非依赖更多长文本数据。3.在短和长任务上,Llama2-Long都表现出色,超越其他长上下文模型,具有潜力革新自然语言处理领域。站长网2023-10-11 18:32:040000中消协点名车企售后服务停摆 消协智慧315平台上线
据央视新闻报道,3月15日,中国消费者协会公布2023年十大消费维权舆情热点,涉及以下消费维权突出问题。电商主播言行不当引发投诉民宿经营者被曝“涨价退单”“虚假地址”餐饮商家不明确收费标准及服务内容“研学游”“低价游”欺骗诱导暗藏陷阱车企售后服务停摆引发车主担忧共享按摩椅及共享充电宝消费体验不佳第三方测评“跑偏”干扰消费者“生鲜灯”改变商品外观误导消费者知名品牌触碰食品安全底线站长网2024-03-15 14:44:160000如何用AI电影创作?电影制片人可以尝试的10个AI模型
站长之家(ChinaZ.com)引言:尽管好莱坞内部关于人工智能在电影行业中的整合一直存争议,但重要的是要认识到人工智能所拥有的巨大力量。虽然,目前这些工具可能还达不到标准,但这仅仅是开始。很快,大家很快就可以在人工智能的帮助下制作一整部电影。站长网2023-07-18 17:22:550000Docker发布全新AI堆栈,开创无缝集成时代
近日,Docker公司在洛杉矶举办的Dockercon23大会上推出了全新的DockerGenAI堆栈,引领着AI应用程序的开发革命。这一堆栈旨在使Docker容器技术与Neo4j图形数据库、LangChain模型链接技术以及大型语言模型Ollama实现无缝集成,极大地简化了生成式AI应用程序的开发过程。站长网2023-10-12 14:17:550000