元象开源70亿参数通用大模型 XVERSE-7B 免费可商用
站长网2023-09-27 08:52:580阅
元象宣布开源70亿参数通用大模型 XVERSE-7B 底座与对话版,这是一款全开源、免费可商用的模型。
相比之前的 XVERSE-13B,7B 版本更小巧,可以在单张消费级显卡上运行,并且推理量化后最低只需6GB 显存,大大降低了开发门槛和推理成本。
该模型在多项权威测试中表现出色,并具有强大的认知、规划、推理和记忆能力,支持40多种语言。
●XVERSE-7B是在2.6万亿 tokens 高质量多语言数据上从头训练的底座模型,具有强大的认知、规划、推理和记忆能力。其上下文窗口长度为8192,支持中、英、俄、法等40多种语言。
●XVERSE-7B-Chat是底座模型经 SFT 指令精调后的中英文对话模型,大幅提升了理解和生成内容的准确度,也更符合人类的认知偏好。
项目地址:
XVERSE-7B:
https://modelscope.cn/models/xverse/XVERSE-7B
XVERSE-7B-Chat:
https://modelscope.cn/models/xverse/XVERSE-7B-Chat
XVERSE-13B:
https://modelscope.cn/models/xverse/XVERSE-13B
XVERSE-13B-Chat:
https://modelscope.cn/models/xverse/XVERSE-13B-Chat
0000
评论列表
共(0)条相关推荐
利用检索增强生成技术提升语言模型的能力
文章要点:检索增强生成(RAG)方法可以让语言模型访问最新的知识库,从而提高模型在实际业务中的应用能力。RAG方法相比重新训练模型或微调模型更为便宜和容易实现,同时也避免了数据集准备的工作量。使用Haystack等开源框架,结合句子嵌入技术和检索算法,可以构建强大的RAG-enabled语言模型,提供准确、实时的信息检索和问题回答能力。站长网2023-08-09 10:15:220000字节辟谣推出中文版Sora:还无法完善产品落地
近日,据相关报道,字节跳动在国内率先推出了一款新型视频模型——Boximator,这款模型被认为具有颠覆性的创新。与Gen-2、Pink1.0等既有模型相比,Boximator的独特之处在于,它能够通过文本输入精确地控制视频中人物或物体的运动。站长网2024-02-20 11:09:270000苹果或将线上发布新品2024 款 iPad 和 Mac 无春季发布会
据马克·古尔曼报道,苹果公司计划通过一系列在线视频和营销活动在其官方网站上宣布新产品,包括新款iPadPro和iPadAir型号,以及M3MacBookAir。预计这些产品将在本月或下个月上市,而不会举办传统的大型春季发布会。这将是苹果连续两年举办春季活动,而今年的新产品尤其多。站长网2024-03-04 15:46:040000假新闻和嘲笑逝者——微软的人工智能新闻聚合出了什么问题?
站长之家(ChinaZ.com)11月6日消息:最新的一篇CNN报道通过一些例子展示了MSNAI模型在新闻聚合方面的问题,如突出显示一则声称美国总统乔·拜登在为毛伊岛野火受害者默哀时打瞌睡的新闻(实际上并没有),或是一则错误地将一名NBA球员描述为「无用」的讣告。站长网2023-11-06 08:58:320001谷歌的新图片搜索工具可以识别AI生成的假图
如今,AI绘画工具功能越来越强大,比如很多图片是由Midjourney或StableDiffusion等生成式AI机器人创建,那么你如何知道图片内容是否是真实的呢?谷歌在今年夏季推出一个名为“关于这张图片(Aboutthisimage)”的新工具,该工具可用于谷歌图片搜索,旨在帮助用户识别AI生成的假图片。站长网2023-05-11 10:24:000000