元象开源70亿参数通用大模型 XVERSE-7B 免费可商用

站长网2023-09-27 08:52:580阅

元象宣布开源70亿参数通用大模型 XVERSE-7B 底座与对话版，这是一款全开源、免费可商用的模型。

相比之前的 XVERSE-13B，7B 版本更小巧，可以在单张消费级显卡上运行，并且推理量化后最低只需6GB 显存，大大降低了开发门槛和推理成本。

该模型在多项权威测试中表现出色，并具有强大的认知、规划、推理和记忆能力，支持40多种语言。

●XVERSE-7B是在2.6万亿 tokens 高质量多语言数据上从头训练的底座模型，具有强大的认知、规划、推理和记忆能力。其上下文窗口长度为8192，支持中、英、俄、法等40多种语言。

●XVERSE-7B-Chat是底座模型经 SFT 指令精调后的中英文对话模型，大幅提升了理解和生成内容的准确度，也更符合人类的认知偏好。

项目地址：

XVERSE-7B:

https://modelscope.cn/models/xverse/XVERSE-7B

XVERSE-7B-Chat:

https://modelscope.cn/models/xverse/XVERSE-7B-Chat

XVERSE-13B:

https://modelscope.cn/models/xverse/XVERSE-13B

XVERSE-13B-Chat:

https://modelscope.cn/models/xverse/XVERSE-13B-Chat

元象开源70亿参数通用大模型XVERSE7B 免费可商用

0000

评论列表

共(0)条

相关推荐

站长资讯
AI视野：Azure AI新增40种大模型；Yi-34B-Chat微调模型开源；GPT-4在图灵测试中成功率超过41%；微软谷歌推出AI入门课程
📰🤖📢AI新鲜事微软AzureAI新增40种大模型微软宣布在AzureAI云开发平台中新增40个大模型，包括WhisperV3、StableDiffusion、Phi、Falcon、SAM、CLIP、CodeLlama等，支持文本生成、图像处理、代码编写、语音识别等多种功能。【AiBase提要:】
站长网2023-11-27 15:35:11
0000
站长资讯
小红书打击通过不当投诉牟利行为
薯管家发布消息称，小红书坚持打造真诚分享、友好互动的社区氛围，严厉打击通过不当投诉非法牟利的内容和行为。近年来，随着投诉维权渠道增多，个别账号发布回收垃圾短信的内容，借此不当牟取利益。上述内容和行为严重扰乱了正常的市场秩序，破坏了平台生态和良好氛围。小红书对此类不当投诉牟利行为坚决抵制，对此类传播内容进行严厉打击。
站长网2023-06-12 17:53:22
0000
PhotoRoom势头强劲完成融资将开启AI图像编辑新篇章
法国巴黎的初创公司PhotoRoom，专注于构建基于人工智能的图像编辑应用程序和API，近日完成一轮融资，消息人士透露融资规模在5000万至6000万美元之间，估值达到5亿至6亿美元。消息人士表示，曾领投PhotoRoom上一轮融资的Balderton也是这次融资的主要投资者之一，其他先前的支持者也参与其中。投资者正在对多个投资意向书进行选择。
站长网站长资讯2024-01-10 12:11:27
0000
站长资讯
年终盘点丨直播带货2023：主播、平台，谁才是超级IP？
2023年接近尾声，掀起直播带货行业年末最后一波高潮的东方甄选“小作文”事件也终于告一段落。董宇辉选择继续与东方甄选牵手，前者既守着了读书人的坚持，也成为了新东方教育科技集团董事长文化助理，兼任新东方文旅集团副总裁，后者股价涨幅扩大至20%，市值重回300亿港元，一场纷争最终由双赢的结果定音。
站长网2023-12-19 17:16:02
0000
站长资讯
斯坦福大学：大模型“卷”错方向了？上下文窗口越长，模型越笨
在语言模型中，上下文窗口对于理解和生成与特定上下文相关的文本至关重要。一般而言较大的上下文窗口可以提供更丰富的语义信息、消除歧义。由于硬件和算法的最新进步，大模型的上下文窗口的长度也越来越“卷”。其中的卷王当属Anthropic公司，其五月份就将Claude的上下文窗口从9ktoken扩展到了100k。最近更新的Claude2更是让其100K的上下文能力“常驻”模型。
站长网2023-07-28 14:05:13
0000