元象开源70亿参数通用大模型 XVERSE-7B 免费可商用
站长网2023-09-27 08:52:580阅
元象宣布开源70亿参数通用大模型 XVERSE-7B 底座与对话版,这是一款全开源、免费可商用的模型。
相比之前的 XVERSE-13B,7B 版本更小巧,可以在单张消费级显卡上运行,并且推理量化后最低只需6GB 显存,大大降低了开发门槛和推理成本。
该模型在多项权威测试中表现出色,并具有强大的认知、规划、推理和记忆能力,支持40多种语言。

●XVERSE-7B是在2.6万亿 tokens 高质量多语言数据上从头训练的底座模型,具有强大的认知、规划、推理和记忆能力。其上下文窗口长度为8192,支持中、英、俄、法等40多种语言。
●XVERSE-7B-Chat是底座模型经 SFT 指令精调后的中英文对话模型,大幅提升了理解和生成内容的准确度,也更符合人类的认知偏好。
项目地址:
XVERSE-7B:
https://modelscope.cn/models/xverse/XVERSE-7B
XVERSE-7B-Chat:
https://modelscope.cn/models/xverse/XVERSE-7B-Chat
XVERSE-13B:
https://modelscope.cn/models/xverse/XVERSE-13B
XVERSE-13B-Chat:
https://modelscope.cn/models/xverse/XVERSE-13B-Chat
0000
评论列表
共(0)条相关推荐
AI视野:Azure AI新增40种大模型;Yi-34B-Chat微调模型开源;GPT-4在图灵测试中成功率超过41%;微软谷歌推出AI入门课程
📰🤖📢AI新鲜事微软AzureAI新增40种大模型微软宣布在AzureAI云开发平台中新增40个大模型,包括WhisperV3、StableDiffusion、Phi、Falcon、SAM、CLIP、CodeLlama等,支持文本生成、图像处理、代码编写、语音识别等多种功能。【AiBase提要:】站长网2023-11-27 15:35:110000小红书打击通过不当投诉牟利行为
薯管家发布消息称,小红书坚持打造真诚分享、友好互动的社区氛围,严厉打击通过不当投诉非法牟利的内容和行为。近年来,随着投诉维权渠道增多,个别账号发布回收垃圾短信的内容,借此不当牟取利益。上述内容和行为严重扰乱了正常的市场秩序,破坏了平台生态和良好氛围。小红书对此类不当投诉牟利行为坚决抵制,对此类传播内容进行严厉打击。站长网2023-06-12 17:53:220000PhotoRoom势头强劲 完成融资将开启AI图像编辑新篇章
法国巴黎的初创公司PhotoRoom,专注于构建基于人工智能的图像编辑应用程序和API,近日完成一轮融资,消息人士透露融资规模在5000万至6000万美元之间,估值达到5亿至6亿美元。消息人士表示,曾领投PhotoRoom上一轮融资的Balderton也是这次融资的主要投资者之一,其他先前的支持者也参与其中。投资者正在对多个投资意向书进行选择。0000年终盘点丨直播带货2023:主播、平台,谁才是超级IP?
2023年接近尾声,掀起直播带货行业年末最后一波高潮的东方甄选“小作文”事件也终于告一段落。董宇辉选择继续与东方甄选牵手,前者既守着了读书人的坚持,也成为了新东方教育科技集团董事长文化助理,兼任新东方文旅集团副总裁,后者股价涨幅扩大至20%,市值重回300亿港元,一场纷争最终由双赢的结果定音。站长网2023-12-19 17:16:020000斯坦福大学:大模型“卷”错方向了?上下文窗口越长,模型越笨
在语言模型中,上下文窗口对于理解和生成与特定上下文相关的文本至关重要。一般而言较大的上下文窗口可以提供更丰富的语义信息、消除歧义。由于硬件和算法的最新进步,大模型的上下文窗口的长度也越来越“卷”。其中的卷王当属Anthropic公司,其五月份就将Claude的上下文窗口从9ktoken扩展到了100k。最近更新的Claude2更是让其100K的上下文能力“常驻”模型。站长网2023-07-28 14:05:130000