王小川旗下百川智能发布Baichuan-13B大模型 130亿参数开源可商用
继Baichuan-7B之后,近日,王小川旗下百川智能再次发布Baichuan-13B大模型。
据介绍,Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含130亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。本次发布包含有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。
Baichuan-13B 有如下几个特点:
更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到130亿,并且在高质量的语料上训练了1.4万亿 tokens,超过 LLaMA-13B40%,是当前开源13B 尺寸下训练数据量最多的模型。支持中英双语,使用 ALiBi 位置编码,上下文窗口长度为4096。
同时开源预训练和对齐模型:预训练模型是适用开发者的『 基座 』,而广大普通用户对有对话功能的对齐模型具有更强的需求。因此本次开源我们同时发布了对齐模型(Baichuan-13B-Chat),具有很强的对话能力,开箱即用,几行代码即可简单的部署。
更高效的推理:为了支持更广大用户的使用,我们本次同时开源了 int8和 int4的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如 Nvidia3090这样的消费级显卡上。
开源免费可商用:Baichuan-13B 不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。
【HuggingFace】
预训练模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Base
对话模型:https://huggingface.co/baichuan-inc/Baichuan-13B-Chat
【GitHub】
https://githuB.com/Baichuan-inc/Baichuan-13B
【Model Scope】
预训练模型:https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/
对话模型:https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Chat/
百川智能开源Baichuan2 均可免费商用
百川智能发布了两款开源大模型Baichuan2-7B和Baichuan2-13B,参数分别为70亿和130亿,能力全面超越了Meta研发的Llama2-13B模型。同时,百川智能还发布了Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。站长网2023-09-06 18:37:320000GPT-4被证实有人类心智!网友:连AI都可以看出他在嘲讽你了
Nature杂志上发表的最新研究显示,GPT-4在心智理论(TheoryofMind,ToM)方面的表现与人类相当,甚至在某些方面超过了人类。这项研究由JamesW.A.Strachan等人进行,他们通过一系列测试来评估GPT-4、GPT-3.5、Llama2以及人类参与者的表现,并进行了比较。以下是研究的主要发现:站长网2024-05-27 14:56:150000研究发现 AI 生成的同情心存在局限性
划重点:⭐️人工智能生成的对话代理在解释和探索用户体验方面表现不佳⭐️研究人员发现,人工智能生成的对话代理对某些身份进行价值判断,并可能鼓励有害意识形态⭐️研究人员呼吁在推进自动同情心技术的同时,应持有批判性观点,以减轻潜在危害站长网2024-05-09 15:34:320000WPS逆袭微软Office背后 雷军揭秘:这是中国软件行业最励志的故事
快科技11月30日消息,日前雷军在武大130周年珞珈论坛演讲时提到,WPS是一个硬核的技术英雄梦想,是中国软件行业最励志的故事。WPS的逆袭,就是坚持的胜利。雷军表示,办公软件这样的大型商业软件,开发难度极高,目前全球主要就微软Office、金山WPS这两款。0000900万人观看解清帅直播带货 同情的流量池能否装下变现的野心?
这两年舆论和关注度有一个统一的代名词叫做“流量”,当流量落在普通人身上时往往能带来命运的改变。因此趁着流量还在,开直播做带货已经成为社会常态。早前的张同学,去年的郑女士,今年的桃子老师、黄老师,都在关注度还不错的时候切入了直播带货业务。最近,又一位“名人”加入直播带货行列,他就是刚刚因“千万富翁”寻子被大家关注的解清帅。0000