Stability AI发布两款日语语言模型
划重点:
1. 最新发布:Stability AI Japan发布了两款日语语言模型,
分别是“Japanese Stable LM3B-4E1T”和“Japanese Stable LM Gamma7B”,前者有30亿参数,后者则拥有70亿参数。
这两款模型基于之前发布的英语语言模型构建,后来通过引入大量日语和英语数据进行预训练,提升其日语语言处理能力。
Stability AI Japan最近发布了两款令人瞩目的日语语言模型,分别命名为“Japanese Stable LM3B-4E1T”和“Japanese Stable LM Gamma7B”。
前者具有大约30亿参数,而后者则拥有高达70亿参数的庞大规模。这两款模型以Apache2.0许可证发布,允许商业使用,为日本的自然语言处理领域带来了一次革命性的突破。

这两个模型的背景可追溯到之前发布的英语语言模型,具体为“Stable LM3B-4E1T”和“Mistral-7B-v0.1”。最初,它们在主要使用英语数据进行训练,因此在英语处理方面表现出色,但在日语处理能力上受限,这是因为日语数据相对较少。


为了提高其日语语言能力,这两个模型经历了持续的预训练,利用了来自维基百科、mC4、CC-100、OSCAR和SlimPajama(不包括Books3)等数据源的大约1000亿token。
这两款模型的性能评估采用了与之前发布的“Japanese Stable LM Alpha”相同的方法。评估包括了日本语言理解基准(JGLUE)任务,涵盖了句子分类、句子对分类、问题回答和文本摘要等八项任务。结果显示,尽管只有30亿参数,但“Japanese Stable LM3B-4E1T”在多项任务上表现出色,而“Japanese Stable LM Gamma7B”甚至获得更高的分数,展示了这些模型在日语自然语言处理方面的卓越进展。
Meta 试图通过 Advantage+ AI 来吸引广告商投放定向广告
据TheInformation消息,广告公司高管透露,Facebook母公司Meta目前已停止向广告商推介其元宇宙计划,并转向强调其人工智能(AI)工具和短视频产品Reels。这也表明马克·扎克伯格的热情正在消退,原本全力押注元宇宙的他,现在开始关注公司的成本削减。Meta正在加强其AI工具的宣传,特别是针对定向广告的AdvantageAI项目。站长网2023-04-19 16:30:200001阿联酋科技集团G42推出开源阿拉伯语AI模型Jais
文章概要:1.一群工程师、研究人员和一家硅谷芯片公司合作,发布了先进的阿拉伯语软件,可以为生成式AI应用提供支持。2.新的大语言模型Jais包含130亿参数,是从大量阿拉伯语和英语数据中训练出来的。3.Jais将以开源许可方式提供。最近,一群工程师、研究人员以及硅谷的芯片公司CerebrasSystems合作,发布了一款先进的阿拉伯语软件,可为生成式AI应用提供支持。站长网2023-08-30 15:22:030000AI日报:Open-Sora Plan v1.2发布;Mistral Large2突然开源;腾讯智影推智能画布功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、震撼来袭!Open-SoraPlanv1.2发布,清晰度、推理速度起飞站长网2024-07-25 17:15:440000美团全资收购光年之外,王兴亲自下场抓大模型
美团全资收购光年之外在国内互联网科技企业大模型之战打得如火如荼时,外卖巨头美团也加入了战局中。大约一个月前,美团就在港交所宣布以20.65亿元收购大模型创业公司光年之外的全部权益。一个月后,光年之外发生工商变更,全资股东由王慧文变更为美团旗下天津三快科技有限公司,这也意味着美团正式入股光年之外。(图源:天眼查)站长网2023-08-09 12:22:170000仿人脑神经开发AI!剑桥大学最新研究登Nature子刊,人造大脑成AI新方向
【新智元导读】剑桥大学最新研究显示,AI模型和人脑神经结构有不少相似,也许未来会成为AI模型设计的关键。人脑作为地球上最复杂的智能载体,一个最大的特点就是能高能效地产生智能。如果能尽可能按照人脑的工作原理来创建AI系统,将会大大提高AI的工作效率,大幅降低能耗。最近,剑桥大学做了这么项研究,就是想找到一个条路径,让AI系统复制人脑。0000