Stability AI发布两款日语语言模型
划重点:
1. 最新发布:Stability AI Japan发布了两款日语语言模型,
分别是“Japanese Stable LM3B-4E1T”和“Japanese Stable LM Gamma7B”,前者有30亿参数,后者则拥有70亿参数。
这两款模型基于之前发布的英语语言模型构建,后来通过引入大量日语和英语数据进行预训练,提升其日语语言处理能力。
Stability AI Japan最近发布了两款令人瞩目的日语语言模型,分别命名为“Japanese Stable LM3B-4E1T”和“Japanese Stable LM Gamma7B”。
前者具有大约30亿参数,而后者则拥有高达70亿参数的庞大规模。这两款模型以Apache2.0许可证发布,允许商业使用,为日本的自然语言处理领域带来了一次革命性的突破。
这两个模型的背景可追溯到之前发布的英语语言模型,具体为“Stable LM3B-4E1T”和“Mistral-7B-v0.1”。最初,它们在主要使用英语数据进行训练,因此在英语处理方面表现出色,但在日语处理能力上受限,这是因为日语数据相对较少。
为了提高其日语语言能力,这两个模型经历了持续的预训练,利用了来自维基百科、mC4、CC-100、OSCAR和SlimPajama(不包括Books3)等数据源的大约1000亿token。
这两款模型的性能评估采用了与之前发布的“Japanese Stable LM Alpha”相同的方法。评估包括了日本语言理解基准(JGLUE)任务,涵盖了句子分类、句子对分类、问题回答和文本摘要等八项任务。结果显示,尽管只有30亿参数,但“Japanese Stable LM3B-4E1T”在多项任务上表现出色,而“Japanese Stable LM Gamma7B”甚至获得更高的分数,展示了这些模型在日语自然语言处理方面的卓越进展。
谷歌痛失AI大将!76岁图灵奖得主Hinton离职
“深度学习三巨头”之一、2018年图灵奖获得者杰弗里·辛顿(GeoffreyHinton)已离开谷歌,强调他离开是为了谈论人工智能的危险,而不会对谷歌造成影响。Hinton担心AI会制造虚假信息,随着AI技术的进步,它会编写并运行自己的代码,对人类生存构成更大的威胁。站长网2023-05-04 10:22:150000美食账号月销万单,7大类型揭晓
各位村民好,我是村长。美食是抖音最容易做的账号,也是最难做的账号。很多人都想去做美食账号,毕竟民以食为天,食品的受众如此之广,消费如此高频。今天村长就来和大家聊一聊,关于食品大类,有哪些方向可以切入的。备注:这里先解释一下,我这里的美食包含了线上线下,也包含了餐饮、零食等产品。01食谱教学号这是做美食账号的同学,最先容易想到的。站长网2023-05-09 09:03:260000苏黎世大学研究员开发SwissBERT多语言模型 针对瑞士小语种
瑞士苏黎世大学的研究人员开发了一种名为SwissBERT的多语言语言模型,用于瑞士的四种官方语言。之前,瑞士研究人员在多语言任务上面临困难,因为每种语言都需要单独的语言模型,而且其中一种语言甚至没有独立的神经语言模型。SwissBERT通过组合这些语言的文章并隐式利用新闻中的实体和事件来创建多语言表示,解决了这一问题。站长网2023-07-18 19:02:050000AI日报:Model3模型重磅发布;阿里云全面支持Llama 3训练推理;Gorq推出iOS应用;批量去水印工具VSR来了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、BlockadeLabs发布全新模型Model3站长网2024-04-22 21:10:230002保费1个月涨几千 还拒保!新能源车险投保难、投保贵有望缓解 新政策已在路上
快科技4月20日消息,车主喊贵,险企喊亏”的新能源车险发展难题有望缓解。据国内媒体报道称,国家金融监督管理总局财产保险监管司下发了《关于推进新能源车险高质量发展有关工作的通知(征求意见稿)》。根据《意见稿》,政策实施时间原则上不晚于2024年6月1日。在中国电动汽车百人会论坛上,商务部副部长盛秋平提到,将研究降低新能源汽车保险费率,推动提高新能源汽车社会化维修服务能力,解决消费者购车后的顾虑。0000