日本政府与科技巨头联手投资数亿美元开发日语语言模型
文章概要:
1. 日本政府与NEC、富士通、软银等主要科技公司正在合作投资数亿美元,旨在开发一款文化敏感的日语语言模型,超越现有的ChatGPT等模型,更好地体现日本文化和语言。
2. 这一新模型将在国家超级计算机Fugaku上进行训练,并计划于明年以开源形式发布,具备至少300亿个参数,预计性能明显优于现有模型。
3. 为了评估语言模型对日本文化的敏感度,研究人员开发了Rakuda排名,其中GPT-3.5目前排名第一,表现优异,但日本LLM在该排名中排名第四。
据最新报道,日本政府与NEC、富士通、软银等主要科技公司正共同投资数亿美元,旨在开发一款文化敏感的日语语言模型。这一举措旨在超越现有的ChatGPT等模型,更好地代表日本文化和语言,解决当前模型在日本市场上的一些不足之处。
由东京工业大学、东北大学、富士通和政府资助的 RIKEN 开发的日本 LLM 预计将于明年开源,并将拥有至少300亿个参数。

新的日语语言模型将使用国家超级计算机Fugaku进行训练,这将使其性能远远超越现有的模型。
研究人员指出,现有模型如ChatGPT存在一些问题,例如生成一些罕见的字符和未知单词,以及在文化上适当且礼貌的沟通规范方面存在不足。这些问题可能是由于日语具有多达48个字符的字母系统,以及汉字汉字的使用,每个字符都有不同的发音,以及大约50,000个很少使用的汉字。新模型的开发旨在解决这些问题,提供更准确和文化敏感的日语生成。
为了评估语言模型对日本文化的敏感度,研究人员还开发了Rakuda排名系统。根据排名结果,目前最优秀的开源日本LLM在该排名中排名第四,而GPT-3.5表现卓越,名列榜首。随着新模型的发布,预计其性能将明显超越目前的情况,使其成为更好的文化代表。
日本文部科学省正在建立一个更大的模型。该模型拥有至少1000亿个参数,也将基于日语并针对科学应用进行优化:根据已发表的研究,它将产生新的假设以加速研究。该模型将耗资约2亿美元,预计将于2031年向公众开放。
最近,日本文部科学省还发布了指导方针,允许小学、初中和高中有限地使用ChatGPT等生成式人工智能,以促进教育和研究领域的发展。这一举措显示了日本政府对人工智能领域的积极投资和支持。
百度MEG进行新一轮组织调整:文库升级为BU,赵世奇回归负责搜索
站长之家(ChinaZ.com)2月23日消息:据36氪消息,百度今日宣布,其移动生态业务群组(MEG)进行新一轮的组织调整,具体调整如下:0000三星计划进军XR市场:正在开发相关芯片
据财联社消息,三星电子正在开发扩展现实(XR)处理器芯片,以与行业领先者高通和谷歌展开竞争。XR包括虚拟现实(VR)、增强现实(AR)和混合现实(MR)。据悉,高通公司目前处于领先地位,在2022年11月推出了最新系列的XR芯片,名为骁龙AR2。三星正在考虑为XR产品开发新的处理器,或对现有的Exynos系列处理器进行改造以适应XR设备,而Exynos处理器目前并不是为XR设备设计的。站长网2023-05-29 11:32:380000荣耀 Magic5 至臻版对比荣耀 Magic4 至臻版,配置有啥升级,一眼看懂
站长网2023-05-24 01:42:520006一游戏网站开除40%员工,用“AI编辑”每周撰写数百篇文章
随着三月份的一轮残酷裁员,一家名为Gamurs的媒体公司拥有包括DotEsports和Destructoid在内的几个受欢迎的游戏网站,淘汰了至少50的员工据估计,大约占员工总数的40%。站长网2023-06-15 12:26:520001研究称:澳大利亚在AI监管中处于落后地位
🔍划重点:-澳大利亚在AI领域的资金和监管方面被认为滞后,尤其在美国发布AI监管行政命令后,专家发出了警告。-澳大利亚政府虽然签署了布莱切利宣言,但尚未宣布对AI安全调查的回应,导致专家担心澳大利亚可能被抛在国际竞争之后。-尽管已收到超过500份关于AI的建议意见,但政府在资金支持和监管细节上的不足表明澳大利亚需要采取更积极的措施来保障AI的安全发展。站长网2023-11-07 14:29:100004