日本政府与科技巨头联手投资数亿美元开发日语语言模型
文章概要:
1. 日本政府与NEC、富士通、软银等主要科技公司正在合作投资数亿美元,旨在开发一款文化敏感的日语语言模型,超越现有的ChatGPT等模型,更好地体现日本文化和语言。
2. 这一新模型将在国家超级计算机Fugaku上进行训练,并计划于明年以开源形式发布,具备至少300亿个参数,预计性能明显优于现有模型。
3. 为了评估语言模型对日本文化的敏感度,研究人员开发了Rakuda排名,其中GPT-3.5目前排名第一,表现优异,但日本LLM在该排名中排名第四。
据最新报道,日本政府与NEC、富士通、软银等主要科技公司正共同投资数亿美元,旨在开发一款文化敏感的日语语言模型。这一举措旨在超越现有的ChatGPT等模型,更好地代表日本文化和语言,解决当前模型在日本市场上的一些不足之处。
由东京工业大学、东北大学、富士通和政府资助的 RIKEN 开发的日本 LLM 预计将于明年开源,并将拥有至少300亿个参数。
新的日语语言模型将使用国家超级计算机Fugaku进行训练,这将使其性能远远超越现有的模型。
研究人员指出,现有模型如ChatGPT存在一些问题,例如生成一些罕见的字符和未知单词,以及在文化上适当且礼貌的沟通规范方面存在不足。这些问题可能是由于日语具有多达48个字符的字母系统,以及汉字汉字的使用,每个字符都有不同的发音,以及大约50,000个很少使用的汉字。新模型的开发旨在解决这些问题,提供更准确和文化敏感的日语生成。
为了评估语言模型对日本文化的敏感度,研究人员还开发了Rakuda排名系统。根据排名结果,目前最优秀的开源日本LLM在该排名中排名第四,而GPT-3.5表现卓越,名列榜首。随着新模型的发布,预计其性能将明显超越目前的情况,使其成为更好的文化代表。
日本文部科学省正在建立一个更大的模型。该模型拥有至少1000亿个参数,也将基于日语并针对科学应用进行优化:根据已发表的研究,它将产生新的假设以加速研究。该模型将耗资约2亿美元,预计将于2031年向公众开放。
最近,日本文部科学省还发布了指导方针,允许小学、初中和高中有限地使用ChatGPT等生成式人工智能,以促进教育和研究领域的发展。这一举措显示了日本政府对人工智能领域的积极投资和支持。
三星电子获得数据中心 AI 芯片订单 受益于 4 纳米工艺良率提高
站长之家(ChinaZ.com)7月14日消息:三星电子在其先进的4纳米制造工艺中,成功获得了一家数据中心AI芯片客户。据ZDNetKorea报道,根据业内消息,三星电子的制造部门最近获得了一项订单,用于生产供应数据中心的服务器用AI芯片。该芯片将通过三星电子设计子公司的设计,在明年下半年开始量产,采用三星电子的4纳米制造工艺。这是三星电子首次获得该芯片客户的订单。站长网2023-07-14 16:01:220001抖音6种月入过万的书单号
各位村民好,我是村长。做书单号,一个月就可以赚好几万。这是大家在一些社群里看到的分享,都想去试试。于是拿起一本书就开始拍照片,发了好几百页,也没带出去几本书。今天村长就和大家一起来聊一聊,关于抖音书单号的六种做法。图源备注:图片由AI生成,图片授权服务商Midjourney01名言名句书单号这种不需要真人出镜,就是去网上翻找那些特别有教育、启蒙、共情的语句。站长网2023-11-08 09:11:540000OpenAI 将 GPT-4 设置为 ChatGPT Plus 付费用户的默认模型
站长之家(ChinaZ.com)8月7日消息:OpenAI最近为ChatGPT引入了几个新功能。其中之一是加入了示例提示、建议回复和后续问题。这些新增功能旨在增强用户体验,在与AI聊天机器人对话时提供更多指导。站长网2023-08-07 09:12:390000短篇作者为何能在UC故事会月入过万
UC故事会的内容机制和平台策略,帮助很多作者都实现了月入过万的小目标,也让他们在这里找到了更多人生新的可能。短篇作者叙白这个月几乎没更新,但今年3月在UC故事会发布的短篇还在为她贡献着每月一两万的收益。UC故事会是UC浏览器小说频道的重要品类之一,其中有海量的独家短篇小说。这种短篇故事在内容上沿袭了传统网文的经典类型,但篇幅更短,节奏更紧凑,10分钟左右就能读完一篇完整内容,深受用户喜爱。0000苹果尴尬!iOS系统比安卓难上手实锤了:易用性相差58%
快科技6月23日,Android和iOS谁更易用?恐怕对于不同的人来说,答案会各不相同。不过,Greensmartphones试图借助搜索引擎来统计出一种确定性的答案。方法是汇总过去12个月iPhone和Android上执行一种常见任务如截图、录屏、拉黑、扫码等操作的搜索量,如果搜索量很大,那证明对于用户并不友好,或者说功能并不直观。结果发现,Android的易用性比iOS高出58%。站长网2023-06-23 23:42:490001