日本政府与科技巨头联手投资数亿美元开发日语语言模型
文章概要:
1. 日本政府与NEC、富士通、软银等主要科技公司正在合作投资数亿美元,旨在开发一款文化敏感的日语语言模型,超越现有的ChatGPT等模型,更好地体现日本文化和语言。
2. 这一新模型将在国家超级计算机Fugaku上进行训练,并计划于明年以开源形式发布,具备至少300亿个参数,预计性能明显优于现有模型。
3. 为了评估语言模型对日本文化的敏感度,研究人员开发了Rakuda排名,其中GPT-3.5目前排名第一,表现优异,但日本LLM在该排名中排名第四。
据最新报道,日本政府与NEC、富士通、软银等主要科技公司正共同投资数亿美元,旨在开发一款文化敏感的日语语言模型。这一举措旨在超越现有的ChatGPT等模型,更好地代表日本文化和语言,解决当前模型在日本市场上的一些不足之处。
由东京工业大学、东北大学、富士通和政府资助的 RIKEN 开发的日本 LLM 预计将于明年开源,并将拥有至少300亿个参数。
新的日语语言模型将使用国家超级计算机Fugaku进行训练,这将使其性能远远超越现有的模型。
研究人员指出,现有模型如ChatGPT存在一些问题,例如生成一些罕见的字符和未知单词,以及在文化上适当且礼貌的沟通规范方面存在不足。这些问题可能是由于日语具有多达48个字符的字母系统,以及汉字汉字的使用,每个字符都有不同的发音,以及大约50,000个很少使用的汉字。新模型的开发旨在解决这些问题,提供更准确和文化敏感的日语生成。
为了评估语言模型对日本文化的敏感度,研究人员还开发了Rakuda排名系统。根据排名结果,目前最优秀的开源日本LLM在该排名中排名第四,而GPT-3.5表现卓越,名列榜首。随着新模型的发布,预计其性能将明显超越目前的情况,使其成为更好的文化代表。
日本文部科学省正在建立一个更大的模型。该模型拥有至少1000亿个参数,也将基于日语并针对科学应用进行优化:根据已发表的研究,它将产生新的假设以加速研究。该模型将耗资约2亿美元,预计将于2031年向公众开放。
最近,日本文部科学省还发布了指导方针,允许小学、初中和高中有限地使用ChatGPT等生成式人工智能,以促进教育和研究领域的发展。这一举措显示了日本政府对人工智能领域的积极投资和支持。
靠聊天记录占据7月情感赛道榜首,视频号新的流量密码诞生?
你有过这样的经历吗?为了把事情说清楚,直接截图聊天记录或者合并转发聊天记录给朋友?或者说,看到别人发给你的聊天记录,一定仔仔细细看清楚上面的对话?聊天记录本是扁平化的存在,但现在有人把它做成了视频。站长网2023-08-09 17:01:160000AI日报:昆仑万维推AI短剧平台SkyReels;Glif工作流可一键生成时尚模特图;在线版FLUX提供LoRA训练;ControlNeXt让钢铁侠跳美女舞蹈
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、昆仑万维推出全球首个AI短剧平台SkyReels站长网2024-08-19 15:24:150000苹果新一代CarPlay不再霸道:放弃部分控制权 车厂适配更灵活
快科技2月12日消息,CarPlay是苹果的生态之一,将iPhone的地图、音乐和通话等功能融入汽车系统,从而减少驾驶过程中的分心和危险。这款来自苹果的车载系统于2014年在法拉利跑车上首次亮相,随后在2015年被各大汽车制造商广泛采用,只需要数据或者无线,就可以在车载屏幕上体验到CarPlay。0000报道称小红书内测“笔记带货”功能
据Tech星球报道,小红书近期推出电商新功能“笔记带货”,商家可以利用KOL合作笔记带动电商交易。目前,该功能正在测试阶段,收到小红书定向邀请的核心商家才可以体验这一功能,后续“笔记带货”将全面开放。据悉,拥有“笔记带货”权限的商家,可以在平台内挑选达人进行挂链合作。同时,平台设立独立笔记带货选品中心,达人可以在发布笔记时直接关联商品,单篇笔记支持多品挂链接。站长网2023-05-05 16:40:5800001999元 全球首款妈祖平安智能手表发布:搭载华为智能机芯
快科技1月3日消息,日前,在2025年湄洲妈祖祖庙跨年祈福盛典上,全球首款妈祖平安智能腕表发布,手表搭载华为智能机芯,售价1999元。据媒体报道,每售出一只妈祖平安智能腕表,即捐献给湄洲妈祖祖庙10元爱心善款,用于助力妈祖文化传承。ID设计上,妈祖平安智能腕表融入妈祖文化元素,表圈一侧印有湄洲妈祖”印记,并且提供妈祖石雕像、卡通妈祖等图案的表盘,实现抬腕见妈祖”。站长网2025-01-04 10:27:090000