苏黎世大学研究员开发SwissBERT多语言模型 针对瑞士小语种
站长网2023-07-18 19:02:050阅
瑞士苏黎世大学的研究人员开发了一种名为 SwissBERT 的多语言语言模型,用于瑞士的四种官方语言。
之前,瑞士研究人员在多语言任务上面临困难,因为每种语言都需要单独的语言模型,而且其中一种语言甚至没有独立的神经语言模型。SwissBERT 通过组合这些语言的文章并隐式利用新闻中的实体和事件来创建多语言表示,解决了这一问题。
SwissBERT 模型是基于跨语言模块化(X-MOD)转换器进行改造的,该转换器已经在81种语言上进行了预训练。研究人员通过训练自定义的语言适配器将 X-MOD 转换器应用于他们的语料库中。他们为 SwissBERT 创建了瑞士特有的子词词汇表,生成的模型包含多达1.53亿个参数。
该模型在任务上的表现良好,例如命名实体识别和检测用户对瑞士政治的评论中的立场。在评估模型在罗曼什语上的能力时,发现 SwissBERT 在零样本跨语言迁移以及单词和句子的德语-罗曼什语对齐方面远远优于未使用该语言进行训练的模型。然而,该模型在识别 OCR 处理的历史新闻中的命名实体方面表现不佳。
通过微调下游任务,该模型在未来的研究和非商业用途中可能具有潜力。
论文:https://arxiv.org/pdf/2303.13310.pdf
项目介绍:https://vamvas.ch/introducing-swissbert
模型网址:https://huggingface.co/ZurichNLP/swissbert
0000
评论列表
共(0)条相关推荐
《魔戒:咕噜》道歉信被指使用ChatGPT生成 开发团队毫不知情
文章概要:-《魔戒:咕噜》因技术问题、重复游戏性等多方面问题受到负面评价。-有报道指出,Nacon发布的道歉信使用ChatGPT生成,开发团队DaedalicEntertainment对此毫不知情。-由于资金和时间限制,游戏开发经常出现缩减内容、赶工上市等问题。站长网2023-10-09 11:53:280000英伟达 H100 GPU 现已对亚马逊 AWS 云服务用户开放
据英伟达官方网站公告,亚马逊云现已正式推出由英伟达H100TensorCoreGPU驱动的全新AmazonElasticComputeCloud(EC2)P5实例。新的EC2P5实例使用户能够通过浏览器轻松扩展生成式AI、高性能计算(HPC)和其他应用。站长网2023-07-30 10:21:540000微信上线“腾讯混元助手”多模态对话小程序 由腾讯混元大模型提供支持
站长之家(ChinaZ.com)9月6日消息:今日,微信上线了一款名为“腾讯混元助手”的小程序,同时,“腾讯混元”公众号也正式上线。据小程序介绍显示,“腾讯混元助手”是腾讯混元大模型多模态对话Bot产品,可以回答各类问题,也能处理多种任务,如:获取知识、解决数学问题、翻译、提供旅游攻略、工作建议等。目前,受邀用户可以尝试使用“腾讯混元助手”小程序。站长网2023-09-06 17:47:350000《新闻女王》,边骂边追
“这几年很少有TVB剧爆了,《新闻女王》算是一部。”2005年开始追港剧的豆豆表示,这部剧能排到她港剧片单职场类的前五。据猫眼数据显示,《新闻女王》开播以来热度维持在9000左右,和其他几部在播的流量大剧咬合紧密,豆瓣评分最高时达到了8.2。该剧也席卷各大社交平台,延伸出了《新闻女王》MBTI测试、《新闻女王》职场等级、《新闻女王》大女主骂人方式等话题。0000小扎老黄亲密换衣炉边对谈!小扎竟破防爆粗,老黄自曝第一批Blackwell已出炉
【新智元导读】就在刚刚,老黄在SIGGRAPH大会上透露:Blackwell的工程样片,已在本周正式向全世界发送!随后,老黄和小扎展开了炉边对话,并且亲密换衣,说到激动处,小扎气得一度爆粗。惊爆消息来了!刚刚,老黄在SIGGRAPH计算机图形会议上透露:就在本周,英伟达已经开始向全世界发送Blackwell的工程样片了!站长网2024-07-30 14:39:090000