苏黎世大学研究员开发SwissBERT多语言模型 针对瑞士小语种
站长网2023-07-18 19:02:050阅
瑞士苏黎世大学的研究人员开发了一种名为 SwissBERT 的多语言语言模型,用于瑞士的四种官方语言。
之前,瑞士研究人员在多语言任务上面临困难,因为每种语言都需要单独的语言模型,而且其中一种语言甚至没有独立的神经语言模型。SwissBERT 通过组合这些语言的文章并隐式利用新闻中的实体和事件来创建多语言表示,解决了这一问题。
SwissBERT 模型是基于跨语言模块化(X-MOD)转换器进行改造的,该转换器已经在81种语言上进行了预训练。研究人员通过训练自定义的语言适配器将 X-MOD 转换器应用于他们的语料库中。他们为 SwissBERT 创建了瑞士特有的子词词汇表,生成的模型包含多达1.53亿个参数。
该模型在任务上的表现良好,例如命名实体识别和检测用户对瑞士政治的评论中的立场。在评估模型在罗曼什语上的能力时,发现 SwissBERT 在零样本跨语言迁移以及单词和句子的德语-罗曼什语对齐方面远远优于未使用该语言进行训练的模型。然而,该模型在识别 OCR 处理的历史新闻中的命名实体方面表现不佳。
通过微调下游任务,该模型在未来的研究和非商业用途中可能具有潜力。
论文:https://arxiv.org/pdf/2303.13310.pdf
项目介绍:https://vamvas.ch/introducing-swissbert
模型网址:https://huggingface.co/ZurichNLP/swissbert
0000
评论列表
共(0)条相关推荐
OpenAI官宣Sam Altman回归担任CEO
OpenAI宣布,SamAltman正式回归OpenAI担任CEO,MiraMurati也将回到CTO职位。新的初始董事会将由BretTaylor(董事长)、LarrySummers和AdamD'Angelo组成。同时,Altman表达了对所有人的感谢,并表示对OpenAI实现使命的成功概率感到非常乐观。站长网2023-11-30 09:32:160000全球首个AI程序员诞生,码农饭碗一夜被砸!10块IOI金牌华人团队震撼打造,996写代码训练模型
全球首位AI软件工程师Devin诞生了,它掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型都不在话下。最可怕的是,它完全不怕996,老黄的预言是彻底成真了!就在刚刚,世界上第一位AI程序员Devin诞生。一家叫Cognition的10人初创公司,才成立不到2个月,就给了全世界亿点点震撼。刚一放出,Devin就刷爆了全网。站长网2024-03-13 14:09:520000谷歌推出AI音乐创作工具“MusicFX”,几句话即可创作音乐
**划重点:**1.🚀MusicFX利用Google的MusicLM和DeepMind的SynthID技术,让用户通过几句话即可创作音乐,标志性的AI音乐创作工具。2.🛡️工具在保护原创艺术家声音和风格的同时,强调了负责任的AI创新,通过早期公众参与和隐私保护解决了潜在问题。站长网2023-12-14 10:24:380000iPhone16Pro四款配色曝光 包括古铜色、纯净原色等
近期,海外爆料者披露了iPhone16ProMax的机模信息,揭示了苹果即将推出的旗舰手机将采用的四款全新配色方案。据曝光,iPhone16Pro系列将提供四种颜色选择:经典白色、深邃黑色、纯净原色以及引人注目的全新古铜色。这款古铜色是苹果首次尝试,它取代了iPhone15Pro系列中反响平平的蓝色版本。古铜色的灵感来源于iPhone5s/6系列的香槟金,但呈现出更为深沉的色调。站长网2024-08-19 09:42:300000快手618购物节招商启动 将投入100亿平台流量和10亿商品补贴
日前,快手电商举办引力大会,宣布启动快手618购物节招商,快手618购物节已从5月9日开启招商报名。618购物节期间(预售期5月18日—5月31日,正式期6月1日-6月18日),快手电商将投入100亿平台流量和10亿商品补贴,推出直播间大牌大补、商品预售、直播间消费金等玩法,助力商家实现大促爆发。站长网2023-05-16 14:15:380000