阿里达摩院推大语言模型PolyLM:通晓18种语言 拥有1.7B和13B两种参数版本
最近,阿里巴巴达摩院发布的一个名为 POLYLM 的多语言大型语言模型引起了人们的兴趣。与其他多语言模型不同的是,PolyLM 能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有1.7B和13B两种参数版本可选。
官方的介绍是这样的:
PolyLM是一个通晓多语言的大语言模型,涵盖中文、英文、西班牙语、法语、德语、俄语、葡萄牙语、意大利语、阿拉伯语、日语、韩语、泰语、越南语和印尼语等18种语言。该模型可以应用于对话问答、文本生成、机器翻译和情感分析等领域,能够自动生成高质量的多语言文本,从而为跨语言、文化的交流提供便利。
据了解,POLYLM 使用了包含640B 个token 的庞大数据集进行训练,数据集来源于维基百科、mC4和 CC-100等公开可访问的资源。

研究团队提出了一种课程学习技术,逐渐增加高质量、资源较少的语言在训练中的比例,重点是从英语向其他语言转移通用知识。
团队还开发了一个名为 MULTIALPACA 的多语言指令数据集,用于监督微调阶段。为了评估 POLYLM 的多语言能力,团队还开发了一个基准测试,包括十个任务和十五种语言。研究表明,POLYLM 在非英语语言上的表现优于同等规模的开源模型。总的来说,POLYLM 提供了一个具有多语言能力的开源模型,有助于解决现有模型在非英语语言上的局限性。
团队总结了 POLYLM 的表现:
已经执行了熟练的13B 比例模型,在西班牙语、俄语、阿拉伯语、日语、韩语、泰语、印度尼西亚语和中文等主要非英语语言中表现良好。该模型补充了现有的开源模型,这些模型要么缺乏对这些语言的熟练程度,要么具有较小的版本而没有相同的功能。
提出了一种先进的课程学习方法,有助于将主要通过英语获得的一般知识转移到各种非英语语言和特定的自然语言处理任务(例如机器翻译)。
人们提出了一个名为 MULTIALPACA 的数据集,它补充了现有的教学数据集,使大语言模型能够更好地遵循多语言教学,特别是非英语母语人士的教学。
论文网址:https://arxiv.org/abs/2307.06018
项目网址:https://modelscope.cn/models/damo/nlp_polylm_13b_text_generation/summary
OpenAI开年王炸!GPT商店本周上线,谁的AI第一桶金?
让普通人翻身的GPT商店终于要来了。OpenAI革命性力作,GPT商店本周上线继奥特曼那场年度宫斗大戏落幕之后,OpenAI终于把推迟许久的GPT商店提上了日程。就在最近,OpenAI突然向所有GPT开发者们发布了一封邮件,明确表示本周将上线自定义的“GPTStore”商店。这可以说是2024开年以来,AI领域的第一个重磅消息,预示着人工智能应用即将进入大爆发时代。0000一元复始,万象更新丨叮咚~你的元旦主题字体已上线!
常言道:“一元复始,万象更新”。元旦,对我们而言,不仅是上一年的终结,也是新一年的开始。为了感谢这一年各位字体商家和用户对字体超市无声的陪伴与支持,在这辞旧迎新的2023年尾声,字体超市为大家精选一波元旦主题字体,“旦”愿2024依旧与您同行!「励字小标宋简」0000“电子女友”@七七7 涨粉百万,谁懂讲故事的含金量?
一名叫@七七7的博主,正在抖音悄然走红。@七七7是一个故事博主,视频中,她凭借可爱甜美的声音,以及同样可爱的样貌,面向镜头向粉丝讲各种睡前小故事。靠着无数“听故事”的用户们,以及平台算法,@七七7火速蹿红。据热浪数据显示,@七七7近一个月涨粉100余万。6月中旬,账号还只有10余万粉丝,如今粉丝量已经达到188.9万,为略显沉闷的7月互联网带来一记惊响。站长网2024-07-13 10:28:270001AI视野:蚂蚁集团开源代码大模型CodeFuse;Meta计划推出新的AI模型;腾讯乐享发布“乐享 AI 助手”
>>>>>大模型动态<<<<<蚂蚁集团开源代码大模型CodeFuse蚂蚁集团在外滩大会上正式开源了自主研发的代码生成大模型CodeFuse。CodeFuse可以根据开发者输入快速生成代码、添加注释、编写测试用例等,能显著提高研发效率。项目地址:https://huggingface.co/codefuse-ai要点:站长网2023-09-11 16:22:550000美国SEC主席警告:若未经监管,AI可能会引发金融危机
划重点:-美国证券交易委员会(SEC)主席GaryGensler警告,未经监管,由人工智能(AI)引发的金融危机“几乎不可避免”。-Gensler指出,AI的问题在于“横向”,因为许多机构可能依赖相同的基础模型或数据聚合器。-SEC已在7月提出一项新规定,针对经纪商和投资顾问使用预测数据分析和类似技术,包括AI。站长网2023-10-18 11:43:020000