阿联酋科技集团G42推出开源阿拉伯语AI模型Jais
站长网2023-08-30 15:22:030阅
文章概要:
1. 一群工程师、研究人员和一家硅谷芯片公司合作,发布了先进的阿拉伯语软件,可以为生成式AI应用提供支持。
2. 新的大语言模型Jais包含130亿参数,是从大量阿拉伯语和英语数据中训练出来的。
3. Jais将以开源许可方式提供。
最近,一群工程师、研究人员以及硅谷的芯片公司Cerebras Systems合作,发布了一款先进的阿拉伯语软件,可为生成式AI应用提供支持。
这项名为Jais的大语言模型包含130亿个参数,它是从大批阿拉伯语数据和英语数据中训练而成的,其中一部分来自计算机代码。之所以启动这个项目,是因为该小组认为目前具有双语能力的大型语言模型很少。
Jais的训练是在Cerebras Systems生产的超级计算机Condor Galaxy上完成的。今年,Cerebras宣布已经向阿联酋科技集团G42出售了三台这样的超级计算机,第一台将在今年交付,其余两台将在2024年交付。与Jais的合作方还包括Mohamed bin Zayed人工智能大学和G42的子公司Inception。
由于用于训练Jais这种规模模型的阿拉伯语数据不足,英语数据中的计算机代码有助于训练模型的推理能力。Mohamed bin Zayed大学教授Timothy Baldwin表示,代码可以“大大提高模型的推理能力,因为它详细说明了(逻辑)步骤”。
Jais将通过开源许可方式提供。阿联酋G42推出这一开源阿拉伯语AI模型,有助促进阿语资源的开发,也体现了该国推动AI发展的决心。其开源性质也使更多研发团队能参与 Arabic AI的建设,为阿拉伯世界的 AI进步贡献力量。
0000
评论列表
共(0)条相关推荐
GPT Crawler:一款可抓取网站内容以创建定制化GPT的AI工具
划重点:-💡GPTCrawler是一款能够从网页中提取知识并生成知识文件的AI工具-💡它使用自然语言处理技术,将非结构化的网页内容转化为有组织的知识-💡GPTCrawler的出现将在信息提取、定制化GPT模型和个性化AI交互等领域发挥重要作用站长网2023-11-29 10:42:050002钉钉斜杠“/”放大招:私有小模型机器人、工作群一键爬楼,手绘表格秒变小程序
用私有数据定制一个专属的AI对话机器人,是很多人“ChatGPT自由”后的下一个梦想。现在,钉钉先帮大家实现了!一键自动学习文档内容创建问答机器人,不同于Langchain等需要开发能力的方案,有手就能玩。简单创建好后,就可以向机器人提问了,对于资料里有的内容,基本都引用原文给出答案。简直是公司培训、客服答疑、社群运营等场景的利器。站长网2023-05-31 21:00:300001支付宝能找工作了:首批上线5万个高薪岗位 年薪70万 占比超一半
快科技5月30日消息,支付宝上能找高薪工作了!。职场社区平台脉脉旗下脉脉高聘”正式牵手支付宝,双方将围绕支付宝小程序、就业聚合频道、直播等维度展开合作。首批在支付宝就业频道上线5万个高薪正式岗位,年薪70万以上岗位占比超一半,包含技术、设计、产品、电商、人事等多个岗位类型。工作地覆盖北上广深等一线城市及重庆、武汉、西安等多个新一线城市。现在,上支付宝搜脉脉高聘”即可了解相关岗位信息。站长网2023-05-30 21:19:390002微软官网发出Win10终止警告 微软不遗余力推荐升级Win11
站长之家(ChinaZ.com)11月8日消息:微软近日在其官方网站的Windows系统下载页面上发布了新的提示,鼓励Windows10用户升级至Windows11操作系统。这一更新是对用户的一种提醒,意在告知用户,如果他们选择不升级,一旦微软停止对Windows10的支持,他们的系统将更容易受到黑客攻击等安全风险。0000复旦大学附属中山医院联合光启慧语发布光语医疗大模型
10月31日复旦大学附属中山医院联合光启慧语打造的“光语医疗大模型”亮相杭州云栖大会。光语医疗大模型是由中山医院深度参与、针对真实医疗场景定制而成,可形成覆盖就医全流程多个场景的医疗AI专业能力。站长网2023-11-01 14:33:300000