登陆注册
9307

阿联酋科技集团G42推出开源阿拉伯语AI模型Jais

站长网2023-08-30 15:22:030

文章概要:

1. 一群工程师、研究人员和一家硅谷芯片公司合作,发布了先进的阿拉伯语软件,可以为生成式AI应用提供支持。

2. 新的大语言模型Jais包含130亿参数,是从大量阿拉伯语和英语数据中训练出来的。

3. Jais将以开源许可方式提供。

最近,一群工程师、研究人员以及硅谷的芯片公司Cerebras Systems合作,发布了一款先进的阿拉伯语软件,可为生成式AI应用提供支持。

这项名为Jais的大语言模型包含130亿个参数,它是从大批阿拉伯语数据和英语数据中训练而成的,其中一部分来自计算机代码。之所以启动这个项目,是因为该小组认为目前具有双语能力的大型语言模型很少。

Jais的训练是在Cerebras Systems生产的超级计算机Condor Galaxy上完成的。今年,Cerebras宣布已经向阿联酋科技集团G42出售了三台这样的超级计算机,第一台将在今年交付,其余两台将在2024年交付。与Jais的合作方还包括Mohamed bin Zayed人工智能大学和G42的子公司Inception。

由于用于训练Jais这种规模模型的阿拉伯语数据不足,英语数据中的计算机代码有助于训练模型的推理能力。Mohamed bin Zayed大学教授Timothy Baldwin表示,代码可以“大大提高模型的推理能力,因为它详细说明了(逻辑)步骤”。

Jais将通过开源许可方式提供。阿联酋G42推出这一开源阿拉伯语AI模型,有助促进阿语资源的开发,也体现了该国推动AI发展的决心。其开源性质也使更多研发团队能参与 Arabic AI的建设,为阿拉伯世界的 AI进步贡献力量。

0000
评论列表
共(0)条