阿拉伯语版ChatGPT“Jais Chat”问世 性能堪比英语商业模型
站长网2023-09-04 10:12:240阅
文章概要:
1. Jais是面向阿拉伯语的开源大模型,参数量达130亿
2. 在阿拉伯语任务上,Jais性能可匹敌ChatGPT
3. Jais在Cerebras专用芯片上训练,具有技术创新
阿拉伯联合酋长国的研究人员利用Cerebras公司的专用AI芯片,开发出了两个开源的大规模语言模型Jais和Jais Chat。这是业界首个面向阿拉伯语的、参数规模超过100亿的开源语言模型。
Jais拥有130亿个参数,使用了3950亿个训练样本,其中1160亿个是阿拉伯语样本。主要使用阿拉伯语网站、书籍、新闻和维基百科作为训练数据,所有数据在训练前进行过滤。

Jais Chat则通过额外的对话训练进行了优化。这两个模型在一系列阿拉伯语任务上的测试精度,明显超过了现有的阿拉伯语开源模型,在某些写作任务上甚至可匹敌商业化的英语模型ChatGPT。
该团队表示,在基准测试中,Jais 和 Jais-chat 的准确度比现有的免费阿拉伯语模型高出11到15个点,并且在英语方面与 Meta 的 LLaMa2具有竞争力。OpenAI 的ChatGPT或 Anthropic 的Claude等商业模型在基准测试中平均仍然领先,但规模也明显更大。
另外,Jais的训练没有使用Nvidia的GPU,而是在Cerebras专用的Wafer级芯片上完成。这种芯片专为AI工作负载而设计,使Jais的训练实现了技术创新。Jais的开源发布有助于推动阿拉伯语自然语言处理的进步。
0000
评论列表
共(0)条相关推荐
马斯克:特斯拉自动驾驶出租车选中国吉祥日子发布
近日,有网友好奇地向特斯拉创始人埃隆·马斯克提问,关于为何选择8月8日作为特斯拉最新自动驾驶出租车Robotaxi的发布日期。马斯克在回应中透露,这一选择并非随意,而是基于对中国文化的深刻理解和个人情感的寄托。站长网2024-05-01 15:06:510000小米公司否认收购恒大汽车:从未有过收购或控股的计划和举动
近日,市场流传出一则消息,称小米汽车计划收购恒大汽车高达58.5%的股权,以快速扩充产能,为热销车型小米SU7及第二款SUV的量产铺路。然而,小米汽车方面迅速对此进行了否认,表示从未听说过收购恒大汽车的事情。此前,小米汽车对未来的产能和交付量充满信心,承诺在产能大幅提升的前提下,2024年的交付量将超过10万辆,并力争达到12万辆。站长网2024-05-30 21:22:490000谷歌被指控窃取数百万用户数据训练人工智能工具
日前,谷歌面临一项广泛的侵权诉讼,指控这家科技巨头未经用户同意,窃取了数百万用户的数据,并违反版权法来训练和开发其人工智能产品。这起对谷歌、其母公司Alphabet和其人工智能子公司DeepMind的集体诉讼于周二在加利福尼亚州的联邦法院提起,由克拉克森律师事务所提出。该律所上个月曾对ChatGPT制造商OpenAI提起类似诉讼。站长网2023-07-12 17:26:03000080%代码秒生成!AI神器Copilot大升级,百万开发者动嘴编码5年内成真
【新智元导读】AI编码神器Copilot模型升级,5年80%的代码自动生成,百万码农提速55%。码农AI神器又升级了!就在刚刚,Github官宣,Copilot模型升级,5年内80%的代码将自动生成。GitHubCopilot发布还不到两年,就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。这次升级究竟改进了什么呢?5年,80%代码自动生成站长网2023-07-31 09:12:220000特朗普观摩SpaceX星际飞船测试,马斯克火星计划获鼓励
站长之家(ChinaZ.com)11月20日消息:美国当选总统唐纳德·特朗普周二亲临德克萨斯州,观摩了SpaceX进行的第六次星际飞船飞行测试,尽管此次测试未能成功捕获助推器,但仍取得重要进展。特朗普的到访不仅显示他对太空探索的支持,也体现了他与SpaceX首席执行官埃隆·马斯克日益密切的关系。0000