阿拉伯语版ChatGPT“Jais Chat”问世 性能堪比英语商业模型
站长网2023-09-04 10:12:240阅
文章概要:
1. Jais是面向阿拉伯语的开源大模型,参数量达130亿
2. 在阿拉伯语任务上,Jais性能可匹敌ChatGPT
3. Jais在Cerebras专用芯片上训练,具有技术创新
阿拉伯联合酋长国的研究人员利用Cerebras公司的专用AI芯片,开发出了两个开源的大规模语言模型Jais和Jais Chat。这是业界首个面向阿拉伯语的、参数规模超过100亿的开源语言模型。
Jais拥有130亿个参数,使用了3950亿个训练样本,其中1160亿个是阿拉伯语样本。主要使用阿拉伯语网站、书籍、新闻和维基百科作为训练数据,所有数据在训练前进行过滤。
Jais Chat则通过额外的对话训练进行了优化。这两个模型在一系列阿拉伯语任务上的测试精度,明显超过了现有的阿拉伯语开源模型,在某些写作任务上甚至可匹敌商业化的英语模型ChatGPT。
该团队表示,在基准测试中,Jais 和 Jais-chat 的准确度比现有的免费阿拉伯语模型高出11到15个点,并且在英语方面与 Meta 的 LLaMa2具有竞争力。OpenAI 的ChatGPT或 Anthropic 的Claude等商业模型在基准测试中平均仍然领先,但规模也明显更大。
另外,Jais的训练没有使用Nvidia的GPU,而是在Cerebras专用的Wafer级芯片上完成。这种芯片专为AI工作负载而设计,使Jais的训练实现了技术创新。Jais的开源发布有助于推动阿拉伯语自然语言处理的进步。
0000
评论列表
共(0)条相关推荐
麻省理工推出AI工具PhotoGuard 对抗生成式AI模型
近年来,大型扩散模型,如DALL-E2和StableDiffusion,因其生成高质量、逼真的图像以及执行各种图像合成和编辑任务的能力而受到认可。但是,人们对用户友好的生成式AI模型的潜在滥用也越来越担忧,这些模型可能会导致不适当或有害的数字内容的创建。例如,恶意行为者可能利用公开分享的个人照片,通过使用现成的扩散模型,出于恶意目的对其进行编辑。站长网2023-08-01 16:32:310000Parrot提出新型多重奖励强化学习框架以改进文本生成图像
**划重点:**-🔄**多奖励优化:**Parrot是一种用于文本生成图像的多重奖励强化学习(RL)框架,采用联合优化方法,有效解决了奖励过度优化和降级问题。-📊**质量度量改进:**与使用单一奖励模型相比,Parrot框架在美学、图像情感和人类喜好等多个质量指标上取得了显著改进。站长网2024-01-16 07:01:200001做播客,肯定亏钱啊。
2023年7月5号,腾讯旗下的企鹅FM宣布下线,并于9月6日正式停止运营。一边是大厂关停旗下的音频产品,一边是国内收听音频在线人数的不断攀升。而这几年,我们朋友圈里面,不时有很多人分享小宇宙、喜马拉雅这样的音频播客节目。图源备注:图片由AI生成,图片授权服务商Midjourney现在写作难、拍短视频难,于是吸引了很多人纷纷转向音频播客节目。01年代感的产品被激活站长网2023-09-27 09:17:230000become-image:人物照片+参考照片可生成目标风格人物照
划重点:⭐️只要上传一张人物照片和一张参考风格的照片就可以将任何人脸图片转换成另一种风格的图像⭐️可调节生成图片的相关参数,包括保留原始人脸图像的程度、强度控制以及样式应用等⭐️可以选择添加一些特殊效果,如控制生成图片的噪声程度、固定随机种子以确保再现性等想要将一张人像照片转换成为类似梵高画作的风格如何操作呢?become-image这个工具就能实现这个效果。站长网2024-03-13 12:03:580001AIGC 是来颠覆还是加入低代码的?
随着以ChatGPT为代表的大模型的爆火,AIGC狂飙态势仍在继续并快速渗透到各行各业,低代码赛道也不例外。AIGC低代码、AI生成式开发、AIGS等概念的涌现,似乎预示着AI新时代下低代码正在发生着深刻变革。当“整个产业都会被AI重做一遍”成为共识,低代码赛道的背后又是怎样的“暗流涌动”?站长网2023-08-24 20:13:420000