智源研究院开源18种语言文图生成模型 利好中文用户
站长网2023-05-08 15:10:020阅
智源研究院发布了新款模型AltDiffusion-m18,该模型支持18种语言的文图生成,包括中文、英文、日语、泰语、韩语、印地语、乌克兰语、阿拉伯语、土耳其语、越南语、波兰语、荷兰语、葡萄牙语、意大利语、西班牙语、德语、法语、俄语。

这是非常好的消息,因为现有的非英文模型选择非常有限,用户需要将prompt翻译成英语再输入模型,这使得整个过程非常复杂,同时也会影响生成图片的准确性。
智源研究院FlagAI团队采用高效的训练方式,使用多语言预训练模型和Stable Diffusion结合,成功训练出了这一多语言文图生成模型。
在客观评测中,AltDiffusion-m18模型在英语FID、IS、CLIP score方面达到了Stable Diffusion95~99% 效果,在中文、日文等方面也取得了最优水平,填补了其他15种语言的文图生成模型的空白,极大地满足了产业界对于多语言文图生成的强烈需求。
此外,相关的技术报告《AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities》已被Findings of ACL2023接收。
0000
评论列表
共(0)条相关推荐
Midjoureny网站Alpha版本优化 增加3个分类
Midjoureny网站的Alpha版本进行了一系列体验优化,主要是对探索页面进行了改进。这次更新主要包括对鼠标悬停效果的丰富化,对页面内容的进一步优化,以及新增了热门、精选和随机浏览选项。此外,还新增了相似图片搜索功能,用户只需点击放大镜图标即可使用。站长网2024-01-25 10:49:480000三星面临人工智能服务器芯片领域困境,第三季度营业利润预计不及预期
据路透社消息,三星电子周二公布了其第三季度营业利润预计,达到9.1万亿韩元(约合67.8亿美元),同比增长274%。然而,这一数字仍低于分析师的预期,主要因为该科技巨头在人工智能服务器芯片领域面临困境。据LSEGSmartEstimate预测,三星本季度的营业利润应为10.3万亿韩元,而实际数字未能达到这一预期。与去年同期相比,当时的营业利润为2.43万亿韩元,上一季度则为10.44万亿韩元。0000月成交额超45亿,谁在Temu上赚钱了?
Temu无疑是今年跨境圈的话题王者。用“狂飙突进”形容它毫不夸张。短短10个月,拼多多跨境团队将一个从零起步的APP,做成不可忽视的商业焦点。在全球16个国家和地区病毒式裂变传播之下,如今Temu下载量超过7000万次,访问量超越SHEIN、速卖通、Wish等平台,成为跨境电商App的新晋“顶流”。站长网2023-06-30 23:54:200001人化养宠、简法生活,2024年的消费者们有何变化?| 2024消费趋势报告
近年来,市场环境与消费不断发生变化。当今的消费者,不再满足于基本的产品使用需求,TA们期望在消费的过程中追求个体价值、独特体验与精神满足。站长网2024-04-28 21:00:280000谷歌生成式 AI 支持的 SGE 搜索生成体验引发出版商关切
站长之家(ChinaZ.com)10月20日消息:Google近日推出的生成式AI支持搜索工具引发出版商的关切,对于他们如何适应AI主导的信息获取和付费方式的世界产生了疑虑。这项名为「SearchGenerativeExperience(SGE)」的新产品在美国、印度和日本已经上线。站长网2023-10-20 08:55:050001