智源研究院开源18种语言文图生成模型 利好中文用户
站长网2023-05-08 15:10:020阅
智源研究院发布了新款模型AltDiffusion-m18,该模型支持18种语言的文图生成,包括中文、英文、日语、泰语、韩语、印地语、乌克兰语、阿拉伯语、土耳其语、越南语、波兰语、荷兰语、葡萄牙语、意大利语、西班牙语、德语、法语、俄语。
这是非常好的消息,因为现有的非英文模型选择非常有限,用户需要将prompt翻译成英语再输入模型,这使得整个过程非常复杂,同时也会影响生成图片的准确性。
智源研究院FlagAI团队采用高效的训练方式,使用多语言预训练模型和Stable Diffusion结合,成功训练出了这一多语言文图生成模型。
在客观评测中,AltDiffusion-m18模型在英语FID、IS、CLIP score方面达到了Stable Diffusion95~99% 效果,在中文、日文等方面也取得了最优水平,填补了其他15种语言的文图生成模型的空白,极大地满足了产业界对于多语言文图生成的强烈需求。
此外,相关的技术报告《AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities》已被Findings of ACL2023接收。
0000
评论列表
共(0)条相关推荐
3个月涨粉25万,AI课代表席卷B站评论区!
最近B站评论区出现了一种“赛博召唤术”——前面这些被召唤的账号接入了生成式AI功能,会总结视频内容,并在评论区或私信回复。影视UP主“木鱼水心”对电影《奥本海默》的前瞻科普视频长达16分钟,发布3分钟后就有了AI总结,按时间线精准列出了要点,评论获赞超3000。美食作家王刚分享了“一鸡两吃”的教学视频,评论区除了粉丝晒出的作业,还有好几位AI课代表留下了总结,王刚点了赞并表示感谢。站长网2023-09-11 14:11:120000OpenAI回应马斯克诉讼:此举源于个人恩怨
站长之家(ChinaZ.com)3月4日消息:埃隆・马斯克(ElonMusk)周四晚间对十年前参与创立的生成式人工智能公司OpenAI提起诉讼。据最新报道,周五晚间,OpenAI迅速作出回应,向员工发送了一份备忘录,详细驳斥了马斯克的指控,并揭示了其提起诉讼背后的真正动机。站长网2024-03-04 15:46:300000如何使用Chat GPT自动批量生成视频,获取大量精准流量?
01内容介绍如何使用Chatgpt自动批量生成视频内容,从而获取大量的精准流量?简单来讲,总共分为三个步骤,而且整个流程从文案生成,到视频合成再到一键发布,大概只需花费十多分钟,不仅可以保证视频质量,同时还非常的高效。站长网2023-04-15 14:46:560003Reddit押注人工智能数据许可协议 或 OpenAI等公司带来巨大收益
据外媒报道,Reddit在今天向美国证券交易委员会提交的IPO招股说明书中披露,该公司预计将从与人工智能供应商签订的数据许可协议中获得巨额收益。招股说明书显示,Reddit已于2024年1月签订了总价值2.03亿美元的数据许可协议,期限为两到三年。该公司预计将在截至2024年12月31日的年度及此后的剩余收入中确认至少6640万美元的收入。站长网2024-02-23 09:38:080000三年“掘金”路,微短剧的风吹向哪了?
2020年底至今,微短剧日益受到观众青睐,逐渐成为了各大内容平台的风口。从2018年的初露锋芒到2021年的快速增长,短剧的内容形式百花齐放,创作者与机构不断挖掘热门题材,为用户带来了优秀的内容体验。随着市场发展和用户圈层的细分,短剧领域逐渐走上了精品化道路。画面质量不断提高,内容创作者不断创新设计反转,通过优质内容让短剧行业蓬勃发展,满足了用户及内容市场的需求。站长网2023-08-02 10:35:320000