给大模型补脑?腾讯发布ELLA,让SD模型提示词理解能力更强
站长网2024-03-14 10:48:202阅
腾讯昨天发布了一个名为ELLA的项目,这是一个高效的大语言模型适配器,能够无需训练就增强现有SD模型提示词理解的能力。ELLA将强大的大语言模型整合到文本到图像的扩散模型中,从而显著提升模型处理文本对齐的能力,而不需要额外对U-Net或大语言模型进行训练。
项目地址:https://top.aibase.com/tool/ella
为了顺畅地整合两种预训练模型,项目团队探索了多种语义对齐连接器的设计,并提出了一种创新模块——时间步感知语义连接器(TSC)。这个连接器能够根据时间步的变化,动态地从大语言模型中提取条件,帮助扩散模型在不同的去噪阶段更好地理解长而复杂的文本提示。
ELLA的设计使其可以轻松整合到社区模型和工具中,增强它们对复杂提示的遵循能力。为了评估文本到图像模型在处理密集提示方面的性能,团队还引入了一个名为密集提示图基准(DPG-Bench)的新挑战,该基准包括1000个密集的提示。
通过大量实验,研究人员发现,当处理包含多对象、不同属性和关系的复杂组合时,ELLA在密集提示遵循方面的表现优于目前最先进的方法。这个项目的发布为文本到图像模型的发展带来了新的可能性,也为未来的研究和应用提供了新的思路。
0002
评论列表
共(0)条相关推荐
蔡崇信:中国有80%科技企业和一半大模型公司都跑在阿里云上
2023云栖大会现场,阿里巴巴集团主席蔡崇信发言指出,智能化时代正在开启,AI将成为各行业新型生产力,目前中国80%的科技企业和一半的大模型公司都跑在阿里云上面。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-10-31 12:14:060000中国开源大模型们纷纷商用免费,这步走对了
在中国对生成式模型的监管落地后第二天,在目前最强开源模型LLaMA再传出即将允许商用,和GPT4的秘方进一步被“泄露”之际,全球开发社区里最受认可的国产开源大模型ChatGLM宣布了一个重要决定:其最新单卡可运行的模型ChatGLM2-6B,开放给企业用户免费商用了。这个消息淹没在Claude2的发布,马斯克xAI的成立等新闻中,缺少讨论。但它其实是中国基础模型开源进程的又一个重要时刻。站长网2023-07-18 19:42:380001英伟达发布Nemotron-4:150亿参数通用大模型,目标单张A100/H100可跑
**划重点:**1.🌐Nemotron-4是英伟达最新的通用大模型,拥有150亿参数,在各语言和编码任务中表现出色。2.💡该模型采用Chinchilla模型的「缩放定律」,通过优化计算预算、数据和模型大小实现性能提升。3.🔥在多领域下游评估中,Nemotron-415B超越同等参数规模的模型,甚至击败4倍大的模型,成为最强通用语言模型。站长网2024-02-29 15:00:520000东方甄选的付费会员“甄选”了谁?
做付费会员制,在中国已经不是新鲜事了。早在1996年,山姆会员店就在深圳开了中国第一家付费的会员制商超。经过这二十多年的发展,不仅山姆会员店迅速扩张,发展强势,像Costco、盒马鲜生、麦德龙等仓储会员店也纷纷冒头,整条赛道都变得火热起来。前段时间,付费会员制赛道里跑进来一位跨界选手,做直播带货的东方甄选高调推出App付费会员业务,价格为每年199元。站长网2023-10-26 11:11:040000梁建章喊话携程员工来领育儿补贴:每生一个孩子发5万元奖励
在2024年ESG全球领导者峰会上,携程集团董事局主席梁建章宣布了一项重大的员工福利政策:为每位员工生育的子女提供5万元人民币的奖励。为此,携程已经预备了高达10亿元人民币的资金。梁建章表示,他期望这一措施能够吸引政府的关注,并促进政府推出更多鼓励生育的政策。梁建章还提出了推广居家办公的建议,认为这样做可以实现社会、员工和公司三方的共赢局面。0000