CommonCanvas:一种使用创意共享图片训练开放扩散模型的方法
核心要点:
研究团队提出了一种使用创意共享图片训练开放扩散模型的方法,以克服高质量数据和版权问题的挑战。
他们使用迁移学习技术创建了合成标题,与精选的创意共享图片匹配,用于训练生成模型,将文字转化为图像。
这一方法大大提高了生成模型的质量,创建了称为CommonCanvas的一组模型,可与SD2相媲美。
近年来,人工智能在文本到图像生成领域取得了显著进展。将书面描述转化为视觉表现具有广泛的应用,从创作内容到帮助盲人和讲故事。然而,研究人员面临着两个重大障碍,即缺乏高质量数据和从互联网抓取的数据集涉及的版权问题。
为了克服这些问题,一支研究团队提出了一个创新的方法,他们创建了一个创意共享许可(CC)的图像数据集,用于训练开放扩散模型,这些模型可以胜过Stable Diffusion2(SD2)。
论文地址:https://arxiv.org/pdf/2310.16825.pdf
这个方法有两个主要挑战:首先,高分辨率的CC照片虽然是开放许可的,但它们经常缺乏文本描述,这对于文本到图像生成模型的训练至关重要。
其次,与像LAION这样的大型专有数据集相比,CC照片数量较少,尽管它们是重要的资源。这引发了是否有足够的数据可以有效训练高质量模型的问题。
为了解决这些问题,研究团队采用了迁移学习技术,使用预训练模型创建了出色的合成标题,并将其与精心选择的CC照片相匹配。这种方法利用了模型从照片或其他输入生成文本的能力,通过创建一个照片和虚构标题的数据集,用于训练生成模型,将文字转化为视觉内容。
此外,他们还制定了一种既节约计算资源又高效利用数据的训练方法,以解决第二个挑战。这意味着有足够的CC照片可供训练高质量模型。最终,研究团队培训了多个文本到图像生成模型,这些模型被称为CommonCanvas系列,并在生成质量上媲美SD2。
通过该方法,他们克服了数据集大小的限制和使用人工标题的问题,实现了高质量的图像生成。总之,他们的研究为创意共享图像的利用提供了新方法,为生成模型的进一步发展提供了有力支持。同时,他们还将训练好的CommonCanvas模型、CC照片、人工标题和CommonCatalog数据集免费提供在GitHub上,以鼓励更多的合作和研究。
美团以20.65亿人民币收购光年之外
6月29日消息,美团于香港联交所发布公告,称已完成光年之外境内外主体100%股权的收购,收购价约为20.65亿人民币。此前,光年之外联合创始人王慧文因身体原因,离岗就医及休养。美团在公告中对于并购的解释是,通过收购事项获得领先的AGI技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。站长网2023-06-30 08:40:240000一文看懂:美团收购光年之外,还有哪些细节?
距离王慧文曝出生病住院没过一周,王慧文的前东家美团便宣布全资收购光年之外。美团发布公告,宣布6月29日订立交易协议以收购光年之外的全部权益。公告显示,为收购光年之外,美团付出的对价包括现金约2.33亿美元债务承担约3.67亿人民币(约合0.51亿美元)现金1元。本文为你拆解收购各项细节:一、美团的钱怎么付?需要注意的是,光年之外分境外和境内主体,所以收购也是包括两部分。站长网2023-06-30 19:25:040000iPad Pro全球首发!M4跑分公布:多核成绩突破1.4万
快科技5月9日消息,苹果最新推出的iPadPro全球首发M4芯片,这款设备已经现身Geekbench数据库。相关页面显示,iPadProM4单核成绩3767,多核成绩14677,作为对比,iPadProM2单核成绩在2500左右,多核成绩在1万左右。在跑分上,M4的单核、多核成绩都是M2的1.5倍左右,性能提升明显。站长网2024-05-09 15:34:320000小米14 Ultra即将发布 已开启线下盲订
小米14Ultra预计将在2024年龙年作为首款旗舰手机亮相,尽管小米方面尚未公布确切的发布日期,但根据多位博主和网友的反馈,部分小米门店已经开始接受这款手机的盲订。站长网2024-02-18 08:46:180000滴滴升级网约车司机保障 推出“橙意保障计划”
滴滴官方宣布,推出“橙意保障计划”,落实新业态劳动者权益保障。滴滴表示,2023年以来,每个月服务时长超过30小时的所有司机月均抽成为13%,其中,5成以上的司机月均抽成低于15%,9成以上低于20%。站长网2023-06-16 19:39:550000