这个新方法有点牛,无需数据训练就能改善Stable Diffusion
站长网2023-07-18 00:04:361阅
受到大型语言模型的微调的启发,研究人员现在正试图使用强化学习来微调生成AI模型以实现特定目标,例如提高图像的美学质量,从而干预这一过程。
最近,伯克利人工智能研究中心(BAIR)的研究人员使用强化学习来进一步优化生成式人工智能模型用于改善图像生成的效果。

通过测试,他们发现去噪扩散策略优化(DDPO)在优化图像的压缩性、不可压缩性、美学质量和提示图像对齐方面表现出了有效性。
在他们的测试中,该团队表明DDPO可以有效地用于优化四个任务。此外,它们还显示出一定的可推广性:例如,对45种常见动物物种进行了美学质量或提示图像对齐的优化,但也可以转移到其他动物物种或无生命物体的表示上。

这种方法不需要训练数据,为基于人工智能的图像合成开辟了新的可能性,但仍需要进一步探索。
与强化学习中常见的一样,DDPO也表现出奖励过度优化的现象:该模型在某个节点之后破坏所有任务中所有有意义的图像内容,这个问题需要在进一步的工作中进行调查。
0001
评论列表
共(0)条相关推荐
苹果发布Vision Pro耳机首个安全补丁 修复潜在黑客利用漏洞
苹果在科技巨头首次实际评测VisionPro耳机后的第二天发布了混合现实耳机的首个安全补丁。公司推出了visionOS1.0.2软件,该软件修复了VisionPro上运行的WebKit中的漏洞,该漏洞可能被黑客利用。漏洞修复后,苹果表示,如果受到利用,恶意代码将无法在受影响的设备上运行。站长网2024-02-01 11:06:220000BGM 猫:用AI一键生成和视频匹配的音乐
BGM猫是一款在线服务工具,专注于提供背景音乐制作。它通过AI音乐生成技术,让用户可以完全控制音乐的风格、情绪、时长、段落和能量等参数。该工具操作简单便捷,只需输入音乐时长和描述或标签,即可生成与之匹配的背景音乐。BGM猫支持拖拽高能点位置、重新生成配乐,并可下载生成的音乐。体验地址:https://bgmcat.com/home核心功能:站长网2023-08-02 17:26:130000软银与 Symbotic 成立合资公司 建设人工智能仓库并增持股份
站长之家(ChinaZ.com)7月25日消息:软银集团周一宣布,正在与仓储自动化公司Symbotic组建一家合资企业,共同建设由日本科技投资者控股的人工智能驱动的仓库。两家公司在这家名为GreenBoxSystems的合资企业中总共投资1亿美元。该部门还签署了一份合同,将在未来六年内从Symbotic购买价值75亿美元的人工智能驱动的系统。站长网2023-07-25 15:51:450000CustomNet:图片合成界的颠覆者,SD商品图融合有救了!
近日,清华大学和东京大学共同发布了一项名为CustomNet的技术,该技术旨在更好地将指定物品的图片融合到新生成的图片中,并确保原物品的样式和纹理细节得以还原。这项技术给SD商品图融合带来了一线生机。从发布的测试案例来看,还原度也相当不错。项目地址:https://jiangyzy.github.io/CustomNet/站长网2023-11-01 11:08:160000偏见问题!WhatsApp AI 贴纸生成器生成巴勒斯坦儿童持枪图
划重点:-Meta的WhatsApp使用AI提示生成贴纸,但AI模型有问题,当输入“巴勒斯坦”等词语时会生成持枪的儿童图像。-据报道,当输入“以色列”等词语时,并没有出现这样的图像。-Meta之前也在其AI模型中遇到了偏见问题,如Instagram的自动翻译功能将“恐怖分子”一词插入阿拉伯文用户简介中。站长网2023-11-06 14:43:230002