首尔国立大学研究人员引入强化学习革新数字艺术拼贴
划重点:
🔍 研究人员利用强化学习训练 AI 代理人自主创建真正的拼贴艺术品
🔍 强化学习模型通过与画布互动来学习拼贴艺术品的创作过程
🔍 该方法通过用户研究和基于 CLIP 的评估证明了其在 AI 生成的艺术方面的出色性能
韩国首尔国立大学的研究人员致力于训练能够自主创作真正拼贴艺术品的 AI 代理人。目前市面上的 AI 工具(如 DALL-E 和 StableDiffusion)可以生成类似拼贴的图像,但缺乏真正的创作过程的真实性。
为了克服这一挑战,研究人员引入了一种开创性的方法,利用强化学习(RL)来训练 AI 代理人创作 “真正的拼贴艺术品”。与基于像素的方法不同,该方法涉及撕裂和粘贴材料,以复制著名艺术品和其他图像的步骤。研究人员摆脱了现有工具的限制,通过强化学习赋予 AI 代理人理解和执行创作拼贴艺术品的微妙步骤的能力。

研究人员的方法是通过训练 RL 模型与画布进行交互,在拼贴艺术品创作过程的每个步骤上做出决策。在训练过程中,AI 代理人被随机分配的图像所喂养,从而学会适应后续的任何目标或材料。通过多种剪切和粘贴选项,RL 代理人尝试使用不同的材料,以确定哪些材料能够产生与目标图像相似的拼贴艺术品。奖励系统随着时间的推移而发展,主要是增强代理人制作的拼贴艺术品与目标图像之间的相似性。
一个关键的方面是开发可微分的拼贴环境,以便应用基于模型的 RL。这个环境可以让代理人轻松跟踪拼贴艺术品创作过程的动态。该团队的模型在各种图像和场景中具有很好的泛化能力。该架构的突出特点在于其自主性,它不需要拼贴样本或演示数据,强调了 RL 提供的强大无数据学习领域的潜力。
评估包括用户研究和基于 CLIP 的评估。结果表明,与其他基于像素的生成模型相比,该方法的性能更优。该方法的应用标志着 AI 生成的拼贴艺术品在模仿人类艺术创作深度方面迈出了重要的一步。
首尔国立大学的研究团队成功地利用强化学习训练了能够真正创作拼贴艺术品的 AI 代理人。他们的创新模型超越了现有的基于像素的方法,展示了强化学习在使代理人能够自主学习和执行创作真正拼贴艺术品的复杂步骤方面的潜力。通过用户研究和客观评估的验证,这一突破为 AI 在艺术创作中开辟了新的道路,为机器在视觉艺术领域有意义地贡献创造了前景。
论文网址:https://arxiv.org/abs/2311.02202
大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4
人工智能的反馈(AIF)要代替RLHF了?大模型领域中,微调是改进模型性能的重要一步。随着开源大模型逐渐变多,人们总结出了很多种微调方式,其中一些取得了很好的效果。最近,来自Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,给人带来了一点新的震撼。站长网2024-01-21 11:06:230000Stability.ai宣布推出生成式 AI 产品Stable Chat
StableChat是由Stability.ai开发的类ChatGPT生成式AI产品,基于开源大语言模型StableBeluga1/2开发而成。该模型具备推理、数学解答、生成创意文本、文本翻译、提取摘要、知识问答等功能,并支持中文、多轮连续问答、不锁区(国内直接访问)、文本响应迅速等技术亮点。用户可通过免费账号或Gmail帐户直接登录使用。站长网2023-08-13 10:16:010000Stability AI发布SD3技术报告 披露SD3更多细节
StabilityAI最近发布了他们最强的图片生成模型StableDiffusion3(SD3)的技术报告,披露了SD3的更多细节。据StabilityAI所说,SD3在排版质量、美学质量和提示词理解上超过了目前所有的开源模型和商业模型,是目前最强的图片生成模型。技术报告要点如下:站长网2024-03-05 18:42:200001再融7800万美金,AI toC独角兽来了
最新消息,AI英语学习产品Speak宣布完成7800万美元C轮融资,总融资额达到1.62亿美元,估值来到10亿美元,如果没记错的话,这应该是第一个真正toC的AI独角兽。而就在不久前,今年6月,Speak才刚完成B-3轮2000万美元融资,估值5亿美元,也就是说,仅仅半年时间,Speak的估值就翻了一倍。Speak融资历史0000播放量破10亿,剧情号靠“玩尬”出圈
厚小花和肖霸的爱情剧大结局了。当两人虚幻的身影出现在天边,朝着上官文才缓缓挥手告别时,不少粉丝既震惊又无语,有人在评论区留言“我追这种剧也能be?”图源:@奥黛丽厚本抖音截图站长网2023-09-28 16:49:050000