首尔国立大学研究人员引入强化学习革新数字艺术拼贴
划重点:
🔍 研究人员利用强化学习训练 AI 代理人自主创建真正的拼贴艺术品
🔍 强化学习模型通过与画布互动来学习拼贴艺术品的创作过程
🔍 该方法通过用户研究和基于 CLIP 的评估证明了其在 AI 生成的艺术方面的出色性能
韩国首尔国立大学的研究人员致力于训练能够自主创作真正拼贴艺术品的 AI 代理人。目前市面上的 AI 工具(如 DALL-E 和 StableDiffusion)可以生成类似拼贴的图像,但缺乏真正的创作过程的真实性。
为了克服这一挑战,研究人员引入了一种开创性的方法,利用强化学习(RL)来训练 AI 代理人创作 “真正的拼贴艺术品”。与基于像素的方法不同,该方法涉及撕裂和粘贴材料,以复制著名艺术品和其他图像的步骤。研究人员摆脱了现有工具的限制,通过强化学习赋予 AI 代理人理解和执行创作拼贴艺术品的微妙步骤的能力。
研究人员的方法是通过训练 RL 模型与画布进行交互,在拼贴艺术品创作过程的每个步骤上做出决策。在训练过程中,AI 代理人被随机分配的图像所喂养,从而学会适应后续的任何目标或材料。通过多种剪切和粘贴选项,RL 代理人尝试使用不同的材料,以确定哪些材料能够产生与目标图像相似的拼贴艺术品。奖励系统随着时间的推移而发展,主要是增强代理人制作的拼贴艺术品与目标图像之间的相似性。
一个关键的方面是开发可微分的拼贴环境,以便应用基于模型的 RL。这个环境可以让代理人轻松跟踪拼贴艺术品创作过程的动态。该团队的模型在各种图像和场景中具有很好的泛化能力。该架构的突出特点在于其自主性,它不需要拼贴样本或演示数据,强调了 RL 提供的强大无数据学习领域的潜力。
评估包括用户研究和基于 CLIP 的评估。结果表明,与其他基于像素的生成模型相比,该方法的性能更优。该方法的应用标志着 AI 生成的拼贴艺术品在模仿人类艺术创作深度方面迈出了重要的一步。
首尔国立大学的研究团队成功地利用强化学习训练了能够真正创作拼贴艺术品的 AI 代理人。他们的创新模型超越了现有的基于像素的方法,展示了强化学习在使代理人能够自主学习和执行创作真正拼贴艺术品的复杂步骤方面的潜力。通过用户研究和客观评估的验证,这一突破为 AI 在艺术创作中开辟了新的道路,为机器在视觉艺术领域有意义地贡献创造了前景。
论文网址:https://arxiv.org/abs/2311.02202
3D AIGC领域的Midjourney?Meshy可一句话生成3D游戏资产
要点:Meshy是一款由胡渊鸣创立的在线生成AI工具,能够通过简单的提示在一分钟内生成3D内容,包括模型和纹理。Meshy的创始人胡渊鸣是计算机图形学知名学者,团队成员来自MIT、哈佛大学、英伟达、谷歌等知名机构,旨在通过提供直观、轻松的内容创建方式改变3D内容制作生态系统。站长网2023-11-28 15:55:570000钉钉上线敲一敲木鱼功能 用户数达 7 亿人
1月9日,钉钉举办了盛大的7.5产品发布会。在此次发布会上,钉钉对外公布了最新的用户数字和商业化数字。据数据显示,截至2023年底,钉钉的用户数已经达到了惊人的7亿,各类组织数量也达到了2500万,包括企业和学校等。同时,付费DAU达到了2800万,软件付费企业数更是高达12万。除此之外,钉钉在发布会上还宣布了另一个重磅消息:截至目前,钉钉已有20条产品线、80多个场景全面接入大模型。站长网2024-01-09 11:35:160001谷歌Gemini Pro大模型向Vertex Al云计算客户以及Al Studio开发人员开放
谷歌宣布其最新AI模型GeminiPro,已对开发者和企业开放,用于构建AI应用程序。站长网2023-12-14 09:57:140000通过这些代码,PyTorch团队让Llama 7B提速10倍
要点:PyTorch团队通过优化技术,在不到1000行的纯原生PyTorch代码中将Llama7B的推理速度提升了10倍,达到了244.7tok/s。优化方法包括使用PyTorch2.0的torch.compile函数、GPU量化、SpeculativeDecoding(猜测解码)、张量并行等手段,以及使用不同精度的权重量化,如int8和int4。站长网2023-12-05 16:18:460000Redmi最强信号!K70至尊版搭载小米澎湃T1信号增强芯片
快科技7月12日消息,今天,Redmi宣布,K70至尊版搭载小米自研澎湃T1信号增强芯片,这是Redmi史上信号最好的旗舰机型。据悉,得益于小米自研澎湃T1信号增强芯片的加持,RedmiK70至尊版的WiFi性能提升12%,GPS导航性能提升20%,5GWi-Fi全向性能最高提升58%。站长网2024-07-12 14:26:150000