替换万物3D!Meta 推ReplaceAnything3D可用文本引导3D场景编辑
**划重点:**
1. 一种名为ReplaceAnything3D(RAM3D)的新型文本引导的3D场景编辑方法,可以替换场景中的特定对象。
2. 提出了Erase-and-Replace方法,通过文本提示实现对场景中的对象进行替换,保持多个视点的3D一致性。
3. 展示了RAM3D在各种现实3D场景中的多样性,演示了修改的前景对象与场景的整体融合,不影响整体完整性。
站长之家(ChinaZ.com)2月1日 消息:Meta联合伦敦大学学院研究院在一项研究中提出了一种全新的文本引导的3D场景编辑方法,被称为ReplaceAnything3D(RAM3D)。这一方法通过引入Erase-and-Replace策略,能够有效地替换场景中的特定对象,实现了文本提示下的高质量3D场景编辑。
替换3D场景中的特定对象一直是一个具有挑战性的任务,而RAM3D通过引入多个视点图像、描述待替换对象的文本提示和描述新对象的文本提示,实现了一种高效的Eraser-and-Replace方法。这种方法首先使用LangSAM和文本提示检测和分割要擦除的对象,然后提出了一种基于文本引导的3D修复技术,填充被移除对象遮挡的背景区域。接着,使用相似的文本引导的3D修复技术生成与输入文本描述相匹配的新对象,并确保新对象的质量最小。最后,将新生成的对象与修复的背景在训练视图中无缝合成,得到一致的多视图图像,用于新视图合成。
相比于2D图像,替换3D场景中的对象更具挑战性,因为需要保持多视图的一致性。为了解决这一挑战,RAM3D结合了大规模图像扩散模型的先验知识和学习到的3D场景表示。具体来说,通过结合预训练的文本引导图像修复模型和复合场景结构,RAM3D能够生成与原始场景协调一致的编辑后的3D场景,新对象与原始场景融合无缝。
简单的说,ReplaceAnything3D 模型 (RAM3D)是一种新颖的文本引导3D 场景编辑方法,可以替换场景中的特定对象。给定场景的多视图图像、描述要替换的对象的文本提示以及描述新对象的文本提示,擦除和替换方法可以有效地将场景中的对象与新生成的内容交换,同时保持多个视点的3D 一致性。
总的来说,RAM3D的贡献有三点:
1. 引入一种Erase-and-Replace方法,实现高分辨率的3D场景编辑,可以替换场景中的特定对象。
2. 提出了一个多阶段的方法,不仅能够替换对象,还能够移除和添加多个对象。
3. 展示RAM3D在多种场景类型上能够生成具有3D一致性的结果,包括前向和360°场景。
随着社交媒体平台和显示设备的不断发展,对高质量3D内容的需求不断增加。RAM3D为这一需求提供了一种高效的工具,使用户能够通过自然语言提示实现对3D场景的灵活编辑。这项研究对于游戏、电影、虚拟现实和混合现实等领域的3D内容创作和编辑具有重要的推动作用。
论文网址:https://arxiv.org/pdf/2401.17895.pdf
Pika上线网页版本付费计划 分10美元和60美元两档
免费体验了一段时间,Pika开始收费了。现在,Pika上线了他们网页版本的付费计划。根据他们提供的信息,Pika的付费计划分为两个档次,分别是10美元和60美元,跨度相当大。官网地址:https://top.aibase.com/tool/pika当然,如果你有足够的积分还是可以继续免费体验的。在免费版本中,视频上会有Pika的水印,300积分可以生成60个视频,而且还可以使用视频放大功能。站长网2024-01-08 11:02:430000在游戏开发中,如何平衡 GPT-3.5 和 GPT-4 的成本与性能?
【CSDN编者按】在成本允许的条件下,从性能方面考虑自然优先选择GPT-4;但考虑到游戏成本,适当“降级”到GPT-3.5似乎也在情理之中。那么,作为一名游戏开发者而言,具体要如何抉择呢?站长网2023-11-20 17:05:330000亚马逊计划对Alexa语音助手重大升级,以保持竞争力
划重点:⭐️亚马逊计划推出重大升级的Alexa语音助手,引入生成式人工智能,以与OpenAI和谷歌等聊天机器人竞争。⭐️新版Alexa将增加月费,不再包含在Prime会员费中。⭐️亚马逊希望借助Alexa庞大的设备基数进行市场推广,但面临生成式人工智能成本和人才竞争等挑战。站长网2024-05-24 10:09:070000微软工程师向美国官员和公司董事会发警告:AI图像生成器存在潜在风险
**划重点:**1.🤖微软工程师发警报:公司的人工智能图像生成器工具可能轻易生成冒犯和有害图像。2.📄工程师致信美国监管机构和微软董事会,敦促采取行动,揭示产品安全隐患。3.🌐问题源于Designer工具,可能生成包含不当内容的图像,引发安全和道德争议。站长网2024-03-07 15:18:420000腾讯云:自研视频编解码芯片“沧海”已量产并投用数万片
今日,腾讯云公布了自研芯片“沧海”的进展。腾讯表示,自研视频编解码芯片“沧海”已经量产并投用数万片。在云游戏、直点播等场景中,沧海目前已面向腾讯自研业务和公有云客户提供服务。据介绍,沧海芯片着力于解决视频编解码中高画质、低延迟、低成本问题。站长网2023-04-17 14:35:280000