文本直接在3D场景中生成对象,谷歌推出InseRF模型
随着大模型技术的飞速发展,基于语言和视觉的3D场景编辑方法取得了十足进步,如Instruct-NeRF2NeRF在修改和场景控制方面展示了强大功能。但在内容生成方面依然面临困难,例如,在3D场景中直接生成一只3D蝴蝶。
为了解决这一难题,谷歌瑞士公司和苏黎世联邦理工学院联合开发了InseRF模型。用户通过InseRF只需输入文本描述和选择特定区域,就能在3D场景中直接生成物品。
例如,在一个3D桌子场景中,在桌面框选一个区域,然后在文本框中输入“生成一个茶杯”,就能快速生成一个3D茶杯模型。
论文地址:https://arxiv.org/abs/2401.05335
InseRF执行流程
InseRF的核心技术创新在于,通过在单个参考视角进行基于遮挡和文本指导的2D对象插入,再将其映射到3D场景,这样可以保证多视角下的一致性并且无需提供具体坐标数据。具体执行流程如下。

1) 在选择的场景参考视角中,基于文本提示和2D边界框生成目标对象;
2) 从参考视角中的2D图像重建目标对象的3D表征;3) 利用单眼深度估计方法,估计对象在3D场景中的位置;
4) 将对象和场景的3D表征融合为包含对象的新场景;5) 对融合的场景进行优化以进一步改进效果。
2D参考视角编辑
首先选择场景的一个渲染视角作为参考,然后在参考视角中插入目标对象的2D视图。文本提示和2D边界框用于3D空间约束,从而确保插入保持在指定的区域内。
为实现局部化的2D插入,InseRF选择了Imagen作为文本到图像生成模型,并通过再次重建的方法使其适应遮挡区域条件。

再从参考视角中提取生成对象对应的图像区域,并使用单视图重建方法SyncDreamer将其映射到3D对象。该重建方法包含有效的3D物体几何和外观先验,有助于生成高质量的3D对象。
3D放置评估
研究人员通过单目深度估计方法,评估对象在参考视角中的深度,从而确定其在3D场景中对应的位置。
然后进行比例和距离优化,确保插入的3D对象视图与2D参考编辑匹配。最后计算出对象的旋转和平移,完成3D放置。

此外,在得到对象在场景中的位置后,将两者的NeRF表示进行融合,使其可以从不同视点渲染包含对象的新场景,以优化两个坐标系统位置不一致带来的影响。
最后,通过Instruct-NeRF2NeRF的迭代优化方法,来进一步改善3D物品插入的效果,可利用从插入对象中获得的多视角遮挡来限制优化区域。
为了测试InseRF的性能,研究人员与当前领先的三维场景编辑产品Instruct-NeRF2NeRF和Multi-View Inpainting进行了评估。InseRF可成功生成各种对象并插入到3D场景中的指定位置,并明显优于这两款产品。
值得一提的是,InseRF只需要一个粗略的视角框,就可实现精确的对象定位,这对于用户来说非常便捷。
爱奇艺推出AI搜索 将生成式AI技术应用于剧情搜索等场景
爱奇艺升级AI搜索,区别于传统搜索第一步只能搜到片名,升级后的爱奇艺AI搜索主打让观众在搜索环节便能一键直达心仪内容。站长网2023-10-24 21:25:090000在线AI音乐分析工具SONOTELLER:可一键分析YouTube链接中的音乐
SONOTELLER是一个在线AI音乐分析工具,专门用于分析YouTube上的音乐和歌词。该工具提供了丰富的音乐信息,包括歌曲摘要、语言识别、内容标记、主要音乐流派和子流派、主要演奏乐器以及情感分析等等。体验地址:https://sonoteller.ai/#carouselExampleCaptions站长网2023-10-12 16:45:590001微博AI评论机器人“评论罗伯特”宣布支持楼中楼回复
今日,微博AI机器人“评论罗伯特”在微博宣布,已支持楼中楼回复,不过该功能目前还在测试中。据悉,“评论罗伯特”原名“评论哇噻机器人”,是以微博用户身份活跃在网友评论区的智能机器人。目前,在微博发布原创内容或者艾特此号,将有可能收到它的回复。站长网2024-03-14 16:08:220000小米首款5G卫星移动终端入网 非小米14Ultra
站长之家(ChinaZ.com)1月18日消息:近日,知名博主数码闲聊站爆料称,小米旗下首款5G卫星移动终端已完成入网认证,并支持卫星通信功能。值得注意的是,这款新机并非市场期待的小米14Ultra。据认证信息显示,该终端设备型号为“2311BPN23C”。此前已有消息透露,这款新机将被命名为小米MIXFlip,是小米旗下首款竖向折叠屏手机。站长网2024-01-18 13:49:270000红米最强性能旗舰来了!Redmi K70至尊版现身:下月发布
快科技6月4日消息,海外博主在数据库发现了小米14T系列机型,设备型号为2406APNFAG。按照小米往年的策略,小米14T系列也就是国内的RedmiK70至尊版系列。RedmiK70至尊版上个月已经在国内入网,核心搭载联发科天玑9300芯片,是目前安卓阵营最强性能,也是Redmi历史最强性能。站长网2024-06-04 17:48:050000