文本直接在3D场景中生成对象,谷歌推出InseRF模型
随着大模型技术的飞速发展,基于语言和视觉的3D场景编辑方法取得了十足进步,如Instruct-NeRF2NeRF在修改和场景控制方面展示了强大功能。但在内容生成方面依然面临困难,例如,在3D场景中直接生成一只3D蝴蝶。
为了解决这一难题,谷歌瑞士公司和苏黎世联邦理工学院联合开发了InseRF模型。用户通过InseRF只需输入文本描述和选择特定区域,就能在3D场景中直接生成物品。
例如,在一个3D桌子场景中,在桌面框选一个区域,然后在文本框中输入“生成一个茶杯”,就能快速生成一个3D茶杯模型。
论文地址:https://arxiv.org/abs/2401.05335
InseRF执行流程
InseRF的核心技术创新在于,通过在单个参考视角进行基于遮挡和文本指导的2D对象插入,再将其映射到3D场景,这样可以保证多视角下的一致性并且无需提供具体坐标数据。具体执行流程如下。
1) 在选择的场景参考视角中,基于文本提示和2D边界框生成目标对象;
2) 从参考视角中的2D图像重建目标对象的3D表征;3) 利用单眼深度估计方法,估计对象在3D场景中的位置;
4) 将对象和场景的3D表征融合为包含对象的新场景;5) 对融合的场景进行优化以进一步改进效果。
2D参考视角编辑
首先选择场景的一个渲染视角作为参考,然后在参考视角中插入目标对象的2D视图。文本提示和2D边界框用于3D空间约束,从而确保插入保持在指定的区域内。
为实现局部化的2D插入,InseRF选择了Imagen作为文本到图像生成模型,并通过再次重建的方法使其适应遮挡区域条件。
再从参考视角中提取生成对象对应的图像区域,并使用单视图重建方法SyncDreamer将其映射到3D对象。该重建方法包含有效的3D物体几何和外观先验,有助于生成高质量的3D对象。
3D放置评估
研究人员通过单目深度估计方法,评估对象在参考视角中的深度,从而确定其在3D场景中对应的位置。
然后进行比例和距离优化,确保插入的3D对象视图与2D参考编辑匹配。最后计算出对象的旋转和平移,完成3D放置。
此外,在得到对象在场景中的位置后,将两者的NeRF表示进行融合,使其可以从不同视点渲染包含对象的新场景,以优化两个坐标系统位置不一致带来的影响。
最后,通过Instruct-NeRF2NeRF的迭代优化方法,来进一步改善3D物品插入的效果,可利用从插入对象中获得的多视角遮挡来限制优化区域。
为了测试InseRF的性能,研究人员与当前领先的三维场景编辑产品Instruct-NeRF2NeRF和Multi-View Inpainting进行了评估。InseRF可成功生成各种对象并插入到3D场景中的指定位置,并明显优于这两款产品。
值得一提的是,InseRF只需要一个粗略的视角框,就可实现精确的对象定位,这对于用户来说非常便捷。
NEC 探讨独自开发并提供支持图像和文字的生成式 AI 服务
日本NEC公司社长森田隆之日前表示,正在探讨独自开发能自动制作精巧文章及图像的生成式人工智能(AI),以新服务的形式提供给用户。目前计划用于回答用户的提问,并提供可靠的答案。森田在接受各媒体线上采访时做出了上述表示。森田表示:「我们会在适当的时候公布。希望大家期待。」他并没有明确公布新服务的推出时间。他指出,生成式AI「将对社会产生巨大的影响,相当于互联网问世时的情况。」站长网2023-06-08 06:55:090000B站上也能卖爆女装?这可能是新的蓝海市场
移动互联网时代,社交媒体的营销价值开始凸显,KOL在营销中逐渐掌握了更多的话语权。而在品牌投放预算缩减的背景下,追求更高的投入产出比成为了品牌共同的诉求。直播带货能为品牌带来曝光度、知名度之外最直接的效益,因此成为众多品牌青睐的营销方式。站长网2023-09-13 18:00:580000微软高管套现440万美元股票 加入微软已有30年
另一位微软公司高管在股价近期强劲上涨后出售了股票。该公司首席营销官克里斯·卡波塞拉本周截至周三出售了价值285万美元的股票,此前他上周已经出售了价值155万美元的股份。卡波塞拉周二以308.705美元的平均价格出售了5000股微软的股票,周三以312.905美元的平均价格出售了另外4177股,根据周三提交给证券交易委员会的文件显示。站长网2023-05-12 11:32:260000AI 虚拟代理将取代搜索引擎 专家:到2026年搜索量将下降25%
据权威机构Gartner公司预测,到2026年,传统搜索引擎的数量将会下降25%,而AI聊天机器人和其他虚拟代理将夺走搜索营销的市场份额。Gartner公司的副总裁分析师AlanAntin指出,自然搜索和付费搜索一直是技术营销人员重要的渠道,但随着生成式人工智能(GenAI)解决方案的崛起,这一局面即将发生改变。站长网2024-02-20 10:03:090000Facebook 联合创始人:英国脱欧意味着其在人工智能领域有望成为全球领导者
站长之家(ChinaZ.com)10月24日消息:Facebook的联合创始人、软件公司Asana的首席执行官DustinMoskovitz近日表示,英国脱欧使得其能够在人工智能(AI)领域独立发展,并有望成为全球领导者。他指出,布鲁塞尔对于监管的严格态度意味着「英国脱离欧盟是更好的选择」。站长网2023-10-24 23:01:510000