智源研究院推出text-to-3D生成模型 GeoDream
站长网2024-01-16 10:08:170阅
近日,智源研究院联合清华和北邮团队推出text-to-3D生成模型 GeoDream,能够将输入的文字描述转化为高质量和多视角一致性的3D 资产。
与传统的方法不同,GeoDream 通过解耦的方式利用2D 和3D 先验,解决了3D 结构不一致性的问题,并支持导出高保真的 texture meshes 和高分辨率的渲染图片。
该模型还提供了 Uni3D metric,用于衡量3D 模型的语义一致性。GeoDream 的论文和代码已经开源,并已集成到 threestudio 等开源库中。
该模型的核心创新点在于使用 Multi-View Stereo 技术生成 Cost Volume 作为3D 先验,并通过 Variational Score Distillation 方法将2D 和3D 先验进行融合。
此外,GeoDream 还提供了新的量化指标和评价方法,以更好地度量和比较生成的3D 模型的质量。最后,GeoDream 展示了对复杂输入的生成结果,支持导出 meshes 和高分辨率 UV maps,方便后续的3D 创作和应用。
代码:https://github.com/baaivision/GeoDream
主页:https://mabaorui.github.io/GeoDream_page/
论文:https://arxiv.org/abs/2311.17971/
新鲜AI产品点击了解:https://top.aibase.com/
0000
评论列表
共(0)条相关推荐
两个月涨粉400万,竟是因为《红楼梦》?
160分钟的《霍乱时期的爱情》,343分钟的《盗墓笔记》,450分钟的《红楼梦》,甚至是1000分钟的《雍正王朝》。前段时间,抖音解说突然迎来长视频潮流,不同领域的解说博主纷纷放大招,用超长视频给抖音网友带来了一点小小的长内容震撼。站长网2024-08-05 09:19:390000650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目
650亿参数大模型的预训练方案,发布即开源。训练速度较传统方案提升38%。这就是由Colossal-AI最新发布的类LLaMA基础大模型预训练方案。要知道,在“百模大战”背景下,谁拥有自家大模型,往往被视为核心竞争力。在这个节点下,愿意开源大模型的公司少之又少。但自己从头训练一个大模型,对技术、资金都有很高要求。由此,Colossal-AI最新的开源动作,可以说是应时势所需了。站长网2023-07-18 19:02:080000罗永浩道歉并点名头部直播间:出来混迟早都要还的
近日,"罗永浩道歉并点名头部直播间"的话题登上了微博热搜榜。事件起因是交个朋友直播间发布了关于"芬迪卡萨月饼"的情况说明,并宣布了退一赔三的决定。站长网2024-09-13 17:31:260000高考生换机高峰来了!卢伟冰:Redmi K60、小米13真卖爆了
快科技6月11日消息,一年一度的全国高考已经结束,每年的这个时候都是学生换新手机的高峰。今日,小米集团合伙人、Redmi品牌总经理卢伟冰发文称,昨天是全国高考后的第一天,小米之家非常热闹,K60和小米13是最受欢迎的两款产品,真的是卖爆了。据了解,小米为今年的高考生推出了考生专属1970元券包,完成高考”认证即可领取。站长网2023-06-12 03:42:420001Meta推全新视频生成模型FlowVid 保持视频高度一致性
要点:Meta清华校友联手提出的视频生成模型FlowVid,通过V2V模型在1.5分钟内生成一段4秒的视频,标志着AI视频生成领域的新进展。FlowVid采用空间条件和源视频中的时间光流信息,实现了视频合成的高度一致性,通过对第一帧进行光流变换编码,使得视频帧之间保持时间连贯性。站长网2024-01-02 14:29:240001