最新“只用一张图转3D”方法火了!GitHub刚建空仓就有300+人标星
站长网2023-07-24 14:03:371阅
最新的一种只用一张图转3D 的方法名为 Magic123,在 GitHub 上刚建立空仓就有300多人标星。与之前的方法相比,Magic123能够生成高质量、高分辨率的3D 网格,并且还能细化几何结构和纹理。
该方法采用两阶段的方案,首先使用现有的模型进行分割和深度图提取,然后在粗阶段使用 Instant-NGP 进行快速推理和重建,最后在精细阶段使用 DMTet 方法细化和解耦3D 模型。团队还提出综合使用2D 和3D 先验信息的方法,在定量比较中取得了最好的效果。
然而,该方法有一些局限性,比如假设参考图像是正视图,对其他角度的图像效果较差。此外,使用了 SDS 损失的 Magic123倾向于生成过度饱和的纹理,尤其在高分辨率下会更加明显。
项目主页:https://guochengqian.github.io/project/magic123/
论文:https://arxiv.org/abs/2303.11328
GitHub:https://github.com/guochengqian/Magic123
0001
评论列表
共(0)条相关推荐
腾讯云联合信通院发布「金融行业大模型标准」
9月18日,腾讯云联合信通院正式发布国内首个金融行业大模型标准。该标准涵盖了金融大模型的关键能力要求,包括场景适配度、能力支持度和应用成熟度三大方面。此外,标准还从金融行业的特性出发,覆盖了投资研究、投资顾问、风险管理、市场营销、客户服务等多个金融应用场景,并详细规定了金融大模型在数据合规性、可追溯性、私有化部署、风险控制等方面的要求。站长网2023-09-19 08:40:010000谷歌Gemini1.5新功能揭秘:上下文挑战重现准确性
近日,GoogleGemini1.5推出了一项令人瞩目的技术突破,该版本引入了一个拥有高达一百万个令牌的上下文窗口功能。这项新功能旨在处理完整的书籍甚至电影,其准确性关注。尽管Gemini1.5的上下文窗口容量庞大,但可能仍存在不准确再现信息的可能性。在“海底捞针”测试中,该系统需要提取多达100条特定信息,但平均准确度仅在60%至70这项任务相对于复杂文档的摘要撰写而言仍然要简单一些。站长网2024-02-21 09:26:370000DeepMind视频生成模型Veo支持从单个参考图像生成视频片段
GoogleDeepMind的Veo模型是一个可以根据单个参考图像生成视频剪辑的创新模型。用户可以通过输入文本提示来调整视频的视觉风格,使其与原始风格保持一致。该模型的应用还包括了新的实验性工具VideoFX,用户可以加入等待名单,体验Veo模型的部分功能。站长网2024-06-03 15:34:550000疯狂小杨哥,最后一位超头主播
疯狂小杨哥,或许是最后一个超级头部主播。作为“抖音一哥”的疯狂小杨哥最近频上热搜:徒弟直播内容被指低俗、影射另一位超头主播垄断品牌定价、回应“电商挤压实体经济”、旧闻“每个月发工资超5000万”再被翻出、被“打假”事件……身处舆论漩涡风口,小杨哥的一切都被拿到放大镜下审视,真真假假,难以分辨。树大招风之下,没有人知道,此刻站在流量顶峰的小杨哥,究竟在想什么?站长网2023-10-31 10:58:150000微软 Azure OpenAI 国际版发布零售电商、制造业和数字原生三大行业场景
微软官方日前宣布,以AzureOpenAI国际版服务所提供的GPT-3.GPT-4.Codex、DALL-E和企业级ChatGPT服务为基础,针对零售电商、制造业、数字原生等行业领域的关键业务场景及全球各主要市场的实际情况,针对企业用户海外使用场景,量身定制了首批三套「Azure全球创新行业场景」。站长网2023-04-18 12:09:300001