秒杀Instant3D!上交大推新框架Bootstrap3D 显著提升3D生成能力
站长网2024-06-11 18:06:510阅
上海交大和香港中文大学的研究团队推出了一个名为Bootstrap3D的新框架,它通过结合微调的3D感知多模态大模型,能够自动生成任意数量的高质量多视角图片数据,显著提升3D生成模型的能力。这个框架的合成数据集已经全面开源,供研究人员和开发者免费使用。

关键特点:
数据构建Pipeline:自动生成多视角图像数据和详细描述文本,是框架的核心创新之一。
文本提示生成:使用大语言模型生成创意和多样化的文本提示,为图像生成提供素材。
图像生成:结合2D扩散模型和视频扩散模型,根据文本提示创建单视图图像。
多视图合成:将单视图图像扩展为多视角图像,确保不同视角下的一致性。
质量筛选和描述重写:通过3D感知模型MV-LLaVA对图像进行质量筛选和描述文本的重写。
此外,研究团队还提出了**训练timestep重安排(TTR)**策略,优化去噪过程的不同阶段,解决多视图扩散模型训练中的图像质量和视图一致性问题。TTR策略限制合成数据的训练时间步,主要参与早期去噪阶段,而真实数据参与所有时间步的训练,提供高频细节和真实感。
实验结果证明,使用TTR策略的多视图扩散模型在图像-文本对齐、图像质量和视图一致性方面表现优异,有效提升了多视图生成的效果。
项目地址:https://top.aibase.com/tool/bootstrap3d
0000
评论列表
共(0)条相关推荐
360新品发布会“被盗图人”喊话周鸿祎:要求公开道歉 赔偿1元RMB
快科技6月13日消息,360AI新品发布会被盗图人”DynamicWangs发微博喊话周鸿祎,要求公开道歉,赔偿1元RMB。DynamicWangs发微博称:周鸿祎先生,贵司在6月6日的AI发布会上,未经授权使用我的模型生成的图片进行重绘、二度创作,并在公开场合发表使用,严重影响和侵犯了我的权益。我在这里郑重的要求您对于上述侵权行为进行公开道歉,并进行赔偿,赔偿金额1元RMB。”站长网2024-06-14 00:28:450001市监总局将加强互联网广告监管 加大互联网广告乱象清理整治力度
日前,市场监管总局办公厅印发《市场监管总局办公厅关于扎实做好广告监管领域行风突出问题排查治理工作的通知》(以下简称《通知》),进一步加强对广告监管领域行风建设工作的指导。《通知》提出10个方面具体要求和举措:一是推进“三品一械”广告审查服务规范化。全面贯彻“四个最严”要求,严格广告审查标准,及时发现和纠正行政许可实施中的违法或者不当行为,保障广告审查质量。站长网2023-06-20 17:10:360000微信朋友圈11岁了 小程序、视频号使用时长已超过朋友圈
今日是微信朋友圈的11岁生日。据了解,在2012年4月19日的微信4.0版本中,朋友圈正式上线。用户可以通过朋友圈发表文字和图片,同时可通过其他软件将文章或者音乐分享到朋友圈。用户可以对好友新发的照片进行“评论”或“赞”,其他用户只能看相同好友的评论或赞。站长网2023-04-19 14:09:350002IBM和NASA宣布在Hugging Face上线watsonx.ai地理空间基础模型
文章概要:1.IBM和NASA联合宣布将watsonx.ai地理空间基础模型添加到HuggingFace平台上,该模型旨在利用卫星图像数据来推进气候科学和改善地球生活。2.该基础模型在NASA的HarmonizedLandsatSentinel-2卫星数据的基础上进行了训练,并使用了标记数据对多个特定用例进行了微调。站长网2023-08-03 16:44:480000抖音电商:去年清退虚假营销账号超1200个
抖音电商宣布,去年治理了超过8000个虚假营销账号,清退了超过1200个账号。随着大模型风潮的兴起,生成式人工智能的快速发展也带来了AI造假等新型风险。为了应对这些挑战,抖音电商发布了《抖音电商人工智能生成内容管理规则》,要求创作者在使用人工智能发布直播、视频或生成虚拟主播时,必须在相关页面进行显著标识,并确保内容真实、准确,不得进行虚假宣传或误导性描述。站长网2024-05-14 15:03:270000