数据集生成模型DatasetDM:可生成准确的感知注释
站长网2023-08-16 10:46:260阅
DatasetDM 是一个通用的数据集生成模型,能够产生多样化的合成图像以及相应的高质量感知注释,包括分割掩码、深度估计和人体姿态估计等。
项目地址:https://weijiawu.github.io/DatasetDM_page/?utm_source=talkingdev.uwl.me
该模型基于预训练的扩散模型,并将文本引导图像合成扩展到感知数据生成领域。通过解码扩散模型的丰富潜在编码,可以有效地生成准确的感知注释。训练该解码器只需要少于1%(大约100张图像)的手动标注图像,从而实现无限大的注释数据集生成。生成的合成数据可用于训练各种感知模型进行下游任务。
核心功能:
1. 生成多样化的合成图像:DatasetDM 利用 GPT-4等大型语言模型产生无限多样的引导语句,从而生成多样化的合成图像。
2. 高质量感知注释生成:利用训练好的解码器模块,DatasetDM 能够将扩散模型的潜在编码准确解码为感知注释,如分割掩码、深度估计等。
3. 多任务支持:DatasetDM 支持多个下游任务,包括语义分割、实例分割、人体姿态估计和深度估计等,为不同任务提供统一的数据生成和感知注释。
4. 高效的数据集生成:通过使用合成数据,DatasetDM 大大减少了数据采集和标注的时间成本,能够快速生成大规模的高质量感知数据集。
5. 强大的性能:DatasetDM 在语义分割和实例分割等任务上取得了最先进的结果,并且在领域泛化和零样本分割等方面表现出较强的鲁棒性和灵活性。
6. 可扩展的应用:DatasetDM 可以灵活应用于图像编辑等新领域和任务,为用户提供更多的创造力和应用场景。
0000
评论列表
共(0)条相关推荐
华为最便宜折叠屏!曝华为nova系列小折叠8月发布
快科技6月24日消息,日前,有数码博主爆料,华为nova系列小折叠要来了,代号PSD。今日,据《科创板日报》报道,从华为内部人士及其他独立消息源处获悉,华为将在今年8月初发布nova系列小折叠屏手机。有消息人士表示,华为曾在去年年底考虑在今年5月发布其nova系列小折叠,但时间一再推迟,目前已基本确定产品的正式发布时间会是在今年8月的首周。站长网2024-06-25 05:03:540000高通展示在安卓设备上运行ControlNet 生成一张图仅需11.26秒
近日,高通在IEEE/CVF计算机视觉和模式识别年会上展示了在智能手机上运行生成式AI模型的进一步进展。站长网2023-06-26 23:41:290000谷歌25%新代码由AI生成,会Prompt工程的程序员更吃香了
好家伙!谷歌超25%新代码都由AI生成了。就在谷歌Q3财报电话会上,CEO劈柴哥(SundarPichai)透露了一则消息:谷歌超25%新代码由AI生成,然后由工程师审查通过。除此之外,财报数据显示,谷歌母公司Alphabet本季度收入为883亿美元,其中谷歌服务(包括搜索)收入为765亿美元,同比增长13%,谷歌云收入为114亿美元,同比增长35%。0000推特在苹果商店更名为X 或为首家单字符批准
根据报道,Twitter应用在苹果AppStore上已经更名为X,这可能是因为该公司获得了苹果的特批。产品设计师NickSheriff此前在Twitter上表示,在iOS上苹果不允许任何应用使用单个字符作为命名。获得苹果的特批也说明了Twitter在品牌知名度和用户影响力方面具有很强的优势。此外,改名也是为了更好地满足用户需求和提升品牌形象。站长网2023-07-31 14:28:520001文本直接生成3D游戏场景、功能,用ChatGPT方式开发游戏
3D游戏开发平台Hiber3D通过谷歌的PaLM大语言模型,结合自身500多个模板库,以及数百万个成品3D场景进行微调,推出了一个全新游戏开发平台。该平台在生成式AI加持下,用户可以像使用ChatGPT那样,通过文本问答方式快速创建3D游戏场景和功能,例如,生成一个被行星、恒星和宇宙飞船包围的空间站场景。如果对生成的游戏场景不满意,同样支持文本问答进行添加、修改、删除等操作。站长网2023-09-12 09:20:540000