数据集生成模型DatasetDM：可生成准确的感知注释

站长网2023-08-16 10:46:260阅

DatasetDM 是一个通用的数据集生成模型，能够产生多样化的合成图像以及相应的高质量感知注释，包括分割掩码、深度估计和人体姿态估计等。

项目地址:https://weijiawu.github.io/DatasetDM_page/?utm_source=talkingdev.uwl.me

该模型基于预训练的扩散模型，并将文本引导图像合成扩展到感知数据生成领域。通过解码扩散模型的丰富潜在编码，可以有效地生成准确的感知注释。训练该解码器只需要少于1%（大约100张图像）的手动标注图像，从而实现无限大的注释数据集生成。生成的合成数据可用于训练各种感知模型进行下游任务。

核心功能:

1. 生成多样化的合成图像:DatasetDM 利用 GPT-4等大型语言模型产生无限多样的引导语句，从而生成多样化的合成图像。

2. 高质量感知注释生成:利用训练好的解码器模块，DatasetDM 能够将扩散模型的潜在编码准确解码为感知注释，如分割掩码、深度估计等。

3. 多任务支持:DatasetDM 支持多个下游任务，包括语义分割、实例分割、人体姿态估计和深度估计等，为不同任务提供统一的数据生成和感知注释。

4. 高效的数据集生成:通过使用合成数据，DatasetDM 大大减少了数据采集和标注的时间成本，能够快速生成大规模的高质量感知数据集。

5. 强大的性能:DatasetDM 在语义分割和实例分割等任务上取得了最先进的结果，并且在领域泛化和零样本分割等方面表现出较强的鲁棒性和灵活性。

6. 可扩展的应用:DatasetDM 可以灵活应用于图像编辑等新领域和任务，为用户提供更多的创造力和应用场景。

数据集生成模型DatasetDM可生成准确的感知注释

0000

评论列表

共(0)条

相关推荐

站长资讯
清华团队AI创企“生数科技”完成数千万元天使+轮融资
近日，北京生数科技有限公司完成了数千万元天使轮融资，本轮融资由锦秋基金独家投资。此轮资金将主要用于算法研发、产品开发和团队扩充。值得一提的是，今年六月生数科技刚获得蚂蚁集团、BV百度风投、卓源资本的近亿元天使轮融资，不到两个月的时间内已经连续获得两轮投资。
站长网2023-08-10 10:12:38
0000
稚晖君开源百万机器人真机数据集
年末大礼包，稚晖君他又双叒来开源了!百万真机数据集开源项目AgiBotWorld，也是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。该项目由稚晖君具身智能创业项目智元机器人，携手上海AILab、国家地方共建人形机器人创新中心以及上海库帕思联合发布。GitHub和抱抱脸上已经可以自取了（本文文末附直通车）～
站长网站长资讯2024-12-30 18:25:16
0000
站长资讯
从抖音获赞Top5000账号，我们发现了头部达人突破创作瓶颈的秘密
“真的没有创作瓶颈吗?”一些头部达人爆款视频的评论区中，常有网友发出这样的感慨。在网友看来，有这样一批堪称“没有瓶颈”的创作者，比如“papi酱”“李蠕蠕”“智博”和“派小轩”等以内容见长的达人。虽然他们总是通过不断迭代的作品带给网友惊喜，但实际上，创作瓶颈是几乎每位创作者都要面对的难题。
站长网2024-06-07 08:42:34
0000
站长资讯
网友希望迪士尼暴雨天退票官方回应：售出不退可游玩室内项目
据报道，上海近日接连几天暴雨，迪士尼多项室外项目停运，影响游玩体验，多名网友发帖建议迪士尼如遇暴雨天能否考虑退还门票费用。对此，迪士尼客服回应称，门票售出后无法退票，如果室外项目没有开放，室内项目还有很多可以游玩。如果消费者购买的是常规预定门票，提前3天可以改期。年卡用户如因天气原因想要免责取消预约，可提供相应官方证明的天气预警的截图，联系微信尝试申请。
站长网2023-06-21 15:13:15
0000
站长资讯
荣耀 90GT 发布限时优惠价 2599 元起
荣耀正式发布了荣耀90GT手机，这款新品搭载了第二代骁龙8芯片，起售价为2699元，限时优惠价更可低至2599元。目前，荣耀90GT已开启预售，并将于12月26日10:08正式开售。售价方面，12256GB版本限时优惠价为2599元，16256GB版本售价为2899元，16512GB版本售价为3199元，而顶配的24GB1TB版本售价为3699元。
站长网2023-12-22 08:29:25
0000