字节推图像分割项目UniRef++ 提高图像分割效率和精确度
站长网2023-12-28 12:04:080阅
字节公司最新推出了一个名为UniRef 的图像分割项目,该项目将现有的即参考图像分割(RIS)、少镜头图像分割(FSS)、参考视频对象分割(RVOS)和视频对象分割(VOS)四种分割方式整合到一个架构下进行处理,从而能够自动判断应该使用哪种方式来分割内容。
论文地址:https://arxiv.org/pdf/2312.15715.pdf
这一项目中的UniFusion模块还可以与SAM模型结合使用,进一步提高图像分割的效率和精确度。这一项目的推出将为图像分割领域带来新的突破,为用户提供更加便捷和高效的图像处理解决方案。
功能:
UniRef 的核心部分是 UniFusion 模块,用于进行多路融合,处理与指定参考相关的不同任务。这使得语言和注释掩码能够无缝集成,适用于不同的分割任务。
采用统一的 Transformer 架构实现实例级分割。这种设计选择增强了模型在不同基于参考的对象分割任务中泛化的能力。
UniRef 允许在广泛的基准上进行联合训练,消除了任务特定模型的需要。这导致资源的更有效利用和整体性能的提高。
该模型在运行时表现出灵活性,能够通过指定相应的参考完成多个任务。这种适应性对于具有不同分割要求的实际应用至关重要。
实验结果表明,UniRef 在引用图像分割和引用视频对象分割方面取得了最先进的性能。此外,它在少样本图像分割和视频对象分割中与参数共享网络相比表现出竞争力。
0000
评论列表
共(0)条相关推荐
剪映推出AI音色克隆功能 录制5秒声音即可完成克隆
剪映推出了AI音色克隆功能,对于AI声音创业公司来说是一个巨大的挑战。这项功能通过录制5秒的声音来克隆用户的声音,效果非常接近原声。对于其他的AI声音公司来说,面对剪映这样的巨头产品,竞争压力非常大。用户只需在“文本朗读”功能中录制5到10秒的声音,就能实现音色克隆。目前,该功能还在小规模测试中,或许很快就会全量上线。站长网2024-01-25 09:21:390001人工智能版权诉讼热潮的背后:发明者正试图证明机器是有感知能力的
「ARECENTENTRANCEtoParadise」是一幅像素化的田园风光,火车轨道在一座长满苔藓的桥下穿过。它是由一种名为DABUS(统一感知自主引导设备)的人工智能在2012年绘制和命名的,据其创造者称。但本月初,美国一名联邦法官判定DABUS的发明者StephenThaler不能为这件作品主张版权。Thaler正在对此提出上诉。站长网2023-09-02 09:42:310000报告:OpenAI的ChatGPT下载量和应用收入持续增长
ChatGPT的下载量和收入持续增长,这款OpenAI的AI聊天机器人下载量达到2300万次(截至9月份)。据TechCrunch报道,Apptopia对人工智能应用市场的分析显示,5月份在苹果应用商店发布的第一个月,下载量就突破了390万次,到6月份达到了1510万次。站长网2023-10-31 15:29:020000“AI孙燕姿”创作者:视频播放千万,教程月销三单
刚刚过去的“五一”假期里,许久未露面的孙燕姿,现身长沙海潮宇宙音乐节。同时期,“AI孙燕姿”在各大短视频平台走红。真人与AI在不同次元遥相呼应,孙燕姿戏剧性地成为了本与她关系不大的AI领域的主角。《漠河舞厅》(原唱:柳爽)、《发如雪》(原唱:周杰伦)等歌曲经由“AI孙燕姿”演唱,网友的评价是“重新认识了这些歌曲”。“AI孙燕姿”版《发如雪》的弹幕站长网2023-05-16 18:20:570000AITO问界全系列2月交付21142辆新车 蝉联新势力榜首
根据鸿蒙智行的官方公告,AITO问界全系列在刚结束的2月份共交付了21142辆新车,稳固了新势力月度销量的首位。在这些销量中,新M7的贡献尤为突出,交付了18479辆,而余下的部分则由M9和M5填补。站长网2024-03-01 14:57:350000