专业的食品图像分割技术FoodSAM开源
站长网2023-08-17 11:14:442阅
FoodSAM 是一种用于食物图像分割的创新框架,结合了 Segment Anything Model(SAM)、语义分割器和物体检测器。它能够生成类别无关的二进制掩码,通过与掩码 - 类别匹配获取食物类别标签,并为背景掩码提供非食物类别。通过合并策略增强语义掩码,实现实例和全景分割,并具备可提示的分割能力。
虽然段落任意模型(SAM)在各种数据集的分割任务中表现优异,但在面具的特定类别细节上存在疏漏。FoodSAM 成功克服了这一问题。它结合了 SAM 的优势和新的特性,有效地分割食品图像,甚至识别出场景中的单个食品和其他物体。FoodSAM 是首个在食物图像上实现实例、全景和可提示分割的工作。
核心功能:
语义分割:能够将食物图像进行语义分割,生成类别标签和语义掩码。
实例分割:通过合并策略,将语义掩码增强为实例分割结果,能够分割出不同的食物实例。
全景分割:结合物体检测器,将 FoodSAM 的零样本能力扩展到全景分割,有效捕捉非食物对象信息。
可提示分割:集成了无缝提示 - 优先选择机制,实现可提示的分割,提供更灵活的分割结果。
0002
评论列表
共(0)条相关推荐
汤姆猫:计划申请接入OpenAI的Sora模型
汤姆猫今日在互动平台上宣布,公司正在积极推进接入OpenAI的Sora模型的申请工作,并计划进行相关素材制作的测试。目前,汤姆猫尚未正式接入Sora模型。站长网2024-03-04 15:36:000001私域用户价值超2倍!小体量私域如何创造大增量?
时至今日,品牌对于用户的定位到底是什么?放在几年前,或许品牌与用户的关系是被追捧与追捧的关系。而在低价策略席卷了全平台、低价心智占据用户消费心理的时代,品牌与用户的地位则发生了翻天覆地的变化。现在的品牌需要更懂用户,要学会做用户的朋友、亲人甚至成为用户的“社交货币”。作为运营用户的同学,更要学会去换位思考,用户需要什么,品牌能给用户提供什么价值,如何成为品牌与用户之间友好的桥梁。0000什么值得买发布全面AI战略:值得买消费大模型参数规模达130亿
站长之家(ChinaZ.com)5月11日消息:在5月10日于北京举行的以“效率驱动未来”为主题的2024值得买科技集团战略发布会上,值得买科技创始人、董事长隋国栋分享了公司的创业理念、AIGC实践以及对未来技术发展趋势的深入洞察。站长网2024-05-11 16:07:530000三电机1548匹马力!小米V8S超级电机何时上车 小米回应
快科技7月20日消息,昨日晚间,小米汽车正式发布了小米SU7Ultra原型车,车辆采用全碳设计,车辆的超强性能引起关注。为解答网友疑问,小米汽车发布了小米SU7答网友问(第四十六集)。有网友提问,小米V8s什么时候会正式上车?对此,小米汽车介绍,小米第一次亮相小米SU7Ultra原型车,也是小米自研V8s超级电机的首次应用。站长网2024-07-20 23:34:320000苹果手机几乎没代言却”卖的“很好
一谈到明星代言手机的事情,大家肯定率先想到国产手机的oppo和vivo,明星代言是一个接一个!我都觉得自己也被代入了!苹果手机几乎没代言却卖的最好站长网2023-05-24 04:21:160000