专业的食品图像分割技术FoodSAM开源
站长网2023-08-17 11:14:442阅
FoodSAM 是一种用于食物图像分割的创新框架,结合了 Segment Anything Model(SAM)、语义分割器和物体检测器。它能够生成类别无关的二进制掩码,通过与掩码 - 类别匹配获取食物类别标签,并为背景掩码提供非食物类别。通过合并策略增强语义掩码,实现实例和全景分割,并具备可提示的分割能力。

虽然段落任意模型(SAM)在各种数据集的分割任务中表现优异,但在面具的特定类别细节上存在疏漏。FoodSAM 成功克服了这一问题。它结合了 SAM 的优势和新的特性,有效地分割食品图像,甚至识别出场景中的单个食品和其他物体。FoodSAM 是首个在食物图像上实现实例、全景和可提示分割的工作。

核心功能:
语义分割:能够将食物图像进行语义分割,生成类别标签和语义掩码。
实例分割:通过合并策略,将语义掩码增强为实例分割结果,能够分割出不同的食物实例。
全景分割:结合物体检测器,将 FoodSAM 的零样本能力扩展到全景分割,有效捕捉非食物对象信息。
可提示分割:集成了无缝提示 - 优先选择机制,实现可提示的分割,提供更灵活的分割结果。
0002
评论列表
共(0)条相关推荐
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快
【新智元导读】LLM训练速度还可以再飙升20倍!英伟达团队祭出全新架构归一化Transformer(nGPT),上下文越长,训练速度越快,还能维持原有精度。AI的未来,或许就此改写......最近,英伟达团队抛出的一枚重磅炸弹,提出了全新神经网络架构——归一化Transformer(nGPT),基于超球面(hypersphere)进行表示学习。0000理想汽车辟谣AI医疗领域合作:涉事方已删除不当言论并致歉
快科技7月12日消息,理想汽车法务部针对将与医施德(北京)医疗科技有限公司在AI医疗领域开展商务合作”进行了回应。理想法务部表示:医施德公司的上述宣传内容没有任何事实依据,属于造谣和欺骗消费者。经理想汽车法务部严正警告,医施德公司已删除所有侵权内容,向理想汽车出具书面致歉信。理想汽车特此公开澄清,以防广大消费者产生误解并造成损失。站长网2024-07-13 10:23:010000字节内部AI“赛马”结束,大模型全跟豆包姓,一出手就点名阿里百度
过去一年,围绕着字节AI的几个谜团,终于都在今天被揭开了。5月15日火山引擎Force原动力大会上,字节大模型进行了全系列更名,从云雀大模型升级为豆包大模型家族,一口气发布了9个豆包模型,其中包括通用模型pro版、通用模型lite版以及各个领域的垂类模型,并宣布正式对外服务。这是一次很有意思的更名,我们甚至可以把它理解为是一场“豆包的胜仗”。0000微软Edge将使用AI实时翻译你观看的YouTube视频内容
划重点:⭐微软Edge将推出实时翻译功能,可在观看YouTube等视频时进行实时翻译⭐该功能将支持多种语言和多个视频网站⭐翻译将在用户设备上完成,不会离开用户设备或在云端处理站长网2024-05-24 10:09:050000