最强“全开源”多模态分割一切大模型APE
要点:
1、APE 是一种全开源的多模态分割模型,通过独立建模每个类别名实例、压缩 Word-Level Embeddings 为 Sentence-Level Embeddings、采用不同的特征融合方式以及统一前景和背景粒度来提高分割效果。
2、APE 的方法主要包括独立建模每个类别名实例、压缩 Word-Level Embeddings 为 Sentence-Level Embeddings、采用不同的特征融合方式、通过矩阵乘法进行 Object Embeddings 和 Prompt Embeddings 之间的相似度计算以及统一前景和背景粒度。在多个常见数据集上进行实验,APE 方法取得了强力的分割效果。
3、APE 方法在各个检测、分割和指向性检测数据集上都比之前的方法表现好,在 D3数据集上取得了显著的提升。在开集检测、开集分割和视觉定位等任务上,APE 方法也展现出竞争力,取得了新的 SOTA 结果。
APE 是一种全开源的多模态分割模型,其独特之处在于采用了独立建模每个类别名实例的方法。以往的方法通常将多个类别名联结成一个单独的 Prompt,但 APE 通过对每个类别名或描述短语进行独立建模,可以学习到不同实例之间的差异。此外,APE 还通过压缩 Word-Level Embeddings 为 Sentence-Level Embeddings 来减少计算复杂度和内存消耗,从而有效地表达语义信息。
论文地址:https://arxiv.org/pdf/2312.02153.pdf
开源链接:https://github.com/shenyunhang/APE
Demo链接:https://huggingface.co/spaces/shenyunhang/APE_demo
APE 采用了不同的特征融合方式来处理不同类型的 Prompt。对于纯类别名的文本特征,采用一种 “zero” 文本 token 作为替代,以避免过拟合问题。而对于语言描述的文本特征,采用特定的融合方式将其与视觉特征进行语义级的理解。此外,APE 还通过矩阵乘法计算 Object Embeddings 和 Prompt Embeddings 之间的相似度,从而实现一次性检测和分割。
APE 还通过统一前景和背景粒度来提高分割效果。在分割任务中,前景和背景的粒度是不同的,但传统方法往往面临前背景冲突的问题。为此,APE 提出统一前景和背景的粒度,将背景的不同块视为独立的标签,从而使模型可以采用统一的架构训练前景和背景数据,并方便地融入大规模的 Class-Agnostic 数据。
APE 在各个检测、分割和指向性检测数据集上都取得了强力结果。特别是在 D3数据集上,APE 的表现显著优于其他方法。在开集检测任务中,APE 在常见数据集上的效果也明显优于其他方法。此外,APE 还在开集分割任务和视觉定位任务上取得了竞争性的结果,在 RoboFlow100和 ODinW 评测基准上取得了新的 SOTA。
APE 是一种非常有潜力的多模态分割模型,具有广泛的应用前景。通过独立建模每个类别名实例、压缩 Word-Level Embeddings 为 Sentence-Level Embeddings、采用不同的特征融合方式、通过矩阵乘法进行 Object Embeddings 和 Prompt Embeddings 之间的相似度计算以及统一前景和背景粒度,APE 在多个常见数据集上取得了强力的分割效果,并展现出竞争力的结果。未来的研究可以进一步探索 APE 在其他视觉任务中的应用,以及对其方法进行优化和改进。
阿里妈妈成立万相创意科技公司 含AI软件开发业务
企查查APP显示,近日,杭州万相创意科技有限公司成立,法定代表人为李穆,注册资本10万元人民币,经营范围包含:数字文化创意软件开发、人工智能应用软件开发、智能车载设备销售等。企查查股权穿透显示,该公司由杭州阿里妈妈网络技术有限公司全资持股。今年7月,阿里妈妈宣布面向商家专注电商领域的AI创意生产工具“万相实验室”全面开放内测。站长网2023-08-24 11:44:070000研究发现:谷歌生成式AI搜索引擎占据84%的搜索查询
**划重点:**1.🚀**Gen-AI(生成式AI)搜索引擎统治搜索市场:**最新研究显示,谷歌的人工智能搜索引擎Gen-AI占据了84%的搜索查询,对品牌和发布者的搜索流量造成巨大冲击。2.💡**搜索引擎优化格局改变:**Gen-AI搜索引擎通过分析搜索的上下文、情感、意图和细微差别,提供基于事实的意见。站长网2024-01-19 11:46:400000OpenAI 竞争对手 Cohere 正在洽谈融资 10 亿美元
据英国《金融时报》报道,OpenAI的竞争对手Cohere正在洽谈筹集最多10亿美元的资金。站长网2024-01-23 09:54:590000FF 91又鸽了!法拉第未来宣布首款车型第二阶段交付推迟
快科技6月17日消息,法拉第未来今日宣布,由于一家供应商的时间限制,以及与公司对FF912.0FuturistAlliance的单一独特产品功能的强化安全测试有关的额外系统测试的完成时间。因此,FF912.0FuturistAlliance第二阶段交付时间从2023年第二季度末更新为2023年8月。站长网2023-06-17 23:47:290001Discord 宣布将于 12 月 1 日起关闭其人工智能聊天机器人 Clyde
Discord正在关闭其实验性人工智能聊天机器人Clyde。根据公司的支持说明,Clyde将于本月底被「停用」,并且从12月1日起,「用户将无法在私聊、群聊或服务器聊天中调用Clyde」。站长网2023-11-21 11:24:180000