华人团队颠覆CV!SEEM模型可一键分割图像和视频
站长网2023-04-23 18:08:290阅
继Meta的「分割一切」之后,又一个颠覆CV的模型来了!近日,威斯康辛麦迪逊、微软、港科大等机构的研究人员提出SEEM模型,通过不同的视觉提示和语言提示,一键分割图像、视频。

论文地址:https://arxiv.org/pdf/2304.06718.pdf
SEEM模型是一种新型的分割模型,这一模型可以在没有提示的开放集中执行任何分割任务,比如语义分割、实例分割和全景分割。
此外,它还支持任意组合的视觉,文本和引用区域提示,允许多功能和交互式的引用分割。

在模型架构上,SEEM采用了常见的编码器-解码器架构。其独特的地方在于具有查询和提示之间复杂的交互。
SEEM模型可以通过多模态提示实现一次性分割所有地方的一切,包括图像和视频。这个模型的出现将会对计算机视觉领域产生深远的影响,也将会对未来的技术发展方向产生指导作用。
0000
评论列表
共(0)条相关推荐
谷歌将推出识别AI生成内容工具 减少虚假信息传播
据彭博报道,谷歌正在为其图像搜索增加两个新功能,以减少虚假信息的传播。包括了图片搜索结果将包含附加信息,人工智能生成的内容将被平台标记。据悉,谷歌母公司Alphabet的第一个新功能称为“关于此图像”,提供额外的上下文,例如图像或类似图像何时首次被Google索引。目的是帮助用户查明原始来源。站长网2023-05-15 17:13:080000鸿海集团向专注于边缘 AI 的初创公司耐能投资约 1400 万美元
鸿海集团日前宣布,其子公司IcreateInvestments获得AI创业公司耐能智慧(Kneron)的股份,投资金额约为1400万美元。鸿海表示,此次现金增资为长期投资。图片来自kneron站长网2023-08-04 09:59:380000在线免费AI头像生成器“AI Portrait” 0元get妙鸭同款头像
AI头像生成器AIPortrait是一个免费的在线应用程序,利用MidjourneyV5提供的支持,可以将自拍照转化为引人注目的AI肖像。用户可以选择不同的风格模板,包括电影肖像、写实油画、卡通头像等,轻松制作独特的AI头像。该应用程序具有快速、简单且高质量的生成过程,可以帮助用户提升社交影响力并改变个人形象。站长网2023-08-24 11:44:090002苹果正在洽谈让谷歌的 Gemini 为 iPhone 生成人工智能功能提供支持
据彭博社消息,知情人士透露,苹果公司正在就将谷歌的新一代生成式人工智能系统Gemini植入iPhone软件进行内部谈判,这可能在AI领域引发重大变革。消息人士称,苹果和谷歌正积极协商授权Gemini为今年新iPhone提供部分人工智能驱动功能的细节。Gemini是谷歌近期推出的顶尖大型语言模型之一,擅长生成图像、文本等各类内容。站长网2024-03-18 16:44:500000IBM 与 NASA 合作开发多模态基础模型,用于天气预测
划重点:-IBM与NASA等机构合作,致力于开发地理空间AI以应对气候变化。-合作旨在开发一个多模态基础模型,用于天气预测、分析热岛效应、绘制造林地图和预测极端天气事件的影响。-IBM希望通过开源发布这个模型,促进全球范围内的研究和科学发现。站长网2023-11-30 15:35:430000