华人团队颠覆CV！SEEM模型可一键分割图像和视频

站长网2023-04-23 18:08:290阅

继Meta的「分割一切」之后，又一个颠覆CV的模型来了!近日，威斯康辛麦迪逊、微软、港科大等机构的研究人员提出SEEM模型，通过不同的视觉提示和语言提示，一键分割图像、视频。

论文地址:https://arxiv.org/pdf/2304.06718.pdf

SEEM模型是一种新型的分割模型，这一模型可以在没有提示的开放集中执行任何分割任务，比如语义分割、实例分割和全景分割。

此外，它还支持任意组合的视觉，文本和引用区域提示，允许多功能和交互式的引用分割。

在模型架构上，SEEM采用了常见的编码器-解码器架构。其独特的地方在于具有查询和提示之间复杂的交互。

SEEM模型可以通过多模态提示实现一次性分割所有地方的一切，包括图像和视频。这个模型的出现将会对计算机视觉领域产生深远的影响，也将会对未来的技术发展方向产生指导作用。

华人团队颠覆CVSEEM模型可一键分割图像和视频

0000

评论列表

共(0)条

相关推荐

站长资讯
谷歌将推出识别AI生成内容工具减少虚假信息传播
据彭博报道，谷歌正在为其图像搜索增加两个新功能，以减少虚假信息的传播。包括了图片搜索结果将包含附加信息，人工智能生成的内容将被平台标记。据悉，谷歌母公司Alphabet的第一个新功能称为“关于此图像”，提供额外的上下文，例如图像或类似图像何时首次被Google索引。目的是帮助用户查明原始来源。
站长网2023-05-15 17:13:08
0000
站长资讯
鸿海集团向专注于边缘 AI 的初创公司耐能投资约 1400 万美元
鸿海集团日前宣布，其子公司IcreateInvestments获得AI创业公司耐能智慧（Kneron）的股份，投资金额约为1400万美元。鸿海表示，此次现金增资为长期投资。图片来自kneron
站长网2023-08-04 09:59:38
0000
站长资讯
在线免费AI头像生成器“AI Portrait” 0元get妙鸭同款头像
AI头像生成器AIPortrait是一个免费的在线应用程序，利用MidjourneyV5提供的支持，可以将自拍照转化为引人注目的AI肖像。用户可以选择不同的风格模板，包括电影肖像、写实油画、卡通头像等，轻松制作独特的AI头像。该应用程序具有快速、简单且高质量的生成过程，可以帮助用户提升社交影响力并改变个人形象。
站长网2023-08-24 11:44:09
0002
站长资讯
苹果正在洽谈让谷歌的 Gemini 为 iPhone 生成人工智能功能提供支持
据彭博社消息，知情人士透露，苹果公司正在就将谷歌的新一代生成式人工智能系统Gemini植入iPhone软件进行内部谈判，这可能在AI领域引发重大变革。消息人士称，苹果和谷歌正积极协商授权Gemini为今年新iPhone提供部分人工智能驱动功能的细节。Gemini是谷歌近期推出的顶尖大型语言模型之一，擅长生成图像、文本等各类内容。
站长网2024-03-18 16:44:50
0000
站长资讯
IBM 与 NASA 合作开发多模态基础模型，用于天气预测
划重点:-IBM与NASA等机构合作，致力于开发地理空间AI以应对气候变化。-合作旨在开发一个多模态基础模型，用于天气预测、分析热岛效应、绘制造林地图和预测极端天气事件的影响。-IBM希望通过开源发布这个模型，促进全球范围内的研究和科学发现。
站长网2023-11-30 15:35:43
0000