又一个!北京智源推出通用视觉分割模型SegGPT
在2023中关村论坛平行论坛之一的人工智能大模型发展论坛上,北京智源人工智能研究院推出通用分割模型 SegGPT(Segment Everything In Contex),这是一个利用视觉提示(prompt)完成任意分割任务的通用视觉模型。
SegGPT 是智源通用视觉模型 Painter 的衍生模型,可针对分割一切物体的目标做出优化。
该模型具备上下文推理能力,训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等。
如下图所示,标注出一个画面中的彩虹,SegGPT可批量化分割其他画面中的彩虹。
它的灵活推理能力支持任意数量的视觉提示。自动视频分割和追踪能力以第一帧图像和对应的物体掩码作为上下文示例,SegGPT 能够自动对后续视频帧进行分割,并且可以用掩码的颜色作为物体的ID,实现自动追踪。
值得一提的是,此前Meta发布了其新的基于 AI 的 Segment Anything Model (SAM) ,该模型具有识别和分离图像和视频中的特定对象的功能。通过使用SAM,用户可以通过点击物体或输入文字提示选中编辑的物体。
威斯康辛麦迪逊、微软、港科大等机构的研究人员也提出SEEM模型,通过不同的视觉提示和语言提示,一键分割图像、视频。SEEM模型是一种新型的分割模型,这一模型可以在没有提示的开放集中执行任何分割任务,比如语义分割、实例分割和全景分割。
另外,南科大发布视频分割模型TAM,可轻松追踪视频中的任意物体并消除,操作简单友好。TAM的出现为解决传统视频分割模型需要人工标记培训数据和初始化参与数据的问题提供了之前提供,将改变CGI行业的游戏游戏规则。
SegGPT相关代码发布在 GitHub 上,论文发表在预印本平台 arXiv 上。论文地址:https://arxiv.org/abs/2304.03284
主播“一条小团团”确认被捕上热搜 网友担心高德导航语音包被下架
斗鱼知名主播“一条小团团”近日被证实因涉嫌大额赌博被捕,此事与斗鱼公司CEO陈少杰案有关。在此之前,斗鱼公司在2023年11月21日的公告中披露,其董事会主席兼首席执行官陈少杰已于11月16日左右被成都警方逮捕。陈少杰被捕后,斗鱼平台上一批头部主播纷纷选择暂停直播,其中仅有几位主播在停播一段时间后恢复直播。站长网2024-04-23 14:20:500003大模型行业,根本没有什么“真”开源?
最近一段时间开源大模型市场非常热闹,先是苹果开源了70亿参数小模型DCLM,然后是重量级的Meta的Llama3.1和MistralLarge2相继开源,在多项基准测试中Llama3.1超过了闭源SOTA模型。不过开源派和闭源派之间的争论并没有停下来的迹象。站长网2024-08-01 14:19:360000OpenAI 测试基于GPT-4的内容审核功能
今日,OpenAI发文介绍了使用GPT-4进行内容审核的方法。OpenAI表示,传统的内容审核需要耗费大量的时间和人力,而使用GPT-4可以加快审核速度,降低人力成本,并提供更一致的审核结果。该方法通过给GPT-4提供审核准则和示例数据集,让其学习并判断内容的合规性。站长网2023-08-16 08:13:510000美国初创公司使用太阳能人工智能传感器提前检测野火
文章概要:1.DryadNetworks开发了太阳能传感器,可以检测空气中的气体变化,早期发现野火。2.传感器使用机器学习技术,可以减少误报率。3.传感器已在欧美部分地区部署,Dryad正在扩大业务规模。美国初创企业DryadNetworks开发了一种太阳能供电的人工智能气体传感器,可以提前检测到森林火灾。站长网2023-08-28 15:34:010000华为再面向全球招募天才少年 旨在发掘优秀的青少年人才
华为招聘微信公众号显示,华为再次面向全球招募天才少年。旨在发掘全球优秀的青少年人才,培养未来科技领域的精英人才,为人类社会的进步与发展做出贡献。华为公司曾表示,参赛的天才少年将有机会获得来自华为公司的专业培训和指导,接触到最前沿的科技技术和应用,参与到华为公司的全球研发和创新项目中,同时还有机会获得丰厚的奖金和荣誉。站长网2023-05-19 09:56:580000