又一个!北京智源推出通用视觉分割模型SegGPT
在2023中关村论坛平行论坛之一的人工智能大模型发展论坛上,北京智源人工智能研究院推出通用分割模型 SegGPT(Segment Everything In Contex),这是一个利用视觉提示(prompt)完成任意分割任务的通用视觉模型。
SegGPT 是智源通用视觉模型 Painter 的衍生模型,可针对分割一切物体的目标做出优化。
该模型具备上下文推理能力,训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等。
如下图所示,标注出一个画面中的彩虹,SegGPT可批量化分割其他画面中的彩虹。
它的灵活推理能力支持任意数量的视觉提示。自动视频分割和追踪能力以第一帧图像和对应的物体掩码作为上下文示例,SegGPT 能够自动对后续视频帧进行分割,并且可以用掩码的颜色作为物体的ID,实现自动追踪。
值得一提的是,此前Meta发布了其新的基于 AI 的 Segment Anything Model (SAM) ,该模型具有识别和分离图像和视频中的特定对象的功能。通过使用SAM,用户可以通过点击物体或输入文字提示选中编辑的物体。
威斯康辛麦迪逊、微软、港科大等机构的研究人员也提出SEEM模型,通过不同的视觉提示和语言提示,一键分割图像、视频。SEEM模型是一种新型的分割模型,这一模型可以在没有提示的开放集中执行任何分割任务,比如语义分割、实例分割和全景分割。
另外,南科大发布视频分割模型TAM,可轻松追踪视频中的任意物体并消除,操作简单友好。TAM的出现为解决传统视频分割模型需要人工标记培训数据和初始化参与数据的问题提供了之前提供,将改变CGI行业的游戏游戏规则。
SegGPT相关代码发布在 GitHub 上,论文发表在预印本平台 arXiv 上。论文地址:https://arxiv.org/abs/2304.03284
AI音乐创作助手Soundful 提供各种风格的音乐模板
Soundful是一个一站式音乐创作助手,让你只需轻点按钮就能创作出专业水准的原创音乐。Soundful提供各种风格的音乐模板,涵盖流行、电子、嘻哈等多种流派。你可以根据风格、心情或喜好的艺人,快速找到适合你创作风格的模板。随机预览模板,一目了然Soundful为你提供的无限可能。体验地址:https://my.soundful.com/站长网2023-09-18 09:55:330000支付宝小程序云上线 无需搭建服务器
日前,支付宝开放平台宣布,支付宝小程序云上线了,官方表示这款产品,主打的就是四个字「拎包入住」。平台配套齐全,无需搭建服务器,无须担心系统不兼容,支付宝小程序云全盘接收,支持智能推荐、搜索等能力无缝接入。另外,智能系统支持从代码开发到数据库全面托管,新手开发者也能轻快上手。站长网2023-06-16 16:32:270001Meta股价大涨近8% 预期人工智能带动广告收益增长
Meta(META.O)的股价周四飙升了近8%,因为其乐观的收入预测显示,人工智能帮助这家社交媒体巨头提高了用户参与度和广告销售,即使在不确定的经济环境下也是如此。在强劲的第二季度业绩鼓励了18位分析师提高了对这只今年已经翻倍的股票的目标价之后,Facebook的所有者将在市值上增加约600亿美元。站长网2023-07-28 11:06:030000最先进的开源预训练大语言模型Lemur 平衡文本和代码功能
文章要点:Lemur是首个在文本和代码任务上都表现卓越的开源预训练语言模型。Lemur通过在大规模代码集上预训练,在文本理解和知识任务上保持竞争力的同时,在编程基准测试上超过其他模型。Lemur填补了语言模型中文本和代码能力之间的空白,推动了开源LLM的发展。站长网2023-09-04 10:28:120001小红书电商能打破柜姐逻辑吗?
发力直播电商一年后,小红书有了新的感悟和解法。去年8月,小红书讲起K播(买手直播)的故事。董洁、章小蕙凭借娓娓道来的风格,精细化的讲解迅速出圈,给小红书直播打出一个很好的样板。小红书推开直播电商大门。10个月后,小红书发力店播。商家种草和买手渗透的人群,可通过店播进行承接,形成经营闭环,就像淘宝和抖音店播的逻辑一样。0000