蚂蚁集团研发多模态遥感基础模型SkySense,可用于地貌地物观测解译
近日,蚂蚁集团推出20亿参数多模态遥感基础模型SkySense,这是蚂蚁百灵大模型在多模态领域最新的研发成果,其论文已被世界计算机视觉顶会CVPR2024接收。数据显示,SkySense在17项测试场景中指标均超过国际同类产品,这也是迄今为止国际上参数规模最大、覆盖任务最全、识别精度最高的多模态遥感基础模型。SkySense可用于地貌、农作物观测和解译等,有效辅助农业生产和经营。
(图片说明:SkySense在17项评测中均超过国际上最新的遥感模型)
随着人工智能的发展,大模型技术与卫星遥感技术相结合产生了新突破。SkySense是蚂蚁集团基于蚂蚁百灵大模型平台能力开发的多模态遥感模型。
SkySense在总计17项国际权威公开数据集进行了测评,其测试任务类型包括了土地利用监测、高分辨率目标识别、地物变化检测等7种常见遥感感知任务,并与国际上已发布的包括IBM和NASA联合研发的Prithvi等共18个全球主流同类模型做了测试结果比较。数据显示,17项测评中SkySense均名列第一。譬如,在国际高清遥感地物检测榜单FAIR1M2.0中,SkySense平均精度(mAP)领先第二名超3%。
在刚刚公布的CVPR2024论文入选结果上,SkySense的研究成果亦被收录。CVPR是由IEEE举办的计算机视觉和模式识别领域的顶级会议,是国际计算机视觉三大顶会之一。
传统的遥感影像理解技术,往往侧重于针对单一模态单一任务建模,缺乏对多模态数据、时间序列、地理先验知识的综合建模和利用,限制了其在海量数据和多种任务中的泛化能力。SkySense突破以上技术瓶颈,实现了文本、红外光、可见光、SAR雷达多种模态、多分辨率的时序遥感影像建模,在多样化的任务中展现出优异性能。在蚂蚁百灵大模型多模态能力支持下,研发人员基于内部构建的19亿遥感影像数据集进行预训练,得到了20.6亿参数量的模型SkySense,这也是迄今为止国际上参数规模最大、覆盖任务最全、识别精度最高的多模态遥感大模型。SkySense可广泛应用于城市规划、森林保护、应急救灾、绿色金融、农业监测等重要领域,目前通过蚂蚁内部MEarth平台提供数据与识别服务。
据了解,蚂蚁集团正在计划开放Skysense模型参数,与行业共建,促进智能遥感技术与应用发展。
SkySense由蚂蚁AI创新研发部门NextEvo与武汉大学联合研发。NextEvo是蚂蚁AI核心技术研发团队,主导了蚂蚁百灵大模型的研发工作,其研发方向涉及CV、NLP、多模态、AIGC、数字人、AI工程化等核心技术。去年,该部门升级了多模态团队,由杨铭带队全面布局多模态技术。杨铭美国西北大学博士,FacebookAIResearch(FAIR)创始成员,去年加入蚂蚁集团,先后就职于NEC美国实验室、FAIR、地平线机器人公司,是世界知名计算机视觉研究专家。
目前,蚂蚁集团多模态研究成果已应用于支付宝五福节AI大规模互动、蚂蚁医疗数字人等场景。
禁止SEO优化竞价推广业务,百度推广开始打击黑帽SEO、SEO黑产了?
前段时间看到有朋友在讨论百度推广将SEO搜索引擎优化业务纳入禁止推政策,其原因则是由于百度总部发现在百度推广搜索引擎优化广告中,存在大量作弊手段改变搜索排名结果的灰色产业链,例如黑帽SEO、SEO黑产等等。搜索引擎的作弊手段其实有很多,借助百度的付费竞价推广也算是一种大手笔的操作。站长网2020-06-18 10:17:310009阿里巴巴智能信息事业群发布夸克大模型 夸克App将升级为AI助手
据证券时报消息,11月14日,阿里巴巴智能信息事业群发布了全栈自研、千亿级参数的夸克大模型。这个大模型将应用于通用搜索、医疗健康、教育学习、职场办公等场景。夸克App也将借助自研大模型全面升级,加速迈向年轻人工作、学习、生活的AI助手。阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的AIGC技术将会给搜索产品带来全新变化,加速迈向下一代搜索。站长网2023-11-14 15:02:300000研究: AI生成的白人面孔现在“比真人还真”
**划重点:**1.🌐人工智能生成的白人面孔如今在真实感上已经“比真人还真”,但却存在对其他族裔的呈现偏见。2.🧑🎓研究发现,由于算法训练数据的偏见,人工智能倾向于用白人特征来呈现其他族裔,可能加深在线上的种族偏见。3.🚨研究者呼吁对今天人工智能的“超真实主义”进行公众教育,以避免信息错误和在线诈骗。站长网2023-11-14 10:15:070000鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6
让机器狗学完真狗子的运动数据,真有二哈那感觉了!它轻松跨个栏,后面“主人”差点没跟上:钻个“狗洞”倒是轻车熟路:还能两只狗一起撒欢儿,它追、它逃……这就是鹅厂机器狗的最新进展。利用预训练模型喂给机器狗真狗子的运动数据、并通过强化学习,机器狗Max不仅在行为上更灵动,而且还能根据已经掌握的技能“举一反三”,去适应更加复杂的环境。总结来说,就是里里外外都“更狗”了一些。站长网2023-06-15 10:37:010000大模型理解复杂表格,字节&中科大出手了
只要一个大模型,就能解决打工人遇到的表格难题!字节联手中科大推出了一款统一表格理解大模型,可以以用户友好的方式解决多种表格理解任务。同时提出的还有一套开源测试基准,可以更好地评估模型在表格理解任务上的表现。该模型名为TabPedia,利用多模态大模型,将不同处理表格任务的专有模型进行了整合。在这之前,不同的任务都有独立的模型和解决方案,单是找到适合的模型就是已经很让人头疼。站长网2024-06-16 14:09:580001