微软推出大型语言模型分割推理助手LISA
站长网2023-08-10 10:54:311阅
想象一下你想喝咖啡,然后你命令机器人去泡咖啡。您的指令涉及“煮一杯咖啡”,但不包括“去厨房,找到咖啡机,然后打开它”等分步指令。目前的现有系统包含依赖人类指令来识别任何目标对象的模型。他们缺乏推理能力和主动理解用户意图的能力。
为了解决这个问题,微软研究院、香港大学和 SmartMore 的研究人员提出了大型语言模型驱动的分割推理助手——LISA(Large Language Instructed Segmentation Assistant)。

项目地址:https://github.com/dvlab-research/lisa
LISA是一种新颖的分割任务,旨在通过复杂而隐含的查询文本生成分割掩码。LISA 继承了多模态大型语言模型(LLM)的语言生成能力,同时具备生成分割掩码的能力。研究人员发现,LISA 在处理复杂推理、世界知识、解释性回答和多对话方面表现出色。
通过对模型进行微调,仅使用239个推理分割图像指令对,性能得到了提升。研究人员还发现,LISA 在复杂推理任务上的性能优于传统的推理分割方法。他们的未来工作将侧重于推理能力的重要性,以建立一个评估基准并促进社区开发新技术。
核心功能:
- 根据复杂查询文本生成分割掩码
- 进行复杂推理和世界知识的分割
- 提供解释性回答
- 支持多轮对话交互
0001
评论列表
共(0)条相关推荐
IBM宣布将46亿美元收购软件公司Apptio 提升AI能力
日前,IBM表示,将以46亿美元收购FinOps软件提供商Apptio,以进一步增强其混合云和人工智能能力。Apptio的SaaS产品使技术部门能够管理混合和多云环境、劳动力和相关领域的支出。与IBM的IT自动化软件和watsonxAI平台相结合,Apptio的功能将帮助客户优化企业IT支出并改善运营。站长网2023-06-28 09:26:510000报告称ChatGPT移动端营收增长开始放缓
据Appfigures公布数据显示,ChatGPT移动端营收增长已开始放缓。在过去的几个月里,ChatGPT的营收增长一直保持在30%以上,其中7月份为31%,8月份为39%。然而,到了9月份,这一数字下降到20%。这可能是ChatGPT的用户数量接近饱和的一个迹象,或者反映出有多少移动用户不愿意为升级后的ChatGPT订阅服务付费。据悉,ChatGPT并不是收入最高的人工智能应用。站长网2023-10-10 08:47:2200002023天猫双11定金预售活动今晚开启 每满300减50上不封顶
今晚8点,2023天猫双11预售活动将正式启动。今年天猫双11将为消费者带来双重惊喜:跨店满300减50的基础上,增加了官方立减直降商品,满足不同消费者的购物需求。首先,消费者可以享受到官方立减和跨店满减的双重优惠。官方立减商品低至8.5折起,跨店满减商品每满300减50,上不封顶。作为88VIP会员,消费者还可以领取总金额高达860元的大额消费券,专享双11第一波福利。站长网2023-10-25 00:27:340000浏览量猛增42倍,“MBTI”在小红书爆火
“你是i人还是e人?”最近,这句话成了很多年轻人在社交场合的开场白。与之类似的,还有“f人与t人”、“j人与p人”等略显特别的分类方式。实际上,这些“黑话”均来自火了好几轮的“MBTI人格测试”。MBTI全称“迈尔斯-布里格斯类型指标”,是时下最火的测试工具,一种通过自我问答来确定自身心理偏好的问卷调查。站长网2023-08-16 13:57:030006微信公众号终于能改标题了 官方回应:这些类型的内容都可修改
今日,“微信公众号终于能改标题了”登上热搜。据悉,微信公众号平台近期推出了一项新功能:文章发布后可以对标题进行修改。用户现在可以在文章标题中最多修改三个字,有效解决了以往标题中可能出现的错别字问题。这项更新意味着,一旦文章发布,如果发现标题有误,可以立即进行更正,而不必再为此感到困扰。修改后的标题会在文章页面、公众号首页以及分享时的卡片上实时更新,确保读者看到的是最新、最准确的标题。站长网2024-07-09 17:21:020000