微软推出大型语言模型分割推理助手LISA
站长网2023-08-10 10:54:311阅
想象一下你想喝咖啡,然后你命令机器人去泡咖啡。您的指令涉及“煮一杯咖啡”,但不包括“去厨房,找到咖啡机,然后打开它”等分步指令。目前的现有系统包含依赖人类指令来识别任何目标对象的模型。他们缺乏推理能力和主动理解用户意图的能力。
为了解决这个问题,微软研究院、香港大学和 SmartMore 的研究人员提出了大型语言模型驱动的分割推理助手——LISA(Large Language Instructed Segmentation Assistant)。

项目地址:https://github.com/dvlab-research/lisa
LISA是一种新颖的分割任务,旨在通过复杂而隐含的查询文本生成分割掩码。LISA 继承了多模态大型语言模型(LLM)的语言生成能力,同时具备生成分割掩码的能力。研究人员发现,LISA 在处理复杂推理、世界知识、解释性回答和多对话方面表现出色。
通过对模型进行微调,仅使用239个推理分割图像指令对,性能得到了提升。研究人员还发现,LISA 在复杂推理任务上的性能优于传统的推理分割方法。他们的未来工作将侧重于推理能力的重要性,以建立一个评估基准并促进社区开发新技术。
核心功能:
- 根据复杂查询文本生成分割掩码
- 进行复杂推理和世界知识的分割
- 提供解释性回答
- 支持多轮对话交互
0001
评论列表
共(0)条相关推荐
微软奔向20万亿帝国
ChatGPT的爆火,让背后的公司OpenAI走到台前,作为OpenAI的大股东,微软也再次回到舞台中央。7月25日,微软公布了2023财年第四季度财报。然而,这份号称微软“史上最重要的财报”,却表现平平,不仅AI对收入的贡献几乎没有体现,PC、云业务增长依然乏力,与全线飘红的“死对头”谷歌相比,逊色不少。站长网2023-07-27 10:35:290000年度最大黑马!问界全新M7爆火:上市不到两月大定超86000台
快科技11月9日消息,今日晚间,华为智选车首款轿车智界S7预售发布会召开。余承东在会上表示,问界新M7发布会爆火,截止到昨天,问界新M7大订数已达到8.6万台,已成为年度最大黑马。而10月份,AITO问界系列交付新车12700辆,其中问界新M7交付新车10547辆,单车型单月交付破万,创历史新高。随着问界新M7的交付,第一批车主口碑也随之打了出来,对产品销售起到助推作用。0000李开复估值10亿美元的LLM创业公司推出开源模型Yi-34B
要点:中国计算机科学家李开复创办了01.AI,旨在为中国市场开发本土大型语言模型,以满足中国对开放AI的需求。01.AI在成立七个月后发布了其首个开源语言模型Yi-34B,拥有340亿参数,表现卓越,引起了广泛关注。01.AI计划建立商业模型,同时继续开源部分模型,以满足其高昂的AI模型开发成本,以及通过应用开发生态系统为外部开发者提供易于使用的平台。站长网2023-11-06 11:59:180000单场直播卖不到10万,晚晚接不住“晚学”的泼天流量
在无人注意的互联网角落,“晚学”又双叒悄悄复兴了。晚学,互联网上一门研究豆瓣早期网红艺术家晚晚(原名:雷宛萤)及其跨越政、商、文三界的丈夫林瀚的“学科”。乍一看,晚晚和林瀚是对豪门夫妇,但晚学家们钻研发现,两人的豪门生活经不起考究,反而透露出一种“没钱硬装”的尴尬。站长网2024-08-21 18:05:410000华为Mate X6系列发布:售价12999元起 全球首发三网卫星通信
华为在今日下午的发布会上正式推出了MateX6系列,该系列手机以其全球首发的三网卫星通信技术成为焦点。MateX6系列包括标准版和典藏版,其中典藏版为全球首款支持三网卫星通信的大众智能手机,能够利用北斗卫星消息、天通卫星通信以及低轨卫星互联网,为用户带来前所未有的通信体验。0000