微软推出用于生物医学的多模态 AI 助手
站长网2023-06-15 09:55:321阅
微软的研究人员展示了 LLaVA-Med,这是一种用于生物医学的多模式 AI 助手,可以处理图像和文本。
使用生物医学图像文本对应大型数据集来训练多模态 AI 模型。该数据集包括胸部 X 光、MRI、组织学、病理学和 CT 图像等。首先,该模型学习描述此类图像的内容以及重要的生物医学概念。然后,使用GPT-4生成的指令数据集对 LLaVA-Med(生物医学的大型语言和视觉助手)进行训练。
该数据集由 GPT-4基于生物医学文本创建,其中包含有关每个图像的所有信息,可用于生成有关图像的问答。微调,然后在图像和相应的 GPT-4示例上训练 LLaVA-Med。结果是一个可以用自然语言回答有关生物医学图像的问题的助手。
使用的训练方法允许 LLaVA-Med 在不到15小时的时间内在八个 Nvidia A100GPU 上进行训练。它基于Vision Transformer和Vicuna语言模型,后者又基于 Meta 的LLaMA。据该团队称,该模型具有“出色的多模式对话能力”。在用于回答视觉问题的三个标准生物医学数据集上,LLaVA-Med 在某些指标上优于之前的最先进模型。
LLaVA-Med 等多模式助手有朝一日可以用于各种生物医学应用,例如医学研究、复杂生物医学图像的解释以及医疗保健中的对话支持。
研究团队表示:“虽然我们认为 LLaVA-Med 代表了朝着构建有用的生物医学视觉助手迈出的重要一步,但我们注意到 LLaVA-Med 受到许多 LMM 常见的幻觉和弱深度推理的限制未来的工作将侧重于提高质量和可靠性。”。
0001
评论列表
共(0)条相关推荐
消息称苏宁易购全品类商品将接入百度电商
据36氪消息,苏宁易购全品类上百万款商品将接入百度电商,双方以618为契机达成合作,合作内容涉及搜索、直播、视频、商城等。后续双方或将共同探索智能电商领域。今年5月,百度电商正式推出电商新品牌“百度优选”,该品牌作为搜逛推一体的智能电商平台的一部分,将深度链接和交互用户与场景,并在搜索、直播、视频和商城四个场域中实现人找货和货找人的深度融合,促进交易。站长网2023-06-13 14:58:470000OpenAI在中国申请“GPT-6”“GPT-7”商标 此前表示GPT5已在训练中
天眼查App显示,近日,欧爱运营有限责任公司(OPENAIOPCO,LLC)申请多枚“GPT-6”“GPT-7”商标,国际分类为科学仪器、网站服务,当前商标状态均为等待实质审查。站长网2023-12-01 17:02:290000库克确认接班人来自内部 称目前没有离开苹果的打算
在最近一期的《DuaLipa:AtYourService》博客采访中,苹果CEO蒂姆·库克明确表示,尚未确定具体的接班计划,目前没有离开苹果的打算。同时,他还强调了对苹果公司的热爱和对未来在苹果工作的期待。关于库克的接班人问题,库克表示,他们正在制定多个接班方案,以应对不可预测的情况。站长网2023-11-22 10:39:120000阿里巴巴推大规模音频语言模型Qwen-Audio
要点:阿里巴巴研究团队推出了Qwen-Audio系列,这是一组具有通用音频理解能力的大规模音频语言模型。Qwen-Audio通过采用层次标签的多任务框架,成功应对了多样化任务的挑战,并在基准任务上取得了令人印象深刻的性能,无需特定任务的微调。Qwen-Audio-Chat是在Qwen-Audio基础上构建的,支持多轮对话和各种音频中心场景,展示了其通用音频理解能力。站长网2023-11-23 11:22:550000字节跳动旗下飞书 AI 助手“MY AI”或将于今年 9 月发布
据财联社消息,飞书计划于今年9月正式发布AI助手“MYAI”。“MyAI”是飞书推出的智能AI助手。2023年4月11日,飞书官方公众号发布了飞书新产品MyAI。当时,飞书方面表示,该产品功能仍在推进中,暂无明确公测及上线时间。站长网2023-08-09 08:28:570001