微软推出用于生物医学的多模态 AI 助手
站长网2023-06-15 09:55:321阅
微软的研究人员展示了 LLaVA-Med,这是一种用于生物医学的多模式 AI 助手,可以处理图像和文本。
使用生物医学图像文本对应大型数据集来训练多模态 AI 模型。该数据集包括胸部 X 光、MRI、组织学、病理学和 CT 图像等。首先,该模型学习描述此类图像的内容以及重要的生物医学概念。然后,使用GPT-4生成的指令数据集对 LLaVA-Med(生物医学的大型语言和视觉助手)进行训练。

该数据集由 GPT-4基于生物医学文本创建,其中包含有关每个图像的所有信息,可用于生成有关图像的问答。微调,然后在图像和相应的 GPT-4示例上训练 LLaVA-Med。结果是一个可以用自然语言回答有关生物医学图像的问题的助手。
使用的训练方法允许 LLaVA-Med 在不到15小时的时间内在八个 Nvidia A100GPU 上进行训练。它基于Vision Transformer和Vicuna语言模型,后者又基于 Meta 的LLaMA。据该团队称,该模型具有“出色的多模式对话能力”。在用于回答视觉问题的三个标准生物医学数据集上,LLaVA-Med 在某些指标上优于之前的最先进模型。

LLaVA-Med 等多模式助手有朝一日可以用于各种生物医学应用,例如医学研究、复杂生物医学图像的解释以及医疗保健中的对话支持。
研究团队表示:“虽然我们认为 LLaVA-Med 代表了朝着构建有用的生物医学视觉助手迈出的重要一步,但我们注意到 LLaVA-Med 受到许多 LMM 常见的幻觉和弱深度推理的限制未来的工作将侧重于提高质量和可靠性。”。
0001
评论列表
共(0)条相关推荐
OpenAI竞争对手Anthropic获得4.5亿美元融资
AI初创公司Anthropic被认为是仅次于谷歌,OpenAI最大的竞争对手,现在这家公司又筹集了4.5亿美元的投资。站长网2023-05-24 17:06:220000做AI转录,拿下日本、实现千万美金ARR
不久前,A16zAI合伙人OliviaMoore分享了一张AI转录初创公司图谱,面向企业服务(B2B)的转录公司不仅数量多,更涉及人宠医疗、招聘、销售和会议等多元场景。其中作为“打工人刚需”的会议场景转录,参与厂商众多,我们也从中发现了一家非常有趣的华人创立公司——Notta。此前TechCrunch披露的融资信息显示,其总部位于新加坡,研发中心位于深圳。站长网2024-08-06 09:11:400000网信办发布关于加强自媒体管理的通知 加大对MCN机构管理力度
今日,中央网信办发布《关于加强“自媒体”管理的通知》提出,加大对“自媒体”所属MCN机构管理力度。通知称,网站平台应当健全MCN机构管理制度,对MCN机构及其签约账号实行集中统一管理。在“自媒体”账号主页,以显著方式展示该账号所属MCN机构名称。对于利用签约账号联动炒作、多次出现违规行为的MCN机构,网站平台应当采取暂停营利权限、限制提供服务、入驻清退等处置措施。以下为具体内容:站长网2023-07-10 17:07:0300002024 年 8 个顶级生成式人工智能工具类别
ChatGPT等生成式人工智能服务的流行激发了人们将这些新工具应用于实际企业应用程序的兴趣。如今,几乎每个企业应用程序都通过生成式人工智能功能得到增强。0000微信的一个新能力,据说是龙哥亲手打磨
昨天我在公众号后台收到一条系统消息,内容是关于授权微信音频播放器引用我公众号发表的内容,默认是开启状态。此外,在这条系统消息里还介绍了一个叫「微信音乐故事」的新能力。关于这个功能,微信团队是这么介绍的:站长网2023-04-25 15:46:290000