微软推出用于生物医学的多模态 AI 助手
站长网2023-06-15 09:55:321阅
微软的研究人员展示了 LLaVA-Med,这是一种用于生物医学的多模式 AI 助手,可以处理图像和文本。
使用生物医学图像文本对应大型数据集来训练多模态 AI 模型。该数据集包括胸部 X 光、MRI、组织学、病理学和 CT 图像等。首先,该模型学习描述此类图像的内容以及重要的生物医学概念。然后,使用GPT-4生成的指令数据集对 LLaVA-Med(生物医学的大型语言和视觉助手)进行训练。

该数据集由 GPT-4基于生物医学文本创建,其中包含有关每个图像的所有信息,可用于生成有关图像的问答。微调,然后在图像和相应的 GPT-4示例上训练 LLaVA-Med。结果是一个可以用自然语言回答有关生物医学图像的问题的助手。
使用的训练方法允许 LLaVA-Med 在不到15小时的时间内在八个 Nvidia A100GPU 上进行训练。它基于Vision Transformer和Vicuna语言模型,后者又基于 Meta 的LLaMA。据该团队称,该模型具有“出色的多模式对话能力”。在用于回答视觉问题的三个标准生物医学数据集上,LLaVA-Med 在某些指标上优于之前的最先进模型。

LLaVA-Med 等多模式助手有朝一日可以用于各种生物医学应用,例如医学研究、复杂生物医学图像的解释以及医疗保健中的对话支持。
研究团队表示:“虽然我们认为 LLaVA-Med 代表了朝着构建有用的生物医学视觉助手迈出的重要一步,但我们注意到 LLaVA-Med 受到许多 LMM 常见的幻觉和弱深度推理的限制未来的工作将侧重于提高质量和可靠性。”。
0001
评论列表
共(0)条相关推荐
90%的组织表示生成式AI将在未来12个月内帮助拓展业务线
**划重点:**-📈根据PwC的2024数字信任洞察报告,90%的组织相信生成式AI将在未来12个月内帮助它们拓展新的业务线。-🛡️针对数字个人数据保护法案等新的网络安全和数据隐私法规,组织对增强网络安全投资的战略重要性日益凸显。-💼报告显示,近70%的组织计划在未来的网络安全战略中积极利用生成式AI,强调积极而有效的防御措施的关键性需求。站长网2023-11-14 14:32:200000今天微信14周年了!官方晒当年第一行代码
快科技1月21日消息,据微信派公众号介绍,今天是微信的14周岁生日。14年前的今天,也就是2011年的1月21日,微信1.0在iPhone正式上线。首发只支持iOS系统,三天后,第一个Android系统版本才姗姗来迟。0000AI视野:通义千问上线通义舞王;斯坦福炒虾机器人爆火;Midjourney艺术家数据库泄露;Meta发布AI调试工具HawkEye;小冰大模型获备案
新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用通义千问上线通义舞王阿里云通义千问APP近日上线了一项名为“通义舞王”的免费功能,用户只需在APP内输入相应口令并上传照片,系统即可生成个性化的舞蹈视频。【AiBase提要】💃用户可以在通义千问APP内输入“通义舞王”或“全民舞王”等口令,上传照片后即可生成个性化的舞蹈视频。站长网2024-01-04 16:11:190001低价战凶猛,门店转让潮,接盘旅拍“五一”亏惨
作为假期曾经最赚钱的旅游生意之一,今年“五一”,旅拍店商家并没有迎来想象中泼天的富贵。“门店暴增,价格战打得太凶了,遍地黄牛抢客户,今年五一假期门店订单量甚至不如淡季”,一位旅拍店老板对Tech星球说道,她原计划再投资一家旅拍店的想法已经动摇,也开始担心现有门店能否持续经营。0000雷军:小米汽车超级工厂正式揭幕
小米创办人雷军刚刚发文称,今天是个特别的日子,小米汽车超级工厂正式揭幕。这次董事会选择在小米汽车工厂召开,董事们参观了工厂,并试驾了小米SU7。据悉,小米SU7将于3月28日正式上市,并且一上市即可交付。站长网2024-03-19 21:47:270000