注册

首页站长资讯GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了？

13098

GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了？

站长网2023-11-21 17:55:541阅

要点:

由马萨诸塞大学和复旦大学的研究团队开发的GPT-4V，在医学执照考试中的准确率超过大部分医学生，为人工智能在医学临床中的应用提供了理论基础。

尽管人工智能在医学影像诊断中取得长足进展，但医生难以在未经严格测试的情况下信任其诊断结果，因为理解人工智能的判别需要额外认知成本。

研究测试了GPT-4V在美国医学执照考试题上的能力，表现出高准确率。然而，其解释质量和可靠性仍需改进，以适应真实临床场景。

近期研究显示，GPT-4V在医学执照考试中表现优异，准确率远超过大部分医学生。这为AI在医学临床中的应用提供了新的可能性。尽管人工智能在医学影像诊断方面取得了显著进展，医生仍难以完全信任其诊断结果，需要额外的认知成本。

为了增强医生对人工智能的信任，研究团队建议通过医学执照考试来评估AI的专业知识和技能。研究还指出GPT-4V在解释质量方面存在局限性，强调了人机协作在未来医疗诊断中的重要性。

论文地址：https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3

图源备注：图片由AI生成，图片授权服务商Midjourney

该研究使用了涉及不同医学领域的带有图像的选择题来测试GPT-4V的性能，结果显示在美国医学执照考试等三个考试上，GPT-4V的准确率分别达到了86.2%、62.0%和73.1%。

尽管在解释正确时医疗专业人士对GPT-4V的解释较为认可，但当回答错误时，存在图像误解等问题。研究团队提出通过提示来改进GPT-4V的解释质量，展示了GPT-4V作为影像诊断辅助工具的潜力。然而，研究也指出GPT-4V仍需改进解释质量和可靠性，以适应真实临床场景。

综合而言，GPT-4V在医学执照考试中的表现为人工智能在医学领域取得了显著进展提供了证据。然而，要将其应用于真实临床环境，还需要进一步改进解释质量和可靠性。这一研究为未来开发更精细的人工智能协作系统提供了方向，以使其成为可靠的医学辅助工具。

GPT4V医学考试成绩超过多数医学生AI看病稳妥了

0001

评论列表

共(0)条

相关推荐

站长资讯
浙大团队推SIFU模型:单张图像准确重建高质量3D人体模型
划重点:🌐SIFU模型创新性解决单张图像重建3D人体模型问题👥引入侧视图条件隐函数及3D一致性纹理编辑方法📈在几何和纹理重建上表现出色，具有更高鲁棒性和广泛应用场景在AR、VR、3D打印、场景搭建以及电影制作等多个领域中，获得高质量穿着衣服的人体3D模型变得至关重要。然而，传统的创建方法耗时且需要专业设备捕捉多视角照片，还依赖技术熟练的专业人员。
站长网2024-01-18 14:29:39
0000
站长资讯
字节跳动旗下时光相册延期至 12 月 6 日停运
字节跳动旗下的时光相册发布公告，宣布将延长应用关停时间至2023年12月6日。这是由于仍有一些用户未完成照片和视频的下载。公告提醒用户，关停时间仅为一次延期调整，之后将不再变动。
站长网2023-11-20 08:45:36
0002
站长资讯
马斯克旗下脑机公司Neuralin启动首次人体试验招募四肢瘫痪和ALS患者
据彭博社报道，亿万富翁伊隆·马斯克领导的大脑植入创业公司神经链接（Neuralink），正在招募四肢瘫痪和肌萎缩性脊髓侧索硬化(ALS)患者，参与该公司的首次人体临床试验。这标志着这项仿佛科幻的技术更进一步地接近人体应用现实。图源备注:图片由AI生成，图片授权服务商Midjourney
站长网2023-09-20 09:43:32
0000
站长资讯
OpenAI官宣Sam Altman回归担任CEO
OpenAI宣布，SamAltman正式回归OpenAI担任CEO，MiraMurati也将回到CTO职位。新的初始董事会将由BretTaylor（董事长）、LarrySummers和AdamD'Angelo组成。同时，Altman表达了对所有人的感谢，并表示对OpenAI实现使命的成功概率感到非常乐观。
站长网2023-11-30 09:32:16
0000
站长资讯
Midjourney角色一致功能保姆级实测！真有那么稳定、可控吗？
昨天，Midjourney补上了一块很重要的拼图，那就是上线角色一致功能（--cref）。一句话来说就是，现在你可以生成一个角色，然后一直使用这个角色，生成Ta不同造型、不同风格、不同场景、不同视角的图片。这是写实人像的效果:动漫人物也不在话下:甚至还支持双人!不过在精细程度上还有待加强。
站长网2024-03-14 09:12:35
0009

热点

《封神2》崩的越惨，DeepSeek的刀就越锋利。
2025-02-06 18:40:06
iPhone用户警惕！苹果App Store首次发现OCR恶意软件：悄无声息窃取资料
2025-02-07 03:21:16
一周打赏20万，各个品牌为做“榜一大哥”正在疯狂撒钱。
2025-02-06 18:38:10
模型优惠进入倒计时 DeepSeek因服务器暂停API服务充值
2025-02-07 03:18:38
过年三件套平替爆火：商家月入200万，订单“根本发不完”
2025-02-06 01:10:59
小米眼镜官微上线：智能眼镜赛道要爆发
2025-02-07 02:59:11
一个行业的AI样板：教培的不同环节怎么被改写
2025-02-05 23:37:52
这个春节大家都在看什么？哪吒创影史纪录，DeepSeek刷屏全网
2025-02-07 02:48:00
黄仁勋喊话年轻人：学会用AI 才能更出色
2025-02-05 23:36:32
告别5美元包邮，Temu和Shein还是比亚马逊便宜
2025-02-07 02:47:51

关注

小鹏G9/G6正式登陆爱尔兰/芬兰：加速欧洲市场布局
2025-02-04 09:36:20
《哪吒2》登顶，谁赚麻了？
2025-02-07 15:41:39
小米汽车门店已有216家门店：覆盖全国64城
2025-02-04 09:33:18
雷军去小米汽车工厂上班了：确认要进一步提产冲击年销30万辆
2025-02-07 15:06:26
三星Exynos 2500芯片确认于2025年下半年推出：性能不及骁龙8 Elite
2025-02-04 07:34:04
小米眼镜官博上线旗下首款AI眼镜将发布
2025-02-07 10:20:34
DeepSeek创始人老家成热门打卡地：家长带着孩子拍照打卡
2025-02-04 07:31:46
模型优惠进入倒计时 DeepSeek因服务器暂停API服务充值
2025-02-07 03:18:38
硅谷掀桌！DeepSeek遭OpenAI和Anthropic围剿，美国网友都看不下去了
2025-02-02 16:49:29
小米眼镜官微上线：智能眼镜赛道要爆发
2025-02-07 02:59:11

推荐