GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了?
要点:
由马萨诸塞大学和复旦大学的研究团队开发的GPT-4V,在医学执照考试中的准确率超过大部分医学生,为人工智能在医学临床中的应用提供了理论基础。
尽管人工智能在医学影像诊断中取得长足进展,但医生难以在未经严格测试的情况下信任其诊断结果,因为理解人工智能的判别需要额外认知成本。
研究测试了GPT-4V在美国医学执照考试题上的能力,表现出高准确率。然而,其解释质量和可靠性仍需改进,以适应真实临床场景。
近期研究显示,GPT-4V在医学执照考试中表现优异,准确率远超过大部分医学生。这为AI在医学临床中的应用提供了新的可能性。尽管人工智能在医学影像诊断方面取得了显著进展,医生仍难以完全信任其诊断结果,需要额外的认知成本。
为了增强医生对人工智能的信任,研究团队建议通过医学执照考试来评估AI的专业知识和技能。研究还指出GPT-4V在解释质量方面存在局限性,强调了人机协作在未来医疗诊断中的重要性。
论文地址:https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3
图源备注:图片由AI生成,图片授权服务商Midjourney
该研究使用了涉及不同医学领域的带有图像的选择题来测试GPT-4V的性能,结果显示在美国医学执照考试等三个考试上,GPT-4V的准确率分别达到了86.2%、62.0%和73.1%。
尽管在解释正确时医疗专业人士对GPT-4V的解释较为认可,但当回答错误时,存在图像误解等问题。研究团队提出通过提示来改进GPT-4V的解释质量,展示了GPT-4V作为影像诊断辅助工具的潜力。然而,研究也指出GPT-4V仍需改进解释质量和可靠性,以适应真实临床场景。
综合而言,GPT-4V在医学执照考试中的表现为人工智能在医学领域取得了显著进展提供了证据。然而,要将其应用于真实临床环境,还需要进一步改进解释质量和可靠性。这一研究为未来开发更精细的人工智能协作系统提供了方向,以使其成为可靠的医学辅助工具。
独家|追赶抖音快手,腾讯系多款产品加码短剧
Tech星球独家获悉,阅文将推出“奇迹短剧”平台,后续会成为阅文短剧的播放渠道。作为一款独立的短剧播放应用,奇迹短剧目前还处于内部测试阶段,不过已于去年12月通过了工信部的备案。“奇迹短剧”的备案主体,是北京天金数码科技发展有限公司,该公司也是阅文旗下天方听书网的运营主体。对于上述消息,Tech星球向阅文方面进行求证,截至发稿,对方暂无回应。站长网2024-02-27 09:19:030000苹果iOS 17正式版发布 新增待机显示、视频语音留言等功能
苹果公司于9月19日凌晨1点左右正式发布了iOS17的正式版升级。适用于iPhoneXs及后续机型。在这次更新中,电话、信息、FaceTime通话等功能得到了重大升级,同时还有新功能“待机显示”。苹果公司表示,iOS17的更新包括了很多新功能,其中最突出的是电话App新增个性化联系人海报功能,这一功能可以让用户自定义拨出电话时对方看到的内容,如照片、拟我表情、字体和颜色等。站长网2023-09-19 08:30:240002“Linux 中国” 开源社区宣布停止运营
开源社区Linux中国宣布,“Linux中国”社区,包括主网(https://linux.cn/)、公众号、视频号,以及下属的《硬核观察》栏目,将无限期停止更新和运营。社区创始人表示,停止运营是一个艰难的决定,但是由于多个原因,包括完成了社区的使命、翻译工作的必要性降低、个人经济压力等,他不得不做出这个决定。社区在十几年的发展中取得了一些成就,但是近年来遇到了一些困难,无法继续独立运营。站长网2024-02-01 16:14:110000一家年GMV3亿的品牌对直播的反思:警惕起哄,保住基本盘,利润为核心
一年卖货3亿元后,品牌如何持续增长?这是康新牧场急需解决的问题。2006年,康新牧场成立于内蒙古呼和浩特,现在它不仅有年产能3000吨的自有工厂,7000平的自有云仓,还做到了年GMV3亿元,其中抖音渠道占比30%,年GMV在1亿元左右。站长网2023-10-31 09:06:130000小米手表S4首发搭载小米澎湃OS 2:将于小米15系列同日发布
小米官方宣布,即将在10月29日的发布会上亮相一系列新品,其中包括小米15系列手机、小米SU7Ultra量产版,以及搭载了全新小米澎湃OS2系统的小米手表S4等多款新品。小米手表S4的外观设计已经公布,这款手表将成为首批搭载小米澎湃OS2系统的设备之一。澎湃OS2系统的引入,为小米手表S4带来了全新的融合设备中心,使用户能够通过单一的手表控制汽车和家中的智能设备。0000