OpenAI 的 ChatGPT 通过新的放射学委员会考试:病患更喜欢 AI 的回答 更具同情心
OpenAI 的 ChatGPT 正在通过医学考试,两项最新研究表明,这一次 ChatGPT 在放射学考试中取得了及格分数。

研究人员将 ChatGPT 的 GPT-3.5 版本和 GPT-4 版本评估了放射学考试的 150 个问题。他们发现,在两个版本中,AI 的聊天机器人从 69.3% 的接近及格的分数提高到了 80.7%,在高级别思维问题中表现更为出色,特别是在描述影像发现和应用医学概念方面,GPT-4 版本的表现更好。
这些问题是基于文本的选择题,分为两个大类(高级和低级),以评估技术在回答问题方面的具体优势和劣势。这些问题被选中以匹配加拿大皇家学院和美国放射学委员会考试的风格、内容和难度。
ChatGPT 在医学考试中的应用已经成为一种常见现象。自 ChatGPT 在 2022 年 11 月 30 日发布以来,通过医学认证考试一直是 AI 开发人员的长期目标,尤其是谷歌的医学重点大语言模型(LLM)Med-PaLM。
自当月以来,参与 AI 测试使用于医学认证的研究已成为一种常见实践,特别是通过 ChatGPT 的性能来提升在医学领域的应用。医学认证考试成为了 AI 开发的一个长期目标。
在 2022 年 12 月,研究人员展示了 Med-PaLM 在美国医疗许可考试(USMLE)上获得了 67.6% 的准确率,这是及格分数的普遍门槛,这是 AI 在医学上功能的一个重大里程碑,类似于人工智能在多年中与国际象棋大师的竞争。
此外,ChatGPT 最近还接受了评估其回答患者问题的能力。在与真实医生回答的比较中,经过盲评估的评价者在 75% 以上的时间内更喜欢 ChatGPT 的回答。与医生的回答相比,该 AI 聊天机器人的回答也被评为更具有同情心。
总的来说,现在 AI 模型在医学上能做什么和不能做什么的努力是一个设定基准的过程。Bhayana 表示,目前的重点是确定 ChatGPT 和其他 AI 模型可以在医学上如何使用,但他警告说,由于这些技术往往会「幻觉」或说谎(通常非常自信),因此应用是有限制的。然而,他希望技术能够不断改进,以实现在医学上更广泛的应用。
目标是了解医生可以信任这些工具的程度,然后开始着手改进和优化这些模型,以适用于特定的临床用途。目前,生成式 AI 已经表明在某些用途上是高效的,例如听写和转录,但 Bhayana 认为,在医学上医生将能够信任这些工具,需要更多时间和更新。
他表示:「随着这些工具的出现,重点在于了解它们的性能,寻找它们的应用,并确保人们知道它们的优点和限制,以便医生与技术共同发展。」
“蓝鸟”价值17万元:二手市场出现旧推特Logo iPhone 11
快科技7月31日消息,近日,马斯克将推特Logo改为字母X,遭到了不少用户的不满,也有用户选择放弃升级,坚守旧版本。但对于一些意外升级到新版本,但有想要老版本蓝鸟”Logo的用户来说,事情似乎已经难以找到解决的方法。近日,有用户在二手交易平台eBay发现,有用户上架了带有旧版推特的iPhone11ProMax,售价达到了夸张的2.5万美元(约合人民币17.9万元)。站长网2023-07-31 20:18:050000一年卖出50亿,高端羽绒赛道杀出“黑马”
虽然很多人喊着“千元以上的羽绒服买不起”,但中高端羽绒服市场还是跑出了新“冠军”。2024年双11期间,高梵登顶天猫、抖音电商羽绒服销售榜首,由张柏芝直播带货的黑金鹅绒系列不仅没有打折促销,反而三次涨价,销量一路飙升。蝉妈妈数据显示,在整个11月期间,抖音女装-羽绒服榜单中,高梵位居第三,仅次于鸭鸭和波司登。目前,高梵抖音官方旗舰店销量第一、售价1599元的黑金先锋系列羽绒服,已售出6万件。站长网2025-01-09 09:07:520000UltraFastBERT:推理过程仅用0.3%神经元,性能与类似的BERT模型相当
**划重点:**1.🧠**创新介绍:**ETHZurich研究人员成功开发了UltraFastBERT,通过使用快速前馈网络(FFFs)在推理过程中仅使用0.3%的神经元,实现了与其他模型相当的性能水平。站长网2023-11-28 15:18:370001剪映海外版CapCut推文生视频功能 每人每天可免费生成5个视频
剪映海外版CapCut推出了一项新的功能,即文字生成视频(AI影片),它允许用户通过输入文字描述来自动转换成短视频。该功能旨在帮助各类用户提高视频制作的效率和便捷性。官方入口:https://top.aibase.com/tool/capcutwenshengshipin主要功能特点:支持AI自动转换:用户只需输入文字提示,系统就能自动生成对应的视频内容。站长网2024-02-23 14:21:320009AI女友突然断崖式分手,独留对象在贴吧发心碎小作文
如果AI女友与你断崖式分手,你会难过吗?据BusinessInsider报道,日活几千人的AI陪伴服务的应用Soulmate因为应用的所有权公司被出售,出于业务原因决定停止运营。这也意味着,大家朝夕相处的「AI伴侣」即将消失。这一切让许多深陷热恋的用户直呼「破防」,HilaryCoyote就是其中之一。站长网2023-11-08 09:16:090000