研究显示 ChatGPT 提供的医疗保健回应与人类提供的建议几乎无法区分
根据《JMIR 医学教育》杂志上发表的一项新研究,ChatGPT 对与医疗保健相关的问题的回答很难与人类的回答区分开来。
该研究由纽约大学的研究人员于今年 1 月进行,旨在评估使用 ChatGPT 或类似的大型语言模型来回答电子健康记录中提出的一长串问题的可行性。研究得出结论,使用像 ChatGPT 这样的大型语言模型可能是简化医疗保健提供者与患者沟通的有效方式。
为了进行这项研究,研究团队从纽约大学朗格医疗中心的电子健康记录中提取了患者的问题。然后,他们将这些问题输入 ChatGPT,并要求聊天机器人回答的字词与医疗保健提供者在电子健康记录中输入答案时的字词大致相同。
接下来,研究人员向近 400 名成年人展示了十组患者问题和回答。他们告知参与者其中五组回答是由人类医疗保健提供者撰写的,另外五组回答是由 ChatGPT 生成的。参与者被要求正确识别每个响应是由人类还是 ChatGPT 生成的,并获得经济奖励。
研究团队发现,人们准确区分聊天机器人和人类生成的答案的能力有限。平均而言,参与者正确辨别回答来源的能力约为 65%。这一结果与研究参与者的人口统计特征无关。
研究的作者表示,这项研究证明了 LLMs 在协助医患沟通方面的潜力,尤其是在行政任务和管理常见慢性疾病方面。
然而,他们指出,还需要进行进一步研究,以探索聊天机器人在承担临床职责方面的能力。研究团队还强调,提供者组织在策划 LLM 生成的建议时要谨慎,以充分考虑这些 AI 模型的限制和潜在偏见。
在进行研究时,研究人员还询问参与者对聊天机器人在回答不同类型问题上的信任程度,采用了一个从完全不可信任到完全可信任的 5 分制评分标准。他们发现,人们对于关于保险或预约安排等后勤问题的信任最高,对于关于诊断或治疗建议的问题,人们对聊天机器人生成的回答的信任最低。
这项纽约大学的研究并不是今年发表的唯一一项支持使用 LLMs 回答患者问题的研究。
今年 4 月,《JAMA 内科医学》发表的一项研究表明,LLMs 在减轻医生面对的海量电子邮件负担方面具有重要潜力。该研究评估了由医生和 ChatGPT 提供的两组对患者咨询的回答。一组由医疗保健专业人员组成的评审团确定,由于 AI 模型的回答更加详细和富有同理心,ChatGPT 的表现优于人类提供者。
等不及Sora的老铁,奔向快手可灵
OpenAI让大模型风暴席卷全球的最初那段时间里,快手并不是一个耀眼的角色。彼时,百度拿出文心一言,阿里拿出通义千问,腾讯拿出混元大模型,彼此追赶,研发与开放速度都很快。快手不在最初的角逐名单里,甚至到现在,都很少有人能叫出快手大语言模型的名字:快意。站长网2024-08-01 11:41:300000Spotify CEO称将引入多个AI技术的新功能
在第二季度财报电话会议上,Spotify的首席执行官DanielEk透露了该流媒体服务可能引入额外的AI功能的几种方式。Ek谈到了AI如何用于创建更个性化的体验,总结播客和生成广告。站长网2023-07-26 14:05:180000米哈游近况:蔡浩宇亲自研究AI,刘伟要求严控招聘
在《崩坏:星穹铁道》上线之后,不少人都认为米哈游有了新的营收支柱,即将进入稳健的「复制爆款」阶段。但最近葡萄君获悉,米哈游几位创始人近期的工作重点有了一些调整,他们对于组织发展也有了一些新的思考——这家公司仍然在寻找更正确的节奏,探索新的上限。01高层工作重点的调整首先,未来蔡浩宇将调动北美更多的资源,并投入更多精力亲自研究AI,而罗宇皓将常驻上海,继续负责更多项目开发工作。站长网2023-08-03 09:09:070000马斯克称推特正在测试一个名为文章的新功能
theverge报道称,埃隆·马斯克透露,推特正在开发一项功能,让你可以在平台上发布文章。马斯克在回复一位用户关于这个正在开发中的工具的推文时说,这个功能将“允许用户发布非常长、复杂的文章,包含混合媒体”。他说,“你想的话,可以发布一本书。”站长网2023-07-19 19:18:290000马斯克的 SpaceX 将为苹果 iPhone 的紧急求救功能发射卫星
据Nola报道,苹果卫星合作伙伴Globalstar正在支付SpaceX的费用,以发射新卫星,用于更新通过卫星紧急呼救(SOS)的iPhone功能的通信网络。根据披露的SEC文件,Globalstar将支付SpaceX6400万美元,支付将从2023年到2025年进行,这也是SpaceX计划发射卫星的时间。站长网2023-09-03 08:52:470000