研究显示 ChatGPT 提供的医疗保健回应与人类提供的建议几乎无法区分
根据《JMIR 医学教育》杂志上发表的一项新研究,ChatGPT 对与医疗保健相关的问题的回答很难与人类的回答区分开来。

该研究由纽约大学的研究人员于今年 1 月进行,旨在评估使用 ChatGPT 或类似的大型语言模型来回答电子健康记录中提出的一长串问题的可行性。研究得出结论,使用像 ChatGPT 这样的大型语言模型可能是简化医疗保健提供者与患者沟通的有效方式。
为了进行这项研究,研究团队从纽约大学朗格医疗中心的电子健康记录中提取了患者的问题。然后,他们将这些问题输入 ChatGPT,并要求聊天机器人回答的字词与医疗保健提供者在电子健康记录中输入答案时的字词大致相同。
接下来,研究人员向近 400 名成年人展示了十组患者问题和回答。他们告知参与者其中五组回答是由人类医疗保健提供者撰写的,另外五组回答是由 ChatGPT 生成的。参与者被要求正确识别每个响应是由人类还是 ChatGPT 生成的,并获得经济奖励。
研究团队发现,人们准确区分聊天机器人和人类生成的答案的能力有限。平均而言,参与者正确辨别回答来源的能力约为 65%。这一结果与研究参与者的人口统计特征无关。
研究的作者表示,这项研究证明了 LLMs 在协助医患沟通方面的潜力,尤其是在行政任务和管理常见慢性疾病方面。
然而,他们指出,还需要进行进一步研究,以探索聊天机器人在承担临床职责方面的能力。研究团队还强调,提供者组织在策划 LLM 生成的建议时要谨慎,以充分考虑这些 AI 模型的限制和潜在偏见。
在进行研究时,研究人员还询问参与者对聊天机器人在回答不同类型问题上的信任程度,采用了一个从完全不可信任到完全可信任的 5 分制评分标准。他们发现,人们对于关于保险或预约安排等后勤问题的信任最高,对于关于诊断或治疗建议的问题,人们对聊天机器人生成的回答的信任最低。
这项纽约大学的研究并不是今年发表的唯一一项支持使用 LLMs 回答患者问题的研究。
今年 4 月,《JAMA 内科医学》发表的一项研究表明,LLMs 在减轻医生面对的海量电子邮件负担方面具有重要潜力。该研究评估了由医生和 ChatGPT 提供的两组对患者咨询的回答。一组由医疗保健专业人员组成的评审团确定,由于 AI 模型的回答更加详细和富有同理心,ChatGPT 的表现优于人类提供者。
马斯克豪掷40亿训Grok-3,红杉高盛大泼冷水,AI收支鸿沟或已达5000亿美元
马斯克为Grok3要豪掷近40亿美元狂买10万张H100,GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水:每年要挣6000亿美元才能支付的巨额硬件支出,换来的却只是OpenAI34亿美元的收入,绝大多数初创连1亿美元都达不到。而如果全世界的AI泡沫都被戳破,很可能就会导致新的经济危机。硅谷大厂的人工智能军备竞赛,还在加剧。站长网2024-07-08 11:07:400000万物皆可“复制粘贴”!苹果商店新上的AR应用火了
现实里的一切都可“复制粘贴”,简直不要太好玩!瞧,一位小可爱端了一杯茶送到老板桌前:老板先是一愣,然后发出灵魂一问:或许你会困惑,茶不是明明就在那儿吗?但实际情况是这样的:很多小伙伴们应该秒懂了,这杯茶其实是“AR(增强现实)制造”。如此效果,正是来自最近大火的ARCode。而且它还是属于未发先火🔥的那种,早在iOS17发布之前,其效果就已经在推特上惊艳了不少网友。站长网2023-10-15 15:23:560000Redmi首款金属腕表 Redmi Watch 4 将于11月29日发布
11月29日,Redmi旗下首款金属腕表RedmiWatch4也将同步发布。据官方预热,RedmiWatch4将在屏幕、设计、材质上迎来全面升级,提供金属、皮制、橡胶、尼龙四种材质选择,并可选米兰尼斯表带,质感十足。从预热海报来看,RedmiWatch4继承上代方形大屏设计,在尺寸、分辨率上应该会有升级。此外,是否会搭载小米澎湃OS系统将是最大悬念。站长网2023-11-24 17:21:350000国产大模型黑马诞生,千亿级拿下双榜第一!知识正确性能力突出,大幅降低LLM幻觉问题
【新智元导读】夸克,也下场大模型了。甫一问世,夸克大模型就迅速登顶权威测评双榜第一,幻觉率大幅降低,可以预见,风靡年轻人的夸克APP,要掀起新的飓风了。最近的各大手机厂商和互联网公司,都在卯足了劲儿地发布大模型。而其中的一匹黑马,显得格外引人注目——千亿级在C-Eval和CMMLU两大权威评测中拿下双榜第一,百亿级在法律、医疗、问答等领域的性能评测中名列榜首。站长网2023-11-25 13:43:080000百万在线,大圣归来!《黑神话:悟空》石破天惊,RTX 4090D飞越花果山
【新智元导读】等待四年,《黑神话:悟空》终于上线。激动的心,颤抖的手,全球玩家们都在电脑屏幕前集结,见证这一中国游戏史上里程碑的一刻。打破多项纪录后,中国游戏版图,会被它撼动吗?就在刚刚,《黑神话:悟空》一上线,就创造了中国游戏史上的奇迹!睽违四年,这一刻,苦苦等待们的玩家们沸腾了。《黑神话:悟空》,将是第一款跻身世界一流水平的国产单机游戏,也注定会是中国游戏史上的一座里程碑。站长网2024-08-20 14:04:040000