研究显示 ChatGPT 提供的医疗保健回应与人类提供的建议几乎无法区分
根据《JMIR 医学教育》杂志上发表的一项新研究,ChatGPT 对与医疗保健相关的问题的回答很难与人类的回答区分开来。
该研究由纽约大学的研究人员于今年 1 月进行,旨在评估使用 ChatGPT 或类似的大型语言模型来回答电子健康记录中提出的一长串问题的可行性。研究得出结论,使用像 ChatGPT 这样的大型语言模型可能是简化医疗保健提供者与患者沟通的有效方式。
为了进行这项研究,研究团队从纽约大学朗格医疗中心的电子健康记录中提取了患者的问题。然后,他们将这些问题输入 ChatGPT,并要求聊天机器人回答的字词与医疗保健提供者在电子健康记录中输入答案时的字词大致相同。
接下来,研究人员向近 400 名成年人展示了十组患者问题和回答。他们告知参与者其中五组回答是由人类医疗保健提供者撰写的,另外五组回答是由 ChatGPT 生成的。参与者被要求正确识别每个响应是由人类还是 ChatGPT 生成的,并获得经济奖励。
研究团队发现,人们准确区分聊天机器人和人类生成的答案的能力有限。平均而言,参与者正确辨别回答来源的能力约为 65%。这一结果与研究参与者的人口统计特征无关。
研究的作者表示,这项研究证明了 LLMs 在协助医患沟通方面的潜力,尤其是在行政任务和管理常见慢性疾病方面。
然而,他们指出,还需要进行进一步研究,以探索聊天机器人在承担临床职责方面的能力。研究团队还强调,提供者组织在策划 LLM 生成的建议时要谨慎,以充分考虑这些 AI 模型的限制和潜在偏见。
在进行研究时,研究人员还询问参与者对聊天机器人在回答不同类型问题上的信任程度,采用了一个从完全不可信任到完全可信任的 5 分制评分标准。他们发现,人们对于关于保险或预约安排等后勤问题的信任最高,对于关于诊断或治疗建议的问题,人们对聊天机器人生成的回答的信任最低。
这项纽约大学的研究并不是今年发表的唯一一项支持使用 LLMs 回答患者问题的研究。
今年 4 月,《JAMA 内科医学》发表的一项研究表明,LLMs 在减轻医生面对的海量电子邮件负担方面具有重要潜力。该研究评估了由医生和 ChatGPT 提供的两组对患者咨询的回答。一组由医疗保健专业人员组成的评审团确定,由于 AI 模型的回答更加详细和富有同理心,ChatGPT 的表现优于人类提供者。
35岁女CEO掌舵 AI时代开始出现分水岭
一切来得猝不及防。今日(11月18日),OpenAI在官网宣布,原CEO山姆·阿尔特曼(SamAltman)被免去CEO职务并离开董事会和公司,首席技术官米拉·穆拉蒂(MiraMurati)将担任临时首席执行官,立即生效。这意味着,CEO阿尔特曼被董事会扫地出门——这位“最牛85后创业者”,一度被视为硅谷新一代权力中心。0000B站陈睿回应up主停更潮:是误导 UP主挣钱是B站最关注的工作
在昨日的财报电话会议上,针对此前有媒体报道的“B站UP主停更潮”一事,B站CEO陈睿回应称,这篇文章带来的基本上就是误导。文章里提到的停更潮,但其实里面只提到了三位UP主,首先,我们有几百万的活跃UP主,第二,他所提到的这三名UP主,其实在他写完稿子之后有两位还在持续更新。站长网2023-06-03 16:23:150000CamCo:可控制相机的3D 一致图像到视频生成
划重点:🔍提供了一个可控制相机姿态的图像到视频生成框架🔍引入Plücker坐标和极线约束注意力,实现了三维一致性🔍通过结构光算法对真实世界视频进行微调,改进了对象运动的合成效果研究提出了一种新颖的可控制相机姿态的图像到视频生成框架——CamCo,用于生成高质量、三维一致的视频。通过引入Plücker坐标,为预训练的图像到视频生成器提供了精确参数化的相机姿态输入。站长网2024-06-05 16:45:060000马斯克:聊天机器人Grok将向X平台所有账户开放
今日,马斯克称,本周晚些时候,大模型Grok将向X社交媒体premium订阅用户全面开放。3月18日马斯克旗下xAI宣布开源Grok-1。据悉,Grok-1基础模型基于大量文本数据训练,共有3140亿参数。该模型使用基于JAX和Rust的自定义训练堆栈进行训练。站长网2024-04-01 22:46:040000以搜索增强对抗幻觉,百川智能拿出了实现大模型商业化的最后一块拼图
12月19日,百川智能宣布开放基于搜索增强的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。这是9月末Baichuan2-53B第一次向外界打开API之后,百川智能在B端的进一步动作。0000