研究发现,GPT-4在临床决策中存在潜在种族和性别偏见问题
**划重点:**
1. 🩺 GPT-4被评估在四个临床决策支持角色中是否存在种族和性别偏见。
2. 🔄 研究发现GPT-4在生成患者案例、制定诊断和治疗计划,以及评估患者特征时存在明显的偏见。
3. 🚨 研究呼吁对大型语言模型进行偏见评估,以确保其在医学领域的应用不会加剧社会偏见。
近期,来自布里格姆和妇女医院的研究人员对GPT-4在临床决策中是否存在种族和性别偏见进行了评估。虽然大型语言模型(LLMs)如ChatGPT和GPT-4在自动化行政任务、起草临床记录、与患者交流以及支持临床决策方面具有潜力,但初步研究表明,这些模型可能对历史上被边缘化的群体产生不利影响。
研究首次系统评估了GPT-4在四个临床决策支持角色中编码和展示种族和性别偏见的倾向,并将结果发表在《柳叶刀数字健康》杂志上。对该研究的首席作者Emily Alsentzer博士表示:“尽管大多数关注点都集中在使用LLMs进行文档编制或行政任务上,但人们也对使用LLMs支持临床决策的潜力感到兴奋。我们希望系统评估GPT-4是否编码了影响其支持临床决策能力的种族和性别偏见。”
图源备注:图片由AI生成,图片授权服务商Midjourney
Alsentzer及其团队使用Azure OpenAI平台测试了GPT-4的四个应用场景。首先,他们促使GPT-4生成可用于医学教育的患者案例。接下来,他们测试了GPT-4对来自NEJM Healer的19个不同患者病例制定诊断和治疗计划的能力,NEJM Healer是一种向医学学员展示具有挑战性的临床案例的医学教育工具。最后,他们评估了GPT-4如何通过八个旨在衡量内隐偏见的病例情景对患者的临床表现进行推断。对于每个应用,作者评估了GPT-4的输出是否受到种族或性别的偏见影响。
在医学教育任务中,研究人员构建了十个提示,要求GPT-4为提供的诊断生成患者案例。他们每个提示运行了100次,发现GPT-4夸大了根据人口统计学差异已知的疾病患病率。
Alsentzer解释道:“一个显著的例子是当GPT-4被提示为患有肺结节病的患者生成案例时:GPT-4在81%的情况下描述的是一个黑人女性。尽管肺结节病在黑人患者和女性中更为普遍,但并不占所有患者的81%。”
接下来,在GPT-4被要求为NEJM Healer病例制定10种可能的诊断时,更改患者的性别或种族/族裔显著影响了其在37%的情况下优先考虑正确的顶级诊断的能力。
Alsentzer说:“在某些情况下,GPT-4的决策反映了文献中已知的性别和种族偏见。在肺栓塞的情况下,该模型将惊恐发作/焦虑作为女性比男性更可能的诊断。对于来自少数族裔背景的患者,它还将性传播疾病,如急性HIV和梅毒,排名为比白人患者更可能的诊断。”
当被要求评估主观患者特征,如诚实、理解和疼痛耐受性时,GPT-4在23%的问题上通过种族、族裔和性别产生了显著不同的回答。例如,在所有模拟患者病例中答案应该相同的情况下,GPT-4更有可能将黑人男性患者与亚洲、黑人、西班牙裔和白人女性患者相比,评定为滥用阿片类药物Percocet。
该研究的局限性包括使用有限数量的模拟提示测试GPT-4的响应,并仅使用一些传统的人口统计学身份类别来分析模型的性能。未来的工作应该使用来自电子健康记录的临床笔记来调查偏见。
Alsentzer表示:“虽然目前正在部署带有临床医生的LLM工具以验证模型的输出,但当临床医生查看个别患者病例时,很难检测到系统性偏见。我们必须对LLMs的每个预期用途进行偏见评估,就像我们对医学领域的其他机器学习模型一样。我们的工作可以帮助引发关于GPT-4在临床决策支持应用中传播偏见的讨论。”
Opera浏览器推出升级版的AI工具Aria
要点:1.Opera浏览器推出升级版的AI工具Aria,使用户能够更轻松地与AI互动,优化查询和创作内容。2.Aria的新工具“Refiner”具备“重用”和“改述”功能,用户可以根据以前的回答元素来改进AI的回应。3.用户还可以使用Aria的“高亮器”功能来标记需要后续处理的元素,以及通过“我的风格”功能训练AI以模仿其写作风格。站长网2023-10-11 16:41:260000工信部最新通报22款违规APP:快检查你的手机
工业和信息化部今天发布通告,公布了侵害用户权益行为的APP(SDK),这是今年的第8批,也是总计的第34批。工信部高度重视用户权益保护工作,持续开展APP侵害用户权益专项整治行动。近期,工信部再次组织第三方检测机构对群众关注的实用工具、网络游戏等移动互联网应用程序(APP)及第三方软件开发工具包(SDK)进行检查,发现22款APP、SDK存在侵害用户权益行为。站长网2023-11-30 20:54:290000AI绘图模型训练到推理,一个网页就能搞定
不会写代码,也能训练AI绘画模型了!只要借助这个框架,从训练到推理都能一站式搞定,还能一次管理多个模型。阿里巴巴团队推出并开源了这款万能图片生成工作台SCEPTERStudio。有了它,不用代码,直接在Web界面当中就能完成模型的训练与微调,并管理相关数据。团队还推出了内置三种模型的DEMO,可以在线体验SCEPTER的推理功能。那么SCEPTER具体都能干啥,下面就来一睹为快!站长网2024-02-18 09:22:070001英国育儿论坛Mumsnet用OpenAI技术创建了AI聊天机器人
本文概要:1.育儿论坛MumsnetOpenAI技术创建了一个AI聊天机器人,名为MumsGPT,可用于分析网站上用户留下的评论和帖子。2.MumsGPT将用于指导决策者在育儿问题上并为广告商提供更精准的营销目标。3.MumsGPT目前只是一个研究工具,但未来可能对公众开放。站长网2023-08-22 14:14:320000不止图片生成excel 微信还有这三大绝技
快科技9月2日消息,微信图片可以生成excel今天引发网友关注。据悉,微信上接到或者发送出去的表格图片,其实可以通过长按--搜一搜的操作,一键生成Excel表格,这样仅需要进行简单排版就能制作出一张表格了。其实,这是腾讯文档和微信联合推出的功能,双方还推出了众多宝藏功能,包括图片转文档和PDF、永久保存公众号文章、聊天文件转存等等。站长网2023-09-03 08:52:460000