ChatGPT在儿科疾病诊断中错误率高达83%
**划重点:**
1. ChatGPT-4在儿科医疗病例诊断方面准确率仅为17%,比其在一般医疗病例中的39%更差。
2. 研究指出ChatGPT难以识别疾病之间的关系,提出需要有选择性地在准确可信的医学文献上进行专门培训。
3. 研究者认为,通过特定医学数据的培训和调整,有望提高LLM(大型语言模型)类聊天机器人的诊断准确性。
站长之家(ChinaZ.com) 1月4日 消息:发表在《美国医学会儿科杂志》上的一项研究表明,ChatGPT-4在儿科医学病例的诊断方面的准确率仅为17%,较去年一般医学病例的39%更低。
这一低成功率显示出人类儿科医生在短时间内不太可能失业的现实,研究强调了临床经验在医学领域的不可替代性。研究人员指出ChatGPT的高错误率主要源于其对疾病关系的辨识不足,并提出通过有选择性地在准确可信的医学文献上进行培训,以及提供更实时的医学数据,有望提高模型的准确性。
图源备注:图片由AI生成,图片授权服务商Midjourney
在该项由纽约科恩儿童医学中心进行的研究中,ChatGPT-4被用于分析自2013年至2023年间JAMA Pediatrics和NEJM发表的100个儿科病例。
研究人员将相关病例的文本粘贴到ChatGPT的提示中,然后由两名合格的医学研究员对AI生成的答案进行评分。ChatGPT在100个病例中仅有17个正确的诊断,72个错误的诊断,以及11个未完全捕捉到诊断的情况。其中,57%的错误诊断集中在同一器官系统。
研究发现,ChatGPT在辨识疾病之间的已知关系方面表现不佳,例如在一个病例中未能将自闭症与坏血病(维生素C缺乏)联系起来。研究者建议通过专门选择性的培训,使ChatGPT能够更好地利用准确和可信的医学文献,而非依赖互联网上可能包含不准确信息和误导的内容。他们还提出,通过提供更实时的医学数据,模型可以进行“调谐”以提高其准确性。
华为余承东官宣 问界M9将在12月26日正式发布
华为智能汽车解决方案BU董事长余承东官宣,问界M9将在12月26日正式发布余承东介绍称,问界M9是科技领先一代的全尺寸旗舰SUV。该车不仅集成了华为最好的智能汽车技术,还首次实现了SUV的纯平地板设计,搭配六座均权头等舱体验座椅,为每位乘客带来超舒适、巨宽敞的享受。0000阿里云与 Salesforce 合作 推出阿里云 Salesforce CRM 平台
阿里云与Salesforce合作,在阿里云上正式推出了SalesforceCRM平台。阿里云将提供本地化的签约、账单管理等服务,并集成阿里云的产品和解决方案,如AI等能力,为客户带来更全面的体验。目前已有十多家领军企业客户,如拜耳、百济神州和EF等,开始使用阿里云上的Salesforce。双方合作还将持续深化和扩大,推动国内云计算SaaS化市场的发展。站长网2024-01-12 17:35:270000荣耀赵明:首款小折叠Flip手机今年推出
在最近的荣耀2024春季旗舰新品发布会后,荣耀CEO赵明接受了媒体的采访,并透露了一个令人期待的消息:荣耀计划在2024年推出一款小折叠的Flip产品。赵明在采访中详细阐述了荣耀对于这款小折叠产品的定位和期待。他表示,荣耀做小折叠产品将延续其一贯的价值主张和产品思维,致力于给行业带来与众不同的产品体验。荣耀始终注重创新和独特性,致力于为消费者提供真正有价值的产品。站长网2024-03-19 17:25:060000钉钉工作台支持「 AI 生成应用图标」 可快速更换风格
钉钉工作台宣布新增功能,支持AI生成应用图标,让用户可以快速更换工作台图标的风格。主要内容包括:支持AI批量生成图标:管理员可以在工作台设置中选择“生成图标”,然后按需选择合适的风格和颜色。共有5种风格,每种风格都有7种颜色。用户可以先预览效果,确认后生成所有图标,省时高效。同时还可以保留图标替换记录,可以随时恢复历史效果。站长网2024-03-12 08:47:590000