MLCommons推出新平台评估AI医疗模型
近年来,医疗行业积极拥抱人工智能,尤其在疫情的推动下。根据 Optum 的一项调查显示,80% 的医疗机构已经制定了人工智能战略,另有15% 计划启动相关项目。为满足需求,包括大型科技公司在内的供应商纷纷推出相关产品。
谷歌最近发布了 Med-PaLM2,这是一个用于回答医学问题和在医学文本中发现洞见的人工智能模型。此外,像 Hippocratic 和 OpenEvidence 等初创公司正在开发模型,为临床医生提供可操作的建议。
然而,随着越来越多针对医学应用的模型上市,了解哪些模型是否能够如广告所述地发挥作用变得越来越具有挑战性。由于医学模型往往是使用来自有限、狭窄的临床环境数据进行训练(例如东海岸的医院),一些模型对特定患者群体,通常是少数族裔群体,显示出偏见,导致在现实世界中产生有害影响。
为了建立一个可靠、可信赖的方法来评估和评价医疗模型,工程协会 MLCommons 开发了一个名为 MedPerf 的新型测试平台。MLCommons 表示,MedPerf 可以在 “多样化的真实医疗数据” 上评估人工智能模型,并保护患者隐私。
MedPerf 是由医疗工作组牵头进行的为期两年的合作成果,得到了行业和学术界的反馈,其中包括20多家公司和20多家学术机构的意见。与 MLCommons 的通用人工智能基准套件(如 MLPerf)不同,MedPerf 设计用于医疗模型的操作人员和客户,即医疗机构,而不是供应商。
通过 “联邦评估”,MedPerf 平台上的医院和诊所可以根据需要评估人工智能模型,并在现场进行评估。
MedPerf 支持流行的机器学习库,以及仅通过 API 提供的私有模型和模型,例如 Epic 和 Microsoft 的 Azure OpenAI Services。
今年早些时候,MedPerf 在一个系统测试中举办了由 NIH 资助的 Federated Tumor Segmentation (FeTS) Challenge,这是一个评估胶质母细胞瘤(一种侵袭性脑)术后治疗模型的大规模比较。MedPerf 今年支持了41个不同的模型的测试,这些模型在32个来自六个大洲的医疗机构的系统上运行,既有本地部署也有云端部署。
根据 MLCommons 的说法,所有模型在与训练数据的患者人口学特征不同的医疗机构中表现出了降低的性能,揭示了其中存在的偏见。
MLCommons 认为,MedPerf 目前主要用于评估放射学扫描分析模型,是实现其通过 “开放、中立和科学方法” 加速医疗人工智能的 “基础步骤”。它呼吁人工智能研究人员使用该平台验证自己的模型,并鼓励数据所有者注册其患者数据,以增加 MedPerf 测试的可靠性。
然而,这个平台是否真正解决了医疗人工智能领域中棘手的问题仍然值得商榷。杜克大学研究人员最近编写的一份报告揭示了人工智能营销和将技术应用于医生、护士及其周围复杂的医疗系统和技术系统的日常工作之间的巨大差距。往往情况并不仅仅是模型的问题,而是如何将技术融入到医疗工作中,包括设备的部署、互联网连接强度以及患者对人工智能辅助评估的反应。
医疗从业者对医疗人工智能持有复杂的观点。雅虎金融的一项调查发现,55% 的医护人员认为这项技术还不准备好使用,只有26% 的人认为可以信任。
这并不意味着医学模型偏见不是一个真正的问题,它确实存在并产生后果。例如,Epic 的系统用于识别败血症病例,但发现错过了许多病例,并经常发出误报。同时,对于不是谷歌或微软这样规模的组织来说,获得多样化、及时的医疗数据并非易事。
然而,将人们的健康问题过分依赖像 MedPerf 这样的平台是不明智的。毕竟,基准测试只能告诉我们故事的一部分。安全地部署医疗模型需要供应商及其客户进行持续、彻底的审计,更不用说研究人员了。缺乏此类测试是不负责任的行为。
NEC 探讨独自开发并提供支持图像和文字的生成式 AI 服务
日本NEC公司社长森田隆之日前表示,正在探讨独自开发能自动制作精巧文章及图像的生成式人工智能(AI),以新服务的形式提供给用户。目前计划用于回答用户的提问,并提供可靠的答案。森田在接受各媒体线上采访时做出了上述表示。森田表示:「我们会在适当的时候公布。希望大家期待。」他并没有明确公布新服务的推出时间。他指出,生成式AI「将对社会产生巨大的影响,相当于互联网问世时的情况。」站长网2023-06-08 06:55:090000过去电商卖灯泡一单50块,现在私域一单8-9万块
“雷士照明私域里做全屋光环境定制的客单价,平均一单在8-10万块钱,相比原来50-100块客单价,几乎是卖灯泡的两千倍。”2000倍。数字没有错。这是雷士照明CIO刘之瀚在企业微信与《哈佛商业评论》联手发起的“2023实干企业家峰会”现场分享时公开的数据。站长网2023-11-03 14:02:290000淘宝免单bug上热搜 有用户意外收到 51 元红包短信
今日,微博平台上关于“淘宝免单Bug”的话题迅速攀升至热搜榜前列。该事件源于今日中午12点左右,淘宝疑似出现系统漏洞,导致多名用户收到了神秘的“淘宝免单短信”。据用户反馈,这些短信中明确指出,用户当天在淘宝下单的商品已被免单处理,并且用户账户内已收到51元的免单红包。然而,截至发稿前,淘宝官方尚未就此事件作出任何官方回应。这一事件迅速在社交网络上引发广泛讨论。站长网2024-05-06 17:40:120000Adobe更新隐私条款 意味着有权将用户作品用于训练AI
划重点:🔍Adobe要求用户同意新使用条款,其中包括访问用户创作内容的权利。🔍设计师和艺术家的作品将失去隐私,可能被用于训练人工智能或内容审查。🔍更新后的Adobe隐私条款引发了用户对于设计工作隐私的担忧。站长网2024-06-06 20:58:050000自研认知大模型 理想汽车带来“一员”真正的家庭成员
快科技6月17日消息,理想汽车于今日举办首个家庭科技日”,期间,理想将公布首款电动MPV名字、最新的5C电池800V高压快充技术以及理想汽车最新AI感知,交互能力。理想官方介绍,除了用车之外,随着AI能力的提升,如今让理想汽车语音助手理想同学”真正变成家庭成员。站长网2023-06-18 23:41:040000