Hugging Face 发布医疗任务评估基准Open Medical-LLM

站长网2024-04-19 11:44:570阅

划重点:

⭐️ Hugging Face 发布了一个新的医疗任务评估基准，旨在测试生成式人工智能模型在健康相关任务上的表现。

⭐️ Open Medical-LLM 基准由现有测试集拼接而成，涵盖多个医学领域，如解剖学、药理学、遗传学和临床实践。

⭐️ 一些医学专家对 Open Medical-LLM 提出了警告，强调实际临床实践与医学问题回答之间存在较大差距，强调基准测试结果不能替代真实世界测试。

近期，Hugging Face 发布了一项名为 Open Medical-LLM 的新基准测试，旨在评估生成式人工智能模型在健康相关任务上的表现。

该基准由 Hugging Face 与非营利组织 Open Life Science AI 和爱丁堡大学自然语言处理小组的研究人员合作创建。Open Medical-LLM 的目标是标准化评估生成式人工智能模型在一系列医学相关任务上的性能。

Open Medical-LLM 并非从零开始的基准测试，而是由现有测试集（如 MedQA、PubMedQA、MedMCQA 等）拼接而成，涵盖多个医学领域，如解剖学、药理学、遗传学和临床实践。基准测试包含多项选择和开放性问题，需要医学推理和理解，涵盖了美国和印度的医学执照考试以及大学生物学测试题库的内容。

尽管 Hugging Face 将该基准视为医疗界生成式人工智能模型的 “健全评估”，但一些医学专家在社交媒体上对 Open Medical-LLM 提出了警告，指出实际临床实践与医学问题回答之间存在较大差距。他们强调，基准测试结果不能替代在真实世界条件下的仔细测试。

对此，Hugging Face 的研究科学家克莱门汀・弗里尔（Clémentine Fourrier）在社交媒体上表示，这些排行榜只能作为探索特定用例的第一近似值，但实际上需要进行更深入的测试阶段，以检查模型在真实条件下的局限性和相关性。她指出，医学模型绝不能单独由患者使用，而应该被训练成为医生的支持工具。

尽管 Open Medical-LLM 等基准测试具有一定的参考意义，但结果排行榜也反映出模型在回答基本健康问题时表现不佳。然而，Open Medical-LLM 和其他任何基准测试都不能替代经过深思熟虑的真实世界测试。例如，谷歌曾试图将用于糖尿病视网膜病变筛查的人工智能工具引入泰国的医疗系统，但尽管理论上准确度很高，该工具在实际测试中却表现不佳，导致患者和护士对其结果的不一致性感到沮丧，与实际临床实践缺乏协调性。

至今，美国食品药品监督管理局已批准的139个与人工智能相关的医疗设备中，没有一个使用生成式人工智能。测试生成式人工智能工具在实验室中的性能如何转化为医院和门诊诊所的实际情况，以及这些结果可能随时间变化的趋势，都是异常困难的。

官方博客:https://huggingface.co/blog/leaderboard-medicalllm

HuggingFace发布医疗任务评估基准OpenMedicalLLM

0000

评论列表

共(0)条

相关推荐

站长资讯
QQ音乐豪华绿钻续费价格上调续包月上涨至15元
近日，QQ音乐官方发布公告称，将对QQ音乐存量自动续费会员价格进行调整，具体调整为连续包月上涨至15元，包季上涨至45元，包年上涨至158元。据网友晒出的续费变更提醒，这次的调价将于今年7月4日0点开始执行。
站长网2023-06-05 19:58:19
0000
站长资讯
健身平台Keep登陆港股上市首日高开近5%
今日，运动科技公司keep正式在港股上市，首日高开近5%，报30.3港元。根据此前公司公告，Keep计划全球发售1083.9万股，其中国际发售975.5万股，占比九成;公开发售108.4万股，另有15%的超额配股权。IPO股票发行价为每股28.92港元，将净筹资1.92亿港元。
站长网2023-07-12 17:26:06
0001
站长资讯
老虎证券推出使用 OpenAI 技术的 AI 投资助手 TigerGPT：用户可登记轮候试用
互联网券商老虎证券宣布推出人工智能（AI）投资助手——TigerGPT，这是运用老虎国际的金融数据库及OpenAI技术开发的文本生成式AI聊天机器人，将内置于其交易平台TIGerTrade。老虎证券表示，TigerGPT目前正处于用户测试阶段，会邀请指定市场的用户参与，用户可登记进入轮候名单。
站长网2023-04-12 14:44:25
0000
站长资讯
vivo OriginOS 4公测适配计划公布：12月开启
今日，vivo公布OriginOS4公测适配计划，将由vivoX100、iQOO12首发搭载。具体时间和机型如下：2023年12月底第一批：vivoXFold2、vivoXFlip、vivoX90Pro、vivoX90Pro、vivoX90、vivoX90s、iQOO11Pro、iQOO11S、iQOO112024年1月底第二批：
站长网2023-11-01 13:52:39
0000
站长资讯
小米14 Ultra外观公布并开启预约：可享24期免息等福利
随着龙年的到来，小米带来了其龙年首款影像机皇——小米14Ultra，并宣布即将在天猫小米官方旗舰店开启预约。这款备受期待的新机不仅带来了强大的影像功能，还为用户准备了丰富的预定福利，包括限时赠送399元小米尊享礼盒、24期免息、以旧换新至高补贴1500元以及延保碎屏保5折等优惠。据悉，小米14Ultra将于2月22日19点发布。
站长网2024-02-18 11:30:29
0000