Hugging Face 发布医疗任务评估基准Open Medical-LLM
划重点:
⭐️ Hugging Face 发布了一个新的医疗任务评估基准,旨在测试生成式人工智能模型在健康相关任务上的表现。
⭐️ Open Medical-LLM 基准由现有测试集拼接而成,涵盖多个医学领域,如解剖学、药理学、遗传学和临床实践。
⭐️ 一些医学专家对 Open Medical-LLM 提出了警告,强调实际临床实践与医学问题回答之间存在较大差距,强调基准测试结果不能替代真实世界测试。
近期,Hugging Face 发布了一项名为 Open Medical-LLM 的新基准测试,旨在评估生成式人工智能模型在健康相关任务上的表现。
该基准由 Hugging Face 与非营利组织 Open Life Science AI 和爱丁堡大学自然语言处理小组的研究人员合作创建。Open Medical-LLM 的目标是标准化评估生成式人工智能模型在一系列医学相关任务上的性能。
Open Medical-LLM 并非从零开始的基准测试,而是由现有测试集(如 MedQA、PubMedQA、MedMCQA 等)拼接而成,涵盖多个医学领域,如解剖学、药理学、遗传学和临床实践。基准测试包含多项选择和开放性问题,需要医学推理和理解,涵盖了美国和印度的医学执照考试以及大学生物学测试题库的内容。
尽管 Hugging Face 将该基准视为医疗界生成式人工智能模型的 “健全评估”,但一些医学专家在社交媒体上对 Open Medical-LLM 提出了警告,指出实际临床实践与医学问题回答之间存在较大差距。他们强调,基准测试结果不能替代在真实世界条件下的仔细测试。
对此,Hugging Face 的研究科学家克莱门汀・弗里尔(Clémentine Fourrier)在社交媒体上表示,这些排行榜只能作为探索特定用例的第一近似值,但实际上需要进行更深入的测试阶段,以检查模型在真实条件下的局限性和相关性。她指出,医学模型绝不能单独由患者使用,而应该被训练成为医生的支持工具。
尽管 Open Medical-LLM 等基准测试具有一定的参考意义,但结果排行榜也反映出模型在回答基本健康问题时表现不佳。然而,Open Medical-LLM 和其他任何基准测试都不能替代经过深思熟虑的真实世界测试。例如,谷歌曾试图将用于糖尿病视网膜病变筛查的人工智能工具引入泰国的医疗系统,但尽管理论上准确度很高,该工具在实际测试中却表现不佳,导致患者和护士对其结果的不一致性感到沮丧,与实际临床实践缺乏协调性。
至今,美国食品药品监督管理局已批准的139个与人工智能相关的医疗设备中,没有一个使用生成式人工智能。测试生成式人工智能工具在实验室中的性能如何转化为医院和门诊诊所的实际情况,以及这些结果可能随时间变化的趋势,都是异常困难的。
官方博客:https://huggingface.co/blog/leaderboard-medicalllm
ChatGPT加剧恐慌?4成AIoT开发者认为AI会产生意识 | 中国AIoT开发者报告正式发布
据国际数据公司IDC预测,到2025年,全球IoT连接的设备数量将达到519亿,其中中国将达到80亿。尽管相较之前,近两年IoT的讨论热度有所消减,但并没有影响到在产业界的持续布局。站长网2023-04-19 09:45:100001微信小店到底要做什么?
微信正式进入微信小店时代。11月25日,视频号小店升级至微信小店的节奏进一步提速,商家需升级后才可继续经营。此前的8月25日,视频号小店正式升级为微信小店,进一步打通公众号、视频号、搜一搜、小程序等场景;9月,微信小店客服工具上线,10月,微信小店助手APP上线。在外界眼中,微信在带货领域的动作慢,进攻性不足。微信小店的出现,以及近期密集上线新功能,可视作微信加快交易布局的重要动作。0000文字生成视频AI初创公司Runway再融资1.41亿美元
Runway是一家热门的生成式人工智能初创公司,其文本到图像视频工具备受关注。日前,该公司宣布进行了一轮新的融资,从谷歌、英伟达和SalesforceVentures等投资者那里获得了1.41亿美元的C轮融资。该公司表示,将利用这笔新的融资“进一步扩大内部的研究工作、扩充世界一流的团队,并继续将最先进的多模态人工智能系统推向市场,同时构建突破性且直观的产品体验。”站长网2023-06-30 19:36:030000完胜GPT-4,秒杀闭源模型!Code Llama神秘版本曝光
发布仅2天,CodeLlama再次引爆AI编码的变革。还记得Meta在CodeLlama论文中出现的能够全面持平GPT-4的神秘版本UnnaturalCodeLlama吗?大佬Sebastian在自己博客里做出解释:是使用了1万5千条非自然语言指令对CodeLlama-Python34B进行微调之后的版本。站长网2023-08-28 09:39:1400002024财富缩水最多的5位亿万富豪:拼多多创始人黄峥上榜 今年夏天还是中国首富
快科技12月25日消息,今日,福布斯发布2024财富缩水最多的5位亿万富豪,其中1位来自中国拼多多创始人黄峥上榜。在线零售商Temu母公司拼多多创始人、前董事长黄峥在今年夏天曾是中国首富。然而,自8月以来,由于第二季度收益未达预期,拼多多股价骤降31%,黄峥因此失去了中国首富的头衔。截至年底,他的财富比年初缩水了153亿美元,以360亿美元的财富值位列中国富豪榜第四名。0000