微软通过提示工程将GPT-4变成医学专家,首次准确率超90%
要点:
微软通过「提示工程」将GPT-4成功转化为医学专家,使用最新提示策略Medprompt在医疗专业领域取得了超过90%的准确率,首次超越其他高度微调的模型。
Medprompt是一个多种提示策略的组合,包括动态少样本选择、自生成思维链和选项洗牌集成,使GPT-4能够在医学领域表现出色,并且该方法具有通用性,可推广到其他专业领域。
在测试中,GPT-4结合Medprompt在MultiMed QA九个基准数据集中均取得最高分,平均准确率达到了91.3%。研究人员还进行了消融实验,发现自动生成思维链对性能提升的贡献最大。
近期微软的研究成果展示了通过「提示工程」成功将GPT-4转化为医学专家的威力。在医学专业领域,GPT-4使用最新提示策略Medprompt在MultiMed QA九个测试集中取得了超过90%的准确率,首次超越其他高度微调的模型,如BioGPT和Med-PaLM。
Medprompt是一个由动态少样本选择、自生成思维链和选项洗牌集成等多种提示策略组成的综合体,使GPT-4能够在医学领域表现出色,同时也具有通用性,可以推广到电气工程、机器学习、法律等专业中。

论文地址:https://arxiv.org/pdf/2311.16452.pdf
其中,动态少样本选择利用训练数据作为少样本示例的来源,通过向量相似度从训练集中选择最相似的样本,避免了对模型参数进行大量更新。
自生成思维链通过要求GPT-4使用特定提示生成思维链,实现了逐步思考和推理,从而提高了模型的细粒度逻辑。选项洗牌集成解决了在选择题中可能存在的位置偏差问题,通过打乱选项顺序并进行多轮预测,最终选择最一致、正确的选项。
在测试中,GPT-4结合Medprompt在MultiMed QA九个基准数据集中表现出色,优于其他微调方法。消融实验进一步验证了Medprompt各组件对整体性能的贡献,其中自动生成思维链步骤对性能提升的贡献最大。
此外,研究人员还探索了Medprompt的跨域泛化能力,发现其在不同领域的数据集上同样取得了显著的提升。这一研究成果引发了广泛关注,被认为是一项能够改变行业的技术。目前我们仍未触及提示的极限,也未达到微调的极限,为未来研究和发展提供了更多的探索空间。
LARP:开放世界游戏的语言代理角色扮演
LARP是一个开创性的框架,旨在增强用户和语言代理在开放世界游戏中的交互。LARP框架包括了一个涵盖记忆处理和决策辅助功能的认知架构,一个具有反馈驱动可学习行动空间的环境交互模块,以及促进各种个性对齐的后处理方法。这一框架的引入优化了用户与预定义具有独特背景和个性特征的代理之间的互动,最终增强了在开放世界情景中进行游戏体验。站长网2024-01-02 10:19:280000百度将举办Create AI开发者大会 AI芯片昆仑等多项成果将亮相
百度宣布百度CreateAI开发者大会已正式定档于2024年4月16日至17日,在深圳国际会展中心(宝安)隆重举办。届时,百度创始人、董事长兼CEO李彦宏将发表主题演讲,展示最新的百度AI技术突破,并分享对未来趋势的独到见解。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-02-05 15:23:420001AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;钉钉 AI 魔法棒正式上线;马斯克𝕏AI团队首批产品曝光
🤖📱💼AI应用Gen-2史诗级更新允许用户通过简单文本生成4K高清视频Runway的AI视频生成工具Gen-2经历了一次重大更新,允许用户通过简单的文本输入来生成4K高清视频,彻底改变了创意软件的方式。Gen-2体验地址:https://research.runwayml.com/gen2【AiBase提要:】站长网2023-11-03 15:18:2900006款产品总流水过亿、出海厂商上榜,谁在领跑混合休闲赛道?
给流量大的超休玩法调控数值保证留存,再配上一套IAP系统拉高流水做混合变现,由此“改造”出一款混合休闲产品,是2024年全球手游市场的一大现象,不少原来的超休大厂凭借这套操作,拿下了不错的成绩。最近Rollic又沿用这种模式,跑出了一款产品、爬上了美国iOS手游畅销榜。0000英伟达RTX Remix modders推出对应Comfyui节点 可对游戏资产放大和重绘
英伟达的RTXRemixmodders最近推出了与Comfyui兼容的新节点,这标志着游戏模组制作和资源增强方面的一大进步。通过这个新节点,模组制作者现在可以直接在Comfyui界面中对已有的游戏资产进行放大和重新绘制,这大大简化了游戏资源的编辑和升级过程。站长网2024-06-05 15:41:180001