首页站长资讯复旦大学团队发布中文医疗健康个人助手DISC-MedLLM 单轮问答和多轮对话均表现亮眼

复旦大学团队发布中文医疗健康个人助手DISC-MedLLM 单轮问答和多轮对话均表现亮眼

站长网2023-09-01 15:13:190阅

复旦大学数据智能与社会计算实验室（FudanDISC）发布了中文医疗健康个人助手DISC-MedLLM。该模型在单轮问答和多轮对话的医疗健康咨询评测中表现出色，相比已有医学对话模型具有明显优势。课题组同时公开了包含47万高质量监督微调样本的DISC-Med-SFT数据集，以及模型参数和技术报告。

DISC-MedLLM的三大特点:

1）可靠丰富的专业知识，基于医学知识图谱采样获得;

2）多轮对话的问询能力，基于真实咨询对话重建;

3）对齐人类偏好的回复，通过筛选生成高质量小样本指导模型。DISC-Med-SFT数据集利用通用大模型的语言能力，围绕这三个方面进行针对性强化。

主页地址:https://med.fudan-disc.com

Github 地址:https://github.com/FudanDISC/DISC-MedLLM

技术报告:https://arxiv.org/abs/2308.14346

研究团队采用两阶段训练方法。第一阶段使用MedDialog、cMedQA2等数据集进行监督微调，同时加入通用数据集增强语言表达能力。第二阶段使用行为偏好小样本数据集进行微调，进一步提高模型表现。

在单轮问答评测中，DISC-MedLLM在零样本设置下表现强劲，在小样本设置下仅次于GPT-3.5，优于专业医学问答模型HuatuoGPT。在多轮对话评测中，研究团队采用多种策略构建高质量的DISC-Med-SFT数据集:

1）重构AI医患对话。从MedDialog和cMedQA2中抽取样本，使用GPT-3.5重构对话，调整回复风格使其符合AI助手。

2）知识图谱问答。基于医学知识图谱CMeKG进行三元组采样，生成专业医学问答样本。

3）行为偏好样本。人工筛选MedDialog和cMedQA2中的高质量样本，使用GPT-3.5生成符合人类行为偏好的样本。

4）通用数据。加入通用数据集样本，增强模型基础语言能力。

5）问答样本。使用英文医学问答数据集生成中文医学问答样本。

研究人员计算真实咨询分布，以此指导样本构造，并利用回路和人在回路两种思路生成样本，使数据集质量和多样性显著提高。

DISC-MedLLM弥补了现有模型在医疗知识、对话技能和人类偏好方面的不足，展示了构建高质量领域特定数据集以及数据集驱动方法培训专业对话模型的有效性。

复旦大学团队发布中文医疗健康个人助手DISCMedLLM单轮问答和多轮对话均表现亮眼

0000

评论列表

共(0)条

相关推荐

站长资讯
Apple Vision Pro将采用SK海力士提供的定制低延迟DRAM芯片
据《韩国先驱报》报道，AppleVisionPro头戴式设备将使用一种新型的动态随机存取存储器，或DRAM，这种存储器是为了支持Apple的R1输入处理芯片而定制设计的。AppleVisionPro由两颗芯片驱动。主处理器是M2，负责处理内容，运行visionOS操作系统，执行计算机视觉算法，和提供图形内容。
站长网2023-07-12 14:30:24
0000
站长资讯
索尼本田移动与微软合作开发 Afeela 汽车人工智能
据报道，索尼正在与本田合作推出名为Afeela的电动汽车，计划于2025年首次亮相。同时，索尼在发布会上宣布，正在与微软合作开发人工智能和其他技术，以应对汽车行业的变革，为Afeela汽车的推出做好准备。索尼的川西泉在CES几年前首次宣布Afeela车型以来展示了该车的进展。在CES2024的舞台上，川西泉使用PlayStation5游戏控制器将Afeela车辆带上了舞台。
站长网2024-01-09 15:15:10
0000
苹果与新闻出版机构谈判，寻求利用其内容开发生成式 AI 系统
据《纽约时报》报道，四位熟悉谈判的人士透露，苹果公司近几周已经开始与主要新闻和出版机构进行谈判，旨在获得使用其材料以开发生成式人工智能（AI）系统的权限。这些知情人士表示，苹果提出了价值至少5000万美元的多年期协议，以获得新闻文章档案的授权。由于谈判敏感性，这些人士选择匿名讨论。苹果联系的新闻机构包括CondéNast（出版《Vogue》和《纽约客》）、NBC新闻和IAC。
站长网站长资讯2023-12-25 09:23:55
0000
站长资讯
苹果 iCloud 存储服务价格上涨：上调幅度约 25% 涵盖多个地区
站长之家(ChinaZ.com)6月28日消息:苹果已经在包括英国、斯堪的纳维亚半岛、东欧、中东和南美在内的多个地区提高了iCloud存储的价格。图片来自Apple
站长网2023-06-29 23:46:34
0001
站长资讯
英伟达3个月卖出800吨H100！老黄竟自曝万亿GPU霸主「三无」策略
【新智元导读】有分析公司算出来，才三个月英伟达就卖出了800多吨H100。然而市值已超万亿的英伟达，竟是一个「无计划、无汇报、无层级」的公司。仅在今年第二季度，英伟达就已经卖出了816吨H100!假如这个速度不变，它有望在今年卖出3，266吨H100。并且，在接下来的每年里，英伟达都会卖出120万张H100。
站长网2023-09-18 18:08:12
0000