当前位置: 主页 > 要闻 > 详情
医联发布医疗大语言模型 MedGPT,AI 要如何具备全流程的诊疗能力?-全球热文

来源36氪   2023-05-26 11:23:55

5 月 25 日,医联正式发布了自主研发的基于 Transformer 架构的医疗大语言模型—— MedGPT。与通用型的大语言模型产品不同,MedGPT 主要想在真实医疗场景中发挥实际诊疗价值,实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。

据医联 MedGPT 项目负责人王磊介绍:通用大语言模型在面对医学问题的准确性上存在天然缺陷,在问诊阶段,通用大语言模型往往会轻易给出结论,但对于医疗应用来说,一致性和准确性是底线问题

医联 MedGPT 项目负责人王磊

为此,MedGPT 不会轻易给出诊断结论,而是会循序渐进通过多轮问诊引导患者收集足够的诊断决策因之后再进到诊断环节,从而保证有效诊断。" 我们会要求大模型收集很多决策因子,决策因子的分类包括整个症状类、病史类、检验检查类,它必须收集到关键数据或决策因子,才能引导患者或者给出患者下一个站点的建议,譬如让他开检验检测项目或者给到一个诊断建议。


(相关资料图)

实现上述目标的前提是,医联 MedGPT 设计了一套监督机制——通过将然语模型 AI 技术与系列程调优技术以及医学致性校验技术相结合,并在模型微调训练阶段采量真实医参与的 RLHF(Reinforcement Learning from Human Feedback)监督微调,提升模型的疾病特征判断与模式识别能," 如果是符合预期的就输出,如果没有符合预期的话会让它重新作答 ",确保医疗准确性。

医联还建立了基于专家评议的 AI 诊疗准确性与真实世界医对标测试机制,不断将 AI 与真实诊疗场景对齐,最终实现准确诊断。

不过有了疑似诊断后,如果没有足够多的检测信息,问诊则不能继续。为解决这个问题,王磊指出,MedGPT 基于 Transformer 架构整合了市面上很多医学检验检查的多模态能力,在问诊环节结束之后,MedGPT 会给患者开具必要的医学检查项目以进一步明确病情,患者则可以通过医联云检验等多模态能力进行检查,基于上述问诊和医学检查数据,MedGPT 进行后续疾病诊断并为患者设计疾病治疗方案。

紧接着,患者可以通过医联互联网医院实现送药到家,"但开药不是闭环、治愈才是目的",MedGPT 会在患者收到药品后为患者进行用药指导与管理、智能随访复诊、康复指导等智能化疾病诊疗动作,形成从预防、诊断、治疗、康复的全流程诊疗能力。

" 举例子来说,无创类和微创类的可以在家搞定,譬如用一些智能设备做指尖血采集、尿液检测、唾液检测等;还有对样本量要求比较高的,可以通过医联的 " 云检验 ",让医生上门采血或引导用户去社区检测点开展;还有影像类检查,我们会有自己的多模态供应商会开着影像检验车到楼下,让患者可以下楼在车上做影像检查,将结果都会回传系统。如果我们如果整合足够多的多模态能力,患者可以尽量不用去医院了,这也是我们想解决的一个问题。"

王磊透露,医联 MedGPT plugin 应用平台目前可以整合 1000+ 医疗多模态能力,可以包括以下几个维度:

首先,接入数字疗法,譬如儿童注意力数字疗法提升方案;

其次,第三方的插件,譬如腾讯觅影、阿里云图像识别和皮肤病识别的插件,从而具备影像阅读和报告解读能力,并给出一些治疗相关建议。

另外,康复类的多模态训练,譬如医联自己做的骨科 DTS,会有一些握拳、腕关节伸曲的治疗方案,帮助做骨科康复的健康管理。

未来,开放第三方插件应用商店,整合足够多的第三方医疗的多模态应用。

医联 MedGPT plugin 多模态插件应用商店

据介绍,目前医联 MedGPT 形成了一套「DIAE」医疗 AI 建设方法论,分别从 Disease(病种覆盖)、Intelligence(智能化)、Accuracy(准确性)、Efficiency(就医效率)四个维度来建设与打磨产品,不断提升 MedGPT 的实际医疗应用价值。

据了解,医联最早在 "AI 医生 " 领域的布局可以追溯到 2017 年,当时和大型医疗机构合作开展了大量的数据清洗工作,具备了医疗数据结构化的能力;2018 年用了很多技术譬如 NLP 和知识图谱技术,并有一些相关产出,譬如智能检测设备、智能分诊、口腔影像识别、智能医助等医疗 AI 类产品,但这些产品没有完全用起来的;2019 年思路发生改变,开始针对于单病种分阶段预防 - 诊断 - 治疗 - 康复,每个阶段建立以单病种为轴心的 AI 诊疗模型;2021 年又初步形成了一套按病种划分的基于互联网医院的 AI 诊疗系统等。

" 这些经历让我们在整个医疗数据和技术上一定沉淀。但这些产品始终无法实现很顺滑的全流程 AI 诊疗体验,无法单独拿出来使用,一定要有医生或者医助坐在系统后面‘指指点点’,直到 Transformer 架构大语言模型技术出现。"

王磊介绍道,医联 MedGPT 目前的参数规模为 100B 规模,预训练阶段使了超过 20 亿的医学文本数据,微调训练阶段使了 800 万条的结构化临床诊疗数据,并投超过 100 名医参与反馈监督微调训练。目前医联 MedGPT 已经可以覆盖 ICD10 的 60% 疾病病种,并在近期将研发重心倾斜在多发疾病,以提升数字医院的普惠率;预计在 2023 年底可以覆盖 80% 病种的就诊需求;计划在 2024 年突破 600 个病种," 大概可以覆盖 90% 的患者需求 "。

不过,大语言模型发布要严格遵守国家政策,尤其是医疗类的,医联 MedGPT 目前仅用于学术的研究。王磊表示,为了尽快推动其落地,医联正努力和医学领域的大专家一起推动建立 AI 诊疗标准的建设;另外,公司年底会启动相应的临床试验,会提前招募大量的患者。

医联发出合作倡议,招募 AI 科技、医学、院校机构、医疗多模态应等各种类型的合作伙伴, 共同开发建设通型智能技术的医疗应用场景。(有兴趣的可以发送合作申请至邮箱:wanglei@medlinker.com)