【新智元导读】医疗AI的门槛如此高,怎么克服关键痛点?这家互联网医疗公司深耕9年,终于推出国内首个医疗范畴大言语模型MedGPT。

ChatGPT带火了大模型之后,全世界大厂都卷了起来。

强壮的言语理解才能、生成才能、逻辑推理才能,让大模型在医疗范畴大有可为。

是的,硅谷巨子们早已意识到,GPT在医疗范畴的无限潜力。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

早在今年2月,ChatGPT在美国医学执照考试中,以60%准确度的答复,现已挨近真人医师。

话虽如此,但只需深入调查这个职业就会发现,现在市面上实在能够投入使用的医疗大模型,还寥寥无几。

原因就在于,医疗AI的门槛适当之高,在这个交叉范畴要想成功做出产品,既要懂医疗,又要懂技能。

国内的医疗大模型之路该怎么走?让咱们先看看国外大厂的开展路线。

硅谷巨子,纷繁入局医疗GPT

当时,大型言语模型的开展,现已有满足的潜力给医疗保健整个职业带去愈加深远、广泛的变革。

比方,长途问诊功率、准确度提高,简化医疗文档,乃至还能够协助医疗人员削减工作量提高功率。

GPT-4、PALM 2作为当时最先进的言语模型,微软、谷歌等硅谷巨子必定将它的才能拓宽到医疗范畴。

上个月,微软和Epic Systems宣布,将GPT-4引入医疗保健范畴,用于医护人员对患者的音讯回复,剖析医疗记录,以及寻找新的趋势。

别的,今年夏天,微软和Nuance将把GPT-4引入医疗保健文档技能。微软称,整合后GPT-4提⾼了AI模型的全体准确性,但没有泄漏准确率。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

此外,谷歌曩昔几年里也一直在探究怎么用AI来改进医疗保健,比方协助早期发现疾病,扩展医疗服务范围等等。

刚刚曩昔的谷歌I/O大会上,谷歌在医疗范畴的微调模型Med-PaLM也升级到了第二代。

值得一提的是,Med-PaLM 2一出手,就成为首个在USMLE(美国医师执照考试)上到达「专家」水平的模型,得分为85.4%。

乃至,它比迭代之前的Med-PaLM功能提高了18%,远超同类AI模型。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

那么,现在通用的大言语模型,在答复医学问题方面体现怎样呢?咱们来实测一下。

MedPaLM的体现很专业,可是,假如从使用场景看,MedPaLM还没有那么高的实用性,由于它首要还是以做题为主。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

要说答复问题,那当然少不了当红大模型ChatGPT。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

能够看到,它的答复就比较中规中矩,没有太多惊喜。

而一旦给它上点难度,问一道国家执业医师资格考试真题,它就寄了……

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家
国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

可见,相似ChatGPT这样的通用类LLM,高度依靠文本计算概率生成答案,因而答复的准确性无法确保。

可是,在医疗使用场景中,准确性和一致性是底线,绝不能出错。

笔直医疗大模型,难在哪?

从谷歌和微软做医疗大模型的开展路线,能够看到,要想让LLM在医疗范畴充分发挥才能,有一些关键的难点。

1. 数据孤岛

首先,最致命的难点便是,笔直范畴的大模型,怎么突破数据「卡点」?

而笔直医疗范畴AI大模型,只重视医疗这个特定的范畴或者场景。它能够使用医疗的数据和常识,提供更精准和高效的解决方案。

可是现实是,整个医疗服务的数据信息碎片化,还有的被严重分割,医疗数据异构性、难流转。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

一方面,不同医疗机构采用不同的体系,每个体系标准不一,因而缺少一致化的数据格式,或交互界面。

另一方面,医疗数据较为灵敏与特别。为更好的维护患者隐私,大多数医院不会为利益交出数据,乃至将数据库只接入局域网。

再加上,患者差异、疾病繁复、医护人员经历识别差异,都导致数据的不完整、不一致。

由此可见,医疗数据具有一定的门槛,而且业内没有一致的的数据标准,都将是练习更专的垂类模型的拦路虎。

2. 复合型人才稀缺

值得注意的是,关于「AI+医疗」这一专业性极强的交叉范畴,对复合型人才的需求极大。

医疗专业的常识本身十分精细,再加上与算法的深度交融,AI医疗这一高精尖技能,对人才归纳才能要求甚高。

3. 职业标准难一致

除了以上两点,在许多涌入AI医疗的企业中,AI+医疗标准缺失也是一大痛点。

而在医疗范畴中,最重要的便是准确度,不然可能会给数百万患者带来风险。

现在,还没有一致的职业标准能证明AI医疗的有用性,怎么确保实在的对患者成果负责就成为了职业中的难点。

总而言之,在医疗这一特别范畴,假如没有打通这些痛点,并不是每个大模型的玩家都能玩转的。

国内首款医疗大模型MedGPT

据媒体报道,昨日医联正式发布了国内首个医疗范畴自研大言语模型——MedGPT。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

具体来说,MedGPT根据Transformer架构,现在参数规模为1000亿,可支持医疗场景下的多模态输入和输出。

其间,预练习阶段使⽤了超越20亿的医学文本数据,微调练习阶段使⽤了800万条的高质量结构化临床医治数据,并投入超越100名医⽣参加⼈⼯反馈监督微调练习。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

还记得ChatGPT一上来「翻车」了的问题吗?

MedGPT秒秒钟就给出了正确答案,而且还配上了每个选项的详尽剖析。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家
国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

上下滑动查看全部

在经典的医学应试才能评测上,MedGPT顺利过关。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

不只如此,MedGTP的创新之处在于,它不再是简略的AI问答,而是以「治愈」为目的完成有用问诊。

值得注意的是,MedGTP不只整合了1000+多模态才能,具有强壮的技能途径,而且还成功完成了许多初次突破。

– 初次突破了AI医师无法与实在患者接连自由对话的难点。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

– 初次开出检验查看单,初次由AI给出准确确诊与医治方案。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

– 初次使用多种医学多模态,初次打通从问诊到医学查看的流程。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

– 初次与医联互联网医院打通,完成药品到家的医治闭环。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

为了确保确诊的准确率,MedGPT采用了一致性校验机制。

也便是说,MedGPT在为患者输出正式答案之前,会先通过临床医学规则器的校验,确保医学的准确性。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

这个医学专家体系,采用了一个多维度的医治准确性评测体系,从多方面来剖析与评测MedGPT在医治全过程中的一致性与准确性。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

当然,用机器去判断仍然是不行的,这个过程中,还有一个根据专家评议的实在世界医师一致性对标机制。

医联团队会招募实在的医师坐在电脑进行确诊,然后把MedGPT和实在医师的成果交由专家委员会评议,将MedGPT的水平对标实在医师。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

有了这样一套完整的体系,咱们得到的也就不再是一个做题家,而是实在能帮患者看病的AI。

为了验证MedGTP全流程疾病医治的才能,团队通过实在患者的脱敏病例,对医治过程进行了模拟。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

相比于上一代产品给患者「查常识库」的感觉,通用型LLM ChatGPT急于给结论的体现,以及实在医师在线问诊会卡在查看这一步的问题,MedGTP在这些方面都有了改进。

它会通过多轮问诊引导,收集满足完善的确诊决议计划因子,满足按部就班。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

在医联专家的要求下,它有必要搜集到满足的决议计划因子,才能给患者建议。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

之后,MedGPT还会持续查看、医治、恢复的过程。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

据计算,在第一阶段测验532名院内复诊患者病案中,MedGPT确诊的吻合率超越了97.5%,掩盖了3000种疾病的全科首诊才能。

缺少职业标准,何以强大并持续开展

标准缺失意味着职业约束和标准的缺失,意味着无法一致标准,也不会被市场所认可。而医疗职业的准确性和⼀致性是医疗底线。

作为致力于疾病全流程医治的医疗专业大言语模型,医联MedGPT形成了一套独有的「DIAE」医疗AI建设方法论,分别从Disease(病种掩盖)、Intelligence(智能化)、Accuracy(准确性)、Efficiency(就医功率)四个维度来建设与打磨产品,不断提高MedGPT的实践医疗使用价值。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

D:Disease,也便是疾病的掩盖范围

现在医联 MedGPT 现已能够掩盖ICD10的60%疾病病种,并在近期将研制重心歪斜在多发疾病,以提高数字医院的普惠率。估计在2023年末,能够掩盖80%病种的就诊需求。

I:Intelligence,也便是智能化和数字化的程度

在医治疾病时,会有诊前、诊中、诊后不同的环节。其间,每个大的环节里还有许多小的环节。比方,诊前就包含了防备、筛查、科普、分诊、导诊等。

在此之前,医联现已在整个场景下做了一些多模态插件的使用,现在则能够使用大言语模型把它们都整合起来。

A:Accuracy,也便是医治的准确性

准确性关于疾病的医治来说尤为重要,而医联在这一方面也做了许多的工作。

比方,医联不只有一整套的测验集和专家体系,而且还会让医师在问诊时直接参加进去,使用根据人类反馈的强化学习,不停地对模型进行调试。

E:Efficiency,也便是就医功率(首要包含时刻维度和本钱维度)

举个例子,关于一次问询来说,假如跟线下的医师只用了10分钟,而跟AI医师要聊半个小时,那就说明这个AI的功率很低。

9年深耕,终获突破

现如今,大言语模型技能正处于飞速开展阶段,医疗职业也势必因而而发生巨大的变化。而技能的开展需要与工业进行深度交融,才能释放技能带来的盈利。

而医联能够成为国内首个推出医疗范畴大言语模型的公司,绝非偶尔。

2021年,医联成立了互联网医疗职业首个学术委员会,并与多个疾病病种范畴的专家一起拟定线上疾病办理SOP。

截至现在,共打造了140多个疾病办理SOP,掩盖1000多个病种,并形成了一套全数字化的、掩盖防备、确诊、医治、恢复全流程的线上疾病办理途径。

据了解,医联成立九年以来,现已积累了150万+注册医师与2000万患者,而且凭借着长时间的互动,沉积出了许多有价值的数据。

而这些也为今日医联MedGPT的推出奠定了十分厚实的医疗与数字才能根底。

国内首个医疗大语言模型问世!多模态打通诊疗全流程,别再叫我做题家

最后,医联MedGPT项目负责人王磊呼吁,业内AI科技、医学、院校机构、医疗多模态使用等各种类型的合作伙伴,一起开发建设通用型人工智能技能的医疗应⽤场景为医疗职业的技能开展贡献力量。

参考资料:

mp.weixin.qq.com/s/SGUqr_4-R…