国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”
每经记者(zhě) 林姿辰 每(měi)经编辑 张海妮
距(jù)离谷歌(gē)大模型(MedPaLM 2)拿下美国医学 执照考试已经快两年了,人工智能(AI)够资格成为(wèi)临床医生 的(de)“假想敌”了吗?
今年7月,一篇发表于Nature Medicine的论(lùn)文显示,即(jí)使是目(mù)前最先进(jìn)的大语言模型(LLM)也无法(fǎ)为所有患者作出准确诊断,且诊(zhěn)断(duàn)正(zhèng)确率(73%)明显差(chà)于人类医生(89%);在极端情况(胆囊 炎(yán)诊断)下,LLM的正确率仅为13%。
但(dàn)对于北京清(qīng)华长庚医院神经(jīng)中心医师邳靖(jìng)陶 来(lái)说,他今(jīn)年刚被AI“上了一课(kè)”。8月下旬,邳靖陶参与的灵犀医学脑血管病(bìng)专病大模型正式(shì)发布(bù),该模型由其所(suǒ)在医院的神经中心武剑教(jiào)授团队主导研发,是国内首个基于专病的(de)医 学人工智能模型。
“大模型(xíng)的能力 说强也强,说弱也弱,我们不能让它(tā)天马行空地自由发挥。”邳靖陶(táo)表示,专病大模型与ChatGPT的最大不同,是(shì)要将(jiāng)AI杜撰的似是而非的诊疗建议扼杀(shā)在摇篮里(lǐ),避免(miǎn)灾难性后果。
8月下旬,灵犀医学脑血管病(bìng)专病大(dà)模型正式发布,该模(mó)型由北京清华长庚医(yī)院神经中(zhōng)心武(wǔ)剑教授团队主导研发,是国内首个基(jī)于专(zhuān)病的医学人工智能模型。图为灵犀医学大模型技术交流会现场。 受访者供图
对标专科和专病专家
作为国(guó)内四大(dà)慢病之(zhī)一(yī),脑血(xuè)管病的首次发(fā)病者约有三分之二是60岁以上(shàng)的老年人,其具有“高发病率、高患(huàn)病(bìng)率、高死亡率、高复发率”的特 点。而截至2021年,我国65岁(suì)及以上的老年 人口已经超过2亿人(rén),脑(nǎo)血管病医生短缺、水平(píng)参差不齐的问题尤为突出。
“基层医院不缺全科医生,但缺(quē)专(zhuān)科专家或专(zhuān)病专家(jiā),这就是大模型要解决的问题。”邳靖陶介绍,脑血管病专病(bìng)大模型是医疗机构(gòu)与科技企业的(de)合(hé)作产物(wù)。具体来说(shuō),新华三集团提供技术人员、AI算法和算力,北京(jīng)清华长庚医院和清华大学(xué)提供大数据(jù)和临床需求,共同打造一款面向临床医生的辅助诊断工具。
武(wǔ)剑(jiàn)教(jiào)授曾(céng)表示,医学人工智(zhì)能在(zài)缓解(jiě)医疗(liáo)资源紧(jǐn)张和提升医疗服务水平方面,具有巨大的潜力和(hé)优势。其核心在于对海量健康数据的深度挖掘和智能分析,这(zhè)能够大幅提(tí)升临床诊断和治疗的准确性与效率。
目前,这个(gè)大模型的核心功能是分(fēn)析和提取病历中的关键信息,并与临床知识库相匹(pǐ)配,最终提供(gōng)符合临床指南的标(biāo)准化(huà)治疗建议。
一(yī)方面,临床医生可以输入脱敏(不包括患者个人信息)的临床(chuáng)病程信息(xī),由大模型生 成最终的治疗方案。其间,如果大(dà)模型察觉到病程信息存在疏漏,会提醒医(yī)生及(jí)时补充,保证(zhèng)病历记录(lù)的标准化。
另一方面,临床医(yī)生(shēng)也可以输入患者主诉(如主要(yào)症状和持续时间等(děng国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”)信息)等简单信息,大模型将通(tōng)过选择性交(jiāo)互引导(dǎo)问诊方向,根据(jù)医生点击的选项,逐步完善临床(chuáng)诊疗过程,提升医生的循证能力。
专业性(xìng)体现(xiàn)在(zài)两方(fāng)面
在邳靖陶看(kàn)来,与ChatGPT等(děng)通用大模型相比(bǐ),专病大模型的专业性体现(xiàn)在思维链和知识库(kù)两方面。以脑血管病专病大模型为例,其数据来源包括两大部分:一部分是经过脱敏处理的临床资料,涉及疾病的特定特征(zhēng),发病情况以及诊疗过程等(děng)综合信息。另 一部分是(shì)公开获(huò)取的临床指南、大量神经病学和神经科学的(de)教(jiào)科书和(hé)参考书籍,这些 构成(chéng)了数据库的核心内容。值得注意的是,大模型并不能直接接收这些知识,而是需要经临床医生和工科团(tuán)队之手,将临床指南的框架和重点国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”内容重新整理,转化为计(jì)算机能够理(lǐ)解的语言和流(liú)程后,再输给大(dà)模型。
“如(rú)果不加限(xiàn)制地直接投喂,大模型会发散到其他方(fāng)面,生成一些新的理解。但临床指南(nán)已经是最高级别的标准化诊疗推荐,在(zài)此基础(chǔ)上的任何修改都是错误的,也(yě)不是(shì)我们想要(yào)的。”邳靖(jìng)陶(táo)告诉记者,想让大模型“听话”,除了要投喂计算机能“听懂”的知识,更关(guān)键的是教给它一套临(lín)床医生的“思维链(liàn)”,并依托这一能力对不同患者(zhě)的临床资料(liào)进行推理(lǐ)。
例如,一位脑血(xuè)管病(bìng)医生的诊疗流(liú)程大致包括(kuò)询问病(bìng)史,进行体格检查,考虑辅助检查,综合分析后给出(chū)准确诊断等环节。基于诊断结果,医生会考虑患者的具体病(bìng)因和(hé)其他基础疾病情况,结合标准化的诊疗(liáo)建议(yì),制定(dìng)规范化的治疗方案。
在这个过程中(zhōng),不(bù)同的(de)患者(zhě)主诉指(zhǐ)向不同的询问方向。但问题是,大模型(xíng)的思维虽然“发散”,但不(bù)具备自主搭建思维链(liàn)的能力,所以需要(yào)工科团队深(shēn)刻理解临床(chuáng)诊疗场景(jǐng),将医(yī)生(shēng)的临床(chuáng)思维转换为机(jī)器可以理解的思维(wéi)。而这个过程让临床医生和技术团队,都(dōu)经历了交叉学习的历练。
“Gap(差距)主要(yào)是语言交(jiāo)流上的(de)障碍,比如(rú)我(wǒ)们不理解思维链,他(tā)们不理解不同(tóng)疾病间(jiān)的关系(xì)。但这不会对(duì)我(wǒ)们的研究造成实质性影响,只要了解对方领域的基础知识,就能扫清(qīng)困难。”邳靖陶说(shuō)。
负(fù)责的仍是临(lín)床医生
邳靖陶透露(lù),目(mù)前脑血管病专病大模型正在北京清华长庚医院神经中心进(jìn)行临(lín)床验(yàn)证。此前,他和同(tóng)事们使用(yòng)真实病(bìng)例或模拟复杂临床场景,对大模(mó)型进行过内部测试。这项测试建立在前(qián)期简单测试的基础之上(shàng),旨在评估大模 型对不同复杂程度、不(bù)同语言风格和(hé)不同级(jí)别医(yī)生的病历的(de)理解能力。
其中,最困扰邳靖陶的一个问题是,如果大模型出现了错误,怎么保证(zhèng)临床医生不受干(gàn)扰呢?换言(yán)之,临床医生应该怎么处理(lǐ)和大模型之间的(de)关系?
这(zhè)一矛盾在首次内部测试时(shí)就(jiù)出现了。当时,邳靖陶模拟了一个复杂的临床场景,大模型给出的治疗方(fāng)案和预想的“标准答案”有所(suǒ)出入。随后,技术人员 介入并回溯了大(dà)模型的(de)推(tuī)理过程,试(shì)图找出可能的错误(wù),却无功而返。而(ér)当邳(pī)靖陶用“标准答案”去(qù)匹配(pèi)临床指南时,让他印象深刻的结果出现了:是自己的诊疗思路存在盲区。
“一开始这个模型(xíng)设计出来,到底能(néng)不能用于临床(chuáng),能不能起到提升和改善(shàn)(诊疗效率)的(de)作用,其实我心里也没有底。但是这件事之后,给了(le)我特别大的底气。”邳(pī)靖陶(táo)总结这次经历,发(fā)现患(huàn)者的临(lín)床症状是一个综合结果。例如,患者可(kě)能因为神经(jīng)系统问(wèn)题住院,但心血管、肾 脏(zàng)、肝(gān)脏状况也(yě)在发生(shēng)变(biàn)化。尽管医生 接受过(guò)规范(fàn)化的专科培训,但诊疗思维仍可能存在盲点,无法保证每次都能提(tí)供全面的诊疗方案。
另外(wài),临(lín)床指南是不断更新(xīn)的,并非所有医生都能及时更新知识。当医(yī)生的知识更新滞后时,大模型可(kě)以帮助弥补这些纰漏。
不过,阅读指南并作出判断,仍是临床医(yī)生不能丢弃的基本(běn)功。邳(pī)靖陶表示,如果(guǒ)医生发现大模型提供的诊(zhěn)疗方案与自身判断不符,不应简(jiǎn)单地接受或拒绝,而应深入(rù)探究原因(yīn)。这一(yī)思考过程有助于医生提高(gāo)临(lín)床诊疗能(néng)力,是大模(mó)型作为临床(chuáng)辅助诊断工具的终极愿景。毕(bì)竟,虽然大模型可以提供(gōng)结论,但对诊(zhěn)疗过程负(fù)责的仍是(shì)临床(chuáng)医生本人。
呼吁更多人加入(rù)
2023年7月,谷(gǔ)歌Research和DeepMind共同打造的全球首(shǒu)个全科(kē)医疗大模型Med-PaLM M正式发布。资料显示,这个大模(mó)型具备临床语言、影像和基因组学的理解能力,用于临床指日可待。
而根据《2023医疗健康AI大模型行业研究报告》,截至2023国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”年(nián)10月,国内(nèi)累计公开的大模型数量达到238个,其中(zhōng),医疗大(dà)模型近50个(gè),涉及(jí)患(huàn)者问诊、医生助(zhù)手、药物研发、健康科普等多个(gè)领域。据邳靖陶观察,许多医疗大模型的开发从(cóng)“全科”出发(fā),试图直接构建一(yī)个涵盖所有专科的大型全科模型,供(gōng)用户咨询(xún)各种疾病。
但在参与构(gòu)建脑血管(guǎn)病专病大模型后,武(wǔ)剑(jiàn)教授团队对这一模式表示怀疑(yí)。他们发现,把(bǎ)一种疾病的临床指南梳理(lǐ)清楚颇具难度,打造对应(yīng)的思维链也耗时耗力,短期内很难用同样的方法训练出全科模型。换言之,目前的全(quán)科大模型(xíng)能够做(zuò)到医学科普(pǔ),但很难在特(tè)定专科领域提供有效(xiào)的临床指导。因此(cǐ),武(wǔ)剑 教授团队(duì)的研发思路是以专病为(wèi)起点,再走向全科。
“如果(guǒ)针对脑(nǎo)血管病的专病大模(mó)型走通了,我们可以把成功经(jīng)验复制到其他(tā)神经系统疾病(bìng)上;如果神经系统疾病覆盖全面了(le),就成了专科大模型;神经科的经验再复制到(dào)其他科,就会形(xíng)成一个真正(zhèng)的全科医疗大模型。”邳靖陶表示,在武剑教授看(kàn)来,国内发(fā)病人数越多、疾病负担越大的疾病(bìng),其专病大模型的临床需求和研发空间就会越大,例如(rú)我(wǒ)国发病率(lǜ)最高的四大慢病(bìng)——高血压、糖尿病、冠心病、脑血管病都有非常广阔的(de)大模型(xíng)开(kāi)发空间。
而在脑血管病专(zhuān)病(bìng)大模型的发布会上,武剑教授(shòu)已(yǐ)经通过招募令(lìng)的形式(shì),呼(hū)吁(xū)全国神经系统(tǒng)疾病领域的专(zhuān)家,以及人工智能领(lǐng)域 的专业人士携手把握创(chuàng)新(xīn)技术的改 革(gé)可能,改善临(lín)床诊疗现状。他表示,如果能(néng)打破学术壁垒,医疗大模型的重复性工作是完全可以避免的(de)。
“这不是我们一个人能做的事情(qíng)。”邳靖陶(táo)说(shuō)。
责任编辑:何松琳
未经允许不得转载:天津电机维修_天津进口电机维修_天津特种电机维修_天津发电机维修 国内首个脑血管专病大模型亮相 对话参与医生:被AI“上了一课”
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了