近日,CCF YOCSEF深圳在深圳市哈尔滨工业大学(深圳)信息楼(L栋)举办了为期一天的深度技术论坛,主题为“医疗知识图谱的未来发展方向”。知识图谱领域经过十几年的发展,虽然有不错的成果和应用,但具体到医药领域,应用落地过程中实际问题直接解决率不高,可替代人工场景有限,那么未来医疗知识图谱这条路到底应该怎么走?需要重点关注和扩展哪些能力?近年来,各种大规模预训练语言模型不断推出,例如去年11月份ChatGPT的惊艳亮相,再到今年3月份GPT4.0和文心一言的相继问世,在医疗领域未有报道有大规模知识图谱支撑的情况下,它们表现出了“强大”的能力和“尚未见顶”的潜力,那么医疗知识图谱是否还有存在的必要?如果仍必不可少,医疗知识图谱又怎么和这些大规模预训练模型进行有机结合,以取得突破?这些问题都值得我们深入思考和讨论。
本次论坛邀请了武汉科技大学计算机科学与技术学院顾进广教授、武汉大学第二临床医院靳英辉副教授、华东师范大学计算机科学与技术学院王晓玲教授、平安科技倪渊副总工程师、哈尔滨工业大学(深圳)陈清才教授、重庆医科大学附属儿童医院赵耀研究员、讯飞医疗科技股份有限公司高级产品经理程美、浙江大学黄正行教授、西南交通大学腾飞副教授、百度高级研发工程师王春宇、百度大健康事业群组产品经理章超奇、重庆大学王洪星副教授、重庆中科云丛科技有限公司高级算法工程师吴天舒、鹏城实验室人工智能中心相洋助理研究员、中山大学附属第八医院病案管理科杨芬主任、腾讯天衍实验室张子恒高级研究员、重庆医科大学赵耀研究员、复旦大学钟凡副研究员、南京柯基数据CEO吴刚、深圳市眼科医院信息科张荣奎主任、汤臣倍健AI营养研究中心产品经理庞伟航、深圳市眼科医院应急办主任质控科曾超高副科长、鹏城实验室李睿副研究员、浙江数字医疗卫生技术研究院数字医学知识中心知识图谱负责人胡冉、南方医科大学卫生管理学院毛燕娜助理研究员等20余位国内知名学者参与深度思辨讨论,YOCSEF深圳的张伟鹏、刘洋、漆舒汉等参加了论坛,CCF YOCSEF深圳现任主席、哈尔滨工业大学(深圳)汤步洲特聘研究员/副教授和CCF YOCSEF深圳副主席、鹏城实验室张彤助理研究员担任本次论坛执行主席。论坛采用“总-分-总”模式,进行为期一天的闭门深度研讨。
论坛伊始,执行主席汤步洲介绍了论坛的举办背景及嘉宾信息,并对来自全国各地嘉宾的到来表示感谢和欢迎。汤步洲首先回顾了从上世纪70年代的专家系统出现知识库概念开始到2012年谷歌正式提出知识图谱概念之间知识图谱的发展历程,比较了不同行业领域知识图谱的使用情况。发现了一个特别的现象,在知识密集程度非常高的医疗领域,知识图谱利用率却很低,启发大家思考为什么会出现这样的情况?随后介绍了ChatGPT的三个核心步骤:(1)在大规模预训练语言模型上的有监督微调;(2)训练奖励模型;(3)近端策略优化。在这一背景下,他提出一系列问题引起大家思考:医疗知识图谱这条路到底应该怎么走?我们是不是不需要做医疗知识图谱这个研究了?或者说,如果我们要做,要往哪边做?如果要做的话,医疗知识图谱怎样和类ChatGPT类模型进行结合,如何能更好地去结合在一起?尤其是现有医疗知识图谱和将来的医疗知识图谱如何融入到三个核心步骤中?背景介绍完毕后,向与会嘉宾发放了关于医疗知识图谱未来发展方向的问卷调查,从目前医疗知识图谱在哪些落地场景比较好还是不理想?ChatGPT在医疗领域基础任务上效果是好还是坏?ChatGPT在医疗领域落地不理想的场景是因为哪些基础任务上表现不理想导致的?这几个方面开展,问卷结果作为本次论坛思辨的初始参考资料。本次深度闭门技术论坛分为三个阶段。第一阶段:3月26日上午9:20-10:20,在主会场进行引导发言和破冰环节;第二阶段:3月26日上午10:30-12:30,下午14:00-17:30,所有嘉宾分为2个小组由执行主席汤步洲和张彤分别在两个分会场主持分组思辨讨论;第三阶段:3月26日下午17:30-18:30,在主会场进行汇报总结、全体思辨讨论以及论坛总结。汤步洲主持论坛
本次论坛邀请了4位引导发言嘉宾,分别为武汉科技大学计算机科学与技术学院顾进广教授、武汉大学第二临床医院靳英辉副教授、华东师范大学计算机科学与技术学院王晓玲教授、平安科技倪渊副总工程师。首先,顾进广教授以“大规模医疗知识图谱构建面临的挑战”为题,从可循证的知识图谱构建、医疗多模态知识图谱的构建、构建大规模知识图谱所需的协作制度和对医疗知识图谱的质量评估四个方面展开介绍了构建大规模医疗知识图谱可能面临的挑战。具体描述如下:- 所谓可循证的知识图谱就是要对描述诊疗过程的知识能给出可溯源的循证证据和等级,为知识图谱的利用提供循证解释,这就需要构建循证知识表达体系;
- 医疗天然就是多模态场景,多模态数据的对齐问题、背景信号和噪声问题都给多模态知识图谱构建带来诸多挑战;
- 大规模知识图谱构建未来可能会依赖“众包“的方式,复杂多样性环境下的自动化众包模板构建流程设计,众包任务的发布形式和潜在承包人的能力评估,医疗数据共享的安全性保障,便捷、交互友好的标注系统UI设计都是需要重点考虑的问题;
- 医疗知识图谱质量评估体系的建设是保证医疗知识图谱构建过程良性增长的法宝,需要专门设计多样化评估维度对医疗知识图谱创建、使用和维护三个阶段分别进行针对性评估。创建阶段可能需要重点关注知识表示描述能力、知识可信度、冗余性等;使用阶段则可能需要重点关注知识的准确性、可访问性和易用性等;维护阶段则可能需要重点关注资源和知识的动态更新能力。
其次,靳英辉副教授以“医疗知识图谱使用过程中遇到的问题与困境”为题,介绍了其团队在医学知识图谱构建方面的相关研究及取得的标志性成果,以及医学知识图谱构建在宏观方面和实践操作方面存在的问题与困境。靳英辉从医学知识图谱构建宏观和实践操作两方面对知识图谱在使用过程中遇到的问题与困境做了详细阐述。- 从宏观上看,当前医学知识图谱构建存在数据来源广泛、缺乏统一标准和整合方法、数据质量和可信度参差不齐、数据隐私和安全保障不明确等方面的问题,给医疗知识图谱构建带来了很大的阻碍,也直接影响知识图谱的落地应用;
- 从实践操作看,医疗知识图谱构建需要结合自然语言处理、机器学习、数据挖掘、知识库和数据库等技术,对于医学专业的人员难度较大;医疗知识图谱使用是与临床决策支持系统是否能深度融合是决定医学知识图谱是否有用和好用的金标准之一;此外,仅构建大规模的指南知识图谱,就需要大量的医学专业人员进行标注,非常耗时耗力。
随后,王晓玲教授以“临床医疗决策树—标注和自动抽取”为题,阐述了诊疗决策树(Medical Decision Tree, MDT)抽取面临的技术挑战,并介绍了其团队所构建的TextMDT数据集,以及基于此数据集开发的面向癫痫诊疗的辅助系统。王晓玲认为,结构化医疗知识可分为医学知识图谱(即三元组)和诊疗决策规则,可用MDT来描述。以往的MDT构建依赖于专家手工标注,严重阻碍了大型CDSS的构建、维护和发展。能否利用信息抽取技术实现诊疗决策规则的自动抽取?她介绍到,MDT抽取面临着以下挑战:- MDT在应用场景、节点信息粒度、树形结构语义上与目前的树状结构(数学表达式、依存句法树)有较大差异;
- 缺乏面向医疗文本的决策规则抽取的基准和技术,传统的医疗信息抽取无法满足决策规则抽取,如无法表示关系和实体之间的逻辑关系。
基于以上考虑,王晓玲团队面向临床指南,对MDT定义、构建过程、统计结果、质量评估和评估方法进行了探索,构建了TextMDT数据集,基于该数据集,在中国健康信息处理大会CHIP 2022上组织了关于MDT自动抽取的公开评测,吸引了卫宁健康、科大讯飞、北京医鸣等业界/学术界队伍的参与。目前,该数据集被纳入天池CBLUE基准数据集中。利用自然语言处理技术(Natural Language Processing)技术自动抽取MDT,并将MDT应用到面向癫痫诊疗的辅助系统中,验证了MDT的有效性和MDT自动抽取的可行性。最后,倪渊博士以“ChatGPT在医疗领域的若干能力测试”为题,介绍了哈尔滨工业大学(深圳)联合、平安医疗科技、百度、腾讯、科大讯飞和南京柯基数据对ChatGPT在医疗领域的若干能力进行测试的结果。从病历解读、健康咨询、分诊导诊、医学诊断、治疗方案推荐、医生助手(考试、科研、文献摘要等)、医疗信息抽取等方面进行了若干示例测试。这些结果里面可以看出,ChatGPT在大部分测试任务上表现出较好的性能,交互方式拟人化程度高,但是结果并不稳定,另外在逻辑推理方面还是存在不少问题。在对医疗知识要求精度高的场景需要谨慎直接使用。引导嘉宾发言结束后,进入了破冰环节,所有与会专家依次发言,发言前做简要自我介绍。从之前下发的问卷结果看,大家对“医疗知识图谱在哪些落地场景比较好还是不理想?ChatGPT在医疗领域基础任务上效果是好还是坏?ChatGPT在医疗领域落地不理想的场景是因为哪些基础任务上表现不理想导致的?”等问题的答案存在较大分歧,从侧面反映出领域专家们对医疗知识图谱的认知和期望明显不一致。根据问卷的结果,与会嘉宾重点围绕“目前医疗知识图谱落地比较好的场景有哪些?落地不太理想的场景有哪些?ChatGPT在医疗领域效果不好的部分主要原因是什么?知识图谱是否可以补位?”等话题,嘉宾们从各个不同的方面展开了深入探讨,现场讨论十分激烈。破冰环节结束后,执行主席介绍本次论坛的议题以及分组情况。本次论坛拟定的议题包括“医疗知识图谱急需扩展哪些能力?”、“医疗知识图谱与类ChatGPT模型如何有机结合?”等。随后,两位组长带领本组嘉宾、本地AC委员以及博士生志愿者进入各自分会场,开展全方位、多角度的深度思辨和讨论,会场气氛热烈,情绪高涨,各组嘉宾积极表达各自观点,碰撞思维,取得了一些颇具创新的思路和技术方案。分组讨论结束之后,所有嘉宾回到主会场。按照分组顺序,由各组组长针对下午的小组思辨成果进行10分钟的汇报与展示,然后全体嘉宾一起针对下午的议题进行全体思辨和讨论,整个过程会场气氛热烈。论坛最后,执行主席汤步洲和张彤对本次论坛进行总结,首先对与会嘉宾的到来和支持再一次表示感谢,也对为期一天的思辨的成果给予肯定。本次论坛首先从多个维度剖析了医疗知识图谱的发展现状和面临的挑战,并分析了ChatGPT等大规模预训练模型在不同医疗场景下的应用表现;基于此,论坛深入探讨了医疗知识图谱在能力上还需要扩展的能力,以及如何与类ChatGPT模型的有机结合;最后,论坛进一步研讨了医疗知识图谱的未来发展方向。经分组报告和全体思辨,对本次深度技术论坛的两个关键思辨问题“医疗知识图谱急需扩展哪些能力?”和“医疗知识图谱与类ChatGPT模型如何有机结合?”进行了总结凝练,初步达成了以下共识:以三元组为核心的知识图谱在推理能力方面严重不足,大大影响了知识图谱在医疗领域的落地,目前仅在查询、问答、基层电子病历质控等简单场景应用较好,在与临床决策相关的应用方面表现不佳。需要引起关注的方面包括以下几点:a.不同部门(卫健委、医保局等)发布的临床诊断名称和疾病分类等标准存在很大差别,急需建立这些标准之间的权威和被普遍采用的映射关系;b.在三元组的基础上加入包含MDT,需要高效的决策树抽取方法,尤其是面向单病种的可靠临床实践指南的决策树自动抽取方法;c.包含MDT的辅助决策系统在一些场景下能体现出很好的效果,需要大规模推广和持续验证;d.利用高质量真实世界数据和医学文献分析为单病种临床实践指南指定提供不同等级的循证证据,反馈到医疗知识图谱;e.根据高质量真实世界数据提供的证据推进复杂场景下的医疗知识图谱的融合,如多个单病种知识图谱融合成共病知识图谱等;f.在包含决策树的医疗知识图谱做临床辅助决策时,需要考虑真实场景下的临床诊疗路径与多个单病种知识图谱的对齐;g.医疗多模态知识图谱首先需要将不同模态之间的数据与文本对应的图谱建立联系,如医学影像可以定义影像相关的临床发现,通过临床发现之间的三元组关系和决策树实现临床辅助决策;h.为增加医学知识图谱的使用范围,需要考虑医院管理等相关场景。(2).医疗知识图谱与类ChatGPT模型如何有机结合?a.在医疗领域,ChatGPT能力的评估是比较主观片面的,急需组织对类ChatGPT模型能力的系统定量评估;b.知识图谱对ChatGPT的基座大模型和三个步骤均能产生有益补充;c.知识图谱与大规模预训练语言模型已经有了较好的结合方式,如鹏城-百度文心等;
d.有监督微调存在遗忘和冲突问题,如何定位和解决是需要重点关注的方向;e.直观上看,决策树能很好用于COT。一种可能的方式是:直接将决策树转化成COT,利用对比学习训练奖励模型;另一种方式可能的方式是:COT背后有一个对应的决策树作为隐式支撑,也可以用决策树来衡量COT获得的奖励;f.COT到一定规模后,是否能达到一个能力瓶颈有待考证,也是需要重点关注的。本次论坛将作为一个起点,启发人工智能、知识图谱、大规模预训练模型、医疗等领域的相关学者对医疗知识图谱发展路径的深度思考,也期待后续持续举办医疗知识图谱的系列论坛,希望计算机各领域的专家学者通过CCF YOCSEF这个平台发表真知灼见,共同为我国计算机领域的发展贡献力量。本次论坛由中国计算机学会(CCF)主办,CCF YOCSEF 深圳承办,并得到了宝德科技集团股份有限公司、北京超级云计算中心、北京天融信网络安全技术有限公司(深圳)、英特尔(中国)有限公司等的大力支持,感谢参与筹备的YOCSEF深圳全体AC委员与候任AC委员。
雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。