1
雷锋网按:本文作者微软亚洲研究院副院长 张益肇。
你能想象每一天就有三架载满乘客的大型飞机坠落全员身亡的事故么?这听起来十分可怕,但全球每年被疟疾夺走生命的人数高达60万~80万,就等同于这样的坠机事故发生的概率。虽然在发达地区,疟疾几乎已经被消灭,但在某些欠发达地区疟疾却仍然是灾难,而在处理疟疾的挑战中,缺少足够的专业病理医师就是其中面临的一大挑战,该问题进而导致患者难以得到及时的诊断和治疗。
目前,微软正在研发的技术则可以帮助判断出病人是否感染了疟疾,感染的是疟疾中的哪一种类,以及可能是从哪些渠道感染的,相比传统方式下需要大量人力看样本、做分析,该技术让医生的效率大为提升。即便是在医疗人员匮乏的地区,也可以不再那么捉襟见肘了。
所以计算机与医疗的结合,远不止智能手环、血糖仪或是Xbox、HoloLens等可能会与医疗产生关联的智能硬件,其覆盖范围非常广泛,从前端设备到后端系统,再到隐藏在最后端的各类算法,每个分支都可以是一个独立的学科。事实上在微软内部,已经有接近100个与医疗相关的项目,他们中既包括十分具有前瞻性的,也有已经步入实际应用层面的。
在我看来,如今计算机在医疗领域的进展其实都是基于同一个基础,即“数据改变医疗”为核心展开的。不管是中医还是西医本质上都是实践科学,医生通过无数次的实践总结、统计出规律,最终达到医病救人的效果。当人类收集、处理和分析数据的能力随着云计算、大数据、机器学习、物联网等技术的发展而日渐增强时,人们利用大数据像医生一样去分析或辅助分析病情的能力自然也会与日俱增。
癌症一直是人类最需要迫切解决的医学难题之一,由于同一类癌症的每位患者表现也各不相同,因此可以说每位患者的癌症都是一种独立的疾病,即便是医生拥有丰富的经验也很难做出100%准确的分析和判断,更别说相对个性化的精准医疗了。因此微软亚洲研究院一直将数字医学影像识别作为主攻方向之一,希望通过计算机视觉领域的最新技术加速推动精准医疗。
从2014年起,微软亚洲研究院的团队开始钻研脑肿瘤病理切片的识别和判断,通过细胞的形态、大小、结构等,去辅助分析和判断病人所处的癌症阶段。而近两年在该领域我们基于“神经网络+深度学习”的模式取得了两大突破:
首先,实现了对大尺寸病理切片的图片处理。通常图片的尺寸也就是224*224像素,但脑肿瘤病理切片的尺寸却达到了20万*20万、甚至40万*40万像素。对于大尺寸病理切片影像的识别系统,我们没有沿用业内常用的数字医学图像数据库,反而在ImageNet这个计算机领域最为成熟的图片数据库的基础之上利用尽可能多的图片,通过自己搭建的神经网络和深度学习算法不断进行大量训练而成,最终实现了对大尺寸病理切片的图片处理。
对大尺寸病理切片图片通过神经网络与深度学习算法进行处理的流程
其次,在解决了细胞层面的图像识别之后,又实现了对病变腺体的识别。所谓腺体,可以简单理解为多细胞的集合体,它更接近于“器官“的概念。相对于细胞病变,腺体病变的复杂性和可能的组合都呈指数级增长,但对腺体状态的准确识别,则可以大大提高对癌症分析的准确程度,意义更加深远。
对病变腺体的识别,主要是基于医学角度三个可以衡量癌细胞扩散程度和预后能力的指标:细胞的分化能力,腺体的状况和有丝分裂水平。我们针对这三个角度,通过多渠道(Multi-Channel)的数据采集和分析,希望在未来帮助医生实现对病人术后、康复水平乃至复发的可能性做出预估和判断。
腺体图像经过计算机处理后被抽象成不同的结构,以便于计算机进一步识别与判断
以往医生都是凭借”肉眼”和经验去观察病理切片影像并判断病情,如今人工智能中的两大核心技术:神经网络和深度学习则让计算机系统能够自动学习恶性肿瘤细胞与正常细胞间的差异以及癌症病情的分析和判断标准,同时能够在扫描病理切片之后,给出判断结果,供医生参考。计算机强大的运算能力弥补了部分医生由于经验不足引起的误判,或是对罕见病及疑难杂症的思虑不周。而且计算机还能发现人眼不易察觉的小细节,并总结出一些出乎医生意料之外的规律,从而不断完善医生和计算机系统的知识体系。因此,正是人工智能技术让精准医疗能够继续向前推进。
不同种类的恶性肿瘤切片经过算法处理后进行分类
目前,微软亚洲研究院对二维医学影像识别结果的准确性已经处于国际领先水平。除了脑肿瘤以外,该研究结果也可以扩展至其他疾病的二维医学影像的识别和判断,例如我们正在研究的肠癌等。此外,我们还在研究肝肿瘤患者的CT三维影像,虽然三维影像与二维影像的识别技术有本质区别,但基于微软亚洲研究院在人工智能领域多年来的深入积累,相信我们在三维CT影像识别上的突破也指日可待。
除了医学影像识别,我们在医疗文字处理方面也做了不少研究。
在与国外同行交流时我们发现,原来全世界的医生所写的病历都是最难懂的书法,由于时间有限,医生们不得不在写病历的时候龙飞凤舞。在病历电子化之后,虽然书写的问题得以解决,但病历上记载的各种描述性语言——有的简洁,有的啰嗦,有的甚至不完整——对于医生后续进行病情查阅、检视或学习参考来说都非常不便。
因此我们团队通过语音和自然语言理解技术,让医生可以口述病历,随后计算机将语音转换成文字再进行结构化处理,从而形成一个囊括了所有关键词的树状图,清晰、简洁地总结所有有用信息,让患者或其他医生对所有病理历程一目了然,如有何病史,用过什么药物,排除了哪些疾病可能,待排查的疾病有哪些等等。
基于这样的电子病历,医生的更换将不再会影响不同医生对于患者完整病情的掌握;年轻医生还可以通过学习各种病历快速成长;结构化的电子病历甚至能够自动总结出被医生忽略的细节和推断,获得对病情了解的新线索;当然,大大减轻医生写病历的工作量更是无需多言。
可以看到,无论是图像识别还是自然语言理解,计算机领域的很多技术都可以与医疗应用密切结合。而随着计算能力的日益强大、人工智能技术的稳步发展,未来计算机将能够对更多复杂、高级的信号进行处理,人类的医疗水平也必将迈入新的时代。
但是,医生永远不会被替代。在医疗这个专业科学与艺术相融合的领域,人工智能技术将成为医生的“左膀右臂“,帮助医生更便捷的获取信息并辅助医生做出更加正确的诊断,而医生除了积累丰富的专业知识,还需要更多地发挥高情商的能力与病患沟通交流。最终,计算机的人工智能和医生的人类智能将互相结合,成为一个既有精准的专业判断又有情感交流的“超级医生”。让我们共同期待人工智能所引领的医疗发展新时代!
雷峰网原创文章,未经授权禁止转载。详情见转载须知。