0
近日,雷峰网《医健AI掘金志》以《隐私计算,让AI释放医疗数据的价值》为话题,邀请了四位隐私计算企业CXO,以线上云峰会的形式,讨论隐私计算的技术路线和在医疗场景下的实际应用前景,以及推演该产业的未来趋势。
感兴趣的读者,可以点击公众号的【云峰会】菜单栏,观看4期嘉宾的视频回放。
作为本次云峰会的最后一位演讲嘉宾,翼方健数合伙人、医疗健康事业群总裁李苇刚,进行了题为《隐私安全计算和人工智能如何在大数据时代推动医疗行业数字化转型》的演讲。
他围绕医疗行业的数字化转型中,如何通过包括隐私安全计算在内的全栈技术,打造数据在全流程安全计算环境下的价值利用和价值共享等内容进行了分享。
数据是智能时代最活跃的生产要素,李苇刚表示,“数据价值体现的终极形式是数据资产化,而数据资产化的实现,必须依赖具有隐私安全计算能力平台所提供的完整流程能力,包括从数据汇集、治理、确权、授权、到数据应用、定价、交易、以及数据价值的溯源和分配等。”
以下为李苇刚的分享内容,雷峰网(公众号:雷峰网)&《医健AI掘金志》作了不改变原意的编辑及整理。
国家卫健委卫生发展研究数据中心游茂主任曾提及,“目前我国医疗服务发展正处于从信息化向数字化过渡的关键阶段”。
大家经常讨论的数字化转型分为两个内容,一是业务数字化,一是数字业务化。
从翼方健数的角度理解,业务数字化是整个数字化转型的上半场,也就是大家熟悉的信息时代通过信息化的系统来优化和改造业务流程。
而作为下半场的数字业务化,即在智能时代通过数据推动新兴业务的发展,通过数据寻找和创造更多更好解决问题的思路和方法。
数字化转型上半场将持续进行,当前的重点则是在下半场如何以数据优先,产生新的数据业务,开创新的数据经济。
比拟于过去的农业时代和工业时代,智能时代的数据就像从前的土地和资本,在当今时代为一个行业、一个地区、一个国家、一个社会创造难以预计的价值。
2020年中共中央、国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》中,将数据纳入进行市场化配置的重要生产要素。
作为信息时代的副产物,数据往往存在质量参差不齐、非标准化、非结构化以及数据之间相互隔离等问题。
如果我们将数据与资本、土地、人才、知识等生产要素进行比较,就会发现它最具代表性的特征是非竞争性和非排他性。
非竞争性与非排他性是指同样的数据可以同时在不同的场景下被反复使用,而一般的要素,当在一个场景中使用时,在很长一段时间将无法在其他场景下被使用。
这是一把双刃剑,一方面数据的价值没有天花板,但另一方面如果数据被人拿走,不论采用什么方法,通过什么渠道,拿走数据的人都将和数据所有者一样拥有对数据的使用权,拥有对数据价值的分配权,从而影响数据所有者手中数据的价值。
再加上医疗数据本身所包含的隐私、机密信息,就导致我们对于医疗数据的使用非常的小心和谨慎。
将数据作为一个新的生产要素发挥价值,就需要在很多场景中开放地使用;但使用过程中,又面临着数据安全问题。这个矛盾如何解决?
首先要分清一个概念:原始数据和数据价值是两个不同的东西。
第二个要分清楚的概念是:数据的所有权和使用权不同,二者可以分离。
当我们将原始数据和数据价值分开,将数据所有权和使用权分开,也就为利用隐私安全计算解决数据安全和数据流通之间的矛盾提供了一种可能性。
将数据作为一个新的生产要素使用时,需要解决数据安全和数据价值流通二者间的矛盾,隐私安全计算技术就是解决这个矛盾的灵丹妙药。
隐私安全计算强调不分享原始数据,只分享数据的价值。即提供一个环境,在这个环境中通过计算数据获取想要的结果,也就是数据的价值。
整个计算过程始终保证原始数据的安全,保证使用者获取数据的价值。
隐私安全计算领域包含很多技术,既有大家耳熟能详的区块链、云计算,也有最近云峰会中被反复提及的多方安全计算、同态加密、联邦学习、安全沙箱、可信环境等。
这些都是隐私安全计算中的核心技术,使用这些技术手段能够保证数据在计算和使用过程中的安全。
了解隐私数据平台,首先要了解医疗信息化历程。
从信息时代到数字时代再到智能时代,医疗信息化不断演变。从院内信息互联互通到建设数据中心,再到互联网医疗线上线下打通和阿里提出的数据中台概念,医疗信息化进程经历了基础阶段、完善阶段和应用阶段。
如今我们提出“隐私数据平台”的新概念,是在中台的基础上加入隐私安全计算的技术,使数据中台里的数据能从原始状态转变为数据资产,实现更好更安全地管理、使用与价值共享。
何为隐私数据平台?
隐私安全计算技术只是其中一部分核心技术,隐私数据平台是一个系统工程。
在这个系统工程中,首先要保证的是全流程的通畅。从数据的汇集到数据的治理,以及归一、结构化、标准化等。
数据汇集后,还要对数据做最小单元的管理、确权。只有完成确权后,才能在需要做数据授权使用时,知道找谁去授权,谁有权利进行授权。
然后是使用数据,从数据的查询、探测开始,找到想要的数据,并向相关数据拥有管理权限的管理方,申请授权后才能开始使用数据。
在使用数据时,还需要引入自己的解决方案,或是借用第三方的服务或应用工具进行数据计算,当所有的计算在安全环境中完成后,即可得到想要的结果,也就是数据的价值。
最后的工作是考虑如何下载计算结果,如何分配数据价值,以及对前面工作做出贡献的参与方如何分配利益。
以上工作全部完成后才是一个完整的隐私数据平台。
数据价值分享的第一步就是数据治理。
翼方健数具有自己的数据治理平台DATAWAND,能够对数据进行清洗,将各系统提供的原始数据转换为可供使用的数据资源。
经过数据治理后,我们就有了可供使用的数据资产,之后就是数据共享环节。做数据共享时,要遵循FAIR原则,即可发现、可访问、可互操作和可重用。
翼方健数目前最核心是围绕XDP平台的相关产品,包括医院使用的科研平台、药厂使用的药研平台、保险公司使用的医保平台以及用于公共卫生领域的疾控平台。
我们在医院端也有一些AI应用,即智慧病案管理的系列解决方案,包括智能分级诊疗、智能哨点、辅助书写、辅助决策、病历质控、首页质控、DRG/DIP费控等一系列的医院院端应用解决方案。
最后,我们也在隐私安全计算保护的前提下,为保险公司、药厂等提供数据使用的服务。
我们的理念是用技术解锁数据的价值。将数据从原始状态通过隐私安全计算、数据治理、建模、应用等一系列的技术和工具进行加工,转化为数据价值,再回馈到应用中去,形成从原始数据到数据价值再到数据资产的闭环,在闭环当中反复使用。
只有医疗隐私计算技术是无法真正发挥数据的价值,必须具备全栈的技术,多方合作一起完成闭环,推动数据价值的流动。
接下来为大家介绍我们实施完成的三个医院案例与两个区域案例:
第一个医院案例是瑞金医院自主学习型智能化电子病历。
我们利用在瑞金医院通过隐私安全计算拿到的数据进行建模后,再通过模型引导电子病历的智能书写。
目前,已经完成了门诊和住院的两个科室的落地和应用,平均病历书写时间缩短了70%,正在推广全院的门诊、急诊电子病历书写的智能辅助。
第二个医院案例是上海九院全息全病例智能内涵质控。
我们与九院合作,通过对病历数据按病种分类,并按各科室进行数据建模,采用深度学习人工智能技术进行病历数据质量校验和内涵质控,有效保证病历质量。
系统可参照知识库中质控规则以及诊疗路径中前后文书的涵义做出对比,找出其中不符合规则或前后不一致的地方,在秒级内给出建议并提示,实现近实时的、自动化的、从事中到终末的门急诊、住院数据质量控制体系。
第三个医院案例是翼方健数与中山大学肿瘤防治中心胡丹旦教授合作的项目。
我们在院内搭建了科研大数据平台,将基因影像、文本病历等多模态的数据融合,建立一个专科专病库。
项目应用了通过隐私安全计算融合来源于不同渠道的数据源的数据。
第一个区域案例是长三角生物医学产业大数据联盟。
该项目是由中科院营养所牵头,翼方健数与上海生物信息学会、福建省生物信息学学会等单位联合组建的大数据联盟。
大数据联盟中使用了翼方健数的平台,通过技术将长三角不同医院、不同学校的数据汇集在平台上,由数据提供方管理数据的授权与使用,构建生物医学产业全新的数据协作共享生态。
第二个区域案例是我们刚刚完成的宜昌市多点触发疾控大数据平台。
该项目包括两个平台,一个是宜昌市卫健委的医疗数据隐私安全计算平台,另一个是宜昌市大数据中心的政务数据隐私安全计算平台。
我们利用隐私安全计算将两个平台之间的数据通过授权共享,而非传统的原始数据互联互通。
此外,该项目不仅完成了政府和政府数据之间连通,也做到了政企数据的融合。
政企数据融合是近年来非常热门的话题,政府想要用企业的数据,企业也想用政府的数据,但是因为种种原因无法实现。
在这个案例中,我们利用隐私安全计算技术实现了宜昌市两个政府平台与外部两个企业的数据的联通使用。
在结束之前,我们用两个问题总结一下今天的内容。
第一个问题是你的数据能用吗?
这个问题有两个内涵,一方面是指数据是否是可用的状态,如果不可用,则可以通过数据汇集治理后实现。
另一方面是指治理好的数据是否敢用,如果没有隐私安全计算的保护,无法充分保证数据在使用过程中的安全,大多数人都无法放心地使用数据,所以我们希望通过一系列的技术解锁医疗数据的价值,将医疗数据用起来。
第二个问题是你的数据用了吗?
当我们拥有可用、敢用的数据后,应该将数据用在什么地方呢?可以自己使用,可以和同行共享,也可以跨区域、跨平台、跨行业使用。
在隐私安全计算的保障下,我们期待共同探讨数据使用的途径,寻找更多的合作伙伴,一起将数据用起来,让医疗数据为人民服务。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。