0
本文作者: 张利 | 2016-11-29 16:17 |
假如人生能够重来,你变成了一名医生,最近尝试在线问诊。一个病人感冒了,给你发来这样几句话:
“医生,您好,在吗?”
“医生,我感冒,体温现在38度,是不是发烧啊?”
“我还流涕、喉咙痒,精神状态也不太好。”
你每天都要面对无数条这样的问题,有时病人说一大堆,其实重点就那几个字。拿上述消息为例,从医学角度来说,你真正需要的只是这几个关键字:”体温38度“、“流涕”、“喉咙痒”等。每天沉浸在这口水化、繁冗的语言中,消耗大量的精力,让你疲惫不堪。不过,你总是很幸运,“做社会真正需要的产品”的Lexigram公司可以帮到你。
不仅在线问诊,如今电子记录的关于健康的数据大部分是繁多冗长的,这样的数据不能处理和应用,但如果它变得结构化,分析和应用就变得很容易了,并且有无限想象的空间。
Lexigram是一家硅谷创业公司,它做这样一件事:按照客户的需求,将自然语言转换成云端健康数据。我们都知道,数据是信息的载体,将信息转化为数据有助于保存和处理。公司目前获得200万美元的种子轮融资。
在这轮种子轮投资中,风暴创投是主要投资者,其他投资者有RTA Ventures和Stanford-StartX基金会。斯坦福大学投资该公司是有原因的,Lexigram公司总部位于加利福尼亚州的雷德伍德市,是从斯坦福生物医学信息学研究中心发展起来的。
逐渐发展起来的Lexigram公司将自己定位为自然语言处理和机器学习的按需定制软件服务提供商。
Lexigram公司声称,如今,文本、PDF文件和电子传真已经非常普及了,但这也同时意味着电子健康记录的信息中有80%是非结构化的。这样的非结构化数据对于临床决策支持系统和其他分析引擎是无意义的。如果能根据关键词的上下文,将这些自然语言文本结构化,就可以对其进行分析并且应用到合适的地方。能根据词语的上下文,准确理解词语的意思,这也是该公司技术的卓越之处。
以医学术语Dermatome为例,它可以表示一种外科手术器械,也表示由单个脊神经提供的一块皮肤区域,如果单独提炼出关键词,而不了解出现该词语的上下文,极有可能会出现意义模糊甚至理解错误。而Lexigram公司的软件就能根据该词语的上下文环境准确理解其意义。公司采用SaaS模式,通过API提供技术,旨在将这项技术带给没有配备数据科学家的小型医疗服务提供商。
该公司一个月前推出的第一个API从多个来源提取非结构化数据,提供了与BioPortal(一个庞大的医学本体库)相关的知识图表。
早期,大部分医疗相关数据是纸张化的形式存在,随着强大的数据存储,计算平台,及移动互联网的发展,医疗数据大量爆发并快速电子数字化。据雷锋网调查,2011年,单单美国的医疗健康系统数据量就达到了150EB(如果你有一台1TB硬盘容量的电脑,那1ZB就是大致等于10亿台电脑的容量,远远超出了我们一般的想象)。如今,五花八门的可穿戴设备、电子病历可以采集到人体方方面面的大量的数据,这些数据多格式、多源头,如果能实现结构化、分析和整合,对医疗行业将产生巨大影响。
相关文章:
雷峰网原创文章,未经授权禁止转载。详情见转载须知。