0
本文作者: 张小马 | 2014-11-04 14:28 |
流行病学家们说,如果希望在今后能做到像气象学家预报天气那样,准确实时的预报疾病,维基百科就是解决问题的关键。
去年的这个时候,亚特兰大的疾病预防控制中心发起了一场比赛,希望借助互联网群策群力,利用网络数据预测下一年流行性感冒的高发季节。现在,新墨西哥州国家实验室的Kyle Hickmann和他的团队伙伴向公众宣布了他们的实验成果——借助维基百科的访问日志进行算法分析,比疾病防控中心要快两周得出结果,成功预测流感病情突发事件。他们表示团队的模型证明了流行性感冒预测不再是困扰整个社会的严重问题,而是完全能够做到像现代气象学预报天气那样,给出准确而有价值的结果。
在美国,流感每年夺走3000-4000人的生命,所以正确的流感预测能够对社会产生重大影响。现在监测流感爆发的方法是过时的,依靠公共卫生官员在医院等公共场所人工统计上报每周流感病发占样本的百分比,仅仅只能留下体温高于100华氏度的人数记录。
传统的记录方法只能统计实时的流感发病率数据,并且精确度有限。因为,存在以下两种情况,会影响到样本整体的偏差:实际感染流感的病人并没有去医院就医诊治,而表现流感症状却实际未患病的人,这两种偏差的样本却被统计在内。
目前Google公司尝试运用多种方法研究流感和流感疑似病例,已做到为全世界的许多国家和地区预测流感灾害。Google的研究收获了巨大的成功,但同样一点不可忽视的问题:Google的数据对公众并不是免费获取的,同时在疾病的监测方面也不是透明公开的。
正是因为此,Hickmann将目标转到了维基百科。网站通过记录在特定时间内,浏览流感内容相关网页用户数量,来预测目前的流感发病率。该数据是对用户免费开放,建立起透明公开的病情数据库。同样都是预测流感病情,同疾病预防控制中心相比,利用维基百科的用户访问日志来预测流感会快上两周的时间。
但是利用访问日志来预报流感,有一点不完善的地方就是,无法准确的预报流感季尾期的实时现状。因为当人二次感染时,患者很少会回过头来再次浏览维基百科上流感相关的网页,使访问日志数据的收集大大减少,降低了预测的准确度。Hickmann说,“我们的整体模型并没有考虑到患者二次感染的情况,所以在流感传播到达峰值之后的传播尾期,不能做出很好的预测结果。”
虽然疾病预测现在仍处于初级阶段,仍然有一定的不足,但Hickmann团队实现的疾病预测是可以同天气预报相媲美的、有重要价值的一项成就。它有能力让人类改进医疗健康环境,更好的防备并抵抗流行病的蔓延传播。2014-2015的流感季节快要到了,预测疾病对抗病情,越早越好。
via technologyreview
雷峰网原创文章,未经授权禁止转载。详情见转载须知。