0
本文作者: 张利 | 2017-08-19 23:19 |
在阿里天池医疗AI大赛第一赛季的榜单上,宜远智能以0.806的分数排名第二,加州大学成绩0.815占据鳌头,北京大学以0.780的成绩排名老三,清华、复旦、浙大、上交等国内高校以及GE、联影等医疗器械商均参加了这项比赛。
意料之外Number 2的成绩,让CEO吴博信心大增,“我们原来以为肺结节智能筛查领域没机会了,参与进来才知道,我们这些新兵还是有机会的。”对于今年4月份刚刚成立的宜远智能来说,“这算是一次算法上的肯定,最主要的当然是算法实用性的体现”他说道。此外,与榜单上单打独斗的选手不同,宜远智能与香港浸会大学、南方医科大学合作,共同参赛,相关模型在南方医科大附属医院落地测试,“关键在于跨界融合”。
这种联盟的思想不仅体现在比赛上,在公司主营业务方向上,也发挥得淋漓尽致。“本质上,我们就是画一个圆,团结一切可以团结的力量,与不同医院(医生)进行科研合作。”
到目前为止,这家四个月的公司已经先后与香港大学深圳医院、南方医科大附属医院、复旦大学附属中山医院的科研团队展开合作,项目已经涵盖骨科智能诊断、皮肤病智能筛查、肺结节筛查领域,在具体合作细则上,公司负责模型,医院/医生负责临床问题定位、数据标注解读等。
「算法还是数据,这是一个问题?」
关于算法还是数据孰轻孰重的问题,AI界争论不休,在知乎上,署名为“项亮”的知友获得最高赞同票,“我强烈同意数据比算法重要!虽然我们可以打官腔说这两个同样重要,但如果是一个资深的机器学习和数据挖掘研究人员,绝对不会掩饰他们对数据的渴望,当然对他们来说设计好的算法是很容易的,但好的数据却是不容易拿到的。”而具体到AI医疗领域,相比于算法人才,数据也是更加稀缺和抢手的资源。
而从公司利益的角度,吴博给出的答案却与此截然相反:“算法公司比数据公司值钱”。
今年年初的美国人工智能年会(AAAI-2017)上,Quora工程副总裁Xavier Amatriain曾表示,对于小公司而言,本身数据量就少,而获得标记的数据更是需要额外的成本。小公司堆数据肯定是堆不过大公司,所以选择把精力放在优化算法上往往比选择把精力放在获取数据上更高效。当然一方面小公司也需要不断地积累数据。对此,吴博评说“深得我心!”
“毕竟医疗数据难以出现互联网数据那样中心化归集的马太效应,而像素级且冗余的医学数据标注又需要极高的专业素养跟成本,算法才是我们最能发挥主观能动性的部分。”他说道。
如果了解宜远智能本身特质的话,会对吴博的观点毫不意外。“我们评估后公司的优势在于算法。”吴博称,对于宜远智能在阿里天池医疗大赛中的第二名成绩,他告诉雷锋网,很多队伍的差别是千分位的差别,就算是0.001级别的FROC位置,都意味着至少20个疑似结节位置的判断的正确。所以,你的FROC的指标比别人或者比自己能提升0.01的话,意味着几百个疑似结节位置你做的更准了。这也是很现实的问题。“在我们看来,医疗没有那么互联网基因,互联网企业是创业驱动的,智能医疗更多是研发驱动的,还是要把研发坐实。”
其算法优势自然可以归因到其创业团队的背景上。吴博本科就读于清华大学,曾任爱立信高级研究员、英国利兹大学博士后、香港浸会大学博士,合伙人刘凯是其同门师弟,香港浸会大学博士,曾为腾讯数据平台高级算法工程师;另一个合伙人吴宇曾同为腾讯数据平台AI算法工程师。吴博曾称,“别的公司连一个AI模型人才都难求,我们连实习生都是伯克利、港科大、港大来顶尖深度学习好手,背后还有一大票教授、国家的合作伙伴作为后盾。”
相比对算法的看重,在医疗数据的获取上,吴博认为,或许没有想象得那么难。甚至,“获取”这件事本身,他认为或许也不成立,“ ‘占有’让位于‘共享’是不可阻挡的趋势,医疗数据也会如此。但共享的本质不是所有权共享,而是Access(访问权/使用权)共享,我们对医疗数据也是不求所有,但求所用。”况且,他补充道,“数据本质上也是用户或国家的。”
相比于数据,在吴博眼中,实打实的成果更重要一些。他认为,IP不仅在娱乐或游戏领域很重要,医疗领域也是很看重IP,更加IP驱动的。一个疗法或产品一旦脱胎于学术成果,后续的产品落地和商业化,更加有生命力。
为此,宜远智能旗帜鲜明地打出“科研服务/合作”牌子的公司,与不同的医院/医生寻求合作。“很多公司号称在打造产品,落到实处就是是科研课题,这个走不了捷径。”吴博告诉雷锋网,“坦白了说,就是这种做法,最心安理得,我也不是不做产品,我们团队的产品基因和经历都很丰富,我们时刻把产品和平台摆在心中重要位置,只不过,现阶段以课题的形式切入。”
“我们团队有学术背景,本身对学术有追求。针对前期的CADe,与拥有数据的医院或科研谈科研服务方面的合作,还是比较稳妥和保险的事情。”他说。
医疗数据非常稀缺,非常宝贵,为此,AI公司与医院/医生联盟时,选择权一般握在后者手中。广东省人民医院影像科刘再毅教授曾表示,在选择AI公司时,会仔细斟酌:能不能以医生为主导?团队是否优秀?是否愿意配几个人给我?无独有偶,深圳市第二医院影像科蒲主任曾称,与AI公司合作时会考虑团队素质,以及是不是以医生为主导?这也是大多数医生与工科团队合作时的诉求。
对于谁来主导的问题,吴博表示,“科研合作医生主导天经地义,但是不是要主导产业化,要看医生是不是有‘企业家精神’,否则完全可以把专利授权给合作方。”
据公司合伙人刘凯博士介绍,公司的面部皮肤问题识别上已经“取得惊奇效果”,面向皮肤护理和敏感肌肤护理保养市场,“吸引了不少美容行业大公司谈合作”。
在这种打法下,商业公司的“项目”变成了学术上的“课题”,双方的投入与收益少了“铜臭味”,那么创业公司何以为继呢?换言之,商业模式是什么?
早在今年3月成立公司前,吴博曾称,“通过近期研究大量医疗医药上市公司,我发现牛的多靠布局,而不是单品打磨。”目前看来,宜远智能确实未专注在某个单品上,而是画一个圆,团结一切可以团结的力量,与不同医院(医生)进行科研合作。
他认为,通过与医院合作,对某种疾病进行医学影像智能分析,也许能获得比目前任何人都要多的数据。通过将数据集中,他们可以很好地构建AI系统,你建造的东西要够好,这样才会让你进入一个良性循环,可以随着时间的推移积累更多数据,并继续前进,最终做成一个与众不同的小生意。
“ 像国外的Zebra、Enlitic等对标企业,也是多病种切入。有些机器学习算法是通用型的,你只需要使用不同的数据进行训练都能快速得出解决方案,这也是为什么在今天机器学习被接纳得如此之快的原因。”他说。
吴博告诉雷锋网,总体上,公司的发展路径是清晰的,就是从CADe(计算机辅助检出)到CADx(计算机辅助诊断)再到CADp (计算机辅助预后)。现阶段,以科研服务为切入点,相对来说,商业周期会慢一点,所以模型队伍和商务队伍有精力做多个领域,但仍是医学领域的相关范畴。“我们把它分解成几个子问题,分阶段往前推进。”
着眼在资金上,目前公司的打法是:一方面落实融资;一方面与医院形成合作提供服务。“融资方面稳步进行,目前已落实几个来自有实力医疗集团的TS。其间还暂时谢绝了一些朋友的资金,因为对方不懂医疗和AI,教育成本高。”吴博说。
“我们做了这么久,发现没有想象中的耗钱。”吴博告诉雷锋网,毕竟跟医院的合作有产学研三方,能分担成本。他认为,本质上,未来医疗AI是toB的生意,精髓在于有多大本钱做多大生意,能押多少资金,就能接多少活儿,你有1倍的本钱,就能接到2倍的单子,其中可以赚取0.5倍的利润。“toB的生意很好赚钱,以后多接点业务,让营收增大一点。”
从长远看,吴博表示,“将会尝试不同方式,看行业内可能出现哪些收费模式,但toB业务,万变不离其宗,做好服务,收益就上来了。”要么与硬件绑定,要么是独立的软件系统,可以尝试不同的收费方式。他认为,医疗不同于互联网产品,3~6个月就可以上线,估计到最后可以推广的营收状态需要1年半~2年时间,“但并不意味着全部在烧钱,toB的业务非要收钱,机会也很多。”
无论商业模式如何,最终离不开医学和医疗的实质问题。“关键在于真正把医学问题解决了,形成医学IP,产品包装、用户体验、性能等都好解决。”
许多在AI医疗领域耕耘过一段时间的人,或多或少表现出一种迷茫,或者说悲观的态度,甚至AI泡沫将要破灭的说法一度甚嚣尘上。飞利浦大中华区临床科学部高级总监周振宇表示,AI医疗与十几年前一样,关注点还停留在纯粹数据驱动结果上,比如100个肺结节找到多少百分比,这对于临床知识来说没有太大的价值;科大讯飞智慧医疗事业部医疗影像产品负责人马文君告诉雷锋网,“如今的智能影像很像前几年的互联网医疗,大家一窝蜂进来了,但下一步怎么做,是个问题。”汇医慧影表示,“整体来讲,智能影像诊断真正深入到临床诊断的很少,目前,业内尝试与医生合作做科研或提高效率方面尝试,但要真正提高诊断率,目前还有很大差距。”
但吴博却不以为然,对这一波AI突破充满信心。他认为以前那些老旧的方法在医学领域干得不够漂亮,每一步做得不够好,整个起来达不到大家预期。“以肺结节筛查为例,大家以为几个大厂已经做到极致了,但至少从大赛结果上看,是新兴公司做得更好。”
他认为,即使做单项的肺结节检出,也能做到比较好的水准;检查完了之后,分类、良恶性判断等都有望逐个突破。每个环节准确率提高10%的话,整体而言,效果可能要好很多。
当然,他补充道,“我们现在还需要做出更多成绩来,证明我们的想法是对的。”
雷峰网原创文章,未经授权禁止转载。详情见转载须知。