0
本文作者: 吴彤 | 2023-05-19 09:43 |
“AI的应用场景很多,但是AIDD最佳的应用场景是品种交付。现在很多AIDD公司的理念、研发路径、战略都不一样;如果拿中国历史比,现在更像春秋时代,连战国都还没到。”
刘振明博士是北京大学药学院研究员,国家化合物资源库北京大学负责人,是我国抗肿瘤创新药物研发和AIDD领域的科学家。前不久,刘振明研究员在与雷峰网&《医健AI掘金志》的对话中,表达了他对AIDD制药的一些个人看法。
作为一名北大培养出的科研工作者,从在北大药学院学习药物合成,到北大化学院学习药物设计,再到法国实践药理学,刘振明研究员认为,多学科的融汇学习,促使他走上药物设计方法和候选药物发现这条路。
2005年8月至今,刘振明研究员在北大药学院药物化学系任教,相继参与北京大学药学院分子设计平台和化合物库的建设。目前,北京大学正在打造“智慧药物研发平台”,对接创新药物发现重大国家战略需求。
随着医药体制改革的不断推进和创新环境的不断改善,中国已经进入创新药时代,顶层制度设计为迎接创新药研发铺平了道路,积极开展和建立人工智能驱动的创新药物研发(AIDD),成为新一轮产业变革的核心驱动力。
然而现实情况却是,自从2012年Exscientia注册成立,AI制药开始在全球萌芽,至今已经十多个年头,依然没有一款AIDD“独立”研发的药物成功获批上市,甚至进入临床试验的药物都凤毛麟角。此外,部分进入临床阶段的药物是否全流程基于AI设计还存在争议。
在刘振明研究员看来,“AIDD不是谎言,按照AI研发的药物规律,乐观来讲,给这个行业5-8年时间,能看到一波AIDD设计出来的药物,至少做到让传统药企眼前一亮。完成这历史性第一步的,未必是现在公认为最好的AIDD公司。”
近日,雷峰网&《医健AI掘金志》推出《AI制药十人谈》系列,探究AI制药的前景与隐忧。以下为我们与刘振明研究员的对话内容,雷峰网&《医健AI掘金志》做了不改变原意的编辑与整理。
雷峰网:作为一名北大培养出的科研工作者,从在北大药学院学习药物的合成,到北大化学院学习药物设计,再到法国实践药理学,您何时尝试在药物设计中使用计算机技术?
我本科是北京医科大学(现北京大学医学部)药学院药物化学专业,直博保送到北京大学化学与分子工程学院物理化学专业。虽然是物理化学,但总体来说,五年博士学习更侧重计算化学。当时和我一同入门的有4 个博士生,一律都进入了计算机模拟方向。入学第五天,我跟师兄就到了国家气象局接触到了曙光大型机和超算,从那时开始,我就尝试将计算机辅助手段用于药物研发。
2005年毕业,我回母校效力,碰巧当时北大药学院要建设计算机辅助药物设计(CADD,computer aided drug design)平台,这就成了我留校任教后的第一个项目。自然地,CADD就成为了我的研究方向。
后来我到法国做了一年半的访问学者,主要工作是熟悉神经药理学研究的一般流程和规律,进一步熟悉和了解药物研发的过程。
为什么要做这个研究?在此之前,我有幸参与了国家“重大新药创制”科技重大专项的启动和实施工作,那时候我就发现:新药研发一定会成为中国未来10~15年的重要发展方向。我进一步梳理自己的知识背景,发现我本科更多是做合成,博士是计算,所以我到法国,主要是为了补充和完善自己在药物研究方面的知识和认知体系。
为什么选择药理学?实际上,药理学对药物研发非常关键,很多人将药理学定义为一个“桥梁学科”,联接基础研究和临床研究。所以我经常感慨,我是站在了“计算机科学”和“生命科学”的分水岭上,同时看到了两边的发展情况。
现在随着算力的提升,AI真正走入药物设计领域,证明国家的判断方向是正确的。
AI其实并不神秘,在我们圈内一些老师看来,简化一些讲,AI就是定量构效关系,完成各种各样的定量关系。只不过当时我们用“已知模型框架”做算法和软件,后来出现了以“深度神经网络”为基础的工具,比如AlphaGo,AlphaGoZero。
从我的经历看,8年前CADD还不是那么火热,但正如当初预期,现在风口来了,CADD的能力逐渐显现出来了,用了AIDD这个词。但无论叫什么名字,药物研发的门槛还是蛮高的。
目前大家比较担忧的是很多闯入“AIDD”这个领域的人是不懂药的,以化学药研发为例,至少要懂药化、药理,否则光会玩程序,算出了一个binding(用于配体结合位点的检测,ligand binding site,LBS),就认为解决了药物发现的问题,这是比较危险的“乐观”。
雷峰网:近年来,您在知识库构建上做了很多工作,为什么决定从数据出发做工作?
我们在数据库上做了两个重要工作。一个是“通用知识的海洋天然产物数据库”(CMNPD)。这是北大药物设计研究室与北大计算机技术研究所等多家机构合作构建的,面向化学知识库自动生成的高效策略平台。
以化合物的结构为主索引,在结构信息、制备(来源)信息、谱图信息、科研人员信息、开展工作的科研实体等方面实现了自动化提取与整合,目前加工效率达到每天超300篇文献(大于每天10000个结构)。
特别是在针对复杂天然产物数据库的构建中,一个月内就可以完成数年非冗余海洋天然产物数据库的构建与标引工作。
另一个是参与到北京大学张陆霞研究员所承担的重点研发计划“生物与信息融合(BT 与 IT 融合)”重点专项:“基于AI大数据驱动和可信安全计算的创新药物筛选系统研发与应用”,前不久启动会在北大医学部召开。
回过头看,我们为什么要做这些数据库项目?
因为早在五年前我们就意识到了数据的重要性。当时我们也在用别人的数据,虽然能拿到一部分数据,但是底层数据是触及不到的。所以即便我们的能力再高,在下游的模型搭建上只能做一些修修补补的工作。
但这五年以来,我反而对自己做的模型和方法更有信心了,因为我们直击的痛点是“自主可控的原始数据”。只有自主可控的数据,才能使得模型自主可控。
目前我们的CMNPD数据平台上线后,一年内达六万点击量, 90多个国家访问。不同人的需求对接过来,我们首先会问他们要做什么问题?所以很明显,数据成了我们的护城河。
总体来说,后信息时代的生物医学研究,使整个生命科学领域都面临着学科整合的问题。只有整合,才能避免科学研究中的“盲人摸象”,而不同学科之间整合的基础和最优途径,就是结构化的知识和数据。
所以现在我有一个判断:未来“基于数据的科研”可能会超过“基于实验的科研”,效率和维度都会提升。而且大家也意识到,基于高维数据可以俯瞰整个学科,这要和翻阅某一学者的一篇文献或者若干篇文献,或者基于自身知识体系看到的东西不一样。
雷峰网:有人称,AIDD一定会成为药研专家必不可少的工具,这也意味未来数据一定是“兵家必争之地”。目前您在这方面有哪些准备?
大家都知道,数据很值钱,但如果仅仅把数据存到硬盘上是不值钱的,那是死数据。所以近年来,很多人想用联邦学习解决这一问题。
但联邦学习最大的问题在哪?
它本质上是一种加密的分布式机器学习技术,可以在不披露底层数据和加密形态的前提下共建模型。但在实际使用中,如果只是做了数据接口,并不能解决数据稀缺的问题。
首先,联邦学习使用的数据,大部分都是拷贝数据,甚至有些数据清洗完丢失了很多信息;
其次,由于联邦学习的数据光有接口,没有打通数据内部,所以“模型拿走数据留下”的理念具体实施起来非常难。
此外,国内搞了很多数据汇交,数据中心,但很多时候这些也都是“死数据”。
举个例子,ACS(American Chemical Society,美国化学学会)是世界上最大的科技协会之一,涵盖了20多个与化学相关的学科,是全球被使用次数最多的化学期刊源之一。
为什么ACS这么受欢迎?因为ACS的一大特色,Article References可直接链接到Chemical Abstracts Services(CAS)的资料记录,也可与PubMed、Medline、GenBank、Protein Data Bank等数据库相链接。
但ACS的创立时间是1876年,有150年的发展历史,现在ACS为了让数据流动,每年几乎花费4亿美元从全世界找人往里面敲数据。
这个事情中国现在干不了,我们和国外的差距,一是时间沉淀,二是资金支持。
因此,大概在五年前我们定了一个原则:绝对不做人工的事情,要做主动数据采集,不能做被动的数据获取,而且要找一个和AI技术结合得更好的数据解决方案。
我们现在认为自己做的还不错的是“面向结构的生物医药大数据生态社区”。这个社区的建设不依靠人工,首先是太过昂贵漫长,其次是依赖责任心和主观判断得到的数据也不可靠。
我们采取了几种方式:
第一,自动化数据主动采集。
我们不会让研究者自己去上传数据,而是采用光学识别技术(OSR,Optical Scanning Recognition)、语义识别技术(NLP)在内的AI策略,自动且高效抓取数据和构建知识库
第二,打造“面向学科的数据知识信息体系和社区”。
比如某位研究海洋天然产物的学者发了200篇文章和专利,我们只要把他的200篇文章和专利做结构化,就能很快推出一个免费的知识库。他本人也不再需要使用excel或者word工具去做标记,而是邮箱或账号登陆,马上就能看到结构化信息。
更进一步地,他可以再次利用自己的已有知识做分析或补充,并获得相应的积分,再去换取别人的知识和数据。通过我们的初步实践发现,这也许才是打造一个高质量知识库的更好路径。
事实上,结构化数据库已经成为我们研究小组的根基。虽然占比不大,但是自从开始做这个方向后,我们愈发看好这个方向,也计划在这个方向上投入相关的人力、物力。期待未来在药物研发的某个细分领域做出类似ChatGPT的工具。
雷峰网:北大在药物设计上非常开放,建立药物设计研究室,生物医药大数据库和生态社区,药物设计-信息与情报分析中心、“智慧药物研发平台”,与杭州市共建创新应用基地,以及前不久和10家单位共同开发创新药物筛选系统。您在这一过程中也进行了不少跨学科合作,有哪些课题可以分享?
在AI方向上,北大前不久刚刚获批教育部支持建设的“中国首个智慧药物研发平台”。这个平台包括了智能设计、智能合成、智能检测,智能筛选等四个模块,都可以对外合作。
我们正在跟晶泰科技洽谈,希望将他们的智能化自动化实验室,发展为我们面向特定合成方法的、训练模型的“数据产生器”。
如果将来面向单步合成的条件筛选一天能产生1万个数据点,一年就是365万个数据点,某种程度上就可以破解国外的数据壁垒或数据封锁。
除了扩大数据生产渠道,在数据标准上我们也有对外合作。
比如,我们跟望石智慧成立了“北大医学-望石智慧AI生物医药数据技术协同创新联合实验室”,在此基础上合作孵化了一些高质量的数据产品,并开发了一些面向业界的解决方案。
实际上,我跟望石智慧的创始人周杰龙先生在2017年6月就有过交流。我们之所以一拍即合,第一,我们都认清了一个问题,AIDD最根本的东西是数据、高质量、自主可控的数据;第二,AI的盈利模式很多,但是AIDD的盈利模式一定是药物品种交付。
我特别希望这个行业中有更多的公司成长起来,所以我以及北大团队都非常开放,我们和很多药企都有学生联合培养,比如泰德制药、普洛药业、望石智慧。
我接下来要讲一句话:中国现在已经进入到创新药时代,很重要的一点,我们“恳请”中国的创新药企业帮助中国的科研院所一起成长,把我们自己的创新药研发能力提升上来,进而服务于企业的药物研发。
我现在基本上每个月出差三次以上,主要工作就是和业界、医院沟通,包括我们很多项目都是跟企业、医院一起申请的。我们课题组算是跟行业、产业结合比较紧密的实验室。
这也是北大的一个理念:给企业提需求,高校建高地。我也经常跟学生讲,我们做任何事,一定要面向需求,就像习总书记经常告诉我们科研人员的那句话:广大科技工作者要把论文写在祖国的大地上,把科技成果应用在实现现代化的伟大事业中。
雷峰网:从您自己的研究经历出发,您觉得现在AI制药人才应该如何培养,还有哪些不足和问题?
我个人感觉AI制药这个概念热得太快。AIDD绝对有用,但需要一个发展过程,往后再看5年到8年,AIDD对于药物研发和智能医疗的作用一定不可估量。
为什么需要 5 到 8 年?实际上,这就是AIDD领域中的技术积累和爬坡的过程,而且这个过程必然要有,学费一定要交。
对学校的科研团队而言,科研经费比较充足,不那么迫切,但对于AIDD从业者和投资人来讲,大家都要有一些耐心。我能肯定的是,未来AIDD的收益一定会超过传统的药物研发,而且周期一定会缩短,但也绝对不会像医疗器械研发那么快。
回过头看人才培养,这个领域快速热起来,我挺高兴也挺担忧的。
一方面这个领域非常缺人,另一方面AIDD在过去属于小众学科,人才输出量没有那么大,能够培养到博士的人才更是少之又少。
但是让老师们非常尴尬的是,即使是一些在校期间水平不高的学生,因为沾上了一个概念,薪资不不低。现在一个硕士的月薪炒到3万以上,一个博士月薪炒到5万以上,高校培养人才蛮难的,人都抢光了。
雷峰网:国外有些基于AIDD的新药推到了临床一期,您觉得截至今天,进入临床的分子里面有哪些是没有AIDD,专家就无法设计出来的吗?AIDD的重要性是否会提高?
首先回答第一个问题,AIDD能够赢过专家?
大家可以这样理解,药物开发在某种程度上是“大海捞针”,那么AIDD在内一些新技术、新策略的介入,是让“捞针”的准确性稍微高点。但这个任务的本质没有变化,它依旧是大海捞针。所以如果把一个药物的发现过程倒回去,再重新做一遍,有可能就是变成了另一条路径。
药物研发中的影响因素比较多,是因为药物研发本身的链条很长,涉及数据、法规、主观因素,绝对不能说“没有AIDD,药物就发现不出来”。如果真的如此,那之前很多药物都是怎么来的?
但与此同时,AIDD的作用也在逐渐提高。
现在我们经常在讲,要做基于临床需求的、新技术驱动的创新候选药物研发。没有临床需求,药物研发就是“无病呻吟”,没有落脚点。
举个例子,之前有个新闻说到一个生理学家的女儿患了罕见病,无药可治,这位父亲就去学习药学知识,了解这种罕见疾病的临床表现,再利用自己的已有手段,结合新技术,完成整个药物发现过程。
所以这位父亲是有了主观动力,才想去解决具体的临床需求。但如今的行业现状是,新技术有了,但70%的疾病依然没有临床治疗药物。
第二个问题,AIDD的重要性是否提高?
我做一个推断,未来5-8年,大家会看到AIDD参与到药物发现过程中的证据或痕迹。那时候人们会惊叹AIDD的巧妙:“为什么计算机能发现,我没有发现?”
如果AIDD能给一个传统药物学家感受到惊喜,那它就是有优势的。所以我们是两边站的,我们愿意去接受一些新技术,期待它能超越我们。
不要说AIDD赋能整个药物研发链条,只要它能解决其中某一个环节,把这一个环节做好,在大家倒推结果的时候,发现这个工具确实是充分必要条件,就足够了。
雷峰网:AIDD和CADD,或者说AI方法和物理方法,各有什么优缺点?您认为未来二者的关系是什么?
这两个词怎么理解?CADD的全称是computer aided drug design,计算机辅助药物设计;AIDD是AI drug discovery,人工智能辅助药物发现。
业界在讲,“为什么以前叫CADD不热,叫AIDD就突然热了?”
解释一下,CADD是先预设一个模型,这个情况下需要加入专家经验。
比如我认为它是S型模型、二元一次函数,都是我给它预设一个模型之后,再用数据去训练它,最后把这个模型变成方程,并应用到具体的领域中。这也是早期机器学习的基本思想。
那么AIDD是什么?它不用做预设,给它一堆数据,直接就能基于深度神经网络学习一个模型,机器学出来什么算什么。这个过程当中,当加入新数据时,它能够自动做优化。
大家知道迁移学习(Transformer Learning),它最大的作用是以任务A开发的模型作为初始点,重新使用在为任务B开发模型的过程中。
例如,有了英语的语言模型后,后续只需要提供法语法规则和小样本数据,就可以很快帮你生成法语的语言模型。
但是AIDD的短板也很明显--只要有数据,它始终能给出答案。但是基于10个数据和基于1万个数据的答案是不一样的,但总会有“答案”。
因此,对AIDD来说,它和CADD一样:大量的、高质量数据是刚需。
基于这一点,我始终认为,CADD和AIDD没有本质性的差别,本身就是一体的,只不过业界或投资者有意把它们割裂了。至于各自的优缺点,业界的观点不太一样。
但只要有用,它们可以融合互补。比如目前数据不足的情况下,CADD肯定有优势,因为它的一部分模型是基于专家系统做出来的,普通人的知识很难企及。
而在数据足够多的时候,当数据本身可以涵盖或者超越专家的认知,AIDD的优势会更明显。这也是我们看好AIDD的一个原因。
但是现在行业里太多人爱蹭热点,包括最近GPT-4.0出来后,有些AIDD公司一周内就推出了所谓的“DrugdesignGPT”,这种跟风做出来的东西意义不大。
第一,达不到预期,自己和资本方失去信心;
第二,对药物发现的本质和核心路径的改变并没有实质性贡献。
雷峰网:针对国内创新药研发现状,目前还是 Fast follow 居多,或者是 me too ,me better,这种情况下最需要AI去解决什么问题?
首先我们要回归到一个本质问题,AI最大的作用在哪?
当给它40%的数据,AI有可能基于40%的数据产生一个模型,找到另外60%数据中的缺失点。现在我们比较看好AI模型,因为早在2016年和2017年,AlphaGo和AlphaGoZero已经展示出AI的“创造力”:当给它足够多的棋谱数据之后,它能够创造新的棋谱。
现在我们在跟国内的药企去聊,发现大家都形成了一个基本共识:Fast follow没有前途,很多药企提出新的创新药口号,“我们要做世界前五,中国前三。”
为什么?
因为中国已经被迫进入创新药时代,顶层制度设计为迎接创新药时代铺平了道路。
2018年3月,十三届全国人大一次会议表决通过了关于国务院机构改革方案的决定,组建国家医疗保障局和国家市场监督管理总局;
2019年1月国务院办公厅印发《国家组织药品集中采购和使用试点方案》的通知,确定将在4个直辖市和7个城市进行带量采购,涉及31个指定规格的采购品种。
2021年7月,国家药监局关于实施《药品专利纠纷早期解决机制实施办法(试行)》相关事宜的通告,预示着未来Fast follow生存空间变小,Fast in Class势在必行。
而且当中国进入创新药时代后,不管你愿意面对还是不愿意面对,都要面对。
像我们国家非常好的某家药企,2021年裁员了仿制药员工,根本原因是Fast in Class和Fast follow的思路完全不一样。
前几年创新药企业的日子比较好,某医药企业登陆港股市场,但上市来研发跟不上,对投资人的信心也有打击,最终结果是大家对创新药投资比较悲观。
但是再悲观,创新药时代已经来了,现在的重点是找到一颗好种子。
以前做仿制药,大家在找种子这件事上不愿意花钱,捡别人的就行。按照以前的药物研发生态,做成歪瓜裂枣也照样有人买。
现在你会发现,如果没有一个好种子,你的努力全部白费,市场和监管层都不可能认可。
因此,如何找到一颗好种子,需要“新技术、新策略驱动创新药候选品种研发”。实际上,AIDD就属于其中的一种新技术。我们比较看好,未来AIDD一定能够在创新药研发过程中赋能。
同时,我不想把AIDD单独拿出来说 ,因为它就是一种赋能技术。
我们也是亲历者和践行者,它一定能够起到作用,存在一条上升曲线,具体发挥什么作用,业界和投资界都稍微给点耐心。
雷峰网:自从2012年首家AI制药公司成立,至今已经第十个年头,但是依然没有一款药物成功获批上市,甚至进入临床试验的药物都凤毛麟角。AI研发的药物距离上市还有多远?
实际上你们看到的,跟我们看到的一样。所以我对行业的一个忠告,现在AI制药企业正处于艰难期,在资本和外界都很焦虑的情况下,一定不要为了应付“考试”,说出一些莫须有的话。
AIDD这个东西不是谎言,按照AI的药物研发规律,具体还有多长时间上市,我不能直接回答你,乐观来讲,给这个行业5到8年时间,就能看到一波AIDD设计出来的药物,至少做到让传统药物厂商眼前一亮。
现在以药学驱动的公司,或者围绕药物研发的公司太少。
有一个数据,截至2022年底,国内已经成立了73家AI制药公司,大部分都是IT背景的创业者转过来的,他们仍然是“互联网+”的模式。真正的AIDD,我想一定是药学家牵头的,叫做“药学+AI” 的方式。
可能在投资人看来,第一,药学家自己不敢吹,第二,药物家相对比较保守,这帮人知道药物研发这个任务有多大,也知道其中有多少变数。
但是现在很多AIDD制药公司的理念、研发路径、战略都不一样,如果拿中国历史比,现在更像春秋时代,连战国都还没到。
当然,我也对AIDD的未来充满信心。因为整个医药研发体系分为两个阶段:以PCC为临界点,前端为research研究;后端为development研发。
中国的后端研发体系很强大,特别是相对于欧洲,只要PCC之前的东西做好,中国至少在全世界排名前三没问题。所以中国药物研发的最大问题在于,前端的基础研究没有做好,根本能力提升不了。但只要种下一颗好种子,药物研发领域的信誉就建立起来了。
这也给我们高校老师提出的一个要求。对于产业也是一样,好种子种活了,整个产业都是得利的,所有环节都能打通。
雷峰网:目前AI制药公司大都进行到什么阶段,还有哪些痛点没有解决,技术瓶颈在哪?
瓶颈倒不在技术,是很多AI制药公司没有真正的做过药物研发。
我个人观点,IT驱动的AIDD公司,软件产品乃至服务都不是产业想要的东西。
其次,现在AIDD从业者, IT人很多,但是真正参与的临床专家、药学专家还太少。当然,一些公司可能是为了融资,找了一个做药的人站台。但实际上做药物研发,并不是靠一个药学背景的人就够了。
此外,IT人创立的公司,基因是IT的思维,药企人可能融不进去。未来需要让更多的临床学家、药物学家加入到AI制药中,由他们来攒局,创立IT公司,或者招募一批IT人才,解决药物研发当中的数据、知识,以及模型的问题。这样才能真正的触及AIDD技术,促使它面向产业,面向研发任务。
现在有个声音:未来会死一批AI制药公司。
因为很多公司用互联网思维做药物研发,互联网思维做消费是可以的,它们叫“高举快打”,但是在药品研发领域,药物研发的周期太长,速度太慢,“互联网+”这种方式不适合,半天到不了终点。
雷峰网(公众号:雷峰网):针对创新药,国内在这一领域还存在哪些薄弱环节?
有很多,最直接的是国家提倡的基础研究没跟上。
我们为什么会follow?说到底是别人有了,我们一做就是follow。原始创新太少。
比如靶点发现,人家敢做,我们敢做吗?
人家敢做,是因为背后有大量的研发数据,证明这个东西跟疾病密切相关。但试想一下,你一做之后,人家不做了,你心里是什么滋味,肯定很慌。这就是说,如果没有原始创新,你只能永远被迫去做follow。从国家层面来讲,基础研究是一个长期的事情。
同时,中国的优势也很明显:人口优势。这是西方所不具备的。因此我们的重要工作,是面向临床做原始药物发现。此外还有一点,要推动中国特色的创新药物研发,要制定我们自己的临床药物评审原则。
雷峰网:新药发现太难,很多百年药企巨头的爆款药物很多是靠收购而来。那么AIDD公司的出现,是否会加速百年药企“药物研发”的没落?也就是说,百年药企越来越依赖外部创新,自身的创新是否愈加乏力,会不会出现一种恶性循环?
百年药企,为什么会做这个事情?
第一,有钱。
国外大药企经常一个License out能开到20亿。但小的企业做不了这个事情,包括国内大药企也做不了,仍然保持自研。
第二,百年药企的成本权衡。
国外大药企很风光,但是内部的管理成本、人员成本,要远远超过小企业。
如果他们自己培养一支AI团队,一年要花20个亿,还不如合作上花20亿和AI制药公司合作,既能收到“果实”,还有可能埋了几个“种子”。而且只要能成一个,依靠他们这种大公司的强大商业能力,一定能获得回报。
所以我和创新企业交流时会说一句话,如果你本身没有AI研发基因,还不如跟高校合作,学习大药企的思路,把原始研发放出去。
事情证明,2015年后FDA批准的新药,59%都来自于Biotech和Bigpharma的合作。
这是一个好现象。
我曾经看到一个段子,大概是说某Bigpharma几千号人,研究十年,没搞出一个新药,后来有人考证过,其实是有研究出新药的,但Bigpharma研究效率低确实也是客观现象。
与此同时,从Biotech变到Bigpharma很难,因为短期内Biotech的商业能力不可能快速提升,不靠时间和资金积累是提升不上去的,所以Biotech也会主动和Bigpharma合作。合作才又可能产生赋能和共赢。
所以这是两厢情愿的事情,目的都是一个:更快完成能力积累,推出药物并盈利。
此外,这里还涉及到药品专利保护期的问题。药品跟别的不一样,它的专利保护期非常重要,多一年可能就多赚十几个亿,少一年就少赚十几个亿。这种现实情况下也让他们更愿意合作共赢。
所以,我不认为百年药企会没落,或者AI制药公司会没落,只不过大家在药物研发和商业版图上做了更好的分工而已。
雷峰网:归根到底, AIDD的价值还是需要跟药企的合作来证明。在您看来,传统药企或百年药企巨头,他们对于AI 制药新技术的看法是怎样的?怎么去做成果验证?是否愿意付费?
百年药企对AI这种新兴事物比较欢迎。有个数字,过去五年,国外一些创新药企业已经开始关注前端研发,超过40家药企建立了跟AI研发相关的部门。
为什么它们不抵触?因为药物研发行业跟别的行业很不一样,别的行业可能会竞争,但是百年药企缺少药物品种,有人能给我更多的选择,我为什么不去鼓励呢?
另外,百年药企更关注的是自身的商业版图。这种情况下,它和AIDD公司是一种互惠互利的关系,没有理由去反对,甚至是欢迎、扶持。
但是你会发现,药企跟AIDD公司的合作,更多的是药物品种交付。药企不管你的软件有多好,能做品种就合作,签一个里程碑付费的合同。
雷峰网:最近ChatGPT 火,包括背后的AIGC技术,对AI制药行业产生了哪些影响?
我们非常欢迎新技术的出现。早在OpenAI和DeepMind两家公司成立之初,我们就有关注,这些年来它们已经分化出两种不同的技术路径。
简单来说,前者非常注重数据和语料,靠规模数据、庞大算力、充分训练而“大力出奇迹”的暴力美学,在大模型时代发挥到了极致。
后者是不搞暴力美学,大搞神经科学,在数学、物理,这些涉及抽象世界和人类深层直觉的领域长期深耕。比如2021年DeepMind与顶级数学家合作研发的AI登上Nature,找到一个几十年来都没有结局的数学猜想,2022年与瑞士等离子体中心合作开发的AI系统参与核聚变。
但实际上,它们最终解决的问题都是一个:如何让电脑看懂你在说什么,而不是简单的复述。
这个是基础,因为人工智能三个领域--图像、语音和语义。
实际上,ChatGPT代表着人工智能在语义方面已经迈出了第一步。这对于AI制药非常重要,因为这个领域的发展方向就是做“基于知识的药物发现”。
以前AI不懂语义时,我们要像一个老师一样,给AI“喂知识”。未来AI懂得语义之后,我们只需要给它“喂数据”就行,甚至是一种开源数据,不需要提前做太多规范。
另外我认为ChatGPT这些技术的出现,也迅速让AIDD行业热闹起来了,大家都在说基于GPT-4要做一个DrugDeginGPT。不管说法对不对,至少有人意识到,以ChatGPT代表的语义解析能力,将为药物研发、智能医疗带来很大的赋能。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。