0
本文作者: 何思思 | 2023-07-27 17:58 |
作者丨何思思
编辑丨林觉民
“如果单指Gen-AI(生成式AI)的创业热潮,中美两地都在共享盛宴。如果指大模型本身,可能只是国内一片热火朝天,”谈到中美大模型发展热潮,AI观察者张斯成如是说。
其实,大模型在国内火了已经有半年时间,百度率先嗅到了商机,并发布文心一言,这一举动也顺利揭开了大模型市场的帷幕。随后国内迎来了大模型密集发布月,阿里云的通义千问、商汤的日日新、昆仑万维 的“天工”3.5以及知乎的“知海图AI”等陆续亮相。当然除了头部大厂外,也不乏创业公司的入局,诸如王小川、李开复等。
一位大模型从业者告诉雷峰网,目前国内做大模型的公司已经有138家左右,且这个数字还在持续上涨。
由此可见,国内大模型产业正在如火如荼的进行。反观这些大模型厂商,张斯成将其分为四类:一是做基础大模型的研发。二是做垂类模型,结合场景去构建领域内的模型。三是做应用,基于大模型的能力解决实际问题。四是围绕大模型的基础技术或设施,比如工程化、数据库、数据处理等。
大模型在国内的火热程度早已不言喻,但由于其不是本土化的概念,所以在大部分人追捧的同时,也有人在质疑,甚至有人给大模型扣上了“抄袭、套壳、画皮”的帽子。在张斯成看来,只有中国在大模型方面是热火朝天的状态,硅谷创业圈更关注如何应用大模型,改变日常生活和工作。
其实不然,正如张斯成所言,除了一批做通用大模型的企业,也有一批专注做垂类模型和上层应用的企业,诸如CRM领域、人力资源领域、营销领域...他们想做的正是基于大模型的能力解决实际应用的问题。
但从目前发展来看,大部分企业仍停留在追热点阶段,实际上并没有成功的产品落地。对此,张斯成也发表了自己的观点。他表示,主要原因在于,中美对创新的认知不同,美国对创新的认知更强调广度,即技术的创新只是大众认知中的一部分,普通民众对于日常场景中的创新会更加关注。
而国内对创新的认知更偏重技术层面,再就是当GPT霸版时,国内呼声最高的是我们自己的大模型在哪,再加上OpenAI的限制,地缘政治之间博弈再次推高了国内对大模型本身的热情。
这也从侧面反映出了,在国内大模型还是一个新项目、新技术,企业更多的是为了做出大模型而做大模型。简言之,没有坚实的大模型底座作为支撑,何谈成熟的上层应用。但相比之下变,国外以OpenAI、谷歌为代表的大模型技术和生态早已相对成熟,且具备了为上层应用服务的能力。
“如果说硅谷的泡沫闻起来是香甜的,国内的则略显苦涩,”对于中美大模型的发展态势,张斯成评价道。
以下是雷峰网和张斯成的对话:
之于大模型,硅谷关注应用,国内关注的是自己的模型在哪儿
雷峰网:最近中美两地迎来大模型创业潮,您怎么看待这一现象?
张斯成:如果我们指Gen-AI(生成式AI)的创业热潮,可以说中美两地都在共享盛宴。如果指大模型本身,可能只是国内一片热火朝天。硅谷创业圈对大模型本身的兴趣,更多在于如何应用,如何改变日常生活和工作。这其中既有创业文化的因素影响,也有产业格局和路径的原因。
一方面,美国社会对创新的认知,比较强调广度,也就是说,技术上的创新只是大众认知中的一部分,普通民众对于日常场景中的创新会更加关注。一个新的技术出现时,如果不能快速破圈,那么很可能只会停留在科研和学术的小圈层中。这也是为何OpenAI在推出ChatGPT之后才迅速成为了大众视野中冉冉升起的明星。
另一方面,LLMs(大语言模型)的发展历史上,当OpenAI默默发展数年之后突然一个弯道加速甩开Google身段时,Microsoft及时的强力助攻让GPT模型迅速成为了全行业的参考系。直到Meta抛出同等级的开源模型后才动摇了GPT霸榜的局面。与此同时,其他大厂或反思或等待或观察,都没有仓促上马推出自己的大模型,反而是积极寻找差异化的定位,比如Apple一直是在冷眼观察找时机再切入。在这种基础上,创业社群里讨论更多的是如何运用已有的技术能力,发掘更多有趣的应用场景。过去几次由技术引发的创业热潮中,以应用场景脱颖而出的独角兽公司比比皆是,结果或是IPO或是被并购,皆大欢喜。
雷峰网:国内是什么样的状态,有什么不同?
张斯成:相对而言,上面说的两个方面在国内都呈现着不同的状态。一方面,对创新的认知,大多数国人还是偏重于技术层面,技术含量成为了一个默认的标准。
另一方面,当GPT霸版时,国内舆论呼声最高的是我们自己的大模型在哪,再加上OpenAI的开放限制,地缘政治下的博弈推高了国内对大模型本身的热情。在这种环境下,应用侧的创新基本被无情地忽略了,产业和资本圈都争先恐后地涌入大模型研发,军备竞赛式的争夺如火如荼。半年下来,国内创业社群呈现出内冷外热的感觉:一边是围观“百模大战”的热闹,一边是缺乏技术成熟、商业可用的基础大模型的尴尬。结果资本和人才都被各种花式模型拉扯分割无法合力,应用生态又无从繁荣来支撑大模型的故事预期。如果说硅谷的泡沫闻起来是香甜的,国内的明显有点苦涩。
雷峰网:它们的创业方向分为哪几类或哪些流派,哪派比较有机会?
张斯成:不论是国内还是硅谷的创业,业界基本都会分成三到四类。第一种是做基础大模型的研发。第二种是做垂类模型,结合场景去构建领域内的模型。第三种是做应用,基于大模型的能力解决实际问题。第四种是围绕大模型的基础技术或设施,比如工程化、数据库、数据处理等。
这四类中,中间两类的边界目前变得越发模糊,或许也是双向奔赴的结果。目前各大云计算平台着力推MaaS(model as a service),也在尝试把前两类融合在一起。我个人不会按流派来划分创业团队,那种做法比较江湖范,更多还是看每一个项目对自身的定位是否清晰来判断它最终在产业格局中的可能价值。
雷峰网:目前圈内流行的对大模型的看法和认知,哪些说法是比较认同的?
张斯成:我不是大模型领域的技术专业人员,所以更多是从产品和商业的视角去理解当前的发展状态。就所知所闻,谈谈我对业内几个流行观点的看法。
第一,应用为王。这个我双手赞成,因为从产业的角度看,最终生产力的变革必须以社会财富的极大变化为佐证。只有大规模多样性的应用才能让一种技术进入良性的上升螺旋。人类点亮科技树的次序并不是随机的,其中需要大量、广泛、持续的运用和传播才能奠定某项技术的里程碑。这是我在阅读著作《世界文明中的技术》时得出的重要结论。因此,大模型技术在达到基础可用之后,在科技史上的地位轻重就要看应用的发展了。
第二,数据是瓶颈。这个我也基本赞同,不过要加上一个限定词:短期内。目前算法而言大多数都处于同一层面,还没有出现明显的段位差。所以数据成为了短期竞争的热点,数据的来源、质量、规管等,都有可能会成为瓶颈,反之也就是优势。
雷峰网:那哪些是你觉得有问题的?
张斯成:“LLMs将带来AGI”这个观点我越来越倾向于不敢相信。虽然大模型领域每天都在进步,比如最近在数学推理方面的进展,但大家也能隐约感受到模型能力的天花板。在构造世界模型的话题上,以Yann Lecun为代表的学者提出不同的方式来提升学习算法。
从人类智能的产生角度而言,具身个体的移动能力相当重要。虽然前些天有研究者在论文中提到将ChatGPT和机器人结合的实验,但还只是一小步。而且最近流传出来关于GPT-4的训练模型结构中,已经可以看到在工程和算法方面的不少妥协。这些可能都在暗示,AGI无法完全依靠LLMs来实现奇点的突破。或许,实现AGI的拼图中,LLMs只是一部分。
大模型释放“无尽推理”能力,B端迎来新的卡位赛
雷峰网:大模型的未来,你更看好To C 还是To B 模式?
张斯成:由于过往的职业经历,我在同时关注2B和2C。我认为AGI对人类社会的根本改变是来自对生产力的终极变革,因此2B是最能体现AI对价值体系进行破坏式创新的领域。但如果参照人类历史最近几次重大的生产力变革过程,一项关键技术的渗透路径往往都是从2C到2B。
也就是说,由于技术对生活应用场景的改变教育了个体对于新技术的认知,进而传导和激励个体在生产应用场景中对新技术的运用。
这种模式在Gen-AI阶段会更加明显。因为Gen-AI最直接影响的就是内容领域的形态,而内容消费又是人类社群在注意力经济范式驱动下越来越重要的活动。因此,2C领域应该是Gen-AI最快产生第一波爆发的地方。
随着2C领域出现一系列成功火爆的应用,2B领域也会通过参考2C领域的行为校正模式找到运用AI的正确方式,由此开启广泛改变生产力的序幕。
当然,2C和2B领域的项目并不会严格区分入场先后,而是会多路并进,只是整体上可能会呈现这种律动。
雷峰网:那To C和 ToB的重点有什么不同吗?
张斯成:对于国内的Gen-AI的创业者,我曾经有过如下建议。如果选择2C领域创业,最好从面向国际用户开始起步,因为一方面硅谷的大模型技术成熟度和可用度相对都较高,可以支撑2C应用快速发展所需的能力,另一方面国际2C领域的竞争环境和文化相对宽松,可以站在同一起跑线上竞技。
如果选择2B领域创业,那还是要立足于国内,因为对组织型业务的理解需要较强的文化和地域特性支撑,而且来自开源社区的支撑让满足客户的个性化需求成为可能。
雷峰网:To B模式在中国会不会又陷入高定制、没利润的软件行业老路?
张斯成:至于国内的2B创业是否会如同SaaS一样,陷入当年商业化软件的发展困境,我认为这种可能性不大。国内2B SaaS之所以一直无法顺利发展,是因为长期以来受到Me-too惯性思维的强烈干扰,也就是试图移植欧美成熟的SaaS模式到中国土壤上落地生根。这种思维从2013年模仿Salesforce的成功开始,直到最近几年才在不断遇挫和反思中进行了适应性改造。
不过,这次Gen-AI的发展,国内与硅谷的进度条差异不是很明显,所以是有可能会走出一条自己的道路。这个就像当年电商和支付的发展,脚踏实地去创新,实现了反超,进而引领了潮流。再说现在还有一种思潮是AI-native,探索如何从根本上改变AI的应用模式,那将是一种掀桌子式的重构。
雷峰网:AI-native怎么理解?具体表现是什么?
张斯成:其实可以回顾过去十年2B领域的互联网化历程。从最初的“互联网+”,强调用所谓的“互联网思维”来改造各行各业,到之后的“+互联网”,通过赋能来激发各行各业运用互联网工具实现自我进化。可以说,“+互联网”打败了“互联网+”。
我认为,接下来会快速从“+互联网”进入“+AI”阶段,也就是说,各行业在积极寻找如何具有Gen-AI的能力。然而,最终的结果,都将走到“AI+”阶段。在这个阶段,AI将不再以工具的从属身份出现,而是在很多方面与人类几乎平权,半自主的参与对各种场景的重构中。在这种重构中,将第一次出现人类以外的视角,甚至不同的逻辑。而“+AI”过渡到“AI+”之间,就是AI-native大行其道的时期。
雷峰网:所以说大模型不会冲击,反而会给B端带来新的发展模式?
张斯成:对,在2B领域,不管是近期的“+AI”,还是远期的“AI+”,最终都要回归到对业务价值体系的理解和接受上。在Gen-AI的渗透下,有些业务模块会提升,有些会消失,有些会重构。我相信,2B领域接下来将出现的发展模式,是大模型的数据和计算能力下沉为云计算平台PaaS的一部分,应用和互动能力上升为SaaS的一部分。所以,SaaS可能会相应从Code as a Service升级成Copilot as a Service,最终再演进为Agent as a Service。
对于前者,重点在于如何实现Copilot的能力,因为用户还是Pilot。对于后者,重点在于如何定义Agent,因为需要解决信任和授权的问题,这个过程会经历比较长期的实验性试错。
所以,对于云计算平台而言,Gen-AI相当于提供了一种新的能力,即大模型所产生的“无尽推理”能力。各大云平台不约而同地发展出了MaaS,横向对接PaaS,向下对接IaaS,向上对接SaaS。这个新一代的云计算平台,将在2B领域掀起新一轮的卡位赛。
做“垂类模型+应用”的机会大,但要找合适的赛道切入
雷峰网:您最初对大模型/AGI有一个什么样的预判?
张斯成:在3月份的时候,我对AGI的发展预判大致分为了两个阶段:Copilot as a Service和Agent as a Service,而且我认为两者之间可能会存在比较长的过渡期,因为前者到后者不仅需要解决技术跃迁的问题,更需要解决信任和授权问题(这对人类社会从来都是一个巨大的挑战)。相对于Model as a Service更关注云计算在资源层面的整合,这两者都是从应用层面来评估AGI对人类社会的影响。
雷峰网:现在处在哪个阶段?
张斯成 :当下,整个世界正在大步流星地进入Copilot as a Service阶段,这个在SaaS基础较好的市场会更加明显。Copilot这个概念是Mircosoft推而广之的,在与OpenAI建立战略联盟的第一时间内将自家的全线产品都进行了升级。这也在某个程度上折射出软件巨头们对于AI短期发展的明确预期/判断,也就是作为人类的助手来提升软件服务的质量,以实现更高的商业价值。
雷峰网:其实创业公司想要在这个阶段做好,还是有难度的?
张斯成:对创业公司而言,机会在于全域灵活度和局域专业度。不得不承认,做基础大模型的研发是需要巨大且长期的基础性投入,如果今年才起步去和平台公司竞争是不大明智的,最好结果是被并购,但这注定是少数人的游戏甚至是伪游戏。
做垂类模型+应用有不小的机会,但是要选择合适的赛道切入,比如长期被平台巨头忽视的领域、天然壁垒较高的领域、或是团队本身拥有较强资源的领域。对于已经处于创业中途的SaaS公司,这个方向是最有机会做成独角兽的。还有一个比较有前景的方向,就是开发技术类的基础工具,为大模型相关的创业者提供某些技术服务,用于提高技术层面的效率、能力、或精度,这个和当年淘金热时卖铲子的道理如出一辙。
雷峰网:那应该如何建立自己的优势?
张斯成:对于在应用层面如何建立自己的Copilot的优势,我会建议创业者考虑五点。第一,快速转身,尽早理解和引领Copilot在各自领域的定义。第二,回溯价值网络,判断LLMs的能力对于业务场景的价值影响,是升级、替代、扩展还是创造。第三,借力打力,不论开源闭源,利用成熟的大模型能力来占据场景、积累用户、建立数据飞轮。第四,放弃幻想,不要试图复制烧钱做市场的神迹,从第一天就开始商业化落地,自我造血。第五,以终为始,结合对Agent形态和内容的探索来持续调整Copilot阶段的设计和节奏。
雷峰网:行业大模型在未来是不是伪命题?就像当年垂直电商,必定会被通用电商公司打败。
张斯成:关于垂类模型和通用模型之间的竞争会如何演进,我认为这个问题应该从三个角度去分析。
首先是数据。在每一个领域,数据都具有明显的边界。领域数据是对客观世界的一种反映和记录,在领域数据的基础上发展出了领域知识。同等条件下,对于同样的领域知识,通用模型和垂类模型在训练之后获得推理能力是相似的。在目前的现实环境中,这种情况并不大可能出现。
原因在于两个方面。一方面是过去互联网的发展所形成的格局导致领域知识被分割和隔离,一家实体往往无法获得跨越其边界的领域知识,比如最近一些互联网平台开始对OpenAI进行了数据获取的限制或封锁。更不用提国与国之间,企业与企业之间对于私有数据流转和交易进行严格限制。另一方面,目前的LLMs算法在训练中需要进行越来越高强度的对齐,这意味着各种领域对齐所用的方法和内容将在更大程度上影响推理结果的呈现。比如最近OpenAI预计有20%的算力用于GPT-4的强制对齐。所以,领域知识可能在很大程度上将为垂类模型的存在建立一道保护墙。
其次是能力。如果从世界模型的角度看,任何LLMs都在尝试通过对数据的学习来建立和完善其对客观世界的认知。由于Gen-AI算法原生的概率属性,垂类模型中的认知明显要比通用模型要聚焦,频谱也因此更窄。在频谱靠近中间的区域,垂类模型明显胜出,在越靠近边界的区域,垂类模型的表现应该会越来越差,而通用模型没有这类问题,表现应该会比较均质。同时业界存在一种观点,认为AI发展越靠近AGI的奇点时,通用模型在能力上将产生更大规模的涌现,类似产生融会贯通的效果,以致于突破领域知识带来的边界,从而在能力上全面碾压垂类模型。如果我们相信AGI必然到来,这种观点很可能是合理的。只是考虑到时间问题,在可见的将来垂类模型依然有很大的聚焦优势。
最后是成本效率。LLMs在训练和推理中所需要的数据和算力成本,大家从OpenAI所披露的数据中都可以感受一二。在开源社区提供的大模型基础上,不少开发者也针对一些领域进行了训练和微调,得到了所需的成本信息。不难看出,垂类模型从成本效率角度而言是具有优势的。
基于以上分析,我倾向于认为在AGI到来之前,垂类模型是不会被通用模型所征服的,他们有各自的生存空间。这个有点像过去十五年云计算的发展,公有云和私有云依旧是分庭抗礼,各自精彩。
大模型公司的三大特质:满级信任、主动式透明、打不死的逆商
雷峰网:最近您接触了哪些做大模型的公司和人?
张斯成:在六个月之前,我和很多人一样,决定要投身这次人类历史上最具有变革性的创业浪潮中,也可能是人类文明的最后一场“无限游戏”。在这个理念下,我与很多创业者进行接触,不论是专注大模型研发和应用的新生创业者,还是希望嫁接大模型能力的资深创业者。其中既有国内的团队,也有国际化的组合,不过主要还是华人,毕竟我大部分的工作经历还是在华人世界中。过去由于工作的关系,我和投资圈的大多数机构都有联系,这次也和不少优秀的投资人进行过深度交流。可以说,我在力所能及的范围内,对这次Gen-AI创业相关的群体进行了广泛且有一定质量的接触。
雷峰网:他们哪些共同特质是您比较喜欢的,或者说你认为什么样的人在这方面会有成就?
张斯成:对于团队的特质,首先是“满级信任”。合伙人/联合创始人团队中,必须存在稳定持久的信任三角,这是获得成功最关键的必要条件。从我自己几次参与创业的经历,以及过去在钉钉负责生态时耳闻目睹各种创业伙伴的故事中,这一点都得到了不同程度的印证。创业本身就是九死一生(从概率角度看)的历险,何况Gen-AI的不确定性更强(难以预测的程度),所以只有用接近于无条件的信任来做风险对冲,才有可能避免团队的中道崩殂。虽说这个听上去有点儿傻,但往往也正是stay foolish的团队才有机会成功闯关。
其次,“主动式透明”也是很重要的特质。我们经常强调一个核心团队内部要足够透明才能规避掉无效的协同和消耗,这对创业型公司尤其重要。因为开创一个新业务的过程是几乎没有任何缓冲余地,不仅容错率低,而且血槽也短,经不起几次内部或外部的折腾。在Gen-AI时代,我会更期待一种主动式的透明,也就是核心成员之间能够主动分享各自的业务进展,而不是等着被动要求下呈现出透明。而且AI也会逐步成为具有一定智慧的助手/成员参与到创业团队中,主动式透明将成为实现人机融合团队的一种特质。
最后,是“打不死的逆商”。对于职业经理人,情商是一个重要的特质。而对于创业团队,则要考察逆商。逆商要求一个人要有信念、有行动、有取舍。在一个初创的业务中,生死考验往往都不是集中在几个重大的时间节点,而是渗透到无数微小的细节中。也就是说,所谓“moment of truth”是持续不断贯穿于整个早期,选择无谓大小,每一步都可能导向完全未知的前景。因此,必须要有坚定沉稳的信念,必须要以行动来捍卫自己的选择,也必须学习杀伐果断,舍中有取,先舍后取。可以预见,在Gen-AI时代的创业节奏将大幅加快,意外和明天不知道哪个会更早降临,核心团队的每个成员必须都具备充分的逆商才能避免成为团队生存的软肋。
能够具备以上任何一点的团队,在这波创业热潮中都是足够优秀的。同时具备三点,大概率能在竞争中脱颖而出,也是我所心仪的。
雷峰网:接下来三到五年内,哪些行业或者领域是比较适合创业公司进入的?
张斯成:在未来三五年,我个人比较看好的场景是陪伴类的服务,行业包括教育培训、健康医疗、金融理财。对于个人消费者而言,陪伴带来的情绪价值是有时间厚度的,可商业化的潜力最高。这也是AI最有能力建立差异化服务的地方。所以,我非常看好Character.ai和Rewind.ai这类项目。广义上说,游戏也是一种陪伴,类似《头号玩家》中的场景具有强大的生命力,因此在某种程度上可以说AGI将重建元宇宙的梦想,这样或许能理解为何Meta不遗余力在LLMs开源社区进行投入。
对于行业而言,我认为应该聚焦符合以下三个特点:痛点亦刚需、数据自生产、知识即专业。迄今为止有三个行业非常符合这个画像:教育培训、健康医疗、金融理财,也分别对应了人类个体的三个主流诉求:成长、寿命、财富。当然,还有一些比较有特色的细分领域,也是值得关注或押注的,比如招聘、婚恋、法律等等,具体以后有机会再展开说说。至于创业者选择做2B还是2C类型,还是应该在充分自我认知的基础上因地制宜,切忌随波逐流。
雷峰网:分析一个大模型项目是否有未来,具体有哪些维度?
张斯成:这个问题不容易回答,因为站在不同的立场会有不同的角度,比如投资人和创业者,前不久朱啸虎和傅盛的朋友圈争鸣也投射出了这点。作为一个观察和参与者,我倾向于从四个维度去分析一个初创项目。
第一,大趋势下的匹配度。任何创业都是一个时运结合的项目,一方面要吻合趋势发展的方向和可行路径,一方面要掌握好时机和节奏。对于一个Gen-AI的项目,在当前阶段,这两方面显得尤为重要;
第二,团队的逆商。如果可以非常幸运判断对了赛道和时间点,接下来最大的问号就是,为什么是这个团队。对团队构成的分析是初创项目的最关键评估点。一个普遍的观点是关注核心团队在能力上是否互补;
第三,竞争模式。每个被证明有效的赛道都不会只有一个创业项目,特别是在国内,人才资源存在较宽阔的同温层。因为项目之间的竞争力比照,也是一个体现功夫的地方;
第四,赛道终局。每个赛道都是AGI这个大局中的组成部分。这个维度的分析,其实更多的是一种预测。分析的结果不是强化取而是强化舍。也就是说,对每个赛道可能终局的猜测,会直接影响是否继续投入这个赛道。
雷峰网:终局赛道应该很难选?毕竟要预判哪个赛道是最具潜力的?
张斯成:我认为在Gen-AI项目中,要更加重视规避为了差异化而差异化的行为,因为在不少赛道上很可能就会是同质化的、硬碰硬的竞争。为了达到这个目标,一个可行的方法是采取类似第一性原理的方法进行解构,这样有助于真实触摸到每个赛道的主脉络,并沿着这个脉络设计和决定适合自己的竞争策略。
比如在国内做基础大模型的研发,就必须考虑各大互联网平台公司的存在。再如,发展到某个阶段时通用大模型是否会超越大部分的垂类模型?AGI最终是一种世界模型独霸天下还是多种世界模型并存?具身智能是否是实现人类智能的必要条件?我们对以上类似问题的预判都会影响我们对项目前景的置信系数。
雷峰网(公众号:雷峰网):您认为,AI会对这些领域产生怎样的影响?
张斯成:如果问AI对人类社会将产生什么影响,我们的确很难预测。但有一点是几乎确定的,AI将改变人类社会的基础结构,因为它将彻底颠覆人类之所以成为地球主宰文明的前提:智能的唯一性。无论我们以何种姿态拥抱这个必然发生的未来,无论我们能否在有生之年见证这个奇迹,我们都应该满怀敬畏,放下个体的执念,以延续人类文明为己任来发起和参与这场创业热潮中。科技向善,这或许是最值得我们共同去珍惜的初心。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。