0
卷了一年多,大模型真的“火”了吗?
有关大模型,似乎总有吵不完的架:追求“大参数”还是考虑“Scaling Law”?“稠密”和“稀疏”哪个框架更优?“语言”和“多模态”谁才是大模型的真正未来?玩家们旗帜鲜明、各有主见,而这个热度,却似乎一直没有传导到更加落地的市场上。
而一众大厂中,百度是大模型工程化落地的凤毛麟角——根据今日释出的2024年百度第二季度财报显示,显示季度总营收339亿元,百度核心营收267亿元,百度核心经营利润56亿元,同比增长23%。
文心大模型日调用量超6亿, AI 带动云营收51亿元,同比增长14%,涨势喜人。
把“飘”在天上的 AI 落回地上,能有如此成绩,百度做对了什么?
先说百度 Q2 财报最亮眼的数据——文心大模型调用量的猛增。
日调用量超6亿,日均处理tokens文本数超一万亿。调用量狂增的背后,总让人想起今年5月那场声势浩大、引得整个行业关注的“大模型价格战”。
这场战斗中,百度杀价的力度堪称“凶猛”:
战斗打响很快,百度就直接宣布将 ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny 系列模型预置服务免费;
而到了今年7月,在 WAIC 期间,百度智能云宣布进一步降价,把 ERNIE 4.0、ERNIE 3.5 两款旗舰模型的价格大幅压低,输入输出分别低至0.03元/千Tokens、0.06元/千Tokens。
把价格门槛直接摘掉,自然有不少用户竞相涌入。尤其是不少大中、中小型公司机构,没了对成本的顾虑,也就有了尝试大模型的热情。
价格降下来,确实减少了客户调用的“推力”;而大模型竞争如此激烈,即使价格再低,尤其在当下价格已经低无可低的情况下,为什么文心可以脱颖而出?
早有文章分析过,百度能够进行如此近乎决绝的让利,本质上依仗的是百度更先进的全栈 AI 技术力,才有了免费和降价的底气。
文心大模型诞生以来,就紧追时代的潮流,文心大模型的周均训练有效率达到98.8%,相比文心一言发布时,训练效率提升到当时的5.1倍,推理105倍,推理成本下降至最初的1%。6月,百度还推出了飞桨3.0,此次升级显著提高了飞桨框架与百度 AI 基础设施和文心大模型的兼容性,有望在未来进一步降低模型推理成本。
对于当下大模型用户的痛点,百度剖析得非常深刻——用户的第一类痛点,是应用落地的门槛比较高,如何快速结合场景开发出合适的的应用;而第二类痛点,则是对于具体的场景,如何用专用模型满足自己的行业需求。
本质上,一个技术产品让用户买账,第一性仍然是技术产品的“可用”和“好用”。
就在财报发布前一天,百度宣布支持对旗舰大模型 ERNIE 4.0 Turbo 进行精调。此前,百度千帆大模型平台已支持 ERNIE 3.5、ERNIE Speed、ERNIE Lite、ERNIE Tiny、ERNIE Character 进行模型精调,截止当前已共计6款文心大模型可在千帆平台进行精调使用,累计精调出2.1万个模型,服务超过千家企业核心业务场景,拥有众多成功效果案例。
政务领域,中华全国总工会联合百度智能云,把 AI 的能力用在了法律咨询上,让劳动者可以通过大模型,更精准地了解法律问题、更快地计算劳动赔偿金额、更个性化地完成案情评估。
相比传统的开发方式,这套对精准度、反馈速度要求极高的系统,交付仅用了一个月,相比传统3-6个月的交付周期有显著的效率提升。
生产力能有如此提升,让更多用户看到这个价值,文心大模型的调用量不涨都难。
AI 迅速发展,给百度带来的直接成绩,是公司云业务的持续增长。
财报披露,Q2季度,百度智能云营收51亿元,同比增长14% ,AI 收入占比9%,高于上一季度的6.9%。
把优秀的大模型当作一张名片,与之结合紧密的云业务也自然被随之带动。AI 应用的大繁荣,让 GPU 云慢慢成为企业采购时的“标配”。
于是,模型即服务(MaaS)的模式正逐渐登上舞台,成为百度云增长的新增量。
据 IDC 最新报告,百度智能云在2023年中国大模型平台市场份额位居第一,达到19.9%。同样,在今年国内近260个已公告中标的大模型项目中,百度领跑中标单位排行。在主流大模型厂商中,百度中标项目数量最多、覆盖了最多行业、也已6400万+的中标金额冠绝群雄,蝉联三项第一。
在大模型落地的这段时间里,千帆平台“闷声发大财”,已经累计服务了15万家客户,在政务、电力、教育等多个行业发力,不仅让技术产品得到了市场的认可,更给社会带来了生产力升级的回馈。
在河南、重庆等地的乡村中,千帆正推动着“大模型下乡”,把医保缴费、户籍办理等最细碎、最耗时的问题,让村民放心交予大模型辅助。
遇到本地政务知识库难以精确覆盖的问题,大模型还能结合百度搜索给出解答,并自动@诉求提问人回复,把全时无休的便民服务带给乡村。
目前,居民助理已经走入超过6000个村庄,让普通老百姓也能享受更加智能的生活。
要让客户感到“可用”和“好用”,百度在大模型商业化上,靠的更是在大模型工具链上的升级。
深耕工具链升级,是百度在今年技术发展的主旋律之一。
在模型精调的角度上,ModelBuilder 推出了混合文心大模型高质量数据功能。用户可以将通用混合语料和垂直领域语料,与业务数据进行融合,来精调出更稳定、效果更好的行业专属大模型。
到了 AI 原生应用开发的角度, AppBuilder 解决了客户在开发 AI 原生应用时的不少难题——海量知识检索、自定义策略、企业级安全保障等几个方面都有所增强,把大模型的可用性再提升了一个台阶。目前,已有超数十万应用在平台上被创建,覆盖在线教育、电商、政务等行业。
百度的大模型体系对客户生产力的实际提升,在业界有目共睹。
而回头看,百度自身也有一个巨大的技术产品生态,大模型的能力如果真的如此厉害,能让百度这棵24岁的“老树”再长出“新芽吗?
互联网上,有这样一个广为流传的故事:第二次世界大战中期,战争正是焦灼时期,美军降落伞的质量却令人堪忧,为了让降落伞的合格率达到100%,军方想出了一个法子:让降落伞的销售人员亲自测试,不跳就不能过关。如此一来,降落伞的合格率才终于接近了100%。
“一个产品,如果你自己都不用,那么何谈让别人放心呢?”
同一个的道理,对于百度也一样适用。早在去年,李彦宏就喊出了要用文心大模型重构百度旗下所有产品的豪言壮语。而首当其冲的就是百度的大本营——搜索。
目前,已有18%的搜索结果由 AI 生成,能够为用户提供更准确和直接的结果。这恰好印证了百度在一年前提出的“新搜索”的概念,以“极致满足”“推荐激发”和“多轮交互”三个特点,让用户的搜索结果更准确、更有组织、更直观。
智能体是其中关键的一环。百度正在搜索结果中加快分发智能体,目前,百度的智能体日均分发次数已经超800百万,是5月的两倍之多。
李彦宏反复强调,智能体就好比 AI 的网站,门槛低但天花板高。
在开发角度,开发智能体比网站只会更加简单,李彦宏说:“当时网站是怎么做出来的?通过浏览器过一遍源代码,非常简单,稍微改一改,我也可以做出来。今天做智能体跟这个很类似……起个名字,告诉它回答什么、不回答什么,一个智能体就做成了。”
作为业内最早布局的大厂之一,百度在智能体的赛道上已经搭建出了一个初具规模的生态。在百度文心智能体平台 AgentBuilder 上,已积累了20万开发者、6.3万企业入驻,开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型3.5或4.0版本,两版模型均可免费使用,可以说把使用门槛“一刀砍平”。
今夏的巴黎奥运会开幕,不少运动员的粉丝都行动了起来,自发集结在百度文心智能体平台上,开发了不少粉丝应援智能体。中国女乒运动员孙颖莎的粉丝,为她开发了“孙颖莎的小迷妹”;支持女乓运动员王曼昱,粉丝们开发了“曼昱的小芋圆”;女子跳水运动员全红婵的智能体,则因为她火出圈的书包挂饰,被粉丝命名为“婵婵的小书包”,交流别开生面,十分有趣。
而到了农业领域,中国工程院的朱有勇院士,也协助百度打造了“农民院士智能体”。这个智能体,搭载了朱有勇及团队研究成果,能够为农民解答多种问题,种植旱地优质稻、冬季马铃薯等农作物都不在话下,把技术惠农提升到了一个新的层次。
门槛低,效果好,智能体怎能不火?不难看到,未来智能体的规模,可以类比今日繁如星海的网站,形成一个庞大的生态。
而百度的野心,是把搜索作为智能体分发的最大入口,站在智能体大繁荣的前沿。
在百度的一众传统产品中,百度文库是出了名的“梅开二度”。
被大模型重构为“一站式 AI 内容获取和创作平台”,百度文库在 AI 的路上走得更加靠前,以智能PPT、智能文档、智能思维导图、智能研究报告等上百项多模态AI功能,让用户的文档体验和使用效率都大幅增强。
截止目前,百度文库累计 AI 用户数已突破1.8亿,AI 功能使用次数已突破22亿,让更多人享受到了大模型带来的生产力红利,让这个15岁的老产品焕发了“第二春”。
今年,李彦宏曾经高调提出,大模型的重点还是“卷应用”:“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”
但实际能看到的,是百度在基础模型和应用上,两手都要抓,两手都要硬。
在过去的十几年间,百度在大模型和 AI 基础研究上洒下的汗水,终究滋养出了一亩肥沃的土壤;而光有土壤还不够,百度已经进入到了他们大模型发展的第二阶段,着力打造 AI 原生应用——在这片“沃土”上,种出丰饶的“庄稼”。
把生成式 AI 深度接入业务,坚决用大模型重构搜索,这也让一众券商对百度的信心再次得到提振。
摩根大通表示:“从商业角度来看,这样的变化将把百度在价值链中的角色从单纯的流量导向扩展到售前咨询。我们相信后者将增加交易对话的流量,如果执行得相当成功,它将在中长期内对盈利产生积极影响。”
其他大厂想把大模型真正落地,或许真的要学学百度:把使用和成本门槛降到最低,依靠云实力和工具链建立一个良好运转的生态,依靠大模型和智能体重构已有业务。
这三招,都是推动着大模型真正“飞入寻常百姓家”的关键操作。
雷峰网(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。