0
自2022年底以来,ChatGPT引发了一波AI热潮,大模型经历了半年的快速发展,竞争已进入激烈阶段。
关于大型模型的发展和认知,业界已经没了早期的陌生感,研究逐渐深入到企业的技术和应用领域。
然而,到目前为止,我们鲜见全面深入的大模型研究报告。
今天,国际数据公司IDC发布了一份《AI 大模型技术能力评估报告》,主要评估了国内14家主流企业的大模型平台,这也是大模型方向的首份权威评估报告。
该报告主要评估方向是:A.能力、B.服务、C.行业三个大维度,并且详尽的对9家大模型进行了打分。
近日,国际数据公司IDC发布了首份《AI 大模型技术能力评估报告》(下称《报告》),主要围绕能力、服务能力以及行业覆盖情况三个主要维度。
从三大维度的评分分布来看,该报告至少展示了以下3个结果:
1.大厂是选手,竞争锱铢必较。百度文心大模型、阿里通义千问分数遥遥领先其他,其中百度文心大模型靠着独占算法模型、行业覆盖两点满分,在这次评比中胜过一筹,成为该报告的大优势方。2.AI厂家是玩家,做透垂直行业有机会。第四范式、科大讯飞虽然在个别点上也拿到了满分,但整体分数落后百度、阿里。
3.其他厂虽然也很努力,单从该报告评分来看,确实前途遥远。
以下,是雷峰网对这份报告的具体解读。
一、关口拼产品,先发大厂大领先,AI公司有机会
作为大模型的基础关口,产品能力是服务和行业落地的基础,对企业而言显得至关重要。
IDC将产品维度进一步细分为算法模型、通用能力、创新能力、平台能力和安全可解释五方面,百度是所评估企业中综合评分最高的企业,除安全可解释层面获得4分(满分5分)外,其余各项均为满分;阿里稍逊一筹,在算法模型和安全可解释层面均拿到4分。
其中,算法模型作为大模型的核心能力,是各大企业角逐的焦点之一。如果我们稍微对行业有些了解,就会明白百度为什么在算法模型层面拿到满分。
正如IDC在报告中所说,整体还是源于百度在人工智能领域长期的技术积累,百度AI大模型在整体竞争力位于领先水平。而这其中,算法模型无疑是最核心的能力。
在大模型成为行业焦点,百度在AI领域布局十余年,如今众所周知的文心大模型百度也早已研发多年并在2019年发布。简言之,百度的算法优势是基于百度的先发优势和长期积累:百度具有“芯片-框架-模型-应用”四层技术栈完整布局的独特优势:芯片层-昆仑芯、框架层-飞桨、模型层-文心大模型,以及各种AI的落地应用,其中百度自研的深度学习平台飞桨在大模型的高效训练和推理上提供了强有力的支撑。
从实际的模型效果和迭代速度来看,作为国内率先推出的预训练语言大模型,文心一言集知识增强、检索增强、对话增强技术创新于一体,效果可圈可点。雷峰网了解到,目前,文心大模型已经升级到3.5版本,训练速度比之前提升2倍,推理速度更是提升了30倍,核心场景推理性能提高50倍,模型效果累计提升超过50%。
IDC报告中,安全可解释这个维度9家大模型厂商均没能拿到满分。雷峰网(公众号:雷峰网)猜测,这主要有两方面原因:一方面,基于多方面因素考虑,企业不能对外完全暴露自身的安全能力;另一方面,大模型目前尚处于发展阶段,业内还未制定出一套权威的安全标准。
从这个角度看,IDC能够在安全可解释纬度上给予百度4分的评估已经充分表现出其对于百度安全能力的认可。不难理解,这得益于百度在搜索等业务在安全领域长年的锤炼与积累。作为对比,阿里在这一维度拿到的分数同样是4分。
IDC报告本次评估的14家企业,既包括阿里、百度大厂玩家,还包括智谱AI、科大讯飞、第四范式等AI公司。可以看到,在产品维度上,百度的文心大模型在算法模型上依托先发优势和技术领先性,显现出明显的领先优势。
二、赛点拼服务:老牌服务大厂胜过一筹
产品是基础,服务是重点。
IDC将服务维度细化为「服务能力」和「生态合作」两个主要方面,前者主要包括为开发者提供的配套服务、对客户的理解力等;后者则不仅包括合作伙伴的数量,也包括结构分布、生态支持等。
在生态合作上,百度和阿里均得到满分。在行业印象中,阿里的生态肯定是优于百度的,因为阿里云的市场规模比百度智能云大很多。但是大模型时代,百度能在生态上打平手,一方面体现了,百度不仅布局大模型产品本身,也提前大力发展生态伙伴。另一方面也说明了,大模型时代下的生态也面临着大洗牌,会在很大程度上区别于传统云计算的服务生态,才给了百度机会。
从近期动作,也不难看出百度正在不断拓展生态,赋能生态伙伴大模型能力。雷峰网了解到,近期,百度已经开始为生态合作伙伴免费提供文心千帆大模型训练等相关培训工作,通过一系列的培训课程,手把手为客户讲解如何基于自身业务场景做相关训练。这种培训精细到什么程度呢?从导数据到训练模型,台上的讲者几乎是从打开文心千帆后台开始,一步一步教给客户。有参与培训的人士表示,到现在为止,国内已经发布了近百个大模型,给人感受确实是有些混乱。而百度,是国内第一家为客户提供如此精细化服务的企业。
在服务能力方面,阿里基于过去深厚积累的客户服务经验拿到5分。曾经在云领域落后于阿里的百度,在大模型时代不甘示弱。在文心一言发布半个月后,便推出了大模型服务平台「文心千帆」——全球首个一站式的企业级大模型生产平台,不但为客户提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链。
三、终点拼行业,百度在行业覆盖上优势大
无论是产品维度,还是服务能力,企业研发大模型的最终目的还是要落地于产业实践,这也就是IDC评估的第三个重要维度:行业覆盖。
综合来看,各家企业都依托于自身优势在部分垂直行业取得一定分数,但百度和阿里再次成为业内的领先企业,是少有的能够在部分行业拿到满分的企业。百度文心大模型领先优势明显,在综合指标行业覆盖上拿下唯一的满分。
此外,从垂直行业来看,阿里在电商领域拿到5分毫不意外,而百度在能源和整体行业覆盖度两个层面均拿到5分,超出预期。此外,科大讯飞在教育领域拿到5分,其他家再也没有满分选手。
百度能在大模型行业覆盖上拿到唯一的满分,无疑仍然与其先发优势关系密切。从文心大模型出发,百度已经在能源、汽车、政务、交通、金融等重点领域布局11个行业大模型,将大模型融入到垂直领域,真正做到产业实践和商业落地。
而在能源领域能拿到满分也是基于过去百度的先发布局:早在一年前,全球最大的公用事业企业--国家电网有限公司,就与百度联合发布了电力行业文心大模型。面向复杂电网的专业场景,基于百度文心大模型,百度与智研院联合训练电力行业大模型,在电网设备、客服等实际业务场景进行试点验证,可以显著增强电网运营的精细化、自动化、智能化水平。百度也和深圳燃气联合发布了燃气行业大模型,破解燃气企业运营场景繁杂、安全风险识别困难等难题。
百度在能源领域的落地还不至于电力。2022年12月,百度携手深圳燃气发布“深燃-百度·文心”行业大模型,针对燃气行业中槽车作业、园区生产等场景存在安全隐患的痛点,通过大模型的技术支持,确保工作人员进行安全作业,消除安全隐患,助力燃气行业智能化升级。
智慧政务方面,百度智能云为大连市打造“一网统管”的运行指挥中心,汇聚全市6.7亿条数据,将城市综合态势、政务服务、民生服务、城市交通等6大方面的城市运行信息呈现在1个屏幕上,帮助城市管理者实现一屏知全城。此外,在北京,基于文心大模型,百度智能云和海淀区政府正在联合测试城市智慧平台的交互式场景,例如,直接问“上个月海淀区12345热线的处置情况如何?”,就能自动生成分析报表并回答。
在交通领域,百度通过大模型技术为北京亦庄打造的智能交通解决方案,可根据车流量自动调节红绿灯,从而缓解拥堵。
6月份的世界互联网大会数字文明尼山对话中,百度创始人李彦宏分享了亦庄智能交通的一个成果:今年五一期间,民众出游热情高涨,假期前最后一个工作日,北京城市拥堵指数暴增2.5倍。但在亦庄,得益于部署AI全域信控方案,车流量同样明显增加的情况,300多个智能路口能根据车流量自动调节红绿灯。亦庄也因此成为当时北京不堵车的唯一“绿洲”。
据悉,亦庄的这一智能交通解决方案已经被69个城市采用,能够将通行效率提升15%-30%,拉动GDP2.4%-4.8%的增长。
“大模型带来的产业智能化变革已经势不可挡,现在我们唯一要做的,就是赶快行动起来。”这是百度智能云事业群总裁沈抖做出的判断,也正逐渐成为业界的共识。
作为国内最早发布预训练语言大模型文心一言的互联网大厂,百度在产业落地上亦不遑多让。IDC在报告中指出,百度文心大模型形成了支撑大模型产业落地的关键路径:在模型层,文心大模型包含数30多个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系,全面满足产业应用需求。
结语
通览IDC报告可知,大模型赛道里,大厂优势虽然大,但竞争更大,厮杀也更激烈。当然,IDC报告对大厂都给予高度评价的同时,但也指出了大厂所面临的挑战:作为领先厂商,大厂应更注重模型的可解释性,并承担更多技术与行业发展的责任。
百度文心大模型之所以这次评分领先,主要是在算法模型、行业覆盖两个方面独家获了满分,这与其先发优势密切相关。
在雷峰网看来,行业覆盖这点上的满分更加值得业界重点关注。这意味着,百度文心大模型在探索大模型应用落地方面已经处于前沿地位。
现在,国内已经有了一百多家大模型公司。对于头部玩家来说,这已经不再是纯粹拼参数、拼算法的阶段,大家最终要拼的是谁先获得足够市场,谁先形成“市场-资金-技术-市场”的增长飞轮。
因为技术终将趋于平衡,企业间的最终竞争目标是行业渗透率和市场份额。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。