0
本文作者: nebula | 2023-07-25 12:53 |
在人工智能行业,流传着这样一句话:数据是燃料、算法是引擎。在大模型中,数据的重要性则体现地更加明显。甚至从某种程度上讲,数据的多少、质量的好坏决定着大模型的成败。
在移动互联网时代,以BAT为代表的头部科技大厂积累了深厚的底层技术、庞大的客户群和行业know-how,客观说,这有助于训练出更加具备泛化性、通用性、实用性的通用大模型。
巨头们的大模型犹如“含着金钥匙”出生,肉眼可见的是,百度文心大模型3.5、华为盘古等大模型产品已经跟国内其它模型产品拉开了差距。反观讯飞、智谱、光年之外、等创业腰部公司的大模型产品已略显后劲不足。
大厂大模型,更稳定更靠谱
过去几个月,大模型经历了草莽阶段,发得快、发得早便是一种优势,因此短期内出现了大模型满天飞、产品多如牛毛的现象。
为了应对用户市场的多样性、吸引更多用户和开发者,很多初创公司开始力推“开源”。在早期,这种策略收到了不错的反馈,开发者和用户容易更快地参与到大模型的技术共享和合作之中。但随着落地的深入,“快”所留下的后遗症也在反噬其自身。
首先,在企业级市场中,客户企业对稳定性和安全性的要求越来越高。
企业级市场对稳定性和可靠性的需求是天然的。在大模型领域,稳定性不光体现在产品层面,更体现在战略方面。举例来说,过去ChatGPT虽让OpenAI爆火,但其公司几易核心战略,创始人对公司管理的把控度也一度遭遇质疑。在与母公司微软的合作中,OpenAI和后者的分工更是模糊不清,不免让人对ChatGPT未来的发展感到担忧。
对于客户企业而言,供应商不稳定的战略会对信任度造成影响,从而减少对平台的意向合作规模。在这点上,大公司无疑比生存状态不稳定的初创企业更具备优势。
以华为经历为鉴,早在云计算时代,华为云依靠稳定和专业的做派赢得了市场的尊重。在大模型时代,其盘古大模型延续了以往提供软硬一体式解决方案的路线,再次受到客户青睐。华为在政企客户间有着相当不错的口碑和品牌价值,它的经验表明,在开发能力参差不齐的市场,踏踏实实做服务的企业往往更有优势。也就是说,在大模型的竞争中,“钞能力并不代表技术强”。
其次,企业客户更加期待一站式、端到端的服务效率提升模式。在这波AI2.0浪潮中,很多能力都是建立在云平台之上,不论是算力、模型,还是工具链,都是通过云平台对外输出。
百度文心大模型就非常符合上述标准,其具备的云底座可以实现端到端调优,这意味着从数据采集、预处理、特征工程、模型训练、模型部署到模型推理等整个流程中,企业都可以进行自动化调优和优化,从而提高模型的性能和效率。有了这层技术,便可以更好地利用深度学习算法实现自然语言处理任务,如文本生成、机器翻译和情感分析等。本质上讲,精巧好用逻辑将取代“大干快上”,企业对大模型的诉求也将逐渐回归至商业价值本身。
反观,以智谱AI等为代表的初创机构,由于其没有云底座,便只能选择与多家云厂商进行合作,但这却为其自身与合作伙伴之间的利益点和后期分成埋下了些许隐患。可与之佐证的是,无云的OpenAI与微软之间的关系也已经发生了微妙的变化,据《The Information》,微软一份内部文件指示 Azure的销售人员告诉客户微软能比OpenAI提供更多的服务,而OpenAI则在通过延迟授予微软产品API访问权限、暂缓提供最新模型等方式进行防御。双方远没有看起来“亲密无间”。
大模型是一场持久战,小公司烧不动
大模型的竞争正在从“百米跑”转向“马拉松”,谁将赢得持久战的最终胜利?
目前答案已经出见分晓。可以看到的是,部分初创和腰部公司已经开始呈现疲态,从光年之外退出竞争、讯飞大幅亏损难以支撑大模型投入便可以得知,一些“笨鸟先飞”的企业已逐渐落后于发展大势。
相比而言,头部大厂的大模型产品已经有所成效。在IDC近日发布的《AI 大模型技术能力评估报告,2023》报告中,百度、阿里等公司的表现非常亮眼。IDC分别对大模型的平台、创新、通用、算法、服务、生态合作、行业覆盖和安全可解释性等诸多方面进行了评价,其中百度7个满分,阿里6个满分。百度在算法模型、行业覆盖领域拿下行业唯一满分。
与此同时,在SuperCLUE中文大模型7月最新榜单中,百度的大语言模型产品文心一言以62分的总成绩一举超越越GPT-3.5-turbo(59.79)和ChatGLM-130B(59.35)等,稳居行业头部。可预见的是,大模型的竞争将在准确、鲁棒性、更新速度、可解释性和性能方面展开。这就要求企业在数据的接入和处理上要加大投入。
另外在toB端,百度依据过往能力推出了千帆大模型平台。千帆是全球首个一站式企业级大模型平台,它拥有较为全面的数据服务能力,从生成、标注、回流再到模型训练(Post-pretraining、Fine-tuning、Prompt-tuning)、模型评估(主观评估、客观评估)和压缩、自动化Prompt工程、到插件应用编排,客户都可以在千帆上一站式完成。
这意味着客户可以将训练好的模型部署和托管在千帆平台上,获得极致的性能、企业级的高可用性和安全环境。除此之外,其在企业级场景中的积累也为行业打开了一扇窗:目前,千帆平台已经制备了开箱即用的使用流程,用可视化产品界面的方式引导用户使用极大降低了使用门槛。对于企业级市场比较担心的安全可靠问题,也内置了安全机制,确保模型的输入和输出的安全。
游击队VS正规军
2023年下半年,不少企业将目光锁定在行业模型上。不落地,大模型就是空中楼阁,不结合行业,大模型便是无本之木。因此,各家厂商除了要在底层技术上继续夯实外,补足行业Know-how和成功经验也是重中之重。
在阿里和百度的发展经验中,似乎可以给大模型行业一些启示。其中,阿里因在电商、物流层面的深厚积累,让该公司拥有了对不同领域的行业特点、业务流程和客户需求有了充分的认识。后加之内部推行“云钉一体”,作为办公一体化平台,钉钉也为通义千问大模型助力颇多。这样一来,阿里的产品便可以在深度了解用户需求的基础上为客户提供定制化的解决方案,满足其业务需求,提高其业务效率和竞争力。这让大模型有了其应有之意,不至于沦落为“无源之水”。
相比之下,百度采用了另一套逻辑:用搭建行业模型的方式赋能具体行业。目前为止,该公司已经布局了十余个行业大模型并取得了不错的效果。在客户中,出现了国家电网、浦发银行、泰康、吉利等知名企业。比如,在电力大模型中,产品已在电网设备、客服等实际业务场景进行试点验证,就结果而言,可以显著增强电网运营的精细化、自动化、智能化水平。而在汽车领域,长安汽车的一款量产车型开始搭载百度智能云提供的人工智能基础设施平台和数字人平台。除此之外,百度的大模型还将触角伸向了金融和政务等领域。
应该说,百度和阿里之所以能在各行业间迅速打开局面,依靠了成体系的团队和稳定的战略。细节上看,大模型所需要的人员众多,其中包括算法工程师、数据科学家、产品经理、运营人员等。比较“散兵游勇”,头部大厂所展现的实力更体现在其员工所拥有的丰富的经验和专业知识。根本上,高素质的人才能够快速响应客户需求,提供高质量的解决方案。
写在最后
在大模型的toB竞争中,本质而言,是取决于客户企业对商业价值的认知。和其他行业一样,在大模型领域,“多快好省”和“物美价廉”难以两全,“大干快上”的结果可能是一地鸡毛。
所以,企业客户在大模型的选择上应当更为审慎,至少在目前,更加稳妥的方式还是在大厂之间做出抉择,大厂大模型更能保证服务交付、运维和维保,这也是企业对自身向智能化方向转型更加负责任地选择。
目前,百度、阿里、华为等大厂在技术、企业级认知方面已经具备相当程度的先发优势。2023年的下半年是大模型马拉松赛的开始,在这个过程中,商业价值也将逐渐回归,劣币终将被市场淘汰。
雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。