0
“去年6月开始做研究文生图模型,8月基于Stable diffusion做图片创作工具,今年发布WAI开始内测”——这是微盟在AI大模型时代的发展路径。
自今年年初大模型之风吹向国内,一些头部企业最早嗅到了商机,百度率先发布文心一言,阿里紧随其后,官宣通义千问大模型,再就是腾讯混元大模型、华为盘古大模型...不仅如此,还吸引了王慧文、王小川等创业者的加入。
可以说,大模型确实给头部大厂以及想要干一番事业的人带来了新的发展机遇。正所谓新技术的价值要在具体的应用场景中体现,从这个角度来说,SaaS厂商似乎可以通过重构产品来获得新的增长极,微盟就是其中之一。
微盟大家并不陌生,用微盟首席运营官尹世明的话来说:微盟不是一个流量的公司,也不是做个商城像京东那样,而是为商户提供SaaS工具,支持其在微信小程序、视频号、小红书开店,快手、支付宝等平台开店,并帮助其管理数据。
那微盟这样一家专门为商家提供SaaS厂商究竟会和大模型碰撞出怎样的火花?
雷峰网了解到,从时间上来看,微盟对于大模型的研究要早的多,从去年6月份开始,微盟就开始了文生图模型的研究,8月份推出了图片创作工具,近段时间又正式发布了基于大模型的AI应用型产品WAI。
截至发布当天,微盟WAI已正式上线包括“话术生产、短信模板、商品描述、种草笔记、直播口播稿、公众号推文、短视频带货文案”等在内25个实际应用场景,其中部分高频应用场景,包括红豆居家、生活家精选等在内的多个行业头部品牌均已接入内测,并有商户反馈基本已经到了可以直接使用的阶段。
尹世明还告诉雷峰网,“微盟所有的产品和服务,将全面接入AI大模型应用做升级”。借助第三方LLM模型和微盟自研技术,目前微盟旗下包括“微商城、企微助手、OneCRM”等在内众多SaaS产品和服务均已接入微盟WAI,涵盖商家在数字商业经营中“智能搭建、内容创作、营销推广、智慧洞察”等多重业务需求。
目前,诸如微盟这样在大模型之上做应用的厂商数不胜数,微盟只是一个缩影。从目前来看,大模型对他们来说是利好的,但他们也要承担大模型给他们带来的局限性。
无论是自研行业模型还是做上层应用,SaaS厂商都要在国内外大模型的基础上去做。但目前国内AI大模型主要通过邀请制来服务应用层的开发者,这种相对有限的能力开放,一定程度上限制了应用服务商基于大模型进一步推动场景落地的创新效率,也因此急需补充Finetune和Plugin等能力。
以微盟规划中基于自然语言交互方式来实现的店铺首页装修为例,即还需要大模型厂商进一步开放能力共同建设的场景之一。
尹世明表示,“当前国内大模型Finetune的能力还有待提高,如果Finetune能做好对开发而言就更容易了,坦率来讲要进行真正意义上的Finetune,还是蛮困难的,但我们很期待。”
基于此,微盟还发布了一个融合了大模型厂商、应用提供商和商家在内的“AI大模型应用激活函数”。按照该函数呈现的大模型应用发展曲线,只有大模型厂商提供包括“大模型基础能力、Finetune能力、模型调度及生态开放”等价值,类似微盟这样的“应用提供商”借助行业knowhow和应用场景迭代,以及融合海量商家的“个性化需求、场景和数据”才能最终激活AI大模型的智能应用。
以下是雷峰网和尹世明的对话(在保证原意不变的情况下做了删减):
雷峰网:什么时候开始关注AI大模型,开始研发WAI的?
尹世明:与SaaS结合的大模型应用开发今年年初就开始了,去年6月开始研究文生图模型,8月份基于Stable diffusion做图片创作工具,今年开始跟国内各大模型厂商对接。
雷峰网:现在有专门的AI团队在做研发吗?
尹世明:目前有一支独立的产研团队来做,因为它是一个动态的过程,包括做SAAS的嵌入,实际上需要调动很多人,具体人数就不披露了。大家也看到我们有一个产品形态是需要融合到整个SAAS系统里的,所以在这一期上线包括后面的持续迭代里面,不仅要靠这支独立的 AI团队来做,也需要其他SaaS团队的支持。
雷峰网:研发过程中遇到了哪些的挑战?
尹世明:因为WAI本身是基于大模型的应用,国内厂商在大模型方面还处于起步阶段,与国外大模型相比的话,国内大模型在生成质量方面还有待打磨,这是第一。第二点是它的一些配套设施,比如它能否支持我们做微调,灌给它语料后,能否让做一些精准的意图识别等,甚至现在多轮对话等都是不确定性比较高的一些功能。在这种情况下,我们的应用开发空间会受到局限。
我们现在一直在跟几个大模型厂商保持沟通,是一起跑的状态。其实理论上我们希望我们是个接力跑的状态,他们跑完后,然后把交接棒给我们,我们再往前跑。但现在交接棒同时握在两边的手上,这是一方面的难度。
另一方面,其实现在很多应用场景还是由产研团队去挖掘的,我们基于国外一些相对成熟的场景,去看他们可能会帮助业务做些什么。但实际上国内SaaS厂商还是要去从他们实际的应用场景出发。现在可能大家对AIGC的理解还不够深入,更多的是和大模型闲聊。真正到具体该怎么做,还是一个偏初级的阶段。
雷峰网(公众号:雷峰网):WAI的定位是什么?
尹世明:我觉得未来它肯定是个营收板块,现在它的效率提升就是肉眼可见的,而且它是有成本的。但会成为什么样的体量现在还不好估算,因为我们还没有正式的生产,我们对他期望值还是不小的。另外一点,有人号称open AI可能成为世界上第一家10万亿美金的公司,AI确实会带来全新的机会,我觉得时间不好讲,但是我们现在是马不停蹄。
雷峰网:WAI已经可以对外商用了吗?客户反响如何?
尹世明:如果你是我们的内测客户,可以直接使用了。目前商户反馈基本上可以直接使用了,这还是蛮厉害的。包括今天的线上演示,如果你反复试几次他给出的答案,做参照已经一点问题都没有了,就像我刚才说的618的营销文案,我觉得比一般市场部写得要好。
雷峰网:未来在这方面会继续扩大投入吗?
尹世明:至于说下一步投入的成本,可能要看产品发布后的一些反响,以及内测反馈来决定,甚至要看大模型的整体发展,如果整个生态发展的速度和成效比现在快的话,我相信会持续保持投入。
周一管理层开会时,我们也再次重申了一下基于这件事情的判断,这次的AI确实和以往不一样,所以我们会密切关注,包括最开始内测的时候,实际上我们还是想铺开的,看情况决定加大投入这件事。从目前效果来看,我们能够走到今天已经很不容易了。我相信通过用现场演示,我们理念也很清晰,基本上也证明了我们不只是想讲故事,而是踏踏实实做事。
雷峰网:作为大模型的应用方,在选择大模型时有哪些标准?
尹世明:坦率来讲,首先要对开发者友好,对开发者不友好其实挺麻烦的,另外,开发模型的接口和开发框架是否友好。对于SaaS公司,我们是业务管理软件,是业务流程导向的,那么像autoGPT这类任务调度架构,实际上还没有整合到大模型的开发框架中去,这是很可惜的。
再就是要合规。其实现在对AI生成内容的评价标准,还没有一个共通的评价标准,它和原来的AI或者机器学习时候的评价标准相比差了很多。原先我们原来广告、搜索,衡量模型好坏的标准是看点击率。但到了AIGC,一篇文章写的好或不好,仁者见仁,智者见智,甚至整个评价已经不能用好和不好来定义,所以现在各大模型还没有沉淀出一个明确的方法论。
我们之前和几家都有一些交流,他们也给我们讲过一些横向测评模型结果的情况,但如果结合自己的行业沉淀,他们的测评还是脱离行业的。所以我希望在选择模型上能做到博采众长,现在还只是单方面为客户考虑,觉得客户能用得上的就是好的,所以再更细致的一些评价指标,可能需要大模型厂商和我们共同打磨后,行程一些更明确的评价准则。
雷峰网:WAI针对不同的场景中的不同业务,这样就会接入多个模型,那成本方面会不会很高?
尹世明:大模型烧钱是肯定的,但核心点是,首先我们在架构上做到与模型无关。另外,我们怎么选择模型就能容易做到应用层面的事情,为了省钱我可以怎么做,我可以选一个最优组合,为了做好一个场景,我也可以选另外一个组合,这是为了在应用层面进行模型调度,实际上架构会给我们更大的灵活性,这样成本方面也会有一个更大的可升可调的空间,而且某个大模型一定会有更适应某个场景的可能性。
当前国内大模型Finetune的能力还是有待提高的,如果Finetune能做好就更容易了,坦率来讲现在要进行真正意义上的Finetune,还是蛮困难的,但我们很期待。
雷峰网:架构上做到与模型无关,是我们独有的能力吗?
尹世明:不能说这是一种独有能力,而是一种设计理念,我们的理念是我们想做到与模型无关,或者叫松耦合,我们不能是紧耦合的,这样就会很麻烦。
雷峰网:现在很多厂商都在做和微盟一样的事情,这件事情的壁垒在哪?
尹世明:我的理解是我们三个产品形态,对于SaaS的融入本身就是一个壁垒,要连接到我们的整个流程当中,可能也就只有微盟的WAI可以做,举一个不是很恰当的例子,我们之前做文生图能力的时候,我们的研发其实提过说我们做一个小插件,然后把它插到像photoshop之类的工具中去,这也是一个应用场景。回头一想photoshop完全可以自己做,现在我们自己的微盟SaaS系统也是一样的,外部可以提供一些工具,这种生成式的工具,但真正能做到和我们的SaaS系统紧密结合的,是能够让我们的客户去感受到AI的能力,帮助他把日常工作的嵌入到他的工作流程中。所以我是这么理解的,可能能力大家都可以做,比如说生成商品的标题,生成推广的文案。另外,除了天然的产品形态是嵌在一块的,还有一部分,我们在发布会上一直说Know-How,就像刚刚说的评价标准还是要基于客户能不能用得上,这一部分我们肯定是要持续和客户去打磨的。
比如刚刚提到的内测,其实在内测过程中,已经有客户在给我们反馈,有一些像开箱的评测等等,我们能不能帮他做上去,像一些3C类的客户其实是很需要的。还有一些我们已经交付的一些内容,比如美妆品牌客户可能对小红书的文案并不满意,我们怎么帮他加工打磨,可能就是调prompt,也有可能是在 Prompt调整的基础上,我们做一些Finetune,甚至在它产出的内容的基础上进行多轮的 prompt,把这个内容润色成他想要的内容。
我们和百度也聊过,像finetune的能力必须开放,不然我们没有办法去finetune它的模型。他们是我们工具能力模型的提供方。你可以认为百度大模型就是个windows,我们是windows上面的应用,他不可能把所有的应用都做了,这不太现实,也无必要。
雷峰网:怎么看AI大模型替代人工?
尹世明:这个问题在AI1.0阶段也经常被问到,我觉得思维一定要改变,有些工种可能以后就不存在了,但一定有新的工种诞生。
我们在研究文生图工具时,其实和SaaS团队、广告代运营团队、设计师团队也有非常紧密的合作。比如一些广告素材需要一些国画,一定要有版权,我们用大模型一次就可以生成成百上千张图片。包括代运营团队服务客户时,也需要不断和客户打磨文案想法。我觉得AI一时半会还不能完全替代人工,但它确实可以给很多工种带来更多的灵感,包括和客户进行意见征询时,可以快速的把部分精力和时间降下来。包括我们自己的短视频拍摄团对现在也是用 AI生成短视频的脚本。
雷峰网:要想做好大模型,最重要的是什么?
尹世明:我自己原来在做1.0的AI时,当时AI火了一阵子。但坦率来讲,快速发展之后,后继力量就有点局限了,一直没有走出遍地开花的应用生态来,这和模型本身也是有关系的。所以这一次我个人不希望大模型厂商只是埋头做大模型,这不是正道,应该一开始就把它的开发生态做好,基建做好。现在我觉得还没有到生态这一步,大家都只是在关注开发大模型。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。