两个多月后，360那个刚出生的孩子「长大了」

本文作者：何思思

2023-06-20 10:18

导语：在做数据积累，用户反馈时，也不能忘了安全。

作者丨何思思

编辑丨林觉民

周鸿祎：你为什么不废掉刘婵取而代之呢？刘备不也同意你这么做吗？

360 AI数字人：夫天下之事非一人之所能独为。虽君父有命，亮亦不忍背之。况刘氏托名汉室，实为一邦之主。亮岂敢以私怨而王大义哉...

在前段时间刚结束的认知型通用大模型360智脑发布会上，360集团创始人周鸿祎与360 AI数字人角色进行多轮对话后，现场响起了一阵又一阵的掌声。

时隔两个多月的时间，周鸿祎携4.0版本的360智脑大模型亮相，同时还发布了核心创新产品——AI数字人。

雷峰网(公众号：雷峰网)了解到，360 AI数字人目前拥有200多个角色，分为数字名人和数字员工两类。其中数字名人包括历史人物、偶像明星等，具有较强的可玩性。数字员工强调的则是高可用性，致力于解决企业的实际问题，可成为企业员工的知识助手和办公助手。

与传统数字人相比，360 AI数字人最大的特点在于有灵魂、有记忆、有人设，能够复刻人类的思维方式和经历。周鸿祎表示，数字人是未来大模型最重要应用入口，360将依托360智脑大模型能力，重新定义“数字人”。

可以说360 AI数字人是周鸿祎对AI认知的具象表现。在他看来，AI应该以人为本，无论做多么强大的AI，都是在为人类做有史以来最好的工具。

百模大战、千模大战，比拼的是多模态的能力

目前国内大模型呈遍地开花之势，几乎到了每个人都可以做出一个大模型的阶段。

周鸿祎认为，一个完整的AI大模型一定要具备多模态能力，包括文字处理、图像处理、语音处理、视频处理四大能力。同时他形象的比喻道，AI大模型是一个从只有眼睛，到有耳朵、鼻子、嘴巴的蜕变过程。

这从360 AI大模型的发展路径中也可以看出来，3月29日360推出大模型1.0，当时只能和搜索结合，还不支持多轮对话；4月26日2.0版本上线，具备了多轮对话的能力；5月18日发布多模态文生图的应用“360鸿图”，同时迭代到了2.5版本；5月31日发布智脑视觉大模型，并迭代到了3.0版本。

而近日发布的360智脑大模型不仅升级到了4.0版本，还加入了多模态的能力。

缘何这么做？

周鸿祎告诉雷峰网，GPT1和GPT2都是以文字处理为主，GPT3扩大了参数量，GPT4展露了一小部分多模态的能力，但之后再也没有新的成果发布。所以我预测，GPT5一定会全面支持多模态。

反观国内自研的大模型基本能力已经成熟，甚至很多方面都赶超了GPT3.5。所以下一步的重点不是文字能力的较量，而是多模态能力的比拼。

对此，周鸿祎还进一步解释道，大模型训练到一定水平后，人类的知识会愈发不够用。以GPT4为例，其学习的Token数目接近4千万种图书，而人类有史以来的图书不足1亿本，所以当大模型具备了多模态能力后，它获得知识的途径不再局限于文字，也可以是图片，亦或视频。

这也是周鸿祎把多模态融入到360智脑大模型的重要原因，目前也成了其最重要的组成部分。

雷峰网了解到，360智脑大模型已经具备了生成与创作、多轮对话、书写代码、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、多语言翻译等十大能力，200多种细分的子能力。

“2015年360就成立了AI研究院，2018年开始多模态的探索。我们未来会发布插件平台，我们要让大模型不仅仅停留在大脑层次，多模态可以给它增加眼睛、耳朵、鼻子、嘴巴，插件可以让它有手和脚的能力，这样大模型的能力才能发挥出来，”周鸿祎补充道。

构建大模型的关键：数据、用户反馈、安全

多模态可以说是进阶版的大模型，但就目前国内大模型发展来看，很多企业仍处于起步阶段，讨论的更多的还是如何做大模型？门槛高不高等问题。

对此业界可谓众说纷纭，一部分人更是极端地把大模型描绘成了“曼哈顿计划”，像原子弹一样高精尖的技术。

但周鸿祎却持否定态度，他表示，做大模型一是找一个类似Transformer架构的基础模型，二是给大模型灌知识，即无监督学习或者预训练的知识，三是刷题训练，即有监督的微调。

此外，还需要在用户场景中不断反馈优化。过程中，用什么样的数据做预训练，用什么样的题海战术做有监督的微调，以及用户的使用反馈都对大模型的持续训练起着至关重要的作用。

360在这方面就显得轻松地多。

首先，360以搜索业务起家，这意味着其在自然语言理解方面有丰富的技术积累。雷峰网了解到，360每天在全球会抓取1.4亿的网站数据，2.8亿的专业文献，1.2亿的行业数据。其中，包括数十种语言、图片、视频等多种形式的基础材料。

其次，360还具备清洗能力，对全网数据清洗后，仍会留下10T级优质的规模数据，更重要的是这个过程还会产生高质量的问题，比如用户每天在搜索引擎里有1亿次的使用，用户搜索的这些问题就是高质量的问题，这就会更加了解用户在想什么，从而有的放矢地做知识的标注。

“搜索能力对大模型不仅会影响数据积累，也会影响结果的真实性。”

对此，周鸿祎解释道，大模型最大的短板是数据更新不及时，甚至有时候会产生幻觉。而搜索恰恰可以补足，我们可以通过搜索最新的内容，让GPT随时训练到最新的事实内容，同时把结果通过搜索做内容的校正，这个能力还在不断研发。

除数据和用户反馈外，360还非常重视安全问题，周鸿祎谈到，大模型如果只一味地讲发展不讲安全，这个大模型肯定是走不远的。

目前360已经启动安全团队专门做人工智能安全方面的研究，具体分为两部分：一是用安全加强大模型的能力；二是用安全使大模型在安全方面更加可控。

所谓道高一尺，魔高一丈，周鸿祎更是形象地把自家的安全手段比喻为：以其人之道反制其人之身，即通过全球的网络攻击大数据，安全行业的智能大脑，帮助企业更好地辨别黑客的攻击，网上隐藏的攻击，从而增强安全防卫能力。

当然，在周鸿祎看来，研发大模型不能把大模型当成一个黑盒子，而是要了解它的来龙去脉、工作原理，才能从根本上解决大模型的安全问题，为此，360首创了大模型安全风险的评估体系“AISE”，为全球大模型提供安全保障。

两个多月后，360那个刚出生的孩子「长大了」

基于此，360提出了“一体双翼”的发展战略，并重发展和安全，此外，为了切实解决千行百业的实际问题，包括360安全浏览器、360搜索以及安全卫士等在内的产品已经全面接入360智脑大模型。

可以预见的是百模大战、千模大战的战火会愈演愈烈，对于大模型厂商来说，只有不断增强大模型的能力，提供差异化的服务，才能在这场战争中保持优势。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

0人收藏

何思思

工业口编辑

关注新基建，聚焦工业互联网领域网络安全丨微信：15230152798

扫描关注作者微信

发私信

当月热门文章