0
雷锋网按:8 月 5 日,在 Rebuild 2017 大会上,iPIN CEO 杨洋发表了题为《从认知智能到更智能的决策》,分享了什么是认知智能,以及 iPIN 在认知智能方面做的应用。雷锋网根据现场速记进行了整理。
以下是 iPIN CEO 杨洋的演讲实录,雷锋网在不改变原意的基础上做了精编:
大家好!我叫杨洋,我这个名字比较像一个明星的名字对吧?所以很多人一听我这个名字以为是另外一个杨洋,我们公司的一个同事为了做宣传,就说杨洋帮你填报志愿,然后吸引了大量的不知情的90后、00后进来,然后“被骗了”。这就是我们的认知发生了偏差。我们今天谈“认知智能”。
人工智能很火,火的一塌糊涂,甚至我都不愿意把我们公司称之为一个人工智能公司。为什么呢?因为任何的技术都是解决问题的,如果一个技术不能解决问题它是没有价值的。我们公司做到现在,大家以为人工智能很火,无所不能,但是大家仔细的回想一下,我们现在的人工智能对你的工作影响了多少?你每天的工作方式有改变吗?也许可能搭滴滴的时候,或者看今日头条的时候有一些改变。但是在我们工作中呢?我们都说人工智能会带来第四次工业革命,但是到现在为止人工智能对我们工作的渗透可能还不到1%。我们不需要聊天,在工作的时候我们要的不是聊天,要的也不是图像识别,要的也不是无人驾驶,除非你是个司机。
所以,其实现在人工智能的发展,距离真正颠覆我们工作的环节或者习惯,还差得好远。为什么是这样子呢?就在于我们现在人工智能发展水平还只是集中在感知智能,距离认知智能还比较遥远。这就像一个5岁的小孩,你跟你5岁时候比智商其实是差不多的,5岁的时候智商基本发展到跟成人差不多,但是你能让一个5岁的小孩去做投资吗?不能对不对?你能够让一个5岁小孩去做招聘吗?不能。
那5岁跟35岁之间的差距到底在哪里?其实就在于,我们对于很多生活常识的各种理解和学习。我爸爸在湖北省当地是一个很有名的医生,我在美国读书他去美国看我,他却发现他失去了他所有的一切能力,他在中国算是一个很有成就的人,但到美国连他自己工作和独立生活的能力全部丧失了。为什么?并不是他能力没有了,而是说他的能力、认知跟当时的环境已经发生了一个巨大的不匹配。所以,他的认知等所有的一切都颠覆了、没有了。这就是认知智能。
现在的人工智能技术,距离我们真正大规模应用到工作中,缺乏的就是在认知智能的发展。
我举一个很小的例子,就是高考志愿填报。
在座的各位应该绝大多数都经过了高考志愿填报环节,除非你高中就出国了,逃掉了,或者说你高中压根儿没毕业,我当时本来也不想读完的。但是,一旦你经历过这事儿就知道,这个事儿是个小事,大概只用一个礼拜就搞定它了。但是要真正把这个事儿做好,你却需要非常多条件,而且它对你的一生影响是非常大的。比如说,我因为当年填错了一个志愿,我的人生在最美好的年华,至少浪费了6年,包括我周围的很多人都是这样,超过71%的人在大学毕业之后所从事的工作跟自己所学的专业是无关的。这就包括我们公司是一个人工智能的公司,我们公司绝大多数人也是这种情况。
那填报志愿需要哪些条件呢?
了解自我
你了解自我吗?我在美国的时候很有意思,有一次受了一个刺激,问了一下我周围的中国留学生,发现绝大多数人都不知道自己是否喜欢自己的现在,也不知道自己喜欢什么。所以,了解自我是个很大的问题。
10万+可选项
中国2500多所大学,10万多个院系,市场上有12000多种职业,这种组合超过1亿个,你如何在里面选?
明规则+潜规则
有一些明规则,每个学校的每个专业,在每个省的填报规则都不一样。这些规则你都了解吗?还有大量潜规则。比如说,机械系女生少,这个规则学校是不会告诉你的,你自己考虑吧?女生少代表什么?还有大量大量其它的各种潜规则,比如中华女子学院也招男生你知道吗?不知道。真的!中华女子学院有1%是男生,在播音系,因为要男女对练。
决策方法
怎样才会有一套科学的决策方法?我们每天都在不停的做决策,科学的决策方法依据是什么?
可惜这一切,这么重要的事,你的一生只有三天去决定。根本搞不定的,它远远超出了人能够通过自己人的大脑的认知去解决的问题范畴。
那接下来需要怎么办呢?所以,就出现了一种职业,叫做高考志愿填报专家,这种专家收费几千到几万不等。还有很多很多事情都是这样的,比如招聘、招新、招标、招生、招商,找投资、找工作、找专家,这些事情现在都是专家在做。这些专家在我们目前的生活中,可以说是很常见的。
就像刚刚说的问题,我们不可能让一个5岁的小孩去做投资,因为确实里面所包含的信息量、所认知的东西实在是太多了。
那我们怎么办呢?人工智能将要引起第四次工业革命,那我们怎么去用AI加速这个进程去真的能够加速我们的工作效率,能够代替我们在工作中去理解大量的这些东西,然后帮助我们做决策呢?
这是现在人工智能真的要想在商业领域大展宏图,必须要去突破的一个领域,这块其实就是认知。
我们回顾一下人是怎么思考问题的:
人的认知其实就分很简单4个步骤,比如从感知信息-认知信息-分析-做出决策,就这么4个环节,我们所有的事情其实就不停的在这4个环节里循环。
我举个小例子,比如说“我很帅”,听清楚了,我很帅!三个字对不对?
感知,在这里所起的作用是,你把这三个字写出来,而且不写错。
认知,就是你听不听得懂,比如说,我跟我女儿说“我很帅”,她1岁的时候听不懂,2岁的时候听不懂,3岁突然听得懂了,但是她可能会来一句“帅”是什么意思?跟“美”有关系吗?她还在一个模糊认知阶段,到5岁的时候她给我来了一句“爸爸臭美”。
分析,分析是基于每个人各自掌握知识的背景和场景,你要对它做一个信息的加工。比如我说“我很帅”,我老婆可能就会来一句“是啊,我就是觉得你很帅,所以我找了你”,可能在座很多人觉得这个人没有自知之明,每个人会根据自己的知识背景做出一个判断。这是分析。
决策,比如说我老婆决定找了我,在座听了这句话就决定把我拉黑。
这就是人整个对信息处理的全过程。认知和分析是目前人工智能最难的,我们现在大多数的信息技术比如说语音识别、图像识别都是在这一块,但是这个认知是怎么回事呢?就是我刚才说的。
举个例子,我的专业背景是做人工智能里面的认知智能。什么是认知智能?可能在座是一个模糊的概念,如果我说I am a scientist rich in collective intelligence 可能英语好的你听得懂我说的每一个词,但是合起来你听不懂我在说什么,因为 collective intelligence 是一个非常专门的领域,你的大脑会告诉你懂还是不懂。
比如我说华为手机,我女儿5岁,她太小听不懂华为,但是她听得懂什么?她听得懂小马宝丽和小仙女的故事,但是她听不懂华为这个词,我们听得懂,因为我们的大脑认知库里反射给你“华为”这个词你是知道的,但是你并没有做出下一步的分析,直到真正分析的时候你才会把相关一些信息提取出来做决策。
这就是我们目前人去做决策信息处理的全过程。现在要用机器来加速这个过程,就要做到机器的认知处理。难在哪里呢?
这是三大巨头。Yan LeCun今年年初在清华说的,现在整个人工智能的认知智能天花板就在于“让机器掌握人类的常识”。就像我刚才说的,比如说华为这是一个常识,清华大学、北京大学是一个常识,常识是什么?就是大家都知道,语言其实本身就有很多是常识,我们才能交流,如果我说的每一个词你们都不懂,那就没法交流了。比如说我爸爸去了美国,他没法独立去生活和工作,就是因为没法跟人沟通。所以大家基于的常识都不一样。
包括一些服装的品牌,在美国非常知名的品牌。比如说有一个品牌叫 Anthropologie,中国的女生有几个知道这个牌子的吗?所以这就是认知基于环境和场景的。
所以,如何能够让机器去掌握人类的常识,这是目前整个认知智能所需要突破的一个天花板。
认知智能是一个非常复杂和交叉的学科,可以说是有非常多的领域都去做了这个,包括生物学、物理学、哲学、社会学、经济学、市场心理学、神经科学,很不幸,做认知智能都必须要涉猎每个学科,从不同的角度去看认知。
举个例子,我们来做一个小实验,我给大家两个选择,A 是我现在立刻给你300块钱,B是我一年之后给你1000块钱。请选择 A 的立刻拿300块钱的举手,这个实验总是人越多越成功,就是50%。
那就说明什么呢?它颠覆了经济学,传统经济学认为人是理性的,其实人是非理性的。如果从理性来讲,1000 块钱是更多的,但是人的非理性行为导致我们决策上其实是有很多主观的偏差。
机器认知最大的难点就在于在认知偏差的情况下,机器还要给出一个相对让人觉得靠谱的答案。
比如我刚才说“我很帅”,机器要能给出一个靠谱的东西,它不能跟你说这个人帅或者是不帅,它也必须要给出一个社会学里后现代学那样,就是一切都是相对的,没有绝对的。
市场心理学、神经科学的人发现人是一个非常大的矛盾体,爱和不爱,爱和恨,信与不信都是同时存在于人的大脑,因为在人的大脑里面,爱和恨,信与不信是根本截然不同的大脑反射区,所以人就是一个思维矛盾体。这种情况下如何做机器认知?这就是一个巨大的挑战。
整个做个的逻辑,一定要做三个大的矢量:真相矢量、场景矢量、投影矢量。然后再去通过无限接近于真相,再找到具体的场景,再做投影。这是整个目前做认知分析所需要突破的三个点。
为了做好这一点,我在哈尔滨工业大学做副教授的时候承担了一个国家项目,史上首个社会经济图谱,通过这个图谱去对整个中国经济社会建模,学习整个社会是怎么样的。
这是中国,其实我们现在也在借鉴美国的数据,希望在未来两年也开始建美国的社会性图谱。因为刚才说了,认知是基于环境的,脱离环境的认知是没效的,同样的一个词在不同的场景下理解是不一样的。
要做好这一点,还要有其它一些基础条件:
主动学习
这是要突破这个认知很重要的事情,机器人在它不懂的时候我们要教它方法,它能够主动学习,而不是等着我来教它,我只能教它学习的方法,而不是教它怎么做。
教材可靠
一个小孩如果说他的父母是他最好的老师,他的父母把他教坏了就教坏了,所以说对教材的选择我们认为是非常非常重要的。
语境认知
比如说喝酒,这个词在不同的语境下理解是完全不一样的,如果你在找工作的场景下你说很会喝酒,这说明什么呢?也许你适合做公关,也许你适合做销售,但是如果说现在在法院大官司,很可能你就撞人了,酒驾。
清晰建模
如果说要帮助人辅助、决策,定性是绝对不够的,所以普通的知识图谱是没用的,这儿我们要求非常高度、精细的全量化建模,这种新的方式,这样才能真的深入我们的工作,帮助人准确地做出判断和决策。
我们在这个基础上做了三方面的应用:1.生涯规划;2.企业招聘;3.供应链匹配
我在哈尔滨工业大学的时候,做一个公益项目,当时就是为了能够帮助人做决策,看看能不能解决这样的问题,后来发现一做就不可收拾了。
在这个领域里面我们做了一个小的产品叫“完美志愿”,我们当时做这个产品,就是帮助人填报告和志愿的。遇到了最大的挑战是什么呢?
第一,规则不清楚。
那要做人生规划遇到的挑战跟 AlphaGo 比的话,其实比 AlphaGo 下围棋要困难得多,AlphaGo 里面所有围棋的规则是非常清楚的,也非常简单。但是在我们这个大社会里,绝大多数规则我们是不清楚的,甚至都是潜规则。所以,我们首先得用机器归纳各种社会的规则,而且这种规则是变化的,不停在变动,今年这个火,明年那个火。所以还是一个动态的。
第二,对手不明确。
在下围棋的时候你的对手是非常明确的,而在人生竞争里面,我们的竞争对手是非常不明确的,你根本就不知道是谁,是环境吗?有人说生活就像是强奸,如果不能反抗就顺从。所以你很多时候一定要找准自己的对手是谁,才知道采取怎样的策略。
第三,价值观问题
更加难办的事情就是价值观的问题情。在下围棋的时候价值观是赢就可以了,给 AlphaGo 加了一个更多的价值观——赢,而且是最低风险的赢,不要追求胜几子,而且以最低风险的方式赢就可以了。所以你看到 AlphaGo 并不急于胜多子,只要胜1子就可以了。
但是我们在人生规划的时候,价值观却有很多样,很多人想要钱,男生就想要尽快地迎娶白富美,登上人生巅峰。有人的价值观是平平淡淡才是真,多少钱无所谓,只要过得开心就好。还有人是追求很巨大的社会影响力,所以就有人把美国总统给杀了。
所以人生观是非常不一样的,价值观会导致各种计算跟下围棋这种虚拟要复杂得多。
为了解决这些问题,我们花了非常长的时间做这些事情。很庆幸地是,经过四年的努力,我们在这个领域得到了广大用户的认可,用户量绝对第一,而且被《中国教育报》评为全国老师最认可的一个产品。
可能这个跟大家来讲关系不太大,但是说到下一步,我们现在正在做下一步的导航,就是真的人生导航仪,这是一个陪伴产品,从15岁到30岁,我们已经机器学习了上亿人的成长轨迹,包括各种成功的、不成功的。如果说你没有理想,就帮助你确定一个理想的方向。如果你已经有理想了,那就帮助你从你的现状和理想之间找到一个最优的路径,在人生每个关键的路口为你指引方向。
这是我们的产品,我们现在正在做高中和大学阶段,也希望未来能够逐步渗透到职场阶段。
我们还做了一个尝试领域是招聘。
说到做招聘,这是一个血泪史,我是2005年第二次创业的时候做了一个项目,那个项目专门做人和项目的匹配,结果发现效率非常低,我当时天真地以为这是一个关键词搜索的问题。所以我2007年进了美国国家旅游与电子商务实验室,专门做搜索。结果做了一年的搜索,发现根本不是一个搜索的问题,搜索的关键词根本解决不了这个问题。
举个例子,在座有很多美女,左边有很多美女,那边有很多漂亮妹子。其实这是说的一句话,一个意思,但是关键词不一样,所以不是关键词匹配的问题,是认知搜索、认知匹配的问题,所以就这样,我就进入到了一个认知智能领域。
招聘领域也是一样的,这是一个可以说是全世界所有企业、所有人都会被涉及的一个领域,但是很可惜,这一块完全是靠HR用人工做的,平均每个HR每天要花40%的时间检索简历,然后要输入一个简历,你要想用什么关键词,无论是51、智联、猎聘也好,你要想你用一个什么样的关键词,然后用了这个关键词之后,所有的简历这些人怎么样?符不符合?都是用人工一个一个点开看去判断,由于用的是关键词匹配,所以排名第一和排名第一百的根本就没有什么区别,并没有说他们有质量的区别。
比如说我回国以后找工作,我太太说强生有一个岗位特别适合她,她就投了简历,结果不停地被淘汰,连面试的机会都没给。我后来我通过关系就找到强生的那个负责人,我就把我老婆的简历给他,他说特别适合,但是问HR为什么不给面试机会?HR说关键词不匹配。
所以,这就是整个影响我们全社会人才去到该被需要的地方去最大阻力,如何通过认知智能解决这个高效匹配的问题可以说是我过去12年就一直在做这样一个事,做了整整12年,遇到的挑战其实就是属于各种企业的理解。我们公司就做两件事:用机器分析人、分析企业。
如何让机器对企业的分析能够达到HR的水平?甚至胜过HR,达到专家的水平?
社会是变动的,各种岗位,那天来了一个华大基因的一个朋友,他就输了一个岗位,那个岗位是一个很罕见的岗位,新出来的岗位机器如何能够快速学习去认知,这也是我们一个很大的挑战。
当然更大的一个挑战是高速计算,对于几千万人的简历在简历库里逐字、逐词、逐句做认知分析,这个计算量是天量的,可以说我们花了很长的时间,花了两年多的时间才突破了这个计算,达到了毫秒级,就是现在4000万人的简历全量地语义认知计算算一遍下来,只需要花大概200毫秒。
绑定渠道之后就会把你所有的这种岗位给拉下来,自动帮助你生成自动招聘的策略,然后上网帮助你找所有可能潜在的人,把这些人以及投简历的候选人拉回来之后,对他做认知分析,对每个人进行多达300多个维度的分析,然后这些分析之后给出一个咨询学习得到的一个加权分,然后根据不同的岗位做出不同排序。所以,排在最上面的相比排到后面的人,岗位是更加适合你的需要的。
整个这个过程,它最核心的地方就是我们能够对人进行多维度的,经过表面的语言,然后做到背后深度的像人一样的认知分析。比如说,这里要找一个,这是猎聘网上的一个职位,直接拉过来,他是要找一个房地产行业的销售。找出这样一个人来,这里有很多大家看到好多机器辅助标蓝的部分,标蓝的这些部分就是机器认为从认知层面来讲是符合你左边所列的这些条件的,右边还列出了各种各样的纬度,这些纬度都是从量化的角度的计算。可以说,我们这方面的维度计算由于是用的全量化,而人的大脑匹配是用的模糊计算,这块可以说是更精准的。
尤其是当招聘行业的大佬来我们公司线上体验的时候说,诶!你们是不是请了房地产专家?原因是,这里说要找房地产行业的销售,结果那边就把一些万科这种词都自动的筛选出来。但其实没有,我们公司没有任何房地产专家,甚至我们公司连买了房子的人都很少,因为我们公司在深圳,深圳房价实在是太逆天了对吧?没有。这一切都是我们把方法教给机器,机器自动去学习、自动去标注出来的,这样就可以大大节省人对简历的分析以及排序的时间。
可以说,从输入的时间到做判断的时间,到匹配的准确率和人才库使用,都有一个极大的提升。这样的话,就可以对我们有20倍的提升。可以说,这样就可以对未来做一个不是很大胆的语言:这个行为目前来看,我们目前基本上把我们所知道的HR行业跟人比较的分析,绝大部分都已经解决了,而且绝大部分都已经做的比HR更好。当然,可能跟专家比还是有一定距离,但比HR做的更好,就是因为HR他不是专家嘛,这方面还是属于有很大的,可以说是在五年之内有大量的招聘专业一定会被大量的解放出来,去解放做更多的。比如说腾讯的HR说,这样的话他们就可以做更多人工的关怀事情,比如说程序员、安慰师之类的。
这个产品可以说是整整做了12年,这个项目已经做了三年,二维码大家可以扫,可以身临体验一下,如果说你对这方面有兴趣。我这个人因为有产品洁癖,一个东西如果不能做到特别让人惊艳,我是不会放出来的。这个项目内测了已经有一年了,不停地在改进,应该就在最近两个月就在全国大范围地免费推出,能够让所有企业的HR得到这样的解放。
再一个领域就是供应链匹配。
供应链匹配这个是我们当时跟两个上市公司交流,比如说在商业地产里如何拿地,从拿到地到开始建设,这中间整个供应链的流程目前有两年,他们积累了大量的历史数据,如何通过历史数据学习加速这个供应链匹配的问题,应该是所有的传统企业都会面临一个很重的问题。这儿其实也是面临同样的,对企业业务的认知、多维度的深度认知和各种企业关系的认知,这儿在未来对传统行业有非常大的帮助,能够加速企业的发展。一块地在那儿放两年,收租得收多少?所以这是一个巨大的资源浪费。
正是由于我们做了这些业务之后,我们其实做这个东西可以通用到很多领域。比如说我们现在正在做一个大的司法项目,有些法律公司用我们这套(做招聘的这套)迁移到做法律,只花了三个月就可以拿去做法律,所以说它拥有很好的在商业领域的知识分析的开放性和通用性。
所以我们也经常被另外一家很有名的公司叫 IBM,和 IBM Watson 做对比,因为 Watson 的定位也是做商业认知分析,和我们的定位是一样的。
今年2月份的时候在美国一个大会上,《华尔街日报》用整个版面报道我们公司,把我们公司跟 IBM Watson去对比,我们会被问起跟 Watson 的区别在哪里,包括 Watson 海外的用户,进入中国的时候也会想要用我们这个东西做尝试。
这里面的区别我觉得主要有几个:
首先是我们切入的领域非常不一样。这个导致我们整个知识陈列的方式非常不一样。Watson 是从医疗领域切入,尤其是从医疗的肿瘤切入,实际上很多人以为 Watson 是一个问答系统,实际上问答系统只是它的一个模块而已,它只要是做认知分析。它是从医疗切入,而我们是从生涯规划和招聘切入,所以我们更关心的是人和企业这方面的分析,和他们关注的是医疗方案分析。
Watson 早期是完全基于专家系统和 NLP 的方向,是2015年才开始组建这种深度学习,才往这方面走的,但是由于它他大量前期都是依赖于专家系统,所以即便是它从它的肿瘤诊断迁移到糖尿病诊断,迁移的成本都非常高,因为它是专家系统。
而我们所有的分析全部是基于深度学习,所以我们的迁移成本在我们所做的商业领域分析领域里,我们的成本相对来说比较低。
可以说在这方面,未来认知智能想要往商业领域渗透是大势所趋,它将决定了整个商业有多大程度会被技术提升。现在 AI 可以说是正在进入到人工智能的下一个时代,从感知过渡到认知智能。希望在未来不久的将来,我们新的产品能够帮助大家在工作中让决策更智能,能够更有效率。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。