清华大学朱小燕教授做客雷锋网沙龙，分享 NLP 和人工智能的那些事儿| AAAI 2017

本文作者：刘子榆

2017-02-12 15:39

专题：AAAI 2017

导语：在雷锋网组织的 AAAI 中国之夜活动上，朱小燕教授做了精彩的分享。

朱小燕教授在雷锋网组织的 AAAI 中国之夜活动上进行分享

在雷锋网组织的 AAAI 中国之夜活动上，AAAI 现任执委杨强教授、清华大学智能技术与系统国家重点实验室主任、信息获取课题组的学术带头人朱小燕教授、今日头条实验室总监李磊、iFly.vc 合伙人沈瀚、物灵科技人工智能首席科学家吴惟心、iPIN 创始人杨洋在现场做了分享。沙龙从下午五点半持续到晚上九点，据雷锋网现场编辑团队表示，活动氛围非常热烈。

本篇是雷锋网根据朱小燕教授在现场的分享整理而成。朱小燕教授所在的研究小组近十几年来在自然语言处理、文本挖掘、问答/对话系统等领域，针对文本信息内容，在信息度量、知识表示等方面进行了过深入研究。发表论文100余篇，曾经获得Coling2010最佳论文、ACL2012最佳学生论文。目前主要工作围绕基于知识的智能信息获取、基于语义的信息服务展开。

| 信息能够度量，知识能够计算

互联网为人类生活带来了翻天覆地的变化。我们都觉得互联网是无所不能的，大家都说内事找百度，外事找 Google。但是，经过一段时间的研究，我们发现，实际上从互联网上用搜索技术能够直接得到的信息最多也就是70-80%。因为，有些表达结果的内容不是简单地，以显性的形式放在那里，而是要通过逻辑分析推理才能够得到的。人类最伟大的地方是发明了文字。它将语言记录下来，文字描述的内容中蕴含了丰富的知识沉淀，代代相传，是的人类能够 “站在巨人的肩膀上”去了解这个世界，推动这个世界发展。如果在对互联网信息处理的时候，不使用知识，而仅仅是依赖互联网表面的内容的话，就会像现在女孩家里的东西一样，买买买，但是买了之后没有很好分类、入库、管理。不停的堆积，很多东西很快就找不到了，也就不去找了，再去继续地买买买……即影响使用时的效率，又造成无比的浪费。因此，现代的智能信息处理必须要充分地利用各种知识。

我们现在生活在信息社会，信息如何表示、信息与信息之间的关系如何度量（使用什么度量衡，什么叫大小，什么叫相似？）人类的知识绝大多数是以文字形式存储的。知识如何表示、知识与知识之间的关系如何计算？这些问题在信息社会，尤其在全社会都非常迫切地希望利用AI技术进行智能信息处理的今天，变得越来越重要。

因此我们曾经提出过一个努力的目标：信息能够度量，知识能够计算。现在主要工作之一也在做各种努力使得智能信息处理系统能够建立在知识库的基础上，对知识进行各种处理和调用，使之能够在系统计算框架中起到应有的作用。

| 对从业者的建议

此外，朱小燕教授还以一名被咨询者的角度分享了她本人对从业者的一些建议。要做好AI+，以下四个方面需要注意：

第一，要想“+”人工智能，企业本身就需要清楚自己到底想要AI为你改变些什么。希望“+AI”后面产生什么变化（结果），比如产品想换个大方向还是换一个新面孔？用它来创业，你必须要清楚所做的是否能够真正体现人工智能的特色。这样人工智能工程师才会能帮你。
第二，要跟人工智能专家沟通。目前的AI技术绝对是有可为而且有可不为的。有的成熟了，有的还在尝试甚至是幻想阶段。产品设计时要用成熟的技术才有可能达到实用效果，产品才能上线。或者就是在大企业研究院做概念产品，也行。例如，在学术界，现在的最先进的机器人灵巧操作必须是触觉、视觉、控制，甚至还有语音的交互的多模态融合系统才是有挑战性的。国际比赛，十样东西堆放在一起，在视觉引导下两个小时抓起来四个就是第一，有好几个组一个都没抓起来。因为指示要抓矿泉水瓶，抓起来香蕉，不算成功，要眼手配合，眼指挥手上下左右自由行动灵巧抓取才行。现在的机器人多任务灵巧操作/抓取离实用还有一定距离了。期待机器人（臂）像人甚至像猴子那样在树枝上采摘苹果，是不太现实的。而且也没必要。实际产品没必要要求做多维度灵巧抓取，3-4个维度就可以了，看起来没有电影里的机器人那么酷，但是能够比较好地完成自动采摘任务。有公司已经设计出产品，看起来挺靠谱。
第三，关于数据。大家会觉得有很多（大）数据。但是需要考虑一下：这些数据你真的能拿到吗？即便在手真的好用吗？之前有个世界五百强的企业跟我们说手上有很多数据，确实是。而且提出的任务也是非常符合人工智能信息处理的场景的。但是项目开始后不断发现问题，几经周折，第一期的数据终于到手，不过，从中提取出来的有用信息基本上是 0。这个任务可真是“任重而道远”，值得庆幸的是最终应该能够完成。数据处理的时间和资源消耗是非常大的，而且在一些场景下是一时的，在另一些场景下将会是永远的，没有一定的经济实力和思想准备，是很困难的。另一方面如果数据与时间相关与社会媒体内容相关，比如社会舆情数据，就更要考虑数据获取的稳定性，如果不能及时第一手拿到或者产生数据，万一被人掐住，可能会直接威胁到产品的生命。
第四，通用人工智能是很难的。语音处理是通用性比较好的一个领域，图像其次。文字是语言语义的沉淀积累，现在要在其上边在做语义处理，就是更加具有挑战性的了。我们现在在做的问答对话系统，也想做成通用的。但是一句话叫隔行如隔山啊，做什么都能干的东西是挺困难的。另外一个方面，还需要注意的是在领域专家和技术专家之间要有一个沟通，有很多领域专有的表达形式在面向大众的产品中是难以被理解的。

如果说到有什么可发展的地方，我个人期待语音再往前迈一步，使得我们60岁以上的尤其是南方老人也能够比较自如地使用语音与机器交互了，那么在居家养老领域应该能够有更好的产品出来。语音技术和产品在别的方向上很好，但是离用到老人使用还差那么一点点，就这样一点点就很重要。对于孩子而言，这个东西怎样才能让他们不是玩了两天就腻了，而是成为他们真的意义上的一个陪伴，这还真挺难的，挑战不在技术。

| NLP 学术和产业有何不同

在分享的最后，雷锋网还向朱小燕教授请教了做 NLP 学术和产业有什么不同的问题。

朱小燕教授说做计算机应用领域的学术研究，内容应该是跳起来能够够得着的，当下不那么踏实，但是，条件好了就能够使用。比如某研究院说要做能够观察人的面部表情情感变化，做能够进行情感交流的机器人。作为研究可以，作为概念产品可以试试，作为赚钱的产品就比较困难了。首先你就要叫计算机知道什么叫表情变化，大喜大悲容易，平时的细微表情变化就难了。又有多少人会察言观色，会到什么程度？家庭陪伴机器人假定的服务对象多半是老人，老人脸上就更不容易识别出喜怒哀乐的变化了。这些做研究是可以，有能力的企业可以做这样的研究做基础沉淀和展示，但是做产业就要想清楚了。再比如做陪伴老人的机器人产品。如果是行走机器人就要想清楚，机器人腿脚不方便，老人腿脚也不方便，两个腿脚不方便的在一起（笑）。这个东西还有不少问题需要解决。但是研究肯定是可以的。

雷峰网版权文章，未经授权禁止转载。详情见转载须知。

1人收藏

专题

AAAI 2017

本专题其他文章

刘子榆

打倒麻瓜

与有趣人做有趣事。

发私信

当月热门文章