3
本文作者: haoxiaoru | 2016-10-09 12:40 |
编者按:2016年8月12、13日,雷锋网在深圳举办了盛况空前的“全球人工智能与机器人峰会(CCF-GAIR)”,来自中美加的全球最为顶尖的科研实验室、学术权威、产业大咖、投资领袖共同探讨人工智能、机器人、无人机、智能驾驶等四大领域的未来趋势和产学研发展方向。雷锋网将会议精彩演讲内容与视频精心编辑,近期将逐步放出。
关于小米如何玩转“人工智能”,该公司联合创始人黄江吉,在雷锋网 CCF-GAIR 大会舞台上,首次做了全面阐述。
他的演讲极具工程师风格,逻辑清晰地对外展示了小米的另一面 —— 如何利用产品产生的海量数据和机器学习技术,将“人工智能”落地到各个互联网业务上,以及推进物联网硬件的智能化。
跟那些恨不得把“人工智能”四个字贴在脑门上的,好高骛远的创业者不同,黄江吉所讲的内容与实际业务结合非常紧密,是典型的成熟公司对待技术拐点的方式。这也是雷锋网最推崇的理念。
黄江吉说,小米运用人工智能的方式和业务(搜索、推荐、广告、云相册等等),跟大家想象中的人工智能 AI 可能不完全一样,但是这些业务都得益于深度学习技术,并且起到了立竿见影的效果。
我觉得人工智能和深度学习这几年的突破,和对这个行业的贡献,远不止大家理解的语音识别、图像处理等基础技术。其实在每一个需要算法的应用和产品里面,都能用得上。这才是机器学习对我们最大的意义,它完全改变了工程师做产品的方法论。
黄江吉所称的方法论,是指产品因为用户使用而产生的数据,通过机器学习技术的加工,让产品更加智能化,从而形成正向循环(见上图)。他认为,这个循环,已经成为产品开发的新常态。
据黄江吉介绍,小米的数据主要来自手机和其他物联网IOT设备(也说智能设备)。
手机方面。小米的 MIUI 系统超过 2 亿用户,其中日活跃度超过 1000 万的应用有 8 个,包括:天气、日历、应用商店、音乐、相册、安全中心、浏览器和小米视频;日活跃度超过 100 万的应用有 17 个,除了前述的 8 个,还有 9 个,分别是:小米生活、个性主题、米家、便签、游戏、邮箱、钱包、金融、阅读。
黄江吉说:
应用的活跃对小米来讲有两个意义:第一,通过用户的使用情况反馈,了解每个用户的真实需求;第二,因为用户非常活跃地使用手机,所以小米才可以获取更多的数据。这些数据反过来,帮助小米改进产品。
物联网设备方面,不含手机,小米已售出超过 3700 万个智能设备。三年前,随着IOT的浪潮,小米开始涉足用户生活中使用的硬件,包括电视、路由器、手环以及一系列来自生态圈的设备。
黄江吉说:
小米进入这个领域,客服了两个核心问题,一个是传统设备智能化,首先应该具备联网控制能力。小米将 Wi-Fi 模块的成本从 60 元左右,降到了 10 元左右;另一个是联网的方式不够智能。小米在自己的生态圈内,实现了设备插电之后,自动会询问是否添加到家庭智能网络中(米家应用)。
“每个人可能都会有一两部手机,但是家里的智能设备产品加起来可能有十几个、二十几个。现在小米智能设备出货量超过 3700 万,未来这个数字会远远大于手机。”黄江吉认为,正是因为手机和智能设备被用户活跃地使用,才产生了真正的高质量大数据。
“我们全线的产品或业务的大数据,全部汇总到一个数据工厂,每天的数据量高达 200 TB。”黄江吉说,“数据的存储成本很高,如果你存了大量的数据,但不能够发挥价值的话,还不如不存。我们通过对数据的处理和挖掘,让它可以反过来训练我们的算法,训练各种各样的产品,让它们做到真正智能化。”
拥有海量的数据之后,我们意识到必须以人为核心,所以花了两年时间去建立用户画像。不同的公司有不同的用户画像,在小米,我们对用户画像的定义其实就是围绕这个用户,不管他是在使用手机,或者在看电视,或者在家庭使用各种各样的智能硬件,如何可以充分的把这个用户的需求和习惯,变成用户画像的特征。
“只有当你比用户更了解他的需求,才可以为他提供更多的智能服务。”黄江吉举了一个小米阅读的例子,他说如果用户经常使用小米阅读,代表他是一个爱读书的人,这样的特征属于粗颗粒度的,非常表象,很难通过这样的特征达到用户的期待。小米需要知道用户喜欢哪类书、哪类作者,喜欢在什么时候阅读,移动中,还是排队这样的碎片时间,只有达到这样的用户画像颗粒度,才能提供超越期待的内容推荐智能度。
黄江吉透露,小米的用户画像数据已经包含了大概 1000 个用户特征。小米还发现,通过精准的用户画像数据,还可以用来有效打击黄牛。大概半年前,小米的工程师试验了一把,通过足够的用户特征判断用户的真实性。黄牛则会利用一两个“漏洞”,让机器以为他是真实用户。黄江吉说,你防止不了黄牛在某一些特征里作弊,但你会发现黄牛很难在30个甚至100个特征里同时作弊,因为这样的“作案”成本太高了。“当我们使用了1000个特征之后,我们发现已经可以把黄牛打到下风了。”根据 PPT 数据,黄牛从超过 20% 降低到 10% 以内(上图右上角)。
“除了对用户越来越了解,我们还要对内容越来越了解,小米把所有内容资源都放到内容池里面,对内容进行整理和特征提取,最后结合用户画像,进行全方位的内容推荐。”黄江吉说。
黄江吉说,过去6年,小米很有幸零距离地看见了几个技术和产品的拐点和爆发:从一开始的移动互联网爆发,带动了几乎所有用户使用了他们第一部智能手机;再到两三年前的 IOT 爆发;直到现在的人工智能。“我觉得这几个爆发和拐点,真的是我们整个行业的幸运。”
“尽管经历这么多技术拐点,但是小米的目标从来没有改变过,依然是如何把用户真的需要的产品和里面的功能做得越来越好用。我们希望把这些最前沿的技术和功能带入到千家万户,而不只是高大上的用户可以用到。”
我们希望跟行业里面的科学家、学术专家,还有工业界的合作伙伴一起,看看在我们这一代里面,是不是可以落地人工智能,把人工智能带入到家庭的每个角落,让它无处不在。我在客厅里面不用摇控器就可以控制电视,可以直接告诉我的智能音响现在要去哪,然后它自动下单……这是第一步。第二步,在我没有说时候,它会自动的预见,做推荐,或者其他智能服务。如果能做到,人工智能才真的做到了日常生活中。
“我担心的不是奇点(Singularity),不是人工智能如何统治这个世界。我担心的是,如何在我们这一代,工业届和科学界一起,利用我们的技术把人工智能带到我们的生活。”黄江吉最后说。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。