1
2017 年 7 月 5 日,智能音箱的市场上又多了一个重磅玩家。
在预热一周之后,淘宝的首任产品经理、现阿里人工智能实验室负责人浅雪,终于在今天下午为大众揭开了智能音箱天猫精灵 X1 的面纱。现场,阿里还请来了王自如对 X1 进行了实测。
目前来看,除了 499 元的价格之外,X1 最大的亮点在于解决了购物的支付验证环节。
和市面上的大多数智能音箱产品一样,天猫精灵 X1 也采用了圆柱形的设计,并有黑白两种配色。
相比亚马逊的 Echo 和苹果的 HomePod,X1 的体积控制的比较好,高度 126mm,直径 82mm,而亚马逊 Echo 的尺寸为 235 mm x 84 mm 。
X1 的顶部中央,配有一枚静音键,当用户触发此键时,X1 会立刻停止声音播放,并停止识音功能。底部则设计了一圈隐藏指示灯,可以根据不同使用功能和场景配合进行提示。
在配置方面,采用的是联发科在今年的谷歌 I/O 2017 开发者大会期间发布的 MT8516,而这款芯片主要面向智能语音助手设备(Voice Assistant Devices)和智能音响的系统设备。
据雷锋网了解,MT8516 支持四核心 64 位 ARM Cortex-A35,主频为 1.3GHz。该芯片还内建 WiFi 802.11 b/g/n 和支持蓝牙 4.0。此外,MT8516 还支持多达 8 个 TDM 通道和 2 个 PDM 输入,以支持来自多个源的音频输入,适用于远场(Far-field)麦克风语音控制和智能音响设备。
至于麦克风阵列,雷锋网从浅雪那了解到,X1 采用了思必驰的 6 麦克风环形阵列方案,能够在家庭环境下实现 5 米范围语音识别。
X1 的唤醒词为 “天猫精灵”,浅雪表示,这是出于设计和市场推广考虑。不过,初次使用的用户,需要先在手机上安装天猫精灵 App,用以绑定账号。据浅雪介绍,X1 采用了一键声波配网,联网时间不到10秒,而市面上同类产品通常至少30秒。
播放音乐、查询天气、设定闹钟、朗读故事、操控智能家电...... 这些都是大多数智能音箱已经具备的功能。除了这些意外,X1 还拥有一些特色功能,包括充话费、网上购物、查快递等。
其中,网上购物尤为值得关注,因为 X1 不仅实现了声纹识别,更为重要的是,打通了支付环节。
用户先将自己的声音注册后生成声音密码,与机器绑定后,确认开启声纹购功能。随后,当用火狐说出 “帮我买一箱牛奶” 这样的需求时,天猫精灵会要求用户跟着念一串随机数字进行声纹校验,如果确认为用户本人,天猫精灵会从用户绑定的支付宝中进行扣款完成交易。
浅雪介绍,声纹识别技术是生物识别的重要识别手段之一,结合服务链多重安全机制,已达到商用的级别。这也是阿里在语音深度学习领域的核心技术之一。据悉,天猫精灵目前最多可以识别 6 个人的身份。
作为对比,亚马逊的 Echo 目前还不支持声纹识别。
显然,这些服务是需要联网的。而在这些服务的背后,就是阿里的第一代中文人机交流系统 AliGenie。
据介绍,天猫精灵 X1 内置的 AliGenie,应用了阿里积累多年的自然语言理解和处理技术。
为了壮大 ALiGenie 的生态,阿里人工智能实验室还同时发布了面向开发者和硬件厂商的 AliGenie 开发者平台。
AliGenie 开发者平台将向应用开发者免费开放 NLP 语义理解、TTS 语音合成等多项自然语言处理技术。开发者既可以创建技能,为更多的语音用户提供服务,也可以将自己的设备接入云端服务,获取语音交互能力。
目前,天猫超市、菜鸟、KEEP 等已推出基于 X1 的语音应用。现场,王自如专门测试了针对健身的 “倒计时” 功能,从现场的演示效果来看,这个功能并不智能。
针对内容创作者,AliGenie 还提供了语音公众号功能,开发者只需将语音或文字上传至后台就可以完成应用的创建和发布,文字将通过语音合成引擎转换为语音,用户可以通过订阅实现定时播放或者点播,开发者也可以进行主动推送。
此外,AliGenie 开发者平台还为硬件制造企业准备了单麦克风到多麦克风阵列的参考设计方案,并提供包括唤醒词定制,声学结构,核心电路设计和芯片方案在内的相关套件的参考设计,以及云端服务和应用管理所必要的全套工具和用户 APP SDK 组件。接入的硬件设备能够快速具备人机语音交互能力,并共享应用商店的所有应用技能。
显然,阿里做智能音箱的目的并不只是为了做智能音箱。
实际上,这并不是阿里首次涉足智能音箱领域。
早在两年前,阿里巴巴旗下的阿里智能就分别与飞利浦与漫步者两家厂商合作,分别推出了智能音箱产品 “小飞” 和“MA1/3/5”。
在宣传时,阿里表示,这两款音箱利用了阿里云大数据分析能力,可以了解用户的听音习惯和喜好,并号称是会成长的智能音箱。
当时,中国市场上最火热的还是 WiFi 音箱。
不过,这两款产品的表现未能让阿里满意。浅雪在会后接受采访的时候,也主动提到了当年的两款音箱产品。
她表示, “其实做天猫精灵 X1 有一个很重要的原因,它需要的东西太多了,今天行业里面的硬件厂商单独去打造(这样)一个硬件产品,要整合那么多资源,还得要有 AI 的技术,(这)是很困难的。所以,我们其实是借着天猫精灵 X1,, 打造了这样一套系统,阿里巴巴也非常愿意分享这样的一个技术给到行业的。”
结合 AliGenie 开发者平台为硬件制造企业准备的单麦克风到多麦克风阵列的参考设计方案,可以发现,阿里做音箱,真的不只是为了做音箱而已,倒是有点微软推 Surface 的意思:既然大家都做不好,那么我就自己做一款产品,为那些 OEM 厂商提供一个模板。显然,这是出于壮大 AliGenie 生态的考虑。
不过,中国市面上的智能音箱产品实在太多。美国市场上目前仍然是亚马逊 Echo 一家独大,然而中国市场的版图仍然支离破碎,目前还没有哪一家的产品能达到 Echo 在美国的高度。
而且,虽然 X1 只要 499 元,但是京东旗下的叮咚 TOP 智能音箱目前的售价为 299 元。也就是说,X1 不仅推的晚,而且在性价比方面并没有太大的优势。
不过,浅雪对 X1 很自信。在她看来,X1 的核心竞争力在于 AliGenie 人机交流系统。要做好人机交流系统,需要对很多不同领域的理解,而且还要有很多的服务。
当有记者问到科大讯飞时,浅雪表示,“到目前为止,很少见到科大讯飞在语言理解这部分开放相关的 SDK”,而这个却是 AliGenie 很核心的一个点。
伴随着 X1 的一同出现在公众视野的,还有阿里人工智能实验室——A.I. Labs。
据浅雪介绍,阿里人工智能实验室(A.I. Labs)成立于 2016 年,主要负责阿里巴巴集团旗下消费级 AI 产品的研发,而 iDST 主要负责 AI 基础技术的研发,两者有所区分。
在发布会现场,雷锋网也发现了阿里人工智能实验室杰出科学家——王刚教授的身影。
由于王刚教授在计算机视觉方面有很深的造诣,之前有人猜测,阿里人工智能实验室聘用王刚教授是不是要进行计算机视觉方面的研究。不过,浅雪表示,他们看中的是王刚教授对深度学习大领域的深刻理解。
此外,因为 Labs 是复数,很多人猜测着意味着 A.I. Labs 会分成语音识别、NLP、计算机视觉等多个实验室。但是,浅雪表示,他们实际上是按算法实验室、终端实验室...... 这样来分的。
不过,阿里方面对于人工智能实验室后续有哪些产品计划并不愿多谈。显然,阿里也还在如何实现 AI 商业化的道路上摸索。
在采访环节结束后,浅雪讲了一个小故事:当她在给马老板演示 X1 是如何回答用户的 “我是谁” 这个问题时,马老板惊呆了。
不知道,当时的马老板心里是不是在想,“So TMD What?”
雷峰网原创文章,未经授权禁止转载。详情见转载须知。