您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
雷峰早报 正文
发私信给黄韦
发送

1

Win10周年升级大礼包要来了;# 语音交互它就一伪需求 # | 雷锋早报

本文作者: 黄韦 2016-06-30 09:40
导语:微软昨天在官方宣布,Windows 10 Anniversary Update一周年更新版将于8月2日正式发布,现有的Windows 10用户可以免费获得升级。

微软拟推出Win10周年升级程序:包含大量新功能

Win10周年升级大礼包要来了;# 语音交互它就一伪需求 # | 雷锋早报

微软昨天在官方宣布,Windows 10 Anniversary Update一周年更新版将于8月2日正式发布,现有的Windows 10用户可以免费获得升级。

这将是Windows 10发布一年以来,规模最大的一次更新,包括诸多全新突破性的功能,使Windows Ink(墨迹书写)和Cortana(微软小娜)成为主流应用;更快速、更方便、更高效的Edge浏览器;面向消费者和企业的先进安全功能;全新的游戏体 验;面向现代课堂的新工具;企业客户全新安全功能,等等。

网友评论:温馨提示,距离Windows 10免费升级服务终止只剩下一个月时间了。在一个月后,用户升级到Windows 10将需要缴纳119美元费用。

一加曾经的智能手表设计图曝光

Win10周年升级大礼包要来了;# 语音交互它就一伪需求 # | 雷锋早报

昨天,一加科技联合创始人裴宇在自己的Twitter上向外界曝光了一张一加智能手表的设计草图。从图中来看, 这款智能手表采用了圆形表盘设计,外形看起来有点类似于Moto 360。不过裴宇在推文中表示:“本来能诞生的产品,结果并没有。”,意在暗示该产品很有可能已经遭砍。

事实上,此前就有有关于一加智能手表的传闻,曾经还流出过据称是一加智能手表的实物图。从当时的图中来看,确实很像Moto 360,采用了圆形表盘和皮质表带。

网友评论:不要跟风,砍掉应该是正确的选择。

小米支付将在今年秋天上线

小米科技联合创始人兼副总裁、MIUI负责人洪峰在接受腾讯科技采访时表示,小米支付将在今年秋天上线,目前正在与各大银行进行调试。洪峰表示,以前很多的厂商都想推或已经推过NFC支付,但由于普及度很低,短期内用户还难以接受。不过,自今年以来,三星和苹果也在全球范围内大幅推广NFC,这样大家都有信心了,小米也看到NFC普及将变得容易。

Roam-e无人机  超便携的自拍神器

Win10周年升级大礼包要来了;# 语音交互它就一伪需求 # | 雷锋早报

这款Roam-e无人机并不是首款可以进行追踪拍摄的无人机,但它的外观却非常与众不同,它的形状有点像根管子。

它的发明人称该款无人机使用面部识别技术来追踪拍摄用户,一次充电可在空中停留20分钟,有充足的自拍时间,它内置了1080P高清摄像头,可以不间断的拍摄视频或完美的360度全景照片。它的旋翼叶片采用了可折叠设计,非常便于携带。它内部使用了四核ARM Cortex A7处理器和500万像素的感光元件,制造商称该款无人机充满电大约需要2个小时的时间。

Uber CEO的Twitter账号被黑 该团伙曾"黑"过小扎

Win10周年升级大礼包要来了;# 语音交互它就一伪需求 # | 雷锋早报

6月30日消息,据国外媒体报道,Uber CEO特拉维斯·卡兰尼克(Travis Kalanick)的Twitter账号日前也不幸遭遇黑客攻击。一个名为OurMine的黑客组织周二晚成功窃取卡兰尼克的Twitter账号,并发出一则推文“邀请”后者访问其网站,以“了解”如何强化账号安全。不过该则推文目前已被删除,卡兰尼克似乎已经重新获得其Twitter账号的控制权。

网友评论:醉了,互联网大佬一个接着一个被黑。

/ 今日话题 /

# 语音交互它就一伪需求 #


关于语音交互的讨论已经很多了,支持语音交互的人觉得说话是人类最原始的交互方式,反对者觉得一是技术能以突破,第二是缺乏隐私性。

每个人说的都很有道理,谁也很难反驳谁。但作为一个在全员使用语音产品的环境中用了四个月的语音交互产品的人来说,用户往往更愿意看到实际体验结果,而不是理论。当然,理论也自然是要有的,只是接下来理论层面的东西均为实际体验做铺垫。

“2011 年苹果推出了 Siri,但 Siri 已经沦为了一个被调戏的工具,很少有人去用它。Siri 及其模仿者就是个装 X 犯。”

——罗永浩

罗永浩认为,Siri 及其模仿者失败的原因在于其理念就是错的,问题不在于语音识别技术,而是人工智能根本达不到。

此外,罗永浩提道语音软件的另一个问题在于用户心理障碍。“当你使用语音软件时,别人会怎样看你?”优秀的语音识别技术一定要解决几个问题:第一,解决心理问题,让他用起来不丢人,不尴尬;另外,它使用便捷性一定超过你用手指去点。

其实我觉得老罗的话前半部分有道理,但后半部分经过长时间测试后发现这实际上并不是重点。丢不丢人、尴不尴尬可以把一个人丢在都在使用语音产品的环境当中做测试。对于便捷性来讲,目前市场上的一些语音产品便捷性明显优于用手触控操作的产品。

好,开始讲道理了。

学术层面难以突破

很多人认为当语音识别越来越智能,再加上人们习惯语音产品,那么未来语音交互一定可以像《her》一样。在我看来,技术和习惯这两个东西在语音交互层面是个看似可以突破,实则两者是很不靠谱的变量。

近几年深度学习火热,数据量也暴增,有人认为输入大量语音数据做训练,去提高它的语音和语义识别度,这样肯定将会迅速提高。

首先,用大量数据去训练虽然可行,但这是一种偷懒的行为,在没有做好分词以及语音模型的情况下随意训练数据往往事倍功半。而语言本身不仅是一种理性和逻辑性行为,它是人类与生俱来的能力,是一种生物智能。而目前自然语言处理均使用工程算法实现,用统计学和概率学的方式去分析词汇和语句,工程算法它只能分析语言的输入从而计算语言该如何输出,但它无法理解。如果无法理解,要是玩点儿套路肯定就听不懂“人话”了。有人说既然是生物智能,那可以去研究大脑啊,保罗·艾伦成立了一个大脑研究室,投入数亿美金,其中加州理工大名鼎鼎的科赫教授主导脑部神经科学的研究,目前并没有什么大的成效。

工业界不肯砸钱

在学术层面它面临技术难以突破的问题,而从工业层面讲,一些公司是否会投入大量资金在NLP中也是问题。

Google资深工程师吴军曾在《数学之美》中写到目前自然语音处理已经达到了一个较高水准,如果想继续突破的话,在目前的形式下提高百分之零点几的识别率,远远大于以往的提升难度,并呈指数级递增。从成本上讲,Google等公司不会考虑这样做,与其提升这些效果不大的项目,不如把资金集中在其他更有潜力的项目当中。其实这也是苹果以及Google不看重Siri和Google Now部门的一大原因。

不要觉得FB和谷歌今年推出的聊天机器人主打语音交互

有人会问,那为什么今年Facebook推出了内置聊天机器人、Google推出了allo。如果觉得语音交互是未来趋势所以Facebook和Google推出这类产品,那笔者认为这是个错误的思维。

Facebook的内置聊天机器人以及allo的重点不在于语音交互,而在于功能自然语言化,我们知道自然语言包括文字和语音。以往使用一项功能,首先打开相应的APP,然后在各个按钮上点击,完成自己想要的服务。而Facebook聊天机器人和allo则可以直接在聊天页面的对话框中输入相应的文字或者语音指令就能获得相关服务。把点击交互变成一种对话式的交互,这才是重点,而非语音交互。

应用本身就是一种累赘。在对话中完成服务像是为人们提供的一种应用上的应用。

对话式UI 正在从消息应用脱茧而出,也渗透到我们的日常产品里面。原因很简单:人性使然。

语言是人类必不可少的一部分,已有成千上万年的历史,跟别人交谈是我们与生俱来的本领。这是我们用来分享知识、自我组织以及分享情感的方式。消息传递已经成为引导和管理我们日常生活的一层,而引导和管理的目的就是服务的一种形式。

对话式交互是未来,但没语音的事儿

而这里我先扔出一个观点:对话式的交互更适合文字交互,不适合语音。

首先技术限制是个前提,这方面我刚已讲过,不重复了。这里面最重要的一个问题是心理舒适性。

我并不认为未来我们会和电脑以口头语言交流。虽然《太空漫游》和《Her》都将这种它描绘成最不费力的交流方式,但说话相比于其他交互方式包括文字输入、多点触控等需要更多认知和身体上的努力。有时候你宁愿和别人聊一晚上微信也不愿意电话聊天,尽管文字输入没有语音快,但是这种方式却让人觉得最舒服。

对于软件来说,舒适比便捷更重要,文字是一种让人舒服的媒介。用文字交流灵活,有趣,也可以客观记叙,甚至更大胆的调情。而且与用户界面和语言相比,有时文字读起来更流畅。

就像国外的Magic为何能迅速火爆,并不是因为它是人工+智能的私人助手,人工+智能的私人助手在国内很早就有了。而是Magic把交互页面设计成短信对话框的形式,并且只提供文字输入。把你想要的东西短信发给Magic,剩下的所有事情它都会帮你搞定。相反,相似的语音产品在火热一段时间后越来越不受投资人待见。

短信是绝佳的文本UI,文本是绝佳的交互。为什么语音不是最佳的交互,接来就看看我的实际体验吧。

4个月的集中式体验

上面也讲到,我曾在某语音助手产品(也可以文字输入)公司工作,产品也采用对话框形式的交互设计,每一项指令用自然语言在页面右侧输入,相关服务则从页面左面输出,与聊天记录相似。

自己强行使用四个月后(包括自家产品和竞品)仍旧觉得很不习惯。

这四个月里,我设定了两个定量,这两个定量可避免其他干扰因素。

第一:作为圈内员工,自己很清楚市场上产品的自然语言处理技术是什么水平,以及产品能提供哪些服务。因此我在四个多月的使用过程中,会做一个自我限定,避开那些无法识别的指令和不能提供的服务,只去体验最好的那部分,因此识别度和各项服务送达率接近百分之百,这方面的使用体验很流畅、很完美。

第二,从环境上讲,因为一直在公司使用,不会存在老罗所说使用语音尴尬和丢人的问题,身边的同事恨不得每一分钟都说一次指令。放下了内心的戒备。

但即便如此,除了特定场景如冬天太冷出门在外用语音会觉得很方便,其他场景始终没有培养出习惯。现在不逼自己使用语音产品的结果就是,我又回到了最原始的状态。连我都有点不太相信。

Win10周年升级大礼包要来了;# 语音交互它就一伪需求 # | 雷锋早报

无论从学术还是工业层面上讲,语音交互均难有较大的提升空间。

而从人与机器的交互天性上讲,语音交互也很难从大众普及开来。

语音交互,它没你想的那么智能,即便智能了,即便普及了,即便你敢大胆拿出来用了,也不见得会让你觉得很舒服。


雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说