1
7月5日雷锋网消息,国家会议中心,百度AI开发者大会,百度度秘总经理景鲲现场讲解百度DuerOS战略,以及宣布百度全资收购KITT.AI的消息。据雷锋网了解,此前KITT.AI拒绝了来自Facebook的收购。
景鲲表示,唤醒万物的核心三要素是要做好听清、听懂、满足。听懂是人工智能时代用数据和技术解决的关键问题。景鲲称,在这个时代,只有百度在中国市场是唯一具备听清、听懂、满足的实力,打造一个开放赋能的生态系统。
“听清”
百度的语音识别率做到了近场识别的准确率97%以上,但这些在AI时代还不够。在AI时代,技术要与场景相结合。百度希望将语音放到真正的场景里面去解决问题,研发了麦克风阵列、回声消除、语音唤醒、人像识别等技术。这些都是百度逐渐推进的世界先进技术,将被放到各种场景中实现用户听清的需求。
“听懂”
数据多、介入深是打造对话系统的必然条件,具备这两点才能做好一个真正可以对话的“听懂”系统。景鲲表示,百度是具备数据量最大的公司,拥有亿级的多轮对话数据、十亿级的知识图谱数据。
“满足”
听懂并满足“听一首某某的歌”这样的用户需求还不够,真正用户想要的是更自然、更复杂的需求,比如“我要听我手一杯品尝你的美这首歌”,比如“想听哥哥的歌”,只有把用户在真实场景中表达的复杂请求做好,才能真正做出一个真正听懂用户需求的产品。
“‘听懂’的目标,就是要FreeStyle,让用户最自然地跟设备进行交互,毫无拘束。”景鲲现场演示了利用DuerOS的多轮交互过程,这种交互只有百度的技术才能驱动。
现场,景鲲公布的另一个重大消息,是全球顶级AI创业公司KITT.AI正式加入百度。百度将把KITT.AI的语音能力和自然语言处理能力融入到百度平台中,全面免费向百度的合作伙伴赋能开放。
据雷锋网了解,KITT.AI专注语音唤醒和自然语音交互技术,是世界上唯一一家获得亚马逊Alexa和微软联合创始人Paul Allen投资的公司,并入选了CB Insights人工智能创业一百强。
KITT.AI联合创始人、CTO陈果果先生现在演示了如何使用KITT.AI语音唤醒技术快速打造一个语音唤醒设备。根据陈果果先生演示,进入Snowboy的唤起词库并新建唤起词“你好景鲲”后,接着只需要说三遍“你好景鲲”,即可完成唤起词的训练。在测试环节,设备只会对唤起词“你好景鲲”进行响应。
最后,景鲲表示,DuerOS将为开发者提供最容易上手的软硬件一体化解决方案,包括多样化的开发套件和完全开放的参考设计:
1、搭载树莓派,利用科胜讯技术的个人版。即刻申请就可以搭载一个个人可以对话的语音设备。
2、轻量版。把一元钱大小的芯片放在任何一个设备里面,设备就可以对话。
3、标准版。两麦、四麦、六麦、八麦的标准版都可以即可申请。
4、完整一体化的参考设计。如开放电路板设计、开放结构设计、开放麦克风阵列等等。
手机、电视、冰箱等任何设备,都可以搭载DuerOS,变成一个能“听懂”的设备。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。