0
本文作者: 王金旺 | 2018-10-24 20:32 |
雷锋网按:10月24日,以“智汇世界·声动未来”为主题的「首届世界声博会暨2018科大讯飞全球1024开发者节」在科大讯飞总部所在地合肥举行,雷锋网也受邀参加活动。zai科大讯飞在大会上一再强调了“人机耦合的战略早已有之,并将继续”,晒出今年比赛成绩单,公布了“1024计划”,并发布了一系列生态产品。
本次大会,公布了“1024计划”的三大计划,包括:
AI教引计划2.0
AI生态计划2.0
AI公益计划2.0
发布了iFLYOS+六大平台,包括:
iFLYOS
iFLY家居平台
iFLY机器人平台
iFLY车载平台
iFLY客服平台
iFLY医疗平台
iFLY营销平台
科大讯飞董事长刘庆峰细数了科大讯飞走过的经历,在世界性语音竞赛中屡屡夺冠,机器翻译达到英语六级水平,分析了人工智能时代“万物互联”和“数据驱动”两大趋势,并一再强调了人机耦合在语音技术中的重要性。
以下为雷锋网整理的会议部分内容。
2016年,我们在历史上第一次用认知智能,使得机器在作文评分和口语评分中超过了人类老师;2017年我们是全世界第一个让机器通过了国家执业医师资格考试,以456分的高分超过了96.3%的人类考生,从而使得人工智能首次具备了全科医生的潜质。今年三月份在合肥医疗机器人开始投入使用,开始只能看150多种病,现在已经可以看到300多种病,我们期待今年底能够看到上千种病,真正成为一个不断学习进步的全科医生。现在我们的翻译水平也达到甚至超过了大学英语六级的水平。
我们现在可以看到,人工智能时代有两个非常重要的趋势:万物互联和数据驱动。
万物互联是最近两年全球消费电子展、世界互联网发展报告都能明确看到的大趋势,作为IT产业的第六次浪潮,越来越多的穿戴式设备、智能家居、便携终端和车载设备开始普及。在此过程中,随着中国5G建设即将大规模到来,更将大力推动万物互联时代的发展,将会比手机为代表的移动互联网时代的终端数呈现十倍以上的增长。而在这个领域,人们对更自然的人机交互也会提出更高的要求。
随着人工智能时代的蓬勃发展,基于数据驱动技术进步的应用发展成为社会非常重要的方式。数据驱动要求我们在数据汇聚的同时,进一步对用户的隐私保护提出了越来越高的要求,全世界范围内都在高度关注。我们在今年的两会,科大讯飞就代表我作为全国人大代表专门提出来了关于建立国家用户隐私保护法的议案,万物互联和数据驱动所带来的后台技术要求也越来越高。
在万物互联的大背景下,我们需要适应越来越多不同年龄的用户,比如我们的父母亲、爷爷奶奶、小朋友们都要开始使用,因此对于噪音、口音、方言,对于远距离的识别,提出来越来越高的要求。语音识别对我们今天在座的众多开发者来说,如果要做到万物互联中真正的好用、解决刚需,而不是噱头,它的技术门槛会进一步抬高,而不是技术门槛变低。
今年9月7日刚刚揭晓的英文语音识别大赛,面对远距离、噪音、多人说话的场景国际英文识别比赛,组委会根据最新的国际算法给了一个基线系统,因为噪音特别大,所以基线系统的错误率是80%,国际著名机构基本都参加了,很多单位都没有达到基线系统的要求。而科大讯飞在所有四项指标都是全世界第一名,而且超过基线系统40分的准确率,我觉得给中国在语音领域进一步赢得了全世界的尊重。我们把最新的语音识别系统用在我们的讯飞听见以及我们与开发者合作的未来参考方案和开放平台中。
在今天我们面对万物互联,我们需要能听会说、能理解会思考更多的技术方案,那么用户隐私保护怎么办?企业当然要自律、要有内部的规则,要遵守国家法律、要尊重用户、尊重市场规律,国家要立法,同时我认为技术进步赋予用户的选择权也非常重要。所以我们在业界率先推出了离线语音识别,在讯飞的输入法中如果你不愿意语音的数据送到后台,可以直接选择离线识别,全在自己本机上,当然我们后台在线的数据是工信部直接颁布的叫“安全可靠语音云”专门给我们进行了鉴定和认证、保护用户隐私的。但如果大家觉得不放心本地语音合成我们想要朗读出来的各种声音,甚至我们可以模仿你女朋友的声音读她给你的EMAIL,你不想让别人知道,自己听,离线语音合成还有离线翻译。今天的系统中所有翻译都是离线的,都是我们在本地一个小小的设备上实现的。
2015年12月,科大讯飞推出听见系统之后,很多厂商在跟风学习,但到目前为止,我们看到在各种重大会议场合下的其他友商的产品没有一个是离线的,都是要到后台大规模服务集群来计算,只有讯飞今天真正地推出了离线翻译系统。因此在这样一个公开场合下我们的系统能用,在内部开会的保密场合下我们跟老外交流一样可以用,我们也可以用在外交部等涉密场合,这是我们科大讯飞技术给我们消费者和用户所带来的选择权。
光有技术当然不代表一切,我们说历来只有伟大的产品,伟大的技术必须通过伟大的产品来落地,人工智能真正发展需要源头技术厂商、需要开放平台、更需要所有创业者协同努力,还需要社会的伦理、人文和法律体系的配套。它绝不是单个企业和单个科研院所的工作、少数科学家的工作,是涉及到整个人类的,它将是一个伟大的历史进程,涉及到社会生活的方方面面。不光是科大讯飞,我们认为随着技术在各种专业有数据、有逻辑规律可循的场合,会大量替代现有的工作岗位,提升现有的工作效率。国际主流的科技媒体和综合媒体也都有这样的评述,比如说科学杂志就预测说2045年之前全世界50%的现有工作会被人工智能替代,我们在多个场合都跟大家都介绍过,中国这个数据是77%,这是科学杂志的预测。而BBC预测人工智能对当前365个行业的替代率给了一张专门的表。很多人说是不是过于夸大了,我今天告诉大家,只要有数据、有规律可循的领域,机器代替人50%、77%,根本不用等到2045年,未来十年之内就将变成现实。所以我们每个人今天都应该关注人工智能,我们每个创业者都应该了解人工智能的大趋势,我觉得这是必然的趋势。
当然我们拒绝神话,要知道,因为人工智能还刚刚起步,所以我们在发展过程中也碰到了各种各样的情况。科大讯飞作为首批入选四大国家人工智能平台,我们的发展也受到了各种各样的讨论,甚至有很多行业跟讯飞沟通探讨机器和人的关系,大家也有顾虑有担心。但我想人工智能现在这种大势所趋,其实不是一个人和一个行业能够阻挡得了的。就像当年英国的红旗法案对汽车的限制一样,最后汽车没有限制住,还使得英国在汽车工业上整整落后了30年、耽误了30年。而人工智能的大潮绝不是我们某个行业某个个人想阻挡就可以阻挡得了的,即便中国不做,全世界也会做。所以我们只有顺应这个时代,用好人工智能才是当前的明智之举。
在2015年底我们发布了讯飞听见,16、17年有很多的数据公司对科大讯飞其实是有敌意的,但是现在我们发现,科大讯飞的听见平台给大家带来了越来越多的流量,给大家带来了越来越多的生意,现在也有越来越多的转写数据公司成了科大讯飞生态体系的一部分,大家的业务量比原来更多更大了,因为原来有很多没有钱、没有条件来接受转写服务的个人和机构。现在开始有这样的需求了,激活了一个更大的市场,使得原来的转写公司可以有更多的生意,我想这是一个大势所趋,大家应该协同起来共同面对这样一个伟大的历史进程。
在这个过程中,人机耦合是人工智能系统应用落地的关键,即便在各种行业领域有数据和规律可循,我们也需要最好的人工智能算法、行业数据和应用专家共同的打磨。为什么我们通过医考机器人的考试?因为我们有很多医学专家,我们跟协和医学院、跟安徽省立医院签订的战略合作协议,现在安徽省立医院已经是中国科技大学第一附属医院了。
从技术发展中来看,从最早的人工智能最容易做到的是信息完全充分、规则完全透明的场合,比如围棋。稍微难一点的是信息半充分,比如打麻将,当然还有很多领域包括规则在变化中,比如考试作文,同样一篇中文,对小学生、对高中生、对大学生同样作文打分应该分值是不一样的,它有不同的体系;信息完全自由,比如说创意,比如说有很多凭直觉和灵感的决策的场所,所以人工智能技术进化路径就要面对这样的信息情况不断变化、规律不断模糊,以及机器从监督训练到无监督训练自主进化的这样一个发展路径。
在这个过程中,人和机器的深度耦合才是真正的推动人工智能应用落地的关键,这个不仅是科大讯飞三年前就确定的核心技术研究路线,如何研究人工智能时代人和机器的耦合也是我们跟很多合作伙伴共同探讨的方向,同时我也认为是人工智能时代社会伦理和人文发展的需要,我们不能让机器完全代替人,我们要让每个人都站在人工智能的平台之上从而享受人工智能,这也是人机耦合的我们内在的精神动力。去年科大讯飞18周年成人礼上,我们都对未来有一段寄语,我们写给2029年科大讯飞三十而立的时候,我们认为世界将会怎样?讯飞将会怎样?我们个人将会怎样?当然这个东西我们都封存起来,到2029年才会打开,其中有一条我就写到了人机耦合,我希望到2029年我作为董事长的工作有80%是机器帮我做的,20%是我来做决策的、做判断的,是一个典型的在企业治理和董事长决策过程中的人机耦合系统,是科大讯飞未来要建信息化系统的一个非常重要的标志。我们昨天还跟全世界最顶尖的人力资源公司在探讨如何用人机耦合来推动我们的人力资源管理和内部的管理决策。
那么关于人机耦合,我再给大家说一下关于翻译的例子,因为最近大家关注很多,其实在去年10月21号,科大讯飞就跟上海外国语大学高翻学院建立了联合实验室,探讨人机耦合的机器翻译应用模式,写在协议中的最关键的词就是人机耦合。经过一年左右的发展,我们做了45个实验, 45个实验报告,92个产品改进的建议,我们可以看到有一组的数据,我们挑出其中两个给大家看,一个是口译信息的完整度,上海外国语大学高翻学院的学生都是培养出来都是中国最顶尖的同传,他们这些学生的最终验证结果是口译信息的完整度从80%提升了97%。我们可以看到我在说话的时候,我们的机器实时的进行了翻译,我的速度很快,如果是一个同传人工来做,他可能会抓住我的主要内容但一定会漏掉很多,因为他来不及,又要记又要说,关键的核心是数据和信息机器全自动把他转写出来,给我们的同传人员去看的时候就可以防止丢失信息,这是一个专门的讯飞同传助手的设备。
在本届世界人工智能大会在上海召开的时候,在同传的盒子里面我们就放了设备,跟上海外国语大学一起做的,可以看到对口译信息完整度从88提升到97%,而工作压力降低了80%,这都是有实验数据在整个过程中做支撑的。所以大家可以看到最近上海外国语大学高翻学院的院长,张爱玲院长也是一个我非常尊重的翻译大家,专门撰文写道,他认为人机耦合是为了不可阻挡的趋势。那么我们再看一下。在中国翻译界可以说是最有名的顶尖专家之一、前联合国日内瓦口译司的司长,在今年的8月份在上海外国语大学举行的同传挑战赛中,我们的机器也参加了,他非常惊讶于我们技术的进展,然后这是他的原话,说真正好的翻译是会使用机器的翻译,而不是被机器替代的翻译,如果我们不能阻止趋势,我们应该引导趋势顺势而为,我想这就是我们今天整个社会各界应有的心态:谁率先适应这个时代的潮流,谁就可以站在时代的风口浪尖之上,成为未来的人生赢家。
人机耦合也正在成为全球的共识,比如说科大讯飞跟MIT计算机和人工智能实验室,签订战略合作协议,其中非常重要的内容就是研究脑科学和数学建模方法的结合以及未来人机耦合的模式。斯坦福大学李飞飞从谷歌回到斯坦福,最近专门成立了以人为本的人工智能研究院,也是在推动人和机器的融合。我想人机耦合正在成为全球的共识,因此这是科大讯飞多年以来的结论,我们两年前就提了理念,不仅仅是技术发展趋势,更是社会伦理的发展要求。比人类更强大的不是AI,而是掌握了AI的人类,我们会按照这个路径持续不移的、坚定不移地推动我们的研究产品以及我们科大讯飞的社会责任。
刚才刘庆峰董事长介绍了科大讯飞最近在人工智能核心技术上取得一些突破性进展。除此以外,我们还取得了非常多的新的成绩,我们刚刚在CityScapes测试全部两项任务中囊括了冠军。CityScapes主要测试人在开车过程中所接受到的所有信息,能不能自动对场景、看到的物体进行分类和判断。
关于人工智能的划分,我们说有计算智能,感知智能、运动智能和认知智能。认知智能是说人类具有理解语言、知识表达、复杂逻辑推理和最终决策的能力,国际上在这个方面也有非常高水平的评测。我们在今年国际语义的识别大赛也取得了很好的成绩。在24个参赛队伍中,我们击败了其他参赛队伍,最终获得了84.13%的准确率。在图像识别方面,今年我们又将医疗领域扩展到糖网病的微动脉瘤的分割任务,我们获得了血管瘤比赛的第一名,以上都说明科大讯飞的核心技术在国际处于领先水平。
我们提供给开发者的技术不止这些。我们的星云计划一方面连接开发者,另一方面连接国内外最好的核心技术研究团队,将他们的成果整合在我们的开发者平台上。根据现在讯飞拥有的40多个分布在全球各个国家的联合实验室,以及和我们有战略合作的研究机构,越来越多世界领先的核心技术通过我们的星云计划不断接入。
我们现在核心技术总量已经达到了153种,然而,光有好的核心技术并不代表着我们在产品中使用得顺畅,我们从三个方面进行了深入的打造,以提升平台整体的能力。
全球化的节点分布。我们在北京、上海、合肥、广州、香港、新加坡、洛杉矶、爱尔兰都设定了云计算的分节点;
大规模超算中心。同时也在合肥(科大讯飞总部)建立了1.5万平米的大数据中心,现在的运算速度已经超过两亿亿次每秒,而且单台最大的服务器的数量超过了20个TOPS,内存带宽约为16TB/s;
云原生计算架构。基于云原生计算技术栈快速构建AI云平台,高效地支撑153项AI能力的快速构建与稳定运行。
科大讯飞从2010年第一次发布讯飞语音云平台开始一直致力于通过更多形式的组合,例如我们考虑过嵌入式软件、芯片、云计算、软硬一体,考虑过整体的解决方案和成品级的硬件平台(AIUI)。去年和今年国际上大的提供商还宣称他们刚刚能够提供全双工的智能语音交互的平台,而AIUI在2015年已经向整个行业开放了。我们还提出过iFLY inside,希望iFLY inside的所有产品将来能够非常好地在各个情况下使用。我们在前年和去年也发布了魔飞麦克风,软硬件一体高度集成化的产品,让很多场景下智能语音能力的基层变得非常简单、容易。
在这些不同解决方案的引导下,我们也制定了面向开发者的提升计划。首先就是三大计划:教引计划、生态计划和公益计划。
教引计划是为了保证所有开发者可以更好地学习到我们所提供的各种各样的环境,生态计划是为了保证所有的开发者能够在整个生态里和讯飞一起成长;公益计划是希望所有的开发者能够和我们一起用爱心锻造AI,服务社会。
AI教引计划。为了让更多的人拥有可以实现的梦想,我们在过去的一年中推出了一系列关于教引计划的内容。例如AI大学,现在AI大学的学生已经超过24万人,有超过100节以上的线上课程,签约教授达到55位。在AI大学里面我们提供了丰富的内容,例如线上课程、未来课栈、精品课堂、技术专业课和AI公开课和AI创业课,这些丰富的素材为我们的开发者们提供全方位引导。
我们也在另外两个方面建立更加全面的体系,一方面我们和高校联合培养在校生,我们已经通过和北大、清华、中科大、浙大、安大等20学校的联系,进行了27个AI创学社。另一方面,我们还与一系列做创新者孵化的品牌联合培养开发者,包括线上的公开课、持续模拟、在线答题、结业证书等方面的合作,这些品牌包括大街、发条、启迪之星和爱课程。
AI生态计划。在这种教育计划的培训下,越来越多的人能够接触到科大讯飞AI生态计划,我们要让更多的AI梦想更好、更快地被开发出来,这里面包括我们现在做的AI众创空间。我们提供场地、支持优惠的政策、公共的平台和创投的资金。现在线下创业平台入驻企业已经超过了600家,智能科技的产业规模超过了800亿,带动就业人数超过了3万人。所以说科大讯飞并不完全是一个在网上向大家提供服务和能力的公司,我们在线上线下有同样的内容。
另外还有AI生态沙龙。很多AI开发者都希望自己开发的产品能够被更多的人使用,这包括很多大型企业,比如说国企。通过AI生态沙龙,我们将好的投资机构和好的开发者联系在一起,我们连接的投资机构数量超过了360家,现场参与观众超过了6000人,连接创业的项目达到了400多个。在北京、上海、杭州、天津、长春等十个城市,AI生态沙龙都蓬勃开展。
我们在这些AI开发者当中选出来杰出代表,在今天下午会有一个颁奖典礼,和我们AI大的颁奖典礼一起举行。我们一共选出54个钻石团队,有13个在过去的一年中获得了融资,总估值现在已经超过了60亿元,AI创业的土壤中会长出越来越多的明星企业。
我们新的独角兽除了AI团队非常优良以外,科大讯飞去年刚开设的AI服务市场,将我们的开发者和to B的需求方对接在一起。在这个方面我们连接所有对AI有需求的企业客户,提供品牌和商业的支持、提供超过180个方案。我们的开发者中有很多人直接研发to C产品,也有很多的开发者研究的是to B产品,我们希望平台能够为to C的产品提供品牌销售渠道和供应链方面的支持,同时也希望我们的生态平台能够为to B开发者提供大企业客户、投资方等各个方面。只有这样,我们to C和 to B这两种商业模式和整个生态才能足够完善,也可以帮助到更多的创业者和开发者。
AI公益计划。AI公益计划主要是让更多的人从AI受益,而且让世界有更多的爱。过去的一年我们的成果首先是我们的方言保护计划,已经有500万人参加了方言保护计划的活动,有10万人上传了方言语音,我们得到的方言语音条数超过了20万条。语音识别方面我们新增了苏州话识别,在目前我们提供的23个方言语音的识别中,有8个以上的识别正确率超过了90%,剩下的都超过了80%。大家可以看到,在讯飞输入法里方言识别的使用量越来越多,大家可以非常方便地用自己的母语、家乡话来实现问候和信息输入。
三声有幸计划是我最觉得自豪和骄傲的一个。从经济利益的角度来讲,我们所做的产品应该覆盖最大的人群一定是年轻人、健康的人,我们的先进技术其实可以帮助社会上很多最需要关注的人,三声有幸计划就是从这个出发点。
我们一个合作伙伴叫音书科技,服务了近40万的听障者、10所聋哑学校,成为聋人和外界沟通的一座桥梁,听到这个消息我特别的兴奋,因为我们的技术真正可以使我们的社会变得更美好。除此之外我们还有心智互动合作,累计服务6万的视力障碍者,他们主要是通过语音合成,让视力障碍者使用互联网。
今年我们还做了AI教育公益。在过去的一年当中,我们利用在教育领域的先进技术,走进了西藏,四川,河南,新疆等地,直接捐赠了超过700万元的设备,给很多的农村学校的孩子们带去了欢乐。大家都知道中国的教育资源是不均匀的,在很多贫穷和落后的地区需要我们做大量的工作。评价一个公司成功与否,可以从销售收入、产值,但是我觉得企业能够带来什么样的社会责任感,将来也会成为评价企业一个非常重要的标准。我也希望在座所有的开发者能够和我们一起,尽到对社会的责任心。
要知道我们将来做什么,我觉得非常重要的一点:要能够预测将来会发生什么样的变化。
第一,交互方式从图形交互、触摸交互向基于视觉呈现和语音交互发展。在计算机体系发展过程中,在每一次计算机代与代的更替中,有一个东西一直在改变我们和机器交互的方式,从最早的七八十年代的图形交互,到2006年第一代iPhone出现开启我们触摸交互的时代,到现在语音交互已经成为当前主要的一个交互方式。而语音交互方式的变化必将带来芯片、云计算、外观设计和软件设计整个一系列的变化,这是趋势。
第二,单纯软硬件模式向软硬件一体的云+端模式变化。原来你只要做个软件或者做个硬件就能满足用户的需求,但是现在随着移动互联网的发展,软硬件一体化、云端一体化已经成为一个必然的趋势,任何一个开发者不能绕开。
第三,面向最终用户的产品从大C向小C发展。大家都知道有一些产品一开始有非常多厂家做,比如说PC电脑,最早全球大概有几万的厂商在生产电脑,到现在为止世界电脑大厂商不过就几家;手机也是一样,现在全球只剩下七大手机厂商。人类历史上这样的产品叫做大C,就是大型的消费品,汽车、家电、电脑、手机都是属于,大家要的是标准化的外形。
但是还有一些产品不是这样发展的。有很多的产品,比如玩具、衣服、鞋子,一开始有几千家几万家厂商生产,到现在还是有几千家、几万家厂商生产。为什么会有这样的差异?因为它叫做小C产品,在这些产品上,人类要的不是工具化的和标准化,而是多样化和差异化。
因为人工智能给我们带来的不仅是交互的便捷,而且是情感上的依托。这也是为什么我们给每一个人工智能产品都要起一个名字。这个名字代表了很多的东西,这个名字比人类历史上所有的小C产品都更加的情感化、差异化和多样化。这也意味着什么?意味着给我们给很多to C的创业者打开了一道门。创业者们都可以坚持下去,因为我们不必像生手机、PC的生产一样,最后只剩下几家巨头来竞争。这给我们提供了一个非常广阔的空间,而在这样的空间上,我们也需要新的平台。
第四,参与生态的物种向多样化和去寡头华发展。在互联网时代,互联网企业往往会形成巨头垄断,比如说在中国就是BAT。在移动互联网时代,你会发现互联网企业已经不能够独家垄断了,为什么?因为很多超级APP进来了。在这个过程中,手机厂商越来越重要,它们的位置越来越关键,移动运营商也在这中间扮演了越来越多的角色。而以后,在物联网时代,在人工智能时代,万物互联,各种类型的企业都能参与进来。比如,家电厂商、家居厂商,甚至服装厂商,都要加入到里面来(因为有越来越多的智能穿戴式的设备)。像中国广电这样的电视运营商、房地产商,也都会越来越多加到整个生态链条里面,这些链条中的某一个环节会越来越寡头化。
最后,商业生态从中心化向去中心化发展。一个趋势是整个商业生态系统的变化。在互联网时代,我们的商业生态系统遵循什么样的角色?我们遵循一家独大、赢者通吃、边际扩张成本极低。如果一直是这样的话,我们所有的创业者都不要做事情了,我们只要给几大巨头来服务就可以了。但是正是因为我讲了上面的各种各样的趋势,我们将看到一个去中心化的商业系统,或者按照我们讯飞的话来说是混合正交的商业生态正在变得越来越重要、越来越成熟。什么叫混合正交的商业生态?我们都知道中心化的商业生态系统中间的控制节点,他们总希望数据是我的、用户是我的,你的也是我的。但是在一个去中心化的混合正交的商业生态系统中,开发者、传统企业、互联网企业、人工智能企业,大家像编一个篮子一样,混合正交地把大篮子编出来,而篮子里面存放的就是整个生态系统,由所有编成篮子的参与方共同来分享生态系统。
大家想象一下,在万物互联的人工智能时代,所有原来的品牌,比如说海尔、美的、中国银行、中国广电,他们应该做什么?我认为他们应该做自己的人工智能系统。人工智能系统可以和最终用户之间发生连接、产生效益。但是中间有一个东西,类似于过去互联网的搜索,比如移动互联网的APP是豆瓣、微博、微信。
那么在IoT时代,中间的东西是什么?
中间的东西就是我们原来想给大家提供的这些东西,包括AIUI、云端一体化、魔飞,以及iFLY inside,但是现在我们想有一个新名词包含这些东西,这个名词就是IFLYOS。我们会提供整个2.0的方案,包括AI教引计划2.0、AI生态计划2.0、AI公益计划2.0。
AI教引计划2.0。在教引计划里面,我们会建立新的课程建设计划导师,我们希望大家能够用到更多的功能,我们希望全平台可用、零学习门槛、快速集成和业务自定义。那么告诉大家一个好消息,我刚才说过的,在新的一年里我们将把科大讯飞开发者平台中间的技能提高到200项以上,让大家有更加丰富的选择空间。那么在生态计划中,新的生态计划2.0怎么帮助大家更好的实现?我们将会有专属的服务经理、全渠道的响应、全业务的支持和我们7×24小时的服务保障。
AI生态计划2.0。我们还支持对于我们刚才讲的to B、to C开发者。有些开发者,他是发展to B的业务,那么我们会推进业务支持的升级,品牌推广的升级和项目服务的升级,让更多服务to B的开发者能够有更好的渠道和力量。除此之外,我们还有最新的1024的投资基金。投资基金将分为三个层面,第一个层面是一级基金,他们主要是种子基金,利用我们的品牌优势为大家赋能;第二个层面是天使基金,让我们的渠道能量能够为天使基金的各位开发者赋能;第三个层面就是星光加速器。开发者都会通过不同的加速器和基金的联合支持来获取他们更大的能量。
AI公益计划2.0。今年我们的公益会继续在方言保护计划上进行深入。我们的语音系统已经可以识别很多方言,那么机器人能不能掌握方言并且把它讲出来?我们在新一年的计划里,要实现十种方言的识别。我们会把暴风雪竞赛的最先进的技术全部放进来,我们也会招募方言保护计划的各个方面的成员,而且我们将扩大语音识别所有能够支持的方言的种类,总共多达24种方言。
去年我们做的公益是教育,新的一年我们准备来做医疗,大家都知道中国有很多地区医疗的设备、设施、人才和资源是严重不足的,我们将投入超过1000万元的医疗资源基金,通过提供医疗服务便民帮扶,让欠发达地区在医疗上也能够获得提升。大家都知道,在中国国策里,特别是习总书记也要求把教育和医疗这两个方面作为提高民生最重要的方面,所以我们也要引起切实的行动。我也希望我们的开发者也能够跟我们一起行动起来。我们最终的目标是什么?科大讯飞基因里是技术创新型企业,我认为技术创新企业的企业就应该做一个去中心化赋能的平台,以智能语音交互为技术,以去中心化商业模式为框架,我们希望和所有的开发者一起来影响人类的生活、影响我们的社会。
我们现在已经累计连接了超过21亿的终端设备,虽然这些终端设备中一些已经退役了,我们今年较去年的智能终端设备的增长达到了40%,生态合作伙伴达到86万,较去年增长了68%。
对于开发者而言,它对于开发者来讲是一个一站式的解决方案,是一个技能平台,是一个知晓每一位消费者的人工智能系统;对于消费者而言,它是一致化的场景和一致化的体验,以及能够把众多的服务商的人工智能系统带到他们的面前,只有这样IOS才能够成为真正的连接者。
iFLYOS本身就是一个人工智能。一方面,iFLYOS可以让开发者更好地开发出来他所需要的智能硬件;另外一方面,iFLYOS能更好地理解每一个消费者;同时,iFLYOS还知道它背后所连接的这些资源,诸如可以连接餐饮、音乐、旅游行业厂商或服务商的人工智能系统,并把它们推荐给最终的消费者。
从开发者角度而言,整个iFLYOS再云端加入了前后端拦截器,在设备端提供各类硬件模组。从消费者角度来看,iFLYOS已经接入超过40亿家产品,有上百个内置技能供用户选用。
在他的背后的后台已经有超过100多个技能,例如打开/关闭电视或空调,操作洗衣机等。另外一方面就是我们的服务内容和素材,例如咪咕音乐现在已经有超过2000万首的正版中文音乐已经在我们的iFLYOS开发平台上进行了链接,用户可以直接通过我们iFLYOS得到这些数据内容。
针对产品互联问题,科大讯飞也提供了iFLYIoT,iFLYIoT面向企业可以对接第三方的语音,通过连接数据和AI决策构造围绕用户的闭环交互体验,它可以构建我们智能互联网的基础设施,让每个设备之间都可以相互轻松的联通。
科大讯飞面向企业提供全链路IoT开放平台,提供高效易用的开发体验,完成Demo开发从原来的3天,到现在3个小时就可以实现。
在我们和京东合作的叮咚音箱刚推出的时候,有很多做智能家居的伙伴非常急迫地想用上我们的设备。因为叮咚音箱很大,但是用户又想把它装在墙上,所以他们想了一个办法,在墙上挖一个洞,然后把叮咚音箱塞进去,只把叮咚音箱的麦克风留在外面。后来很快推出了叮咚mini,因为叮咚Mini做扁了,就可以直接装在墙上了。但是这样就能够满足用户的需求吗?不是的。因为叮咚音箱的设计是水平放置才能接受命令,当你把它垂直放置的时候是接收不到命令的。因此,我们研发了搭载双层麦克风阵列、具有八个麦克风的MORFEI麦克风。有了MORFEI麦克风,大家可以就可以把它放置在屋顶、墙面、地面等任何地方了。
科大讯飞的双层魔飞麦克风阵列可以放置在任何地方,今天搭载iFLYOS的MORFEI,在智能家居方面将覆盖和连接各种各样的设备商、方案商,构建完整的解决方案。在客厅、厨房、卫生间的电视、橱柜屏幕、魔镜将都是可行的终端。
在过去的两到三年中,家庭服务机器人成为非常重要的角色。开发魔飞是希望可以嵌入到机器人的任何部位,而不会再出现装在头部,影响外形设计。现在包括讯飞自己的机器人、优必选机器人等国内超过85%的机器人在使用iFLYOS,主要应用在银行、医院、政府、购物等各个方面。
在机器人领域我们向大家介绍两个合作案例,一个就是优必选机器人,优必选的机器人现在在居然之家里进行了大量的配置,也应用了科大讯飞iFLYOS的整个语音交互的体系,而且现在也有非常良好的表现。我们自己的机器人也被用在红星美凯龙的购物广场里面。
在中国车辆现在越来越多,我们的智能车载平台现在已经和中国基本上所有的车厂进行了合作,为400多款车系提供语音交互的支持。大家都知道宝马一直非常相信自己的技术,但是最近他们不得不买了一台奇瑞艾瑞泽5。它为什么要买这台车?因为它发现这台车的车机的中文语音交互的效果是世界上最好的。
现在在车载的应用环境中,我们对外提供多种解决方案:一种是面向B端提供技术,就是和国内在售的基本上所有车场,包括大众、丰田合作,他们已经开始在使用我们的技术;另一种则是面向C端,我们有自己的飞鱼。另外,我们的平台已经整合了在大数据、云计算、机器视觉、智能语音方面的各种能力,可以快速的帮助车辆实现赋能。而且这一智能化的车载系统,马上就要向所有开发者开放。
iFLY客服平台
最初语音识别研究的目标就是希望能够代替客服人员。在过去,我们已经有非常多的关于智能客服的积累,我们覆盖的场景最多,已经能够完成81%的工作;我们覆盖的行业也非常多,因为每个行业里面的客服都有很多专业化的知识。在这个基础上,我们的AI电话机器人已经能够提供非常多的应用,我们现在已经对接了华为等专业化的呼叫平台中心。现在我们语音引擎的语音识别正确率已经超过了98%,合成的自然度已经超过了4.5分,不仅如此我们还有高效的可专业化的可视化操作,你可以通过图形的拖拽,就能够构建出来你们整个对话系统的逻辑。
我们和海底捞合作的电话客服平台,也是海底捞智慧餐饮的一个非常重要的部分。通过这个智能客服系统,上线一个月就接听了757万的来电,服务了超过193万的客户,节省了10万小时的人工服务时间,而且客户对服务效果非常满意。我们之所以能达到这样的效果,是因为此前不断为中国移动、中国电信、中国联通以及中国银行、交通银行、建设银行等大客户的客服中心提供服务和支持所积累的结果。
教育和医疗是国家、政府最关心的内容。在医疗方面,面向居民需要健康管理、血压计实时监控;面向社区,需要分级诊疗,和基层治疗;面向医院,我们需要语音电子病历,需要提高工作效率;面向区域,我们需要跨区域的辅助诊疗。目前讯飞的人工智能辅助诊疗平台已经具备了语音、图像、眼底、西科、西医全科辅助慢病管理等各方面的能力,而这些也都是讯飞瞄准医疗行业需求后将对外提供的能力。
我们希望我们能够给开发者,包括药企医疗机构进入平台展现能力的机会,现在我们现在已经连接了一百多家的三甲医院,3000家以上的基层医疗机构,为他们提供人工智能服务,我也希望大家能够借助于我们这些已有的产品,已有的经验。
很多人很奇怪为什么科大讯飞可以做广告?我们所说的智能营销业务是因为我们手机上有很多的APP他们使用了我们的技能,但是同时我们也注意到这些APP有商业模式变现的需求,所以我们就开发了iFLY营销平台,把这些分散的APP的流量汇聚起来,然后我们再跟国际、国内的大客户,比如京东来沟通,把广告需求投放在这些APP和智能硬件上。
我们可以看到我们现在已经积累了大量的品牌传播案例,利用大数据、人脸画像和AI的算法实现精准投放。我们也能够连接企业和开发者,把开发者拥有的流量和拥有的客户转变成为我们另外一端的大企业所需要营销的一个阵地。并且通过科大讯飞的大数据实现广告主更高的投资回报,我们也希望在这些方面的CPMCPC和CPA能够达到业界最高的一个水平。
那么我这地方也举一个例子,直播吧采用我们tts的整个技术,包括机器翻译加语音,现在我们已经实现了月活3500万,是2017年的体育资讯类的APP的第一名。在商业变现方面,2018年我们和直播吧进行合作,已经实现了收益2000万,同比增长了170%。在广告创新和用户精准投放方面取得了很好的成绩。
随后,科大讯飞消费者事业群副总裁、听见科技总经理王玮上台发布了重量只有93克的M1转写机器人,预售价格1299元。
我们大家都知道,室内的拾音实际上有两大难题:噪音干扰和混响。
因为我们在每一个不同的房间里,它的声场、回声都不太一样。所以我们在听见M1上面有自己独特的设计:
第一,使用了24比特的高精度拾音芯片;
第二,我们使用了7+1的环形麦克风。我们还运用了科大讯飞最先进的自适应波束形成和去混响的技术,从而实现在环境里能做到360度无死角的拾音和声源的精确度可以达到正负5度,什么概念?如果说我走在这个位置上和我走在比如说四点钟方向和八点钟方向的时候,它可以用波束形成去驱动不同的麦克风,然后把边上的噪音把它抑制掉,它拾音距离可达十米,这样的话就真正地解决了室内拾音的问题。
近距离、高保真的录音数据识别正确率达到98.24%,8米距离的识别率为97.93%。除此之外,它能够装进近百小时的语音数据,特别设计了磁盘加密的功能,因为每一个听见M1都设置了一个特别的秘钥,需要和他绑定的听见APP进行配对的时候才能够读取数据,当你的小机器人丢掉的时候他的数据会被丢失。另外它还能够自带WiFi的热点,它和听见APP一键连接能够做到无线传输。
相关文章:
带来新奇应用的HI! MORFEI 智能家居开发大赛有科大讯飞的什么“秘密”?
雷峰网原创文章,未经授权禁止转载。详情见转载须知。