0
11月初,AI语音行业“元老级”选手云知声递交科创板上市招股说明书,计划冲击“AI语音第一股”。
根据招股说明书,云知声拟募集资金91162.75万元,用于人工智能技术中台建设、面向物联网边缘计算的人工智能芯片研发平台建设和基于人工智能技术的智慧医院解决方案建设等三个项目,目前已进入问询阶段。
在竞争激烈的AI语音赛道里,云知声为何能当冲击科创板“AI语音第一股”?
白热化竞争下的造芯实力
作为一家AI语音公司,能造芯是云知声科技硬实力的关键。
最初AI语音公司们决定自研芯片,有观点认为这只不过是AI芯片市场被过度炒作之后的一场表演。事实上,得益于快速增长的语音市场需求和AI语音算法的成熟,造芯是AI语音自然发展的趋势,如今也已成为各大AI语音公司提升竞争力的关键。
快速增长的市场需求单从智能音箱的出货量上就能看出,据国际咨询机构IDC发布的《2019年中国智能音箱市场出货量》报告显示,中国2019年智能音箱市场出货量达到4589万台,同比增长109.7%。根据中商产业研究院预测,尽管2020年受疫情的影响,我国智能音箱市场出货量也预计达到5041万台。
随着智能音箱井喷期而来的,便是通用芯片向专用AI语音芯片的过渡。中小型AI语音公司自研芯片是机会也是挑战。用云知声创始人兼CEO的话讲,“不做芯片就是死路一条”。
另外,包括智能音箱在内的智能设备,更多是在云端实现语音交互,存在语音延时和数据安全问题,端侧智能则会让用户在使用智能设备时有更好的体验。
拥有8年AI语音行业和技术经验的云知声很早就意识到自研芯片的必要性和可行性,在已有的硬核技术根基之上,于2015年就启动造芯计划,并于2018年5月就推出了首款AI语音芯片“雨燕”,成为行业内首家宣布造芯并成功量产的AI语音公司。
据悉,“雨燕”主要用于生活场景下的白色家电、智能音箱及中控,工作状态下功耗小于800mW,延迟低于300ms。
云知声芯片性能对比
紧接着,2019年,云知声进一步扩大产品可适配物联网设备范围,陆续推出车规级芯片“雪豹”和面向家居领域的第二款升级版芯片“蜂鸟”系列,启动具备“图像+语音”多模态交互功能的芯片“海豚”的研发。
截止目前,“雨燕”、“蜂鸟”系列均已量产,既直接对外销售,也自用于部分公司模组和整机类产品,“雪豹”已进入产品稳定性测试及车规阶段。
善用新技术的“少数派”
造芯并不是云知声的目的,而是手段。除了芯片,云知声还有很多硬核技术,而且在很多时候,云知声都是那个率先将新技术引入行业的“少数派”。
云知声最先在2012年率先将深度神经网络(DNN)应用于商业语音识别系统。深度神经网络的前身是多层感知机,层数的多少直接决定其对现实的刻画能力,引入DDN算法能够有效提高识别率。一般而言,在语音识别中,4层网络就可以被视为“深度”,而在图像识别中多为20层以上。
引入DNN之前,云知声的语音识别引擎基于传统统计模型,准确率达到85%,甚至超过科大讯飞,不过仍然没有达到可以商用的水平。云知声率先引入DNN,推动了语音识别引擎的可商用性,DNN也成为众多企业的选择。
此后,云知声持续进行前沿算法的商业实践,在卷积神经网络(CNN)、回归神经网络(RNN)、端到端序列建模、生成对抗网络(GAN)、注意力转换模型(Transformer)、双向编码表征转换模型(BERT)、知识蒸馏(KD)、自监督学习(SSL)等主流技术方法的引入上,都是业界最早的实践者之一。
另一个“少数派”的动作是在2014年率先提出“云-端-芯”的产品战略,这一战略的意义在于是对众多语音核心技术的模块化梳理和整合,面对市场需求时拥有快速产品化的能力。
AI语音的核心是实现人与机器甚至是机器与机器的无障碍交流,因此AI语音的实现可以按流程拆分为对语音信号的拾取和重建,机器对语音所含信息的综合理解,以及类人[Y3] 自然语言表达,即声音感知、认知和生成。
顺利完成这些步骤,需要靠包括回声消除、降噪增强、语音唤醒、语音识别、声纹识别等核心语音技术的支持,这些技术的种类复杂又割裂独立,想要提高运行效率就需要找到最合适的方法将其结合起来。
“云-端-芯”战略就是行之有效解决方法,边缘侧芯片以更低的成本和功耗提供硬件算力需求,软件为不同类别的终端设备做适配,形成相对标准化的“交钥匙”方案。
当边缘侧芯片无法处理更复杂的语音和语音问题时,就需要借助云端高性能计算服务器来完成。云知声自主搭建的智慧云平台,以公有云的形式或者根据客户特定需求进行私有化部署,搭载各项核心技术引擎解析用户需求,将用户需求与云端服务对接。
矩阵式产品建立壁垒
率先引入DNN等先进算法和“云-端-芯”战略之后,云知声在家居、医疗等多个细分场景均有较为成熟的落地方案,这是云知声冲击科创板“AI语音第一股”的底气。
最初,云知声面向住宅和酒店场景,以空调语音模组为突破口,同格力等家电龙头企业合作,于2016年率先在白电领域落地智能语音模组,确立市场地位。
同年,云知声与北京协和医院合作,率先在国内落地医疗转写解决方案并被快速推广,目前已在100多家医院上线使用,超过500家医院测试使用。
在建立医疗知识图谱方面,借助于合作医院以及自由专业医生团队以及原有的自然语言处理技术,云知声构建了大规模全科室的医疗知识图谱及相关应用平台,并且被多家三甲医院采购。基于医疗知识图谱和预训练语言模型,云知声历经1年时间,在400M的语料上完成医疗实体识别模型的训练,相应的技术在2020年CCKS评测任务“面向中文电子病历的医疗命名实体识别”中获得冠军。
正如希望通过研发芯片提升商业化能力,云知声也凭借产品升级提升竞争力。只提供类似于智能语音会议系统、智能语音客服等通用的单一语音工具,在竞争激烈的语音赛道上并无区分度,于是云知声将单一产品升级为综合解决方案,面向酒店、社区等场景规模交付。
招股说明书显示,云知声依托“云-端-芯”产品中台,形成了智能语音交互产品、智慧物联网解决方案、人工智能技术服务三条业务线,数十个产品类型的矩阵式产品结构。其中智慧物联网解决方案就是云知声在场景落地方面的升级,并且从此次招股说明书中拟募集资金的用途方面也可以看出,这也将是云知声未来的重点建设内容,以此建立行业壁垒。
那么,云知声的智慧物联网解决方案究竟如何?
基于原有的单一产品,以智能语音和控制为核心,云知声提供面向酒店、社区和医院的智慧解决方案且均有落地案例。
智慧酒店整体解决方案支持在入住、电梯、客房、客控、客需、公区、退房等环节的智能化升级;智慧社区实现对社区车辆、人员、环境的全面监测和精准管理,打造安全、智能、高效的社区环境,目前已在昆明、天津等新房社区中落地使用。值得一提的是,云知声同世茂进行合作,依据其智慧酒店和智慧社区解决方案与世茂共同探索“智慧+地产”新模式。另外,云知声携手建发,共建新基建新标杆。
智慧医院提供面向诊前、诊中、诊后全流程环节的升级,包括导医机器人、远程会诊系统、个人健康助理机器人等服务,济南市千佛山医院、镇江市第四人民医院均有依托云知声的方案做选择性升级。
在最重要的诊断和手术部分,云知声基于最先进的深度学习技术开发了手术和诊断自动编码系统,其中手术编码系统用到的技术获得2019年CHIP评测冠军,诊断编码相关技术获得2020年CHIP评测亚军。同时和中科院自动化所合作发表多篇关于诊断编码的顶级会议论文。在自动编码系统基础上云知声开发了CHS-DRGS入组系统,该系统除了能给出当前病历的模拟入组,还能对首页的填写错误进行修正,给出修正后的推荐入组。
值得一提的是,近期国家医保局紧密出台DRGS 、DIP等系列政策,雷锋网了解到云知声正响应这一政策需求和顺应行业趋势,面向医保的病案首页质控和直接面向控费的报销稽核两方面,延续和拓展既有的病历质控产品线产品,目前已实现落地。这将大大拓宽云知声医疗业务产品矩阵,进而打开突破现有的智能语音及智慧医院的市场空间的天花板。
目前,云知声的智慧化方案已经落地北京、天津、广州、南京、长沙、珠海、福州、霞浦、武夷山等多个城市。此外,雷锋网了解到,云知声近期还与“中国房地产开发企业50强”之一建发公司展开合作,打造“建发·云养地产”项目,实现住宅智能化。
云知声智慧社区方案
显然,云知声的发展早已不再局限于单纯的语音交互产品,而是通过向智慧物联网延伸拓宽市场,建立其专属的行业壁垒。
小结
AI语音“行业元老”云知声,凭借其灵敏的产品嗅觉和行业前瞻性,从算法到芯片,到“云-端-芯”,再到在各个细分场景的落地,在竞争激烈的AI语音行业走过8年,拥有实打实的竞争力。若成功上市,云知声将进一步升级自研芯片和物联网解决方案的能力。
这一次,全栈硬核的AI技术产品的云知声能否成功冲击科创板“AI语音第一股”?我们拭目以待。
文中图片源自云知声
雷锋网雷锋网雷锋网
相关文章:
云知声-中科院自动化所联合实验室获CCKS2020医疗命名实体识别评测冠军
雷峰网原创文章,未经授权禁止转载。详情见转载须知。