1
根据荷马史诗《奥德赛》中讲述,在西西里岛附近海域的一座遍地是白骨的岛屿上住着一群人首鸟身的女怪物,被人称之为「海妖」,这些海妖经常游荡在礁石和孤岛之间,用自己天籁般的歌喉使得过往的水手倾听失神,航船触礁沉没。后世经常以「海妖的歌声」来形容一些令人心醉、神往的事情。
从神话的逻辑来说,「海妖的歌声」是种魔法,但是如果强行从科学的角度来猜测的话,极有可能是这种声音中包含了一种能够摄人心魄的情绪,如果声音中有情绪能够影响人,那么反向来说,这种情绪也一定能被机器「读懂」,几年前,移动互联网概念刚刚流行、「App创业」逐渐兴起的时候,Emokit翼开科技的创始人魏清晨就做了一款拥有「读心术」功能的音乐App——海妖音乐,这款App能够读取用户的语音和心率两项指标,从而分析用户的情绪,并为用户推荐符合其情绪的音乐。
随着App创业大潮达到瓶颈期,魏清晨也顺利转型,EmoKit接过了海妖音乐的接力棒,让情绪识别不在局限于音乐。
中关村创业大街上的咖啡馆迎来送往,见证了一批批创业公司的成功和落寞,雷锋网「新智造」就在大街上的Binggo咖啡见到了魏清晨,EmoKit的团队也就在这家咖啡馆办公。
2014年,雷锋网对海妖音乐这款App做过一次报道,简单来说,用户在移动设备上使用这款App时,App上会出现一段文字供用户朗读,设备会同时采集语音,并且使用「电容积扫描技术」直接通过摄像头来采集心率。采集完成后,海妖就会分析语音(语调、语速、音量、停顿)和心率特征来识别用户的情绪,并为用户推荐相关的音乐。据Emokit创始人魏清晨说,这些音乐能让用户「产生更多感官享受和情绪共鸣」。
这款App就是EmoKit情感计算的初期模型。也是这款App几乎奠定了EmoKit接下来的前进方向。
做出海妖音乐的时候,魏清晨就面临着两个抉择:产品&技术。
从移动互联网方向发展到现在,不难观察到,App创业积累到一定用户数量之后,难免会碰到瓶颈,几乎都会碰到上述的问题,EmoKit也是一样。当时魏清晨拿出了两个选项:做音乐硬件或开放SDK。
经过权衡,魏清晨选择了后者,做针对开发者的SDK和API,为他们提供技术支持。无论是互联网还是人工智能行业,现在来看,几乎都是底层技术商的胜利,所以魏清晨这个决定可以说是正确的。
之所以说他的选择正确,一方面是因为做底层技术确实是未来创业的一个重要方向,另一方面,Emokit在技术方面的背景非常深厚。据魏清晨介绍,Emokit有两位科学家对这方面的技术非常了解。
一个是Emokit的首席科学家杨滢,杨滢是美国卡内基梅隆大学的博士后,主攻脑神经认知方向,曾参与美国国防部“士兵精神筛查虚拟系统”项目,杨滢的导师是Jeffery Cohn,IEEE Transactions on Affective Computing 的创始人和前主编,其创立的Faciometric被Facebook收购,目前,Jeffery Cohn也是Emokit的顾问;另一个是AI科学家张鹿鸣,浙大博士,新加坡国立大学博士后,主攻机器视觉、深度学习方向。
有了技术背景,其他都好说,由于此前的App积累了一定的数据和百万级的用户,SDK一经推出,用户在短时间内就突破了千万,截至雷锋网「新智造」见到魏清晨的时候,EmoKit情绪识别的用户已经达到了2000万,而且在技术上已经更加完善。
此前海妖音乐,只是利用声音和心率来判断用户情绪,显得有些单薄,而Emokit研发情感计算的过程中,算法也经历了六次升级。第一代通过量表测评,第二代加入了心率和呼吸,第三代针对个体增加了纵向的学习和训练,第四代对情绪做了一个细化(从原来的5中情绪增加到了24种),第五代加入了表情和笔记的情绪识别,第六代主要做两块工作:一个是判断了用户的情绪之后,基于单一的事件背景进一步识别用户的意图。第二个工作就是把语音、表情和视觉的行为、文本做一个多模态的拟合。
说到多模态,EmoKit情绪识别的SDK使用了多模态的识别方式,比如声纹、基于更专业设备(智能手表、手环等)的心率、表情识别等等,让情绪识别更加准确。
据魏清晨介绍,目前他们的情绪识别在商业应用领域用途非常广泛,在基于人工智能的应用中,以下场景情感计算都能够落地:
基于AI多模态识别和生物反馈技术的精神压力智能筛查装备
基于AI多模态识别和NLP技术的公安审讯实时分析预警装备
基于AI多模态识别和车载控制技术的司机情绪和疲劳度监测干预系统
基于AI多模态识别和智能控制技术的情感联动的无操控智能家居系统
基于AI多模态识别和动机分析技术的金融信贷面签风险评估机器人
基于语音声纹和NLP技术的呼叫中心坐席情绪监控和满意度分析方案
基于情感大数据时序递归分析技术的幼儿性格发育倾向性预测软件
基于情感大数据时序递归分析技术的承认免疫系统损伤预警软件
魏清晨说,目前的客户多来自于军警、教育、金融等领域,其中公安审讯、金融信贷面签等落地较为快速,订单也拿到了不少。
在传统行业AI+的商业落地过程中,Emokit拿到了部队合作的1000万元订单、教育行业的百万元定金以及金融行业的百万元订单,成绩还不错,其他市场也都在不断的开拓。
除了EmoKit-SDK的免费API之外,他们还推出了EmoKit-IOT、EmoKit-AI,前者是智能硬件OS的免费KIT,后者是针对服务机器人的EQ4AI芯片,目前人工智能大热,这三条产品线能够让EmoKit的「情绪识别」快速渗透到人工智能领域的应用。
商业化落地是我们跟其他AI公司差别。
魏清晨告诉雷锋网「新智造」,情感计算这块的商业化落地能力很强,未来发展也很会很可观。
EmoKit项目研发至今,先后获得美国麻省理工学院举办的MIT-CHIEF全球创业大赛中国区第一名,芬兰Slush World 2014全球创业大赛名列第一,工信部和全国科协2015全国移动互联网创业大赛特等奖等多个奖项,赢了了很多业内人士的认可。
目前公司也在与一些机器人、智能设备厂商进行合作,为他们提供情感计算的API。
前文说过,在当下的人工智能浪潮中,底层技术商会拿到很大一波红利,而从目前的市场来看,语音识别、语义识别、视觉识别等不同领域的技术商都出现了向上的趋势,而做「情绪识别」并不是特别多,国外有几家知名的厂商都在单模态情绪识别(比如只利用面部表情来识别情绪)上进行了尝试,但目前并没有什么尖端的技术出现,从市场状况来看,EmoKit还是有机会的。
在与魏清晨的聊天中,他也表达了一个意愿,在未来,无论是机器人还是其他AI产品中,情绪识别能够像语音识别等技术同样重要,并且合作前行。
EmoKit目前也报名了「新智造成长榜」,作为榜单中「特立独行」的情感计算技术企业,能否出现在最终的评选名单中,非常值得期待。
雷锋网正在启动“新智造成长榜2017”评选活动,我们将对人工智能与机器人行业进行大规模报道、梳理和调研,并联合数十家著名投资机构根据这些创新公司的技术实力、商业能力和成长性进行深度评选,最终从多个领域分别选出一些极具潜力成长性的创新公司。如果你想参与我们的评选,可点击「报名」链接,或通过邮箱xinzhizao@leiphone.com联系我们!
雷峰网原创文章,未经授权禁止转载。详情见转载须知。