1
雷锋网按:本文作者阮航,北京脑穿越科技有限公司海外观察员。独家首发文章。
在上个月的Oculus Connect 3大会上,给人印象最深的莫过于扎克伯格带来的新一代的Social VR avatar了。清晰的面容辨识度,准确的语言口型配对,稍有瑕疵但足够精彩的面部表情,但最惊喜的是这一代AVATAR终于有手和身体了,这不仅带来了真实丰富的肢体语言,更意味着我们在比特世界的“躯体”进一步补全。
如何能让人更自然的将自己的内心投射到虚拟世界的形象上去?至少在现今阶段,一个更贴近人类生理构造的形象是最稳妥的。Facebook为这样的AVATAR形象制定了以下几点要求:
能说话,有眼神交流,表现出凝视,说话对得上口型,表情,至少有上半身,动作的精准还原。但是目前来说,由于运动追踪设备的限制,许多肢体语言无法直接由用户表达。此时,就需要“人造动作(secondary motion)”。也就是机器通过语音判断用户的行动,然后指导AI给出一个预设的动作,比如“捧腹大笑”。
于是,问题来了。如何让你的AVATAR具有个性化?这个问题绝对是VR社交最大的痛点,形象、声音、表情都有办法解决,但是肢体动作呢?总不能让用户全身穿着动作捕捉设备进行VR社交吧。有什么办法能让AI自己做出丰富的肢体动作,而又具备人性的那一点点闪光呢?
澳大利亚迪肯大学的Deakin Motion.Lab给我们提供了一种解决方法:动作捕捉+人工智能+虚拟现实。
Deakin Motion.Lab成立于2006年,专注于肢体表达领域的研究。成员知识背景跨度很大,有艺术家,设计师,舞蹈教授和不同媒体领域的技术大牛。实验室不仅在学术领域颇有建树,在商业合作上甚至也有诸多案例。比如和Iloura公司(《Mad Max》,《权力的游戏》特效制作公司)合作的电影《我,弗兰肯斯坦》,游戏《RUGBY LEAGUE LIVE》的人物动画,和丰田合作的广告《TOYOTA VELLFIRE》,以及匹诺曹舞蹈机器人。
在研究领域,Deakin Motion.Lab曾经创造了一套让盲人感知舞蹈的系统,并研究如何让舞蹈艺术变得“可编程”。这项研究目的在于弄清楚“动作能否碎片化成有特定意义的小单元”。就像把词汇从语句中分解出来一样,如果我们能把肢体动作拆分开来,并依据这些单元的逻辑,整合出一段有意义的信息。通过这种方式,我们就能实现人与AI的“肢体交流”。
而Deakin Motion.Lab目前最新的AI肢体研究项目“DUET”就是基于以上这项假设。”DUET”这项研究的目的在于创造一个能自主学习并和人类肢体交流的AI AVATAR,这个AVATAR既可以担当VR世界中的NPC,又能成为具有个性化的用户AVATAR。
DUET的研究思路大致如下:首先,实验员戴上VR头盔,看到AI 的AVATAR形象,并对他做一些动作。此时,AI模仿并学习这些动作,并通过AVATAR形象在对实验员做出相似的动作。此时,研究员会对AI的刺激产生一些肢体反应,而这些反应又再次被AI学习过去。如此反复,便构成了一个不断迭代学习的闭环。此外,AI avatar还能分析肢体语言,将不同的动作赋予“意义”,进而不断升级。
DUET的设备有动作捕捉系统、虚拟现实系统,以及基于机器学习和神经网络算法的人工智能系统。动作捕捉系统设置了24个光学动捕镜头进行光学动作分析,OptiTrack的动作分析系统(国内众多公司使用这个系统,比如诺亦腾的Project Alice)能够分析出关节的旋转和位移。
AI算法上DUET使用的是自组织特征映射 (Kohonen Self-Organizing-Map)的人工神经网络(ANN)方法。关于算法,DUET介绍他们在设计时会考虑到如何能够让人机的交互显得更自然,以及如何在数字系统中添加更多“人类”的维度。
虚拟现实设备从早期的OCULUS DK1到现在的HTC VIVE都有使用过。通过VR设备,DUET系统创建了一个供实验员和AI avatar共同探索的场景,使得实验员能更真切地对AI的刺激做出反应。
在我们自己体验时感受到最奇特的一点是,AI的avatar竟然是从体验者自己的身体中间产生的。
首先,体验者会看到自己的avatar,这个avatar是由无数流动的光点组成。接着,在体验者挥动肢体的同时,自己身上的一些光点会随着运动的轨迹脱离本体(象征着信息的流动),逐渐汇聚成一团新的信息聚集体,再由此伸展出AI的肢体。
值得一提的是,在我们体验和AI交互时,并不需要全套光学动捕系统,只用一台KINECT就可以了,这意味着在我们做个性化录入时,对硬件的门槛可能也会大大降低。
DUET还介绍到他们研究的另一个目的:创造更适合VR交互下的自然用户界面(NUI)。相对图形用户界面(GUI)而言,GUI要求用户必须先学习软件开发者预先设置好的操作,而NUI则只需要人们以最自然的交流方式与机器互动。
此外,这项技术在电影、游戏角色制作等领域也很有市场。目前在制作龙套角色的动作轨迹时,因为要让角色的动作保证基本的真实,即使非常简单的动作,由于配角人物数量太多,仍然需要耗费大量的人力。如果AI能够自动做出和角色性格相符又真实的动作,无疑能减少大量的开支。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。