8
那些从鸡蛋里出生的
似乎就是从今年初开始,有关虚拟现实(Virtual Reality)将会颠覆全球娱乐产业,“2016年将是虚拟现实的元年”这样的论调就开始扶摇直上。全新与全新山寨的产品层出不穷,仿佛大业将成的革命者前赴后继。
而这一切似乎都是源自于Oculus VR和他们的沉浸式VR眼镜,以及Facebook为首的一批互联网巨头放出的各种利好消息。一时间,VR成为了一个巨大的话题引爆点:每一个初创团队,每一次行业聚焦,都似乎牵动着万众的目光与遐念。
然而冲锋在这些话题最前面的,却总是一个接一个的大鸡蛋,美其名曰穿越时空,美其名曰身临其境,美其名曰9D体验——虽然除了我们身处的宇宙之外,其它6D都只是从商者们在原本的三维空间上投射出的倒影而已。
这样的倒影并不是什么跨越时代的新鲜玩意儿,在广东番禹的游戏机一条街上,四处可以见到这种动感座椅的最基础元件——铝制或者钢制的桁架型材,配上伺服电机和自制的减速箱,再引出一根串口线来传递简单的控制指令。更有头脑的老板可能已经配置好了一个周立功版的单片机,然后与客户的手机和PAD建立通讯,进而形成一整套完善的展馆中控系统。
全部预算下来,也就是几千或者万把块钱的代价,当然还有精美而神秘的蛋壳,舒适的座椅,以及来自Oculus原产或者国内厂商的虚拟现实眼镜。最后辅以人们习以为常的一些VR内容,例如预先拍摄好的全景视频,又或者一个激烈的第一人称射击游戏和飞行模拟游戏,就可以大胆地搬上展会现场,或者请来投资顾问,把自己纵横行业十几年的经历好好吹嘘一番了。
而那些慕名或者有幸坐上了大蛋壳的观众和爱好者们,则宛如京极夏彦那部令人不寒而栗的悬疑小说《魍魉之匣》中那位扭曲在内心里的受害者一样,被剥夺了手足一般地恐惧,挣扎,尖叫,兴奋,沉静,冥想,疲累,眩晕,解脱……眼前的画面似幻似真,脚下从未曾立足过的虚幻土地,殷红如血。
这就是我们期望的VR吗?又或者说,仅仅靠这样的体验感,就可以颠覆传统,席卷起一场全新的革命吗?
赤身裸体的另一个世界
实现一个完整的VR系统,不仅需要一种具有沉浸感的,不同于二维屏幕的观看手段,更需要能够让人沉浸其中的交互方式,以及与之相配合的数字内容。因为游戏者终究是活生生的人,有着完整的视觉、听觉、嗅觉、味觉、触觉组成的精密系统。当其中某一种感觉被彻底地取代之时,就显见着需要其它感观的体验也能够得到取代,亦或合理地遗弃,才不会造成巨大的生疏和不适感。
然而,现阶段的VR体验开发者们,却往往采用键盘,鼠标,摇杆,转眼珠,敲头盔,打手势,以及各式各样奇怪的控制器……诸如此类的种种交互手段,来配合一个视觉被完全替换的游戏者的动作和肢体感受。
而正常人类在现实社会中显然不会采用这样的方式来进行交流,人们更习惯的方式是:行走,站立,握手,对话,直视对方的眼睛,揣摩嘴角的微笑,挥拳,举枪,奔跑,跳跃,感受呼吸与痛苦,舔舐硝烟的苦涩——
而这些并不是VR眼镜这单一的显示设备,以及简单机械运动的外设能够带给我们的。
尽管行业的前行者们不断创造出新的概念与思路:例如可以敲击和触摸的头盔,挂在手臂上的感应环与体感摄像机,以及语音、隔空手势、面部识别等等,但它们毕竟是一种需要重新理解、学习和适应的交互输入工具,亦或存在着不可完全克服的算法本质,无法立即适用于每一位游戏者。
而对于普通的家庭娱乐参与者而言,如果眼睛正置于虚拟环境当中,就被迫换一种新的交互方式来适应环境本身,进而产生巨大且对于普通人来说难以理解的学习成本,那么就不会给一般消费者带来任何喜悦和沉浸体验——毕竟这不是特种兵的训练,也不是科学研究,不能奢求参与者的极佳素质与使命感——而没有沉浸式的体验,对于普通观众来说也只是昙花一现的打闹游戏,谈何推广?又谈何普及呢?
没错,VR的娱乐体验不同于以往任何一种看似新型的游戏方式或者外设,它不止于当年Wii对交互设备的维度和物理属性的多样化,也不止于Kinect对于虚拟游戏场景中真实深度信息的补充。它的交互流程更需要贴合人类真实的行为方式。
例如,捕捉游戏者的全身动作并且传递给VR应用程序;然后获取玩家在实际场地中的位置和精确的运动轨迹,反馈给虚拟场景;之后还要实现玩家与场景中其它人或者物体的交流:比如玩家伸手触碰到了虚拟世界中的一面墙,被一团灼热的火球直击面门,或者与虚拟社交游戏中的另一个游戏者深情拥抱。她的体态,她的触感,她的温度,她的笑靥如花——
假设一下,如果你靠近了虚拟世界的墙,手指乱摆却空无一物;又或者你在一篇辽阔无极的大草原上尽情驰骋,却一头撞到了狭小客厅里那个价钱贵的离谱的4K电视机,你会因此感觉到任何的震撼力吗?取而代之的,也许只是慌慌张张摘下眼镜之后的惊惶和痛心才对——幸好我们还有魍魉之匣,还有一个大鸡蛋可以承载理想,以及遮蔽因为基本的交互方式缺失而带来的巨大的不真实感。
这正是如今正热的滚烫的虚拟现实应用的最大病根,只是被桎梏在一个小小座位上,从粗糙,延迟和锯齿感十足的眼前感受到的有限场景,谈何VR?
交互体验矛盾论
上面提到的问题,也并非全无解决之道。
首先是动作捕捉,Opti Track的光学动捕设备在影视行业已经火了好多年了,穿上满是marker点的动捕服,在密密麻麻的摄像机注视下,从全身到手指到面部表情都可以绝无遗漏地捕获下来,把你活生生从一个人变成《猿族崛起》里的一头巨猿——这样的体验令人兴奋,然而动辄百万的价格也令人胆寒。
并且就算哪天光学动捕大发慈悲地平价了,那漫天遍野的镜头注视着一个穿着黑色紧身光点服的你……恐怕不会有多少人在这个时候还有心情慢条斯理地继续自己的VR游戏,这挑战性恐怕比在色情影片的拍摄现场,在导演制片摄像剧务化妆助理以及三四十号群众演员的注目下,宽衣解带地尽情表演难度更大吧。
不要担心,惯性动捕前来救驾。
抛开老牌厂商Xsens不谈,单看这两年国产的后起之秀Noitom,其价格、体积和平价化的发展策略都足以让整个VR行业心里如小鹿乱撞了——只要简单地固定好麻将牌大小的动捕元件,再配合简单的三步标定过程,没有绊脚的电线,没有蠢萌的装备,没有可怖的围观相机,游戏者的一举一动自然而然地被转换为BVH动作数据输出,进而在VR实时引擎当中绑定给游戏角色。
这样的处理过程之后,游戏者要在场景里看到自己的手臂乱摆,执枪舞刀都不再是难事,而其他人的动作自然也会通过服务器的统一处理和分发,映入眼帘,更真实的VR体验,并非天方夜谭。
然而噩梦并未散去,也许反而愈发真实……
惯性动捕的最大问题来自于漂移,因为是通过六轴传感器的积分和二次积分来计算角度与位移值,所以并不存在绝对的世界参考点,传感器产生的误差虽小但是无法得到补偿。
就这样不断积累的结果就是让角色与原本的位置和姿态渐行渐远,甚至可能飘在天上不能自拔——而这种无法得到修正,只能通过一个愚蠢的“回零位”按钮来重置的体验(没错,这个回零位按钮也正是现在各种炫感枪的常见做法),显然彻底破坏了我们刚刚构筑起来的虚幻感。
并且因为无法确定初始位置,无论Oculus眼镜还是惯性动捕设备,都需要玩家有一个预先标定姿态的过程,即游戏者摆出一种或者几种系统预设好的姿势,来帮助系统确定零件的初始状态——
这对于一个没有足够经验的游戏者来说无疑是噩梦,当然把自己固定在蛋壳之中的体验不在此列。
除此之外,电池管理的问题,穿戴复杂的问题,手指和面部识别的问题,跳跃和反复蹲起时抖动或不准的问题,金属底板和磁场环境下数据干扰的问题,无线传输在复杂环境下信道的问题,这些都是现在的惯性动捕设备厂商锁不得不面临的一道道屏障,在彻底解决这堆积如山的难题之前,我们也许很难看到一个能够真正面向消费者级别的产品诞生,现阶段,也许只有被冠以专家名号的人能够驾驭它们。
再说说精确的虚拟空间定位方法与运动轨迹测量。
差分GPS应该是测绘行业里非常通用的定位方案,在场地里预先建立好足够多的基站和误差补偿站,然后身背一个手机大小的接收器,就可以把你的位置精确到毫米级别——不过,足够多的意思,基本上也就是你得大张旗鼓在院子里摆开龙门阵的意思,那就不要怪小区大妈和怀孕的邻居们扯起横幅来围观骂街了。
那就用CV的做法,比如澳洲的Zero Latency,使用PS Move的摄像头和标记点来确定游戏的位置,进而做出了世界上第一个虚拟现实体验馆。然而,他们总共在400平米不到的场馆里用了129个PS Move,这个姑且不提,并且因此需要一个繁杂而漫长的标定过程。
标定,Calibration,为的是对齐和裁切每个摄像头的画面以拼合成一幅完整的场景,当年水晶石为上海世博会做《清明上河图》展项的时候,前后对150台投影机进行标定、对齐、几何校正,边缘融合……足足调了三个月有余——不过这样的辛苦带来了一个伟大的工程。
是的,伟大的工程——这种事如何快速地发生在每个人自己的家里?
所以Zero家目前只开了一个体验馆,维护的费用不得而知,但是也许可以静观他们再开第二个馆的时间,以及是否能有足够的收入维持运营和投资者的决心。至于让这种定位方式普及开来的难度,恐怕也是不言自明了。
对了,还有HoloLens以及Kinfu里看似神乎其神的SLAM方法,难道不能移植过来吗?当然可以。事实上BIM圈子里的天宝早就先人一步把这种方法用到建筑工程管理上了,只是一个手持设备而已。
但是,与之前提到的惯性动捕算法类似,SLAM毕竟也不是一个闭环的系统,它的计算同样存在着不断累积的误差,并且场景的复杂度越高,这种累积带来的影响就越明显。
而对于极为突出场景定位要求的VR应用,即使是一个厘米的误差可能也是致命的失败体验,比如命悬一线的你会刚好够不到空中的绳索,又比如正深情吻向虚拟女友的嘴唇,却吻到了正巧挑着炊饼路过的武大郎。
不过定位方法还有很多。比如UWB,比如超声波,又比如在场馆里铺满海量的RFID或者ZigBee……然而复杂的工程实施需求早已超越了虚拟现实应用这个命题本身,需要因此整合起来的经验丰富的团队,也早已不只是一批Unity或者Unreal引擎的使用者而已。
那么还有没有其它的问题需要解决呢?
比如人与人之间的触摸和气味?可以考虑医用硅胶,温度传感,或者就是4D5D6D影院的喷洒头和芳香剂;
被人打了怎么办?不妨穿上不太劣质的力回馈背心,或者来个微电流电你一下产生痛感;
识别触摸墙体和桌面?那就需要用3D扫描和重建的方法精确匹配现实场地与虚拟的场景,再配上触摸膜和压电薄膜来反馈触碰信号;
又比如怎么把右手拿的枪换到左手?也许在两手都贴上RFID加上RSSI的识别应该是一个可行的选择(不过下图的The Void暂时是由另一位工作人员把枪递过去的……)。
再说软件层面:
比如面部动画,可以接入FaceShift或者LipSync中间件来做处理;
角色之间的精细动作,例如接触和对抗,这需要引入成熟的IK库,比如FinalIK也有EmotionFX;
角色的物理模拟在此时也成为了必需,比如用到Havok或者PhysX;
如果场景的更新和渲染压力此时已经无法达到75Hz的目标,那么可能还要考虑从Simplygon到Umbra3D一应俱全的LOD和遮挡查询工具;
最后还有勤勤恳恳的美工负责减面,以及开发人员的日夜兼程……
好吧,还有什么问题是不能通过辛苦的劳动去解决的呢?虽然这劳动着实太过辛苦了一些。
那么有请能理解和做到上述一切事情,知道如何购买和运用各种虚拟现实交互设备,成熟融合所有这些技术于一身,并最终创造全新交互和观感体验的VR应用团队出场!
……
如果有这样的团队的话,为什么没见到他们出场。我们看到的只是头盔厂商时不时推出的几个寒碜案例,视频网站拿来疯狂造势的全景直播,当然还有Unreal救场用最曼妙的素材构建一个最真实的坐着看的场景——
是的,在尚且堆积如山的技术难题面前,更多的人选择回到了那个魍魉之匣,也许你一开始被震撼住了,你甚至被那个家喻户晓的过山车Demo吓尿了裤子,然而你并不会马上为这种震撼掏钱。
在一个深蒙蒙模模糊糊还容易起雾的黑盒子里,你只是看到了粗糙的可以简单环视的画面而已。这是一种新奇的感受,然而你为此需要承受各种延时造成的晕动;劣质镜片的强烈色散,非2K屏的巨大锯齿,法线造成的动态Aliasing,以及被迫坐在原地不动的困惑感——
这不是一个可以持续20分钟以上的游戏模式,换句话说,这就好比90年代大街上的万花筒,看一次5毛,但是没人会买回家天天瞅着。
哦,对了,90年代也是有VR头盔的哦(下图为96年的杂志封面),也有过人类即将分不清虚拟与现实世界的论调,至于是不是说过元年二字,也许没人记得。
半步地狱,咫尺天堂
所以,虚拟现实将要崛起吗?VR的元年将要到来了吗?
不知道,然而笔者只是看到它的最重要的几个组成部分还是断肢残臂,站起来也许都是晃晃悠悠的,为什么就断定只凭着一双“奥酷拉丝”发起,而千百创业者造就的近视+散光+延时+锯齿而生的飞蚊症+过热之后还会白内障的慧眼,就能跑进千家万户了呢?
何况还有因为那些恐怖的技术壁垒而变得一片空白的内容服务商,这些平台提供者们布局之后翘首以盼的杀手级应用,真的会如同平地一声惊雷地飞起吗?
没关系,这些都是笔者较真和抬杠的醉话而已,因为眼镜平台可以主动去对接上述的一切需求,因为无门槛的开发者们可以只做最基本的VR应用,只看全景大片(前提是你得有充足的数据源),避免过多的交互,避免网络传输、传统外设、凭空操作等一切产生迟滞感和反交互特性的特性——
比如只拿着一把装好了各种传感器和按钮的大枪,戴上炫酷的VR魔镜,宛若一尊碉堡,一样肆无忌惮地在虚拟战场上开无双就好了。
如果这就叫VR,那么就这样好了;如果这样就迎来了元年,那么至少海龙和E世界的空荡摊位都可以赶紧改成VR游戏体验厅,一起享受这场热潮了——
虽然这种体验厅似乎已经不少了,虽然它们看起来都是千篇一律,虽然无数看起来已经冲在路上的先驱们,做的事情却渐渐异曲同工。
然而希望终究还在。虚拟现实并非什么全新的概念,这些被炒得火热的虚拟设备与内容也并非完全应运而生,更多的是对之前深居于科技前沿的高阁的昂贵产品的一种平民化创新,它们的诞生与兴起本身就是一种进步。
而这样的进步到底能走多远,到底会持续多长时间,到底是爆发与迎来全新的行业变革,还是继续行走在“量变终将引起质变”的漫漫路上。这也许正是行业从业者和关注者们共同谱写的一曲长歌,其中有深远的咏叹,有短促的悲鸣,有激昂的摇滚,有自娱自乐,有鱼目混珠,也有死灰复燃,但是——
唯独不会有终点。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。