您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
业界 正文
发私信给董子博
发送

0

元宇宙创新者:落入凡尘的「动作捕捉」,会是元宇宙的「新希望」吗?

本文作者: 董子博 2023-01-31 17:29
导语:十年过去,动捕行业也有了“中年危机”。

作者:董子博

编辑:岑峰

元宇宙创新者:落入凡尘的「动作捕捉」,会是元宇宙的「新希望」吗?

2011年夏天,深圳的气温又是屡创新高,毒辣的阳光洒在沥青路上,甚至能把胶鞋的鞋底烫化。

在南山蛇口的创业大厦,戴若犁已经创业了2年多。他、刘昊扬,和其他几位合伙人一起,在一块不大的办公区域里,围着一张堆满了设备和原型机的办公桌,常常工作到深夜,才汗流浃背地回家。

创业第二年,戴若犁全家早从香港迁到了深圳。戴若犁的太太,原先在香港某家投资银行就职,在戴若犁开始创业后,也放下了优渥的待遇,陪着丈夫来到深圳蛇口,家的不远处,就是停靠在六湾海滨的明华号。

而在2011年,比起一个企业家,戴更像一个极客:他和几个合伙人,还有一两个员工,只知闷头开发,不去融资,也不领工资,他们研发的动作捕捉技术,几年内也看不到产品变现的未来,家底再厚,也架不住“只出不进”。

为了支持丈夫创业,戴若犁的夫人想到了自己手头的金饰——是自己在结婚时,从父母那里得到的礼物。

两人略一商量,一狠心,典当掉了其中不少金饰,加上手中还存着的一些现金,总算是有了能够支撑一年的生活费用。

到了今天,戴若犁联合创始的公司——诺亦腾——已经在动作捕捉赛道上排在前列,让一个中国名字在世界范围内如雷贯耳。

十多年后回忆起这段往事,对过去曾走过的艰难,戴若犁似乎早已云淡风轻,“好在我们很快做出了第一代产品,融到了资,也知道给自己发工资了,这才没再卖一次金子。”他笑道。

然而当时究竟是何等心境,只有戴若犁自己才清楚,如人饮水,冷暖自知。

2021年,元宇宙概念爆红,让不少圈外人注意到了动作捕捉技术,在未来交互中重要的作用。

有人会说,不少行业等了这么多年,终于等到了元宇宙的“风口”。而十年里,戴若犁见到了太多市场的起起落落,早已波澜不惊。

十载积累,一朝功成,并非戴若犁和诺亦腾的故事——十年里,他只做一件事,就是让动作捕捉技术落得更“低”,让更多的人能够通过动捕,实现更多的不可能。


一、“懵”过的10年学术生涯

1978年,戴若犁出生于湖南。他的父亲是一名工程师,专业领域是飞行器结构强度设计。当时,成都飞机工业公司正向全国范围内广募英才,戴若犁的父亲便举家迁往成都。 参与了目前列装量最大的几款机型的大量工作。

戴若犁自小就在这样的环境里长大,97年在成都九中高三毕业,成绩排在全省前100名。戴的父母担心儿子,在大城市玩物丧志,误了学业,于是坚持他去一个小城市,一所治学严谨的高校读书。

如果把北京、上海、广州都去掉,中国剩下的理工科顶级高校,剩下的选择不多,而在四川收分仅次于清北的中科大,就是其中之一。

“如果用一个字形容,我的学术生涯挺‘懵’的。”戴若犁道,“选择之前似乎并没想得太清楚,不过现在看起来结果都不错。”

在中科大,戴若犁修的是力学与机械工程系——外人可能不清楚,在中科大,力学是一个与数学、物理、化学平行的专业,是中科大的第“五系”。而中科大的第一任力学系主任,正是后来提出了古早元宇宙概念“灵境”的钱学森。

本科五年时间白驹过隙,到了毕业,出身书香门第的戴若犁,选择继续去海外进修也算是顺理成章。当时,要自力留学进修,大多数人在经济上都有困难。于是,奖学金的多寡,就成了海外大学抢人的有力手段。

戴若犁在中科大成绩也堪称优秀,一番努力“套磁”后,海外offer拿了不少,但当时的他,甚至对高校排名都懵懵懂懂,拿到offer,就看奖学金有多少。

当时不少大学的offer,奖学金都大概在1000-1400美金不等,但香港中文大学,给戴若犁的奖学金开到了14000-15000港币。

要知道,大学5年,戴若犁的生活费每个月开始只有四五百块,到了大四大五,才又涨了一两百块钱。

“当年港币汇率比人民币还贵,从来没见过这么多钱。”戴若犁的心,就这么一下飘到了香江河畔。

于是,本科毕业后,戴就远赴香港,来到香港中文大学继续进修自动化与计算机辅助工程。

在港中文,戴若犁第一次有了“睁眼看世界”的感触:在中科大,大家很卷,但更多卷在基础学术能力的建设上,力求一个“扎实”;而到了香港,研究则必须与世界前沿接轨,学生的眼界也必须更宽,争取的是“前沿”。

戴若犁在港中文一直读到博士毕业,并且留校做了博士后,他当时的校友,在今天纷纷成为了中国科技界的中流砥柱:商汤科技的创始人,IEEE Fellow 汤晓鸥,在戴若犁读博士后的时候已经在港中文教书;另一位 IEEE Fellow 王钧,就在戴若犁隔壁的实验室,是华人地区最早进行神经网络研究的第一批学者;而商汤今天的CEO 徐立,也和戴若犁同期在校。

博士后出站后,不少人的选择都是去高校谋一个教职,不仅稳定,而且不用太多思考,几乎是水到渠成,顺理成章。

然而,在象牙塔里待了11年,戴若犁不想再“懵”下去了。

开始这么想,还是在他完成博士论文的时候。《碳纳米管复合材料在主动减震上的应用》,光题目听上去就像天书:

“这么细的内容,细分到全球,可能只有4个人能百分百地读懂你的论文——一个是你的师爷爷,一个是你师父,一个是你,除此以外可能只有一个陌生人能读懂。”戴若犁说道。

在科技界,戴若犁知道,有很多人,身处学术圈,正在用他们的研究,不断地探索理论的尖端前沿——如果把人类的知识储备比作一个袋子,那他们就是往袋子里捡拾薪柴的人。

但与此同时,世界也需要有人,能从袋子里拿出材料,把它们做成实实在在,对普通人和工业界有价值的东西。这是戴若犁更想走的路——一条把科技理论落进人间的路。


二、创业之路,缘起一块芯片

2009年,戴若犁决心创业动作捕捉,正是碰上了这个行业一个全新的机会。

动作捕捉技术的发端,最早可以追溯到1915年的“转描”技术——动画师借由将提前摄录好的人像,投影到画布上,再将其逐帧拓写下来,最终制成一部动画。

早年间迪士尼的《白雪公主》、《爱丽丝梦游仙境》,甚至还有中国的《铁扇公主》等大量的动画,都是以这样手动“捕捉”动作的方法完成的。

40多年过去,动画师李·哈里森三世开发出了现代意义上的第一套动作捕捉系统——他将电阻缝在紧身衣上,并以此记录人体的动作。到了后面,使用外骨骼的动作捕捉技术也应运而生。

尽管技术发展的速度不慢,但动捕的落地使用仍然是一个难以解决的难题。

在大制作的影视、游戏行业,使用更多的是“光学动捕”手段,以大型摄像头矩阵驱动,通过识别动捕演员身上的光学反射标记,来进行动作的捕捉。

光学动捕模式精度更好,但成本动辄巨大,场地、设备、辅助团队等等条件缺一不可,而整套系统使用起来也相当专业复杂。这也就让光学动捕迟迟不能走出影视和游戏行业,无法面对更大的市场。

而另一种模式——“惯性动捕”,则一定程度上牺牲了精度,换取了易用性。这种模式下,动捕演员的动作信息不再被摄像机收录,而是直接记录在他们身上的可穿戴式传感器上。无需摄像头,这些传感器直接记录下自己的运动信息,再根据算法,演算出演员全身或局部的动作,来实现动作捕捉的效果。

尽管相比光学,惯性动捕所需要的条件更少,但这种模式在当时也存在一堵“叹息之墙”——单个传感器的体积如果太大,对于动捕演员来说必然是个负担;传感器价格如果居高不下,不少小公司就用不起。

在诸多因素限制下,动捕技术在当时,还只是少数人的“玩具”;行业也比较封闭,没有破圈式的传播,行业增长也陷入了迟滞。

而数十年时间过去,芯片行业的东成西就,让动捕行业也看到了新的可能。

直到今天,戴若犁还能记得一串代号——L3G4200D——这是意法半导体一款陀螺仪芯片的产品代号,被应用于IPhone3GS和不少其他的手机型号中。

原先的三轴陀螺仪,不仅价格很贵,而且尺寸巨大,还需要一大堆设备进行驱动;而L3G4200D只有4*4*1毫米,造价也被压进了一美元以内。

“这个事情真的震惊了我。”戴若犁说,“动作捕捉技术能够继续在行业里下沉,还是要感谢智能手机的发展。”

传感器的发展,让惯性动捕有了打开新市场的可能——传感器更便宜、更易用,原先由光学动捕模式垄断的行业,惯性动捕也能够有了一席之地。在今天,不少小工作室、乃至虚拟主播,早就用上了动作捕捉的技术。如果未来有一天,普通人也能用上动捕技术,那么人们用的,也很可能是惯性动捕。

地球的另一边,在美国马里兰州的巴尔的摩市,后来诺亦腾的另一位创始人刘昊扬博士毕业后,和他的导师一起在美开办了一间公司,用计算机来进行桥梁的模拟分析计算,用传感器技术监测楼宇桥梁的健康程度。接一些美国交通部排查大型基础设施健康状况,以及仿真模拟计算的业务。

而在2008年次贷危机爆发后,全美经济跌进谷底,国内反而是一片欣欣向荣。看到这样的形势,刘昊扬便回国寻找新的机会。

经人介绍,戴若犁和刘昊扬成了网友,仅三言两语,两人都知道对方不是一般人物。后来,戴若犁从香港、刘昊扬从北京出发,终于在深圳“会师”。

在深圳上海宾馆大堂的咖啡吧,戴、刘和几个朋友促膝长谈。激情涌动,他们决定开一间公司,公司的名字是Motion(意为动作)的回文——Noitom——也就是今天的“诺亦腾”。


三、To B “饮鸩止渴”,To C 下沉艰难

在深圳艰苦创业3年,诺亦腾获得了投资,便一起搬去北京,在西城普天德胜科技园盘下一块小地方,团队从十几人扩展到上百人。戴若犁直言,他有时还会想念原先公司规模尚小的时候,员工之间家人般的氛围。

几年过去,正是 VR 炙手可热的时候。新的显示方式,让新的交互方式也获得了更多的关注——VR让人能用眼睛“直视”虚拟世界,那为何还要使用手柄?人的“数字化”程度仍在加深,从《少数派报告》到《头号玩家》,不少影视作品早已“预言”了XR的未来:手柄交互的时代终将过去,动作捕捉终将“加冕为王”。

与VR一起成长,诺亦腾很快成为了动捕工业中的一颗新星,接的单子不少。就像前面说的,诺亦腾看到了动捕行业巨大的下沉空间,并在这个市场以更便宜、更易用的动捕设备拿下了不少份额。2014年,诺亦腾推出了第一套全功能动捕设备Perception Neuron,最便宜的一档众筹价格仅为200美元,比一款低配的手机也贵不了多少。

以轻量化的动捕设备,诺亦腾很快在海内外收获了大量的拥趸,并很快跻身行业的前列。

但戴若犁却并不“开心”,相反,他开始感觉到了焦虑。

在一个智能硬件公司创业之初,To B生意往往是必选项。一方面,B端对成本的敏感程度更低,对于设备的复杂度要求也更低——如果一家公司需要动捕技术,那技术贵不贵、好不好用,都不是第一性的问题。

同时,乙方的需求也更加定制化,让科技公司不必花费太多时间,去考虑市场对于产品的反馈,也不用为了讨好市场,进行迅速的迭代——拿人钱财,替人消灾,几乎不需要思考。

眼看着诺亦腾又要钻进一个舒适圈,戴若犁却警觉了起来:

“To B 最大的坑,是需求——需求不是由产品开发人员定义,而是由甲方爸爸定义,他们的需求千奇百怪,当你解决了他们的问题以后,他们的投入就会下降。而在通用的解决方案上,我们却很难有所积累。”

能在 To B 领域做出发展,软件的机会大于硬件,尤其是 SAAS 服务,可以通过将产品模块化的方式,在定制化的需求里,积累通用化的经验。如同 Zoom 的成功一样,越是轻度、小而美的软件产品,越容易跑通To B这条路。

但硬件公司不同——迷失在甲方定制化的需求中,很容易长期没有技术沉淀,最后在供应量里变成了一个组件商,止步于一个很细的领域,再也无法谋求增长。

盲目跟着甲方需求做B端是“饮鸩止渴”,而C端的路,走通也不容易。

戴若犁身边不少人,经常问他,什么时候能开始做C端产品。戴若犁心里也知道,C端做不下去,并非因为造价太高、售价太贵——“即使诺亦腾的设备免费送,我们目前也没有能力,做成C端产品。”戴对雷峰网(公众号:雷峰网)如是说。

戴若犁忘不了,2015年,任天堂曾向诺亦腾伸出橄榄枝,想邀他们去京都的总部一叙。戴若犁平素也是游戏玩家,知道任天堂名号震耳,难掩心中兴奋,于是叫上了诺亦腾美国分部的总经理中岛洛克,陪他一同走一遭。

2006年,任天堂的上世代主机Wii正式面世,以双传感器运动感知动作捕捉的交互方式,在游戏主机市场强势占领了半壁江山,据统计数据,销量达到了恐怖的一亿以上。

而任天堂找到诺亦腾时,Wii也正走向生命的末期,正在寻求新主机的开发思路。戴若犁知道,找到他们,就是为了评估他们的技术,是否适合被用到任天堂新一代的主机身上。

戴若犁和中岛来到日本后,任天堂也相当重视——一个会议室里挤了三四十号人,把诺亦腾几乎所有的传感器、穿戴方案、动捕技术的演示看了个遍。戴若犁甚至还专门设计了一套方案,用6个传感器即可捕捉全身的动作。

演示结束后,戴若犁胸有成竹:“我当时觉得这把肯定成了,终于可以做 To C 了。”

而后面的故事,就不再是什么秘密:任天堂最终没有选择诺亦腾的方案,但他们的新主机 Switch 面世后,再次掀起了市场持久的追捧。双手柄(还可以加上健身环、绑带等外设)的设计牺牲了动作捕捉的精准度,却保证了产品的易用性。

这也不禁让戴若犁反思:“To C 一定要像任天堂这样做,动作捕捉落不进C端,核心不是成本问题——中国人擅长数学,也擅长把东西做便宜。但即使把这套系统造价做进200块以内,用户也不愿意在身上绑这么多传感器。”

无疑,今天的诺亦腾正站在一个十字路口上。公司创业已经走过十年,然而未来的方向,并没有想象中那么明朗。

戴若犁不想把诺亦腾变成一家单纯的 To B “小公司”,在供应链里负责“小而美”;但B端生意却支撑着公司大部分的营收,要降到C端又绝非一日之功。

诺亦腾的“中年危机”,并不表现成是某种“生死难关”,而就潜藏在公司发展的“风平浪静”之中——而一招不慎,就可能万劫不复。

戴若犁知道,诺亦腾必须动起来了。

一方面,在B端,诺亦腾想求发展,就必须把触角伸向天花板更高的产业。

诚然影视特效、游戏开发、动画制作仍然是诺亦腾的基本盘,但在运动、健康、医疗等领域,行业对于动作高精度的追踪、三维的可视化也有需求,同时,能够覆盖更大的用户群体,也更能帮助诺亦腾在B端获得新的增长。

“十亿规模的市场天花板太低,我们就去找千亿规模的市场,”戴若犁说,“这样我们的可能性也就更大。”

另一方面,在B端做下沉,甚至要降到C端,还得把产品做的更易用,使用门槛更低。

在诺亦腾的美国分部,一位叫丹尼尔·夸卓的员工,平日里做的都是售后服务工作。最早的时候,诺亦腾对于小B端的想象,是两人一起工作的“小作坊”,一人负责采集动作,一个人来协助校准和采集。而在丹尼尔日常的客服工作中,他接到了不少反馈:

“我身边没有人可以提供协助,你们的产品我一个人用不来。”

于是,丹尼尔就自己动手,利用倒计时、语音提示等方式,为设备设计了一套单人操作的流程。方案交到戴若犁手上,最终也集成到了后续诺亦腾的设备里,在申请专利时,丹尼尔是第一发明人。


结语

创业路上,诺亦腾吃过苦:在B轮和C轮融资之间,公司的资金链一度面临断裂,创始人刘昊扬曾不得不将房产抵押,来周转资金;

多少次,办公室里通宵达旦,戴若犁在算法和公式中推敲、求索。抬起头,第一缕阳光早已刺破窗外的天空。

疫情当下,诺亦腾的全球化业务也严重受创。无论是人员,还是资金的流动,诺亦腾都收到了巨大的挑战。自打疫情开始,戴若犁已经有3年没有亲自去过美国的办公室,而零星出现的阳性病例,也让办公场所时不时封闭,办公环境也受到很大挑战。

疫情对海外市场的打击也相当巨大:之前提到的,诺亦腾美国分部的总经理中岛,新近又感染了第二次新冠,也在家里躺了三周没法出门。

“疫情之前,海外的销售站所有销售额的70%;现在,国内的销售额占所有销售的70%。”戴若犁解释道。

回看诺亦腾的创业历程,有人会说,诺亦腾创业太早,早期的VR1.0时代,诺亦腾的困局在于市场太小;而随着芯片、5G、AI、云计算等基础科技的发展,XR这个行业也在步入2.0时代——无论是从硬件,还是从生态角度上,XR又经历了一轮“生产力”上的飞跃。而诺亦腾入局太早,也就走了太多不必要的弯路。

谈及此事,戴若犁对雷峰网说:“如果晚个4-5年创业,应该不会有之前那么艰难。现在的创业者,更深思熟虑,有些也更功利——哪里热,哪能拿到钱,就一股脑挤过去。而我们创办诺亦腾的时候,虽然能跑出来的人很少,但创造力更百花齐放,当然成功率会低一些,死掉的公司很多。”

戴若犁的心里,一直有理想主义的一面存在。2014年,戴接到了一通电话,来人名叫托比,是一个瑞士人,他想来诺亦腾工作。

托比是个不可多得的全栈工程师,他懂Unity,会做美术,了解虚拟现实和动作捕捉,还对传感器技术如数家珍。而从2009年开始创业,动作捕捉和XR就是诺亦腾主要攻关的方向,也正是因为对诺亦腾正在做的事情感兴趣,托比才铁了心要来诺亦腾上班。

然而,戴若犁曾经婉拒过她——当时二人还是网友,托比人在瑞士,通过Skype和戴若犁聊了很久。

但在2014年,“线上办公”还只是个遥远的梦想,尽管知道托比的才能过人,戴若犁也不敢贸然招他入职。

而当戴若犁第二次接到托比电话的时候,后者人已经在北京了。

戴则是心里一惊,因为他知道,托比是个残疾人——他小时曾经得过小儿麻痹,行动非常不便,他孤身一人来到中国,得吃多大的苦?

托比则是相当简单:诺亦腾在做的事情,让行动不便的他,也能享受到在草地上自由奔跑的乐趣。所以他必须投身到这个事业中来,并且要把自己的名字留在上面。

也是这样的激情一直激励着戴若犁,让他知道,自己在做的事情,是有价值的。

————————————————————————————————————————

以下是雷峰网与戴若犁对谈的采访实录,其中设涉及了“元宇宙基建”、雷峰网在不改变原意的情况下做了精选和整理:

雷峰网:元宇宙当下的发展态势,是诸多领域齐头并进,共同发展。您认为,动作捕捉技术在元宇宙建设中,扮演了一个怎样的角色?

戴若犁:动作捕捉技术,在元宇宙这个概念里面,属于一个基础建设级别的技术。简单的说,其实元宇宙不必像扎克伯格所说的那样,所有人都生活在一个虚拟的时空里——元宇宙的关键,还是数字化的程度。

如果要将物理世界数字化,人的数字化是必不可少的,因为元宇宙到最后还是人机交互,除了个人提供一个Avatar(化身)以外,元宇宙还是要提供一个人机交互的载体。而除了语言、图像,肢体语言和动作、表情、手势都相当重要。

雷峰网:那您认为,要让动作捕捉技术在元宇宙开花结果,会是怎样的形态?

戴若犁:我觉得动作捕捉技术,如果真的要开花结果,还是在C端里,能够可以作为一个基础建设的存在。

在C端能作为基础设施,需要的是一个平台化的方案,来把人进行数字化,进而完成可视化和人机交互。

雷峰网:提到交互,往往被认为和动作捕捉关联很近的,是XR设备。您看好XR吗?为什么?

戴若犁:其实我们一直认为,智能终端还在不断地完成迁移。XR领域上来讲,我和行业里边的很多进行过深度思考的人,比如SVVR的前组织者Karl Krantz,比如细红线科技的创始人罗永浩都讨论过这个问题。

首先我们认为,AR的前景很好,第一代通用的to c的产品出来的时候,它有很大机会可以抢走手机50%到60%以上的屏幕时间和开屏的次数。比起VR,AR更偏向于碎片化和常态化的全日佩戴使用;相比手机,AR是一个随身佩戴的“智能器官”,在交互上要简化得多。

比如说你面对一个阿拉伯语的菜单,一般大家是掏出手机、解锁、打开一个APP、拍一张照片、翻译、再去和waiter去沟通;但是如果是一个基于AR原理的 always on 的头戴式设备,你的做法则是直接阅读,所以这两件事情一个是用一个工具来解决我的问题,另外一个是一个智能器官,增强了我本人的能力,所以这两件事情其实是有质的区别的。

但同时,我和罗老师一致的意见,是认为AR设备现在最大的问题,是产业链还不够成熟。而从另一方面考虑,如果产业太成熟,对于小公司也就没有机会了。

雷峰网:诺亦腾作为一家已经创业了十几年的公司,要推XR作为新的增长曲线,能感觉到阻力吗?

戴若犁:首先诺亦腾作为一家成熟的企业,我们并没有确定的决策会投入做XR,更好的理解是XR是我的个人兴趣,我会用力所能及的资源支持和参与这个浪潮,阻力肯定有的。毕竟要做新曲线,就要把里面的一些资源分出来,去做新的方向。2016、17年的时候,我们也尝试过这个方向,投入了不小的资源去做 to B 的VR解决方案,但没能把市场做起来。

但XR这个方向我还没有死心,我们还是在等一个机会,同时储备自己的力量。我个人认为,XR这件事就是长跑,特别是AR赛道——长跑不怕慢,怕的是掉队。

我们的态度是,要在牌桌上待着,如果从牌桌上掉下来,就再也上不去了。

本文作者董子博,VX:william_dong,欢迎交流。

雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说