天天看點

諾亦騰 CTO 戴若犁,和動作捕捉的十年

作者:AI科技評論
諾亦騰 CTO 戴若犁,和動作捕捉的十年

十年過去,動捕行業也有了“中年危機”。

作者 | 董子博

編輯 | 岑峰

2011年夏天,深圳的氣溫又是屢創新高,毒辣的陽光灑在瀝青路上,甚至能把膠鞋的鞋底燙化。

在南山蛇口的創業大廈,戴若犁已經創業了2年多。他、劉昊揚,和其他幾位合夥人一起,在一塊不大的辦公區域裡,圍着一張堆滿了裝置和原型機的辦公桌,常常工作到深夜,才汗流浃背地回家。

創業第二年,戴若犁全家早從香港遷到了深圳。戴若犁的太太,原先在香港某家投資銀行就職,在戴若犁開始創業後,也放下了優渥的待遇,陪着丈夫來到深圳蛇口,家的不遠處,就是停靠在六灣海濱的明華号。

而在2011年,比起一個企業家,戴更像一個極客:他和幾個合夥人,還有一兩個員工,隻知悶頭開發,不去融資,也不領工資,他們研發的動作捕捉技術,幾年内也看不到産品變現的未來,家底再厚,也架不住“隻出不進”。

為了支援丈夫創業,戴若犁的夫人想到了自己手頭的金飾——是自己在結婚時,從父母那裡得到的禮物。

兩人略一商量,一狠心,典當掉了其中不少金飾,加上手中還存着的一些現金,總算是有了能夠支撐一年的生活費用。

到了今天,戴若犁聯合創始的公司——諾亦騰——已經在動作捕捉賽道上排在前列,讓一個中國名字在世界範圍内如雷貫耳。

十多年後回憶起這段往事,對過去曾走過的艱難,戴若犁似乎早已雲淡風輕,“好在我們很快做出了第一代産品,融到了資,也知道給自己發工資了,這才沒再賣一次金子。”他笑道。

然而當時究竟是何等心境,隻有戴若犁自己才清楚,如人飲水,冷暖自知。

2021年,元宇宙概念爆紅,讓不少圈外人注意到了動作捕捉技術,在未來互動中重要的作用。

有人會說,不少行業等了這麼多年,終于等到了元宇宙的“風口”。而十年裡,戴若犁見到了太多市場的起起落落,早已波瀾不驚。

十載積累,一朝功成,并非戴若犁和諾亦騰的故事——十年裡,他隻做一件事,就是讓動作捕捉技術落得更“低”,讓更多的人能夠通過動捕,實作更多的不可能。

1 “懵”過的10年學術生涯

1978年,戴若犁出生于湖南。他的父親是一名工程師,專業領域是飛行器結構強度設計。當時,成都飛機工業公司正向全國範圍内廣募英才,戴若犁的父親便舉家遷往成都。參與了目前列裝量最大的幾款機型的大量工作。

戴若犁自小就在這樣的環境裡長大,97年在成都九中高三畢業,成績排在全省前100名。戴的父母擔心兒子,在大城市玩物喪志,誤了學業,于是堅持他去一個小城市,一所治學嚴謹的高校讀書。

如果把北京、上海、廣州都去掉,中國剩下的理工科頂級高校,剩下的選擇不多,而在四川收分僅次于清北的中科大,就是其中之一。

“如果用一個字形容,我的學術生涯挺‘懵’的。”戴若犁道,“選擇之前似乎并沒想得太清楚,不過現在看起來結果都不錯。”

在中科大,戴若犁修的是力學與機械工程系——外人可能不清楚,在中科大,力學是一個與數學、實體、化學平行的專業,是中科大的第“五系”。而中科大的第一任力學系主任,正是後來提出了古早元宇宙概念“靈境”的錢學森。

大學五年時間白駒過隙,到了畢業,出身書香門第的戴若犁,選擇繼續去海外進修也算是順理成章。當時,要自費留學進修,大多數人在經濟上都有困難。于是,獎學金的多寡,就成了海外大學搶人的有力手段。

戴若犁在中科大成績也堪稱優秀,一番努力“套磁”後,海外offer拿了不少,但當時的他,甚至對高校排名都懵懵懂懂,拿到offer,就看獎學金有多少。

當時不少大學的offer,獎學金都大概在1000-1400美金不等,但香港中文大學,給戴若犁的獎學金開到了14000-15000港币。

要知道,大學5年,戴若犁的生活費每個月開始隻有四五百塊,到了大四大五,才又漲了一兩百塊錢。

“當年港币匯率比人民币還貴,從來沒見過這麼多錢。”戴若犁的心,就這麼一下飄到了香江河畔。

于是,大學畢業後,戴就遠赴香港,來到香港中文大學繼續進修自動化與計算機輔助工程。

在港中文,戴若犁第一次有了“睜眼看世界”的感觸:在中科大,大家很卷,但更多卷在基礎學術能力的建設上,力求一個“紮實”;而到了香港,研究則必須與世界前沿接軌,學生的眼界也必須更寬,争取的是“前沿”。

戴若犁在港中文一直讀到博士畢業,并且留校做了博士後,他當時的校友,在今天紛紛成為了中國科技界的中流砥柱:商湯科技的創始人,IEEE Fellow湯曉鷗,在戴若犁讀博士後的時候已經在港中文教書;另一位IEEE Fellow王鈞,就在戴若犁隔壁的實驗室,是華人地區最早進行神經網絡研究的第一批學者;而商湯今天的CEO徐立,也和戴若犁同期在校。

博士後出站後,不少人的選擇都是去高校謀一個教職,不僅穩定,而且不用太多思考,幾乎是水到渠成,順理成章。

然而,在象牙塔裡待了11年,戴若犁不想再“懵”下去了。

開始這麼想,還是在他完成博士論文的時候。《碳納米管複合材料在主動減震上的應用》,光題目聽上去就像天書:

“這麼細的内容,細分到全球,可能隻有4個人能百分百地讀懂你的論文——一個是你的師爺爺,一個是你師父,一個是你,除此以外可能隻有一個陌生人能讀懂。”戴若犁說道。

在科技界,戴若犁知道,有很多人,身處學術圈,正在用他們的研究,不斷地探索理論的尖端前沿——如果把人類的知識儲備比作一個袋子,那他們就是往袋子裡撿拾薪柴的人。

但與此同時,世界也需要有人,能從袋子裡拿出材料,把它們做成實實在在,對普通人和工業界有價值的東西。這是戴若犁更想走的路——一條把科技理論落進人間的路。

2 創業之路

緣起一塊晶片

2009年,戴若犁決心創業動作捕捉,正是碰上了這個行業一個全新的機會。

動作捕捉技術的發端,最早可以追溯到1915年的“轉描”技術——動畫師借由将提前攝錄好的人像,投影到畫布上,再将其逐幀拓寫下來,最終制成一部動畫。

早年間迪士尼的《白雪公主》、《愛麗絲夢遊仙境》,甚至還有中國的《鐵扇公主》等大量的動畫,都是以這樣手動“捕捉”動作的方法完成的。

40多年過去,動畫師李·哈裡森三世開發出了現代意義上的第一套動作捕捉系統——他将電阻縫在緊身衣上,并以此記錄人體的動作。到了後面,使用外骨骼的動作捕捉技術也應運而生。

盡管技術發展的速度不慢,但動捕的落地使用仍然是一個難以解決的難題。

在大制作的影視、遊戲行業,使用更多的是“光學動捕”手段,以大型攝像頭矩陣驅動,通過識别動捕演員身上的光學反射标記,來進行動作的捕捉。

光學動捕模式精度更好,但成本動辄巨大,場地、裝置、輔助團隊等等條件缺一不可,而整套系統使用起來也相當專業複雜。這也就讓光學動捕遲遲不能走出影視和遊戲行業,無法面對更大的市場。

而另一種模式——“慣性動捕”,則一定程度上犧牲了精度,換取了易用性。這種模式下,動捕演員的動作資訊不再被錄影機收錄,而是直接記錄在他們身上的可穿戴式傳感器上。無需攝像頭,這些傳感器直接記錄下自己的運動資訊,再根據算法,演算出演員全身或局部的動作,來實作動作捕捉的效果。

盡管相比光學,慣性動捕所需要的條件更少,但這種模式在當時也存在一堵“歎息之牆”——單個傳感器的體積如果太大,對于動捕演員來說必然是個負擔;傳感器價格如果居高不下,不少小公司就用不起。

在諸多因素限制下,動捕技術在當時,還隻是少數人的“玩具”;行業也比較封閉,沒有破圈式的傳播,行業增長也陷入了遲滞。

而數十年時間過去,晶片行業的東成西就,讓動捕行業也看到了新的可能。

直到今天,戴若犁還能記得一串代号——L3G4200D——這是意法半導體一款陀螺儀晶片的産品代号,被應用于IPhone3GS和不少其他的手機型号中。

原先的三軸陀螺儀,不僅價格很貴,而且尺寸巨大,還需要一大堆裝置進行驅動;而L3G4200D隻有4*4*1毫米,造價也被壓進了一美元以内。

“這個事情真的震驚了我。”戴若犁說,“動作捕捉技術能夠繼續在行業裡下沉,還是要感謝智能手機的發展。”

傳感器的發展,讓慣性動捕有了打開新市場的可能——傳感器更便宜、更易用,原先由光學動捕模式壟斷的行業,慣性動捕也能夠有了一席之地。在今天,不少小工作室、乃至虛拟主播,早就用上了動作捕捉的技術。如果未來有一天,普通人也能用上動捕技術,那麼人們用的,也很可能是慣性動捕。

地球的另一邊,在美國馬裡蘭州的巴爾的摩市,後來諾亦騰的另一位創始人劉昊揚博士畢業後,和他的導師一起在美開辦了一間公司,用計算機來進行橋梁的模拟分析計算,用傳感器技術監測樓宇橋梁的健康程度。接一些美國交通部排查大型基礎設施健康狀況,以及仿真模拟計算的業務。

而在2008年次貸危機爆發後,全美經濟跌進谷底,國内反而是一片欣欣向榮。看到這樣的形勢,劉昊揚便回國尋找新的機會。

經人介紹,戴若犁和劉昊揚成了網友,僅三言兩語,兩人都知道對方不是一般人物。後來,戴若犁從香港、劉昊揚從北京出發,終于在深圳“會師”。

在深圳上海飯店大堂的咖啡吧,戴、劉和幾個朋友促膝長談。激情湧動,他們決定開一間公司,公司的名字是Motion(意為動作)的回文——Noitom——也就是今天的“諾亦騰”。

3 To B “飲鸩止渴”

To C 下沉艱難

在深圳艱苦創業3年,諾亦騰獲得了投資,便一起搬去北京,在西城普天德勝科技園盤下一塊小地方,團隊從十幾人擴充到上百人。戴若犁直言,他有時還會想念原先公司規模尚小的時候,員工之間家人般的氛圍。

幾年過去,正是 VR 炙手可熱的時候。新的顯示方式,讓新的互動方式也獲得了更多的關注——VR讓人能用眼睛“直視”虛拟世界,那為何還要使用搖桿?人的“數字化”程度仍在加深,從《少數派報告》到《頭号玩家》,不少影視作品早已“預言”了XR的未來:搖桿互動的時代終将過去,動作捕捉終将“加冕為王”。

與VR一起成長,諾亦騰很快成為了動捕工業中的一顆新星,接的單子不少。就像前面說的,諾亦騰看到了動捕行業巨大的下沉空間,并在這個市場以更便宜、更易用的動捕裝置拿下了不少份額。2014年,諾亦騰推出了第一套全功能動捕裝置Perception Neuron,最便宜的一檔衆籌價格僅為200美元,比一款低配的手機也貴不了多少。

以輕量化的動捕裝置,諾亦騰很快在海内外收獲了大量的擁趸,并很快跻身行業的前列。

但戴若犁卻并不“開心”,相反,他開始感覺到了焦慮。

在一個智能硬體公司創業之初,To B生意往往是必選項。一方面,B端對成本的敏感程度更低,對于裝置的複雜度要求也更低——如果一家公司需要動捕技術,那技術貴不貴、好不好用,都不是第一性的問題。

同時,乙方的需求也更加定制化,讓科技公司不必花費太多時間,去考慮市場對于産品的回報,也不用為了讨好市場,進行迅速的疊代——拿人錢财,替人消災,幾乎不需要思考。

眼看着諾亦騰又要鑽進一個舒适圈,戴若犁卻警覺了起來:

“To B最大的坑,是需求——需求不是由産品開發人員定義,而是由甲方爸爸定義,他們的需求千奇百怪,當你解決了他們的問題以後,他們的投入就會下降。而在通用的解決方案上,我們卻很難有所積累。”

能在To B領域做出發展,軟體的機會大于硬體,尤其是SaaS服務,可以通過将産品子產品化的方式,在定制化的需求裡,積累通用化的經驗。如同Zoom的成功一樣,越是輕度、小而美的軟體産品,越容易跑通To B這條路。

但硬體公司不同——迷失在甲方定制化的需求中,很容易長期沒有技術沉澱,最後在供應量裡變成了一個元件商,止步于一個很細的領域,再也無法謀求增長。

盲目跟着甲方需求做B端是“飲鸩止渴”,而C端的路,走通也不容易。

戴若犁身邊不少人,經常問他,什麼時候能開始做C端産品。戴若犁心裡也知道,C端做不下去,并非因為造價太高、售價太貴——“即使諾亦騰的裝置免費送,我們目前也沒有能力,做成C端産品。”戴對雷峰網如是說。

戴若犁忘不了,2015年,任天堂曾向諾亦騰伸出橄榄枝,想邀他們去京都的總部一叙。戴若犁平素也是遊戲玩家,知道任天堂名号震耳,難掩心中興奮,于是叫上了諾亦騰美國分部的總經理中島洛克,陪他一同走一遭。

2006年,任天堂的上世代主機Wii正式面世,以雙傳感器運動感覺動作捕捉的互動方式,在遊戲主機市場強勢占領了半壁江山,據統計資料,銷量達到了恐怖的一億以上。

而任天堂找到諾亦騰時,Wii也正走向生命的末期,正在尋求新主機的開發思路。戴若犁知道,找到他們,就是為了評估他們的技術,是否适合被用到任天堂新一代的主機身上。

戴若犁和中島來到日本後,任天堂也相當重視——一個會議室裡擠了三四十号人,把諾亦騰幾乎所有的傳感器、穿戴方案、動捕技術的示範看了個遍。戴若犁甚至還專門設計了一套方案,用6個傳感器即可捕捉全身的動作。

示範結束後,戴若犁胸有成竹:“我當時覺得這把肯定成了,終于可以做To C了。”

而後面的故事,就不再是什麼秘密:任天堂最終沒有選擇諾亦騰的方案,但他們的新主機 Switch 面世後,再次掀起了市場持久的追捧。雙搖桿(還可以加上健身環、綁帶等外設)的設計犧牲了動作捕捉的精準度,卻保證了産品的易用性。

這也不禁讓戴若犁反思:“To C 一定要像任天堂這樣做,動作捕捉落不進C端,核心不是成本問題——中國人擅長數學,也擅長把東西做便宜。但即使把這套系統造價做進200塊以内,使用者也不願意在身上綁這麼多傳感器。”

無疑,今天的諾亦騰正站在一個十字路口上。公司創業已經走過十年,然而未來的方向,并沒有想象中那麼明朗。

戴若犁不想把諾亦騰變成一家單純的 To B “小公司”,在供應鍊裡負責“小而美”;但B端生意卻支撐着公司大部分的營收,要降到C端又絕非一日之功。

諾亦騰的“中年危機”,并不表現成是某種“生死難關”,而就潛藏在公司發展的“風平浪靜”之中——而一招不慎,就可能萬劫不複。

戴若犁知道,諾亦騰必須動起來了。

一方面,在B端,諾亦騰想求發展,就必須把觸角伸向天花闆更高的産業。

誠然影視特效、遊戲開發、動畫制作仍然是諾亦騰的基本盤,但在運動、健康、醫療等領域,行業對于動作高精度的追蹤、三維的可視化也有需求,同時,能夠覆寫更大的使用者群體,也更能幫助諾亦騰在B端獲得新的增長。

“十億規模的市場天花闆太低,我們就去找千億規模的市場,”戴若犁說,“這樣我們的可能性也就更大。”

另一方面,在B端做下沉,甚至要降到C端,還得把産品做的更易用,使用門檻更低。

在諾亦騰的美國分部,一位叫丹尼爾·誇卓的員工,平日裡做的都是售後服務工作。最早的時候,諾亦騰對于小B端的想象,是兩人一起工作的“小作坊”,一人負責采集動作,一個人來協助校準和采集。而在丹尼爾日常的客服工作中,他接到了不少回報:

“我身邊沒有人可以提供協助,你們的産品我一個人用不來。”

于是,丹尼爾就自己動手,利用倒計時、語音提示等方式,為裝置設計了一套單人操作的流程。方案交到戴若犁手上,最終也內建到了後續諾亦騰的裝置裡,在申請專利時,丹尼爾是第一發明人。

4 結語

創業路上,諾亦騰吃過苦:在B輪和C輪融資之間,公司的資金鍊一度面臨斷裂,創始人劉昊揚曾不得不将房産抵押,來周轉資金;

多少次,辦公室裡通宵達旦,戴若犁在算法和公式中推敲、求索。擡起頭,第一縷陽光早已刺破窗外的天空。

疫情當下,諾亦騰的全球化業務也嚴重受創。無論是人員,還是資金的流動,諾亦騰都收到了巨大的挑戰。自打疫情開始,戴若犁已經有3年沒有親自去過美國的辦公室,而零星出現的陽性病例,也讓辦公場所時不時封閉,辦公環境也受到很大挑戰。

疫情對海外市場的打擊也相當巨大:之前提到的,諾亦騰美國分部的總經理中島,新近又感染了第二次新冠,也在家裡躺了三周沒法出門。

“疫情之前,海外的銷售占所有銷售額的70%;現在,國内的銷售額占所有銷售的70%。”戴若犁解釋道。

回看諾亦騰的創業曆程,有人會說,諾亦騰創業太早,早期的VR1.0時代,諾亦騰的困局在于市場太小;而随着晶片、5G、AI、雲計算等基礎科技的發展,XR這個行業也在步入2.0時代——無論是從硬體,還是從生态角度上,XR又經曆了一輪“生産力”上的飛躍。而諾亦騰入局太早,也就走了太多不必要的彎路。

談及此事,戴若犁對雷峰網說:“如果晚個4-5年創業,應該不會有之前那麼艱難。現在的創業者,更深思熟慮,有些也更功利——哪裡熱,哪能拿到錢,就一股腦擠過去。而我們創辦諾亦騰的時候,雖然能跑出來的人很少,但創造力更百花齊放,當然成功率會低一些,死掉的公司很多。”

戴若犁的心裡,一直有理想主義的一面存在。2014年,戴接到了一通電話,來人名叫托比,是一個瑞士人,他想來諾亦騰工作。

托比是個不可多得的全棧工程師,他懂Unity,會做美術,了解虛拟現實和動作捕捉,還對傳感器技術如數家珍。而從2009年開始創業,動作捕捉和XR就是諾亦騰主要攻關的方向,也正是因為對諾亦騰正在做的事情感興趣,托比才鐵了心要來諾亦騰上班。

然而,戴若犁曾經婉拒過他——當時二人還是網友,托比人在瑞士,通過Skype和戴若犁聊了很久。

但在2014年,“線上辦公”還隻是個遙遠的夢想,盡管知道托比的才能過人,戴若犁也不敢貿然招他入職。

而當戴若犁第二次接到托比電話的時候,後者人已經在北京了。

戴則是心裡一驚,因為他知道,托比是個殘障人士——他小時曾經得過小兒麻痹,行動非常不便,他孤身一人來到中國,得吃多大的苦?

托比則是相當簡單:諾亦騰在做的事情,讓行動不便的他,也能享受到在草地上自由奔跑的樂趣。是以他必須投身到這個事業中來,并且要把自己的名字留在上面。

也是這樣的激情一直激勵着戴若犁,讓他知道,自己在做的事情,是有價值的。

以下是雷峰網與戴若犁對談的采訪實錄,其中涉及了“元宇宙基建”、雷峰網在不改變原意的情況下做了精選和整理:

雷峰網:元宇宙當下的發展态勢,是諸多領域齊頭并進,共同發展。您認為,動作捕捉技術在元宇宙建設中,扮演了一個怎樣的角色?

戴若犁:動作捕捉技術,在元宇宙這個概念裡面,屬于一個基礎建設級别的技術。簡單的說,其實元宇宙不必像紮克伯格所說的那樣,所有人都生活在一個虛拟的時空裡——元宇宙的關鍵,還是數字化的程度。

如果要将實體世界數字化,人的數字化是必不可少的,因為元宇宙到最後還是人機互動,除了個人提供一個Avatar(化身)以外,元宇宙還是要提供一個人機互動的載體。而除了語言、圖像,肢體語言和動作、表情、手勢都相當重要。

雷峰網:那您認為,要讓動作捕捉技術在元宇宙開花結果,會是怎樣的形态?

戴若犁:我覺得動作捕捉技術,如果真的要開花結果,還是在C端裡,能夠可以作為一個基礎建設的存在。

在C端能作為基礎設施,需要的是一個平台化的方案,來把人進行數字化,進而完成可視化和人機互動。

雷峰網:提到互動,往往被認為和動作捕捉關聯很近的,是XR裝置。您看好XR嗎?為什麼?

戴若犁:其實我們一直認為,智能終端還在不斷地完成遷移。XR領域上來講,我和行業裡邊的很多進行過深度思考的人,比如SVVR的前組織者Karl Krantz,比如細紅線科技的創始人羅永浩都讨論過這個問題。

首先我們認為,AR的前景很好,第一代通用的To c的産品出來的時候,它有很大機會可以搶走手機50%到60%以上的螢幕時間和開屏的次數。比起VR,AR更偏向于碎片化和常态化的全日佩戴使用;相比手機,AR是一個随身佩戴的“智能器官”,在互動上要簡化得多。

比如說你面對一個阿拉伯語的菜單,一般大家是掏出手機、解鎖、打開一個APP、拍一張照片、翻譯、再去和waiter去溝通;但是如果是一個基于AR原理的always on的頭戴式裝置,你的做法則是直接閱讀,是以這兩件事情一個是用一個工具來解決我的問題,另外一個是一個智能器官,增強了我本人的能力,是以這兩件事情其實是有質的差別的。

但同時,我和羅老師一緻的意見,是認為AR裝置現在最大的問題,是産業鍊還不夠成熟。而從另一方面考慮,如果産業太成熟,對于小公司也就沒有機會了。

雷峰網:諾亦騰作為一家已經創業了十幾年的公司,要推XR作為新的增長曲線,能感覺到阻力嗎?

戴若犁:首先諾亦騰作為一家成熟的企業,我們并沒有确定的決策會投入做XR,更好的了解是XR是我的個人興趣,我會用力所能及的資源支援和參與這個浪潮,阻力肯定有的。畢竟要做新曲線,就要把裡面的一些資源分出來,去做新的方向。2016、17年的時候,我們也嘗試過這個方向,投入了不小的資源去做To B的VR解決方案,但沒能把市場做起來。

但XR這個方向我還沒有死心,我們還是在等一個機會,同時儲備自己的力量。我個人認為,XR這件事就是長跑,特别是AR賽道——長跑不怕慢,怕的是掉隊。

我們的态度是,要在牌桌上待着,如果從牌桌上掉下來,就再也上不去了。

賽道進入“後元宇宙”時代,浮沫被撇清,技術沉向實處。雷峰網長期關注元宇宙基建領域的優秀技術創業者,還有他們背後的故事。本文作者董子博,VX:william_dong,歡迎交流。

繼續閱讀