文章來源于投稿
作者 | 費越
總體上對Vision Pro産品怎麼看?
Apple Vision Pro釋出會後很多人的興奮程度不亞于2007年人們看完iPhone 1代釋出會後的興奮程度。總的來說,Apple Vision Pro是一個非常非常蘋果風格的産品。Vision Pro和其它XR頭顯所強調的東西完全不同:并沒有強調沉浸式遊戲,而是和蘋果曆史以來一貫所強調東西的非常一緻:那就是面向普通消費者,面向普通人。
因為Apple Vision Pro釋出會上所強調的核心應用,給使用者的‘核心價值’,是3個:1. Entertainment – 影音娛樂, 2. Socializing –社交通訊,3. Productivity – 相容大量已有的2D應用。
圖示
如果對比2007年iPhone 1代的釋出,會發現驚人的類似。 iPhone的3個核心價值主張是一摸一樣的: 1. iPod - 影音,2. Phone/Face Time -通訊,3. Internet Browser - 相容大量已有的應用(在2007年的時候還沒有App概念。一個一個的網站,比如Amazon,Facebook,微網誌,就是一個一個應用)。
圖示
是以,Vision Pro和iPhone 1釋出會上的核心應用是一模一樣的3個:
圖示
并且保持了蘋果一貫的釋出會上‘事不過三’的原則,消費者的大腦無法記住超過3個重點。
除了上面3個核心賣點,Vision Pro和iPhone釋出會上提及的第二級附屬功能也是驚人的完全一緻:1. 為此新平台專門開發的新應用,2. 拍照和看照片(内容生産,UGC)
1.為此新平台專門開發的新應用。iPhone 1 對比 Vision Pro:
圖示
圖示
2. 拍照和看照片(内容生産,UGC):
圖示
把AVP釋出會上對産品的所有價值主張和iPhone一代釋出會做個對比:
圖示
是一模一樣的。由此可見蘋果對消費者核心需求的了解和實操保持了相當強的一貫性和一緻性。因為普通人是普通的生活方式。人們希望能夠輕松快樂的:娛樂,工作,溝通,創作。
圖示
蘋果這次很踏實,并沒有标新立異的對一個新硬體創造出一套新奇的需求體系。這是由于蘋果對消費者最重要的,最本質需求的深刻了解:消費者是同樣的消費者,不要試圖用花活把消費者改造成适應新技術的新人,而是要讓技術适應人。
有人這樣類比:之前的VR頭顯的設計是滿足一群奇怪的人“能那種家裡來了客人正在聊天,他自己卻鎖起門來玩10個小時遊戲的那種怪人”,而Vision Pro滿足的你我他,所有正常人。
VR是否應該從遊戲機開始做?
過去的幾年大部分VR公司都把産品形态收斂為‘遊戲機’,包括HTC,Oculus等。
這并沒有錯,因為VR的技術水準和體驗隻能滿足‘遊戲機’的使用者體驗要求。
這和個人電腦發展曆史非常相似:當電腦進入2C市場的時候,首先被做成的也是遊戲機,1972年Atari,而2C的個人電腦形态1977年才出現,Apple II。
随身的移動電腦的發展也類似,首先出現的産品也是遊戲機:2004年的PSP (PlayStation Portable), 同年Nokia釋出了遊戲機手機N-Gage(不知道有多少人記得),2005年的Nintendo DS。
圖示
圖示
2007年才出現的通用型的移動計算機:iPhone。
是以在技術水準達不到成為2C計算機形态的時候,往往首先能夠滿足遊戲機形态。那麼就先做遊戲機是合理的選擇,能夠做出成功的産品,比如Oculus Quest 2。
為什麼其它VR頭顯都是主攻遊戲,而蘋果并沒有做遊戲機?
因為蘋果是一個2大C的公司,想要做新的計算平台服務大衆消費者。本質問題是:能否先做遊戲機,然後過度和更新成為‘計算平台’型的産品?
從曆史中看,做出了成功遊戲機品的公司都并沒有轉化為做通用形計算機。比如Atari,Nintendo FC,SONY PlayStation…以遊戲做為出發點的裝置并沒有在未來成功演化為通用消費裝置。
我認為VR也是這樣,遊戲機雖然從曆史和市場角度是個好産品,但無法以此為基點演化為通用消費裝置。因為設計一個通用消費裝置需要全身心的投入,design from ground up,不做任何妥協。就像油改電是無法做出好的電動車。做通用型計算平台比做遊戲機更難,更需要時間和耐心,但回報也是巨大的。
其本質原因是什麼?不知道。可能的原因是:要做一個成功産品,其組織管理,團隊成員的能力,和文化一定是高度的适合這個産品。原因是,成功是極為困難的,成功的産品需要團隊100%的投入和專業化。産品和團隊是互相打造的,一個産品是公司人員,管理,文化的直接映像。同樣的團隊再開發一個完全不同類型的産品,團隊的意願很小,能成功的可能性很小。
有個說法是,對于創業團隊 “you can pivot, but you can’t hedge”:如果發現産品或商業模式的方向不對,那麼全員轉向新的産品和商業模式并100%的投入進去,是可以的;但絕不能腳踩兩隻船,同時平行做多個不同的東西投機。
Facebook的Oculus團隊原本是個很純粹的遊戲團隊,對于如何遊戲化的設計整個硬體軟體産品有豐富經驗。Quest 1,2是專注而成功的。但Facebook的野心不滿于此。後來混入了做網際網路的人,和來自蘋果的做2C消費電子産品經驗豐富的人,其産生的Quest Pro是一個四不像産品。
為什麼蘋果Vision Pro這麼重視VST?
蘋果把VST的品質放在産品中非常高的優先級。在2018年就收購了做VST頭顯的公司VRVana(頭顯産品Totem)。
圖示
因為蘋果對使用者有比其它廠家更加深刻的洞察力。對于‘VR難以被大衆接受的最大原因是什麼?’這個問題,通常的回答清單會是:
- 穿戴不舒适
- 眩暈
- 沒有好内容
- 視覺感受不好(不清晰,沉浸感不強,VAC問題…)
- …
這些實際上都是錯誤答案。真正最重要的原因是:看不見真實世界的VR模式是和人類(任何動物)億年進化出來的生物本能相沖突的。使用者心裡永遠會有不安全感,隐藏在内心深處。
uSens和VRVana都是在~2016年的時候把雙目RGB相機VST定義到了2C的頭顯上,是世界上最早定義VST頭顯中的。因為當時同樣認識到了VR的最大問題在哪裡,并且認識到了VST能夠開啟的AR大門,實作‘讓人獲得把不可能變為可能的超群能力’。
uSens的Impression Pi頭顯配置更接近Vision Pro:
- 雙目RGB相機 + 深度相機, 做VST和環境3D重建,SLAM
- 2xIR相機和IR LED做3D手勢互動
- 無線一體機
圖示
蘋果不做使用者問卷,不請外部專家來做評審,因為最重要的原因往往隐藏在使用者心裡,使用者自己都不知道,知道也會掩飾不說。是以這是靠問卷訪談得不到的。
蘋果的洞察能力明顯優于其它公司,不光從VST硬體和性能上的投入力度,從2個方面也能看出來:
- UI和應用都是VST優先,而不是VR優先。
- 專門做了硬體旋鈕用來無極控制VST的程度。
圖示
尤其是第二點。因為蘋果洞察到,哪些東西是使用者一定要感覺自己有100%把控能力的。這些東西,如果使用者不能100%把控,内心就會有極強的不安全感,那麼産品就會出大問提。
VST就是這種使用者從心理層面必須覺得自己有100%成功率的立即控制能力的,否則使用者就會産生極大不安全感。這種不安全感就是VR的最大障礙。是以加了硬體按鈕。
就像手機的靜音實體開關,Android手機都去掉了這個開關,而iPhone至今還保留了這個實體開關。蘋果第一個摒棄了實體耳機插孔,但最後一個去掉靜音開關。因為蘋果不是靠複雜的功能和能力,而是重視人的心理狀态。
Apple Vision Pro和Meta等公司頭顯的核心差別是什麼?
有人開玩笑,說VR,AR裝置是占領使用者的臉,簡直就像 Alien vs. Predator
圖示
蘋果不提XR/MR/VR,回避了産品是不是‘占據使用者的臉’。Vision Pro這個産品的真正意義是:
1. 占領使用者的視覺
産品名‘Vision Pro’揭示了這一點。
2. 占領整個空間世界
把産品類别叫做‘Spatial Computing’ 說明了這一點。
3. 占領時間,讓人成為4維生物
‘3D照片,3D視訊’是其最讓所有人感動和喜愛的功能,本質是實作‘占領時間’。
Vision Pro這個硬體産品隻是一個表象而已,這個産品實際上并不算完美,它不是蘋果的目的,未來肯定會進一步演化。要看的是實物的本質:蘋果的核心演進方向是 1. 占領使用者的視覺,2. 占領整個空間世界, 3. 占領時間。
Vision這個名字取的不錯,它實際上蘊含有幾個意思:1)圖像,視覺效果;2)視野,眼界;3)想象力,對未來的前瞻性;4)幻象,夢幻。是以,是個很好的産品名。
蘋果把産品名定為‘Vision’,把品類名定為‘Spatial Computing Device’ : ‘空間計算機’。
蘋果抓住的是1)人性化,人的感受和需求, 2)對未來的深刻了解。這是蘋果和Meta等公司的最大差別。
其3D拍,3D看,就像電影‘Eternal Sunshine of the Spotless Mind’中講述的: ‘如果可以忘記,如果已經不能不忘,我仍不甘心,要将你藏在記憶的最深處,在必須遺忘的最後一刻,還要留下再次相見的暗語。’
uSens在2015~2018年也定義和研發了頭顯産品: Impression Pi。它的設計和定位與Apple Vision Pro非常類似。
對産品的命名,品類的命名方式也和蘋果類似。 uSens 把産品名定為‘Impression’,把品類名定為‘Super Reality Device’ (‘超現實計算機’)。Impress一詞和Vision很類似,深層的意思是: 1)外觀,畫面,視覺感受;2)和‘印象派’畫的本質一樣,重要的是捕捉稍縱即逝的環境,建立深度、運動的感覺;3)一種‘印象’,‘感受’,和‘情感’,一種‘内心深處的記憶和表達’,而不是表面的圖像而已。一個好的産品,從内到外應該是一個藝術品,給人帶來的是情感,就像印象派畫一樣。
圖示
蘋果和uSens的共同點是,認為這個新産品的本質是:
1)讓數字資訊變得無比真實,
2)讓真實世界變得更強大和美妙,
3)讓數字資訊和真實世界合為一體,成為一種新的超自然‘現實’。
Apple 和 Google 的差別是什麼?
兩家公司在文化上有本質性的巨大差別。從一個簡單的例子就能看出,兩家公司在AR方面都有多年的算法和應用生态的布局,Apple做了ARKit(ARKit也是Vison Pro産品裡的核心視覺算法之一),Google做了對應的ARCore。
Apple對ARKit的概括語是:“Change the way you see the world, Realistic and immersive experience.” – 改變你看這個世界的方式,達到真實和沉浸的體驗。
Google 對ARCore的概括語是 : “Make Physical world acquire Digital attributes, Make the world your digital canvas.” – 讓實體世界獲得數字屬性,讓世界成為你的畫闆。
能看出來,蘋果隻講人,隻講體驗。Google隻講物,隻講功能。這就是兩家公司在文化上的本質差別。蘋果是體驗第一,藝術第一,完美第一。Google是功能第一,而體驗和藝術感完全沒有,所有東西都像兒童的卡通玩具。
當時uSens也對其産品和公司目标的概括語是:“Realize your dreams, make impossible possible.Make the digital world as real as possible, and close the gap between the two.”“讓你實作夢想,把不可能變為可能。讓數字世界和實體世界一樣的真實,并且讓兩者融為一體。”這個文化和蘋果的更接近一些。
但是要注意到,上面三種對XR目标的描述都有重大缺陷:都沒說出來這個東西有什麼用?講體驗也好,講功能也好,都是空洞的。對使用者來說到底有什麼用處,解決什麼問題?誰都沒說清楚,因為誰都沒想清楚。這是XR的最大問題。它很酷,但它有用麼?
改變人的生活方式 / Changing people’s Lifestyle 可以讓一個新裝置成立
實際上蘋果對于一個新裝置成不成立的評判标準是:這個裝置是否能改變人的生活方式(Change people’s Lifestyle)。如果能夠給使用者一個某些場景下更好,更舒适愉悅高效的生活方式,那麼這個新産品就是成立的。
比如iPad,它對比iPhone沒有任何新功能。但是它能滿足一個新的生活方式:
圖示
Apple Vision Pro也是一樣,能夠在某些情景下讓使用者可以放松,安逸,享受,沉浸。這是現在任何一個裝置都無法給人的‘生活方式’。
圖示
Vision Pro的創新點之一:3D大自然環境,多應用在3D空間中排布
圖示
這個設計,2004年Sun Microsystem和我的創業公司Infinite 3D同時提出和實作了,release了beta版。這兩個産品的目的是實驗,實驗消費者的反應。Sun的系統,可以把Sun OS變為3D OS,所有已有2D應用都相容。Infinite 3D系統把Windows變為3D OS,相容所有已有2D應用。并且帶有1)環視的3D大自然環境,2)也可以一起運作遠端其它計算機上的應用,3)新的3D app的framework, 3D UI。當時這個系統,就是為了未來在真正的XR頭顯上運作的。當時選用的環視3D自然環境是祖國自豪的珠穆朗瑪峰頂。
Sun Microsystem - Looking Glass
圖示
Infinite 3D
圖示
圖示
3D Launcher的設計,後來也出現在了2008年的Mac OS上:
圖示
這種‘空間計算’,‘3D UI’ 給使用者帶來的好處是:
1) 解決應用太多,桌面過于擁擠的問題
2) 讓人真的能夠随心所欲的多任務;讓多應用和人之間可以更高效的協作
3) 利用人與生俱來的3D記憶能力,3D空間感和方向感,更好的管理資訊
4) 新的拟物的3D應用UI,使其更加自然,易懂,易操作,高效。
那為什麼沒有把它放到uSens的頭顯和後來做的其它頭顯裡?因為頭顯的分辨率一直不夠高,無法讓使用者達到這個産品功能所‘宣稱的’要給使用者帶來的好處,那麼就不要上線這個功能。
而蘋果Vision Pro的分辨率領先其它産品首先達到了足夠的高度,終于可以讓使用者滿意的得到我們所宣稱的東西了。
如果對使用者做了一個promise:這個産品功能有多好,有多麼有用,那麼産品一定要deliver the promise,否則就不要上線這功能。如果欺騙使用者,就是欺騙自己,産品一定會吃灰。不要抱僥幸心理。
手眼互動為什麼這麼神奇?
因為
1. 眼睛的運動比手更快,更準。
視覺資訊占大腦處理資訊的80%,是以眼睛的轉動速度,精度,延遲對生存來說極為重要,眼睛也是距離大腦最近的器官。實體上講,控制眼睛轉動的肌肉和手臂連杆結構相比簡單直接得多,轉動慣量也小,是以和眼睛比手的尋址運動快得多。
圖示
并且眼睛是心靈的視窗,任何細微的思緒往往難以逃過在眼睛上的反映,更進一步的挖掘眼睛的圖像可以做到對大腦思想的分析。
觸摸屏互動:從大腦下達了指令到手運動到了目标位置有100ms以上的延遲,而觸摸屏本身再加~80ms的延遲。而眼睛本身響應大腦的指令到運動到目标隻有~50ms延遲,眼動系統~15ms延遲,遠快于手部互動。
2. 因為眼睛的運動并不是使用者的額外負擔。
不管你用什麼其它的互動方式,不管是滑鼠,觸摸屏,還是手勢,實際上你的眼睛反正都要先去看你想點選的UI控件,然後再移動手。
手的動作是人要額外努力去做的動作,不是必須的行為;而眼睛的動作不是額外的,是下意識裡就已經完成了。是以,使用者從習慣了用手互動轉到用眼手結合,會有前所未有的‘讀心術’的感受:“這個系統怎麼會這麼快?大腦想什麼就能立刻實作什麼?”。
實際上不是眼睛太神奇,而是手太慢。我們原先習慣适應了非常緩慢的手部尋址互動,而不覺得它慢。是以,這也印證了蘋果經常說的:不要搞使用者調研,不要問使用者他有什麼痛點,因為使用者已經麻痹了。必須把新東西做好了,擺在使用者面前,使用者才會明白。
這個手眼互動方式和軟硬體系統,2011年我在矽谷的松下研究中心(位置就在現在蘋果總部旁邊200米的地方)就已經實作了。并發現了這種‘手眼結合’互動的神奇感受,這是最佳的互動方式’。
圖示
當時眼動系統采用了Tobii和SMI的方案。後來Tobii于2014年上市,而2017年SMI被蘋果收購,支撐了蘋果的Vision Pro産品。
既然,手眼結合的互動不是‘新鮮事’,為什麼在其它頭顯沒有采用?
1. 松下的模式是:把研究結果放到‘保險箱’裡,等未來有客戶有需求了就拿出來。但客戶不懂人機互動,怎麼知道自己有這個需求呢?但至少松下有專利保護,也不算白做了研究。
2. 這個互動方式的優秀性也有不少人直接憑空就能想到。比如國内造車新勢力中的一家,2019年的時候其創始人就直接想到了在汽車中使用這個互動方式,并希望uSens能幫助其實作。對他的感悟力我感到欽佩。但需要眼動達到極高的精度和靈敏度,會讓公司在投入的資金,和時間需要的等待方面望而卻步。因為這是一個長期的,并需要冒險進行領先整個業界的投入,而不是簡單購買一些子產品拼湊出來。
3. 而蘋果,收購了SMI之後能夠内部和硬體,光學,傳感器和算法等多部門合作,做垂直的整體優化。是以能夠達到足夠的精度滿足産品需要。這就是下面要說的,蘋果“不做拼湊式創新”,因為這是不可能的。
4. 其它VR公司在做‘遊戲機’方向,是以成本控制極為嚴格。并且6DoF搖桿和沉浸式遊戲進行互動是重點問題,如何和UI改進互動不是重點要解決的問題。手-眼互動方式不是萬能的,并不适合沉浸式6DoF遊戲
蘋果的手勢互動為什麼這麼好?
蘋果采用了紅外相機并帶有紅外補光,這樣圖像的品質和穩定性更高,可以達到更魯棒更精确的手勢識别效果。
而這個硬體方案Leap Motion和uSens在~2013年就發明,并在~2018年通過深度學習的算法達到了非常好的産品級效果。
圖示
圖示
但現在的其它頭顯為什麼都沒有采用?比如,HTC Cosmos等用的是VST的雙目RGB相機,Quest 2和Pro用的是SLAM的灰階相機。因為這些頭顯都在拼遊戲機市場,陷入了成本内卷,為了最低的成本,讓手勢成為二等公民,複用專門為其他目的而已經放在了産品上的相機。
蘋果追求極緻的手勢效果,是以采用了這個方案。說明産品經理,和上下全鍊路整合優化起到了關鍵作用。和眼動一樣,特殊的硬體,加上算法,才能達到‘神奇’的效果。
說個題外故事,
2013年Leap Motion去矽谷某家大公司談合作,大公司裡的人對其嗤之以鼻:“你們隻是兩三個毛孩子而已,我們有幾百個算法方面的專家博士,你們的手勢效果不過是騙人的‘障眼法’而已,我們分分鐘就能做出來。”
2016年uSens參加一個專家評審,當時uSens已經能夠在高通800移動晶片上實時50fps運作,并且能夠處理各種3D自然手勢。專家也是很資深做得領先的大學教授,說:“你們是騙人的,我們最先進的學術狀态也需要在桌上型電腦Nvidia的GPU上才能跑個30fps,而且無法覆寫各種自然手勢。你們就是騙錢的,都是假的。”
為什麼Leap和uSens能夠做到别人不能相信的東西,原因和蘋果一樣:産品思維。需要從相機硬體,到算法,到執行器做垂直的全鍊路優化,和全鍊路創新。比如,使用紅外照明:讓困難的手勢識别任務變得簡單而且更精确,用巧妙的方法獲得優勢,而不是隻憑在模型上下蠻力。
Leap的CTO David Holtz後來做了Midjourney,也是一樣,其效果令人驚歎‘簡直是不可能的’。他是如何做到的我想應該一樣,創新:用各種巧妙的方式解決問題,而不光是蠻力。
蘋果的員工對蘋果的評價是喜憂參半:“蘋果的産品能力非常強。但蘋果在research(前沿的科研)方面薄弱,和Google,Meta相比差很多。”這個評價是中肯的。
蘋果的核心到底是什麼?和其它公司的最大不同點是什麼?
蘋果的特點,或者說秘訣,有3個:
1. 公司從上到下的文化:我們是一家消費電子公司
2. 産品經理有絕對話語權
3. 深刻認識到什麼是‘創新’
1. 蘋果從上到下一貫堅持的就是:“我們是一家消費電子公司,做面向大衆的消費計算機産品”。這個定位在喬布斯重新上位之後明确了,并且毫不動搖。
2. 産品經理有絕對話語權。研發人員在努力創新,努力工作,打造極緻的技術和産品。但做的東西什麼時候能上線,他們永遠不知道,有時候感覺永遠在等待。隻有産品經理能決定這個功能是否做得足夠好,;這個功能是否和其它功能結合在一起給使用者優秀的價值。隻有滿足這些了,功能才會上線。産品經理對體驗和價值有極高的要求,和時間點的良好把控。
3. 對什麼是‘創新’的定義。
Tim Cook接受GQ雜志的采訪曾經說過:“Apple looks to make a significant contribution and own the primary technology when entering a market, as that is how innovation happens. Apple isn’t interested in simply putting together pieces of someone else’s technology.”
蘋果如果要進入某個市場,那一定要做出重大貢獻并擁有核心技術,因為這才是真正的‘創新’。不會僅僅把别人的技術拼湊在一起,蘋果對這樣的做法不感興趣。
蘋果的定位是高端?是貴?
我覺得這是誤區,沒有把因果關系搞清楚。貴和高端隻是表象和結果,而不是本質和原因。
喬布斯曾經在被采訪的時候回答過:“蘋果對産品的要求是:做一個産品,就要讓這個産品好到自己會毫不猶豫的推薦給家人和朋友們。”“而不要像有些公司,為了降低成本而降低品質和省去必要的功能。功能需要完整,蘋果不能去賣那種缺失了功能的垃圾。”
是以蘋果隻是不想賣‘垃圾’而已,造成的結果是産品看起來比較高端,比其它公司的産品貴。當然,各公司對什麼是‘垃圾’的衡量标準不同。
但我認為,最底線的要求是‘deliver the promise’:設計的時候想要達到的産品價值和想向使用者提供的功能,最終在産品裡是否真達到了使用者能夠認可這設計價值的程度?
比如,Hololens的promise是,能夠提升人的生産率,能夠玩好玩的AR遊戲。它Deliver了這個promise麼?沒有。
有人說,Vision Pro沒什麼,裡面的所有功能在其它頭顯裡都找得到…
明顯的酸葡萄說法。在iPhone 1代推出之前Nokia已經推出了N95。N95的功能和配置應有盡有,沒有什麼功能是iPhone沒有的。還有更好的相機硬體,賣更高的價格:
圖示
但相比iPhone,N95的每個app都醜陋,東拼西湊。整體的UI和互動缺乏美感,缺乏愉悅,使用不便。
是以,Vision Pro和其它XR産品的差別不在于功能,而是在于設計。而設計觸及到的是人的靈魂。
最前面也做了對比,Vision Pro釋出會上所重點宣導的所有功能點和iPhone 1釋出會上的都甚至毫無差別。是以創新在于藝術,美感,情感,生活方式。
從深層次思考,Vision Pro賣的是:藝術,感情,‘時空機’,讓不可能變為可能…
賣的是情感,不是功能。賣的是一個新的‘生活方式’。
在UI中使用光影,動畫,可以表達‘情感’。
比如OS X登入界面,失敗的動畫,給人的感受是‘搖頭’,‘否定’。
圖示
蘋果産品裡的動畫大量是經過精心設計的,非線性的。而Google沒有仔細打磨,都是簡單的線性動畫。
這是我在2010年在松下矽谷研究院設計和實作了的3D UI系統,能看出其光影效果的使用,表達了輕松愉悅陽光,而每個icon的動畫,是拟人‘走向前鞠躬’,給使用者被尊重被服務的感受。
圖示
Apple Vision Pro的眼動設計包含了一個新設計:當使用者注視某個UI控件一段時間後,控件會顯示關于它的更多資訊。
圖示
當時2010年做的3D UI也有被使用者注視後,UI控件知道使用者對它感興趣,會自動顯示關于它的更多資訊。實際上其核心思想是:每個UI Element是‘活的’,要賦予其生命,它需要會表達感情,它需要自己知道如何和使用者互動。
圖示
HCI的進化方向:智能的生成式的HCI
上面,在2010年的工作,已經認識到UI的發展方向是:UI(計算機)應該是不停的觀察使用者,自主的了解使用者,自主的向使用者‘表達’。也就是:智能的,生成式的UI。
GPU/高性能計算,經過了3個時期,每個時期提高了100x的算力,來解決确實需要100x算力才能解決的問題:
1. 3D圖形:
1998年至2012年是3D渲染蓬勃發展的時期,計算機可以做到把預建好的3D物體的模型變為很真實的圖像。
圖示
2. 計算機視覺(判别式AI):
3D渲染的逆過程是計算機視覺:已知真實圖像,想算出其背後的3D物體的模型。這個逆過程需要比正過程大100倍的算力。在~2012年之後變為現實,并蓬勃發展了10年。
3. 生成式AI (Generative AI):
判别式AI本質上是做選擇題。而生成式AI是做作文題,繪畫題。需要比簡單的選擇題高100倍的算力。
在2015年之後,Leap Motion和uSens都不約而同的開始采用深度學習方法的計算機視覺(判别式AI)解決3D手勢識别問題,并在~2017年達到了很好的可商業化的效果。
而在2017年之後,uSens開始認識到,下一個時代是‘生成式AI’的時代。在HCI方面,計算機将和人完全對等:表達能力上達到和人相同,可以有拟真的語音,3D面部形态,3D動作;了解力上達到和人相同:了解人的自然語言,了解人的舉手投足表情目光所有細節表現。我們将告别滑鼠-鍵盤-觸摸屏 的階段。人-機 完全對等:
圖示
蘋果Vision Pro因為其内置的感覺硬體,加上未來的算法完全可以達到這一點。但目前出于成熟度,和使用者的接受過程考慮,并沒有直接上升到這種互動方式。未來可能會演變到這一方式。
題外話,關于生成式AI和Leap Motion:
2019年之後uSens開始采用GAN的方式處理手部圖像資料,生成手部圖像資料,達到和真實圖像的‘alignment’,以假亂真。Leap Motion應該同期也開始研究這類生成式方法。2019年Leap Motion公司被收購後,美國公司把所有伺服器都賣了,CTO David Holtz離開了公司。他繼續在生成式AI方面研究,在2022年做了出大家現在都知道的MidJourney。
7. Vision Pro定價實在太高,Vision Pro會不會是一個叫好不叫座的産品?
實際上,花了如此高的成本,剛剛達到了MVP的最底線。實驗剛剛能夠‘開啟’。
最好的産品是既叫好又叫座,這極難做到,蘋果的之前每個新産品都做到了。這次,蘋果Vision Pro顯然做到了‘叫好’,是否能做到‘叫座’?
有人說Vision Pro沒有解決任何實際問題和需求。我認為,不要從功能角度思考問題。
如果隻是從功能角度,那麼iPhone和N95一樣,可能還不如N95,為什麼iPhone成功了?
如果隻是從功能角度,那麼Vision Pro和iPhone是一樣的,為什麼Vision Pro不能成功?
關鍵是體驗上的提升,而不是功能上的。
但Vision Pro的問題是便攜性的下降,使用場景的下降。是以它不會是一個叫座的産品。但是它會是一個‘分水嶺’的産品。
做一個類比:數字相機革命的過程。
一個重要的基石性産品是佳能D1s,2002年發售,$7999。它是第一個能夠從各方面(畫質,對焦能力,測溫能力,拍攝延遲,連拍速度,…)完全超越最先進的膠片相機的數位相機。
圖示
要完成從膠片相機,到數位相機的革命,不是有一堆低端的point and shot相機,想靠易用性來彌補劣質的像質就能完成的。這些相機給使用者帶來的是惡劣的感受,和慢慢的吃灰。
1Ds開始讓最專業攝影師都認可:如果不考慮價格和重量,數位相機是可以完全超越膠片相機的。這是一個分水嶺的曆史性時刻。相當于MVP:新的産品形态必須能夠真正deliver the promise。
然後2003佳能推出300D,$899。它的畫質和拍攝能力雖然不能超過最好的膠片相機,但是可以等同于大衆攝影師手中的普通SLR膠片機。
圖示
剛開始的時候大衆攝影師依然都是對數位相機還保持懷疑态度,但是凡是看過身邊朋友用300D拍出的圖像,和看到它的價格,立刻懷疑全部打消,毫不猶豫的下手買一台。數位相機開始被所有的攝影者所接受。走過了MVP階段,進入Scale-up階段。
是以,對比佳能的這段曆史,蘋果Vision Pro的做法也許并不是完全沒有道理。
Apple Vision Pro 會成功還是失敗?
蘋果Vision Pro作為面向大衆的AR Glass産品,剛剛達到了MVP的及格線(MVP:Minimum Viable Product / 最簡可行産品。),其使用者體驗剛剛能夠達到人能接受的最低标準,或者說,剛剛能夠‘deliver the promise’。 為什麼這麼說?舉兩個例子:
1)頭戴式産品對人産生了不便和痛苦。産品帶來的正向價值和美好體驗必須要大于痛苦才算是‘0’分,達到了最低要求産品狀态。蘋果Vision Pro可能剛剛到達這條線。而其它産品根本沒有達到。
2)宣稱的‘能夠在空間中放置多3D視窗,進行辦公’。Vision Pro的分辨率,VST延遲,剛剛達到能夠做這件事的最低限。而其它宣稱能做這個的産品根本沒有達到能用。
如此先進,優秀,複雜的産品,耗時7年,投入人力資金巨大,才剛剛達到MVP?
我覺得是的。這是創新的智能裝置和網際網路應用的巨大差別。Meta是網際網路基因,可能裡面很多人對此無法了解。
到了MVP這一步,整個故事才剛剛開始:來驗證驗證整個産品的想法,裡面所有hypothesis(假設)是否成立。來驗證整個“AR,VR是否成立的實驗”才剛剛開始。
在産品定義上,2016年uSens 的Impression Pi頭顯和Apple Vision Pro的相似度很高:
圖示
對于uSens沒能支撐到完成類似的産品,我并不遺憾。非常感謝uSens的投資人,他們對産品形态有着同的了解,他們同樣看到了“To大C的下沉浸式3D計算平台”應該是什麼樣子。但是在實踐中才發現,要實作這個MVP所需要的人力物力和時間遠遠超過了最先的估計,不是創業公司在幾年内能夠完成的。即使Facebook/Meta,微軟,做成這件事需要的時間和投入也都超出了他們的預想和承受能力。隻有蘋果才剛剛完成這個‘實驗的初步搭建’。
重要的不是蘋果Vison Pro這款硬體産品的成功失敗,而是整個空間計算這個想法的成功失敗。蘋果終于走到了實驗正式開啟的這一天。讓我們拭目以待實驗的結果吧。
Vision Pro是下一代計算平台的最佳形态麼?
我覺得顯然不是。
1. 價格和重量。同樣以相機為對比:大衆無法接受佳能1Ds,是佳能 300D真正讓高品質數位相機進入大衆時代。而且相機形态繼續發展,現在已經進入了新的無反‘微單’時代,才得以讓數位相機繼續scale up。
2. 使用時間和地點的覆寫能力。
人對計算機的追求是:1)人的數字資訊能力的提升,比如顯示和互動能力越強越好,2)裝置和實體世界的互動能力越強越好,3)能夠使用的時間和地點覆寫面越大越好,越靈活越好。
和已有的計算機(桌上型電腦,筆記本,手機)相比,Vision Pro在1)人的數字資訊能力是颠覆性提高,2)方面比手機并沒有太大提高, 而在3)方面是巨大倒退:
圖示
是以,Vision Pro不是最終形态。我們拭目以待的是:
1.類似佳能300D這種‘scale-up’型産品的釋出。
2.能夠在時間和地點覆寫面上有巨大提升。
最難的階段已經過去了,下一個階段的機會不光屬于蘋果,也屬于其它公司。有多種産品形态可以做;而且蘋果因為一些執念,其Vision Pro産品設計有不少’不正确’的地方,也是機會。
------ dark side of the moon -----
隐私問題,Apple vs Android
Vision Pro讓計算機真正成為四維空間生物,計算機從未如此真切的感受這個世界,和感受人類。
但同時這類産品是危險的。原因是1.對人的影響力,2.隐私。
1.對人的影響力
馬斯克推特裡的玩笑:“Apple Vision Pro提供的價值不就是幻覺麼?$20的買緻幻蘑菇就能做到”
圖示
這并不完全是玩笑。強大的增強現實技術可以對人的心理産生巨大影響。善意的應用可以用此技術給人愉悅的心情,給人正能量,改善人的心理狀态,讓人更專注,等等。而惡意的内容,可以用此技術獲利:比如讓人沉迷于低效資訊,改變人的購買行為,甚至給人不良心理狀态。蘋果的一貫作風,會對上線App Store的應用進行嚴格的管理,隻有對人有益的,正面的内容才能上線。
而Android是自由派作風,硬體商和應用商店商完全以短期利益,盈利和内卷為第一目的。大量不良應用不被管理。Android陣營會抄襲Vision Pro,但按照這些廠商的一貫做法,這種硬體會比手機對使用者産生更大的傷害。
2. 隐私
Vision Pro對人,對環境的觀測能力相比手機有天翻地覆的提高,能夠幾小時的全程觀察到人的舉手投足所有細節動作,面部表情,和眼睛觀察世界和數字界面的所有過程。對實體世界也是全程的觀察和識别。
蘋果做了極高規格的隐私保護,這些資訊蘋果隻在本機處理,并且應用無法擷取(應用無法拿到相機圖像。無法拿到眼動資料,隻能知道“眼睛+手勢”出發了哪個UI控件)
但這些資訊具有極大商業價值,因為對使用者的了解比手機提高了百倍。而Android陣營的特點是:OS設計對隐私保護不夠強,硬體商會對OS底層進行改動,商店不對侵犯隐私的應用進行攔截,應用開發商之間的内卷(侵犯隐私獲利方面的惡性競争)。硬體商會利用這些資訊,做新商業模式,推出表面上看極具價格優勢的硬體。而更多的硬體商不得不加入同樣商業模式應對價格戰,陷入内卷。受害的是消費者。
值得擔心的是,不受管控的類似Vision Pro的産品,會讓普通使用者在1精神影響,2.利用隐私資訊的雙重進攻下成為被精神控制的搖錢樹。在這方面的能力,類Vision Pro産品比手機強百倍。
任何有突破性的重要技術都是雙刃劍。
再次回到問題,Vision Pro這個産品會成功還是失敗?
有的媒體看衰AVP,理由是:和以往的蘋果的産品不同,AVP是在分割一個很小的,甚至是不存在的市場。以往的蘋果産品都是在一個很大的市場裡做創新,切個小蛋糕然後擴大。
比如比蘋果iPhone一代的釋出會,Steve Jobs明确指出:手機市場和PC電腦市場相比是一個大5倍的市場。iPhone試圖革命這個已有市場,如果切出1%的蛋糕,就有1千萬銷量。
圖示
圖示
而VR,AR市場是很小,并且未被證明的市場。自從2014年已經發展了近10年才隻有1千萬台的銷量。我覺得這些媒體的看法和擔憂并不無道理。
iPhone釋出會的最後一頁:
圖示
這裡Steve Jobs引用了加拿大“冰球大帝”Wayne Gretzky的名言:“我總是滑到冰球未來将到達的地方,而不是滑到冰球現在的位置。”這句話更适合拿出來給Vision Pro打打士氣。
數字時氪(digital36kr)