市面上對於Apple Vision Pro的解讀有很多,但少有涉及AR/VR產品根本性問題的瞭解和洞察。
關於Vision Pro理想應用是“空間顯示”?Elon Musk評價AVP,"我不明白為什麼要將電視機掛在鼻子上“,其實這句評論沒有貶低AR/VR,甚至還高估了。因為使用VR作為沉浸式大屏(3D)顯示其實是個偽命題。過去25年裡,AR/VR頭顯早有人嘗試,並不是什麼新鮮玩意,到如今顯示技術得到長足發展,採用的螢幕規格越來越高。為什麼你看不到飛機上VR觀影的人?
這是直擊靈魂的拷問。
Vision Pro能否成為“空間顯示器”,關鍵不在你採用了哪種先進面板,不在顯示質量、解析度,也不在重新整理率,而是一個人體工學的問題,在於人類視覺的底層機制變成了阻礙。Vision Pro 的R1再怎麼強大,video資料流處理過程再怎麼先進,畫面延遲再低,用VST就無法解決運動狀態下凝視畫面,耳蝸-前庭-眼球協調的問題。只要看到的畫面運動重新整理和內耳檢測到的旋轉速度不一致,暈動症或多或少就會發生,並且因人而異,這就意味沉浸式VR頭顯佩戴久了一定會有一部分人不舒適。依靠攝像頭的VST無法高頻日常使用,證據就是你很少看到坐飛機使用頭顯。
解決方案似乎只有發展真正的光學透視,天然的OST過程,光子打到視網膜轉化為視覺神經訊號傳輸到大腦,才能真正消滅延遲。
還有眾所周知的視覺輻輳衝突,人眼觀察不同遠近(不同焦點)、不同位置的物體,晶狀體收縮擴張和眼球轉動會同時“協作”。如果晶狀體一直保持大小不變,固定一個焦點,長時間眼睛太難受了。VR最困難的變焦顯示,難倒了Magic Leap,經過多年開發還是放棄了自己獨有的FSD(Fiber Scaning Dislay)方案,也讓Meta的硬體科學家們困在原地。按照之前國外對Vision Pro光學透鏡 Pancake模組的分析,理論上是可以做到調焦顯示的,但是蘋果沒有提,這說明技術不是一般的困難。然而,看久了固定焦點的虛像,眼睛會非常累,又是一個無法高頻日常使用的核心難題。
關於重量。Vision Pro的重量明顯“超了”,無法長時間佩戴。蘋果的說法是已經使用了最好最輕的材料,無法再減重。很多人缺乏對Apple Vision Pro真正深入理解,蘋果為了解決佩戴以往VR頭顯的周圍視覺“交流”、動態環境安全性的問題、讓VR能真正“出街”,開發了EyeSight方案,並且在硬體上做出了重大妥協,特別是重量上。
為了EyeSight,蘋果設計OLED曲面外屏,使用了3D裸眼技術,並且覆蓋一層曲面玻璃,EyeSight可以說體現了蘋果對VR頭顯產品有異常深刻的洞察。但這些增重是否完全有必要,EyeSight硬體實現方案,能否繼續改進?其實Meta很早也展開過相關“視覺交流”的方案探索,只是沒有真正落地。
圖為Meta “reverse passthrough system”的一張Demo圖
還有,因為這塊正面外屏的存在,需要重新調整攝像頭、深度相機、dToF雷達的位置,相應的畸變矯正演算法、資料融合、調整VST畫面實時顯示,算力、演算法的要求更高更難了。
關於VR超大畫幅和沉浸感,對於辦公看文件、看電影,其實VR的優勢並不明顯。為什麼,跟你去電影院不願意坐前排是一個道理,視覺資訊超過一定視角,人類的通常習慣是轉頭再凝視而不是轉動眼球再凝視,所以理論上Vision Pro又一個應用場景是偽命題。
你眼前看到的真實世界其實是“拼湊”起來的,類似量子力學的非連續點粒子構成了世間萬物,你看到的世界也是非連續的視覺資訊。人眼視場角內最清晰的區域(視網膜中央凹)僅佔2°,眼球透過掃視、跳動等微動作捕捉視覺資訊,然後大腦快速將其“整合”在一起。
“佐治亞理工學院教授Thad Starner曾指出,受制於眼球運動的機械限制,顯示屏的水平FOV不應超過55°,其中有效的眼動範圍只有45°,而舒適的觀看區域可能不超過10°到20°左右。
由於看電影是一個長時間凝視/無需轉頭的過程,在VR中看電影實際上不像VR遊戲那樣需要那麼大的FOV。現實情況是,人眼盯著40°到50°高解析度畫面時,只用幾分鐘就會感覺視覺疲勞。因此,電影畫面最好保持在20°水平,當畫面超過30°時,使用者可能會需要轉頭看,而不會轉動眼球,這情況在電影院前排、或者大尺寸顯示器上存在。”
換句話說,人眼主要注意螢幕中心30°範圍的畫面,在不轉頭的情況下,大FOV不僅沒有帶來沉浸優勢,還帶來了困擾。比如BirdBath這種主打“投屏顯示”眼鏡,發燒友使用它看文件、網頁,需要轉動眼球凝視虛像邊緣的字型、畫面畫素資訊的時候,體驗就相當糟糕。
大FOV帶來的沉浸感有不易察覺的代價。辦公和看片,Vision Pro的沉浸大屏並不會讓你長期覺得舒適,而這恰恰是蘋果重點宣傳的一個使用場景。
關於價格,個人非常贊同國外AR資深專家Karl Guttag的說法,Vision Pro 價格貴不是重點,重點是“真的有用”。
“對於評論AVP(Apple Vision Pro)價格的人,他們是從看待一項成熟技術而不是一項全新技術的視角出發。僅舉一例,記憶體為4KB的Apple II初始零售價為1298美元(相當於2022年的6268美元),而最大記憶體為48KB的型號則為2638美元(相當於2022年的12739美元)。再比如,1979年我買了第一臺錄影機,價格約為1千美元,按通貨膨脹率調整後相當於現在的4400多美元,一盤1.5小時的空白磁帶約為10美元(相當於2023年的44美元)。問題不在於價格,而在於AVP是否會成為人們經常使用的裝置。”
Oculus創始人Palmer Luckey的評價也非常有啟發,
“在產品策略上,蘋果瞄準了正確的市場。相比於追求低價,硬體質量、舒適度、人體工學、解析度、高質量內容才是前期更重要的目標,而降價是後面才要考慮的。 每家公司擅長、適合開發的產品不同,如果蘋果追求入門級市場,可能會是一個錯誤。蘋果努力打造解析度最高、人體工學最好的頭顯,面向的是早期採用者,而這也是適合當下的策略。實際上,現在這個階段價格高低並不是關鍵,尤其是對於早期採用者並不重要,雖然Vision Pro售價高達3500美元,但即使賣到5000美元,也有人會買。 透過Vision Pro,蘋果可以讓XR頭顯在市場上獲得更多關注,並刺激早期採用這之外的更多人的需求,然後再降價至人們買得起的水平。“
還有更多,比如扎克伯格還對競爭對手蘋果AR發表了看法。他認為,
這段時間Vision Pro很熱鬧,但AVP的啟發不僅僅是產品層面上,也少有人注意到下面這些事實和疑問:
蘋果只不過釋出了一個司空見慣的VST頭顯,Vision Pro的許多特點和關鍵創新,像競品Meta 也提出過、實踐過,Vision Pro並沒有解決VST頭顯的許多重要問題:比如多焦點顯示、重量、發熱、續航、VST在暗光環境或過曝光線時畫面對比度、全身追蹤,並且價格過於昂貴。但Vision Pro就是成功引爆市場,全球媒體熱議,這可能才是同行需要反思的地方。
先行者做不到的,Vision Pro也一樣,為什麼換成蘋果頭顯大家就能接受?而且即使定價如此之貴。很多人評價Vision Pro就是“配置很高”,感測器數量上大幅超越友商,讓眼球追蹤的準確性可靠性明顯提升,還帶來了超大範圍的手勢識別;視覺/深度相機/鐳射雷達SLAM融合,人機互動和VST的畫面(畸變)矯正無比絲滑和自然;還有桌面級效能的核心處理器M2,從硬體底層設計感測器資料處理晶片R1(專用積體電路晶片ASIC,類似iPhone 協處理器?),定製的多片式擁有非標曲面的Pancake模組,4K矽基OLED內屏,OLED前向(外屏)eyesight裸眼3D....等等。所以,問題是硬體堆料能否複製另一個Vision Pro,究竟是品牌起作用還是產品本身?
Apple Vision Pro釋出會上並沒有遵循行業“常規”,公佈具體的像PPD、FOV、Pancake模組光學效能,並且要求Apple Store員工等不能提到VR等字眼。空間計算其實早就有人提出過類似概念,從蘋果口中出來效果卻完全不同,蘋果不僅培訓銷售人員避諱使用和提及“VR”等字眼,並且釋出會用兩段定義了Vision Pro, “most advanced personal electronics device ever” + “a standalone spatial computer portable enough to use anywhere”。即最先進的個人消費電子裝置,任意場景都適用的空間計算機。
庫克相信,未來我們誰也離不開屬於個人消費電子的“空間計算機”。這是從iPhone的邏輯延伸。
Oculs創始人Luckey提到了一個“社會工程”(social engineering)的概念,本意指的是透過大規模影響人們的態度和社會行為,讓目標人群產生所需的特性本質上來講,蘋果不是透過工程設計來讓人接受XR,而是透過社會工程,改變社會對XR的預期。換句話說,Vision Pro透過恰當的營銷、名人帶貨,也可以改變人們對XR的固有印象,讓頭顯技術比之前看起來更酷,即使Vision Pro並沒有輕薄的外觀。
沃爾特·李普曼在他的1922年的《公眾輿論》(Public Opinion)一書中提出,人與環境之間的真實環境太大、太複雜,而且瞬息萬變,無法直接認識。每個人都會建構自己的偽環境(pseudo-environment),這種偽環境是主觀、有偏見且必定更精簡的世界的心理形象,而在某種程度上,每個人的偽環境都是虛構的。人們“生活在同一個世界中,但在不同的世界中思考和感受”。李普曼說的“環境”可稱為是“現實”,而“偽環境”更像是今天所謂的“建構現實”。人們“在被社會和文化世界創造的同時,也創造自己的社會和文化世界”。
社會建構主義(英語:social constructionism)是社會學和傳播學中的認識論。大多數社會建構主義者都信奉“語言不是反映現實,而是構成(創造)了現實,即“沒有事實,只有詮釋。”
事實是:Apple Vision Pro是一款領先同行的產品,但整體來說,它並沒能領先時代。
許多人相信歷史是天才和英雄人物決定的,大眾只是一群被趕著到處跟著跑的鴨子。中心化比去中心化好,讓行業分工明細、開放的自組織演化不如由封閉的精英小圈子制定“標準”並進行“質量管控”,起碼iPhone和iOS已經是肉眼可見的前例。
蘋果對於使用者的深度理解、對於產品創新的洞察,對於未來的想象力,組合起來就是一種魔力,也是扭曲現實力場的來源。投資者、行業巨頭和創新企業、使用者都在觀望,姍姍來遲了很多年的Apple Vision Pro能夠引導VR/AR真正走出極客小眾,成為大眾普及的消費電子產品。很多巨頭等著別人試錯成功後在後面摘果子。
深入研究Apple Vision Pro,可以明顯地感知到:這家公司擅長從底層向上完全構建,自成一體,而非等著光學器件、顯示屏、新式感測器、演算法和算力晶片、應用開發慢悠悠“協同”發展,不同實力的廠商分散地製造一堆不同品相的垃圾。
就像蘋果投入巨大、一直瘋傳汽車"泰坦“被取消,Apple Vision Pro的產品態度,把使用者體驗放在最高優先順序,從不製造垃圾的信念,不釋出不成熟的低使用者價值的“新產品”,還有這家公司的營銷手法,可能才是最最值得學習的。