文/VR陀螺
太平洋時間2月2日上午8點(北京時間2月3日0點),Vision Pro正式在美國上市。隨著8點前最後5秒的倒計時結束,Apple Store店門外一片歡呼聲,門店外排著隊的慕名而來的使用者有序進入店內。
從早上8點開始,店內根據排隊順序以及使用者自願安排的Demo演示,每位預約了Demo演示的使用者都將能夠獲得1v1的產品使用和功能講解。
早上6點便來到門口排隊的VR陀螺也在第一時間拿到這臺“斥巨資”買到的產品,算上往返機票,裝置的總價已經達到4萬以上。
作為蘋果第一款“空間計算”終端,被寄予了開啟下一個空間計算時代的產品,VR陀螺也在第一時間帶來全面評測。
包裝清單&外觀&引數配置
相對於蘋果一貫的環保風格,Vision Pro的包裝比以往的很多電子產品包裝要“豪華”很多。標配包裝清單包括頭顯、充電移動電源、充電頭和充電線、兩塊面罩、擦鏡布以及說明書。
開啟包裝盒即可看到頭顯被非常穩固地卡在盒子裡面,頭顯外包裹著嚴絲合縫的防護罩。由於頭顯正面為玻璃材質,所以在運輸中增加了塑膠防護罩,加上其容易殘留指紋,還增配了擦鏡布。
在購買Vision Pro時,所有人都需要透過手機上的深度感測器來掃描面部資訊,以獲取使用者的3D面部資料,這個資料一方面是為了選擇適配的面罩和頭帶,同時也可用作 3D Facetime 通話的Avatar構建。
包裝內標配兩條頭帶,透過頭顯左右兩側的卡扣可以輕鬆替換。第一條為蘋果在產品影片展示的包裹型針織材料頭帶,材質柔軟親膚並且輕薄透氣,頭帶後方較寬約8.5cm(不同尺寸寬度不一樣),可以很好地包裹後腦勺,調節右側的旋鈕可以將其收緊。由於這種佩戴方式將所有重量聚焦在面部,所以整體舒適度有限。
另一條為魔術貼鬆緊頭帶,類似現有VR終端,只是相比其他VR頭銜的橫縱交叉分佈,Vision Pro頭頂上方的帶子改為橫向延展,避免了將頭髮縱向分成兩半的尷尬情況。這種佩戴方式除了後方和額頭可固定外,還可以將頭顯重量有效分散到頭頂,雖然美觀程度比第一種差,但佩戴體驗明顯優於第一種。
頭顯前方為玻璃材質,四周為鋁鎂合金,與蘋果其他很多電子產品風格一致,銀黑配色非常高階。玻璃外觀帶來了極高的質感,但缺點也顯而易見,除了容易沾染指紋外,易碎以及對頭顯重量帶來的負擔,不得不讓使用者在使用過程中小心翼翼。
Vision Pro採用3P式Pancake光學,相對於2P結構成像效果更好,但體積也會更厚。根據VR陀螺測量,去掉遮光罩後頭顯最厚的部分約5cm,加上遮光罩及面罩後厚度達到7cm,整體重量為623g。相比Meta Quest 3,Vision Pro更重。
包裝盒內的兩塊面罩均根據頭圍掃描後自動適配尺寸,分厚款和薄款兩種,舒適度差異不大,或許是為了適應屈光人群,由於屈光鏡片增加了透鏡的厚度,厚款面罩可拓展成像距離。
使用者在購買時可選配149美元的蔡司的屈光鏡片,需要提供驗光單來獲得最精準的度數。鏡片採用磁吸設計,非常方便使用,只是對於頭顯來說無疑又增加了部分重量。
由於Vision Pro主要互動方式為手眼協同,並且其具備精度非常高的Slam定位,頭顯搭載了超級多感測器。包括12個攝像頭(其中兩顆4K彩色攝像頭用於Video See Through)、5個感測器(1個 Lidar、2個結構光深度感測、2個IR紅外感測)和6個麥克風,共23個感知感測器,分佈在整個裝置的外側,用來處理Slam空間環境感知、手勢識別、三維建模和眼動追蹤等資訊。
由於頭顯感知全靠這些感測器來獲取,所以如果玻璃外殼碎裂可能直接導致空間定位和互動受到影響,這也是區別與以往手機、手錶等電子產品的地方,顯然摔落測試不適合Vision Pro。
外部揚聲器位於頭帶兩側,之前在Vision Pro的技術解讀文章中曾經提到,蘋果為了這款終端使用了其獨有的空間音訊技術,所以從外觀來看,音訊模組的體積也比眾多VR/AR產品要更厚重一些。
頭顯正上方和底部均設定了散熱孔,由於極限堆料,據瞭解Vision Pro的功耗達到18w以上,所以需要更多的散熱模組,高功耗對續航也帶來了非常大的負擔,所以可以說續航是目前頭顯的硬傷。
Vision Pro上的物理按鍵非常少,只有頭顯左側上方的按鍵以及右側的數位旋鈕。左側按鍵可開啟相機,進入空間拍攝介面。數位旋鈕功能較多,按一次可回到Home介面,與手錶的選單呼喚功能一樣;雙擊兩次可以回到空屏狀態;音量調節、虛實空間程度調節都靠旋轉來完成。
標配的移動充電電源為3166mAh,體積比常規的10000mAh充電寶體積更大,重量也達到了354g。實際測試,持續使用的續航時間可達3.5小時,與現有的大部分VR/MR頭顯的續航時長基本一致。不過如果在室內辦公或者客廳場景下,可以讓充電寶處於持續充電狀態,也就沒有續航焦慮了。
標配充電頭採用30W Type-C 快充,實際測試1個小時30分鐘可以充滿電。
以上為Vision Pro最基礎的標配清單,蘋果官網上還提供了非常多的配件可選擇,如上文提到的屈光鏡片,還有收納盒、充電線等。同時頭顯也有256GB、512GB和1TB的記憶體版本可選,價格分別為3499美元、3699美元、3899美元。
以下為Vision Pro產品完整引數:
開機體驗、UI、互動
接下來是Vision Pro最為驚豔的體驗部分。
跟蘋果所有的終端啟用開機一樣,不同國家語言的Hello字樣會出現在螢幕中間,之後跟隨引導完成手勢和眼動追蹤設定即可進入主介面,整個流程大約3分鐘。
1、手眼協同:符合“下一代計算平臺”定位的互動方式
Vision Pro的互動方式包括手眼協同、語音、物理按鍵以及外設。主要的互動方式為手眼協同,不得不說這Vision Pro上最驚豔的部分。
雖然手勢識別和眼動追蹤並不是新技術,均在各自的領域應用多年,但以往都是分開發展,蘋果是首次將這兩項技術結合在一起進行互動的公司。相對於PC的鍵盤滑鼠以及手機的觸屏互動,手眼簡直是一種會讓人上癮且極其簡單、易用、輕鬆的互動方式。
VR陀螺分別從便攜性、易用性、學習成本、可靠性、精準性、自然度六個維度對比了鍵鼠、觸屏和手眼協同互動,可以看到手眼協同在互動方面的便攜易用、學習成本和自然度方面優勢非常明顯,雖然可靠性(出現誤操作的比率)會比其他兩種高,但未來也可以透過演算法提升得到改善。
原本以為手眼會讓眼睛和手容易出現疲勞,實際上並不會。如果仔細觀察可以看到Vision Pro的硬體設計、互動與UI相輔相成。
頭顯外的感測器主要分佈於偏下方的斜面位置,這是為了更好的實現間接手勢。在手勢互動中分為直接手勢和間接手勢,直接手勢可理解為手與虛擬物體直接互動,手需要“接觸”到虛擬物體來進行操作,如點按、拖拽、拉伸等,這種互動方式在之前的眾多VR/MR終端中非常常見,如微軟的HoloLens等,所以互動時由於需要長時間抬起手臂,所以很容易出現疲勞。
間接手勢是蘋果提出的新的手勢互動,坐躺姿勢下,手自然置於腿上輕輕捏合就能實現點選,感測器位於頭顯偏下也是為了避免抬手出現疲勞,更好地捕捉到手的動作。
Vision Pro目前支援6種手勢互動,主要動作都是拇指和食指捏合,配合眼動可以實現單擊、雙擊、拖拽、旋轉等操作。
陀螺君測試了捏合手勢的識別程度,如五個手指呈爪狀捏合依然可以互動,握拳狀態下無法操作,點贊手勢不可操作,OK手勢可操作,可以看到演算法設定的互動的基礎前提是隻要識別到拇指與食指捏合就能成功完成互動。
相比蘋果的電腦介面中應用框的關閉、最小化和縮放位於左上方的設定,Vision Pro的UI介面調整幅度較大,這與前文提到的硬體設計、互動與UI相輔相成有關。
從眼動追蹤模組的感測器位置可以看到,分別位於鼻樑兩側以及雙眼下方,雖然感測器與眼睛有一定距離可以幫助其獲取更大的捕捉範圍,但眼球畢竟是凸起的球狀,當視線瞟到上方時一定程度上會影響捕捉精度。這也是為何幾乎所有的UI操作介面都放在了視野下方,包括拖動條、縮放條、關閉等操作介面。
實際手勢的位置測試中發現,手在頭顯正下方、手自然伸展自身體左右側均可精準操作,水平於身體兩側亦可捕捉,在頭顯上方仍可識別,但頭頂和背後位於感測器捕捉範圍之外是不可捕捉到的。另外,從距離來看,手勢離頭顯5釐米之內會難以識別,手臂伸到最長只要在捕捉範圍內都無影響。
UI互動上,當眼睛看向應用框下方正中間時將出現拖動條和關閉按鍵,眼睛相當於PC滑鼠的滾輪,用來選擇標的,而手勢則相當於滑鼠上的按鍵,用來點選,同時也可以移動來拖動介面位置。眼睛看向的位置將出現高亮,用來辨別是否已選。
如蘋果強調的“空間計算”一般,應用在空間中的自由度非常高,應用框可以多層重疊,在頭顯中可以明確感知到介面的深度位置差異,並且前後拉拽會有跟真實物體一樣近大遠小的效果。
而如果當多個應用框前後重疊,只要看向未完全重疊的部分,配合捏合手勢即可將介面召喚到最上層。
經實測,手眼協同互動的精準度非常高,即便是介面中非常細小的按鈕或者帶有超鏈的小文字都能精準識別互動。
當然,手勢的拓展性還有很大,根據蘋果的開發文件,開發者可以在應用中自行設定其他手勢。只是雖然結合了深度感測器和視覺,手指交叉等複雜手勢應該還是會容易出現誤操作。
2、顯示畫面:至今為止顯示效果最好的頭顯
單眼4K的Micro OLED帶來的極佳顯示效果,顯示的色彩、解析度、畫面精細度從肉眼體驗來看絲毫不遜色於陀螺君的Macbook電腦的觀看效果,Micro OLED螢幕相對於LCD、以及LCD+MiniLED背板的優勢在此不再贅述。
Vision Pro肉眼觀看FOV約90-100度之間,據瞭解,其PPD(角解析度)約35左右,而Meta的Quest 3的PPD約25,顯示效果提升明顯。
特別是在現場Demo演示中展示的Immersive影片,高畫質內容+3D顯示,再結合180度全景,完全足夠以假亂真。
3、VST:仍有改進空間
VST——Video See Through,即透過攝像頭捕捉真實畫面來實現與現實世界融合的效果,相比AR眼鏡的OST(Opticl See Through),其更容易實現大FOV,同時也更便於在VR和MR之間切換。
但VST的弊端在於對延時和對攝像畸變演算法的處理,將直接影響使用者體驗。這也是蘋果為何要在頭顯上增加協處理晶片的原因所在。
VR陀螺之前曾經在文章中提到,協處理晶片與主晶片來處理VST的路徑差異,相對於使用主處理晶片對捕捉到的影片進行處理,協處理器的路徑更為高效。
而實際體驗中可以發現,畸變使用VST模式觀看Excel中的表格,不論是畫面中央還是畫面邊緣都沒有出現表格線條扭曲、變形的情況,可見其畸變處理非常優秀。
而另一方面清晰度和延遲,前置雙4K攝像頭捕捉到的真實畫面,相對於人眼直接觀看仍存在一定差距,無法達到照片級效果,特別是在VST透視狀態下快速轉動頭部,很容易出現模糊拖影,當畫面靜止下來很快會恢復清晰。並且,透過攝像頭拿取真實世界的物體,移動行走,甚至是檢視手機、PC上的文字資訊都能夠清晰可見。觀看手機上的文字時需要控制頭顯與手機之間的距離,最佳距離範圍約30釐米以內,太遠文字會變模糊。
延遲方面,官方曾經提到低於12ms,從VST透視狀態下在PC上輸入文字,或者是進行其他較快速的操作時,幾乎都感知不到透視所帶來的延時。
之前的技術解析文章中也曾經提到,蘋果的VST相對於其他的VST差異在於可以任意調整虛實程度,透過數位旋鈕來精準控制虛擬範圍,而這也是靠R1協處理晶片完成。
整體來看,VST在透視的清晰度方面仍有待提升,但畸變和延遲處理非常優秀。
4、虹膜識別等其他功能
在Vision Pro中設定了個人安全防護,由於頭顯為核心為近眼顯示,與人眼最為接近,且內建眼動追蹤模組,可直接用此模組用來進行虹膜識別,因此Optic ID成為了Vision Pro中最自然也是最為合理的安全防護手段。
Optic ID被用於頭顯的解鎖、錢包和蘋果支付、Persona社交的眼神動態呼叫、包括App Store應用下載和自動金鑰填充等場景,相當於手機上的面容解鎖或指紋解鎖,但相對而言虹膜識別的安全級別遠遠高於面容ID和指紋。
所以每次摘取頭顯的時候都會進行虹膜識別,在設定Optic ID的同時還可以設定Passcode,以便其他人體驗該頭顯的時候可以透過輸入Passcode解鎖進入。
眼動模組的功能不止於此,包括注視點渲染、IPD自動調節等。注視點渲染為後方演算法,在體驗時很難感知到,但可以有效最佳化功耗,減輕畫面渲染負載;而IPD自動調節,在最開始設定頭顯時可以看到提示長按數位旋鈕來調整顯示模組的位置,此處即是透過眼動追蹤識別瞳距來實現的。
隱藏使用小技巧:頭顯上方左右兩個鍵同時按可截圖,長按開關機。頭不動眼睛向上看可撥出頂部選單,可開啟投屏、錄屏、藍芽&飛航模式切換等。
應用生態及場景
至今為止蘋果展示了非常多Vision Pro的應用場景,包括觀影、大屏遊戲、工業維修、建築設計、3D視訊通話、空間拍攝等,而縱觀所展示的所有場景,可以看到蘋果始終強調室內非移動場景使用,所以之前的VR內容的設計思路現階段不一定適合Vision Pro。
在Vision Pro的App Store中,據官方表示將有超過100萬個原手機或者iPad平臺移植過來的應用上線,同時首發的原生應用也達到了600個。
App Store中沒有展示所有應用類目,因此難以計算其數量,不過目前根據不同的板塊劃分瞭如“必須體驗的Apps”、“Apple Vision Pro最佳應用”“Apple Arcade”、“以全新的方式做你喜歡的事”、“探索全新的空間應用”、“釋放你的生產力”、“必須玩的Apple Arcade遊戲”、“iPad及iPhone相容遊戲”、“不可錯過的必選應用”、“iPad及iPhone優秀作品系列”以及一部分專欄合輯等。內容覆蓋辦公、社交、娛樂、藝術、設計等全領域內容。
1、影視影片
觀影是Vision Pro的核心場景之一,AppleTV、Disney+、NBA:Live Games& Scores等影片內容平臺均在首批名單中。
在Vision Pro中,影視內容的觀看形式較多,如180度的沉浸式3D內容、大屏3D內容、大屏2D內容以及空間影片內容。
顯示效果為畫質表現提供了保障,加上平臺上的影片內容都是經過篩選的優質作品,可以看到影片的質量幾乎達到照片級,用Vision Pro觀影的體驗完全可以媲美線下IMAX影院,體驗更優於家裡的投影或者電視。
甚至現場很多人為了觀影、觀看賽事這一項體驗就願意為這款產品買單。
2、遊戲
Vision Pro中的遊戲包含iPhone、iPad移植過來的2D版,以及基於頭顯的原生內容,互動方式主要為手柄或手眼。如移植遊戲可以使用手柄體驗,而部分移植的內容也專門基於Vision Pro的手眼互動進行了調整。而這以視窗形式存在的應用大多可以在Share Space(共享空間)中共存,在空間中放置多個遊戲,可以毫無障礙的任意選擇遊戲操作,只是遊戲音樂會相互串擾。但一個人同時控制多個遊戲螢幕,彷彿自己承包了整個遊戲廳,非常爽。
原生遊戲很多需要Full Space(全沉浸空間)來呈現,所以在開啟一些原生遊戲時原先開的很多其他內容視窗會被最小化到後臺,畫面被全沉浸的內容所佔有。
從目前Vision Pro上的遊戲型別來看,休閒類的輕互動內容居多,包括一部分RPG、文字劇情類、解謎類等。
值得注意的是,陀螺君在Vision Pro上下載的《Life is Strange》的遊戲採用Unreal引擎開發,看來目前Vision Pro已經開放了對虛幻引擎的支援。而原本眾多VR/MR遊戲、互動敘事作品都基於虛幻引擎開發,看來未來也有望能移植到Vision Pro平臺。
3、3D創作、設計
Vision Pro不同於其他VR/MR終端,其定位為計算平臺,因此,遊戲娛樂之外,生產力也必將是其中的重要場景。
特別是在3D創作、設計、營銷等領域,AVP平臺具有天然的優勢。在應用市場有多款3D設計的應用,包括用於醫療培訓領域的3D器官模型,用於工業設計領域的JigSpace等,基於極其清晰的畫面表現,3D模型在畫面中看起來彷彿真實一般。
3、空間影片拍攝、錄製
Vision Pro的獨有功能包括空間影片和空間照片拍攝,而後iPhone 15 Pro系列也開始增加了對空間影片內容的支援。
按下頭顯左上方的按鍵即可進入相機應用,可選擇照片或影片模式。關於空間影片的原理和技術,包括其帶來的影響,VR陀螺有多篇內容可參考。
所以本文更注重實際體驗的描述。當空間影片/照片拍攝時,所拍攝的範圍將出現高亮,而周圍則會變暗,空間影片能拍攝的範圍有限,大概30-40度FOV。
從陀螺君看來,現階段的空間影片清晰度相比手機上看到的2K或者4K仍有差距,特別是在immersive的大屏狀態下觀看時,清晰度會進一步降低,而且可拍攝的視角範圍也仍然需要提升,不過作為一種全新的影片/照片展現形態,其所呈現出來的空間縱深感是其他所有平臺均難以實現的,而這也很有可能為空間影片這類影片格式帶來全新的市場。
4、辦公&社交
在Vision Pro中有諸多辦公和社交應用,如微軟辦公全家桶、蘋果辦公全家桶、DingTalk(釘釘)、zoom、Teams、Facetime等,眾多應用中都加入了蘋果的Persona。
Persona是所有使用者可以為自己建立的3D模型,透過頭顯上的感測器進行掃描,相比購買裝置時只需要移動面部掃描外觀之外,在進行Persona的模型掃描時,需要有微笑、大笑、閉眼、抬眉毛等動作輸入,而後構成的3D模型,以陀螺君個人為例,面部整體輪廓還原度非常高,甚至感覺所有的動作是在照鏡子一般真實,但頭外圍,如頭髮、肩膀的邊緣部分都被虛化了一圈,看起來有些許違和。
社交和視訊會議應用大多都加入了Persona,所以即便是頭顯使用者與手機使用者線上聊天,對方也能看到自己的3D模型,眉眼、表情,甚至吐舌頭都能完全實時被還原出來。
辦公板塊重點為內容輸入,目前Vision Pro支援的輸入方式一共有4種,實體鍵盤(效率高、準確率高),語音輸入(使用場合受限,效率高、準確率較高),虛擬鍵盤輸入。
其中虛擬鍵盤輸入也分為兩種方式,一種是手勢直接互動,但是目前經測試只支援兩個手指,所以打字的樣子看起來比較滑稽;另一種方式為手眼配合輸入,眼鏡作為游標看向相應的鍵位後,手勢捏合即可輸入,這種方式同樣效率較低,也比較費力。
綜合來看,辦公場景,如果講究效率仍最適合使用實體鍵盤輸入。不過隨著AI的引入,未來文字輸入的工作量很有可能大幅降低,從而讓語音變成更為核心、高效的方式。
結語
由於現在體驗的時間有限,無法將Vision Pro更為全面的體驗表達出來,陀螺君後續將以更為直觀的影片方式來呈現。
對於Vision Pro,陀螺君認為,雖然價格不便宜,現在也有諸多槽點,但我依舊認為非常值得入手,很多感受難以用言語來傳達,需要親自體驗才能真正體會到。
“整個過程給了我太多Wow Moment,我試戴下來覺得很值得。”會上第一次體驗到AVP的一位使用者說道。
“當我聽到AVP宣傳影片裡面的《Dreamer》的時候,突然一下就淚目了。”最近跟圈內小夥伴聊天時他說道。
我們往往高估一兩年的發展,而低估未來十年的變化,第一代的AVP表現不盡如人意,但也亮點滿滿,它只是未來的一個雛形,現下最重要的是下一個時代的互動被定義,空間計算這種呈現形式被定義,方向清晰明瞭,未來技術會不斷進步,價格會降低,劃時代的應用也將出現,而我們需要做的,只是多給它一些耐心,時間終將證明一切。