對(duì)于類似HTC Vive的設(shè)備,需要雙目12450*6840或更高的分辨率(介于8k和16k之間)才能達(dá)到“視網(wǎng)膜”效果。
對(duì)于所有VR設(shè)備,需要達(dá)到150-240fps的刷新率才能讓一般人覺得足夠真實(shí)。
如此高的分辨率和刷新率需要數(shù)十倍于當(dāng)前PC的硬件性能才能驅(qū)動(dòng)。
“視網(wǎng)膜”效果是一個(gè)沒有清晰定義的概念。根據(jù)Steve Jobs在發(fā)布iPhone 4時(shí)的定義,它是指在10-12英寸的距離上,設(shè)備的像素密度達(dá)到300ppi(每英寸300像素)的水平時(shí)的顯示效果。然而實(shí)際上人眼在12英寸的距離上的分辨率可以超過900ppi。我們?cè)谶@里采用Jobs的標(biāo)準(zhǔn)來討論。
12英寸距離上300ppi的像素密度,通常用一個(gè)單位為ppd(每度像素?cái)?shù))的參數(shù)來表示:
想象一個(gè)頂角為1°的細(xì)長(zhǎng)的等腰三角形,其高度 d 為眼睛與屏幕的距離,r 即為其底邊覆蓋的像素?cái)?shù)量。根據(jù)Jobs的定義,要獲得視網(wǎng)膜顯示效果,需要至少57ppd。
對(duì)于主流VR頭顯如HTC Vive來說,其單眼橫向FOV為110°,縱向約120°。據(jù)此計(jì)算,它需要
的單眼分辨率才能達(dá)到視網(wǎng)膜水平,也就是需要一塊至少 12540*6840 的屏幕輸出雙目畫面。按照類似流行的4k、5k、8k 的說法,這樣一塊屏幕差不多是13k;如果維持Vive顯示面板大小不變的話,其像素密度約為2567 ppi(作為對(duì)比,Vive的像素密度約為447 ppi)。至于有的朋友提出這樣高的像素密度能否實(shí)現(xiàn),我覺得應(yīng)該是沒什么問題的,畢竟Sony早在2013年就造出了2098 ppi的OLED屏幕。
如上圖。目前的主流VR頭顯的像素密度只達(dá)到了這一標(biāo)準(zhǔn)的1/6。我們?cè)谥髁黠@示設(shè)備的像素密度上翻的前一個(gè)6倍,花了二十多年(從DOS時(shí)代的320*200到目前主流的1920*1080)。
提高VR設(shè)備的像素密度,并不是單純地把高密度顯示面板造出來然后放進(jìn)頭顯這么簡(jiǎn)單。從2k到4k、4k到8k,每次升級(jí)看上去都只是數(shù)字翻了一倍,然而像素?cái)?shù)量卻是呈平方級(jí)上升的,4k是2k的4倍,8k是2k的16倍。視網(wǎng)膜VR級(jí)別的分辨率,其像素?cái)?shù)量是目前Vive的33倍。
為了滿足VR游戲的需求,目前最頂級(jí)的PC的性能都可以被輕易榨干。3D游戲的性能是與分辨率密切相關(guān)的,這意味著如果要提供相匹配視網(wǎng)膜VR的3D游戲內(nèi)容,計(jì)算機(jī)的性能也要相應(yīng)地提升幾十倍。以摩爾定律計(jì)算,這個(gè)過程需要近10年。
視頻信號(hào)的傳輸也是一個(gè)大問題。上圖每個(gè)方塊右上角給出了在該分辨率下以90 Hz的頻率發(fā)送未壓縮的每像素24 bit的視頻信號(hào)所需要的帶寬(不含音頻)。作為參考,目前最新的HDMI 2.0標(biāo)準(zhǔn)可以傳輸最大18 Gbps的帶寬——連視網(wǎng)膜VR所需求帶寬的1/10都達(dá)不到。為此,我們必須使用更先進(jìn)的傳輸方式,例如光纖傳輸。尚在襁褓之中的無線傳輸則會(huì)面臨更大的挑戰(zhàn)(開個(gè)腦洞,近場(chǎng)激光傳輸?)。
很多朋友提到,由于人眼只能清晰地看到聚焦點(diǎn)周圍很小的范圍(2°),利用這一特性,我們可以通過降低周圍的分辨率來降低對(duì)像素?cái)?shù)量的需求,以及計(jì)算機(jī)和傳輸性能的要求。
上圖是人類左眼的分辨率曲線(CC-BY-SA 3.0授權(quán))。可見只有眼球中央凹(Fovea centralis)附近的區(qū)域有較高的分辨率,周圍的分辨率急轉(zhuǎn)直下,甚至不及中央十一。
要利用這一特性,我們需要在VR頭顯中植入眼球追蹤設(shè)備。它可以通過追蹤眼球中央凹的移動(dòng)來獲知用戶的眼睛正看向哪個(gè)點(diǎn),然后在這一點(diǎn)周圍使用全清晰度渲染,其他地方使用低清晰度渲染。目前眼球追蹤技術(shù)已經(jīng)非常成熟,但相關(guān)產(chǎn)品都還是以頭顯插件的方式存在,比如我們這里有一只樣機(jī),可以插入Vive頭顯使用;但由于設(shè)備太大,戴眼鏡的用戶就無法使用了;這個(gè)設(shè)備需要使用USB線連接,走線上也很繁冗。不過相信下一代的VR頭顯就會(huì)開始集成此類設(shè)備,也就不存在這些問題了。根據(jù)nVidia的說法,應(yīng)用這一技術(shù)可以將渲染性能提高2到3倍。
不過眼球跟蹤并不能實(shí)際降低對(duì)頭顯像素?cái)?shù)量的需求。有的朋友在此基礎(chǔ)上設(shè)想了一種機(jī)構(gòu),使得顯示面板可以快速根據(jù)眼球的位置來移動(dòng),這樣就只需要極低的分辨率了。我不能否認(rèn)這種技術(shù)在未來出現(xiàn)的可能性,但人眼的轉(zhuǎn)動(dòng)速度可以達(dá)到900°/s,很難想像有何種設(shè)備既能夠提供足夠的扭矩來低延時(shí)地跟蹤這樣高速的移動(dòng),又能小到能放進(jìn)頭顯里(開個(gè)腦洞,也許使用類似Olympus微單防抖系統(tǒng)那樣的磁懸浮面板?)。
換一種思路,由于目前的VR頭顯都是通過一塊(菲涅爾)透鏡來將矩形(接近正方形)的顯示面板矯正為符合人眼的視野,面板上的某些像素實(shí)際上是被浪費(fèi)掉的。譬如面板上只有內(nèi)接的近圓形區(qū)域里的內(nèi)容才會(huì)被看到,四個(gè)角上的像素實(shí)際上是完全用不到的,所以根本不需要去渲染。再比如由于透鏡的特性,邊緣的可視像素密度比中心要低,因此也沒有必要使用全分辨率渲染。nVidia的Multi-res Shading技術(shù)就利用了這一特性,使得渲染性能可以提高33%-50%。
nVidia Multi-res Shading示意圖,邊緣的部分像素密度較低,因此以較低的精度渲染。
盡管這些技術(shù)看上去能有效地節(jié)約像素?cái)?shù)量,但需要注意的是,因?yàn)樯a(chǎn)難度和成本問題,實(shí)際情況下基本上不可能去生產(chǎn)像素密度不均勻的顯示面板。因此這些技術(shù)只能用于緩解對(duì)計(jì)算機(jī)性能的要求。
刷新率方面,盡管我們知道24 fps已經(jīng)能提供連續(xù)的畫面、60 fps的游戲?qū)τ诮^大多數(shù)人來說已經(jīng)足夠流暢;對(duì)于VR來說,為了提供足夠的沉浸感,這些刷新率都遠(yuǎn)遠(yuǎn)不夠。理論上人眼最大可以感知到1000 fps的畫面(維基百科說的,我也沒有查到引用來源);對(duì)于未經(jīng)訓(xùn)練的人來說,150-240 fps的畫面已經(jīng)顯得足夠真實(shí)。因此Vive、Oculus的90 Hz,以及PSVR的120 Hz都還太低。而如果要達(dá)到理想的刷新率,VR對(duì)機(jī)器性能的需求和傳輸帶寬的壓力還會(huì)進(jìn)一步提升一到兩倍。
(審核編輯: 林靜)
分享