在上一篇文章《什么是GPU?GPU有什么用?》曾提及可編程著色器,可編程著色器對于 3D 游戲的設(shè)計者來說可謂有巨大的優(yōu)點,不過同時也給 GPU 工程師帶來了一些和 CPU 類似的有趣的問題。因需要發(fā)送指令(instruction)運行,解碼(decode)和執(zhí)行指令(execute)過程必不可少,而著色器代碼中判斷語句和循環(huán)語句也會引起執(zhí)行次序的小問題等等。這意味著著色器核心已經(jīng)能成為一個小型的計算引擎去執(zhí)行任何的編程任務(wù),盡管不如 CPU 那么靈活多變,但也能執(zhí)行有用的、非圖形相關(guān)的任務(wù)。
GPU 計算
而現(xiàn)在利用 GPU 計算的任務(wù)基本都是高度并行的——同時執(zhí)行大量小型的數(shù)學(xué)計算,所以當(dāng)前其發(fā)展方向是機器學(xué)習(xí)(machine learning)和計算機視覺(computer vision)。隨著 GPU 計算擴展的領(lǐng)域越來越大,作用也會隨著越發(fā)重要,它就能成為和 CPU 并排的伙伴而不再是 CPU 附屬的一個部件。
在 2015 年 10 月 ARM 發(fā)布最新的 SoC 時順帶還有 CoreLink CCI-550,它的作用就是將 CPU、GPU、主存儲器和各種內(nèi)存緩沖區(qū)連接在一起。新的 GPU 代號為 Mimir,能夠從高速緩存內(nèi)存里直接獲取數(shù)據(jù),甚至在 CPU 執(zhí)行變動時,GPU 無需通過主存儲器就能獲得和 CPU 一樣的數(shù)據(jù)。CCI-550 也允許 CPU 和 GPU 共享相同的內(nèi)存,無需在 CPU 和 GPU 的緩沖區(qū)之間復(fù)制數(shù)據(jù)。
統(tǒng)一著色器(Unified shaders)和 Vulkan
OpenGL ES 3.0(或相近的 DirectX 版本) 對比 OpenGL ES 2.0 最大的變化就是統(tǒng)一著色器。查看 Mali-470 的模型圖,就能發(fā)現(xiàn)兼容 OpenGL ES 2.0 的 GPU 有兩種類型的著色器,分別稱作“頂點(Vertex Processor)”和“片段(Fragment Processor)”,就是之前介紹過的頂點著色器和片段著色器。Mali-470 有 1 個頂點著色器和 4 個片段著色器,而查看 Mali-T860 的模型圖就會發(fā)現(xiàn)它支持 16 個能作為頂點著色器或片段著色器的統(tǒng)一著色器,此前著色器可能會空閑的情況被消除了。
2016 年 2 月發(fā)布的 3D 圖形 API——Vulkan 是另一個重點,它帶來了兩個重要的創(chuàng)新。一是通過降低驅(qū)動程序的消耗和提高 CPU 多線程使用率,帶來顯著的性能提升;二是為桌面系統(tǒng)、移動系統(tǒng)和控制臺提供了一個統(tǒng)一的 API。Vulkan 現(xiàn)支持 Windows 7/8/10、SteamOS、Android 和部分 Linux 發(fā)行版,首款支持 Vulkan 的 Android 機器是三星的 Galaxy S7。
電源問題
不同于 PC 上的顯卡,它們擁有大的風(fēng)扇、復(fù)雜的冷卻系統(tǒng),部分有需要的還會直接供電,智能手機和平板上的 GPU 體積無法和這些顯卡相比。加上智能手機的 GPU 由電池供電,所以與桌面級的顯卡相比,這些移動版的 GPU 不能大量的消耗能源,更要控制熱量的散發(fā)。然而作為消費者的我們肯定是希望它能有更強的圖形性能,所以對于移動版 GPU 工程師來說,最大的挑戰(zhàn)不是支持最新的 3D API,而是更高的圖形性能與發(fā)熱、能耗之間如何達到一個平衡。
總結(jié)
回顧一下這次兩篇文章的重點:移動 3D 圖形基于三角形,模型進行移動、縮放是對三角形的頂點進行處理;GPU 里面的可編程執(zhí)行單元被稱為著色器核心,游戲開發(fā)者可以編寫基于著色器核心的代碼;頂點著色器處理完后,交由片段著色器轉(zhuǎn)換為一個個像素,最終送到像素著色器設(shè)置顏色;3D 游戲開發(fā)者可以根據(jù)需要編程自由調(diào)用頂點著色器和片段著色器;GPU 并行處理的特性讓其非常適合用于機器學(xué)習(xí)和計算機視覺。
(審核編輯: 滄海一土)
分享