以數(shù)據(jù)中心、云計算和人工智能為代表的高性能計算類應(yīng)用的發(fā)展,驅(qū)動算力需求不斷攀升,但目前單一計算類型和架構(gòu)的處理器已經(jīng)無法處理更復(fù)雜、更多樣的數(shù)據(jù)。如何在增強(qiáng)數(shù)據(jù)中心算力和性能的同時,具備應(yīng)對多類型任務(wù)的處理能力,成為全球性的技術(shù)難題。在計算領(lǐng)域龍頭芯片企業(yè)的不斷探索和研究中,異構(gòu)計算成為公認(rèn)的算力突破“抓手”。
芯片巨頭紛紛發(fā)力異構(gòu)計算
異構(gòu)計算可以提高算力和性能,降低功耗和成本,又具備多類型任務(wù)的處理能力,業(yè)內(nèi)廣泛認(rèn)為是未來高性能計算領(lǐng)域的市場主導(dǎo)。英偉達(dá)、英特爾、AMD作為行業(yè)領(lǐng)頭羊,近兩年在異構(gòu)計算方面的新產(chǎn)品層出不窮。
英特爾在最近的投資者會議中提出了一款將x86和Xe GPU 整合到一個Xeon插槽中的新架構(gòu)Falcon Shores。英特爾中國研究院院長宋繼強(qiáng)向《中國電子報》記者介紹到,將x86的主芯片和GPU的性能整合在一起,這是一個創(chuàng)新。在性能上,F(xiàn)alcon Shores將提供超過5倍的每瓦性能、計算密度以及內(nèi)存容量和帶寬。
英偉達(dá)在今年的GTC2022上,宣布推出首款面向AI基礎(chǔ)設(shè)施和高性能計算的基于Arm Neoverse的數(shù)據(jù)中心專屬CPU——Grace CPU 超級芯片。該芯片專為AI、HPC、云計算和超大規(guī)模應(yīng)用而設(shè)計,由兩個CPU芯片組成,兩者通過NVLink-C2C進(jìn)行互連。根據(jù)NVIDIA實(shí)驗(yàn)室使用同類編譯器估算,這一結(jié)果較當(dāng)前的DGX A100要高1.5倍以上。
AMD完成對賽靈思的合并后,將其CPU與賽靈思的FPGA結(jié)合為CPU+FPGA的異構(gòu)模式。借助賽靈思在5G、通信、自動駕駛和行業(yè)領(lǐng)域的資源,AMD能夠?qū)⒏咝阅苡嬎隳芰敫囝I(lǐng)域。AMD全球高級副總裁、大中華區(qū)總裁潘曉明曾在2021世界半導(dǎo)體大會上表示:“今天和未來的工作負(fù)載需要強(qiáng)大的計算能力,異構(gòu)計算是未來的關(guān)鍵。AMD未來在計算、圖形和解決方案的三個方面聚焦高性能計算,在持續(xù)發(fā)展的行業(yè)中保持高性能計算領(lǐng)導(dǎo)力?!?/p>
異構(gòu)計算瓶頸待突破
異構(gòu)的優(yōu)勢顯而易見,與此同時暴露出的技術(shù)難題也越來越多。一是,異構(gòu)計算產(chǎn)品需要面對不同的系統(tǒng)架構(gòu)、指令集和編程模型,需要降低多樣計算帶給軟件開發(fā)者的難度;二是,異構(gòu)計算芯片產(chǎn)品除了在芯片設(shè)計層面實(shí)現(xiàn)突破之外,還需要解決其在芯片制造、制程和封裝過程中不同結(jié)構(gòu)之間的適配和升級;三是,異構(gòu)計算要實(shí)現(xiàn)性能的多樣性合一,使其同時滿足人工智能訓(xùn)練、推理、圖像視頻處理等各種不同的需求。
燧原科技創(chuàng)始人兼CEO趙立東在接受《中國電子報》記者采訪時表示,從產(chǎn)業(yè)規(guī)范與標(biāo)準(zhǔn)層面看,異構(gòu)計算是指在完成一個計算任務(wù)時,采用一種以上的硬件計算單元、互聯(lián)協(xié)議、差異化架構(gòu)、軟件接口等,由于不同的硬件設(shè)備、協(xié)議、應(yīng)用二進(jìn)制接口(ABI)、軟件應(yīng)用層接口(API)等都存在著巨大的差異,如何構(gòu)建一個高效、系統(tǒng)化的協(xié)調(diào)統(tǒng)一的異構(gòu)計算系統(tǒng),就成為異構(gòu)計算最為關(guān)鍵的技術(shù)問題。
宋繼強(qiáng)同樣表示,異構(gòu)計算在技術(shù)方面、互連方面和軟件方面都面臨瓶頸,仍然沒有達(dá)到要求。一是技術(shù)設(shè)計流程的協(xié)同問題。要保證與其他不同廠商的芯粒一起互聯(lián)互通、協(xié)同工作時,電和傳輸通路不出現(xiàn)問題。二是需要統(tǒng)一各廠商芯粒之間的互連標(biāo)準(zhǔn)。未來全球各大芯片制造商、科技巨頭的芯??赡軙稍谝粋€芯片上,目前它們之間的互連標(biāo)準(zhǔn)并不統(tǒng)一,各個廠商之間并沒有做好互聯(lián)互通的準(zhǔn)備。最近英特爾攜手業(yè)界部分企業(yè),推出了UCIe標(biāo)準(zhǔn),未來可以把不同廠商的芯粒連到一起,形成一個符合要求的、大的、封裝級的集成芯片。三是軟件層面要過關(guān)。不同廠商的計算芯片之間要做出最好的I/O、內(nèi)存的通道。
東數(shù)西算帶來新風(fēng)口
當(dāng)下正值我國“東數(shù)西算”工程建設(shè)穩(wěn)步推進(jìn)之際。這一宏觀戰(zhàn)略,對數(shù)據(jù)中心、計算、存儲、數(shù)據(jù)通信、光傳輸?shù)犬a(chǎn)品有較高建設(shè)需求,從而帶動了我國計算領(lǐng)域的整體發(fā)展,形成了諸多新風(fēng)口,其中數(shù)據(jù)中心的建設(shè)是底層基礎(chǔ)中最重要的一環(huán)。
宋繼強(qiáng)表示,“東數(shù)西算”是個非常棒的工程。首先,它非常精準(zhǔn)地看到了未來在數(shù)字化轉(zhuǎn)型之后,所需要的大量算力,而算力本身又分成很多種,并不是建一個大的計算中心就能解決所有問題。所以要先將算力網(wǎng)搭建起來,按照數(shù)據(jù)的產(chǎn)生和算力的使用情況,形成一個比較完美的布局。
宋繼強(qiáng)明確指出,異構(gòu)是“東數(shù)西算”的底層支撐?!皷|數(shù)西算”所需的大型計算中心內(nèi)部,CPU、GPU、FPGA、DPU、專用加速器等,對處理不同種類的工作數(shù)據(jù)各有優(yōu)勢與劣勢,也有運(yùn)營成本高低之分,所以未來一定要綜合部署,多種架構(gòu)可能都需要涵蓋,而且要有機(jī)聯(lián)合起來。
趙立東認(rèn)為,異構(gòu)計算對于“東數(shù)西算”來說是剛需。從半導(dǎo)體集成電路發(fā)展特性來講,它是“贏家通吃”的——不管是從內(nèi)部的產(chǎn)品業(yè)務(wù)布局還是外部的生態(tài)與商業(yè)布局出發(fā),單個數(shù)據(jù)中心或智算中心項目在落地時,會考慮異構(gòu)計算的復(fù)雜性及發(fā)展不完備性所帶來的巨大的額外部署成本,在一定程度上會偏好選擇以單一廠商為核心的現(xiàn)成產(chǎn)品組合,盡量避免技術(shù)適配投入。而置身于“東數(shù)西算”政策背景下,最終要實(shí)現(xiàn)的是全國算力中心的大一統(tǒng),從而盡可能地優(yōu)化利用資源,在多個數(shù)據(jù)中心或智算中心進(jìn)行互聯(lián)互通的場景下,異構(gòu)計算的復(fù)雜性會是前所未有的。因此,在異構(gòu)算力溯源、調(diào)度與管理平臺的建設(shè)上,需要盡早布局與投入。
算力網(wǎng)絡(luò)的構(gòu)建不只依賴于異構(gòu)計算,通用計算也將為“東數(shù)西算”提供更多助力。近兩年,國內(nèi)涌現(xiàn)出一批通用計算芯片初創(chuàng)企業(yè),以FPGA和ASIC類型芯片作為切入點(diǎn),或者購買國外公司的IP授權(quán)開發(fā)通用GPU芯片,其中也有少數(shù)企業(yè)自主研發(fā)通用GPU核心IP,實(shí)現(xiàn)了國內(nèi)通用計算的突破。
天數(shù)智芯副總裁郭為向《中國電子報》記者表示,通用計算所構(gòu)建的算力平臺通常并行處理能力特別強(qiáng),計算能效比高,并且有很大的存儲帶寬,能夠釋放非??捎^的算力。
郭為提出要強(qiáng)化頂層謀劃,將算力網(wǎng)絡(luò)上升為國家戰(zhàn)略,從全局層面整體謀劃其戰(zhàn)略定位、發(fā)展目標(biāo),加快構(gòu)建新型算力網(wǎng)絡(luò)格局。此外,還應(yīng)成立國家重點(diǎn)實(shí)驗(yàn)室,打造重大原創(chuàng)技術(shù)的策源地。優(yōu)化異構(gòu)計算產(chǎn)業(yè)布局,發(fā)揮龍頭領(lǐng)軍企業(yè)的“鏈長”作用,協(xié)同上下游企業(yè),制定產(chǎn)業(yè)鏈供應(yīng)鏈圖譜及協(xié)同發(fā)展計劃,推動異構(gòu)計算產(chǎn)業(yè)鏈本土化、供應(yīng)鏈多元化,確保異構(gòu)計算產(chǎn)業(yè)安全穩(wěn)定。
(審核編輯: 智匯聞)