最近,總部位于美國奧斯汀的 Mythic 推出了 Mythic 模擬矩陣處理器(Mythic AMP)一種單芯片模擬計算設(shè)備。該M1076 AMP采用Mythic的模擬計算引擎(Analog Compute Engine :ACE),能以十分之一功耗提供GPU的計算能力。
M1076 的功耗為 3瓦,每秒可執(zhí)行高達 25 萬億次操作(TOPS)。新產(chǎn)品線包括單芯片、適用于低占用空間應(yīng)用的 PCIe M2 卡和最多16個芯片的 PCIe 卡?,F(xiàn)在,邊緣設(shè)備可以以更高的分辨率和幀速率執(zhí)行復(fù)雜的AI 應(yīng)用程序,從而產(chǎn)生卓越的推理結(jié)果。計算發(fā)生在存儲數(shù)據(jù)的同一個地方。
上個月,Mythic在 C 輪融資中籌集了 7000 萬美元,黑石是主要投資者,由惠普企業(yè)(HPE)共同領(lǐng)導(dǎo)。
為什么是Mythic的AMP?
在傳統(tǒng)計算機中,數(shù)據(jù)會定期從 DRAM 內(nèi)存?zhèn)鬏數(shù)?CPU。內(nèi)存保存程序和數(shù)據(jù)。計算機中的處理器和內(nèi)存是分開的,數(shù)據(jù)在兩者之間移動。多年來,處理器速度急劇上升。與此同時,內(nèi)存的進步主要集中在密度——在更小的空間中存儲更多數(shù)據(jù)的能力——而不是傳輸速率,導(dǎo)致延遲。
簡而言之,處理器無論速度有多快,在從內(nèi)存中獲取數(shù)據(jù)時都必須處于空閑狀態(tài),并且取決于傳輸速率——這就是所謂的馮諾依曼限制。因此,將計算和內(nèi)存合并到單個設(shè)備中就成為了大家探索的解決方法,而模擬 AI 就消除了馮諾依曼瓶頸,從而顯著提高了性能。此外,由于沒有數(shù)據(jù)傳輸,任務(wù)可以在很短的時間內(nèi)完成,并且消耗的能量也少得多。
每個 Mythic ACE 都配有一個數(shù)字子系統(tǒng),包括 32 位 RISC-V 納米處理器、64KB SRAM、SIMD 矢量引擎和高吞吐量片上網(wǎng)絡(luò)(NoC)路由器。模擬矩陣處理器能夠以高達 25 TOPS 的速度提供高能效的 AI 推理。
‘邊緣設(shè)備現(xiàn)在可以部署強大的 AI 模型,而不會面臨高功耗、熱管理和外形尺寸限制的挑戰(zhàn),’該公司表示。
邊緣人工智能
Mythic 的主要重點是邊緣 AI 部署。該公司還在數(shù)據(jù)中心提供服務(wù)器級計算。企業(yè)可以使用邊緣 AI 來部署在邊緣設(shè)備上本地運行的ML 模型。然而,邊緣人工智能面臨一些挑戰(zhàn):
低功耗:設(shè)備的功耗和相關(guān)熱量隨著更多功能和功能的添加而增加。有時,它們由功率預(yù)算有限的以太網(wǎng)供電(PoE)供電。即使在 0.5 或 2W 時,設(shè)備也需要表現(xiàn)出強大的性能。
不使用時功率應(yīng)該接近于零,并且這些不同模式之間的切換應(yīng)該快速而簡單。
小尺寸:在數(shù)據(jù)源運行的AI算法具有最小的延遲問題,并且不會因視頻壓縮而損失準(zhǔn)確性;因此,不需要大型 PCIe 卡、大型散熱器或風(fēng)扇。整個系統(tǒng)需要適合其他人使用的 22mm x 30mm M.2 A+E 卡。
即使使用更大的 PCIe 卡,加速器和冷卻解決方案的大小也決定了可以塞入多少 AI。
成本效益:以可承受且有效的價格提供高功率計算的能力為客戶提供了根據(jù)客戶需求進行擴展的自由度。
迄今為止,該公司已經(jīng)籌集了 1.652 億美元,用于為智能家居、智慧城市、AR/VR、無人機、視頻監(jiān)控甚至制造業(yè)輕松且經(jīng)濟高效地部署強大的人工智能。
(審核編輯: 海藍之心)