人工智能處理器降低功耗帶來(lái)的挑戰(zhàn)與機(jī)遇
作者:David Lammers
“對(duì)于邊緣技術(shù)來(lái)說(shuō),關(guān)鍵在于如何優(yōu)化所需性能,同時(shí)最大限度地降低功耗。”
鑒于疫情期間,行業(yè)活動(dòng)已普遍轉(zhuǎn)變?yōu)樘摂M活動(dòng),年初至今我已經(jīng)參加了6次線上半導(dǎo)體會(huì)議。討論的熱門主題之一是人工智能(AI)和深度學(xué)習(xí)(DL)芯片,這是一個(gè)不斷發(fā)展的領(lǐng)域,范圍涵蓋了廣泛的技術(shù)和器件類型。一項(xiàng)共同主題是關(guān)注內(nèi)存優(yōu)化和解決功耗/內(nèi)存瓶頸。
人工智能是一個(gè)炙手可熱的市場(chǎng)。據(jù)ABI Research估計(jì),2024年整個(gè)人工智能芯片市場(chǎng)將達(dá)到210億美元。令人驚訝的是,基于ASIC的人工智能加速器占據(jù)了市場(chǎng)的很大一部分,預(yù)計(jì)到2024年,其價(jià)值將增長(zhǎng)三倍,達(dá)到90億美元的總可用市場(chǎng)(TAM),年復(fù)合增長(zhǎng)率(CAGR)為30%。
各家公司都想方設(shè)法,研發(fā)出低能耗的訓(xùn)練和推理處理解決方案。雖然機(jī)器學(xué)習(xí)只占數(shù)據(jù)中心總功耗的一部分,但這一部分功耗正在迅速擴(kuò)大。2017年,數(shù)據(jù)中心消耗的電力約占美國(guó)總電力的3%,2020年這一數(shù)字翻了一倍,達(dá)到了6%。智能邊緣器件的普及也在加速。根據(jù)市場(chǎng)研究公司IDC的數(shù)據(jù),未來(lái)十年將有1,250億個(gè)“物品”連接到互聯(lián)網(wǎng)上,屆時(shí)每年將創(chuàng)建、捕獲、復(fù)制和消費(fèi)近60澤字節(jié)的數(shù)據(jù)。
很明顯,我們的行業(yè)面臨著一項(xiàng)重大挑戰(zhàn):如何在邊緣部署多個(gè)智能設(shè)備,在邊緣以極低的功耗推斷所有數(shù)據(jù),并在云端管理、處理和訓(xùn)練指數(shù)級(jí)增長(zhǎng)的數(shù)據(jù),同時(shí)將功耗保持在控制水平內(nèi)。
人工智能參考封裝發(fā)展
格芯®(GLOBALFOUNDRIES®)計(jì)算業(yè)務(wù)部副總裁Hiren Majmudar表示:“在推理和訓(xùn)練中都存在功耗瓶頸”,而格芯技術(shù)產(chǎn)品很好地解決了這一點(diǎn),無(wú)論是基于FinFET的12LP (12nm FinFET)平臺(tái)和12LP+解決方案,還是基于全耗盡型SOI的平面22FDXTM (22nm FD-SOI)平臺(tái)。
Hiren Majmudar
基于FinFET技術(shù)的人工智能處理器,無(wú)論是用于云端還是邊緣,都具有功率和成本優(yōu)勢(shì)。12LP+解決方案能夠以高于1 Ghz的速度運(yùn)行人工智能內(nèi)核,并采用全新的低電壓SRAM和支持在0.55V下工作的標(biāo)準(zhǔn)單元庫(kù)。格芯先進(jìn)的FinFET解決方案12LP+于今年投產(chǎn),與12LP基礎(chǔ)平臺(tái)相比,其雙功函數(shù)FET的邏輯性能最高可提高20%,相當(dāng)于功耗最高可降低40%。
他表示:“我們客戶使用獨(dú)特的架構(gòu),往往依賴一組有限的標(biāo)準(zhǔn)單元。我們一直致力于研究設(shè)計(jì)技術(shù)協(xié)同優(yōu)化(DTCO),并開發(fā)了人工智能參考封裝,可通過(guò)一套預(yù)封裝元件來(lái)充分發(fā)揮潛能。借助合作DTCO模式,我們的客戶可以快速將SoC目標(biāo)推向市場(chǎng)。DTCO工作包括基于客戶自身架構(gòu)的設(shè)計(jì)分析服務(wù),以針對(duì)性能、功率和面積(PPA)進(jìn)行優(yōu)化。”
Majmudar表示,最佳PPA因具體應(yīng)用而不同。
他表示:“所有的細(xì)分市場(chǎng)都非常關(guān)注成本。對(duì)于云計(jì)算來(lái)說(shuō),指標(biāo)是每瓦TOPS,以最低的功耗獲得最佳性能。對(duì)于邊緣技術(shù)來(lái)說(shuō),關(guān)鍵在于如何優(yōu)化所需性能,同時(shí)最大限度地降低功耗。”
Majmudar表示,對(duì)于開發(fā)“即時(shí)開啟或永遠(yuǎn)在線”人工智能應(yīng)用的客戶來(lái)說(shuō),22FDX的eMRAM產(chǎn)品具有很強(qiáng)的優(yōu)勢(shì)。他補(bǔ)充道:“eMRAM有很多應(yīng)用,可幫助客戶實(shí)現(xiàn)高密度和非易失性。另一項(xiàng)功能是模擬存儲(chǔ)器內(nèi)計(jì)算。”
人工智能工作負(fù)載范圍很廣,除了訓(xùn)練和推理外,還包括語(yǔ)音、視覺和成像。他表示:“我們是一家專業(yè)晶圓廠,不斷推出創(chuàng)新的IP產(chǎn)品。我們持續(xù)投資IP、晶圓到晶圓互聯(lián)、存儲(chǔ)器和接口IP領(lǐng)域。我們擁有明確的路線圖,并吸收客戶的意見不斷改進(jìn)。”
創(chuàng)新型初創(chuàng)公司
我計(jì)劃在未來(lái)的博客中,詳細(xì)介紹格芯如何與該領(lǐng)域的初創(chuàng)公司開展合作,但本文將先介紹其中一家公司,以便讓大家初步了解格芯客戶在人工智能芯片方面的豐富創(chuàng)新成果。
全耗盡型絕緣體上硅平臺(tái)經(jīng)過(guò)專門設(shè)計(jì),支持動(dòng)態(tài)電壓、頻率微縮和自動(dòng)時(shí)鐘門控。由此實(shí)現(xiàn)了超低功耗的信號(hào)處理和神經(jīng)網(wǎng)絡(luò)算法,可用于電池供電的物聯(lián)網(wǎng)設(shè)備。
Perceive是Xperi Corp.擁有多數(shù)股權(quán)的子公司,旨在為超低功耗消費(fèi)器件中的傳感器數(shù)據(jù)提供人工智能推理。Perceive的“Ergo”邊緣推理處理器能夠在設(shè)備上處理大型神經(jīng)網(wǎng)絡(luò),其效率是目前支持推理的處理器的20至100倍。
該公司專注于通過(guò)集成神經(jīng)網(wǎng)絡(luò)處理技術(shù)實(shí)現(xiàn)安全攝像頭、智能家電和移動(dòng)設(shè)備,而無(wú)需將數(shù)據(jù)發(fā)送到云端進(jìn)行推理處理。