加入收藏
 免費注冊
 用戶登陸
首頁 展示 供求 職場 技術(shù) 智造 職業(yè) 活動 視點 品牌 鐠社區(qū)
今天是:2026年3月17日 星期二   您現(xiàn)在位于: 首頁 →  技術(shù) → 電子材料(技術(shù)聚焦)
通過架構(gòu)定制(DSA)迭代為AI提供通用算力
2023/4/12 13:37:40    
Domain-Specific Architectures(DSA)是后摩爾時代持續(xù)提升處理器性能的一種技術(shù)理念,即采用可編程的專用集成電路(ASICs)去加速特定的高強度的處理器負(fù)載,比如加速圖形渲染、加速AI神經(jīng)網(wǎng)絡(luò)的前向推理計算、提高巨量網(wǎng)絡(luò)數(shù)據(jù)的吞吐等。

架構(gòu)的定義包含指令集架構(gòu)與微架構(gòu)。指令集架構(gòu)是軟件與硬件進行對話的接口,如果說一條指令是一個單詞,那么指令集(ISA)就是詞典,而軟件程序就像是一本使用特定詞典中的詞匯編寫出來的一本書。

通過對架構(gòu)進行面向特定領(lǐng)域的設(shè)計,縮小應(yīng)用范圍,獲得更高的性能,或者更好的能效比,保持可編程的靈活性,這就是DSA的理念。
- 面向領(lǐng)域的架構(gòu)設(shè)計可以以較低的成本獲取較高的算力,以滿足算力需求。
- 指令集架構(gòu)的可編程性帶來了相對通用的算力,為下一代算法的應(yīng)用和覆蓋更廣泛的領(lǐng)域提供了無限的可能。

GPU也是一種的DSA,GPU的發(fā)展論證了DSA取得的成功。DSA、GPU、AI這是個互相成就的故事。而Nvidia的GPGPU硬件的成功,與其CUDA生態(tài)豐富的算力軟件包、易于使用的編程接口、優(yōu)秀的編譯器脫不開干系。由此我們可以得出一條結(jié)論,對于DSA算力硬件來說,這些都是走向商業(yè)成功的必要條件。

從TX1推出開始,對標(biāo)TX1的競品層出不窮。TX1的算力來自于GPGPU,而更加客制化的ASIC,利用卷積操作的空間局部性進行數(shù)據(jù)復(fù)用的精妙設(shè)計,在達到同等甚至更高算力的同時硬件的成本更低。最普遍的設(shè)計是一個高能效比的CPU小核如Arm Cortex A7/A53加固化的2D圖像處理(CV)模塊與固化的神經(jīng)網(wǎng)絡(luò)處理(DNN/NPU)模塊。

由于小CPU的計算能力非常受限,將主要負(fù)責(zé)應(yīng)用軟件的任務(wù)調(diào)度部分,AI應(yīng)用的前處理(非DNN算法模型部分)主要由2D圖像處理模塊來承接。問題在于前處理是非常碎片化的算法,除了個別的插值、顏色域轉(zhuǎn)換功能幾乎所有圖像處理軟件都會用到,其他所需功能非常的廣泛。僅OpenCV的核心函數(shù)、圖像處理函數(shù)就包含矩陣變換、濾波、分辨率變換、顏色空間轉(zhuǎn)換、直方圖等等幾個大類,其中每個大類中的子方法又會有若干個,無法定義哪些功能需要被固化。這還不包含3D數(shù)據(jù)處理能力與特征描述子的使用。算法廠商的需求各不相同,固化的多了浪費面積,固化的少了產(chǎn)品開發(fā)的難度將大幅提升。

ONNX是一種針對機器學(xué)習(xí)所設(shè)計的開放式的文件格式,用于存儲訓(xùn)練好的模型。它使得不同的人工智能框架訓(xùn)練得到的網(wǎng)絡(luò)模型可以以相同的格式進行存儲。 ONNX的規(guī)范及代碼主要由微軟,亞馬遜,F(xiàn)acebook和IBM等公司共同開發(fā)。以NVIDIA的AI軟件生態(tài)中最富盛名的DNN推理開發(fā)工具庫TensortRT為例,5.1版本支持87個ONNX算子,到了7.1版本支持的ONNX算子數(shù)量為108個。功能高度固化的ASIC無法對新增的算子計算類型進行支持,將會越來越約束算法的迭代。而在這之上進行AI產(chǎn)品開發(fā)的算法工程師們無異于是戴著鐐銬跳舞。

Google公司研發(fā)了張量處理單元 (TPU),TPU v1 于2015年投入生產(chǎn),并被谷歌內(nèi)部用于其應(yīng)用程序。TPU是一種應(yīng)用于AI領(lǐng)域,為AI算法提供算力的ASIC,利用了神經(jīng)網(wǎng)絡(luò)對于數(shù)值精度不敏感的特性,其思想核心是采用低精度矩陣Systolic Array提供巨大算力,同時提供滿足AI需求的最小化的運算功能。此版本(即TPUv1)的云服務(wù)從未對用戶開放開發(fā)使用,F(xiàn)在TPUv2以及后續(xù)版本被廣泛的應(yīng)用于谷歌的搜索排序、語音識別、以圖搜圖、谷歌翻譯等領(lǐng)域。

通過以上的成功案例我們可以發(fā)現(xiàn),GPGPU、TPU的迭代的共同點是通過越來越高度的架構(gòu)定制帶來了越來越澎湃的專用算力。同時保留或者新增通用的算力。通過高度優(yōu)化的編譯器和豐富的軟件棧,讓用戶能夠輕松的將硬件算力充分地利用起來。那么通用算力、編譯器、軟件棧這些顯然都在CPU平臺是最豐富最成熟的,而對于CPU來說 “Domain-specific architecture design is all you need”。(張底剪報)
→ 『關(guān)閉窗口』
 365pr_net
 [ → 我要發(fā)表 ]
上篇文章:合作應(yīng)對來自小芯片封裝的10大挑戰(zhàn)
下篇文章:數(shù)字聲紋,讓我們通過聲音辨別出一個人
→ 主題所屬分類:  電子材料 → 技術(shù)聚焦
 熱門文章
 如何申請EtherCAT技術(shù)協(xié)會(ETG)會員資格 (200276)
 臺北國際計算機展(COMPUTEX 2015)參展商名… (107848)
 上海市集成電路行業(yè)協(xié)會(SICA) (96787)
 USB-IF Members Company List (89195)
 第十七屆中國專利優(yōu)秀獎項目名單(507項) (78097)
 蘋果授權(quán)MFi制造商名單-Authorized MFi Lic… (73526)
 臺北國際計算機展(COMPUTEX 2015)參展商名… (70797)
 中國130家太陽能光伏組件企業(yè)介紹(3) (59402)
 PLC論壇 (54257)
 中國130家太陽能光伏組件企業(yè)介紹(2) (50760)
 最近更新
 涉及圖形用戶界面的產(chǎn)品外觀設(shè)計專利申請指引 (12月18日)
 jpg、gif、png、webp等主流圖片格式選擇建議 (9月9日)
 AI演進推動5G與Wi-Fi連接方式的變革 (9月6日)
 晶振:人工智能時代的精密脈搏 (8月29日)
 晶振—機械臂高精度動作的“隱形指揮官” (8月29日)
 趨膚效應(yīng)(Skin Effect)對電子電器的影響及應(yīng)… (8月18日)
 一本面向設(shè)計工程師精心修訂和更新的《ESD應(yīng)用手冊… (3月10日)
 表皮電子學(xué)的代表作:石墨烯紋身 (2月26日)
 在晶圓級大規(guī)模生產(chǎn)中引入脈沖激光沉積(PLD)技術(shù) (1月21日)
 你聽說過PiezoMEMS技術(shù)嗎? (1月21日)
 文章搜索
搜索選項:            
  → 評論內(nèi)容 (點擊查看)
您是否還沒有 注冊 或還沒有 登陸 本站?!
關(guān)于我們 ┋ 免責(zé)聲明 ┋ 產(chǎn)品與服務(wù) ┋ 聯(lián)系我們 ┋ About 365PR ┋ Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產(chǎn)通互聯(lián)網(wǎng)有限公司 版權(quán)所有
E-mail:postmaster@365pr.net 不良信息舉報 備案號:粵ICP備06070889號