|
 【產(chǎn)通社,7月18日訊】英特爾公司(Intel?Corporation;NASDAQ股票代碼:INTC)官網(wǎng)消息,其AI產(chǎn)品戰(zhàn)略暨Gaudi2新品發(fā)布會7月11日在京舉行。會上,英特爾正式于中國市場推出第二代Gaudi深度學習加速器——Habana Gaudi 2。作為英特爾從云到端產(chǎn)品組合的重要組成,Gaudi2致力于以領(lǐng)先的性價比優(yōu)勢,加速AI訓(xùn)練及推理,為中國用戶提供更高的深度學習性能和效率,從而成為大規(guī)模部署AI的更優(yōu)解。 英特爾執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera指出,“英特爾致力于通過為客戶提供廣泛的硬件選擇,并支持開放的軟件環(huán)境,加速人工智能技術(shù)的發(fā)展。憑借包括至強可擴展處理器和Gaudi2深度學習加速器在內(nèi)的產(chǎn)品組合,英特爾正在降低人工智能的準入門檻,并強化客戶在云端通過網(wǎng)絡(luò)和智能邊緣部署這一關(guān)鍵業(yè)務(wù)技術(shù)的能力,從而幫助構(gòu)建中國人工智能的未來! 產(chǎn)品特點 該Gaudi2深度學習加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),以多方位性能與能效比提升,加速高性能大語言模型運行。該加速器具備: - 24個可編程Tensor處理器核心(TPCs) -  21個100Gbps(RoCEv2)以太網(wǎng)接口 - 96GB HBM2E內(nèi)存容量 - 2.4TB/秒的總內(nèi)存帶寬 - 48MB片上SRAM Gaudi2加速器的出色性能在6月公布的MLCommons MLPerf®基準測試中得到了充分認證,其在GPT-3模型、計算機視覺模型ResNet-50(使用8個加速器)、Unet3D(使用8個加速器),以及自然語言處理模型BERT(使用8個和64個加速器)上均取得了優(yōu)異的訓(xùn)練結(jié)果。與市場上其他面向大規(guī)模生成式AI和大語言模型的產(chǎn)品相比,Gaudi2擁有卓越的性能與領(lǐng)先的性價比優(yōu)勢,能夠幫助用戶提升運營效率的同時,降低運營成本。 此外,Gaudi2可為大規(guī)模的多模態(tài)和語言模型提供出色的推理性能。在最近的Hugging Face評估中,其在大規(guī)模推理方面的表現(xiàn),包括在運行Stable Diffusion(另一個用于從文本生成圖像的最先進生成式AI模型之一)、70億以及1760億參數(shù)BLOOMz模型時,在行業(yè)內(nèi)保持領(lǐng)先。 Gaudi2深度學習加速器的架構(gòu)旨在高效擴展,以滿足大規(guī)模語言模型及生成式AI模型的需求。其每張芯片集成了21個專用于內(nèi)部互聯(lián)的100Gbps(RoCEv2 RDMA)以太網(wǎng)接口,從而實現(xiàn)低延遲服務(wù)器內(nèi)擴展。 在Stable Diffusion訓(xùn)練上,Gaudi2展示了從1張卡至64張卡近線性99%的擴展性。此外,MLCommons剛剛公布的MLPerf訓(xùn)練3.0結(jié)果,亦驗證了Gaudi2處理器在1750億參數(shù)的GPT-3模型上,從256個加速器到384個加速器可實現(xiàn)令人印象深刻的接近線性的95%擴展效果。 供貨與報價 目前,英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學習加速器的浪潮信息AI服務(wù)器NF5698G7。該服務(wù)器集成了8顆Gaudi2加速卡HL-225B,還包含雙路第四代英特爾至強可擴展處理器。 查詢進一步信息,請訪問官方網(wǎng)站 http://www.intel.cn/content/www/cn/zh/newsroom/news/intel-launches-new-gaudi2-processor-in-prc-market.html。(張怡,產(chǎn)通發(fā)布) (完)
|