加入收藏
 免費注冊
 用戶登陸
首頁 展示 供求 職場 技術(shù) 智造 職業(yè) 活動 視點 品牌 鐠社區(qū)
今天是:2026年3月17日 星期二   您現(xiàn)在位于: 首頁 →  智造 → 辦公電子(應(yīng)用指南)
Graphcore PopRT實現(xiàn)零代碼模型推理部署
日期:2023/4/16 12:01:28   作者:
當(dāng)你和ChatGPT聊天時,你有沒有想過,在那個閃爍的光標(biāo)背后,正在發(fā)生什么?

ChatGPT在收到你的輸入指令后,到生產(chǎn)出答案的過程就是推理。AI推理是將用戶輸入的數(shù)據(jù),通過訓(xùn)練好的模型產(chǎn)生有價值信息的過程。在LLM類模型應(yīng)用、自動駕駛、量化交易、搜索、推薦等很多場景中,對于AI推理效率的要求非常高。為進一步幫助克服AI應(yīng)用部署的時延痛點,Graphcore搭配C600推出了高性能推理SDK——PopRT,幫助開發(fā)者實現(xiàn)零代碼推理部署已經(jīng)訓(xùn)好的模型,同時帶來低時延和高吞吐量,極大縮短AI業(yè)務(wù)商業(yè)變現(xiàn)時間窗口,為企業(yè)用戶贏得市場先機。


PopRT構(gòu)成


PopRT包括轉(zhuǎn)換器、編譯器和運行時:

    轉(zhuǎn)換器
        提供對op-fusion、constant-folding等廣泛使用的優(yōu)化方法內(nèi)置支持
        提供對FP16和FP8訓(xùn)練后量化的內(nèi)置支持,這種訓(xùn)練后量化可以實現(xiàn)更低的時延和更高的吞吐量,并且精度損失很小
        支持將多個模型融合為一個
    編譯器
        支持模型切分和流水線
        為運行時導(dǎo)出PopEF(Poplar可執(zhí)行格式)
    運行時
        支持自動批處理
        支持移除填充以減少對自然語言處理(NLP)模型的無用計算(或通過移除填充對自然語言處理模型進行更有效的推理)
        支持針對CV(計算機視覺)模型的多模型推理


部署和運行


Graphcore始終堅持降低IPU的使用門檻,廣泛支持各類主流的機器學(xué)習(xí)框架,讓開發(fā)者能夠在自己熟悉的環(huán)境中工作,專注創(chuàng)新。

PopRT優(yōu)化模型可與英偉達Triton和TF-Serving一起部署,并可以通過PopRT運行時API很容易地與第三方框架和服務(wù)平臺集成。


優(yōu)化推理性能


搭配Grapchore C600高端推訓(xùn)一體加速卡,PopRT使得開發(fā)者可以“一鍵”零代碼部署已經(jīng)訓(xùn)練好的AI應(yīng)用,可以大幅加速計算機視覺、自動語音識別、自然語言處理(BERT、GPT類)、多模態(tài)和推薦系統(tǒng)的AI應(yīng)用的部署速度,加速整個數(shù)據(jù)中心的各項工作負(fù)載,縮短研發(fā)到商用的時間。

欲了解各類模型在C600的優(yōu)異性能,請聯(lián)系info_china@graphcore.ai


在C600上使用PopRT


C600是擬未為云和數(shù)據(jù)中心打造的高端推訓(xùn)一體加速卡,主打推理,兼做訓(xùn)練,可以支持各種主流的AI應(yīng)用,在搜索和推薦等業(yè)務(wù)上別具優(yōu)勢。為了使得C600在推理場景發(fā)揮更大效能,PopRT在C600的基礎(chǔ)上進一步針對推理進行了優(yōu)化,低時延和高吞吐使得用戶可以高效地進行推理,一鍵部署已經(jīng)訓(xùn)好的模型。

現(xiàn)在,15億參數(shù)量的GPT2-XL已經(jīng)在C600上成功部署(詳情請見本次推送首條)。在PopRT的加持下,GPT2-XL的推理延時在C600上已經(jīng)達到1 ms/token的水平。這意味著在實際應(yīng)用場景中,模型可以快速響應(yīng)用戶的請求,極大提高用戶體驗。

查詢進一步信息,請訪問官方網(wǎng)站http://www.graphcore.cn/0-code-deploy-graphcore-poprt/,http://docs.graphcore.ai/projects/poprt-user-guide/zh_CN/latest/,http://github.com/graphcore/PopRT。(Donna Zhang,張底剪報)
→ 『關(guān)閉窗口』
 發(fā)布人:-----
 [ → 我要發(fā)表 ]
上篇文章:1700V SiC MOSFET無需考慮功率轉(zhuǎn)換中的權(quán)衡問題
下篇文章:MIPI提高新一代圖像數(shù)據(jù)的傳輸性能
→ 主題所屬分類:  辦公電子 → 應(yīng)用指南
 熱門文章
 中航光電(158廠)電連接器產(chǎn)品選型指南 (64375)
 國巨(Yageo)片式電阻電容產(chǎn)品規(guī)格書 (57637)
 下一代前傳網(wǎng)絡(luò)接口(NGFI)白皮書 (49839)
 2013年移動經(jīng)濟(The Mobile Economy 2013… (48115)
 鐳射二極管 (46552)
 使用NFC進行藍(lán)牙配對(Using NFC for Bluet… (45343)
 為濾波電路選擇合適的運算放大器 (42189)
 mirasol顯示器與競爭性顯示技術(shù)的比較 - Qualco… (41850)
 CodeWarrior Development Studio (41014)
 u-blox產(chǎn)品目錄(Product Catalog 16… (40722)
 最近更新
 風(fēng)華高科中高壓MLCC解決方案多領(lǐng)域全場景滲透 (8月29日)
 用樹莓派Pico W和Lora Hat構(gòu)建網(wǎng)格節(jié)點 (5月8日)
 用Pulsus PLD系統(tǒng)實現(xiàn)突破性piezoMEMS器件 (1月21日)
 復(fù)旦芯片實現(xiàn)感存算一體化:像人眼一樣智能 (9月29日)
 增強型人工智能為Meteor Lake處理器的設(shè)計提速 (5月15日)
 教育行業(yè)數(shù)字化自主創(chuàng)新飛騰生態(tài)解決方案白皮書 (4月2日)
 人形機器人設(shè)計原則及人類智能和內(nèi)部身體系統(tǒng)仿真 (2月2日)
 用傳感器讓中央空調(diào)更節(jié)能環(huán)保,精確測量溫濕度、… (1月30日)
 不干膠標(biāo)簽印刷UL認(rèn)證 (11月22日)
 基于廣芯微UM3242F-RET6主控芯片的DC-AC逆… (11月9日)
 文章搜索
搜索選項:            
  → 評論內(nèi)容 (點擊查看)
您是否還沒有 注冊 或還沒有 登陸 本站?!
關(guān)于我們 ┋ 免責(zé)聲明 ┋ 產(chǎn)品與服務(wù) ┋ 聯(lián)系我們 ┋ About 365PR ┋ Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產(chǎn)通互聯(lián)網(wǎng)有限公司 版權(quán)所有
E-mail:postmaster@365pr.net 不良信息舉報 備案號:粵ICP備06070889號