加入收藏
 免費(fèi)注冊
 用戶登陸
首頁 展示 供求 職場 技術(shù) 智造 職業(yè) 活動(dòng) 視點(diǎn) 品牌 鐠社區(qū)
今天是:2026年3月17日 星期二   您現(xiàn)在位于: 首頁 →  產(chǎn)通直播 → 半導(dǎo)體器件(企業(yè)動(dòng)態(tài))
d-Matrix提出針對生成推理優(yōu)化的grounds-up硬件和軟件架構(gòu)
2025/1/22 11:40:03     

按此在新窗口瀏覽圖片

【產(chǎn)通社,1月22日訊】d-Matrix公司官網(wǎng)消息,其聯(lián)合創(chuàng)始人蘇迪普·博賈和他的團(tuán)隊(duì)討論了一種針對生成推理優(yōu)化的grounds-up聯(lián)合設(shè)計(jì)的硬件和軟件架構(gòu)。

基于轉(zhuǎn)換器的大型語言模型(LLM)已經(jīng)成為現(xiàn)代自然語言處理的基礎(chǔ)架構(gòu)。今天,在最先進(jìn)的系統(tǒng)上部署LLM推理的高昂成本限制了生成式人工智能的大規(guī)模部署。此外,低延遲LLM推理在今天要么是不可能的,要么是昂貴的,它可以開啟新的用例,如思維鏈推理、結(jié)對編程、代理工作流等。

為了降低服務(wù)成本,同時(shí)提供可接受的延遲,行業(yè)已經(jīng)轉(zhuǎn)向更小的模型、稀疏模型(如混合專家)和替代注意力機(jī)制(如組查詢注意力(GQA))。然而,昂貴的部署成本和高推理延遲的關(guān)鍵問題仍然存在。

在加州大學(xué)伯克利分校機(jī)器學(xué)習(xí)硬件課程的客座演講中,d-Matrix的聯(lián)合創(chuàng)始人Bhoja和他的團(tuán)隊(duì)討論了一種針對生成推理優(yōu)化的grounds-up聯(lián)合設(shè)計(jì)的硬件和軟件架構(gòu)。Bhoja介紹了LLM推理工作負(fù)載的關(guān)鍵特征以及d-Matrix的一種新方法,解釋了他的團(tuán)隊(duì)如何設(shè)計(jì)一種模塊化的基于小芯片的CGRA式架構(gòu),這種架構(gòu)是為LLM推理量身定制的,并介紹了如何將架構(gòu)從小芯片橫向擴(kuò)展到多個(gè)節(jié)點(diǎn)。

除了硬件考慮之外,該團(tuán)隊(duì)還關(guān)注現(xiàn)代系統(tǒng)的相關(guān)軟件設(shè)計(jì),包括集體通信算法和分布式推理服務(wù)堆棧,重點(diǎn)關(guān)注它們?nèi)绾闻c模型架構(gòu)創(chuàng)新和全堆棧技術(shù)進(jìn)行互操作。通過這次檢查,d-Matrix團(tuán)隊(duì)展示了超低延遲、高吞吐量的LLM推理。

查詢進(jìn)一步信息,請?jiān)L問官方網(wǎng)站http://www.d-matrix.ai/democratizing-ai-through-hardware-software-codesign-for-llm-inference。(鐠元素,產(chǎn)通數(shù)造)    (完)
→ 『關(guān)閉窗口』
 365pr_net
 [ → 我要發(fā)表 ]
上篇文章:Groq和Aramco Digital在沙特阿拉伯建立世界…
下篇文章:深圳欣銳科技取得轉(zhuǎn)換器組件及燃料電池系統(tǒng)發(fā)明專利…
  → 評論內(nèi)容 (點(diǎn)擊查看)
您是否還沒有 注冊 或還沒有 登陸 本站?!
 分類瀏覽
官網(wǎng)評測>| 官網(wǎng)  社區(qū)  APP 
STEAM>| 學(xué)術(shù)科研  產(chǎn)品藝術(shù)  技術(shù)規(guī)范  前沿學(xué)者 
半導(dǎo)體器件>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
電子元件>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
消費(fèi)電子>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
商業(yè)設(shè)備>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
電機(jī)電氣>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
電子材料>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
電子測量>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
電子制造>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
應(yīng)用案例>| 家庭電子  移動(dòng)電子  辦公電子  通信網(wǎng)絡(luò)  交通工具  工業(yè)電子  安全電子  醫(yī)療電子  智能電網(wǎng)  固態(tài)照明 
工業(yè)控制>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
通信電子>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
交通工具>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
基礎(chǔ)工業(yè)>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  VIP追蹤 
農(nóng)業(yè)科技>| 產(chǎn)品通報(bào)  企業(yè)動(dòng)態(tài)  專家追蹤 
信息服務(wù)>| 企業(yè)動(dòng)態(tài) 
光電子>| 企業(yè)動(dòng)態(tài) 
關(guān)于我們 ┋ 免責(zé)聲明 ┋ 產(chǎn)品與服務(wù) ┋ 聯(lián)系我們 ┋ About 365PR ┋ Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市產(chǎn)通互聯(lián)網(wǎng)有限公司 版權(quán)所有
E-mail:postmaster@365pr.net 不良信息舉報(bào) 備案號(hào):粵ICP備06070889號(hào)