|
 【產通社,10月22日訊】中國科學院(Chinese Academy of Sciences)官網消息,微電子研究所感知中心低功耗智能技術與微系統(tǒng)團隊近日在低功耗人工智能領域取得新進展。  語音喚醒技術(Keyword Spotting,KWS)是人工智能領域的重要技術,是人聲與低功耗設備或終端之間的典型且廣泛使用的“觸發(fā)器”,廣泛應用于各種低功耗的智能芯片與微系統(tǒng)。通常高性能的深度卷積神經網絡模型的語音喚醒模型復雜度高、計算量大、需要占用大量內存,難以將其部署到上述資源有限的硬件設備。  針對上述問題,科研團隊提出了用于語音喚醒的極輕量化、高準確率的改進二值殘差神經網絡B-ResNet(Binary Residual Neural Network),利用二值量化方法,將神經網絡中的全精度權重、激活參數(shù)量化為1bit(+1,-1),顯著降低內存占用,亦可將網絡中存在的大量浮點卷積乘加運算簡化為XNOR同或邏輯與popcount運算,大幅降低計算復雜度。為解決二值網絡帶來的精度下降問題,該團隊在B-ResNet網絡前向傳播中提出了具有移位初始化且可學習的激活函數(shù)來優(yōu)化網絡各層激活值分布,降低信息損失,并在反向傳播過程中提出了具有可變周期性窗口的梯度修正近似方法,有效解決了梯度失配與消失問題。在GSCD(Google Speech Commands Dataset)標準語音數(shù)據集的12分類任務下,與基線網絡Res8-narrow相比,該技術可降低33%參數(shù)量與72%計算量,實現(xiàn)更高的語音喚醒精度,為后續(xù)該功能的低功耗硬件實現(xiàn)奠定了良好基礎。  相關研究成果(Low-complex and Highly-performed Binary Residual Neural Network for Small-footprint Keyword Spotting,DOI:10.21437/Interspeech.2022-573)被國際語音通信協(xié)會(ISCA)組織語音領域會議Interspeech2022接收。查詢進一步信息,請訪問官方網站 http://www.cas.cn/syky/index_1.shtml。(張嘉汐,產通發(fā)布) (完)
|