北京大學孫仲團隊設計 國產芯片上新 能效比提升超228倍
非負矩陣分解是挖掘高維數據潛在結構的核心技術,廣泛應用於推薦系統、生物信息學、圖像處理等多個領域。北京大學人工智能學院孫仲研究員團隊瞄準這一技術,設計了一種模擬計算芯片,為大規模數據處理提供了全新高效方案。和當前先進數字芯片相比,計算速度可提升約12倍,能效比提升超過228倍,相關成果已於近日發表於《自然·通訊》。
1月22日,孫仲告訴科技日報記者,非負矩陣分解是一種強大的「數據降維」技術。它能從巨量且龐雜的用戶行為、圖像像素等信息中,提煉出潛在的模式與特徵,在圖像分析、信息聚類、個性化推薦等領域具有廣泛應用。但面對如今動輒百萬級規模的數據集,傳統數字硬件受計算複雜度和內存瓶頸限制,難以滿足實時處理需求。
孫仲團隊一直研究模擬計算。模擬計算直接利用物理定律實現並行運算,延時低、功耗低,在算力瓶頸背景下,具有先天優勢。團隊此次研製出了基於阻變存儲器(RRAM)的非負矩陣分解模擬計算求解器,並創新性設計了一種可重構緊湊型廣義逆電路,通過電導補償原理,用最少的計算單元實現相同運算功能,對非負矩陣分解過程中最核心的計算步驟進行了優化,實現一步求解,極大優化了芯片的面積與能耗表現。
為驗證芯片性能,研究團隊搭建了測試平台,在典型場景中進行驗證。在圖像壓縮任務中,和在全精度數字計算機上運行的結果相比,圖片精度損失相差無幾,還節省了一半的存儲空間;在推薦系統應用中,其預測誤差率和數字芯片計算結果高度相近。在MovieLens 100k數據集推薦系統訓練任務中,與主流可編程數字硬件相比,該模擬計算器實現了212倍的速度提升和4.6萬倍的能效提升;在網飛(Netflix)規模數據集的推薦系統訓練任務中,其計算速度較先進數字芯片提升約12倍,而能效比提升超過228倍。
「這項工作為非負矩陣分解這類約束優化問題的實時求解開闢了新路徑,展現了模擬計算處理現實複雜數據的巨大潛力。」孫仲表示,該研究可為實時推薦系統、高清圖像處理、基因數據分析等場景帶來技術革新,助力人工智能應用向更高效、更低功耗方向發展。