「探境科技」釋出儲存優先架構SFA,28nm工藝條件下系統能效比可達4TOPS/W
ofollow,noindex" target="_blank">探境科技 成立於2017年初,是36氪此前曾持續跟進的一家AI晶片領域的創業公司。 與當前行業的不少AI晶片公司不同,探境科技提出了一種新的晶片架構和儲存解決方案——在有效降低晶片功耗的同時,大幅提高硬體資源利用率的適用於各種終端裝置的嵌入式AI晶片解決方案。簡單來說,就是希望同時解決AI晶片的計算與儲存問題。
在今天的IC world “芯星新銳專場論壇”上,公司也正式公佈了其晶片採用的儲存優先架構SFA。
根據探境提供的資訊,對比“類CPU架構”採用的基於匯流排的對映方法,在同等條件下, SFA架構資料訪問可降低10~100倍;28nm工藝條件下,系統能效比達到4T OPS/W,計算資源利用率超過80%,DDR頻寬佔用率降低5倍。
探境表示, SFA架構實現了將儲存、計算、排程演算法一體化,通過軟硬體協同工作,控制器在各儲存和計算節點進行最優的對映,可以通過OTF的方式動態更新排程演算法; 使用了分散式的儲存和分散式的計算,可以達到較高的內部頻寬和計算效率; 採用資料驅動的方式,可以支援未來的可計算SRAM或其他新型儲存,進一步提高計算效能。
之所以選擇這一架構,與探境科技對行業的判斷有關。 在探境看來,當前絕大多數的AI晶片,都是基於馮諾依曼架構,與最初的CPU架構並無本質差異,其解決問題的思路在於解決計算的問題,降低計算指令銜接上的控制冗餘,提高效率,以指令為中心或以計算為中心進行優化,以計算驅動儲存,通過編譯器構建虛擬機器的思想,樹立AI晶片指令集的抽象標準,對於儲存資源的使用和排程,依然或依賴於編譯器,或依賴於傳統的快取管理演算法,這相當於用較為富裕的計算資源驅動較為稀缺的儲存資源,無法解決儲存牆的問題的。
CEO魯勇分析,從更高的層面來看,在特定的工藝條件下,一定精度的計算操作下,最終的功耗都來自於MAC,所以每瓦功耗得到的算力是相對固定的,而儲存所消耗的功耗和資源超過了計算部分,因此當前大多數AI晶片的能效比差別並不大,在“儲存牆”問題解決前,如果在以計算為中心的指令抽象化的方向做文章,結果只能是讓抽象層更加遠離任務排程的實質,使得儲存問題更加的惡化;換句話說,是“類CPU架構”適用於計算複雜度高,儲存複雜度低的環境,當面對深度學習這個新形勢時,其本身的侷限性導致稀缺資源沒有得到很好的利用和處理,只有重新思考深度學習所面臨的儲存牆問題,才能得到突破的AI晶片架構。
魯勇告訴36氪,目前業界對“儲存牆”也看到了一些解決思路,有的加大儲存頻寬,採用高頻寬的外部儲存,例如HBM2,這樣不惜功耗,僅提高效能;有的採用分散式片上儲存,拋棄DDR,達到幾百MB的SRAM,成本非常可怕;有的以演算法精度、應用範疇為代價,設計低位元權重的神經網路,無法滿足通用神經網路的計算;有的在儲存單元內部的設計計算單元的新型儲存器,進行存算一體化(In Memory Computing),商用化道路較長;因此,探境科技重新思考儲存和計算的關係,以儲存驅動計算,直接從應對“三高”特性出發設計與“類CPU架構”完全不同的計算架構,即儲存優先架構SFA。
探境規劃,未來將圍繞安防市場、工業智造、消費類市場、自動駕駛等幾個領域開拓市場,並推出相關產品。值得關注的是,此次語音晶片也被提及。
延伸閱讀: