在成為國企和被收購之外,AI晶片公司的另一種活法
撰文 | 四月
繫結國企資源,還是被巨頭收購?亦或者還有沒有一套更為主流的AI晶片公司生存之道?
更加多元化,更接地氣的。
「去年底iPhone X出來之後,客戶都在問結構光方案能不能做。但是當下,大家問得最多的是『有沒有結構光的替代方案?』」,耐能創始人劉峻誠談起過去一年手機晶片市場的訴求變化。
下半年以來,創投圈裡關於「AI 晶片」的議題逐步降溫,資本熱捧和媒體光環散去,晶片創業的本質浮出水面。
很顯然,並不是所有公司都自信如寒武紀,自誕生之日就繫結國企資源,拿下華為的長期訂單;也不是所有團隊都幸運如深鑑科技,公司成立兩年便深受資本厚愛,順利以不錯的價格「出售」。
在以上兩類稀缺案例之外,更多的是一般創業團隊的生存之道——必須更加多元化,更加接地氣。Kneron(以下簡稱耐能)就是這第三類公司的典型之一。
2015 年,耐能在美國聖地亞哥創立,核心團隊來自於前高通等半導體公司的華人工程師,聚焦在終端 AI 晶片解決方案,主攻智慧手機、智慧安防、智慧家居等領域。公司在 2017 年、2018 年相繼完成兩輪融資,其背後的投資方包含阿里巴巴、高通、紅杉資本、李嘉誠旗下的維港投資等。
近期,機器之心與耐能創始人兼 CEO 劉峻誠對話,探尋產品迭代背後更接地氣的考量,主流客戶與市場在過去一年的訴求變化,以及在 RSIC-V 架構、7nm 工藝等行業熱點影響下的趨勢走向,以窺探 AI 晶片產業整體的暗流和潮向。
以下為機器之心與創始人劉峻誠的對話整理。
NPU IP 不一定要塞進主核晶片,晶片效能提升的關鍵還是在於 CPU、GPU、NPU 多核的協調性。
機器之心:第二代 IP 系列中運算力最高為 5.8 TOPS/s,如何理解?
劉峻誠:5.8 TOPS/s 是高效能版本 KDP720 在 28 納米制程、600 MHz、8bit fixed points 下的效能表現。此外,我們還有超低功耗版 KDP 320、標準版 KDP 520。
機器之心:距離上一代 IP 不到半年,產品迭代節奏很快。
劉峻誠:產品線會保證兩年內的規劃。這款產品一年前就在佈局,效能不斷迭代。當出現較大效能突破,以及獲得核心客戶的認可之後就會發布出來。這代產品主打偏高階手機市場和安防市場。下代產品在功耗上會有更大提升。
機器之心:今年已經出現 7 納米制程,效能比 5Tops/watt 的 NPU IP;對比之下,你們的效能如何?
劉峻誠:不同製程會影響晶片的運算能力表現,我們二代 KDP720 在 28nm 製程下的每瓦效能表現預估為 13.17 TOPS/W。
機器之心:有沒有考慮過更高的製程工藝?
劉峻誠:我們提供的 IP 架構預設以 28nm 製程為主,參考資料也是在 28nm 納米制程下的表現。
團隊沒有盲目追究高階製程,主要是考慮到成本和效能的綜合因素。在我們主要聚焦的三大領域裡:手機領域,雖然當下主流晶片廠商的主製程已經提升至 10nm 或以下,但協處理器仍可以使用 28nm;安防領域則以 28nm 為主,16nm 為輔;在 IoT 領域,主要以 40nm、65nm 為主。
機器之心:你們更偏向協處理器的方式?
劉峻誠:是的。我們和大廠合作主要採用協處理器與主核處理器協同的方式。該模式和谷歌 Piexl 手機晶片模式類似,比如,針對機器學習與圖形處理需求專門定製一款「協處理器」Pixel Visual Core,專門用於加速相機等特定應用。
機器之心:該模式和將 IP 繫結在主核晶片的模式有什麼不同?
劉峻誠:協處理器和主處理器可以採用不同製程,以降低主晶片的成本,因為協處理器不需要用到那麼高的製程。將 IP 繫結在主核晶片因為採用同一套製程必然加大晶片成本。NPU IP 不一定要塞進主核晶片,晶片效能提升的關鍵還是在於 CPU、GPU、NPU 多核的協調性。
機器之心:如何看待 7nm 製程之爭?
晶片公司和手機公司的 IC 設計思路不同。比如,蘋果和華為都是自研晶片,其模式和嚴格意義上的晶片公司不同。手機公司設計晶片更大動力在於升級手機效能,而晶片公司面向更廣的客戶群體,必須將成本和出貨量考慮進去。
7nm 會有一個黃金交叉的時間點,在推行一年、加持的模組更豐富之後,價效比或許才會比較被手機公司接受。
機器之心:除了效能引數,新品還有哪些升級?
劉峻誠:在此之前,我們通過 3*3 矩陣重構就能覆蓋大量神經網路。不過,過去一年又冒出了很多比較受歡迎的機構,比如輕量級的 MobileNet、YOLO、Tiny YOLO 等、以及一些很巧思的特異神經網路,部分採用的是 1*1 的矩陣,再用 3*3 矩陣去適配就浪費了。
面對這些輕量級矩陣,可以採用交錯式運算架構去協調。用普通製程達到高效能表現能夠滿足客戶的價效比要求。
機器之心:可重構演算法主要應用在哪些層面?
劉峻誠:可重構主要面向兩個層面,一個是 Convolution Filter 層面的重構,即將 5*5、7*7 等不同大小型矩陣的卷積濾波器分解為 3*3 或者更小的矩陣,因為在 CNN 模型中 3*3 矩陣是最為常見的模型。今年我們已經針對這項技術進行多個地區的專利保護。
第二個是動態可調整定點運算的重構,針對不同的精度/浮點數的運算層進行動態運算的重組,以達到不同精度值要求與不同浮點數的運算進行精確匹配,更加高效地利用處理器效能進行並行交錯計算。此外,還包括針對不同模型的轉移學習和壓縮,保持儘可能多的 MAC 以提高平均效能等。
現在很多創業公司會更加聚焦在優勢市場,而不是鋪大盤子。因為創業公司需要聚焦資源才能開啟市場。
機器之心:手機 AI 晶片市場過去一年有哪些變化?
劉峻誠:手機是我們佈局最深的領域,這一年市場訴求變化很快。去年 iPhone X 釋出之後,我們認為 3D 結構光應該是大勢所趨。所以在一代產品中就嵌入了人臉識別等 SDK。去年底iPhone X出來之後,客戶都在問結構光方案能不能做。
但是當下,大家問得最多的是「有沒有結構光的替代方案?」
現在看來,結構光方案接受度並沒有想象中那麼高。我們分析,一是技術沒跟上,二是產品方案太貴。所以我們開始考慮 TOF、雙攝等更多方案,二代產品中三種軟體方案都能相容。
方案既面向整合晶片廠商,也會面向光學模組廠商。因為人臉資訊資料在主核晶片上跑效果仍然不是很理想,一是安全鏈路層空間限制,二是計算量較大。
機器之心:傳統安防廠商對於 AI 的態度是否有所轉變?
劉峻誠:安防市場注重通用性,而不是效能的精簡。過去,AI 演算法和識別應用主要放到雲端,所以安防廠商對於 AI 演算法和應用的接受度的確不高。
現在新的攝像頭會需要加入一部分預處理的功能,比如黑名單等。所以有一定的需求量了。主要針對一些需要架設新攝像頭的新市場,比如一些地方政府的智慧城市工程等;而不是說現有的存量市場來進行攝像頭的更新換代,這個動力仍然不是很大。
機器之心:開源指令集 RSIC-V 的關注越來越高,可能帶來哪些變數?
劉峻誠:RSIC-V 可能會覆蓋到一部分到通用性的市場,比如安防、車載等。越通用的晶片,就容易受到 RSIC 的衝擊。
不過現在各類晶片功效的界限正逐漸模糊。專用晶片通用性越強,可能就會接近 DSP 或者 GPU;而 DSP 定製化程度越高,就越接近 ASIC、AI 晶片。
機器之心:從多起併購案中能看到行業整合趨勢開始顯現。
劉峻誠:一是行業很熱,即使創業團隊缺少很強的營利能力,但在技術上的強創新仍然能夠受到價值肯定。但是 AI 演算法很大一部分創新仍然停留在介於硬體和軟體層面之間的 SDK,這樣的團隊在落地和實戰考驗上會遇到瓶頸。
第二也反應出現實問題——沒有差異化的產品路會很難走。比如,新的架構出現可能就會擠壓市場,RSIC 對於安防市場的衝擊我們也可能會遇到。
能夠看到的是,現在很多創業公司會更加聚焦在優勢市場,而不是鋪大盤子了。因為創業規模的團隊需要足夠聚焦資源才能開啟市場。