AI晶片之上,華為正在放眼「下一次計算革命」
未來的計算會是什麼樣的形式?今天,雲端計算和 AI 正在改變著許多行業,但也有很多人對新技術能夠做到什麼表示懷疑。華為也曾是這樣。
這家科技巨頭在過去的幾年中進行了大量內部探索,只想知道:人工智慧在第四次工業革命到底有怎樣的應用價值?
事實證明是可行的,今天在華為內部已經開啟人工智慧技術的應用,其先進的運作體系已讓自身獲得了很多收益——看看它在通訊市場上的佔有率就知道了。過去幾年,很多需要耗費大量人力的工作,而今已逐步被 AI取代。
在這個過程中人們發現:人工智慧仍然面臨著很多艱鉅的挑戰。
今天的計算還主要集中在遙遠的資料中心,停留在電量不足的手機終端上。而代替IBM專用計算的 x86 架構,在 40 多年後,隨著摩爾定律的失效而開始放慢步伐,傳說中將要改變世界的新技術,大部分仍停留在實驗室裡。
未來的計算,應該有怎樣的願景?
或許是包含所有場景的「智慧計算」。去年 11 月,亞馬遜率先發布了基於 Arm 架構的伺服器晶片,並開始提供相應的雲服務;2019 年 1 月,華為推出了基於 Arm 架構的伺服器晶片鯤鵬 920,以及「TaiShan」伺服器,引發了人們的廣泛關注。在 AI 晶片之上,華為的智慧計算願景正在我們眼前逐漸展現。
AI 晶片為先
智慧計算不僅僅是手機上的 NPU 和機箱中的 GPU。華為去年 10 月推出了昇騰 910 和昇騰 310 兩款自研 AI 晶片,在這家科技巨頭的未來構想中,它們將是華為智慧計算架構的核心。在雲端計算和端側等各領域全面提供高效能 AI 算力。
目前華為自研的伺服器和端側晶片。
2019 年 1 月 7 日,華為又推出了ARM處理器晶片鯤鵬 920及基於此晶片的TaiShan 伺服器。自此,涵蓋雲伺服器到智慧裝置,甚至自動駕駛汽車等場景的 AI 晶片開始全面出爐。
鯤鵬 920 被認為是目前業內最高效能的 ARM-based 處理器,採用 7nm 製造工藝,基於 ARM 架構授權,由華為自主設計,主頻可達 2.6GHz,單晶片可支援 64 核。該晶片整合 8 通道 DDR4 記憶體,頻寬超出業界主流 46%。晶片整合 100G RoCE 乙太網卡功能,大幅提高系統整合度。鯤鵬 920 支援 PCIe4.0 及 CCIX 介面,可提供 640Gbps 總頻寬,單槽位介面速率為業界主流速率的兩倍,有效提升儲存及各類加速器的效能。
通過優化分支預測演算法、提升運算單元數量、改進記憶體子系統架構等一系列微架構設計,華為大幅提高了新一代處理器的效能。在典型主頻下,其晶片在 SPECint Benchmark 評分超過 930 分,超出業界標杆 25%。同時,能效比優於業界標杆 30%。
和鯤鵬晶片同時推出的還有搭載這種晶片的「TaiShan」伺服器。華為表示,這些伺服器相較於業界同類規格雲伺服器效能領先 3 倍。
華為內部一直有一種先做再說的風格,這些推出的晶片和伺服器不僅推高了業界頂尖水平,也已在華為內部得到了一定程度的應用。全面佈局 AI 晶片是為了加速多行業智慧化的步伐。華為表示,目前,由於算力供應不平衡、部署場景要求高、雲邊資料無法協同互通、專業技術門檻高等原因,人工智慧只能在網際網路、公共安全等少數行業得以滲透普及。資料顯示,全世界全行業 AI 普及率不超過4%(Source: IDC’s Cloud and AI Adoption Survey, January 2018)。
正如麒麟 980 手機晶片開創全新移動端 AI 體驗一樣,基於華為AI 晶片的伺服器將為下一代雲端計算開啟新的篇章。
智慧計算戰略
華為推出的 AI 晶片是構建面向未來智慧計算戰略的基礎,在這之後則是「普惠 AI」戰略的龐大布局。去年 12 月 21 日,華為智慧計算戰略正式釋出,其將圍繞算力、工程、架構和一體化解決方案四個方面,面向行業構建「全棧全場景」智慧解決方案,希望以此加速各個行業智慧化的程序。
晶片是開始,但智慧計算還需要更多硬體裝置,一系列的伺服器產品組成了華為智慧計算產品線,華為已釋出智慧計算系統包括:智慧伺服器(FusionServer)與人工智慧計算架構(Atlas、TaiShan、MDC)。
其中 Atlas人工智慧計算平臺包括 Atlas 200 AI 加速模組、Atlas 300 AI 加速卡、Atlas 500 智慧小站、Atlas 800 AI 一體機等型號,具備高算力、低功耗和易部署的優勢,而 MDC 600 移動資料中心則已經在部分自動駕駛專案中得到應用。
在 2018 全聯接大會上,華為推出了 MDC 600 移動資料中心。
自動駕駛研究需要對大量攝像頭和各類感測器收集的資料進行分析計算,資料處理及模型訓練,對硬體算力有著很高要求。
端雲一體的新架構
未來的智慧計算將是全場景覆蓋。雲端、私有云和裝置端需要不同的計算能力,而不同位置的算力部署也需要統一協調。
本世紀初,亞馬遜等科技巨頭提出「雲端計算」概念,這一計算形式不僅接手了大量原本屬於端側的算力任務,更催生了大量新業務,帶來了全新形式的科技公司。雲端計算以網際網路和大規模計算為基礎,創造了一種新的基礎設施,也讓互動模式發生了轉變。從使用者角度來說,雲端計算能夠提供成本更低、效率更高的服務。
相對於各自獨立的傳統硬體平臺,雲端計算通過資源共享和靈活排程,可以顯著降低計算成本。如今,雲端計算已是一種和水、電、網路通訊相似的「基礎設施」了。
然而在技術發展的過程中我們會發現,常規雲端計算的形式仍非全無缺點:很多資料如不在端側進行處理,傳輸到雲端會遇到網路頻寬的瓶頸;一些任務對於資料處理的延遲性有很高要求;有時人們還會擔憂資料上傳雲端之後可能暴露隱私的問題……
在這樣的情形下,加入邊緣裝置算力,形成端雲一體的統一計算架構成為了未來雲端計算的新趨勢。
華為提出的全棧全場景智慧解決方案
與資料中心龐大的伺服器設施相比,邊緣計算的硬體距離我們更近,甚至可以延伸到手邊的 IoT 裝置上。邊緣計算節點與雲端計算中心可以形成邏輯整體。邊緣計算節點負責對資料或者部分資料進行處理和儲存,用以節約頻寬消耗,減少反應延遲,並提高業務連續性,滿足資料本地儲存與處理等安全合規的要求。
在雲邊端架構上,華為擁有強大的工程能力和一體化能力。在 AI 基礎算力上,華為可以提供從虛擬機器、容器到裸金屬各種形態的服務。
構建新生態
華為致力於構建更為繁榮的 ARM 生態環境,並一直在硬體、基礎軟體和應用三個層面推進產業合作。這家公司希望能讓人工智慧不再是一種高高在上的技術,而是走向大眾,讓每個人、每個組織都能享受到人工智慧帶來的價值。
對此,華為一直在行動著:2017 年,華為釋出了面向企業、政府的人工智慧服務平臺華為雲 EI;2018 年,華為釋出了面向智慧終端的人工智慧引擎 HiAI,以及全棧全場景解決方案。今天的華為已能為企業、政府提供覆蓋全面的智慧計算解決方案。
華為預計,2018 年到 2025 年全球資料總量將會有 18 倍的增長。如何構建完整的 AI 生態體系,為企業與客戶創造更多的價值,需要攜手上下游各方來共同打造。
3 月 21 日,華為中國生態夥伴大會在福州舉行。在開幕儀式上,華為董事、企業 BG 總裁閻力大在演講中對外透露,華為2018 年企業業務收入接近 100 億美元。
計算的提升過去主要依賴摩爾定律——即提高硬體效能,降低單位算力的成本,但隨著晶片製程逐漸接近極限,AI 的算力需求正在變得難以滿足。對於科技公司來說,改革晶片結構及優化硬體系統是更為有效的選擇,華為將在技術領先的前提下努力建設屬於新體系的產業生態。通過更高效的智慧計算體系,華為希望其提供的裝置能夠擁有比摩爾定律更快的效能增長速度。
60 年前,以IBM大型機為代表的專用計算將計算產業帶入了民用領域;40 年前,英特爾的 x86 架構的出世,在摩爾定律的驅動下實現了計算機的大規模普及;現在,計算產業在 AI 的驅動下來到了新的歷史節點。在產業外,很多科技公司正試圖打造新武器;而在產業的內部,裝置和晶片廠商也正在自我進化。它們的目標是一致的:先改變自己,再去改變世界。
華為認為,這個歷史節點的名字,叫做「智慧計算」。