拳打TPU,腳踢英特爾,亞馬遜自研CPU和AI雲晶片曝光
歡迎關注“創事記”的微信訂閱號:sinachuangshiji
文/文強、張乾、大明
來源:新智元(ID:AI_era)
【新智元導讀】本週,亞馬遜推出首款自研Arm架構雲伺服器CPU Graviton和首款雲端AI推理晶片AWS Inferentia,拳打TPU,腳踢英特爾,力圖走一條自己的雲端芯一體化路線,未來雲端計算市場將迎鉅變!
亞馬遜出手了,一出手就是兩顆炸彈!
本週一,亞馬遜推出首款自研Arm架構雲伺服器CPU Graviton,目標直指英特爾;
昨天,亞馬遜又推出了首款雲端AI推理晶片AWS Inferentia,目標是殺傷微軟Azure、谷歌雲等一批對手,並讓中小玩家無牌可打。
亞馬遜力圖走一條自己的雲端芯一體化路線,似乎沒有給其他人留出可趁之機。
未來雲端計算的市場,將迎來鉅變!
亞馬遜自研Arm架構資料中心CPU,成本最低降45%
據The Register報道,本週公佈的亞馬遜AWS定製版Graviton——支援AWS的A1EC2例項的多核Arm處理器,處理器效能幾乎與AMD的基於Arm的晶片相當,這些虛擬機器現在可在美國和歐洲使用。
Graviton:亞馬遜基於Arm架構的CPU
關於Graviton的效能引數,目前能瞭解到的是:CPU核心基於Arm 2015年的Cortex-A72設計,主頻為2.3GHz,為64位Armv8-A、非NUMA處理器,具備浮點數學計算、SIMD、AES,SHA-1、SHA-256、GCM和CRC-32演算法的硬體加速功能。
片上系統使用Arm的資料中心優化型Neoverse技術和Annapurna的內部設計。 16個vCPU例項排列在4個四核叢集中,每個叢集有2MB的共享L2快取,每個核有32KB的L1資料快取和48KB的L1指令快取。一個vCPU對應一個物理核心。
亞馬遜一位發言人表示:“AWS Graviton處理器是由AWS定製設計的新處理器系列,設計中融入了亞馬遜為大規模雲應用程式構建平臺方案上的廣泛專業知識。”
據亞馬遜全球基礎設施和客戶服務VP Peter DeSantis所說,使用新的晶片能讓AWS虛擬機器特定工作負載的價格再降低45%。
亞馬遜雲首款AI晶片問世,降低推理成本75%
在亞馬遜美國拉斯維加斯大會上,昨天還放出另一個炸彈——首款雲端AI晶片AWS Inferentia。
AWS Inferentia是一款機器學習推理晶片,支援TensorFlow、Apache MXNet和PyTorch深度學習框架,以及使用ONNX格式的模型。
使用經過訓練的機器學習模型進行預測可以驅動應用程式高達90%的計算成本。開發人員可以將GPU支援的推理加速附加到Amazon EC2和Amazon SageMaker例項中,從而將推理成本降低75%。
根據官網介紹,每個Inferentia晶片提供高達幾百TOPS的算力,使複雜的模型能夠做出快速的預測。多個AWS Inferentia晶片可以一起使用來驅動,形成成千上萬的TOPS算力。
這款晶片將於2019年底上市,AWS使用者可以通過Amazon SageMaker、Amazon EC2等一起使用 Inferentia的算力。
雲端計算巨頭自己造芯:擺脫束縛、降低成本、打擊對手
Graviton的問世顯示出亞馬遜AWS擺脫英特爾的決心。
目前,英特爾擁有全球資料中心計算幾乎全部市場份額,英特爾的伺服器芯片價格居高不下,而且有供應短缺的風險。
為了擺脫這種束縛,越來越多網際網路巨頭們正考慮使用Arm,OpenPower,RISC-V和AMD Epyc產品,定製自己的晶片,全球雲端計算巨頭(包括微軟,谷歌,Facebook,亞馬遜,百度等) 都在尋找替代晶片供應商。
早在2015年左右,亞馬遜與AMD合作開發64位Arm伺服器處理器,用於亞馬遜的資料中心。AMD還在2016年就推出了與亞馬遜合作的Arm晶片,代號“西雅圖”的Opteron A1100處理器。
不過,AMD未能達到亞馬遜的效能標準,於是亞馬遜退出了與AMD的合作,收購了Arm授權許可持有者和片上系統設計企業Annapurna Labs,讓收購後的團隊開始設計物聯網閘道器及其Nitro晶片組,負責處理託管EC2虛擬機器的亞馬遜伺服器的網路和儲存任務。
今天的高階Arm CPU的應用範圍,遠遠超出了智慧手機,還能夠執行桌面端和輕型伺服器上的應用程式。Graviton的問世就是Annapurna Labs的成果。
而AWS Inferentia的問世則是打擊對手的思路。
第三季度,亞馬遜有一半利潤來自AWS雲服務,AWS業務在第三季度的營業利潤率為31%,這是四年多以來的最高水平。
市場份額也印證了AWS的業績。根據Synergy Research的資料,亞馬遜的AWS控制著34%的雲基礎設施服務市場。微軟以15%的市場份額位居第二,其次是IBM(第三)和谷歌(第四),市場份額均為個位數。
形勢一片大好。
但是,AWS的對手也突飛猛進。微軟Azure雲端計算同比增長76%,而Alphabet早在今年2月就宣稱,基於2017年的公開資料,谷歌雲平臺是“全球增長最快的主要公有云提供商”。
谷歌雲也在最近迎來大調整:現任CEO將在明年1月離職,接替她的是在甲骨文有20年工作經驗的雲端計算市場老手,緊緊盯住AWS的份額。
Inferentia晶片的推出,就是AWS應對這種局面的殺手級武器,主要能夠降低成本。
至此,主要雲端計算公司中,AWS、谷歌雲、阿里雲、華為雲都佈局了AI晶片。
5000億美元市場廝殺:智慧雲市場重量級玩家全部整裝待發
亞馬遜的Inferentia晶片和Graviton讓人想起了華為釋出昇騰系列,這是科技巨頭要走一條自己的雲端芯一體化路線。
亞馬遜要做的跟華為類似,所不同的是,亞馬遜的晶片已經做出來了。亞馬遜也將成為首個在資料中心基礎設施採用基於Arm架構CPU的大廠。
回頭再看亞馬遜全球基礎設施和客戶服務VP Peter DeSantis所說的“使用新的晶片能讓AWS虛擬機器特定工作負載的價格再降低45%”。
這個數字不可小覷。
亞馬遜AWS本已經是雲端計算市場毋庸置疑的王者,現今低價格加上客戶層鋪開,或將築建起令其他競爭對手者難以逾越的高牆——眾所皆知,低成本與大規模形成飛輪效應,智慧雲端計算是一個贏者通吃的市場。
釋出會上還有一點值得注意,那就是亞馬遜雲的完全託管端到端機器學習服務AWS SageMaker,將採用陳天奇團隊的TVM 作為自動優化深度學習模型的框架編譯器,後端支援ARM、英特爾和英偉達的硬體。
還記得英特爾的野心嗎?隨著各種框架(前端)和各種硬體(後端)的興起,大家想做更多的優化,業界出現了框架編譯器這個“中間表示”(IR)之爭。英特爾想把自家的框架編譯器 nGRAPH 打造成 IR 的標準。現在亞馬遜直接支援 TVM,對即將於2019年年底釋出新品的英特爾來說,無疑構成了另一個層面上的打擊。
國內雲端計算市場的No.1阿里雲日前升級為阿里雲智慧平臺,由阿里CTO 張建鋒兼任阿里雲智慧事業群總裁,目標是構建數字經濟時代面向全社會基於雲端計算的智慧化技術基礎設施。這一舉措,呼應騰訊新成立的雲與智慧產業事業群,以及更早些時候從二級部門升級為一級部門的華為雲。
至此,全球雲端計算市場的幾大主要玩家已經全部整裝待發,誰將主宰價值5000億美元的智慧雲端計算市場?
廝殺時間已到,請開始表演。
參考資料:
https://www.theregister.co.uk/2018/11/27/amazon_aws_graviton_specs/