擴博智慧CTO柯嚴:如何用計算機視覺數字化改變世界?
風電和零售行業落地的解決方案,共用的不是具體技術,而是技術儲備。
文 | 李夜
計算機視覺如何數字化改變世界?
或許,可以從擴博智慧的落地案例中找到答案。它橫跨風機葉片巡檢和零售快消兩個領域,為它們提供特種飛行機器人全自動風機葉片巡檢和實體零售數字化管理解決方案。即便風電行業和零售業在外界看來,毫不相干。
擴博智慧成立於2016年11月,由四位微軟前高管發起成立(文章末尾附四人簡歷)。博士多,是該公司的一大特點,研發團隊有25%的博士及以上學歷。擴博智慧創始人兼CEO嚴治慶說,“在計算機視覺、機器學習、雲端計算和智慧硬體領域,他們有十幾年的經驗,打好這個組合拳是擴博智慧的核心技術優勢。”
這群博士如何在兩個看似毫不相干場景中大開腦洞,帶著這個疑問,i黑馬&黑智採訪了擴博智慧CTO柯嚴。
在回答這個問題之前,黑智先介紹一下柯嚴這位擴博智慧技術靈魂人物的工作履歷。和嚴治慶一樣,他曾在微軟工作,是Bing search(必應搜尋)美國總部的研發團隊負責人。
(柯嚴)
柯嚴2008年CMU卡耐基梅隆博士畢業後,進入西雅圖的微軟公司Bing必應團隊工作,他從Web Index Selection專案開始成名,在當時就使用了Machine Learning的方法做Page Ranking,完全沒有使用人工標註資料。
隨後,柯嚴提出IE的Flip Ahead功能,通過機器學習的方法判斷客戶最有可能下一步點那個頁面,在機器端進行提前載入,提升使用者體驗。柯嚴從2013年開始帶團隊做高難度知識圖譜專案工作,Knowledge Graph有3億個真實的使用者使用場景物件,利用一萬億個網際網路上的網頁,服務於5億使用者。即便跑一個普通的任務,也需要使用高達數十萬臺的微軟雲端的高階虛擬伺服器,該專案從開展到交付使用,僅用時四年,比同期谷歌專案縮短了一半時間。“我們沒有利用外部資源或者收購第三方技術,完全是內部自有資源從頭開始完成的。”
後來,他一直在思考如何能夠把計算機視覺和機器學習更廣泛地分享給更多企業。這可以為被看作柯嚴2016年出來創業的動機。再加上當時,一些硬體製造商可以生產帶有高解析度攝像頭的智慧硬體,比如無人機;一些軟體公司在做資料分析平臺,但都是割裂的,並不成體系。“我們當時決定做點和計算機視覺、智慧硬體相關的事情,因為行業中一定會生成大量的資料。我們開始利用自身在企業服務和計算機視覺方面積累的能力,嘗試幫助企業,把物理世界進行數字化。”
一開始,柯嚴他們構建了一個無人機平臺,“數以千萬計的無人機可以跟我們的資料中心相連線,我們的機器學習和計算機視覺的演算法可以幫助我們去分析這些無人機採集的資料。”但他們很快發現由於無人機需要飛手,操作上對於普通人群有困難,企業購置的無人機多被閒置在角落,很難普及。
這讓擴博智慧意識到行業需要一個端對端的解決措施。“方法只有一個:軟硬結合。我們把機器學習的演算法應用在其中,來幫助這些企業去把所有的視覺化過程都完成,找到一個自動化的端對端的解決措施。”
柯嚴如是描述該方案,“例如在風電行業,企業一線工作人員只要按一個按鈕,特種飛行機器人就會起飛。通過固態雷達+機器視覺+感測器,能夠全自動飛行,跟蹤葉片,然後拍照。拍完了,資料會傳到雲上,有深度學習可以自動識別,生成資料。你可以想象它是一個硬體+軟體+演算法的視覺的一個整合。
這臺機器人就像是自動駕駛汽車一樣,有固態雷達、攝像頭、感測器,機器視覺演算法等飛行控制演算法等,通過中控來全自動的對飛機姿態,拍攝效果,飛行路線做定義,不需要人工進行干預。我們的演算法會不斷地進行優化,讓整個飛行拍攝過程越來越有效率。因為是全自動的三維自動駕駛,所以不需要對風機,風場,品牌進行任何定製化的設定。”
這個方案最先被用到風電領域,風電行業是一個聽起來陌生但體量卻不小的領域。據悉,每年全球風電行業有 250 億美金投入風電機運維當中。其中,中國約佔市場的三分之一,還是全球增速最快的市場。在中國,有 10多萬颱風電機組,而且每年還在擴建,目前主要建設都是挑戰更大的海上風機。
風電機運維痛點也不小。工程師需要爬到風機頂端,用繩索、梯子、昂貴裝置做檢查。一般情況下, 4 個人要花半天時間才能完成一次風機檢查。每年,類似的檢查需要兩次。如果是在海上,運維的難度就不是一個指數級別的了,很多地方海上巡檢和維修就是看天吃飯。
用機器人巡檢葉片有幾個優勢: 一,更簡便,比傳統的巡檢裝置更快,巡檢效率比過去高 10 倍;二,資料報告、生產速度提升了 8 倍,接近 10 倍; 三,在 30 分鐘以內完成巡檢,一個人監測就可以了,一個技術人員可以同時進行多個巡檢;四,在清晰度、精度這方面,可以實現 1-3 毫米的高精度圖片採集。
未來,擴博智慧從風機葉片巡檢切入以後,還會做預測和全生命週期的資產管理。“如果資料足夠多的話,我們就可以知道在哪裡搭建風車比較好,因為溫度、天氣(雨、雪、風沙)對風車影響很大,這會導致運營成本差別很大。如果我們能夠拿到資料,就可以告訴風車廠應該在哪裡造風車,在哪裡造風車的維修成本是最低的。”
涉足零售行業是因為客戶的一次需求,這個客戶是“一個比較有名的飲料公司”。公開資料顯示是可口可樂。“他們在上海每天派上千個人到店裡檢視貨架、冰櫃等,看重點的SKU瓶子擺得對不對,每個瓶子的數量夠不夠多、位置擺得對不對、有沒有缺貨。”和風電巡檢一樣,這也是一個耗時費力,資料難以視覺化的枯燥、重複工作。
當這個問題擺到擴博智慧的桌面上,柯嚴想到的是用計算機視覺來做。但是這需要解決一個如何識別海量SKU的問題。比如說像沃爾瑪、家樂福這種大型超市,有10萬種SKU,如果每個SKU都要訓練模型的話,這個是完全不行的,因為人工標註的成本太高了。
擴博智慧採取的方式是半自動化,“我們的工作是教會機器去聯想 (More generalization), 通過相似度的方式去聯想 (Similarity), 機器不需要知道A是什麼東西,叫什麼,但是機器知道A和B兩個是同一樣東西。我們使用少量的渲染過的照片,就可以開始學習識別了。而且可以在海量資料裡找新產品,不認識的產品,資料量越大的時候,價值越大,找相似的產品越準確。”
在柯嚴看來,人工智慧最終實現的是人和機器的結合,純人工做太苦、太累,純機器做又不太準確,而且需要大量的資料標註,最好就是人和機器的交融。任何學習也都是如此,雙向互動最合適,要學會跟機器交流。“傳統的機器學習,就是把大量的資料餵給機器,人是不知道機器要什麼,機器也不知道它需要什麼,這種方式最終也是可以做成的,但是成本是非常非常高的。”
和風電一樣,在零售領域,擴博智慧也是和大公司一起打造行業解決方案。這樣做的好處在於頭部企業的多樣化需求和具有參考價值的行業標準,“今後,我們服務同類其它型公司會輕鬆很多。”據瞭解,打造實體零售數字化管理解決方案用了一年的時間。從最開始的小規模的POC測試,慢慢上量、上規模,2018年夏正式交付。
回到本文開始提到的問題,如何橫跨兩大看似毫不相干領域,並落地產品?
柯嚴提到,風電和零售行業落地的解決方案,共用的不是具體技術,而是技術儲備。技術儲備指的是,人才和經驗。“機器學習Machine Learning自身的工具是相通的(Tooling), 對於人才來說,深度探討理論知識很重要,除了演算法數學好,還需要了解機器邊界和限制,這就需要我們的人才除了有深度還有廣度,也就是經驗豐富。”
問及擴博智慧在零售領域的積累,柯嚴認為兩個方面:一,演算法本身識別的模型。二,資料。“這個是最重要的,其他公司是沒有的。我們花了很多時間,除了積累資料外,還開放很多工具和演算法,資料積累速度變快,我們積累的資料比別人多,還比別人快。”
從某種角度來看,品牌公司跨界需要平衡,“做一個具體解決方案,如果你有很針對性地做,那你就做得深,但風險是很難擴充套件到其他領域。如果你一開始就做一個平臺,希望平臺是通用的,但最後可能發現平臺不解決任何問題,平臺對某一個領域能夠解決80%的問題,但客戶要求的是100%,剩下的20%怎麼辦?這需要平衡。”
2019年,擴博智慧將全面開拓國際化市場提上日程。“現在,擴博智慧已經開始做海外市場了,我們選的品牌商都是國際化的,他們的市場不只是在中國,也是全球分佈,我們跟著他們一起做佈局。現在,風電和零售業務已經在四個國家和地區落地了。”柯嚴在採訪的最後說道。
擴博智慧補充資料如下:
商業化
在風電行業,2018年10月,擴博智慧釋出風機葉片全自動巡檢新品,正式提出“全自動”的風機葉片運維服務。並宣佈與雙瑞風電和上海電氣等國內知名風電廠商達成戰略合作協議;
2019年2月,擴博智慧宣佈與歐洲最大的風機運維商GEV達成戰略合作共同拓展歐洲、北美、非洲等國際市場。
在零售領域,擴博智慧已與可口可樂等國際知名零售品牌在全球多個地區建立戰略合作,所供方案已在北美、東南亞等四個市場落地。
團隊
擴博智慧由四位前微軟高管創立,成立於2016年11月。他們分別是創始人兼CEO嚴治慶,前微軟大中華區副總裁;聯合創始人兼CTO柯嚴是卡耐基梅隆大學機器視覺領域方向的博士, 曾經是微軟Bing search的在美國總部的研發團隊負責人,將微軟Bing搜尋業的市場份額從8%做到21%;
聯合創始人兼CRO李炤在微軟公司工作10年,專注商業解決方案構建與銷售;聯合創始人兼COO陳麗蘋也曾經是嚴治慶在Microsoft Azure業務團隊中的夥伴,負責在中國地區落地及運營微軟Microsoft Azure和 Office365業務。