對話閔萬里:智慧杭州造城記
從芝加哥大學圖書館中埋首苦讀的統計學博士,到如今帶領阿里雲 ET 大腦在交通、工業、農業中落地的首席科學家,閔萬里對於 ET 城市大腦一以貫之的思想精髓是什麼?面向未來,他如何描述 ET 城市大腦指導城市「二次發育」的藍圖?
自 2015 年誕生以來,阿里雲 ET 城市大腦已與杭州、蘇州、衢州、重慶、廣州、吉隆坡等國內外十多個城市合作。作為國家四個人工智慧開放創新平臺之一,阿里雲 ET 城市大腦在本次雲棲大會上宣佈對生態合作伙伴全面開放城市大腦平臺。
更新到 2.0 版本的杭州城市大腦作為 ET 城市大腦的落地樣本,已經接管了杭州城 5,000 多個路口中的 1,300 個路口,覆蓋了杭州主城區、餘杭區、蕭山區共 420 平方公里的地域,較 17 年雲棲大會時已擴大了 28 倍。在全國最擁堵城市排行榜上,杭州從 2016 年的第 5 名下降到 2018 年的第 57 名。
我們在雲棲大會期間,採訪到了阿里雲機器智慧首席科學家閔萬里,關於 ET 城市大腦的設計思想及未來方向進行了一些交流。在他看來,杭州建設城市大腦主要有兩個經驗:
1)企業一開始便從業務方(杭州交管局等)角度出發建設城市大腦,業務方有懂城市需求的「政務型產品經理」;
2)杭州市大資料資源管理局的成立,使城市資料得以匯聚一處,形成統一的「城市資料底盤」。
閔萬里認為,城市問題痛點有很多,阿里今天講智慧城市,瞄準的是老百姓當下的獲得感 ,ET城市大腦瞄準的是當前痛點中可以用技術解、並且能用最合適技術解的問題。
用他的話說,ET 城市大腦要解決最核心的問題——如何通過多種城市資料融合產生化學反應,形成可執行的洞察(actionable insight) ?
在閔萬里的理解中,資料是ET城市大腦的血液,城市資料是在城市這個「固定的拓撲結構網路」上流淌的「資訊流」。城市裡不同的人和物組成了固定的拓撲網路結構中的元素。人、政府、服務者三類城市參與者,在城市中進行不同的社會活動時產生了資訊流,人群在不同社會角色的轉換中產生的能量,則推動了城市中紛繁的動態資訊的流轉。
以下是對話實錄,機器之心做了不改變原意的整理。
ET 城市大腦的杭州經驗
杭州市交管局與杭州大資料資源管理局,是杭州城市交通大腦能落地的兩個重要政府參與方。阿里雲參與杭州城市大腦建設,是如何與兩方合作的?
閔萬里:我們在杭州建設城市大腦得到的一個寶貴的經驗就是第一天開始就一定要以業務單位為主 ,不能以管理單位為主。杭州市交管局在雲棲小鎮城市大腦實驗基地的團隊相當於杭州城市交通大腦的產品經理,沒有它就沒有交通大腦,就形成不了在一個子領域當中的業務閉環 。
交警管的業務是老百姓都叫苦的通行部門,他們是真正懂業務、懂交通需求、懂城市痛點並且知道如何解決的人。我個人認為以後城市大腦的產品經理,大多都是要從政府業務部門出來 。因為懂業務的人才能提出產品需求;不懂業務的人,比如網際網路的產品經理去做城市大腦產品經理,風險會比較高。要懂老百姓和政府的需求,才能為政府業務部門設計更好的為老百姓服務的產品。
大資料管理局是另外一個角色。假設今天交通大腦做的很好,但若明天城管又要建一個城管大腦,後天衛計委又要搞一個衛生大腦,結果就會出現城市中各個部門都搞自己一套獨立的系統,又成了智慧城市1.0的悲劇重演,條塊分割、資料割裂。
誰來保證今天這些業務部門創新應用都是根出同源 ,源自於同一個火箭發射廠的底座?——杭州大資料資源管理局。
城市資料就是城市大腦的血液。城市大腦若缺少了資料,就成了博物館裡面的標本,停止了運作。
大家既然都在一個城市,資料底盤就要一樣。資料底盤就跟水、電、網一樣,以後一定是國家的基礎設施。 大資料管理局的資料實時彙集平臺,就是他們的核心抓手。有了這個平臺,各個單位的資料就有一個統一的入口。
大資料管理局相當於給未來各個細分行業的應用大腦提供輸血站,它的定位就是要把整個城市的公共資料資源管好、用好,而且不能被無味地複製。
每複製一次,資料的價值密度就降低一次。同一份資料在這兒,非要搞三份資料,最後每次用的時候就是抓鬮來用,平均下來,這三份資料產生的價值跟原來只用這一份資料產生的價值是一樣的,但價值密度就低了。
所以從大資料資源局這個統一的底座出發,來管理城市大腦的建設和頂層設計就非常重要。它會設一些規矩,保證資料底座是完整的,不是條塊分隔的。
這就叫以政策管理機制的方式,來確保創新走在良性互動的軌道上,最後不會出現互相掣肘的現象,不然本來一個好的想法最後又走偏了。
所以交管局作為業務方,大資料局作為管理方都很重要,我覺得這是杭州獨有的經驗。其他城市如果沒有這兩套機制,很難複製。 這是杭州模式當中最值得借鑑的東西。
阿里除了與杭州市公安局合作建設城市交通大腦,這次雲棲大會上也宣佈了與衢州市進行全方位合作,打造一個城市大腦的樣板。在您看來,一個好的城市大腦樣板,需要從哪些維度評估?
閔萬里:我覺得一個城市大腦樣板的作用就是通過實戰業務效果這個標尺,把一些假的大腦甄別出來。
有的城市大腦講來講去永遠都是連線,連線之後結不出成果,所以都是假的。
所謂樣板有兩個層面的衡量標準:
第一,業務閉環是否具備絕對創新的價值所在 。還是說只是在炒冷飯,把原來可以做的事,在今天換一個「新」的方式再做一遍。要關注這個樣板有沒有業務新增價值;
第二,要看它的模式是否可持續 、具有借鑑意義。
今天杭州的模式就是非常可持續,而且有高度借鑑意義的。首先資料資源局先行,這是政府理念的改變。過去講的是,資料是政府的一個累贅,需要花錢存它;現在政府已意識到,資料是一種資源,已成了政府的應該充分利用的資產 。
存在「業務閉環+管理閉環」,是城市大腦能落地的先決條件;以資料平臺作為抓手,才有可能將杭州城市大腦的經驗在其他城市中複製、長久發展。
任何一個城市如果沒有大資料資源管理局這樣的一個城市資料管理機構,持續向城市大腦輸送資料作為血液,即使城市大腦建成了,後面也會死掉,成了博物館的標本。
城市資料打通
像浙江的「最多跑一次」工程本質上也是強調資料打通,我們發現阿里在這項工程上也有釘釘、ET 城市大腦等多個團隊在對接?
閔萬里:阿里雲有很大的團隊,當然還有其他團隊,例如釘釘也在裡面。因為「最多跑一次」涉及到業務流上的改造,業務流改造的基礎是資料流的打穿。
人少跑路了,一定是有東西多跑路,那就是資料跑路,不然的話資訊沒通,該稽核的還是要稽核,只是換一個方式把稽核的材料運過去。以前是靠人自己運,現在是用機器之間資料聯通。
所以這是很多部門團隊在一起努力的事,釘釘成為一個入口之一,但是背後是資料彙集,資料彙集就是把各個部委、部門的資料打穿。比如說醫療保險報銷的時候要看社保繳納情況、醫保情況,這兩個資料就要打穿。
我們看到市面上的「打穿」有兩種,一種是停留在 API 層面連線的打穿,還有一種是真正的資料整合在一起發生化學反應。
閔萬里:兩者都有,有一些很淺顯的都是 API 呼叫一下,比如我去查詢這個人的車牌有多少次違法,這種 API 呼叫一下就可以了。但有些是要看這個有沒有疑似騙社等,這就需要深層次資料整合與模型計算分析。
資料打通還有一個問題:現在政府各個部門都把資料當寶,就像您之前說的,從前還覺得需要高額的儲存成本,現在反而不願意把資料分享出來。
閔萬里:冰淇淋握得越緊,它化得越快。現在是資料通貨膨脹的年代 ,資料不是石油,石油不可再生,資料是不斷在衍生新的。
所以既然它在通貨膨脹,它的價值很快就消失了 。對於很快要消失價值的東西,你捂得再嚴幹什麼。
資料的生命價值週期很短,且數量又很龐大,導致其價值密度就很低。
對於這樣一種資源,只有彙集在一起進行實時的有意義的分析,形成 可執行的洞察(actionable insight) ,轉化成實際行動,才能發揮資料的價值。
城市規劃,ET 城市大腦的新舞臺
阿里與中國城市規劃設計研究院(以下稱「中規院」)合作新成立的未來城市實驗室主要希望做什麼?
閔萬里:我們要用 ET 城市大腦指導城市的二次發育。
基本上有一定規模的城市,都不可能推倒重建,一定是基於現有格局下,對某一個特定的老城區或者某一片區劃進行二次發育。
為什麼這個ET城市大腦能運用起來?假定今天 ET 城市大腦基於資料底盤,它對城市的脈絡一舉一動都掌控了,它就清楚知道要改造的這片區域和周邊肌體之間的聯動 。
想象一個生物體,把這塊肉切掉會影響什麼?資料流可以體現城市受影響的面。
假定有一個規劃說現在這個區域規劃是 80 層的住宅或者 20 層的辦公樓或者停車場,我們把這一個規劃的設想疊加在規劃平臺上,然後迅速通過模型計算出因為這種新的規劃方案,對原來的肌體造成的影響是什麼,交通的影響、電網的影響、水網的影響、土壤的壓力、噪音的程度、廢氣的排放,甚至包括對周邊的日光光照強度(因為 80 層的樓光照會有影響),會全部量化出來。
量化出來以後,就能發現這個地方是否該用 80 層,還是用 60 層,還是 50 層。所以要用資料計算、量化任何一個規劃,然後指導這個城市在它的肌體上二次發育。
以往的城市大腦都是基於現有的城市道路網路和訊號燈、小區,只能在固有的結構下,從區域性的軟處著手,做一些改良、微調。
比如杭州沒有東西貫穿的路,要判斷是否要建一條,就需要有資料量化的指標:第一,要不要東西貫穿;第二,如果要東西貫穿,往西邊貫穿到天目山路還是貫穿到高教路老餘杭,還是貫穿到另外一個點。應該怎麼規劃對交通的拉動性更好,這是可以靠資料說話的。
我們今天跟中規院的未來城市實驗室就是要通過以往的經驗、教訓,其他城市的經驗、教訓,給城市構建一個數字化的模型,發現規劃當中的規律,量化建模型之後,把這些模型用在另外一個城市當中的老區改造、新區規劃。
真正在建設規劃的初期,就讓城市有這個智慧的基因。
ET 城市大腦用資料做訊號燈調控,我們不碰訊號燈的硬體設施,主要通過演算法對紅綠燈配時邏輯進行優化,很軟;未來到真正觸及到城市的鋼筋水泥,改變的是城市的物理基礎設施的規劃,這是一個由軟到硬的過程。
但是再之後,可能會再由硬變軟。為什麼?規劃好以後,在整個建設過程當中又是一個數字化的程序,然後又要通過資料來指導它,所以這是螺旋型迭代上升的。
通過感測器收集詳實的資料,對城市進行高精度模擬建模,以此來指導城市規劃,這種方式可以取代過去傳統城市規劃中基於流體力學的城市簡化模擬模型?
閔萬里:流體力學還可以存在,可以作為大棋當中的幾個棋子輸入,但是今天講的規劃是一盤棋不是一個棋。一個城市是一盤棋,只有一局機會。這一局規劃錯了,建設完了,總不能說推倒重來。
交通之外,城市規劃是這次雲棲大會我們看到的一個新業務。阿里雲 ET 城市大腦未來還會開放哪些其他的業務?
閔萬里:再往後,城市的公共基礎設施的管理。比如城市環保,像灑水車是按照固定的時間跑還是按照街道髒的程度、灰塵的厚度動態地跑,這都可以做。今天有攝像頭,知道這個街道的情況,從攝像頭可以分析出來這個街道是否髒。以前灑水車都是定點定時的時間表的方式執行,但今後可能不需要了,改為動態按需出勤。還有垃圾桶的管理,都涉及到城市的各個方面,只要數字化之後都可以貫連起來提升效率。
ET 城市大腦裡面的應用會不會有一天能做到像 iOS 一樣自動更新?
閔萬里:永遠不可能。太自動,就容易太隨便。iOS 如果有一個病毒,手機上的東西可能都丟了。
這個大腦系統可以說是半離散、半連續,半整合的形態。具體講,在單獨的業務形態上它是集中的並且形成了閉環,像救護車、消防車,因為這裡面分秒必爭。但是在救護車的系統、城管的系統、灑水車的系統或者是城市規劃的系統之間,可能是彼此離散的。有合有分,有交織的,也有獨立的。
城市資料流機制
通過使用城市大腦治理城市問題,其實已是在城市治理的模式上實現了新突破。而開發ET城市大腦這種技術工具,本質上需要首先對城市問題有特別清晰的定義。您的學術背景,特別是在芝加哥大學寫畢業論文時關於 weakly dependence 研究,對您理解城市問題有什麼幫助?
閔萬里:工業和交通流中遇到的很多管控問題,其實都是關於 weakly dependence(弱相關性)的問題。
我們今天在物理世界觀察到的很多「網」,交通網、路網、電網,以及工業生產線上的流水線作業形成的流水線網,城市水/氣管形成的管道網,手機塔臺和塔臺之間形成的 4G、5G 無線電訊號網,全都是有固定節點的網路。 這些網路傳遞著動態的資訊流。
近一步進入這個動態資訊流,如果從一個固定的網路節點看資訊流,看到的現象就是時間序列,但這個節點跟另外一個節點之間的時間序列是有相互關聯的,因為有拓撲結構。
對於這種帶有動力學特徵的系統,怎麼去發現並且量化背後的真實關聯性?這就是我以前研究的問題。
我從概率論角度提出了一個理論框架,證明了在一定條件下可以重新構造一些統計變數,通過這些統計變數能夠找到超大型的網路上相鄰節點之間或者二、三級鄰居節點之間跨越時空的關聯性是多少,從而鎖定最小充分子網。
最後用在哪裡?用在交通當中,就是交通網調控;用在工業當中就是工業控制、自動反饋,就是流程製造的工序1、工序2、工序3之間怎麼關聯協動。這些工作都可以基於 weakly dependence 的原理找準實時聯動的機制。
以前的做法都是假設同一節點上兩個資訊流是沒有關聯,統計學上是基於獨立分佈的。統計學下假定五分鐘前發生的事,跟現在發生的事情完全獨立沒有關係,就跟拋硬幣一樣,前後兩次結果沒有記憶。
但實際情況呢?它是相關的,為什麼?五分鐘前這個地方發生的車禍,影響可能蔓延到後面十分鐘,周邊受影響,所以它的影響會傳遞開,它是有關聯性的,就像我們說牽一髮而動全身。
所以基於城市資訊流具備的這種弱關聯性的特徵,我們如何更好理解城市資料?您曾經說過,城市大腦需要從「社會結構、社會環境、社會活動」三個維度看城市資料,能否結合生活場景具體解釋一下?
閔萬里:記得我剛才講的「固定拓撲網路結構上的動態資訊流 」。
舉個具體例子,比如說我要辦社保,要報銷,需要到哪幾個業務部門。把關聯的幾個業務部門當做節點,部門之間劃條線就體現了物理世界中的關聯性。
這幾個業務節點之間為什麼會有流?就是因為有一個老百姓發起這樣的請求,需要資訊流從一個點傳到另外一個點,因此產生了流。以前是老百姓自己跑把資訊表格材料帶過去,現在浙江「最多跑一次」落地後改成由資料跑。
社會結構就是上面講的拓撲問題,把整個城市看作一個網路的話,各個業務單位、部委辦、老百姓、商場都是一個節點,都是一種型別的節點。所以在這些節點之間,每天都流動著的就是資訊。社會活動就是對應的資訊流。
為什麼講社會環境?環境這裡不是指自然環境,社會環境是指政府(管理者)、服務者和老百姓的組成的一個三國遊戲。管理者可能是制定政策的人,服務者比如公交車司機,他要服務老百姓,或者醫院的醫務工作者。除此之外就是老百姓。
在這個大環境當中,彼此之間每一個人又可能出現角色的轉移。什麼意思?在醫院裡面我是服務者,我是醫生,我服務老百姓。我回到家裡我成了老百姓,發生了角色的轉移,我要上班,這時候政府要服務我。社會環境就是在三國遊戲當中,角色之間經常進行轉換。醫生也可能變成老百姓,服務者也可能變成一個被服務者。
這種視角對您定義城市問題,以及構建 ET 城市大腦有什麼幫助?
閔萬里:我們今天解的很多問題是在幫助政府更好進行管理,但是間接讓老百姓受益。但最終,我們還是要直面老百姓的訴求。為什麼不是「自然環境」而是用「社會環境」的措辭,就是對社會的結構解析,分析環境及角色究竟怎麼在變。
固定的拓撲網路結構上動態的資訊流,萬變不離其宗, 城市問題還是可以數字化映射回歸到本質— —拓撲結構及動態流 。今天我們的核心程式碼就是找到拓撲結構網路上關鍵的路徑。
一套理念和核心程式碼,是我們今天一系列 ET 大腦背後最根本的東西。這也是為什麼短短兩年一個團隊能做出這麼多大腦,就是抓住了最本質的問題。
有了這套想法,就有可能在看上去紛繁複雜的表象當中,找到背後本質的關鍵問題。找到關鍵路徑,就知道問題的解法在哪。相當於找到複雜網路中的要害節點,去下手。
整個杭州市要排堵,不可能所有的地方都同時下手,也不是交通最擁堵的地方就要下手,擁堵是表象,要找到導致擁堵的根本原因與觸發點。
同時,基於我們ET城市大腦的服務定位,在規劃中也有一些想做的功能,比如尋找在這個社會拓撲圖的結構上增加哪一條邊,可能使得連通性變得更好,或者使得從一個起點到另外一個終點的交通流再縮得更短,把最短路徑再壓縮。
這種東西技術上很容易做,但今天還沒有做,因為我們目前最大的痛點還不是增加政府部門的業務之間的對接關係,還是想先梳理清楚現有流程之間的對接關係,儘量簡化大腦中需要定義的城市網路結構。
對這樣一個系統進行角色的定位為什麼重要?這就能讓你牢牢把握住一個核心要素:今天城市大腦要解的問題,是幫誰解決問題,幫他去服務誰。要講清楚的是這一點。