做產業數字化合作夥伴 京東數字科技副總裁曹鵬JDD大會現場分享“成績單”
在11月20日的JDD-2018京東數字科技全球探索者大會上,京東數字科技副總裁、技術研發部總經理曹鵬發表了《不做“浮冰” 深挖數字科技與場景》的主題演講,他明確表示,京東數字科技要做產業數字化合作夥伴,推動產業的網際網路化、數字化和智慧化。並表示,未來京東數字科技將做未來趨勢的預見者,積極改變現實的推進者,與京東數字科技的合作伙伴一起在產業數字化的路上共建共生,共同實現數字經濟的美好願景。此外,曹鵬還分享了過去一年內,京東數字科技在數字科技領域取得的亮眼成績。
以下為京東數字科技副總裁、技術研發部總經理曹鵬演講原文:
各位來賓、各位朋友,大家上午好!
非常高興能夠在這裡有機會跟大家分享一下我們做的一些事情。
大家也看到了,剛才陳總也公佈了我們的品牌升級戰略。現在,我又站在這兒,我們所聊的,我們所做的其實都是為了跟大家解釋一個問題,一個最簡單、最根本也最直接的問題,那就是京東數字科技到底要做什麼。
在回答這個問題之前,我可以簡單地說我們不做什麼。
其實從我們成立的那一天開始,我們就定了一條原則,就是跟資料、跟技術無關的事兒,我們不做。對,我們做資料,我們做技術,但是我們又不光只做資料和技術,更多做的是把資料和技術放到場景裡面、放到產業裡面,我們要做的是產業的數字合作伙伴,我們要做的是推動產業的網際網路化、產業的數字化和智慧化。
回答完這個問題,我給大家彙報一下我們做的一些工作。
先來看一下架構。大家可以看到,我們實際上是在四個層次上面做事,最下面的是基礎設施,也就是大家經常說的雲這一層,這裡麵包括計算能力、儲存、分散式的架構和虛擬化的技術、安防、容災、監控等等一個系列,這一層很多的時候,大家是看不到的,但是我每次還是會說,為什麼,因為這是所有上層建築的基礎,沒有一個堅實的地基,上面的應用都會是空中樓閣。
在這之上,第二層就是應用的核心技術。所有的技術都圍繞著三個領域在展開。第一個就是資料相關的一系列從資料的清洗、挖掘、計算、建模等等一系列的能力。資料技術是我們做產業數字化的一個最基礎的根本和前提。
第二個就是人工智慧技術。京東數字科技是國內最早大規模在業務上應用AI技術的公司之一,在這麼多年的實踐過程中,我們也積累了非常豐富的經驗和具體的技術。從機器計算到深度計算,然後從計算機視覺到音訊處理,到NLP,各種各樣的技術都在各種場景裡面發揮著它們的價值。
第三個是IOT,也就是物聯網相關技術。我們在做越來越多的場景過程中發現一個問題,我們面對的其實是感測器,面對的是射頻和加密的演算法,我們需要能夠感知周圍環境的能力,我們需要有邊緣計算的能力,我們需要把伺服器上面的大資料和場景裡面實時採集的資訊進行融合、進行聚合和處理。所以,我們也著重地發展了這方面的物聯網技術,我們也相信萬物互聯是所有產業數字化的一個未來的必然趨勢。
在技術層之上就是場景。所有的技術都不是獨立存在的,都是依託於場景的需求,在場景裡面有營銷、客服、風控,每一個場景背後都是一個或者多個技術的支撐。
在場景之上的最上層就是行業解決方案。現在有了技術、場景的功能,再加上我們對行業的理解,就可以包裝出能夠解決行業問題的解決方案。
看完這個架構,我來給大家彙報一下過去的一年裡面,我們之前的一些技術的進展情況。
首先是一個比較基本的機器學習平臺。案例過去一年,機器學習也有了一個比較大的改變。從早期大量依賴於建模人員的人工建模,逐漸的、更多的在使用自動機器學習的平臺。
這就是一個例子,在這個裡面我們最早的嘗試是查詢高淨值客戶,建模人員花了很長時間根據模型尋找客戶,但是非常不幸,樣本量太小,樣本很稀疏,而且這些客戶的資訊沒有辦法集聚,所以大家可以看到下面的藍色和綠色的線是我們嘗試的人工建模模型,效果不是很好,然後就用了自動機器學習平臺。自動機器學習平臺裡面非常關鍵的一點是它沉澱了從海量資料中尋找出來的使用者特徵知識圖譜,這就使得原來很多很難解決的問題,比如樣本稀疏,使用者的特徵很難聚集這樣的課題都能夠很好的解決。原來建模人員用了幾周時間建模也解決不了的問題,在這個平臺上跑了一天所得出的模型,它的AP直接從0.22提升到了0.8,效果非常理想。
所以,這個平臺不管是從效率上面、從效果上面還是從成本上面都有著很大的價值。所以越來越多原來做不了的事兒、細分的場景都可以非常低成本地實現,機器學習能夠支撐更多的業務。
第二個,這個東西去年JDD上也釋出過,生物探針技術。這個技術在過去一年裡面,它的核心指標也得到了很大的提升,現在它不光支援了京東集團裡面安防、核身和風控等等一系列功能,也成功向外輸出了從國內小的銀行到大的頭部銀行一系列的專案,幫助他們實現資料化和科技化。
剛才李院士談到的養豬的專案,去年還是一個簡單的豬臉識別的賽題,現在已經發展到了整個行業的解決方案。
數字風控系統,這個課題每年都會談到,基於數字的風控模型一直是我們最早、最古老也是最核心的技術,應該是在2014年11月份最早在白條的授信模型裡面使用了人工智慧技術。從那一天開始,風控模型經過了十個版本的迭代,到今天風控模型裡面有超過90萬維的特徵,然後有超過150個子模型支撐著整個風控系統。這個風控系統涵蓋了從貸前的預測,貸中的監控到貸後的催收整個產業鏈,一個使用者從他來的時候開始,從註冊到交易到支付,整個場景裡面背後都有風控系統的影子。
得益於人工智慧技術的應用,我們更多的可以從弱相關聯的資料當中發現更多的價值,這就使我們的系統能夠支撐更大範圍的應用,能夠匹配更多的使用者達到更好的效果。
現在我們已經完成了對超過5億的網際網路使用者的風險評估,同期我們的風險降低了50%。在座有很多金融行業的同仁,大家應該可以知道白條和金條的資產不良率在行業裡面都處於一個非常低的水平。
彙報完去年的一些傳統工作進展,我給大家彙報一下我們做的一點新的嘗試。
我們現在正在研究的一個很複合的技術,這個裡面有心理學專家的心理學模型,有計算機視覺的特徵抽取,有基於聲波和聲聞的分析,有語義的合成、語音的理解,所以這種複合技術的應用,讓我們可以做更多原來我們做不了的事兒,可以觀察一些原來看不到的東西,所以這種技術我相信不管是在風控裡面,在安防裡面,甚至在HR的員工情緒管理裡面都可能有它的價值。
說說安防,安防也是技術應用一個很重要的場景。我們的安防體系包括人臉的軋機,剛才大家進來的時候應該也看到了,包括人臉的門禁,包括人員的密度檢測,基於使用者ID的使用者行為跟蹤,包括使用者訪客系統,除了支撐京東集團內部的物業以外,還成果地向外部很多智慧機構進行輸出。
這是一個機器人,最早是為了解決運維自動化提出的一個專案。發展到第二代的時候,它除了能夠做機房的常規巡檢,能夠檢測機房的環境,能夠識別所有機器的故障碼,能夠對機房裡面的檢查人員進行跟蹤監控,還可以跟固定資產系統打通,實現自動化的物資盤點,一系列功能,非常高興,在第二代的時候,除了解決我們自己內部的問題,還對外提供輸出。很多機構都跑過來說,能不能用一下你們的機器人,我們想試一下,看看這個機器人能不能解決運維問題,解放運維成員,降低成本。
所以,整個系列從最早只有一款機房巡檢產品,慢慢也發展到了包括信用機器人、金庫的智慧搬運、鐵道的巡檢、可穿戴裝置等等一個完整的系列。
說完一些具體的場景跟功能點,下面我想介紹一下過去的一年在做的一些對行業的理解。其實我想說的是,做技術這麼多年發現,光有技術是不夠的,光有場景和功能也是不夠的。我今天的主題叫不做浮冰。為什麼呢?
因為我們真的深刻地理解到想要幹成一件事,必須得扎到一個行業裡面去,去學習這個行業的知識,感受這個行業的痛苦,然後才有可能做出一個解決行業痛點的解決方案。
比如金融行業,我們進入得最早,最早也在談信貸和風控能力,大家也知道得很清楚。今天也介紹一下資管。
剛才陳總也介紹了,我們做資管也做了一些年,做資管的過程中我們也做得很痛苦,遇到很多問題,包括專業人員的能力、資訊披露得不充分,計算能夠弱、風控能力不夠等等。
但是做了這麼多年以後,我們嘗試著把這些痛點逐一解決掉,提出一種新的基於基本面和量化相結合的投資模式。這種模式相對於原來的投資方式來講,它更全面、更精準也更智慧,因為這種模式在初期最早測試過程中,首批合作伙伴就涵蓋了國內的頂部銀行到券商超過20家機構,它所管理的資產超過6萬億。
再來說營銷。剛才陳總也說了我們新的營銷解決方案。這個新的解決方案很大的重點放在了線下,為什麼放線上下?是因為在這個行業裡面我們扎進來做了。
大家記得去年在釋出的時候,我們在談做營銷來客系統,核心是資料驅動的精準投放,所有的資料和技術公司基本都會把這個當成一個核心能力。真的扎到這個產業裡面來做,做了一年,現在你跟我說這個東西好不好,我說特別好,你看我們的客戶,他們用我們的系統,他們的獲客成本都有非常大幅度的降低,最多的一個降了超過80%。80%,看起來特別美好的一個數字。但是真的要說這個東西夠不夠,我特別實誠地就告訴你說,這個可能還不夠。為什麼,80%很誇張,但是實際情況什麼樣子,一個沒有知名度的小貸公司,它做盲投,一個獲客成本可能超過5000塊錢人民幣,通過資料的精準投放,可以降到900塊,降低80%,但是不管5000塊也好900塊也好,這個數字都是它承受不了的,成本太高了,為什麼?因為有線上的使用者量,再加上現線上下所做的實時競價的模式,把優勢流量的成本推高到非常畸形的高度,這些你不進到產業裡面是不知道的,所以我們除了做資料的精準投放以外,我們把幫助客戶獲得更優質更低價的流量做成我們的一個核心目標。
更優質的流量在哪,有可能是在京東的自有流量裡,有可能是在新的有流量紅利的媒體裡面,比如像新的短視訊媒體、比如像裂變的傳播這些領域,更多的可能是線上下。因為從2016年開始,線上的獲客成本就超過了線下,線上下我們有機會獲得一個更精準、真實、也更低成本的流量,所以我們正式提出了雙百計劃,百億京東的線上流量加百萬線下的支撐螢幕,我們要做的就是用O2O的模式打通線上和線下的數字營銷。
智慧城市,剛才鄭宇博士也介紹過了,院士也介紹過了。在這個領域,鄭博士沉浸超過了12年,他對這個領域裡面的痛點有特別深刻的理解,所以他才有機會提出一套從點到線到面的頂層架構。再結合京東數字科技的數字能力和技術,所以才能夠在非常短的時間內提出了六大解決方案,覆蓋了超過30個城市。
最後介紹一下養豬的專案。說實在的,在最開始接觸這個專案的時候,我們還是很糾結的,也很猶豫的。為什麼呢?因為我們最開始想做的就是一個簡單的豬臉識別模型,其實對這個行業並沒有什麼特別多的瞭解。
我們的員工拿著豬臉識別模型到豬場去,被人家嘲笑得無地自容,根本就沒有用。但是我們又特別幸運,為什麼呢?因為這個行業雖然在嘲笑我們的無知,但是同時它也告訴我們,他們自己非常真切地認識到這個行業裡面的問題,他們也特別渴望用技術改變這個行業。所以,我們才有機會能夠把自己洗白,重新紮下去,從頭開始學習。
我們有機會跟集團的領導學習他們的管理理念,有機會下到豬場裡面,跟豬場的場長和技術員學習他們的飼餵經驗,我們發現很多飼餵經驗之間有衝突有矛盾。特別幸運的,我們又能找到很多行業專家,向他們請教真正科學的養殖辦法。
一直到有一天,我們的演算法和我們的研發工程師在豬場裡面一待就是半個月,每天扛飼料,每天鏟豬糞,趕著肥豬稱重,趕著母豬配種,直到這個時候我們才說好象可以幹這件事了,我們好象已經摸到這個行業的門檻了。
直到我們真正殺到一線去,我們體會到這個行業裡面特別真實的一個痛點。所以現在的解決方案不是一個特別單薄的豬臉識別功能,它已經變成一個特別整體的專案,它最核心的是一個神農大腦,這裡集成了國內頂尖的養殖專家的養殖經驗,還有AI演算法可以做到非常精準的飼餵甚至到每一個個體,它傳出的指令會到兩個地方,一個是SaaS系統,直接到管理員。SaaS系統裡面內建了超過60個環節的100多個模型,都是養豬過程中所必需的任務,這個可以實現整個養殖過程中的標準化。
另外一條線就到IOT裝置,我們自己研發了一系列的IOT裝置,從整個環路的監控到巡檢到飼餵等等。在這些裝置裡面,我們用了最先進的人工智慧的技術。然後我們的成本是國外同類裝置的十分之一甚至更低。
這些裝置可以自動化實現一系列的環境調整到飼餵,這樣我們也可以實現養殖的自動化。大家可以看到,現在整個方案已經在一些實驗的豬舍裡面完整地跑通了,經過測算,有特別大的經濟價值。推廣到這個行業,對中國社會的價值也是巨大的。
最後我想說的是,我們要乾的其實就是這些事兒,京東數字科技手裡有什麼,手裡有技術,有對使用者的理解,再加上我們不斷地嘗試,對行業進行洞察,這樣我們可以佈局很多的行業,我們的客戶也遍佈了從C端的客戶到B端,到政府,實現三端打通。我們的slogan叫預見、改變、實現,我們希望能夠做未來趨勢的預見者,也希望能夠做積極改變現實的推動者,我們希望能夠跟我們的數字化的產業合作伙伴一起在產業數字化的路上共建共生,共同實現我們的美好願景。
我的講話完了,謝謝大家!
關於JDD-2018京東數字科技全球探索者大會
JDD-2018京東數字科技全球探索者大會於11月20日在北京中國國際展覽中心新館舉辦,總獎金達220萬元的同名大賽於同天上午正式啟動。本屆大會由京東集團、京東數字科技聯合主辦,KDD China為學術指導單位,APEC中國工商理事會青年企業家委員會為支援單位。大會旨在連線科技界、產業界、金融界、學術界、投資界五大圈層,搭建一個全球化的開放平臺,共同探索數字科技創新之道,實體經濟數字化升級之路。
相比去年的首屆大會,本屆JDD大會規模再創新高,共有來自政府部門、金融機構、投資機構、大型企業和科研院所的近3000名嘉賓,包括400名業界大咖出席了大會。京東數字科技CEO陳生強、京東集團首席技術官張晨與30餘位重量級嘉賓在大會上暢談未來數字科技發展趨勢,其中包括中國工程院院士、原中國工程院常務副院長潘雲鶴,中國工程院院士、中國農業大學動物科技學院教授李德發,麻省理工學院教授、生命未來研究所主席、暢銷書《Life 3.0》作者Max Tegmark,美國國家工程院院士、MIT人工智慧實驗室主任Daniela Rus,日本機器人“教父”、ROBOGARAGE公司創始人兼CEO高橋智隆,知名科幻作家、雨果獎獲得者、“童行學院”創始人郝景芳等國際知名學者和業界領軍人物。